IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ピッター ペッター インコーポレーテッドの特許一覧

特許7527071周期的にアップデートされる遺伝子変異検査結果レポート自動発行システム
<>
  • 特許-周期的にアップデートされる遺伝子変異検査結果レポート自動発行システム 図1
  • 特許-周期的にアップデートされる遺伝子変異検査結果レポート自動発行システム 図2
  • 特許-周期的にアップデートされる遺伝子変異検査結果レポート自動発行システム 図3
  • 特許-周期的にアップデートされる遺伝子変異検査結果レポート自動発行システム 図4
  • 特許-周期的にアップデートされる遺伝子変異検査結果レポート自動発行システム 図5
  • 特許-周期的にアップデートされる遺伝子変異検査結果レポート自動発行システム 図6
  • 特許-周期的にアップデートされる遺伝子変異検査結果レポート自動発行システム 図7
  • 特許-周期的にアップデートされる遺伝子変異検査結果レポート自動発行システム 図8
  • 特許-周期的にアップデートされる遺伝子変異検査結果レポート自動発行システム 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-25
(45)【発行日】2024-08-02
(54)【発明の名称】周期的にアップデートされる遺伝子変異検査結果レポート自動発行システム
(51)【国際特許分類】
   G16B 50/30 20190101AFI20240726BHJP
   G06F 40/295 20200101ALI20240726BHJP
【FI】
G16B50/30
G06F40/295
【請求項の数】 2
(21)【出願番号】P 2023539055
(86)(22)【出願日】2021-12-23
(65)【公表番号】
(43)【公表日】2024-01-09
(86)【国際出願番号】 KR2021019723
(87)【国際公開番号】W WO2022145877
(87)【国際公開日】2022-07-07
【審査請求日】2023-06-23
(31)【優先権主張番号】10-2020-0186595
(32)【優先日】2020-12-29
(33)【優先権主張国・地域又は機関】KR
(73)【特許権者】
【識別番号】522451241
【氏名又は名称】ピッター ペッター インコーポレーテッド
(74)【代理人】
【識別番号】110001896
【氏名又は名称】弁理士法人朝日奈特許事務所
(72)【発明者】
【氏名】ソン、ジ ウォン
(72)【発明者】
【氏名】チェ、ゴ ウン
【審査官】塩田 徳彦
(56)【参考文献】
【文献】特開2020-144658(JP,A)
【文献】国際公開第2020/077352(WO,A1)
【文献】韓国公開特許第2019-0136765(KR,A)
(58)【調査した分野】(Int.Cl.,DB名)
G16B 5/00 - 99/00
G06F 40/295
(57)【特許請求の範囲】
【請求項1】
a)論文データベースで収集した情報を自動個体名認識(NER)道具を利用して遺伝子(gene)データ、遺伝子変異位置データおよび表現型データとして抽出した後、抽出されたデータの内容を検証した後前記データを自動で積載する疾病/遺伝子変異データベース構築モジュール;
b)特定動物種の遺伝形質と関連がある表現型メタデータ収集のために外部表現型メタデータデータベースおよび表現型データテーブルにデータを積載する疾病メタデータ構築モジュール;
c)レポート生成自動化のために、レポート別に表現型データテーブル、遺伝子変異データテーブルに基づいて、レポート文章データテーブルに文章を追加し、レポート別に使われるイメージ要素のIDをマッピングするデータマッピングモジュール;および
d)顧客動物の遺伝子変異情報ファイル(VCF、Variant Call Format)を入力値として受信して遺伝子変異を抽出し、該当動物が有した実際の変異に応じて表現型別報告書を自動で生成し、これを顧客がダウンロードできるように提供する結果物提供モジュール;を含み、
前記b)疾病メタデータ構築モジュールは、
b-1)論文メタデータテーブルに存在する「遺伝子-遺伝子変異-表現型」関係のうち「表現型」IDとspecies(動物種)IDを入力値として該当するデータテーブルCの表現型の名前とNCBI MeSH terms IDを獲得するモジュール;
b-2)外部参照用表現型メタデータデータベースのAPIを活用して前記b-1)モジュールの検索結果を獲得するモジュール;
b-3)前記b-2)モジュールの検索結果に基づいて該当動物種の該当表現型の説明、疾病、症状を作成するモジュール;
b-4)前記b-3)モジュールの表現型疾病、症状にNCBI MeSH IDをマッピングするモジュール;および
b-5)前記b-1)モジュール~b-4)モジュールの結果で表現型メタデータテーブルがアップデートされ、該当過程は周期的に繰り返されて最新データを維持するモジュール;を含むことを特徴とする、周期的にアップデートされる遺伝子変異検査結果レポート自動発行システム。
【請求項2】
前記a)疾病/遺伝子変異データベース構築モジュールは、
a-1)特定動物種のNCBI Taxonomy IDと検索対象を通じて、特定動物種の遺伝的変異と疾病関係を見つけ出すことができる検索語および構造的検索語固有ID(mesh Terms ID)を準備するモジュール;
a-2)外部論文データベースの論文検索APIを活用して、特定動物種に対する前記a-1)モジュールのキーワードリスト検索を要請して結果データを、pubmed id、doi、article title、article abstract、mesh termsからなる群から選択される抽出カラムで抽出するモジュール;
a-3)前記抽出カラムを基準として既存の論文メタデータテーブルに重複個体があるかないかを確認するモジュール;
a-4)論文別にarticle abstractを自動生物個体名認識道具であるpubtatorにインプットデータとして活用するモジュール;
a-5)前記pubtator結果データとして抽出された生物個体名(bio-entity)のうち遺伝子(gene)データ、遺伝子変異位置データおよび表現型データのみ別途に抽出するモジュール;
a-6)前記a-2)モジュールのように遺伝子(gene)データ、遺伝子変異位置データ、表現型データを抽出するモジュール;
a-7)前記a-4)モジュールおよびa-5)モジュールの結果を活用して「遺伝子-遺伝子変異-表現型」関係を自動抽出するモジュール;
a-8)前記a-2)モジュールの結果のうちarticle、titleとarticle、abstractを見て、「本来抽出しようとした論文の対象動物種関連論文であるか」、「該当動物種の遺伝形質変異と表現型の相関性を叙述した論文であるか」を確認するモジュール;
a-9)前記a-8)モジュールの結果が真である場合、前記a-7)モジュールの結果と前記a-2)モジュールの結果のうちarticle title、article abstractを対照して正しく抽出された関係にチェックし、前記a-8)モジュールの結果が偽りの場合、間違って抽出されたと判断して前記a-2)モジュールのa)抽出モジュールの性能改善のためにフィードバック、すなわち、抽出時に役に立つようなmesh terms、該当論文がなぜ関連論文ではないかに対するフィードバックを進行するモジュール;
a-10)前記a-9)モジュールで前記a-8)モジュールの結果が真である場合、抽出された「遺伝子-遺伝子変異-表現型」関係で正しく抽出されたものにチェックするモジュール;
a-11)前記a-10)モジュールの結果、正しく抽出された関係があるかないかを確認した後、あればどのような関係であるかa-5)モジュールのモジュール改善のためにフィードバックを進行するモジュール;
a-12)モジュールでは前記a-11)モジュールのフィードバック結果をプログラム開発者が参照して該当関係が抽出された文章を自然語分析あるいは前記a-5)モジュールの結果、生物個体名の文字列間の距離間などの多様な情報に基づいてモジュールの「遺伝子-遺伝子変異-表現型」関係を抽出するモジュール;
a-13)該当論文内の実験対象個体の数(実験群/対照群)を確認および記録するモジュール;
a-14)前記a-13)モジュールの結果該当論文の実験個体数が過度に不足して信頼度が低いと判断される場合、該当論文に信頼性低いと表示し、前記低い信頼性を有する論文の遺伝子-遺伝子変異-表現型関係は今後遺伝子検査結果に反映しないか、信頼性低いと表記するモジュール;および
a-15)前記a-13)モジュールの結果、信頼度が充分であれば、該当論文メタデータと遺伝子変異メタデータおよび表現型名(表現型を表す名前)をデータベースに追加するモジュール;を含むことを特徴とする、請求項1に記載の周期的にアップデートされる遺伝子変異検査結果レポート自動発行システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムに関する。
【背景技術】
【0002】
生物の細胞内にはDNAという遺伝物質が存在する。この物質に生命現象を起こす遺伝情報が入っており、生命体はDNAを子孫に伝えることによって自身の遺伝情報を後世に続けて伝達する。このようなDNAは四つのタイプの(ATGC)の塩基を有しており、約30億対の組み合わせによって二重螺旋からなる巨大分子で構成される。どのような塩基配列の構成であるかによって各個体の遺伝情報に差を有することになり、結局その個体の特徴を決定することになる。また、一つの個体にあるすべての細胞は同じ数の染色体と遺伝情報を有しているので、一つの細胞のみ分析しても全体の遺伝子情報が分かる。
【0003】
2003年ヒトの遺伝子全体配列を調べようとしたヒトゲノム計画(Human Genome Project)終了以後、全世界的に遺伝情報分析技術が発達してヒトおよび多様な生物の疾病関連遺伝子研究と遺伝子検査商用化が促進された。それに伴い、遺伝子分析費用が次第に低くなり遺伝子検査接近性が高くなって、効率的な健康管理のための精密医療および個人/個体オーダーメード型医療の時代に進入した。
【0004】
遺伝子検査は個体の遺伝情報を分析して遺伝関連疾病発病の危険度を事前に予測し、オーダーメード型予防戦略を立てることができるように助ける。ひいては、遺伝疾患の診断や薬品による敏感度を分析して治療効果を高めるのに役に立つこともできる。個体の健康の増大だけでなく医療費の削減などの効果により、社会および国の次元での利益も期待することができる。
【0005】
遺伝子分析依頼時に、依頼者の要求事項および疑われる疾患の種類による個体情報の受付、事前相談、試験分析、試験結果報告書に関連した一連のプロセスおよびこれに関連した情報収集と遺伝子分析が遂行されているが、データの正確度と提供される結果が不備であるため改善の必要性がある。
【0006】
(特許文献1)大韓民国公開特許第10-2011-0035663号(2011.04.06)、個人遺伝情報暗号化データを利用した遺伝カウンセリング サービスプログラムを記録したコンピュータで読み取り可能な媒体
【発明の概要】
【発明が解決しようとする課題】
【0007】
本発明の目的は、脊椎動物の遺伝子変異検査結果と自然語処理を通じてリアルタイムで更新される研究結果により、自動で同期化および更新される遺伝子変異検査結果レポート自動発行システムを提供するところにある。
【0008】
本発明によると、脊椎動物の遺伝子変異および表現型に関連した情報だけでなく、疾病症状、検査方法、他の要因、ケアする方法、関連疾病、ブリーディング時の注意点、同じ遺伝子変異および表現型を有する他のユーザーとともに対話できるウェブコミュニティ空間を提供して脊椎動物の遺伝子変異および表現型に対する理解を助けることができる。
【0009】
また、本発明によると、前記疾病と症状、医療行為などは国際的医療コードでマッピングおよび管理され、今後脊椎動物遺伝子変異研究のためのフィードバック資料として活用され得、特に伴侶動物遺伝子変異研究事業のようにヒトに比べて研究規模が小さい遺伝子変異研究事業に寄与することができる。
【課題を解決するための手段】
【0010】
前記目的を達成するために、本発明はa)論文データベースで収集した情報を自動個体名認識(NER)道具を利用して遺伝子(gene)データ、遺伝子変異位置データおよび表現型データとして抽出した後、抽出されたデータの内容を検証した後前記データを自動で積載する疾病/遺伝子変異データベース構築モジュール;b)特定動物種の遺伝形質と関連がある表現型メタデータ収集のために外部表現型メタデータデータベースおよび表現型データテーブルにデータを積載する疾病メタデータ構築モジュール;c)レポート生成自動化のために、レポート別に表現型データテーブル、遺伝子変異データテーブルに基づいて、レポート文章データテーブルに文章を追加し、レポート別に使われるイメージ要素のIDをマッピングするデータマッピングモジュール;およびd)顧客動物の遺伝子変異情報ファイル(VCF、Variant Call Format)を入力値として受信して遺伝子変異を抽出し、該当動物が有した実際の変異に応じて表現型別報告書を自動で生成し、これを顧客がダウンロードできるように提供する結果物提供モジュール;を含む、周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムを提供する。
【0011】
また、前記周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムを実行するためのプログラムが記録されたコンピュータで読み取り可能な記録媒体を提供する。
【発明の効果】
【0012】
本発明に係る周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムは、脊椎動物の遺伝子変異と表現型情報によって最新研究結果を反映して自動で報告書を生成し、これを周期的にアップデートして迅速で正確な脊椎動物遺伝子変異検査結果を提供することができるという長所がある。
【図面の簡単な説明】
【0013】
図1】本発明の周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムのうち、a)疾病/遺伝子変異データベース構築モジュールの一実施例を示した模式図である。
図2】本発明の周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムのうち、a)疾病/遺伝子変異データベース構築モジュールのさらに他の一実施例を示した模式図である。
図3】本発明の周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムのうち、b)疾病メタデータ構築モジュールの一実施例を示した模式図である。
図4】本発明の周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムのうち、c)データマッピングモジュールの一実施例を示した模式図である。
図5】本発明の周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムのうち、d)結果物提供モジュールの一実施例を示した模式図である。
図6】本発明の周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムのうち、d)結果物提供モジュールの一実施例に係るウェブページを示した結果である。
図7】本発明の周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムのうち、d)結果物提供モジュールの一実施例に係るウェブページを示した結果である。
図8】本発明の周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムのうち、d)結果物提供モジュールの一実施例に係るウェブページを示した結果である。
図9】本発明の周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムのうち、d)結果物提供モジュールの一実施例に係るウェブページを示した結果である。
【発明を実施するための形態】
【0014】
以下、本発明をさらに詳細に説明する。
【0015】
本明細書および請求の範囲に使われた用語や単語は、通常的または辞書的な意味に限定して解釈されてはならず、発明者はそれ自身の発明を最も最善の方法で説明するために用語の概念を適切に定義できるという原則に則って本発明の技術的思想に符合する意味と概念fr解釈されるべきである。
【0016】
本発明で使った用語は単に特定の実施例を説明するために使われたもので、本発明を限定しようとする意図ではない。単数の表現は文脈上明白に異なって意味しない限り、複数の表現を含む。本発明で、「含む」または「有する」などの用語は明細書上に記載された特徴、数字、段階、動作、構成要素、部品またはこれらを組み合わせたものが存在することを指定しようとするものであって、一つまたはそれ以上の他の特徴や数字、段階、動作、構成要素、部品またはこれらを組み合わせたものなどの存在または付加の可能性を予め排除しないものと理解されるべきである。
【0017】
本明細書で使われている用語「論文メタデータ」は、論文に対するメタデータを意味する。これは論文のタイトル、掲載されたジャーナル、著者、発行年度、doi(digital object identifier)、pubmed識別番号、該当論文にマッピングされたmesh termsなどを含むことができる。
【0018】
本明細書で使われている用語「表現型メタデータ」は、表現型に対するメタデータ~を意味する。これは表現型の名前、該当表現型を有する生物のNCBI taxonomy id、疾病/特徴の有無、OMIAデータベース表現型ID、遺伝形態、該当表現型に対応するmesh terms IDなどを含むことができる。
【0019】
本明細書で使われている用語「遺伝子変異メタデータ」は、遺伝子変異に関するメタデータ~を意味する。これは該当遺伝子変異がある遺伝子のNCBI ID、該当遺伝子のNCBIで指定した遺伝子名、染色体番号、VGNC(Vertebrate Gene Nomenclature Committee)ID、有害な変異(deleterious mutation)の有無、参照配列(refseq)バージョン、dbSNP(single nucleotide variations)ID、遺伝子変異の位置、蛋白質変異の位置、OMIAデータベース表現型ID、OMIAデータベース遺伝子変異IDなどを含むことができる。
【0020】
本明細書で使われている用語「レポート文章データ」は、実際のレポートに表記される文章を意味する。本明細書の「レポート」は顧客、脊椎動物または伴侶動物、表現型により出力される内容と形態が異なり、これは自動化されたシステムによって自動で生成される。このような自動化のためにデータベース内に文章データテーブル内に固有なIDとともに保存される。レポート文章データは文章ID、文章類型、文章内容等で構成され得る。
【0021】
本明細書で使われている用語「特定動物」は脊椎動物に該当する動物を意味し得、前記脊椎動物にはヒトも含むことができる。
【0022】
ヒト用データベースは脊椎動物用データベースに比べてその情報量が豊富でよく整理されており、脊椎動物間遺伝子類似性のため脊椎動物用研究にヒトの研究を参照することが可能である。例えば、SNOMED CTは疾病を含んだその他の医療行為まで幅広く定義している医療用語体系コードであり、OMIMは表現型-遺伝子型の相関関係に関連した幅広い情報を体系的に整理したデータベースであって、遺伝子の機能、表現型に対する生化学的、分子生物学的情報、関連動物モデル、遺伝体および蛋白質情報、臨床関連情報などを含んでいる。
【0023】
本明細書で使われている用語「表現型(Phenotype)」とは、遺伝形質によって現れる表現的性質を称する。疾病や症状だけでなく目や毛の色などの発現形質を意味する。
【0024】
本明細書で使われている用語「モジュール(module)」は特定の機能や動作を処理する一つの単位を意味し、これはハードウェアやソフトウェアまたはハードウェアおよびソフトウェアの結合で具現することができる。
【0025】
本発明に係る周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムは、
a)論文データベースで収集した情報を自動個体名認識(NER)道具を利用して遺伝子(gene)データ、遺伝子変異位置データおよび表現型データとして抽出した後、抽出されたデータの内容を検証した後前記データを自動で積載する疾病/遺伝子変異データベース構築モジュール;
b)特定動物種の遺伝形質と関連がある表現型メタデータ収集のために外部表現型メタデータデータベースおよび表現型データテーブルにデータを積載する疾病メタデータ構築モジュール;
c)レポート生成自動化のために、レポート別に表現型データテーブル、遺伝子変異データテーブルに基づいて、レポート文章データテーブルに文章を追加し、レポート別に使われるイメージ要素のIDをマッピングするデータマッピングモジュール;および
d)顧客動物の遺伝子変異情報ファイル(VCF、Variant Call Format)を入力値として受信して遺伝子変異を抽出し、該当動物が有した実際の変異に応じて表現型別報告書を自動で生成し、これを顧客がダウンロードできるように提供する結果物提供モジュール;を含む。
【0026】
本発明に係る周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムにおいて、
前記a)疾病/遺伝子変異データベース構築モジュールは
a-1)特定動物種のNCBI Taxonomy IDと検索対象を通じて、特定動物種の遺伝的変異と疾病関係を見つけ出すことができる検索語および構造的検索語固有ID(mesh Terms ID)を準備するモジュール;
a-2)外部論文データベースの論文検索APIを活用して、特定動物種に対する前記a-1)モジュールのキーワードリスト検索を要請して結果データを、pubmed id、doi、article title、article abstract、mesh termsからなる群から選択される抽出カラムで抽出するモジュール;
a-3)前記抽出カラムを基準として既存の論文メタデータテーブルに重複個体があるかないかを確認するモジュール;
a-4)論文別にarticle abstractを自動生物個体名認識道具であるpubtatorにインプットデータとして活用するモジュール;
a-5)前記pubtator結果データとして抽出された生物個体名(bio-entity)のうち遺伝子(gene)データ、遺伝子変異位置データおよび表現型データのみ別途に抽出するモジュール;
a-6)前記a-2)モジュールのように遺伝子(gene)データ、遺伝子変異位置データ、表現型データを抽出するモジュール;
a-7)前記a-4)モジュールおよびa-5)モジュールの結果を活用して「遺伝子-遺伝子変異-表現型」関係を自動抽出するモジュール;
a-8)前記a-2)モジュールの結果のうちarticle、titleとarticle、abstractを見て、「本来抽出しようとした論文の対象動物種関連論文であるか」、「該当動物種の遺伝形質変異と表現型の相関性を叙述した論文であるか」を確認するモジュール;
a-9)前記a-8)モジュールの結果が真である場合、前記a-7)モジュールの結果と前記a-2)モジュールの結果のうちarticle title、article abstractを対照して正しく抽出された関係にチェックし、前記a-8)モジュールの結果が偽りの場合、間違って抽出されたと判断して前記a-2)モジュールのa)抽出モジュールの性能改善のためにフィードバック、すなわち、抽出時に役に立つようなmesh terms、該当論文がなぜ関連論文ではないかに対するフィードバックを進行するモジュール;
a-10)前記a-9)モジュールで前記a-8)モジュールの結果が真である場合、抽出された「遺伝子-遺伝子変異-表現型」関係で正しく抽出されたものにチェックするモジュール;
a-11)前記a-10)モジュールの結果、正しく抽出された関係があるかないかを確認した後、あればどのような関係であるかa-5)モジュールのモジュール改善のためにフィードバックを進行するモジュール;
a-12)モジュールでは前記a-11)モジュールのフィードバック結果をプログラム開発者が参照して該当関係が抽出された文章を自然語分析あるいは前記a-5)モジュールの結果、生物個体名の文字列間の距離間などの多様な情報に基づいてモジュールの「遺伝子-遺伝子変異-表現型」関係を抽出するモジュール;
a-13)該当論文内の実験対象個体の数(実験群/対照群)を確認および記録するモジュール;
a-14)前記a-13)モジュールの結果該当論文の実験個体数が過度に不足して信頼度が低いと判断される場合、該当論文に信頼性低いと表示し、前記低い信頼性を有する論文の遺伝子-遺伝子変異-表現型関係は今後遺伝子検査結果に反映しないか、信頼性低いと表記するモジュール;および
a-15)前記a-13)モジュールの結果、信頼度が充分であれば、該当論文メタデータと遺伝子変異メタデータおよび表現型名(表現型を表す名前)をデータベースに追加するモジュール;
を含むことができる。
【0027】
本発明に係る周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムにおいて、
前記b)疾病メタデータ構築モジュールは
b-1)論文メタデータテーブルに存在する「遺伝子-遺伝子変異-表現型」関係のうち「表現型」IDとspecies(動物種)IDを入力値として該当するデータテーブルCの表現型の名前とNCBI MeSH terms IDを獲得するモジュール;
b-2)外部参照用表現型メタデータデータベースのAPIを活用して前記b-1)モジュールの検索結果を獲得するモジュール;
b-3)前記b-2)モジュールの検索結果に基づいて該当動物種の該当表現型の説明、疾病、症状を作成するモジュール;
b-4)前記b-3)モジュールの表現型疾病、症状にNCBI MeSH IDをマッピングするモジュール;および
b-5)前記b-1)モジュール~b-4)モジュールの結果で表現型メタデータテーブルがアップデートされ、該当過程は周期的に繰り返されて最新データを維持するモジュール;
を含むことができる。
【0028】
本発明に係る周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムにおいて、
前記c)データマッピングモジュールは
c-1)表現型データテーブル、遺伝子変異データテーブルに基づいて実際のレポートに入る文章を作成するモジュール;
c-2)前記c-1)モジュールで検討された内容を文章データテーブルに追加するモジュール;
c-3)特定報告書(特定動物種-特定疾病-特定遺伝子変異[ら])の報告書固有idと該当文章idをマッピングするモジュール;
c-4)報告書に使われるイメージのサーバー内絶対経路を文章データテーブルに保存するモジュール;
c-5)特定報告書(特定動物種-特定疾病-特定遺伝子変異[ら])の報告書固有idと該当イメージidをマッピングするモジュール;および
c-6)モジュールでは、前記c-2)モジュール~c-5)モジュールの結果でレポート文章データテーブルがアップデートされ、該当過程は周期的に繰り返されて最新データを維持するモジュール;
を含むことができる。
【0029】
本発明に係る周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムにおいて、
前記d)結果物提供モジュールは
d-1)顧客動物の遺伝子変異情報ファイル(VCF)を獲得するモジュール;
d-2)前記顧客動物がどのような遺伝子変異を有しているかを該当動物種の遺伝子変異データテーブルを通じて確認するモジュール;
d-3)前記顧客動物が有する遺伝変異を顧客動物データテーブルに記録するモジュール;
d-4)前記d-3)モジュールの結果と「該当遺伝子変異の固有ID」に基づいて文章データテーブルで報告書に表示される文章を呼び出すモジュール;
d-5)前記d-3)モジュールの結果と「該当遺伝子変異の固有ID」に基づいて文章データテーブルで報告書に表示されるイメージを呼び出すモジュール;および
d-6)プログラミング言語に基づいて作成された報告書自動化コードを通じて前記d-4)モジュールと、d-5)モジュールの結果に基づいて各表現型別報告書のウェブページを生成するモジュール;
を含むことができる。
【0030】
本発明に係る周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムにおいて、
前記a)モジュール~c)モジュールが周期的に繰り返され得る。
【0031】
本発明に係る周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムにおいて、
前記a-7)モジュールの「遺伝子-遺伝子変異-表現型」関係は、まず「遺伝子」、「遺伝子変異」、「表現型」個体の可能なすべての場合の数を抽出した後、特定条件を基準として加重値を付与して抽出した関係の優先順位ランキングを付与して自動抽出することができる。
【0032】
本発明に係る周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムにおいて、
前記b-2)モジュールの検索結果は特定表現型の一般的な説明、関連疾病、関連症状のうちいずれか一つ以上であり得る。
【0033】
本発明に係る周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムにおいて、
前記d-3)モジュールで記録されるデータは該当遺伝子変異の固有ID’(遺伝子変異テーブルから)、変異が発生した対立遺伝子の情報およびその保有数からなる群から選択されるいずれか一つ以上であり得る。
【0034】
本発明は前記周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムを実行するためのプログラムが記録されたコンピュータで読み取り可能な記録媒体を提供する。
【0035】
発明の実施のための形態
本発明に係る周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムは、a)疾病/遺伝子変異データベース構築モジュールを含む。
【0036】
本発明において、前記疾病/遺伝子変異データベース構築モジュールは、論文データベースで収集した情報を自動個体名認識(NER)道具を利用して遺伝子(gene)データ、遺伝子変異位置データおよび表現型データとして抽出した後、抽出されたデータの内容を検証した後前記データを自動で積載する。
【0037】
前記疾病/遺伝子変異データベース構築モジュールは図1を通じて例示することができ、以下具体的に説明する。
【0038】
本発明において、前記a)疾病/遺伝子変異データベース構築モジュールは下記のようにa-1)モジュール~a-15)モジュールを通じて具現され得る。
【0039】
前記論文データベースは特定動物種の遺伝形質と表現型の相関性を明かした外部の論文であり得る。
【0040】
まず、a-1)モジュールで、特定動物種のNCBI Taxonomy ID(動物種に付与された固有数字)と検索対象(NCBI Mesh Terms)を通じて、特定動物種の遺伝的変異と疾病関係を見つけ出すことができる検索語および構造的検索語固有ID(mesh Terms ID)を準備することができる。例えば、9685[uid] AND 「mutation」[MeSH Terms]「AND」Diseases Category」[Mesh Terms]「のような内容で準備することができる。
【0041】
この後、a-2)モジュールでは外部論文データベース(例えば、Pubmed、Europe PMC)の論文検索APIを活用して、特定動物種に対する前記a-1)モジュールのキーワードリスト検索を要請して結果データを抽出することができる。この時、抽出カラムとしてはpubmed id、doi、article title、article abstract、mesh termsなどを使うことができる。
【0042】
この後、a-3)モジュールでは前記pubmed id、doiを基準として既存の論文メタデータテーブルに重複個体があるかないかを確認することができる。
【0043】
この後、a-4)モジュールでは論文別にarticle abstractを自動生物個体名認識道具であるpubtatorにインプットデータとして活用することができる。
【0044】
この後、a-5)モジュールでは前記pubtator結果データとして抽出された生物個体名(bio-entity)のうち遺伝子(gene)データ、遺伝子変異位置データおよび表現型データのみ別途に抽出することができる。この時、表現型データは疾病、症状などに対するデータを意味する。
【0045】
この後、a-6)モジュールでは、前記a-2)モジュールの「mesh terms」で同様に遺伝子(gene)データ、遺伝子変異位置データ、表現型データを抽出することができる。
【0046】
この後、a-7)モジュールでは前記a-4)モジュールおよびa-5)モジュールの結果を活用して「遺伝子-遺伝子変異-表現型」関係を自動抽出することができる。前記「遺伝子-遺伝子変異-表現型」関係は、まず「遺伝子」、「遺伝子変異」、「表現型」個体の可能なすべての場合の数を抽出した後、特定条件を基準として加重値を付与して抽出した関係の優先順位ランキングを付与して自動抽出することができる。
【0047】
この後、必要に応じて、a-8)モジュールではキュレーション専門家が前記a-2)モジュールの結果のうちarticle、titleとarticle、abstractを見て、「本来抽出しようとした論文の対象動物種関連論文であるか」、「該当動物種の遺伝形質変異と表現型の相関性を叙述した論文であるか」を確認することができる。
【0048】
この後、a-9)モジュールでは前記a-8)モジュールの結果が真である場合、前記a-7)モジュールの結果と前記a-2)モジュールの結果のうちarticle title、article abstractを対照して正しく抽出された関係にチェックし、前記a-8)モジュールの結果が偽りの場合、間違って抽出されたと判断して前記a-2)モジュールのa)抽出モジュールの性能改善のためにフィードバック、すなわち、抽出時に役に立つようなmesh terms、該当論文がなぜ関連論文ではないかに対するフィードバックを進行することができる。
【0049】
この後、a-10)モジュールでは前記a-9)モジュールで前記a-8)モジュールの結果が真である場合、抽出された「遺伝子-遺伝子変異-表現型」関係で正しく抽出されたものにチェックすることができる。この時、正しく抽出された「遺伝子-遺伝子変異-表現型」関係がない場合、別途に直接作成することができる。
【0050】
この後、a-11)モジュールでは前記a-10)モジュールの結果、正しく抽出された関係があるかないかを確認した後、あればどのような関係であるかa-5)モジュールのモジュール改善のためにフィードバックを進行することができる。
【0051】
この後、a-12)モジュールでは前記a-11)モジュールのフィードバック結果をプログラム開発者が参照して該当関係が抽出された文章を自然語分析あるいは前記a-5)モジュールの結果、生物個体名の文字列間の距離間などの多様な情報に基づいてモジュールの「遺伝子-遺伝子変異-表現型」関係をさらに正確に抽出することができるように改善することができる。
【0052】
この後、a-13)モジュールでは該当論文内の実験対象個体の数(実験群/対照群)を確認および記録することができる。
【0053】
この後、a-14)モジュールでは、前記a-13)モジュールの結果該当論文の実験個体数が過度に不足して信頼度が低いと判断される場合、該当論文に信頼性低いと表示することができる。また、前記低い信頼性を有する論文の遺伝子-遺伝子変異-表現型関係は今後遺伝子検査結果に反映しないか、反映しても信頼性低いと別途表記することができる。
【0054】
この後、a-15)モジュールでは、図2でのように、前記a-13)モジュールの結果、信頼度が充分であれば、該当論文メタデータと遺伝子変異メタデータおよび表現型名(表現型を表す名前)をデータベースに追加することができる。前記論文メタデータとは、title、PubMed ID、DOI、Journal title、Author、abstract、published yearなどを意味する。前記遺伝子変異メタデータとは、phenotype、gene、variant(遺伝子変異)、inheritance type、harmful mutation(T/F)、reliability、speciesなどを意味する。このうち、phenotype id、gene id、variant idの場合、自社データベースで付与したunique idの他に該当個体に対するNCBI MeSH terms IDを別途にマッピングすることができる。前記疾病/遺伝子変異データベース構築モジュールであるモジュールaの結果で論文メタデータテーブル、遺伝子変異メタデータテーブルがアップデートされ、該当過程は周期的に繰り返されて最新データを維持することができる。
【0055】
本発明に係る周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムは、b)疾病メタデータ構築モジュールを含む。
【0056】
前記b)疾病メタデータ構築モジュールは特定動物種の遺伝形質と関連がある表現型メタデータ収集のために外部表現型メタデータデータベースおよび表現型データテーブルにデータを積載することができる。本発明において、特定動物とは、ヒトを含む脊椎動物を意味し得るが、好ましくは伴侶動物を意味し得る。
【0057】
前記疾病/遺伝子変異データベース構築モジュールは図3を通じて例示することができ、以下具体的に説明する。
【0058】
本発明において、前記b)疾病メタデータ構築モジュールは下記のようにb-1)モジュール~b-5)モジュールを通じて具現され得る。
【0059】
まず、b-1)モジュールでは論文メタデータテーブルに存在する「遺伝子-遺伝子変異-表現型」関係のうち「表現型」IDとspecies(動物種)IDを入力値として該当するデータテーブルCの表現型の名前とNCBI MeSH terms IDを獲得することができる。
【0060】
以後、b-2)モジュールでは外部参照用表現型メタデータデータベース(SNOMED CT 2、OMIM 3)のAPIを活用して、前記b-1)モジュールの検索結果を獲得することができる。この時の検索結果は特定表現型の一般的な説明、関連疾病、関連症状であり得る。また、前記外部参照用表現型メタデータデータベースはヒトを基準としたものであるので参考用としてのみ使われ得る。
【0061】
この後、b-3)モジュールでは、前記b-2)モジュールの検索結果に基づいて該当動物種の該当表現型の説明、疾病、症状を作成することができる。この時、必要な場合、獣医学専門家が該当表現型に対する医療行為を作成でき、前記医療行為とは、該当表現型を診断するための検査、該当表現型を有する動物に遂行できる治療行為などを意味し得る。
【0062】
この後、b-4)モジュールでは、前記b-3)モジュールの表現型疾病、症状にNCBI MeSH IDをマッピングすることができる。また、前記b-2)モジュールの医療行為にNCBI Mesh IDをマッピングすることができる。
【0063】
この後、b-5)モジュールでは、前記b-1)モジュール~b-4)モジュールの結果で表現型メタデータテーブルがアップデートされ、該当過程は周期的に繰り返されて最新データを維持することができる。
【0064】
本発明に係る周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムは、c)データマッピングモジュールを含む。
【0065】
前記c)データマッピングモジュールはレポート生成自動化のために、レポート別に表現型データテーブル、遺伝子変異データテーブルに基づいて、レポート文章データテーブルに文章を追加し、レポート別に使われるイメージ要素のIDをマッピングすることができる。
【0066】
前記データマッピングモジュールは図4を通じて例示することができ、以下具体的に説明する。
【0067】
本発明において、前記c)データマッピングモジュールは下記のようにc-1)モジュール~c-6)モジュールを通じて具現され得る。
【0068】
前記c)データマッピングモジュールにおいて、前記レポートは「特定動物種-特定疾病-特定遺伝子変異(ら)」によりそれぞれ生成され得る。
【0069】
まず、c-1)モジュールでは表現型データテーブル、遺伝子変異データテーブルに基づいて実際のレポートに入る文章を作成することができる。前記レポートに入る文章は、例えば文章の作成基準と方法は下記の表1のように作成することができ、実際に入る文章は後述するであろうが図6図9のように作成することができる。下記の表1の文章はキュレーション専門家と獣医学専門家が前記内容を検討して作成できるが、必ずしもこれに制限されるものではない。
【0070】
【表1】


【0071】
この後、c-2)モジュールでは、前記c-1)モジュールで検討された内容を前記表1のように文章データテーブルに追加することができる。前記文章データは固有のidを有することになり、多くの報告書に繰り返されて使われ得る。
【0072】
この後、c-3)モジュールでは、特定報告書(特定動物種-特定疾病-特定遺伝子変異[ら])の報告書固有idと該当文章idをマッピングすることができる。
【0073】
この後、c-4)モジュールでは報告書に使われるイメージのサーバー内絶対経路を文章データテーブルに保存することができる。その結果、イメージデータは固有のidを有することになり、多くの報告書に繰り返されて使われ得る。
【0074】
この後、c-5)モジュールでは、特定報告書(特定動物種-特定疾病-特定遺伝子変異[ら])の報告書固有idと該当イメージidをマッピングすることができる。
【0075】
この後、c-6)モジュールでは、前記c-2)モジュール~c-5)モジュールの結果でレポート文章データテーブルがアップデートされ、該当過程は周期的に繰り返されて最新データを維持することができる。
【0076】
本発明に係る周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムは、d)結果物提供モジュールを含む。
【0077】
前記d)結果物提供モジュールは顧客動物の遺伝子変異情報ファイル(VCF、Variant Call Format)を入力値として受信して遺伝子変異を抽出し、該当動物が有した実際の変異に応じて表現型別報告書を自動で生成し、これを顧客がダウンロードできるように提供することができる。
【0078】
前記疾病/遺伝子変異データベース構築モジュールは図5を通じて例示することができ、以下具体的に説明する。
【0079】
本発明において、前記d)結果物提供モジュールは下記のようにd-1)モジュール~d-15)モジュールを通じて具現され得る。
【0080】
まず、d-1)モジュールでは、顧客動物の遺伝子変異情報ファイル(VCF)を獲得する。前記遺伝子変異情報ファイル(VCF)とは、Variant Call Format、生物情報学で遺伝子配列変異を保存するのに使われるテキスト ファイルの形式を意味する。
【0081】
この後、d-2)モジュールでは前記顧客動物がどのような遺伝子変異を有しているかを該当動物種の遺伝子変異データテーブルを通じて確認することができる。
【0082】
この後、d-3)モジュールでは前記顧客動物が有する遺伝変異を顧客動物データテーブルに記録することができる。ここで記録されるデータは、「該当遺伝子変異の固有ID」(遺伝子変異テーブルから)、変異が発生した対立遺伝子の情報およびその保有数を意味する。また、前記記録されるデータは顧客動物種、動物の名前、性別、中性花の有無、品種、生年月日などであり得る。
【0083】
この後、d-4)モジュールでは前記d-3)モジュールの結果と「該当遺伝子変異の固有ID」に基づいて文章データテーブルで報告書に表示される文章を呼び出すことができる。
【0084】
この後、d-5)モジュールでは前記d-3)モジュールの結果と「該当遺伝子変異の固有ID」に基づいて文章データテーブルで報告書に表示されるイメージを呼び出すことができる。
【0085】
この後、d-6)モジュールではプログラミング言語に基づいて作成された報告書自動化コードを通じて、前記d-4)モジュールと、d-5)モジュールの結果に基づいて各表現型別報告書のウェブページを生成することができる。この時、前記ウェブページはPDF形態でダウンロードすることもでき、その一例を図6図9に示した。
【0086】
本発明に係る周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムは、前記a)モジュール~c)モジュールが周期的に繰り返されることにより、前記d-6)モジュールの結果報告書が最新研究データを反映できるようになる。
【0087】
本発明のさらに他の態様は本発明の周期的にアップデートされる遺伝子変異検査結果レポート自動発行システムを実行するためのプログラムが記録されたコンピュータで読み取り可能な記録媒体を提供する。
【0088】
前記のような内容の本発明が属する技術分野の当業者は、本発明の技術的思想や必須特徴を変更することなく他の具体的な形態で実施され得ることが理解できるであろう。したがって、以上で記述した実施例はすべての面で例示されたものであり、限定的ではないものと理解されるべきである。
【0089】
本発明の範囲は前記詳細な説明よりは後述する特許請求の範囲によって示され、特許請求の範囲の意味および範囲そしてその等価概念から導き出されるすべての変更または変形された形態は本発明の範囲に含まれるものと解釈されるべきである。
図1
図2
図3
図4
図5
図6
図7
図8
図9