IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 独立行政法人国立がん研究センターの特許一覧 ▶ シスメックス株式会社の特許一覧

特開2025-7170情報処理装置を制御する方法、情報処理装置及びコンピュータプログラム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025007170
(43)【公開日】2025-01-17
(54)【発明の名称】情報処理装置を制御する方法、情報処理装置及びコンピュータプログラム
(51)【国際特許分類】
   G16B 30/00 20190101AFI20250109BHJP
   C12Q 1/6869 20180101ALI20250109BHJP
【FI】
G16B30/00
C12Q1/6869 Z
【審査請求】未請求
【請求項の数】25
【出願形態】OL
(21)【出願番号】P 2023108392
(22)【出願日】2023-06-30
(71)【出願人】
【識別番号】510097747
【氏名又は名称】国立研究開発法人国立がん研究センター
(71)【出願人】
【識別番号】390014960
【氏名又は名称】シスメックス株式会社
(74)【代理人】
【識別番号】100103034
【弁理士】
【氏名又は名称】野河 信久
(74)【代理人】
【識別番号】100159385
【弁理士】
【氏名又は名称】甲斐 伸二
(74)【代理人】
【識別番号】100163407
【弁理士】
【氏名又は名称】金子 裕輔
(74)【代理人】
【識別番号】100166936
【弁理士】
【氏名又は名称】稲本 潔
(74)【代理人】
【識別番号】100174883
【弁理士】
【氏名又は名称】冨田 雅己
(74)【代理人】
【識別番号】100189429
【弁理士】
【氏名又は名称】保田 英樹
(74)【代理人】
【識別番号】100213849
【弁理士】
【氏名又は名称】澄川 広司
(72)【発明者】
【氏名】河野 隆志
(72)【発明者】
【氏名】角南 久仁子
(72)【発明者】
【氏名】市川 仁
(72)【発明者】
【氏名】塩田 あすか
(72)【発明者】
【氏名】藤原 健太郎
(72)【発明者】
【氏名】吉本 倫子
(72)【発明者】
【氏名】祐村 実旺
(72)【発明者】
【氏名】鷲尾 尊規
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA01
4B063QA13
4B063QA17
4B063QA20
4B063QQ42
4B063QQ52
4B063QS39
(57)【要約】
【課題】解析対象領域の塩基配列上に変異が検出されなかった場合でも、その配列の所定部位についての核酸解析の品質を確認することを可能にする手段を提供することを課題とする。
【解決手段】シーケンサーにより読み取られた複数の第1のリードに基づいて、核酸の配列中の解析対象領域における変異の検出結果を取得し、第1のリードのうち、解析対象領域の塩基配列から選択された少なくとも1つの所定部位に対応する第2のリードに基づいて、所定部位に対する核酸解析の品質に関する情報を生成し、所定部位における変異の存否に関わらず、品質に関する情報を出力するように情報処理装置を制御することにより、上記の課題を解決する。
【選択図】図4
【特許請求の範囲】
【請求項1】
被検者の検体から取得した核酸の配列を解析する情報処理装置を制御する方法であって、
シーケンサーにより読み取られた複数の第1のリードに基づいて、前記核酸の配列中の解析対象領域における変異の検出結果を取得する工程と、
前記第1のリードのうち、前記解析対象領域の塩基配列から選択された少なくとも1つの所定部位に対応する第2のリードに基づいて、前記所定部位に対する核酸解析の品質に関する情報を生成する工程と、
前記所定部位における変異の存否に関わらず、前記品質に関する情報を出力する工程と、
を含む、方法。
【請求項2】
前記解析対象領域における変異の検出結果を出力する工程をさらに含む請求項1に記載の方法。
【請求項3】
前記解析対象領域からの前記所定部位の選択を受け付ける工程をさらに含む請求項1に記載の方法。
【請求項4】
前記選択を受け付ける工程において、前記所定部位に関する情報の入力を受け付け、入力された前記情報に基づいて前記所定部位が設定される請求項3に記載の方法。
【請求項5】
前記解析対象領域の塩基配列から選択された複数の前記所定部位のそれぞれについて、前記品質に関する情報を生成する請求項1に記載の方法。
【請求項6】
前記所定部位が、前記解析対象領域の塩基配列中の1つの塩基又は2つ以上の連続する塩基からなる請求項1に記載の方法。
【請求項7】
前記所定部位が、変異が生じる可能性のある部位を含む請求項1に記載の方法。
【請求項8】
前記所定部位に生じる可能性のある変異が、前記解析対象領域において、疾患の診断又は治療に関連する変異である請求項7に記載の方法。
【請求項9】
前記疾患の診断又は治療に関連する変異が、
(1) 薬剤の効果及び/又は副作用と関連することが既知の変異、
(2) 疾患の状態、発症及び/又は予後と関連することが既知の変異、及び
(3) 診断又は治療との関連性を示すエビデンスレベルが所定のレベル以上であることが既知の変異
の少なくとも1つである請求項8に記載の方法。
【請求項10】
前記(1)に記載の変異が、コンパニオン診断マーカーである請求項9に記載の方法。
【請求項11】
前記(2)に記載の変異が、ドライバー変異、病原性変異、悪性度マーカーとしての変異、予後予測マーカーとしての変異、罹患リスクマーカーとしての変異、又は発症リスクマーカーとしての変異からなる群から選択される少なくとも1つである請求項9に記載の方法。
【請求項12】
前記(3)に記載のエビデンスレベルが、腫瘍原性エビデンス、疾患素因関連エビデンス、治療効果予測エビデンス、診断エビデンス又は予後予測エビデンスからなる群より選択される少なくとも1つのエビデンスレベルである請求項9に記載の方法。
【請求項13】
前記疾患の診断又は治療に関連する変異が、図6A図6Cに示される表に記載のバイオマーカーから選択される少なくとも1つである請求項8に記載の方法。
【請求項14】
前記所定部位が、既知の遺伝子変異の情報が蓄積された変異情報データベースの情報に基づいて、前記解析対象領域の塩基配列から選択された部位である請求項1に記載の方法。
【請求項15】
前記品質に関する情報が、
(1) 前記第2のリードの数及び/又は長さに関する情報、
(2) 前記第2のリードの各塩基に付与される、前記シーケンサーの塩基配列の読み取りの精度に関する情報、
(3) 前記第1のリードを参照配列にマッピングするアライメントにおいて、前記第2のリードの各塩基に付与される、前記マッピングの精度に関する情報、及び
(4) 前記(1)~(3)の少なくとも1つに記載の情報に基づいて品質を判定した結果
からなる群より選択される少なくとも1つである請求項1に記載の方法。
【請求項16】
前記(1)に記載の情報が、前記所定部位のデプス情報、及び前記第2のリードの長さの平均値から選択される少なくとも1つである請求項15に記載の方法。
【請求項17】
前記(2)に記載の情報が、前記第2のリードの各塩基に付与される、ベースコールの正確さを示す指標値である請求項15に記載の方法。
【請求項18】
前記(3)に記載の情報が、前記第2のリードに付与される、マッピングの正確さを示す指標値である請求項15に記載の方法。
【請求項19】
前記品質に関する情報が、前記所定部位に関する情報と対応付けて出力される請求項1に記載の方法。
【請求項20】
前記品質に関する情報を出力する工程において、前記所定部位に対する核酸解析の品質に関する情報を含む品質管理レポートを生成して出力する請求項1に記載の方法。
【請求項21】
前記品質に関する情報を出力する工程において、前記解析対象領域における変異の検出結果を含む解析結果レポートを生成して出力する請求項2に記載の方法。
【請求項22】
前記解析対象領域が、全ゲノム領域、全エクソーム領域、又は少なくとも1つの標的遺伝子を含むゲノム領域の一部である請求項1に記載の方法。
【請求項23】
前記被検者の検体から取得した核酸がDNA又はRNAである請求項1に記載の方法。
【請求項24】
被検者の検体から取得した核酸の配列を解析する情報処理装置であって、
前記情報処理装置は、制御部と出力部とを備え、
前記制御部は、
シーケンサーにより読み取られた複数の第1のリードに基づいて、前記核酸の配列中の解析対象領域における変異の検出結果を取得する工程と、
前記第1のリードのうち、前記解析対象領域の塩基配列から選択された少なくとも1つの所定部位に対応する第2のリードに基づいて、前記所定部位に対する核酸解析の品質に関する情報を生成する工程と、
前記所定部位における変異の存否に関わらず、前記品質に関する情報を前記出力部に出力する工程と、
を実行する、情報処理装置。
【請求項25】
被検者の検体から取得した核酸の配列を解析するためのコンピュータプログラムであって、
前記コンピュータプログラムは、コンピュータが読み取り可能な媒体に記録され、前記コンピュータに、
シーケンサーにより読み取られた複数の第1のリードに基づいて、前記核酸の配列中の解析対象領域における変異の検出結果を取得する工程と、
前記第1のリードのうち、前記解析対象領域の塩基配列から選択された少なくとも1つの所定部位に対応する第2のリードに基づいて、前記所定部位に対する核酸解析の品質に関する情報を生成する工程と、
前記所定部位における変異の存否に関わらず、前記品質に関する情報を出力する工程と、
を実行させる、コンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、被検者の検体から取得した核酸の配列を解析する情報処理装置を制御する方法に関する。本発明は、被検者の検体から取得した核酸の配列を解析する情報処理装置に関する。本発明は、被検者の検体から取得した核酸の配列を解析するためのコンピュータプログラムに関する。
【背景技術】
【0002】
近年、次世代シーケンサー(NGS)による核酸解析技術の進歩により、ゲノム中の所定の領域を解析するターゲットシーケンス解析をハイスループットに実行できるようになった。また、全エクソーム解析及び全ゲノム解析も、以前より低いコストで実現可能となった。全エクソーム解析では、全てのエキソン領域の塩基配列が解析され、全ゲノム解析では、ゲノム全体の配列が解析される。NGSによる核酸解析技術は、臨床における遺伝子診断にも利用されており、例えば、がん遺伝子パネル検査が知られている。がん遺伝子パネル検査では、患者検体から取得した核酸の配列をNGSにより解析し、遺伝子変異を検出する。検出された遺伝子変異についてレポートが作成され、当該レポートに基づいて医療関係者は治療方針を決定する。
【0003】
例えば、非特許文献1には、検出された遺伝子変異が記載されたRGシーケンシングレポートの一例が記載されている。RGシーケンシングレポートには、検出された遺伝子変異とともに、その遺伝子変異に対する変異アレル頻度が記載される。変異アレル頻度は、「変異デプス/総デプス」で算出される。RGシーケンシングレポートには、変異デプス及び総デプスの各値も、変異アレル頻度とともに記載される。変異デプスとは、参照配列上の所定の塩基に着目したとき、その塩基を含む部分にアライメントされ、且つその塩基に対応する位置に変異を有するリードの数である。総デプスは、その塩基を含む部分にアライメントされたリードの数である。総デプスは、配列上の変異が生じた位置における核酸解析の品質を確認に用いることができる。また、RGシーケンシングレポートには、解析対象領域の各遺伝子に対するデプスの分布が記載される。
【先行技術文献】
【特許文献】
【0004】
【非特許文献1】OncoGuide(商標) NCCオンコパネル システム レポート活用ガイド(https://products.sysmex.co.jp/products/genetic/AK401170/report_guide.pdf)
【発明の概要】
【発明が解決しようとする課題】
【0005】
治療方法を決定する医療関係者から、塩基配列上の変異が検出されなかった位置についても、デプス、クオリティスコア等の核酸解析の品質を確認したいという要望があがっている。例えば、疾患や治療に関連する遺伝子に変異が検出されなかった場合、その位置に対する核酸解析の品質を確認したいという要望があがっている。本発明は、このような医療関係者からの要望に応じることを可能とする、情報処理装置を制御する方法、情報処理装置及びコンピュータプログラムを提供する。
【課題を解決するための手段】
【0006】
本発明は、被検者の検体から取得した核酸の配列を解析する情報処理装置を制御する方法であって、シーケンサーにより読み取られた複数の第1のリードに基づいて、核酸の配列中の解析対象領域における変異の検出結果を取得する工程と、第1のリードのうち、解析対象領域の塩基配列から選択された少なくとも1つの所定部位に対応する第2のリードに基づいて、所定部位に対する核酸解析の品質に関する情報を生成する工程と、所定部位における変異の存否に関わらず、品質に関する情報を出力する工程と、を含む方法を提供する。
【0007】
本発明は、被検者検体から取得した核酸の配列を解析する情報処理装置であって、情報処理装置は、制御部と出力部とを備え、制御部は、シーケンサーにより読み取られた複数の第1のリードに基づいて、核酸の配列中の解析対象領域における変異の検出結果を取得する工程と、第1のリードのうち、解析対象領域の塩基配列から選択された少なくとも1つの所定部位に対応する第2のリードに基づいて、所定部位に対する核酸解析の品質に関する情報を生成する工程と、所定部位における変異の存否に関わらず、品質に関する情報を前記出力部に出力する工程と、を実行する、情報処理装置を提供する。
【0008】
本発明は、被検者検体から取得した核酸の配列を解析するためのコンピュータプログラムであって、コンピュータプログラムは、コンピュータが読み取り可能な媒体に記録され、コンピュータに、シーケンサーにより読み取られた複数の第1のリードに基づいて、核酸の配列中の解析対象領域における変異の検出結果を取得する工程と、第1のリードのうち、解析対象領域の塩基配列から選択された少なくとも1つの所定部位に対応する第2のリードに基づいて、所定部位に対する核酸解析の品質に関する情報を生成する工程と、所定部位における変異の存否に関わらず、品質に関する情報を出力する工程と、を実行させる、コンピュータプログラムを提供する。
【発明の効果】
【0009】
本発明によれば、解析対象領域の塩基配列上に変異が検出されなかった場合でも、その配列の所定部位についての核酸解析の品質を確認できる。
【図面の簡単な説明】
【0010】
図1】核酸解析システムの構成の例を示す図である。
図2A】情報処理装置の構成の例を示す図である。
図2B】検査結果データベースの構成の例を示す図である。
図2C】シーケンサーの構成の例を示す図である。
図3】被検者の検体から取得した核酸の配列をシーケンサーにより読み取る処理の例を示すフローチャートである。
図4】情報処理装置による核酸配列データの解析処理の例を示すフローチャートである。
図5】マッチドペア検査により体細胞変異及び生殖細胞変異を検出する処理の例を示すフローチャートである。
図6A】米国食品医薬品局(FDA)に承認されたコンパニオン診断(CDx)マーカーの例を示す表である。
図6B】FDAに承認されたCDxマーカーの例を示す表である。
図6C】FDAに承認されたCDxマーカーの例を示す表である。
図7A】解析対象領域にマッピングされた第1のリードと、一塩基からなる所定部位(2箇所)に対応する第2のリードとの関係を示す図である。
図7B】解析対象領域にマッピングされた第1のリードと、複数塩基からなる所定部位に対応する第2のリードとの関係を示す図である。
図8】腫瘍配列データ及び正常配列データのそれぞれに基づいて、所定部位に対する核酸解析の品質に関する情報を取得する処理の例を示すフローチャートである。
図9】検査結果レポートの例を示す図である。
図10】情報処理装置のユーザーにより所定部位を決定する処理の例を示すフローチャートである。
図11A】カテゴリー情報を入力して、所定部位を選択するための画面の例を示す図である。
図11B】カテゴリー情報及びサブカテゴリー情報を入力して、所定部位を選択するための画面の例を示す図である。
図11C】カテゴリー情報及びサブカテゴリー情報を入力して、所定部位を選択するための画面の例を示す図である。
図11D】ユーザーが任意に所定部位を選択するための画面の例を示す図である。
図12】マッチドペア検査なしで変異を検出する処理の例を示すフローチャートである。
図13】腫瘍配列データに基づいて、所定部位に対する核酸解析の品質に関する情報を取得する処理の例を示すフローチャートである。
【発明を実施するための形態】
【0011】
(核酸解析システム)
まず、本実施形態の情報処理装置を用いた核酸解析システムについて説明する。図1を参照して、核酸解析システム100は、核酸解析を依頼する依頼元施設200に設置されたデータ送受信装置40と、依頼元施設200からの依頼を受けて核酸解析を実施する依頼先施設300に設置された情報処理装置10、ストレージ20及びシーケンサー30と、を含む。データ送受信装置40と、情報処理装置10とは、ネットワーク400を介して通信可能に接続される。依頼先施設300では、情報処理装置10と、ストレージ20と、シーケンサー30とが、施設内ネットワークを介して通信可能に接続される。データ送受信装置40は、例えばコンピュータで構成され得る。
【0012】
依頼元施設200は、例えば医療施設である。医療施設は、医師、看護師、臨床検査技師などの医療関係者により、患者や疾患の疑いがある者に対して検体の採取、検査、診断、治療などの医療行為がなされる施設である。医療施設としては、例えば病院、診療所、療養所などが挙げられる。図1の例では、依頼元施設200は、シーケンサーを設置していないので、遺伝子パネル検査のような、シーケンサーを用いる核酸解析を実施できない。そのため、依頼元施設200は、依頼先施設300に核酸解析を依頼する。核酸解析の依頼は、依頼書の電子データ(例えばPDFファイル)の送信及び/又は紙に印刷された依頼書の送付によりなされる。また、依頼元施設200は、被検者の検体を依頼先施設300に送付する。
【0013】
依頼先施設300は、依頼元施設200からの依頼に応じて核酸解析を実施し、その解析結果を記載した検査結果レポートを依頼元施設200に提供する施設である。依頼先施設300は、例えば検査センターである。依頼を受け付けた依頼先施設300は、依頼元施設200から提供された検体から核酸を取得して解析し、解析結果に基づいて検査結果レポートを作成し、これを依頼元施設200に提供する。検査結果レポートの提供は、検査結果レポートの電子データ(例えばPDFファイル)の送信及び/又は紙に印刷されたレポートの送付によりなされる。
【0014】
図1に示されるように、依頼先施設300には、本実施形態の情報処理装置10、ストレージ20及びシーケンサー30が設置されている。本実施形態の情報処理装置10については後述する。ストレージ20は、シーケンサー30により読み取られた核酸配列データを記憶する装置である。ストレージ20は、例えばネットワーク接続型ストレージ(NAS)であり得る。NASは、例えば、ハードディスクドライブ(HDD)やソリッドステートドライブ(SSD)などの記憶装置、LANインターフェース及び簡易OSを備える。ストレージ20には、後述の参照配列のデータがあらかじめ格納されていてもよい。
【0015】
本明細書において、「核酸配列データ」とは、被検者の検体に由来するライブラリー試料から取得したリードをいう。核酸配列データは、後述の腫瘍配列データ及び正常配列データを包含する。「リード」とは、シーケンサーにより読み取られたアンプリコンの塩基配列をいう。ライブラリー試料、アンプリコン及びリードについては後述する。
【0016】
シーケンサー30は、ポリヌクレオチドの塩基配列を読み取るための装置である。本明細書において、「塩基配列」との用語は、「核酸配列」及び「ヌクレオチド配列」と同義である。塩基配列とは、核酸分子内でのヌクレオチドの一次元的な並び方(序列)をいう。以下、塩基配列を単に「配列」と呼ぶことがある。シーケンサー30は、好ましくは次世代シーケンサーである。「次世代シーケンサー」との用語は、サンガー法を利用したキャピラリー電気泳動によるシーケンサーである「第1世代シーケンサー」との対比で用いられる語である。次世代シーケンサーは、数千万から数億の核酸断片を同時並列的に処理して配列を読み取ることができる。次世代シーケンサー自体は公知であり、例えば、HiSeq2500(illumina社)、MiSeq(illumina社)、NextSeq(illumina社)、Ion Proton(Thermo Fisher Scientific社)、Ion PGM (Thermo Fisher Scientific社)、GS FLX+(Roche社)、GS Junior(Roche社)などが挙げられる。シーケンサー30により読み取られた塩基配列のデータは、ストレージ20に記憶される。
【0017】
図2Cを参照して、シーケンサー30の構成例を説明する。シーケンサー30は、制御部301と、送受信部302と、入力部303と、出力部304と、記憶部305と、フローセル306と、撮像部307と、を備える。制御部301は、例えばCPUなどのプロセッサ、及びROM、RAMなどのメモリを備える。送受信部302は、制御部301が外部の装置と通信するための通信インターフェースである。入力部303は、例えばキーボード、マウス、タッチセンサなどである。出力部304は、例えばディスプレイ、プリンタ、スピーカーなどである。タッチセンサとディスプレイとが一体化されたタッチパネルのような、入力部及び出力部の両方の機能を有する装置を用いてもよい。記憶部305は、例えばHDD、SSDなどの記憶装置である。フローセル306は、試薬の流れる流路を持ったガラス基板を含み、流路内に導入されたライブラリー試料に含まれるポリヌクレオチドのクラスター形成及びシーケンス反応を起こす。撮像部307は、フローセル306内のクラスターを撮像し、撮像した画像を記憶部305に記憶する。制御部301は、記憶部305に記憶された画像を解析し、ポリヌクレオチドの塩基配列を決定する。
【0018】
「ライブラリー」とは、シーケンサーにより塩基配列を解析されることとなるアンプリコン(増幅産物)の集りを意味する。「ライブラリー試料」は、ライブラリーを含む試料であり、検体から取得した核酸を増幅することにより調製される。ライブラリー試料の調製では、まず、被検者の検体から核酸を抽出する。核酸の種類は、解析の目的に応じて、DNA及びRNAから選択される。DNAの抽出では、検体と、細胞又は組織を可溶化する界面活性剤(例えばコール酸ナトリウム、ドデシル硫酸ナトリウムなど)を含む可溶化液とを混合する。得られた混合液に物理的処理(撹拌、ホモジナイズ、超音波破砕など)を行い、検体に含まれるDNAを液中に遊離させる。RNAの抽出では、検体と、チオシアン酸グアニジン及び界面活性剤を含む可溶化液とを混合する。得られた混合液に物理的処理を行い、検体に含まれるRNAを液中に遊離させる。
【0019】
検体がホルマリン固定パラフィン包埋(FFPE)組織である場合、核酸の抽出は、例えば次のようにして行うことができる。まず、FFPE組織にキシレンを添加して、脱パラフィン処理をする。脱パラフィン処理した組織をエタノールに浸して、親水化処理をする。親水化処理した組織をプロテアーゼで処理して、ホルマリンで架橋された核酸を液中に遊離させる。好ましくは、DNA又はRNAを含む混合液を遠心分離などにより細胞破片を除去して、遊離したDNA又はRNAを含む溶液を取得する。そして、得られた溶液をフェノール/クロロホルム抽出することにより、DNA又はRNAを精製できる。検体からの核酸の抽出及び精製は、市販の試薬キットを用いて行ってもよい。
【0020】
ライブラリー試料の調製では、核酸を断片化することが好ましい。断片化により、取得した核酸を、シーケンサー30による読み取りに適した長さ(数十から数百bp)とすることができる。核酸は、例えば超音波処理により断片化できる。核酸がDNAである場合、断片化は、アルカリ処理、制限酵素処理などによっても行うことができる。例えば、アルカリ処理によりDNAを断片化する場合、DNA溶液に水酸化ナトリウム溶液を終濃度0.1~1.0 Nとなるよう添加し、10~40℃で5~15分間インキュベーションすることによりDNAが断片化される。また、制限酵素処理によりDNAを断片化する場合、制限酵素はDNAの塩基配列に基づいて適宜選択され、例えばMseIやBamHIなどが用いられる。必要に応じて、核酸断片のサイズセレクション、末端平滑化、アダプター配列のライゲーション、インデックス配列のライゲーション、又はバーコード配列のライゲーションなどを行ってもよい。
【0021】
断片化した核酸は、PCRに基づく方法により増幅することが好ましい。解析対象領域を増幅可能なプライマーセットを設計し、それらを用いて核酸をPCR法で増幅することにより、ライブラリー試料を得ることができる。1つのプライマーセットは、1つのフォワードプライマー及び1つのリバースプライマーを含む。シーケンス・キャプチャー法により、核酸断片から解析対象領域を含む核酸を濃縮してもよい。濃縮した核酸をPCR法のテンプレートに用いて増幅することにより、ライブラリー試料を得ることができる。検体中のDNAに由来するライブラリー試料を以下、「DNAライブラリー試料」とも呼ぶ。
【0022】
増幅に用いるプライマーにアダプター配列、インデックス配列、バーコード配列などの付加配列、標識物質などを付加してもよい。複数のプライマーセットを用いる場合、これらのプライマーセットはマルチプレックスPCRが可能であることが好ましい。これにより、取得した核酸中の複数の領域を同時に増幅できる。この場合、各プライマーセットには、相互に異なるバーコード配列を付加することが好ましい。これにより、各プライマーセットによるアンプリコンを識別できる。エキソームシーケンシングキットなどの市販の試薬キットに添付されているマルチプレックスPCR用プライマーセットを用いてもよい。
【0023】
増幅に用いるポリメラーゼは、PCRに用いられる公知の耐熱性ポリメラーゼから適宜選択できるが、それらの中でも、マルチプレックスPCRに適しており、且つPCR増幅によるエラーが少ない耐熱性ポリメラーゼが望ましい。増幅反応には、選択したポリメラーゼに適したバッファーを用いればよい。PCR増幅によるエラーを抑えるために、PCRのサイクル数は、シーケンシングに必要な数のアンプリコンが得られる範囲で最小限にすることが好ましい。サイクル数は、例えば10サイクル以上25サイクル以下の範囲から決定すればよい。
【0024】
上記のようにして得たライブラリー試料について、当該技術分野において公知のシーケンシング法により塩基配列を読み取ればよい。シーケンシング法は特に限定されないが、次世代シーケンサーによる解析が好ましい。次世代シーケンサーによる解析法としては、イオン半導体シーケンシング法、パイロシーケンシング法、SBS(sequencing by synthesis)法などが挙げられる。
【0025】
本実施形態の情報処理装置10は、被検者の検体から取得した核酸の配列を解析するための装置である。図2Aを参照して、情報処理装置10の構成の例を説明する。情報処理装置10は、制御部101と、送受信部102と、入力部103と、出力部104と、記憶部105とを備える。記憶部105には、参照配列データベース106と、変異情報データベース107と、解析対象テーブル108と、品質指標テーブル109と、解析結果データベース110と、が記憶されている。あるいは、参照配列データベース106、変異情報データベース107、解析対象テーブル108、品質指標テーブル109及び解析結果データベース110は、ストレージ20に記憶されてもよい。各データベース/テーブルに含まれる情報については後述する。情報処理装置10は、例えばコンピュータで構成され得る。この場合、制御部101は、例えばCPUなどのプロセッサ、及びROM、RAMなどのメモリを備える。送受信部102は、制御部101が外部の装置及びネットワーク400と通信するための通信インターフェースである。入力部103は、例えばキーボード、マウス、タッチセンサなどである。出力部104は、例えばディスプレイ、プリンタ、スピーカーなどである。タッチセンサとディスプレイとが一体化されたタッチパネルのような、入力部及び出力部の両方の機能を有する装置を用いてもよい。記憶部105は、例えばHDD、SSDなどの記憶装置である。記憶部105には、核酸の配列を解析するためのコンピュータプログラムが記憶される。制御部101は、記憶部105からコンピュータプログラムを読み出し、後述する核酸配列の解析処理を実行する。
【0026】
参照配列データベース106及び変異情報データベース107に含まれる情報は、外部のデータベースの情報に基づいて、定期的に最新の情報に更新され得る。情報の更新は、核酸解析システムを提供するベンダー又はユーザーによって実施されてもよい。あるいは、核酸解析システムによって自動的に情報の更新が実施されてもよい。外部のデータベースとしては、例えば、各国の学術団体や公的機関から提供される情報(参照配列の情報、及び既知の遺伝子変異に関する種々の情報)を蓄積したデータベース、ベンダーから提供される商用データベースなどが挙げられる。
【0027】
「参照配列」とは、リードが、ゲノム領域上のどこに対応する塩基配列であるかを決定するための参照となる配列である。参照配列は、解析対象領域の塩基配列を含む配列であればよい。参照配列としては、例えば、ヒトの全ゲノム領域の塩基配列、全エキソン領域の塩基配列、標的遺伝子の塩基配列などが挙げられる。
【0028】
「変異」及び「遺伝子変異」は、突然変異及び遺伝子多型を包含する。変異としては、例えば配列変異、構造変異及びコピー数変異が挙げられる。配列変異は、1又は複数のヌクレオチドの置換、挿入、欠失及びそれらの組み合わせである。ヌクレオチドの置換は、例えば一塩基変異(SNV)及び一塩基多型(SNP)が挙げられる。ヌクレオチドの挿入及び欠失は「InDel」とも呼ばれる。構造変異は、例えば転座、逆位、欠失及び重複が挙げられる。コピー数変異は、例えば増幅及び欠失が挙げられる。
【0029】
解析対象テーブル108は、解析対象領域の情報を含む。解析対象領域の情報は、例えば、解析対象領域として選択される標的遺伝子の情報が記載される。標的遺伝子の情報としては、例えば、遺伝子の名称、位置情報及び塩基配列などが挙げられる。位置情報としては、染色体番号(Chr)、遺伝子(Gene)ゲノム配列上での当該遺伝子の塩基配列の始点(Pos-Start)及び終点(Pos-End)などが挙げられる。表1に解析対象テーブル108の一例を示すが、これに限定されない。
【0030】
【表1】
【0031】
「解析対象領域」は、被検者の検体から取得した核酸において塩基配列の解析を所望する領域である。解析対象領域は、ゲノム領域から任意に決定できる。好ましくは、解析対象領域は、少なくとも1つの標的遺伝子を含むゲノム領域の一部である。解析対象領域は、全ゲノム領域又は全エクソーム領域であってもよい。解析対象領域は1つでもよいし、複数でもよい。例えば、遺伝子パネル検査では、数十又は百以上の遺伝子を解析対象領域として核酸解析を行う。
【0032】
「標的遺伝子」は、変異の有無の判定が所望される遺伝子である。標的遺伝子は、特に限定されず、検査の目的に応じて適宜決定できる。例えば、公知の遺伝子パネル検査に用いられる遺伝子が挙げられる。標的遺伝子の塩基配列には、当該遺伝子のエキソン、イントロン、プロモーターなどの転写調節領域の塩基配列、及び当該遺伝子から転写されたmRNAの配列が包含される。mRNAには、pre-mRNAが包含される。
【0033】
核酸解析システム100は、例えば、遺伝子パネル検査を実施する場合に利用できる。遺伝子パネル検査は、臨床検査に限られず、研究用途の検査も包含する。例えば、依頼元施設200は、遺伝子パネル検査などの核酸解析の依頼情報をデータ送受信装置40により依頼先施設300へ送信する。また、依頼元施設200は、被検者の検体を依頼先施設300に送付する。
【0034】
被検者は、特に限定されず、例えば患者、疾患の疑いがある者、健常者などが挙げられる。疾患は特に限定されず、例えば、遺伝学的検査やゲノム医療が有用と考えられる疾患が挙げられる。そのような疾患としては、例えば、がん、自己免疫疾患、遺伝性疾患などが挙げられる。検体は、被検者の核酸を含むかぎり、特に限定されない。好ましくは、検体は、被検者から採取された生体試料である。生体試料としては、例えば、組織、細胞、体液、分泌液、尿、糞便などが挙げられる。体液は、例えば、血液(全血)、骨髄液、脳脊髄液、リンパ液、腹水、胸水、羊水、関節液などが挙げられる。分泌液は、例えば、唾液、汗、涙液、鼻汁、精液、乳頭分泌液などが挙げられる。検体は、生体試料からの調製物であってもよい。例えば、血液からの調製物は、血漿及び血清が挙げられる。細胞からの調製物としては、採取した細胞を培養して得られた培養物(培養した細胞及び培地を含む)が挙げられる。組織からの調製物は、例えば、凍結組織、固定組織、FFPE組織などが挙げられる。
【0035】
固形がんの患者である被検者に対してマッチドペア検査を行う場合は、検体として、腫瘍検体及び非腫瘍検体の2種類を用いる。マッチドペア検査とは、固形がん患者の腫瘍検体及び非腫瘍検体のそれぞれから取得した核酸の配列を解析し、それらの結果に基づいて体細胞変異と生殖細胞変異を区別して検出することが可能な検査である。腫瘍検体は、例えば、手術又は生検により被検者から採取された腫瘍組織及びその調製物であり得る。非腫瘍検体は、同じ被検者から採取した非腫瘍細胞(例えば全血)であり得る。
【0036】
固形がんは、がんのうち、血液がん以外のがんをいう。固形がんの種類は特に限定されず、上皮細胞がん及び非上皮細胞がんのいずれであってもよい。上皮細胞がんは、上皮細胞に発生するがんであれば特に限定されず、例えば、肺がん、乳がん、胃がん、大腸がん、肝がん、子宮がん、卵巣がんなどが挙げられる。非上皮細胞がんは、例えば、骨肉腫、軟骨肉腫、横紋筋肉腫、平滑筋肉腫、線維肉腫、脂肪肉腫、血管肉腫などが挙げられる。
【0037】
品質指標テーブル109には、後述する所定部位に関する情報として、少なくとも、解析対象領域における所定部位の位置情報を含む。図2Bに示すように、解析結果データベース110は、解析対象領域における変異の検出結果を含む測定結果テーブルと、所定部位に対する核酸解析の品質に関する情報を含む品質情報テーブルと、それらから生成された検査結果レポートの情報を含むレポートテーブルと、を検査依頼ごとに含む。各テーブルは、検査依頼を個別に識別する検査依頼IDと紐づけられている。
【0038】
以下、核酸解析システム100による核酸配列の解析について説明する。依頼元施設200の担当者が、データ送受信装置40に核酸解析の依頼情報を入力すると、依頼情報は、ネットワーク400を介して情報処理装置10に送信され、情報処理装置10によって受信される。依頼情報は、例えば、被検者の情報、検体の情報などが含まれてもよい。被検者の情報は、例えば、年齢、性別、疾患の種類及び状態などを含む。検体の情報は、例えば、検体の種類、採取時期、検体と被検者とを関連付ける検体IDなどを含む。依頼情報には、解析対象領域及び/又は所定部位の指定が含まれてもよい。遺伝子パネル検査の依頼の場合、依頼情報には、所望の遺伝子パネルの指定が含まれてもよい。所定部位については後述する。依頼先施設300の担当者は、情報処理装置10が受信した依頼情報に応じて、シーケンサー30に、解析の依頼を入力する。
【0039】
図3を参照して、シーケンサー30による塩基配列の読み取りについて説明する。ステップS11において、シーケンサー30の制御部301は、解析の依頼を受け付ける。ステップS12において、シーケンサー30の制御部301は、ライブラリー試料の塩基配列を読み取る。
【0040】
上記のとおり、シーケンサーにより読み取られたアンプリコンの塩基配列が、「リード」である。すなわち、ステップS12では、シーケンサー30はライブラリー試料の各アンプリコンの塩基配列を読み取り、リードを取得する。リードの長さは、解析法、シーケンサーの種類などにより異なるが、例えば50塩基以上、好ましくは100塩基以上、より好ましくは150塩基以上である。また、リードの長さは、例えば500塩基以下、好ましくは350塩基以下、より好ましくは250塩基以下である。リードの数は、特に限定されず、検体から取得した核酸のコピー数、PCR法で増幅した部位などにより異なる。
【0041】
ステップS13では、シーケンサー30の制御部301は、取得した全てのリードをストレージ20に送信する。ストレージ20は、それらのリードを記憶する。シーケンサー30から送信されるリードのファイル形式は、例えばFASTA、FASTQ、uBAMである。FASTAファイルは、リードの配列情報だけを含むファイルである。FASTQファイルは、後述のクオリティスコアを含むリードの配列情報を含むファイルである。uBAMファイルは、参照配列へのアライメントがされていないリードの配列情報を含むバイナリファイルである。アライメントについては後述する。なお、ステップS13では、シーケンサー30の制御部301は、取得したリードを情報処理装置10に送信してもよい。この場合、情報処理装置10がそれらのリードを記憶する。
【0042】
シーケンサー30から送信されるファイルには、リードのデータと共に、リードの名称(又は配列ID)、配列中の各塩基のクオリティスコアなどの情報が含まれてもよい。クオリティスコアは、シーケンサーによるベースコール(塩基の指定)の正確さを表す指標である。ここで、リードの塩基配列は、シーケンサーが取得したトレースデータ(シーケンシング反応で得たシグナルの波形データなどの生データ)からベースコールが行われることで決定される。すなわち、クオリティスコアは、シーケンサーにより決定された塩基配列の正確さを表す。ベースコールは、例えばPhredのような公知のベースコーリングプログラムにより実行される。クオリティスコアとして、例えば、illumina社のシーケンサー(HiSeq2500、MiSeq、NextSeq等)から出力されるクオリティスコア(Q)を用いることができる。クオリティスコア(Q)は、下記の式(I)により算出される。式中、Eは、ベースコールが誤っている確率の推定値である。
【0043】
Q=-10log10E ・・・(I)
【0044】
クオリティスコアは、リードの各塩基に付与される。例えば、リード中のある塩基のクオリティスコアが20であるとき、その塩基におけるエラーの頻度は10-2/塩基であり、クオリティスコアが30であるとき、その塩基におけるエラーの頻度は10-3/塩基である。リードにおけるクオリティスコアの平均値は、エラーの頻度を表すことができる。クオリティスコアの平均値は、リードの各塩基のクオリティスコアの和を、リードの長さ(塩基数)で割ることにより算出できる。例えば、クオリティスコアの平均値が20であるとき、リード中のエラーは100塩基に1つであり、クオリティスコアの平均値が30であるとき、リード中のエラーは1,000塩基に1つである。このように、クオリティスコアが高いほど、エラーの確率が低くなる。クオリティスコア及びその平均値は、次世代シーケンサーにより自動的に算出される。
【0045】
DNAを解析対象とするマッチドペア検査を行う場合、腫瘍検体(例えば腫瘍組織のFFPE検体)及び非腫瘍検体(例えば全血)のそれぞれから、DNAライブラリー試料を調製する。そして、シーケンサー30は、ステップS12において、各ライブラリー試料の各アンプリコンの塩基配列を読み取り、リードを取得する。以下、腫瘍検体に由来するDNAライブラリー試料から取得したリードを、「腫瘍配列データ」と呼ぶ。また、非腫瘍検体に由来するDNAライブラリー試料から取得したリードを、「正常配列データ」と呼ぶ。
【0046】
図4を参照して、情報処理装置10による核酸配列データの解析処理の一例について説明する。ステップS21において、情報処理装置10の制御部101は、ストレージ20に記憶されたリードを読み出す。ステップS22において、制御部101は、リードに基づいて、解析対象領域における変異の検出結果を取得する。
【0047】
ステップS22の一つの実施形態として、マッチドペア検査により体細胞変異及び生殖細胞変異を検出する処理のフローについて説明する。体細胞変異とは、体細胞の遺伝子に生じた変異である。体細胞変異は、腫瘍の原因の一つであることが知られている。図5を参照して、ステップS31において、制御部101は、参照配列データベース106から参照配列を読み出し、ステップS21で読み出した腫瘍配列データと参照配列とのアライメントを実行する。また、ステップS32において、制御部101は、正常配列データと参照配列とのアライメントを実行する。腫瘍配列データと参照配列とのアライメントの結果及び正常配列データと参照配列とのアライメントの結果は、記憶部105に記憶される。
【0048】
「アライメント」は、各リードについて、参照配列上で対応する領域を決定する処理である。アライメントは、マッピングとも呼ばれる。参照配列は、体細胞変異を含まない塩基配列であればよい。例えば、参照配列は、野生型のゲノムの塩基配列である。リードと参照配列とのアライメントには、BWA(Burrows-Wheeler Aligner)、BWA-MEM、Bowtie、Bowtie2、BLASTなどの公知のアライメントツール(ソフトウェア)を用いることができる。
【0049】
リードのうち、解析対象領域に対応するリードを、以下「第1のリード」とも呼ぶ。「解析対象領域に対応するリード」とは、解析対象領域の塩基配列を含む参照配列に対するアライメントを実行したときに、解析対象領域の塩基配列に配置されたリードをいう。後述の図7A及びBに示されるように、解析対象領域の塩基配列には、通常、複数の第1のリードがマッピングされる。解析対象領域の塩基配列は、通常、第1のリードよりも長い。図中、第1のリードは、白抜きのバー及び黒のバーで表される。なお、第1のリードのうち、黒のバーは、後述の第2のリードを表す。
【0050】
制御部101は、各配列リードのマッピングクオリティスコアを算出してもよい。マッピングクオリティスコアは、リードのマッピングの正確さを表す指標である。マッピングクオリティスコア(Q)は、下記の式(II)により算出される。式中、Pは、リードが誤った位置にマッピングされる確率である。
【0051】
Q=-10log10P ・・・(II)
【0052】
あるリードのマッピングクオリティスコアの値が高いほど、そのリードが誤った位置にマッピングされている確率は低くなる。したがって、リードのマッピングクオリティスコアが高いとき、リードは、解析対象領域に対応する塩基配列を有する可能性が高いといえる。
【0053】
腫瘍配列データにおいて、参照配列と一致しない部位がある場合、当該部位は、腫瘍組織の遺伝子の変異であるか又は被検者固有の遺伝子多型であり得る。正常配列データにおいて、参照配列と一致しない部位がある場合、当該部位は、被検者固有の遺伝子多型であるか又は生殖細胞変異であり得る。
【0054】
ステップS33において、制御部101は、正常配列データにおいて、参照配列と一致しない部位があるか否かを判定する。上記のとおり、参照配列と一致しない部位がある場合、当該部位は、生殖細胞変異であるか又は被検者固有の遺伝子多型であり得る。制御部101が、正常配列データが参照配列と一致しないと判定したとき、プロセスはステップS34へ進む。ステップS34において、制御部101は、ステップ33で検出された正常配列データ中の参照配列と一致しない部位を生殖細胞変異と判定する。その後、プロセスは後述するステップS37へ進む。一方、ステップS33において、制御部101が、正常配列データが参照配列と一致すると判定したとき、プロセスはステップS35へ進む。ステップS35において、制御部101は、ステップ33で検出された正常配列データ中の参照配列と一致する部位に対応する腫瘍配列データが、参照配列と一致するか否かを判定する。腫瘍配列データが参照配列と一致しない場合、ステップS35で検出された腫瘍配列データ中の参照配列と一致しない部位は、腫瘍組織の遺伝子にのみ認められる変異である可能性が高い。腫瘍組織の遺伝子にのみ認められる変異は、体細胞変異である。よって、ステップS36において、制御部101は、ステップ35で検出した部位を体細胞変異と判定する。
【0055】
ステップS35において、腫瘍配列データが参照配列と一致する場合、制御部101は、処理を終了する。この場合、被検者には体細胞変異も生殖細胞変異もないと考えられる。
【0056】
ステップS37において、制御部101は、検出された体細胞変異又は生殖細胞変異に基づいて、変異情報データベース107を検索する。変異情報データベース107には、既知の遺伝子変異を特定するための情報が蓄積されている。そのような情報としては、変異識別子(変異ID)、遺伝子名、変異の位置情報(例えば染色体番号(Chr)及びゲノム配列の塩基番号(Pos))、REF、ALT、アノテーションなどが挙げられる。変異IDは、変異を識別するための識別子である。変異の位置情報のうち、Chrは、変異が位置する染色体の番号を示す。Posは、ゲノム配列の塩基番号を示す。REFは、野生型における塩基を示し、ALTは、変異後の塩基を示す。アノテーションは、変異により変化するアミノ酸及び/又は塩基の情報を示す。アノテーションは、例えば「p.A146V」、「c.437C>T」のように表示されてもよい。「p.A146V」は、変異によりタンパク質の146番目のアラニン残基がバリン残基に変化したことを意味する。「c.437C>T」は、変異により437番目のシトシンがチミンに変化したことを意味する。
【0057】
例えば、制御部101は、検出された体細胞変異又は生殖細胞変異が存在する遺伝子の名称と位置情報に基づいて、変異情報データベース107を検索できる。これにより、検出された体細胞変異又は生殖細胞変異が、既知の遺伝子変異のいずれに該当するかを決定できる。
【0058】
変異情報データベース107は、既知の遺伝子変異を特定するための情報だけでなく、それらの既知の遺伝子変異と関連する疾患情報、薬剤情報及びバイオマーカーの属性情報がさらに格納されてもよい。疾患情報としては、例えば、既知の遺伝子変異に関連する疾患名(例えば大腸がん、肺がん、乳がんなど)、疾患の種類(例えば、がん、眼疾患、精神神経疾患など)、ドライバー変異に関する情報、変異の病原性評価に関する情報(例えば病原性(pathogenic)、病原性の可能性がある(likely pathogenic)、良性(benign)など)、変異と疾患との関連性レベルに関する情報(例えばエビデンスレベル)、変異と疾患との関連性の種別情報(例えば、腫瘍原性エビデンス(Oncogenic)、疾患素因関連エビデンス(Predisposing)、治療効果予測エビデンス(Predictive)、診断エビデンス(Diagnostic)、予後予測エビデンス(Prognostic))などが挙げられる。薬剤情報としては、例えば、既知の遺伝子変異に関連する治療薬の有無、治療薬の名称、治療薬が承認された国・地域などの情報が挙げられる。バイオマーカーの属性情報としては、例えば、バイオマーカーの種類(例えば、コンパニオン診断(CDx)、悪性度、予後、罹患リスク、発症リスクなど)、マーカー検査の情報(例えば、検査の適用対象の疾患名、治療薬の名称、検査が承認された国・地域など)が挙げられる。
【0059】
ステップS38において、制御部101は、検索結果に基づき、検出された体細胞変異又は生殖細胞変異にアノテーションを付与する。ステップS31~S38の処理により、制御部101は、ステップS22において、変異の検出結果として、解析対象領域における遺伝子変異の情報を得る。遺伝子変異の情報としては、例えば、検出された変異が生じている遺伝子の名称(Gene)、変異の位置情報(染色体番号(Chr)、ゲノム配列の塩基番号(Pos)など)、遺伝子変異におけるアミノ酸変化(AA)、遺伝子変異におけるコーディング領域変化(CDS)、体細胞変異又は生殖細胞変異の種別の情報(Somatic/Germline)、変異の種類(Mutation type)などが挙げられる。
【0060】
制御部101は、ステップS22のプロセスにより取得した変異の検出結果を、検査結果データベース110の測定結果テーブルに記憶する。表2に測定結果テーブルの一例を示すが、これに限定されない。測定結果テーブルには、ステップS22のプロセスにより検出された全ての遺伝子変異が含まれる。表中、「Chr」は、検出された遺伝子変異の染色体番号を示し、「Pos」は、検出された遺伝子変異のゲノム配列の塩基番号を示し、「CDS」は、検出された遺伝子変異におけるコーディング領域変化を示し、「AA」は、検出された遺伝子変異におけるアミノ酸変化を示し、「Somatic/Germline」は、検出された遺伝子変異が体細胞変異であるか、生殖細胞変異であるかの種別を示し、「Mutation type」は、検出された遺伝子変異の種類を示す。
【0061】
【表2】
【0062】
制御部101は、変異の検出結果を取得する処理を終了し、プロセスは、図4のステップS23へ進行する。ステップS23において、制御部101は、核酸配列データに基づいて、所定部位に対する核酸解析の品質に関する情報を生成する。
【0063】
「所定部位」とは、解析対象領域の塩基配列から任意に選択される少なくとも1つの部位である。所定部位は、核酸解析の品質を調べ、その品質に関する情報を提供するために選択される。制御部101による所定部位の決定については、後述する。解析対象領域の塩基配列において、所定部位は1箇所であってもよいし、複数箇所であってもよい。また、所定部位は、解析対象領域の塩基配列中の1つの塩基又は2つ以上の連続する塩基からなる。すなわち、所定部位は、一塩基であってもよいし、連続する複数の塩基からなる領域であってもよい。所定部位が、連続する複数の塩基からなる領域である場合、その長さは、例えば2塩基、3塩基、4塩基、5塩基、6塩基、7塩基、8塩基、9塩基、10塩基又は11塩基であり得る。
【0064】
所定部位は、変異が生じる可能性のある部位を含むことが好ましい。所定部位は、変異が生じる可能性のある部位であってもよいし、変異が生じる可能性のある部位及びその近傍であってもよい。例えば、解析対象領域中の既知の変異として、ある一塩基に置換又は欠失が生じ得るか、又は一塩基が挿入され得ることが既知であった場合、所定部位は、その変異が生じ得る一塩基自体であってもよい。あるいは、所定部位は、その変異が生じ得る一塩基を中心として上流側及び下流側に1~5塩基ずつの領域であってもよい。この場合、所定部位は、その変異が生じ得る一塩基を含む領域であってもよい。所定部位に実際に変異が生じていたか否かは問わない。核酸解析の結果、所定部位に変異が生じていてもよいし、生じていなくてもよい。
【0065】
所定部位に生じる可能性のある変異は、例えば、解析対象領域において、疾患の診断又は治療に関連する変異である。そのような変異としては、例えば、以下の(1)~(3)に記載の変異が挙げられる。
【0066】
(1) 薬剤の効果及び/又は副作用と関連することが既知の変異、
(2) 疾患の状態、発症及び/又は予後と関連することが既知の変異、及び
(3) 診断又は治療との関連性を示すエビデンスレベルが所定のレベル以上であることが既知の変異。
【0067】
(1)に記載の変異は、例えばコンパニオン診断マーカー(CDxマーカー)である。そのようなマーカーとしては、例えばFoundationOne(登録商標) CDxがんゲノムプロファイル(中外製薬株式会社)などの遺伝子パネル検査に用いられる遺伝子変異が知られている。(2)に記載の変異は、例えばドライバー変異、病原性変異、悪性度マーカーとしての変異、予後予測マーカーとしての変異、罹患リスクマーカーとしての変異、発症リスクマーカーとしての変異である。そのようなマーカーとしては、例えばOncoGuide(商標) NCCオンコパネルシステム(シスメックス株式会社)、FoundationOne(登録商標) CDxがんゲノムプロファイル(中外製薬株式会社) に用いられる遺伝子変異が知られている。
【0068】
エビデンスレベルは、エビデンスについて信頼又は推奨できる度合いを示す。(3)に記載のエビデンスレベルは、例えば腫瘍原性エビデンス、疾患素因関連エビデンス、治療効果予測エビデンス、診断エビデンス又は予後予測エビデンスのエビデンスレベルである。腫瘍原性エビデンスは、体細胞変異や生殖細胞変異のような、細胞のがん化に寄与する遺伝子変異をいう。疾患素因関連エビデンスは、遺伝性の乳がんや卵巣がんなどにおける、がん化関連の生殖細胞変異をいう。治療効果予測エビデンスは、薬剤、放射線治療などの感受性及び耐性に関連するマーカーや、薬物動態に影響する薬物代謝酵素や薬物トランスポーターの遺伝子変異などをいう。診断エビデンスは、患者の診断に関連するマーカーであり、例えば、細胞の形態、腫瘍の組織像、免疫組織染色によるがん種特異的なマーカータンパクの発現や局在などが挙げられる。予後予測エビデンスは、がんの進行、重症度、生存予後などに関するマーカーをいう。これらのエビデンスについてのエビデンスレベルは、例えば、日本臨床腫瘍学会、日本癌治療学会、日本癌学会、米国臨床腫瘍学会(ASCO)、米国病理医協会(CAP)、米国分子病理学会(AMP)、欧州臨床腫瘍学会(ESMO)などの学術団体から発表されている。
【0069】
疾患の診断又は治療に関連する変異は、例えば、FDAに承認されたCDxマーカーから選択されてもよい。具体的には、疾患の診断又は治療に関連する変異は、図6A~6Cに示される表に記載のバイオマーカーから選択されてもよい。これらの図に示される各バイオマーカーに対応する検査又はキットの名称及び製造業者を、表3に示す。
【0070】
【表3】
【0071】
所定部位は、上記の変異情報データベース107の情報に基づいて、解析対象領域の塩基配列から選択してもよい。具体的には、制御部101は、記憶部105から、解析対象領域の情報と、既知の遺伝子変異に関する情報とを読み出す。既知の遺伝子変異に関する情報は、変異情報データベース107に含まれる。既知の遺伝子変異に関する情報は、例えば、上記の既知の遺伝子変異を特定するための情報、疾患情報、薬剤情報及びバイオマーカーの属性情報である。制御部101は、読み出した情報に基づいて、所定部位を決定し、所定部位に関する情報を抽出する。所定部位に関する情報は、品質指標テーブル109(図2B参照)に含まれる情報として記憶部105に記憶されてもよい。なお、所定部位は、所定の判定ルール又はユーザーの指示により制御部101により選択されてもよいし、記憶部105に記憶される核酸の配列を解析するためのコンピュータプログラムの設計者により選択され、選択された所定部位が予めコンピュータプログラムに記載されていてもよい。
【0072】
一つの実施形態として、バイオマーカーの属性情報に基づいて所定部位を決定する例について説明する。この例では、バイオマーカーの属性情報として、CDxマーカーの情報に基づいて所定部位を決定する。しかし、バイオマーカーの属性情報は、CDxマーカーの情報に限定されない。悪性度、予後、罹患リスク、発症リスクなどに関する他のバイオマーカーの情報に基づいて、所定部位を決定してもよい。制御部101は、変異情報データベース107からCDxマーカーの情報を取得する。次いで、制御部101は、取得した情報に基づいて、解析対象テーブル108の解析対象領域の中から、CDxマーカーの部位を抽出する。そして、制御部101は、抽出したCDxマーカーの部位の位置を示す情報を、記憶部105の品質指標テーブル109に記憶する。これにより、制御部101は、解析対象領域中のCDxマーカーの部位を所定部位として決定できる。この実施形態の品質指標テーブル109の例を、表4に示す。表中、「Region」は、CDxマーカーが承認された国及び地域を示す。
【0073】
【表4】
【0074】
表4に示されるように、品質指標テーブル109には、所定部位に関する情報として、所定部位を含む遺伝子の名称(Gene)、所定部位の位置情報(所定部位が位置する染色体番号(Chr)、ゲノム配列の塩基番号(Pos))が記載されている。品質指標テーブル109には、表4に示されるように、所定部位に生じる可能性のある変異に関する情報として、遺伝子変異におけるアミノ酸変化(AA)が記載されている。表4に示す品質指標テーブル109では、更に、マーカーの種類(Marker type)、CDx検査が承認された国及び地域(Region)、CDx検査が適用される疾患(がん)の種類の情報(Cancer type)が記載されている。
【0075】
さらなる実施形態として、疾患情報に基づいて所定部位を決定する例について説明する。この例では、疾患情報として、既知の遺伝子変異に関連する疾患名に基づいて所定部位を決定する。より具体的には、肺がんに基づいて所定部位を決定する。しかし、疾患情報は、肺がんに限定されない。他の疾患や疾患の種類の情報に基づいて、所定部位を決定してもよい。制御部101は、変異情報データベース107から、肺がんに関連する遺伝子変異についての情報を取得する。次いで、制御部101は、取得した情報に基づいて、解析対象テーブル108の解析対象領域の中から、肺がんに関連する一塩基又は複数塩基を抽出する。そして、制御部101は、抽出した肺がんに関連する一塩基又は複数塩基の情報を、品質指標テーブル109として記憶部105に記憶する。これにより、制御部101は、解析対象領域中の肺がんに関連する一塩基又は複数塩基を所定部位として決定できる。
【0076】
他の疾患情報に基づいて所定部位を決定する例について説明する。この例では、疾患情報として、変異と疾患との関連性レベルに関する情報に基づいて所定部位を決定する。より具体的には、エビデンスレベルに基づいて所定部位を決定する。しかし、疾患情報は、エビデンスレベルに限定されない。変異と疾患との関連性の種別情報に基づいて、所定部位を決定してもよい。制御部101は、変異情報データベース107から、エビデンスレベルが所定のレベル以上の遺伝子変異についての情報を取得する。次いで、制御部101は、取得した情報に基づいて、解析対象テーブル108の解析対象領域の中から、エビデンスレベルが所定のレベル以上の遺伝子変異が生じ得る一塩基又は複数塩基を抽出する。そして、制御部101は、抽出した一塩基又は複数塩基の情報を、品質指標テーブル109として記憶部105に記憶する。これにより、制御部101は、解析対象領域中の、エビデンスレベルが所定のレベル以上の遺伝子変異が生じ得る一塩基又は複数塩基を所定部位として決定できる。
【0077】
さらに、他の疾患情報に基づいて所定部位を決定する例について説明する。この例では、疾患情報として、ドライバー変異に関する情報に基づいて所定部位を決定する。しかし、疾患情報は、ドライバー変異に関する情報に限定されない。変異の病原性評価に関する情報に基づいて、所定部位を決定してもよい。制御部101は、変異情報データベース107から、ドライバー変異に関する情報を取得する。次いで、制御部101は、取得した情報に基づいて、解析対象テーブル108の解析対象領域の中から、ドライバー変異が生じ得る一塩基又は複数塩基を抽出する。そして、制御部101は、抽出した領域の情報を、品質指標テーブル109として記憶部105に記憶する。これにより、制御部101は、解析対象領域中の、ドライバー変異が生じ得る一塩基又は複数塩基を所定部位として決定できる。
【0078】
疾患情報に基づく品質指標テーブル109の例を、表5に示す。表中、「Disease type」は、変異に関連する疾患の種類を示し、「Disease name」は、変異に関連する疾患名を示し、「Evidence type」は、変異と疾患との関連性の種別情報を示し、「Evidence level」は、変異と疾患との関連性レベルを示す情報である。表5に示されるように、品質指標テーブル109には、所定部位の位置情報(所定部位が位置する染色体番号(Chr)、ゲノム配列の塩基番号(Pos))が、種々の疾患情報と対応付けられて記載されてもよい。
【0079】
【表5】
【0080】
さらなる実施形態として、薬剤情報に基づいて所定部位を決定する例について説明する。この例では、薬剤情報として、既知の遺伝子変異に関連する治療薬の有無に基づいて所定部位を決定する。しかし、薬剤情報は、治療薬の有無に限定されない。治療薬の名称、治療薬が承認された国・地域などの情報に基づいて、所定部位を決定してもよい。制御部101は、変異情報データベース107から、既知の遺伝子変異に関連する治療薬の有無についての情報を取得する。次いで、制御部101は、取得した情報に基づいて、解析対象テーブル108の解析対象領域の中から、治療薬との関連が既知の遺伝子変異が生じ得る一塩基又は複数塩基を抽出する。そして、制御部101は、治療薬との関連が既知の遺伝子変異が生じ得る一塩基又は複数塩基の情報を、品質指標テーブル109として記憶部105に記憶する。これにより、制御部101は、解析対象領域において、治療薬との関連が既知の遺伝子変異が生じ得る一塩基又は複数塩基を所定部位として決定できる。この実施形態の品質指標テーブル109の例を、表6に示す。表中、「Drug」は、承認された治療薬を示し、「Region」は、治療薬が承認された国及び地域を示し、「Disease name」は、承認された治療薬が対象とするがん種を示す。表6では、「Disease name」として、肺がんを例示した。
【0081】
【表6】
【0082】
表6に示されるように、品質指標テーブル109には、所定部位の位置情報(所定部位が位置する染色体番号(Chr)、ゲノム配列の塩基番号(Pos))が、種々の薬剤情報と対応付けられて記載されてもよい。なお、上記の実施形態では、所定部位の位置情報として、所定部位が位置する染色体番号(Chr)及びゲノム配列の塩基番号(Pos)が用いられたが、これには限定されず、解析対象領域中の塩基の位置を特定する情報であればよい。
【0083】
図4のステップS23に関して、本実施形態の情報処理装置10の制御部101は、第1のリードのうち、所定部位に対応する第2のリードに基づいて、当該所定部位に対する核酸解析の品質に関する情報を生成する。制御部101は、被検者由来の核酸に関して、所定部位における変異の存否に関わらず、当該所定部位に対する核酸解析の品質に関する情報を生成する。ここで、「所定部位に対応する第2のリード」とは、解析対象領域中の所定部位を含む領域にアライメントされた第1のリードをいう。以下、所定部位に対応する第2のリードを、単に「第2のリード」とも呼ぶ。図7A及び7Bを参照して、解析対象領域にアライメントされた第1のリードと、所定部位に対応する第2のリードとの関係を説明する。図7Aでは、参照配列中の「X」及び「Y」で示されるように、解析対象領域の塩基配列から、一塩基の所定部位が2つ選択されている。図中、第1のリードは、白抜きのバー及び黒のバーで示され、解析対象領域にアライメントされている。図7Aに示されるように、所定部位が一塩基である場合、所定部位に対応する第2のリードは、解析対象領域中の所定部位と同じ位置に塩基を含む第1のリードである。図中、第2のリードは黒のバーで示される。
【0084】
核酸解析の品質に関する情報として、例えば、解析対象領域の所定部位におけるデプス情報を生成できる。「デプス」とは、参照配列上の塩基に対応する位置にアライメントされたリードの数である。デプスはリード深度(read depth)ともいわれ、1回の測定で解析対象領域のある塩基が何度読まれたのかを示す。「デプス情報」とは、所定部位の塩基についてのデプス及び/又は当該デプスから取得される情報をいう。例えば、所定部位が1箇所又は複数箇所の一塩基である場合、デプス情報は、各塩基についてのデプスであり得る。すなわち、所定部位のデプスは、所定部位の各塩基にアライメントされた第2のリードの数である。所定部位が複数の塩基からなる領域である場合、デプス情報は、所定部位に含まれる個々の塩基のデプス、及び/又はそれらのデプスの統計的代表値である。デプスの統計的代表値は、例えば、デプスの平均値、最頻値、中央値、最小値、最大値などが挙げられる。デプス情報は、核酸解析の品質に関する情報の一つである。図7Aでは、所定部位のX及びYの各塩基について、デプス情報として、それぞれデプスA及びデプスBが取得される。
【0085】
図7Bでは、所定部位として、参照配列中の「X」から「Y」までの領域が選択されている。図7Aと同様に、第1のリードは、白抜きのバー及び黒のバーで示され、解析対象領域にアライメントされている。また、第2のリードは黒のバーで示される。図7Bに示されるように、所定部位が複数の連続する塩基からなる場合、所定部位に対応する第2のリードは、所定部位の一部又は全部に該当する塩基を含む第1のリードである。図7Bでは、所定部位(XからYまでの塩基配列)について、デプス情報として、デプスCを取得できる。
【0086】
ステップS23の一つの実施形態として、腫瘍配列データ及び正常配列データのそれぞれに基づいて、所定部位のデプス情報を取得する処理のフローについて説明する。以下、腫瘍配列データに基づいて取得されるデプス情報を「デプス情報T」と呼ぶ。また、正常配列データに基づいて取得されるデプス情報を「デプス情報N」と呼ぶ。図8を参照して、ステップS41において、制御部101は、記憶部105から、ステップS31で実行した腫瘍配列データと参照配列とのアライメントの結果を読み出す。ステップS42において、制御部101は、腫瘍配列データと参照配列とのアライメントの結果を参照し、解析対象領域の所定部位に対応する第1リードである第2のリードの数に基づき、デプス情報Tを取得する。ステップS43において、制御部101は、記憶部105から、ステップS32で実行した正常配列データと参照配列とのアライメントの結果を読み出す。ステップS44において、制御部101は、正常配列データと参照配列とのアライメントの結果を参照し、解析対象領域の所定部位に対応する第1リードである第2のリードの数に基づき、デプス情報Nを取得する。所定部位が複数ある場合、それぞれの所定部位について、デプス情報T及びNを取得する。ステップS45において、制御部101は、所定部位におけるデプス情報T及びNを、記憶部105の検査結果データベース110の品質情報テーブルに記憶する。そして、制御部101は、所定部位に対する核酸解析の品質に関する情報を生成する処理を終了し、プロセスは、図4のステップS24へ進行する。
【0087】
なお、ステップS42のデプス情報Tの取得において、腫瘍配列データと参照配列とのアライメントの結果の参照には、マッピングデータを用いることができる。同様に、ステップS44のデプス情報Nの取得において、正常配列データと参照配列とのアライメントの結果の参照にも、マッピングデータを用いることができる。マッピングデータとは、リードを参照配列にアライメントした結果を含む、リードの情報である。なお、ステップS42及びS44において、腫瘍配列データ及び正常配列データと参照配列とのアライメントの結果を参照しない場合には、制御部101は、ステップS41において腫瘍配列データと参照配列とを読み出し、ステップS42において、腫瘍配列データと参照配列とのアライメントを実行してもよい。さらに、ステップS43において正常配列データと参照配列とを読み出し、ステップS44において、正常配列データと参照配列とのアライメントを実行してもよい。
【0088】
表7に品質情報テーブルの一例を示すが、これに限定されない。表中、「Chr」、「Gene」、「Pos」、「AA」に対応する各情報は、品質指標テーブル109から転記された情報であり、所定部位に関する情報である。「depth T」は、デプス情報Tであり、「depth N」は、デプス情報Nである。表7の例では、デプス情報T及びデプス情報Nは、それぞれ、3箇所の所定部位のデプスの平均値が記載されているが、これに限定されない。例えば、デプス情報T及びデプス情報Nは、それぞれ、複数個所の所定部位の最大値、中間値、又は最小値などであってもよい。デプス情報T及びデプス情報Nは、それぞれ、所定部位ごとのデプス情報T及びデプス情報Nであってもよい。「変異の検出結果」は、各所定部位について、ステップS33又はS35の処理により生殖細胞変異又は体細胞変異と判定されたか否かを示す情報である。例えば、表7の2番目の所定部位には変異が存在することが示され、3番目及び4番目の所定部位には変異が存在しないことが示される。「変異の検出結果」は、品質情報テーブルに含まれる所定部位における変異が、測定結果テーブルに含まれているか否かで判定することができる。表7に示すように、品質情報テーブルには、所定部位にける変異の検出結果がYESであるかNOであるかに関わらず、すなわち、所定部位における変異の存否に関わらず、デプス情報T及びデプス情報Nが含まれている。デプス情報T及びデプス情報Nは、所定部位に対する核酸解析の品質に関する情報の一例である。なお、「変異の検出結果」は、品質情報テーブルから省略してもよい。
【0089】
【表7】
【0090】
所定部位に対する核酸解析の品質に関する情報としては、例えば、以下の(1)~(4)に記載の情報などが挙げられる。
【0091】
(1) 第2のリードの数及び/又は長さに関する情報、
(2) 第2のリードの各塩基に付与される、シーケンサーの塩基配列の読み取りの精度に関する情報、
(3) 第1のリードを参照配列にマッピングするアライメントにおいて、第2のリードの各塩基に付与される、マッピングの精度に関する情報、及び
(4) 上記の(1)~(3)の少なくとも1つに記載の情報に基づいて品質を判定した結果。
【0092】
(1)に記載の情報のうち、第2のリードの数に関する情報は、例えば、所定部位のデプス情報である。デプス情報については、上記のとおりである。第2のリードの長さに関する情報は、例えば、第2のリードの長さの平均値、最頻値、中央値、最小値、最大値などである。
【0093】
(2)に記載の情報は、例えば、第2のリードの各塩基に付与される、ベースコールの正確さを示す指標値である。そのような指標値としては、例えば上記のクオリティスコアが挙げられる。第2のリードの各塩基に付与されたクオリティスコアは、そのまま、(2)に記載の情報として用いられてもよい。あるいは、第2のリードの各塩基に付与されたクオリティスコアの統計的代表値(各クオリティスコアの平均値、最頻値、中央値、最小値、最大値など)が、(2)に記載の情報として用いられてもよい。
【0094】
(3)に記載の情報は、例えば、第2のリードに付与される、マッピングの正確さを示す指標値である。そのような指標値としては、例えば上記のマッピングクオリティスコアが挙げられる。(1)~(3)に記載の情報は、一塩基又は当該一塩基及び近傍からなる所定部位に対応する短い領域に対する核酸解析の品質を示す。したがって、例えば、(1)に記載のデプス情報は、1つの遺伝子の全長に対するデプスの統計的代表値と比較して、所定部位における核酸解析の品質をより高い精度で示す。
【0095】
(4)に記載の判定は、例えば、上記(1)~(3)に記載の情報から選択されるいずれかの値と、閾値とを比較することにより行ってもよい。例えば、所定部位のデプスが、対応する閾値以上であるとき、核酸解析の品質は良好であると判定してもよい。また、所定部位のデプスが、対応する閾値未満であるとき、核酸解析の品質は良好ではないと判定してもよい。判定結果は、記号、数字、文字などで表示してもよい。例えば、核酸解析の品質は良好であると判定されたときは、判定結果の欄にチェックマークを表示し、核酸解析の品質は良好でないと判定されたときは、判定結果を空欄としてもよい。
【0096】
図4を参照して、ステップS24において、制御部101は、ステップS22で取得した変異の検出結果と、ステップS23で取得した所定部位に対する核酸解析の品質に関する情報と、を含む検査結果レポートを出力部104に出力する。制御部101は、検査結果レポートを、ネットワーク400を介してデータ送受信装置40に出力してもよい。
【0097】
図9は、検査結果レポートの例を示す。検査結果レポートRは、検査依頼情報が記載される領域R1と、変異の検出結果が記載される領域R2と、所定部位に対する核酸解析の品質に関する情報が記載される領域R3と、を含む。領域R1には、依頼元施設から送信された依頼情報が記載され、例えば、検査依頼ID、被検者の情報などが記載される。領域R2には、ステップS22で取得し、記憶部105の測定結果テーブルに記憶された変異の検出結果が記載される。領域R3には、ステップS23で取得し、記憶部105の品質情報テーブルに記憶された所定部位に対する核酸解析の品質に関する情報が記載される。図9の例では、領域R3には、さらに、核酸解析の品質を判定した結果が記載されている。図9の表中、「判定結果T」は、Depth Tの値と閾値とに基づいて、核酸解析の品質を判定した結果を示し、「判定結果N」は、Depth Nの値と閾値とに基づいて、核酸解析の品質を判定した結果を示す。
【0098】
図9に示すように、情報処理装置10から出力される検査結果レポートの領域R3には、所定部位における変異の存否にかかわらず、核酸解析の品質に関する情報が記載される。これにより、依頼元施設200及び/又は依頼先施設300の担当者は、被検者の核酸の解析対象領域において、所定部位に変異が検出されなかった場合でも、その所定部位についての核酸の品質を確認できる。例えば、領域R3の2番目の所定部位(染色体2番の29,432,664位)について、変異の検出結果は「NO」であり、Depth Tの判定結果Tの欄にチェックマークが表示されている。これは、この検査では当該所定部位に変異が検出されず、且つその結果が十分な品質の解析に基づくことを示唆する。すなわち、変異の検出結果が真の陰性であることを示唆する。また、領域R3の3番目の所定部位(染色体2番の29,432,682位)について、変異の検出結果は「NO」であり、Depth Tの判定結果Tは空欄となっている。これは、この検査では当該所定部位に変異が検出されなかったものの、この被検者の核酸には、実際には変異が存在する疑いがあることを示唆する。すなわち、変異の検出結果が偽陰性であることが疑われる。この場合、再度、遺伝子パネル検査を実施したり、この所定部位に対応する遺伝子マーカーに絞った別の検査を実施したりするなど、医療関係者が取るべき次のアクションを具体的に検討することが可能となる。再検査において変異が検出された場合には、適切な診断又は治療へと導くことが可能となる。
【0099】
なお、本実施形態において、変異の検出結果と、所定部位に対する核酸解析の品質に関する情報と、は同じレポート内に記載されたが、変異の検出結果と、所定部位に対する核酸解析の品質に関する情報と、を別々のレポートとして生成してもよい。例えば、変異の検出結果をレポートするための解析結果レポートと、所定部位に対する核酸解析の品質に関する情報をレポートするための品質管理レポートと、を別々に生成してもよい。
【0100】
なお、検査結果レポートは、他の品質情報をさらに含んでもよい。他の品質情報とは、従来のゲノム医療の検査で提供されていた品質情報であり、例えば、解析対象領域の全体の核酸配列データに基づき取得される品質情報が挙げられる。
【0101】
他の品質情報としては、例えば、取得されたリードの総数、マッピング率、重複率、均質性、解析対象領域のデプスの統計的代表値、解析対象領域のデプス頻度の度数分布、リードの平均クオリティスコアの度数分布、リードの長さの度数分布などが挙げられる。「マッピング率」は、総リードのうち、解析対象領域にマッピングされたリード数の割合をいう。「重複率」は、解析対象領域にマッピングされたリードのうち、同じ増幅領域に由来するリード数の割合をいう。「均質性」は、解析対象領域のうち、マッピングされたリード数が所定の値以上となる領域の割合をいう。「デプス頻度の度数分布」は、解析対象領域内の各塩基にマッピングされたリードの数を集計し、塩基の位置及びその塩基に対するデプスを二軸とするヒストグラムをいう。「リードの平均クオリティスコアの度数分布」は、各リードのクオリティスコアの平均値及びその平均値を示すリードの数を二軸とするヒストグラムをいう。「リードの長さの度数分布」は、リードの長さ(塩基数)及びその長さを有するリードの数を二軸とするヒストグラムをいう。
【0102】
検査結果レポートは、ステップS22において検出された変異に、品質情報テーブルに記載されていない部位において検出された変異がある場合、当該部位に対する核酸解析の品質に関する情報(例えば、デプス情報)をさらに含んでもよい。
【0103】
図4を参照して、ステップS25において、制御部101は、検査結果レポートを記憶部105のレポートテーブルに記憶する。
【0104】
(ユーザーによる所定部位の決定)
さらなる実施形態では、ユーザーが所定部位を決定できる。ユーザーは、検査の依頼先施設300における情報処理装置10のユーザーであってもよい。情報処理装置10のユーザーは、例えば、依頼先施設300の検査担当者であり得る。この実施形態では、ユーザーが入力した情報に基づいて、所定部位が決定される。以下、情報処理装置10のユーザーにより所定部位を決定し、リードを解析する例について、図10を参照して説明する。本実施形態において、記憶部105の品質指標テーブル109には、例えば、表4~6に示した各品質指標テーブルを統合した品質指標テーブルが記憶される。ステップS51において、制御部101は、ユーザーが入力部103を操作して入力した情報に基づいて、品質指標テーブル109を参照し、所定部位を選択する。ユーザーによる情報の入力は、ディスプレイ又はタッチパネルのような出力部104に表示される画面を介して行ってもよい。ステップS52~S56についての詳細は、図4のステップS21~S25について述べたことと同様である。なお、ユーザーは特に限定されない。例えば、ユーザーは、検査の依頼元施設200におけるデータ送受信装置40のユーザーであってもよい。データ送受信装置40のユーザーは、例えば、被検者を担当する医師などの医療関係者であり得る。所定部位の決定のために入力する操作は、いずれの施設のユーザーであっても同じである。ユーザーが、データ送受信装置40のユーザーである場合、ステップS51において、制御部101は、ユーザーがデータ送受信装置40に表示された画面を介して入力した情報を、ネットワーク400を介して受信する。
【0105】
図11Aを参照して、画面D1においてカテゴリー情報を入力して、所定部位を選択する例について説明する。画面D1のD11において、カテゴリー情報として、バイオマーカーの属性情報が選択可能に表示される。カテゴリー情報の入力は、例えば、プルダウンメニューからバイオマーカーの属性情報を選択することにより行われる。D11にカテゴリー情報が入力されると、制御部101は、そのカテゴリー情報に応じた所定部位に関する情報を記憶部105から読み出す。そして、D12に、読み出された所定部位に関する情報が表示される。ユーザーがD12に表示された1又は複数の所定部位をクリック等により選択し、D13の設定ボタンをクリックすることにより、選択された所定部位の情報が記憶部105に記憶される。ユーザーが、依頼元施設200のデータ送受信装置40のユーザーである場合は、選択された所定部位の情報が依頼情報と共に、ネットワーク400を介して情報処理装置10に送信される。
【0106】
図11Bを参照して、画面D2においてカテゴリー情報とサブカテゴリー情報とを入力して、所定部位を選択する例について説明する。画面D2のD21では、カテゴリー情報として、CDxマーカーが選択されている。この場合、D22において、サブカテゴリー情報として、例えばCDxマーカーが承認された国・地域の情報が選択可能に表示される。カテゴリー情報及びサブカテゴリー情報が入力されると、制御部101は、それらの情報に応じた所定部位に関する情報を記憶部105から読み出し、D23に、読み出された所定部位に関する情報が表示される。ユーザーが、D23に表示された1又は複数の所定部位をクリック等により選択し、D24の設定ボタンをクリックすることにより、選択された所定部位の情報が記憶部105に記憶される。これにより、解析対象領域から、所定の国・地域において承認されたCDxマーカーを、所定部位として設定することができる。サブカテゴリー情報は、国・地域以外に、CDx検査の適用対象の疾患名や治療薬名などであってもよい。
【0107】
カテゴリー情報は、バイオマーカーの属性情報以外であってもよい。図11Cを参照して、画面D3のD31において、カテゴリー情報として、バイオマーカーの属性情報だけでなく、疾患情報、薬剤情報などが選択可能に表示される。画面D3のD31では、カテゴリー情報として、エビデンスレベルが選択されている。この場合、D32において、サブカテゴリー情報として、エビデンスレベルの分類(例えばLv A、Lv B及びLv Cなど)が選択可能に表示される。カテゴリー情報及びサブカテゴリー情報が入力されると、制御部101は、それらの情報に応じた所定部位に関する情報を記憶部105から読み出し、D33に、読み出された所定部位に関する情報が表示される。ユーザーが、D33に表示された1又は複数の所定部位をクリック等により選択し、D34の設定ボタンをクリックすることにより、選択された所定部位の情報が記憶部105に記憶される。
【0108】
ユーザーが、解析対象領域の中から任意の領域を入力することで、所定部位を決定してもよい。図11Dを参照して、画面D4のD41において、カテゴリー情報として「任意選択」を選択する。この場合、D42において、染色体番号(Chr)、ゲノム配列上の塩基番号(Pos_Start及びPos_End)などの位置情報を入力するためのテキストボックスが表示される。ユーザーは、解析対象領域の塩基配列中から、所定部位として、所望の一塩基又は複数塩基の位置情報をテキストボックスに入力する。位置情報の入力後、ユーザーがD43の設定ボタンをクリックすることにより、入力された所定部位の情報が記憶部105に記憶される。
【0109】
(マッチドペア検査なしの体細胞変異の検出)
図4のステップS22のさらなる実施形態として、マッチドペア検査なしで、変異を検出する処理のフローについて説明する。この場合、非腫瘍検体は使用されず、腫瘍検体から調製されるライブラリー試料から取得したリードを腫瘍配列データとして用いる。図12を参照して、ステップS61において、制御部101は、参照配列データベース106から参照配列を読み出し、腫瘍配列データと、参照配列とのアライメントを実行する。ステップS62において、制御部101は、腫瘍配列データにおいて、参照配列と一致しない部位があるか否かを判定する。制御部101が、腫瘍配列データが参照配列と一致しないと判定したとき、プロセスはステップS63へ進む。図12の処理では、参照配列と一致しない部位がある場合、当該部位は、腫瘍組織の遺伝子に認められる変異であると判定する。ステップS62において、腫瘍配列データが参照配列と一致する場合、制御部101は、処理を終了する。この場合、腫瘍配列データには変異がないと考えられる。
【0110】
ステップS63において、制御部101は、検出された変異に基づいて、変異情報データベース107を検索する。ステップS64において、制御部101は、検索結果に基づき、検出された変異にアノテーションを付与する。ステップS63及びS64の詳細は、図5のステップS37及びS38について述べたことと同様である。ステップS61~S64の処理により、制御部101は、ステップS22において、変異の検出結果として、解析対象領域における遺伝子変異の情報を得る。
【0111】
図4のステップS23のさらなる実施形態として、腫瘍配列データに基づいて、所定部位のデプス情報Tを取得する処理のフローについて説明する。図13を参照して、ステップS71において、制御部101は、ステップS61で取得した腫瘍配列データと参照配列とのアライメント結果を読み出す。ステップS72において、制御部101は、腫瘍配列データと参照配列のアライメントの結果を参照し、解析対象領域の所定部位に対応する第1リードである第2のリードの数に基づき、デプス情報Tを取得する。デプス情報Tとしては、所定部位の各塩基についてのデプスが好ましい。ステップS73において、制御部101は、所定部位におけるデプス情報Tを記憶部105に記憶する。そして、制御部101は、所定部位のデプス情報を取得する処理を終了し、プロセスは、図4のステップS24へ進行する。
【符号の説明】
【0112】
10 情報処理装置
20 ストレージ
30 シーケンサー
40 データ送受信装置
100 核酸解析システム
110 解析結果データベース
200 依頼元施設
300 依頼先施設
400 ネットワーク
図1
図2A
図2B
図2C
図3
図4
図5
図6A
図6B
図6C
図7A
図7B
図8
図9
図10
図11A
図11B
図11C
図11D
図12
図13