特開2025-7170 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 独立行政法人国立がん研究センターの特許一覧 ▶ シスメックス株式会社の特許一覧

特開2025-7170情報処理装置を制御する方法、情報処理装置及びコンピュータプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2A
2B
2C
3
4
5
6A
6B
6C
7A
7B
8
9
10
11A
11B
11C
11D
12
13

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2025007170

(43)【公開日】2025-01-17

(54)【発明の名称】情報処理装置を制御する方法、情報処理装置及びコンピュータプログラム

(51)【国際特許分類】

G16B 30/00 20190101AFI20250109BHJP

C12Q 1/6869 20180101ALI20250109BHJP

【ＦＩ】

G16B30/00

C12Q1/6869 Z

【審査請求】未請求

【請求項の数】25

【出願形態】ＯＬ

(21)【出願番号】P 2023108392

(22)【出願日】2023-06-30

(71)【出願人】

【識別番号】510097747

【氏名又は名称】国立研究開発法人国立がん研究センター

(71)【出願人】

【識別番号】390014960

【氏名又は名称】シスメックス株式会社

(74)【代理人】

【識別番号】100103034

【弁理士】

【氏名又は名称】野河信久

(74)【代理人】

【識別番号】100159385

【弁理士】

【氏名又は名称】甲斐伸二

(74)【代理人】

【識別番号】100163407

【弁理士】

【氏名又は名称】金子裕輔

(74)【代理人】

【識別番号】100166936

【弁理士】

【氏名又は名称】稲本潔

(74)【代理人】

【識別番号】100174883

【弁理士】

【氏名又は名称】冨田雅己

(74)【代理人】

【識別番号】100189429

【弁理士】

【氏名又は名称】保田英樹

(74)【代理人】

【識別番号】100213849

【弁理士】

【氏名又は名称】澄川広司

(72)【発明者】

【氏名】河野隆志

(72)【発明者】

【氏名】角南久仁子

(72)【発明者】

【氏名】市川仁

(72)【発明者】

【氏名】塩田あすか

(72)【発明者】

【氏名】藤原健太郎

(72)【発明者】

【氏名】吉本倫子

(72)【発明者】

【氏名】祐村実旺

(72)【発明者】

【氏名】鷲尾尊規

【テーマコード（参考）】

4B063

【Ｆターム（参考）】

4B063QA01

4B063QA13

4B063QA17

4B063QA20

4B063QQ42

4B063QQ52

4B063QS39

(57)【要約】

【課題】解析対象領域の塩基配列上に変異が検出されなかった場合でも、その配列の所定部位についての核酸解析の品質を確認することを可能にする手段を提供することを課題とする。
【解決手段】シーケンサーにより読み取られた複数の第１のリードに基づいて、核酸の配列中の解析対象領域における変異の検出結果を取得し、第１のリードのうち、解析対象領域の塩基配列から選択された少なくとも１つの所定部位に対応する第２のリードに基づいて、所定部位に対する核酸解析の品質に関する情報を生成し、所定部位における変異の存否に関わらず、品質に関する情報を出力するように情報処理装置を制御することにより、上記の課題を解決する。
【選択図】図４

【特許請求の範囲】

【請求項1】

被検者の検体から取得した核酸の配列を解析する情報処理装置を制御する方法であって、
シーケンサーにより読み取られた複数の第１のリードに基づいて、前記核酸の配列中の解析対象領域における変異の検出結果を取得する工程と、
前記第１のリードのうち、前記解析対象領域の塩基配列から選択された少なくとも１つの所定部位に対応する第２のリードに基づいて、前記所定部位に対する核酸解析の品質に関する情報を生成する工程と、
前記所定部位における変異の存否に関わらず、前記品質に関する情報を出力する工程と、
を含む、方法。

【請求項2】

前記解析対象領域における変異の検出結果を出力する工程をさらに含む請求項１に記載の方法。

【請求項3】

前記解析対象領域からの前記所定部位の選択を受け付ける工程をさらに含む請求項１に記載の方法。

【請求項4】

前記選択を受け付ける工程において、前記所定部位に関する情報の入力を受け付け、入力された前記情報に基づいて前記所定部位が設定される請求項３に記載の方法。

【請求項5】

前記解析対象領域の塩基配列から選択された複数の前記所定部位のそれぞれについて、前記品質に関する情報を生成する請求項１に記載の方法。

【請求項6】

前記所定部位が、前記解析対象領域の塩基配列中の１つの塩基又は２つ以上の連続する塩基からなる請求項１に記載の方法。

【請求項7】

前記所定部位が、変異が生じる可能性のある部位を含む請求項１に記載の方法。

【請求項8】

前記所定部位に生じる可能性のある変異が、前記解析対象領域において、疾患の診断又は治療に関連する変異である請求項７に記載の方法。

【請求項9】

前記疾患の診断又は治療に関連する変異が、
(1) 薬剤の効果及び／又は副作用と関連することが既知の変異、
(2) 疾患の状態、発症及び／又は予後と関連することが既知の変異、及び
(3) 診断又は治療との関連性を示すエビデンスレベルが所定のレベル以上であることが既知の変異
の少なくとも１つである請求項８に記載の方法。

【請求項10】

前記(1)に記載の変異が、コンパニオン診断マーカーである請求項９に記載の方法。

【請求項11】

前記(2)に記載の変異が、ドライバー変異、病原性変異、悪性度マーカーとしての変異、予後予測マーカーとしての変異、罹患リスクマーカーとしての変異、又は発症リスクマーカーとしての変異からなる群から選択される少なくとも１つである請求項９に記載の方法。

【請求項12】

前記(3)に記載のエビデンスレベルが、腫瘍原性エビデンス、疾患素因関連エビデンス、治療効果予測エビデンス、診断エビデンス又は予後予測エビデンスからなる群より選択される少なくとも１つのエビデンスレベルである請求項９に記載の方法。

【請求項13】

前記疾患の診断又は治療に関連する変異が、図６Ａ～図６Ｃに示される表に記載のバイオマーカーから選択される少なくとも１つである請求項８に記載の方法。

【請求項14】

前記所定部位が、既知の遺伝子変異の情報が蓄積された変異情報データベースの情報に基づいて、前記解析対象領域の塩基配列から選択された部位である請求項１に記載の方法。

【請求項15】

前記品質に関する情報が、
(1) 前記第２のリードの数及び／又は長さに関する情報、
(2) 前記第２のリードの各塩基に付与される、前記シーケンサーの塩基配列の読み取りの精度に関する情報、
(3) 前記第１のリードを参照配列にマッピングするアライメントにおいて、前記第２のリードの各塩基に付与される、前記マッピングの精度に関する情報、及び
(4) 前記(1)～(3)の少なくとも１つに記載の情報に基づいて品質を判定した結果
からなる群より選択される少なくとも１つである請求項１に記載の方法。

【請求項16】

前記(1)に記載の情報が、前記所定部位のデプス情報、及び前記第２のリードの長さの平均値から選択される少なくとも１つである請求項１５に記載の方法。

【請求項17】

前記(2)に記載の情報が、前記第２のリードの各塩基に付与される、ベースコールの正確さを示す指標値である請求項１５に記載の方法。

【請求項18】

前記(3)に記載の情報が、前記第２のリードに付与される、マッピングの正確さを示す指標値である請求項１５に記載の方法。

【請求項19】

前記品質に関する情報が、前記所定部位に関する情報と対応付けて出力される請求項１に記載の方法。

【請求項20】

前記品質に関する情報を出力する工程において、前記所定部位に対する核酸解析の品質に関する情報を含む品質管理レポートを生成して出力する請求項１に記載の方法。

【請求項21】

前記品質に関する情報を出力する工程において、前記解析対象領域における変異の検出結果を含む解析結果レポートを生成して出力する請求項２に記載の方法。

【請求項22】

前記解析対象領域が、全ゲノム領域、全エクソーム領域、又は少なくとも１つの標的遺伝子を含むゲノム領域の一部である請求項１に記載の方法。

【請求項23】

前記被検者の検体から取得した核酸がDNA又はRNAである請求項１に記載の方法。

【請求項24】

被検者の検体から取得した核酸の配列を解析する情報処理装置であって、
前記情報処理装置は、制御部と出力部とを備え、
前記制御部は、
シーケンサーにより読み取られた複数の第１のリードに基づいて、前記核酸の配列中の解析対象領域における変異の検出結果を取得する工程と、
前記第１のリードのうち、前記解析対象領域の塩基配列から選択された少なくとも１つの所定部位に対応する第２のリードに基づいて、前記所定部位に対する核酸解析の品質に関する情報を生成する工程と、
前記所定部位における変異の存否に関わらず、前記品質に関する情報を前記出力部に出力する工程と、
を実行する、情報処理装置。

【請求項25】

被検者の検体から取得した核酸の配列を解析するためのコンピュータプログラムであって、
前記コンピュータプログラムは、コンピュータが読み取り可能な媒体に記録され、前記コンピュータに、
シーケンサーにより読み取られた複数の第１のリードに基づいて、前記核酸の配列中の解析対象領域における変異の検出結果を取得する工程と、
前記第１のリードのうち、前記解析対象領域の塩基配列から選択された少なくとも１つの所定部位に対応する第２のリードに基づいて、前記所定部位に対する核酸解析の品質に関する情報を生成する工程と、
前記所定部位における変異の存否に関わらず、前記品質に関する情報を出力する工程と、
を実行させる、コンピュータプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、被検者の検体から取得した核酸の配列を解析する情報処理装置を制御する方法に関する。本発明は、被検者の検体から取得した核酸の配列を解析する情報処理装置に関する。本発明は、被検者の検体から取得した核酸の配列を解析するためのコンピュータプログラムに関する。

【背景技術】

【0002】

近年、次世代シーケンサー(NGS)による核酸解析技術の進歩により、ゲノム中の所定の領域を解析するターゲットシーケンス解析をハイスループットに実行できるようになった。また、全エクソーム解析及び全ゲノム解析も、以前より低いコストで実現可能となった。全エクソーム解析では、全てのエキソン領域の塩基配列が解析され、全ゲノム解析では、ゲノム全体の配列が解析される。NGSによる核酸解析技術は、臨床における遺伝子診断にも利用されており、例えば、がん遺伝子パネル検査が知られている。がん遺伝子パネル検査では、患者検体から取得した核酸の配列をNGSにより解析し、遺伝子変異を検出する。検出された遺伝子変異についてレポートが作成され、当該レポートに基づいて医療関係者は治療方針を決定する。

【0003】

例えば、非特許文献１には、検出された遺伝子変異が記載されたRGシーケンシングレポートの一例が記載されている。RGシーケンシングレポートには、検出された遺伝子変異とともに、その遺伝子変異に対する変異アレル頻度が記載される。変異アレル頻度は、「変異デプス/総デプス」で算出される。RGシーケンシングレポートには、変異デプス及び総デプスの各値も、変異アレル頻度とともに記載される。変異デプスとは、参照配列上の所定の塩基に着目したとき、その塩基を含む部分にアライメントされ、且つその塩基に対応する位置に変異を有するリードの数である。総デプスは、その塩基を含む部分にアライメントされたリードの数である。総デプスは、配列上の変異が生じた位置における核酸解析の品質を確認に用いることができる。また、RGシーケンシングレポートには、解析対象領域の各遺伝子に対するデプスの分布が記載される。

【先行技術文献】

【特許文献】

【0004】

【非特許文献1】OncoGuide(商標) NCCオンコパネルシステムレポート活用ガイド(https://products.sysmex.co.jp/products/genetic/AK401170/report_guide.pdf)

【発明の概要】

【発明が解決しようとする課題】

【0005】

治療方法を決定する医療関係者から、塩基配列上の変異が検出されなかった位置についても、デプス、クオリティスコア等の核酸解析の品質を確認したいという要望があがっている。例えば、疾患や治療に関連する遺伝子に変異が検出されなかった場合、その位置に対する核酸解析の品質を確認したいという要望があがっている。本発明は、このような医療関係者からの要望に応じることを可能とする、情報処理装置を制御する方法、情報処理装置及びコンピュータプログラムを提供する。

【課題を解決するための手段】

【0006】

本発明は、被検者の検体から取得した核酸の配列を解析する情報処理装置を制御する方法であって、シーケンサーにより読み取られた複数の第１のリードに基づいて、核酸の配列中の解析対象領域における変異の検出結果を取得する工程と、第１のリードのうち、解析対象領域の塩基配列から選択された少なくとも１つの所定部位に対応する第２のリードに基づいて、所定部位に対する核酸解析の品質に関する情報を生成する工程と、所定部位における変異の存否に関わらず、品質に関する情報を出力する工程と、を含む方法を提供する。

【0007】

本発明は、被検者検体から取得した核酸の配列を解析する情報処理装置であって、情報処理装置は、制御部と出力部とを備え、制御部は、シーケンサーにより読み取られた複数の第１のリードに基づいて、核酸の配列中の解析対象領域における変異の検出結果を取得する工程と、第１のリードのうち、解析対象領域の塩基配列から選択された少なくとも１つの所定部位に対応する第２のリードに基づいて、所定部位に対する核酸解析の品質に関する情報を生成する工程と、所定部位における変異の存否に関わらず、品質に関する情報を前記出力部に出力する工程と、を実行する、情報処理装置を提供する。

【0008】

本発明は、被検者検体から取得した核酸の配列を解析するためのコンピュータプログラムであって、コンピュータプログラムは、コンピュータが読み取り可能な媒体に記録され、コンピュータに、シーケンサーにより読み取られた複数の第１のリードに基づいて、核酸の配列中の解析対象領域における変異の検出結果を取得する工程と、第１のリードのうち、解析対象領域の塩基配列から選択された少なくとも１つの所定部位に対応する第２のリードに基づいて、所定部位に対する核酸解析の品質に関する情報を生成する工程と、所定部位における変異の存否に関わらず、品質に関する情報を出力する工程と、を実行させる、コンピュータプログラムを提供する。

【発明の効果】

【0009】

本発明によれば、解析対象領域の塩基配列上に変異が検出されなかった場合でも、その配列の所定部位についての核酸解析の品質を確認できる。

【図面の簡単な説明】

【0010】

【図1】核酸解析システムの構成の例を示す図である。

【図2A】情報処理装置の構成の例を示す図である。

【図2B】検査結果データベースの構成の例を示す図である。

【図2C】シーケンサーの構成の例を示す図である。

【図3】被検者の検体から取得した核酸の配列をシーケンサーにより読み取る処理の例を示すフローチャートである。

【図4】情報処理装置による核酸配列データの解析処理の例を示すフローチャートである。

【図5】マッチドペア検査により体細胞変異及び生殖細胞変異を検出する処理の例を示すフローチャートである。

【図6A】米国食品医薬品局(FDA)に承認されたコンパニオン診断(CDx)マーカーの例を示す表である。

【図6B】FDAに承認されたCDxマーカーの例を示す表である。

【図6C】FDAに承認されたCDxマーカーの例を示す表である。

【図7A】解析対象領域にマッピングされた第１のリードと、一塩基からなる所定部位(２箇所)に対応する第２のリードとの関係を示す図である。

【図7B】解析対象領域にマッピングされた第１のリードと、複数塩基からなる所定部位に対応する第２のリードとの関係を示す図である。

【図8】腫瘍配列データ及び正常配列データのそれぞれに基づいて、所定部位に対する核酸解析の品質に関する情報を取得する処理の例を示すフローチャートである。

【図9】検査結果レポートの例を示す図である。

【図10】情報処理装置のユーザーにより所定部位を決定する処理の例を示すフローチャートである。

【図11A】カテゴリー情報を入力して、所定部位を選択するための画面の例を示す図である。

【図11B】カテゴリー情報及びサブカテゴリー情報を入力して、所定部位を選択するための画面の例を示す図である。

【図11C】カテゴリー情報及びサブカテゴリー情報を入力して、所定部位を選択するための画面の例を示す図である。

【図11D】ユーザーが任意に所定部位を選択するための画面の例を示す図である。

【図12】マッチドペア検査なしで変異を検出する処理の例を示すフローチャートである。

【図13】腫瘍配列データに基づいて、所定部位に対する核酸解析の品質に関する情報を取得する処理の例を示すフローチャートである。

【発明を実施するための形態】

【0011】

(核酸解析システム)
まず、本実施形態の情報処理装置を用いた核酸解析システムについて説明する。図１を参照して、核酸解析システム１００は、核酸解析を依頼する依頼元施設２００に設置されたデータ送受信装置４０と、依頼元施設２００からの依頼を受けて核酸解析を実施する依頼先施設３００に設置された情報処理装置１０、ストレージ２０及びシーケンサー３０と、を含む。データ送受信装置４０と、情報処理装置１０とは、ネットワーク４００を介して通信可能に接続される。依頼先施設３００では、情報処理装置１０と、ストレージ２０と、シーケンサー３０とが、施設内ネットワークを介して通信可能に接続される。データ送受信装置４０は、例えばコンピュータで構成され得る。

【0012】

依頼元施設２００は、例えば医療施設である。医療施設は、医師、看護師、臨床検査技師などの医療関係者により、患者や疾患の疑いがある者に対して検体の採取、検査、診断、治療などの医療行為がなされる施設である。医療施設としては、例えば病院、診療所、療養所などが挙げられる。図１の例では、依頼元施設２００は、シーケンサーを設置していないので、遺伝子パネル検査のような、シーケンサーを用いる核酸解析を実施できない。そのため、依頼元施設２００は、依頼先施設３００に核酸解析を依頼する。核酸解析の依頼は、依頼書の電子データ(例えばPDFファイル)の送信及び／又は紙に印刷された依頼書の送付によりなされる。また、依頼元施設２００は、被検者の検体を依頼先施設３００に送付する。

【0013】

依頼先施設３００は、依頼元施設２００からの依頼に応じて核酸解析を実施し、その解析結果を記載した検査結果レポートを依頼元施設２００に提供する施設である。依頼先施設３００は、例えば検査センターである。依頼を受け付けた依頼先施設３００は、依頼元施設２００から提供された検体から核酸を取得して解析し、解析結果に基づいて検査結果レポートを作成し、これを依頼元施設２００に提供する。検査結果レポートの提供は、検査結果レポートの電子データ(例えばPDFファイル)の送信及び／又は紙に印刷されたレポートの送付によりなされる。

【0014】

図１に示されるように、依頼先施設３００には、本実施形態の情報処理装置１０、ストレージ２０及びシーケンサー３０が設置されている。本実施形態の情報処理装置１０については後述する。ストレージ２０は、シーケンサー３０により読み取られた核酸配列データを記憶する装置である。ストレージ２０は、例えばネットワーク接続型ストレージ(NAS)であり得る。NASは、例えば、ハードディスクドライブ(HDD)やソリッドステートドライブ(SSD)などの記憶装置、LANインターフェース及び簡易OSを備える。ストレージ２０には、後述の参照配列のデータがあらかじめ格納されていてもよい。

【0015】

本明細書において、「核酸配列データ」とは、被検者の検体に由来するライブラリー試料から取得したリードをいう。核酸配列データは、後述の腫瘍配列データ及び正常配列データを包含する。「リード」とは、シーケンサーにより読み取られたアンプリコンの塩基配列をいう。ライブラリー試料、アンプリコン及びリードについては後述する。

【0016】

シーケンサー３０は、ポリヌクレオチドの塩基配列を読み取るための装置である。本明細書において、「塩基配列」との用語は、「核酸配列」及び「ヌクレオチド配列」と同義である。塩基配列とは、核酸分子内でのヌクレオチドの一次元的な並び方(序列)をいう。以下、塩基配列を単に「配列」と呼ぶことがある。シーケンサー３０は、好ましくは次世代シーケンサーである。「次世代シーケンサー」との用語は、サンガー法を利用したキャピラリー電気泳動によるシーケンサーである「第１世代シーケンサー」との対比で用いられる語である。次世代シーケンサーは、数千万から数億の核酸断片を同時並列的に処理して配列を読み取ることができる。次世代シーケンサー自体は公知であり、例えば、HiSeq2500(illumina社)、MiSeq(illumina社)、NextSeq(illumina社)、Ion Proton(Thermo Fisher Scientific社)、Ion PGM (Thermo Fisher Scientific社)、GS FLX+(Roche社)、GS Junior(Roche社)などが挙げられる。シーケンサー３０により読み取られた塩基配列のデータは、ストレージ２０に記憶される。

【0017】

図２Ｃを参照して、シーケンサー３０の構成例を説明する。シーケンサー３０は、制御部３０１と、送受信部３０２と、入力部３０３と、出力部３０４と、記憶部３０５と、フローセル３０６と、撮像部３０７と、を備える。制御部３０１は、例えばCPUなどのプロセッサ、及びROM、RAMなどのメモリを備える。送受信部３０２は、制御部３０１が外部の装置と通信するための通信インターフェースである。入力部３０３は、例えばキーボード、マウス、タッチセンサなどである。出力部３０４は、例えばディスプレイ、プリンタ、スピーカーなどである。タッチセンサとディスプレイとが一体化されたタッチパネルのような、入力部及び出力部の両方の機能を有する装置を用いてもよい。記憶部３０５は、例えばHDD、SSDなどの記憶装置である。フローセル３０６は、試薬の流れる流路を持ったガラス基板を含み、流路内に導入されたライブラリー試料に含まれるポリヌクレオチドのクラスター形成及びシーケンス反応を起こす。撮像部３０７は、フローセル３０６内のクラスターを撮像し、撮像した画像を記憶部３０５に記憶する。制御部３０１は、記憶部３０５に記憶された画像を解析し、ポリヌクレオチドの塩基配列を決定する。

【0018】

「ライブラリー」とは、シーケンサーにより塩基配列を解析されることとなるアンプリコン(増幅産物)の集りを意味する。「ライブラリー試料」は、ライブラリーを含む試料であり、検体から取得した核酸を増幅することにより調製される。ライブラリー試料の調製では、まず、被検者の検体から核酸を抽出する。核酸の種類は、解析の目的に応じて、DNA及びRNAから選択される。DNAの抽出では、検体と、細胞又は組織を可溶化する界面活性剤(例えばコール酸ナトリウム、ドデシル硫酸ナトリウムなど)を含む可溶化液とを混合する。得られた混合液に物理的処理(撹拌、ホモジナイズ、超音波破砕など)を行い、検体に含まれるDNAを液中に遊離させる。RNAの抽出では、検体と、チオシアン酸グアニジン及び界面活性剤を含む可溶化液とを混合する。得られた混合液に物理的処理を行い、検体に含まれるRNAを液中に遊離させる。

【0019】

検体がホルマリン固定パラフィン包埋(FFPE)組織である場合、核酸の抽出は、例えば次のようにして行うことができる。まず、FFPE組織にキシレンを添加して、脱パラフィン処理をする。脱パラフィン処理した組織をエタノールに浸して、親水化処理をする。親水化処理した組織をプロテアーゼで処理して、ホルマリンで架橋された核酸を液中に遊離させる。好ましくは、DNA又はRNAを含む混合液を遠心分離などにより細胞破片を除去して、遊離したDNA又はRNAを含む溶液を取得する。そして、得られた溶液をフェノール／クロロホルム抽出することにより、DNA又はRNAを精製できる。検体からの核酸の抽出及び精製は、市販の試薬キットを用いて行ってもよい。

【0020】

ライブラリー試料の調製では、核酸を断片化することが好ましい。断片化により、取得した核酸を、シーケンサー３０による読み取りに適した長さ(数十から数百bp)とすることができる。核酸は、例えば超音波処理により断片化できる。核酸がDNAである場合、断片化は、アルカリ処理、制限酵素処理などによっても行うことができる。例えば、アルカリ処理によりDNAを断片化する場合、DNA溶液に水酸化ナトリウム溶液を終濃度0.1～1.0 Nとなるよう添加し、10～40℃で５～15分間インキュベーションすることによりDNAが断片化される。また、制限酵素処理によりDNAを断片化する場合、制限酵素はDNAの塩基配列に基づいて適宜選択され、例えばMseIやBamHIなどが用いられる。必要に応じて、核酸断片のサイズセレクション、末端平滑化、アダプター配列のライゲーション、インデックス配列のライゲーション、又はバーコード配列のライゲーションなどを行ってもよい。

【0021】

断片化した核酸は、PCRに基づく方法により増幅することが好ましい。解析対象領域を増幅可能なプライマーセットを設計し、それらを用いて核酸をPCR法で増幅することにより、ライブラリー試料を得ることができる。１つのプライマーセットは、１つのフォワードプライマー及び１つのリバースプライマーを含む。シーケンス・キャプチャー法により、核酸断片から解析対象領域を含む核酸を濃縮してもよい。濃縮した核酸をPCR法のテンプレートに用いて増幅することにより、ライブラリー試料を得ることができる。検体中のDNAに由来するライブラリー試料を以下、「DNAライブラリー試料」とも呼ぶ。

【0022】

増幅に用いるプライマーにアダプター配列、インデックス配列、バーコード配列などの付加配列、標識物質などを付加してもよい。複数のプライマーセットを用いる場合、これらのプライマーセットはマルチプレックスPCRが可能であることが好ましい。これにより、取得した核酸中の複数の領域を同時に増幅できる。この場合、各プライマーセットには、相互に異なるバーコード配列を付加することが好ましい。これにより、各プライマーセットによるアンプリコンを識別できる。エキソームシーケンシングキットなどの市販の試薬キットに添付されているマルチプレックスPCR用プライマーセットを用いてもよい。

【0023】

増幅に用いるポリメラーゼは、PCRに用いられる公知の耐熱性ポリメラーゼから適宜選択できるが、それらの中でも、マルチプレックスPCRに適しており、且つPCR増幅によるエラーが少ない耐熱性ポリメラーゼが望ましい。増幅反応には、選択したポリメラーゼに適したバッファーを用いればよい。PCR増幅によるエラーを抑えるために、PCRのサイクル数は、シーケンシングに必要な数のアンプリコンが得られる範囲で最小限にすることが好ましい。サイクル数は、例えば10サイクル以上25サイクル以下の範囲から決定すればよい。

【0024】

上記のようにして得たライブラリー試料について、当該技術分野において公知のシーケンシング法により塩基配列を読み取ればよい。シーケンシング法は特に限定されないが、次世代シーケンサーによる解析が好ましい。次世代シーケンサーによる解析法としては、イオン半導体シーケンシング法、パイロシーケンシング法、SBS(sequencing by synthesis)法などが挙げられる。

【0025】

本実施形態の情報処理装置１０は、被検者の検体から取得した核酸の配列を解析するための装置である。図２Ａを参照して、情報処理装置１０の構成の例を説明する。情報処理装置１０は、制御部１０１と、送受信部１０２と、入力部１０３と、出力部１０４と、記憶部１０５とを備える。記憶部１０５には、参照配列データベース１０６と、変異情報データベース１０７と、解析対象テーブル１０８と、品質指標テーブル１０９と、解析結果データベース１１０と、が記憶されている。あるいは、参照配列データベース１０６、変異情報データベース１０７、解析対象テーブル１０８、品質指標テーブル１０９及び解析結果データベース１１０は、ストレージ２０に記憶されてもよい。各データベース／テーブルに含まれる情報については後述する。情報処理装置１０は、例えばコンピュータで構成され得る。この場合、制御部１０１は、例えばCPUなどのプロセッサ、及びROM、RAMなどのメモリを備える。送受信部１０２は、制御部１０１が外部の装置及びネットワーク４００と通信するための通信インターフェースである。入力部１０３は、例えばキーボード、マウス、タッチセンサなどである。出力部１０４は、例えばディスプレイ、プリンタ、スピーカーなどである。タッチセンサとディスプレイとが一体化されたタッチパネルのような、入力部及び出力部の両方の機能を有する装置を用いてもよい。記憶部１０５は、例えばHDD、SSDなどの記憶装置である。記憶部１０５には、核酸の配列を解析するためのコンピュータプログラムが記憶される。制御部１０１は、記憶部１０５からコンピュータプログラムを読み出し、後述する核酸配列の解析処理を実行する。

【0026】

参照配列データベース１０６及び変異情報データベース１０７に含まれる情報は、外部のデータベースの情報に基づいて、定期的に最新の情報に更新され得る。情報の更新は、核酸解析システムを提供するベンダー又はユーザーによって実施されてもよい。あるいは、核酸解析システムによって自動的に情報の更新が実施されてもよい。外部のデータベースとしては、例えば、各国の学術団体や公的機関から提供される情報(参照配列の情報、及び既知の遺伝子変異に関する種々の情報)を蓄積したデータベース、ベンダーから提供される商用データベースなどが挙げられる。

【0027】

「参照配列」とは、リードが、ゲノム領域上のどこに対応する塩基配列であるかを決定するための参照となる配列である。参照配列は、解析対象領域の塩基配列を含む配列であればよい。参照配列としては、例えば、ヒトの全ゲノム領域の塩基配列、全エキソン領域の塩基配列、標的遺伝子の塩基配列などが挙げられる。

【0028】

「変異」及び「遺伝子変異」は、突然変異及び遺伝子多型を包含する。変異としては、例えば配列変異、構造変異及びコピー数変異が挙げられる。配列変異は、１又は複数のヌクレオチドの置換、挿入、欠失及びそれらの組み合わせである。ヌクレオチドの置換は、例えば一塩基変異(SNV)及び一塩基多型(SNP)が挙げられる。ヌクレオチドの挿入及び欠失は「InDel」とも呼ばれる。構造変異は、例えば転座、逆位、欠失及び重複が挙げられる。コピー数変異は、例えば増幅及び欠失が挙げられる。

【0029】

解析対象テーブル１０８は、解析対象領域の情報を含む。解析対象領域の情報は、例えば、解析対象領域として選択される標的遺伝子の情報が記載される。標的遺伝子の情報としては、例えば、遺伝子の名称、位置情報及び塩基配列などが挙げられる。位置情報としては、染色体番号(Chr)、遺伝子(Gene)ゲノム配列上での当該遺伝子の塩基配列の始点(Pos-Start)及び終点(Pos-End)などが挙げられる。表１に解析対象テーブル１０８の一例を示すが、これに限定されない。

【0030】

【表1】

【0031】

「解析対象領域」は、被検者の検体から取得した核酸において塩基配列の解析を所望する領域である。解析対象領域は、ゲノム領域から任意に決定できる。好ましくは、解析対象領域は、少なくとも１つの標的遺伝子を含むゲノム領域の一部である。解析対象領域は、全ゲノム領域又は全エクソーム領域であってもよい。解析対象領域は１つでもよいし、複数でもよい。例えば、遺伝子パネル検査では、数十又は百以上の遺伝子を解析対象領域として核酸解析を行う。

【0032】

「標的遺伝子」は、変異の有無の判定が所望される遺伝子である。標的遺伝子は、特に限定されず、検査の目的に応じて適宜決定できる。例えば、公知の遺伝子パネル検査に用いられる遺伝子が挙げられる。標的遺伝子の塩基配列には、当該遺伝子のエキソン、イントロン、プロモーターなどの転写調節領域の塩基配列、及び当該遺伝子から転写されたmRNAの配列が包含される。mRNAには、pre-mRNAが包含される。

【0033】

核酸解析システム１００は、例えば、遺伝子パネル検査を実施する場合に利用できる。遺伝子パネル検査は、臨床検査に限られず、研究用途の検査も包含する。例えば、依頼元施設２００は、遺伝子パネル検査などの核酸解析の依頼情報をデータ送受信装置４０により依頼先施設３００へ送信する。また、依頼元施設２００は、被検者の検体を依頼先施設３００に送付する。

【0034】

被検者は、特に限定されず、例えば患者、疾患の疑いがある者、健常者などが挙げられる。疾患は特に限定されず、例えば、遺伝学的検査やゲノム医療が有用と考えられる疾患が挙げられる。そのような疾患としては、例えば、がん、自己免疫疾患、遺伝性疾患などが挙げられる。検体は、被検者の核酸を含むかぎり、特に限定されない。好ましくは、検体は、被検者から採取された生体試料である。生体試料としては、例えば、組織、細胞、体液、分泌液、尿、糞便などが挙げられる。体液は、例えば、血液（全血）、骨髄液、脳脊髄液、リンパ液、腹水、胸水、羊水、関節液などが挙げられる。分泌液は、例えば、唾液、汗、涙液、鼻汁、精液、乳頭分泌液などが挙げられる。検体は、生体試料からの調製物であってもよい。例えば、血液からの調製物は、血漿及び血清が挙げられる。細胞からの調製物としては、採取した細胞を培養して得られた培養物(培養した細胞及び培地を含む)が挙げられる。組織からの調製物は、例えば、凍結組織、固定組織、FFPE組織などが挙げられる。

【0035】

固形がんの患者である被検者に対してマッチドペア検査を行う場合は、検体として、腫瘍検体及び非腫瘍検体の２種類を用いる。マッチドペア検査とは、固形がん患者の腫瘍検体及び非腫瘍検体のそれぞれから取得した核酸の配列を解析し、それらの結果に基づいて体細胞変異と生殖細胞変異を区別して検出することが可能な検査である。腫瘍検体は、例えば、手術又は生検により被検者から採取された腫瘍組織及びその調製物であり得る。非腫瘍検体は、同じ被検者から採取した非腫瘍細胞(例えば全血)であり得る。

【0036】

固形がんは、がんのうち、血液がん以外のがんをいう。固形がんの種類は特に限定されず、上皮細胞がん及び非上皮細胞がんのいずれであってもよい。上皮細胞がんは、上皮細胞に発生するがんであれば特に限定されず、例えば、肺がん、乳がん、胃がん、大腸がん、肝がん、子宮がん、卵巣がんなどが挙げられる。非上皮細胞がんは、例えば、骨肉腫、軟骨肉腫、横紋筋肉腫、平滑筋肉腫、線維肉腫、脂肪肉腫、血管肉腫などが挙げられる。

【0037】

品質指標テーブル１０９には、後述する所定部位に関する情報として、少なくとも、解析対象領域における所定部位の位置情報を含む。図２Ｂに示すように、解析結果データベース１１０は、解析対象領域における変異の検出結果を含む測定結果テーブルと、所定部位に対する核酸解析の品質に関する情報を含む品質情報テーブルと、それらから生成された検査結果レポートの情報を含むレポートテーブルと、を検査依頼ごとに含む。各テーブルは、検査依頼を個別に識別する検査依頼ＩＤと紐づけられている。

【0038】

以下、核酸解析システム１００による核酸配列の解析について説明する。依頼元施設２００の担当者が、データ送受信装置４０に核酸解析の依頼情報を入力すると、依頼情報は、ネットワーク４００を介して情報処理装置１０に送信され、情報処理装置１０によって受信される。依頼情報は、例えば、被検者の情報、検体の情報などが含まれてもよい。被検者の情報は、例えば、年齢、性別、疾患の種類及び状態などを含む。検体の情報は、例えば、検体の種類、採取時期、検体と被検者とを関連付ける検体IDなどを含む。依頼情報には、解析対象領域及び／又は所定部位の指定が含まれてもよい。遺伝子パネル検査の依頼の場合、依頼情報には、所望の遺伝子パネルの指定が含まれてもよい。所定部位については後述する。依頼先施設３００の担当者は、情報処理装置１０が受信した依頼情報に応じて、シーケンサー３０に、解析の依頼を入力する。

【0039】

図３を参照して、シーケンサー３０による塩基配列の読み取りについて説明する。ステップＳ１１において、シーケンサー３０の制御部３０１は、解析の依頼を受け付ける。ステップＳ１２において、シーケンサー３０の制御部３０１は、ライブラリー試料の塩基配列を読み取る。

【0040】

上記のとおり、シーケンサーにより読み取られたアンプリコンの塩基配列が、「リード」である。すなわち、ステップＳ１２では、シーケンサー３０はライブラリー試料の各アンプリコンの塩基配列を読み取り、リードを取得する。リードの長さは、解析法、シーケンサーの種類などにより異なるが、例えば50塩基以上、好ましくは100塩基以上、より好ましくは150塩基以上である。また、リードの長さは、例えば500塩基以下、好ましくは350塩基以下、より好ましくは250塩基以下である。リードの数は、特に限定されず、検体から取得した核酸のコピー数、PCR法で増幅した部位などにより異なる。

【0041】

ステップＳ１３では、シーケンサー３０の制御部３０１は、取得した全てのリードをストレージ２０に送信する。ストレージ２０は、それらのリードを記憶する。シーケンサー３０から送信されるリードのファイル形式は、例えばFASTA、FASTQ、uBAMである。FASTAファイルは、リードの配列情報だけを含むファイルである。FASTQファイルは、後述のクオリティスコアを含むリードの配列情報を含むファイルである。uBAMファイルは、参照配列へのアライメントがされていないリードの配列情報を含むバイナリファイルである。アライメントについては後述する。なお、ステップＳ１３では、シーケンサー３０の制御部３０１は、取得したリードを情報処理装置１０に送信してもよい。この場合、情報処理装置１０がそれらのリードを記憶する。

【0042】

シーケンサー３０から送信されるファイルには、リードのデータと共に、リードの名称(又は配列ID)、配列中の各塩基のクオリティスコアなどの情報が含まれてもよい。クオリティスコアは、シーケンサーによるベースコール(塩基の指定)の正確さを表す指標である。ここで、リードの塩基配列は、シーケンサーが取得したトレースデータ(シーケンシング反応で得たシグナルの波形データなどの生データ)からベースコールが行われることで決定される。すなわち、クオリティスコアは、シーケンサーにより決定された塩基配列の正確さを表す。ベースコールは、例えばPhredのような公知のベースコーリングプログラムにより実行される。クオリティスコアとして、例えば、illumina社のシーケンサー（HiSeq2500、MiSeq、NextSeq等）から出力されるクオリティスコア(Ｑ)を用いることができる。クオリティスコア(Ｑ)は、下記の式(I)により算出される。式中、Ｅは、ベースコールが誤っている確率の推定値である。

【0043】

Ｑ＝-10log₁₀Ｅ・・・(I)

【0044】

クオリティスコアは、リードの各塩基に付与される。例えば、リード中のある塩基のクオリティスコアが20であるとき、その塩基におけるエラーの頻度は10^-2/塩基であり、クオリティスコアが30であるとき、その塩基におけるエラーの頻度は10^-3/塩基である。リードにおけるクオリティスコアの平均値は、エラーの頻度を表すことができる。クオリティスコアの平均値は、リードの各塩基のクオリティスコアの和を、リードの長さ(塩基数)で割ることにより算出できる。例えば、クオリティスコアの平均値が20であるとき、リード中のエラーは100塩基に１つであり、クオリティスコアの平均値が30であるとき、リード中のエラーは1,000塩基に１つである。このように、クオリティスコアが高いほど、エラーの確率が低くなる。クオリティスコア及びその平均値は、次世代シーケンサーにより自動的に算出される。

【0045】

DNAを解析対象とするマッチドペア検査を行う場合、腫瘍検体(例えば腫瘍組織のFFPE検体)及び非腫瘍検体(例えば全血)のそれぞれから、DNAライブラリー試料を調製する。そして、シーケンサー３０は、ステップＳ１２において、各ライブラリー試料の各アンプリコンの塩基配列を読み取り、リードを取得する。以下、腫瘍検体に由来するDNAライブラリー試料から取得したリードを、「腫瘍配列データ」と呼ぶ。また、非腫瘍検体に由来するDNAライブラリー試料から取得したリードを、「正常配列データ」と呼ぶ。

【0046】

図４を参照して、情報処理装置１０による核酸配列データの解析処理の一例について説明する。ステップＳ２１において、情報処理装置１０の制御部１０１は、ストレージ２０に記憶されたリードを読み出す。ステップＳ２２において、制御部１０１は、リードに基づいて、解析対象領域における変異の検出結果を取得する。

【0047】

ステップＳ２２の一つの実施形態として、マッチドペア検査により体細胞変異及び生殖細胞変異を検出する処理のフローについて説明する。体細胞変異とは、体細胞の遺伝子に生じた変異である。体細胞変異は、腫瘍の原因の一つであることが知られている。図５を参照して、ステップＳ３１において、制御部１０１は、参照配列データベース１０６から参照配列を読み出し、ステップＳ２１で読み出した腫瘍配列データと参照配列とのアライメントを実行する。また、ステップＳ３２において、制御部１０１は、正常配列データと参照配列とのアライメントを実行する。腫瘍配列データと参照配列とのアライメントの結果及び正常配列データと参照配列とのアライメントの結果は、記憶部１０５に記憶される。

【0048】

「アライメント」は、各リードについて、参照配列上で対応する領域を決定する処理である。アライメントは、マッピングとも呼ばれる。参照配列は、体細胞変異を含まない塩基配列であればよい。例えば、参照配列は、野生型のゲノムの塩基配列である。リードと参照配列とのアライメントには、BWA(Burrows-Wheeler Aligner)、BWA-MEM、Bowtie、Bowtie2、BLASTなどの公知のアライメントツール(ソフトウェア)を用いることができる。

【0049】

リードのうち、解析対象領域に対応するリードを、以下「第１のリード」とも呼ぶ。「解析対象領域に対応するリード」とは、解析対象領域の塩基配列を含む参照配列に対するアライメントを実行したときに、解析対象領域の塩基配列に配置されたリードをいう。後述の図７Ａ及びＢに示されるように、解析対象領域の塩基配列には、通常、複数の第１のリードがマッピングされる。解析対象領域の塩基配列は、通常、第１のリードよりも長い。図中、第１のリードは、白抜きのバー及び黒のバーで表される。なお、第１のリードのうち、黒のバーは、後述の第２のリードを表す。

【0050】

制御部１０１は、各配列リードのマッピングクオリティスコアを算出してもよい。マッピングクオリティスコアは、リードのマッピングの正確さを表す指標である。マッピングクオリティスコア(Ｑ)は、下記の式(II)により算出される。式中、Ｐは、リードが誤った位置にマッピングされる確率である。

【0051】

Ｑ＝-10log₁₀Ｐ・・・(II)

【0052】

あるリードのマッピングクオリティスコアの値が高いほど、そのリードが誤った位置にマッピングされている確率は低くなる。したがって、リードのマッピングクオリティスコアが高いとき、リードは、解析対象領域に対応する塩基配列を有する可能性が高いといえる。

【0053】

腫瘍配列データにおいて、参照配列と一致しない部位がある場合、当該部位は、腫瘍組織の遺伝子の変異であるか又は被検者固有の遺伝子多型であり得る。正常配列データにおいて、参照配列と一致しない部位がある場合、当該部位は、被検者固有の遺伝子多型であるか又は生殖細胞変異であり得る。

【0054】

ステップＳ３３において、制御部１０１は、正常配列データにおいて、参照配列と一致しない部位があるか否かを判定する。上記のとおり、参照配列と一致しない部位がある場合、当該部位は、生殖細胞変異であるか又は被検者固有の遺伝子多型であり得る。制御部１０１が、正常配列データが参照配列と一致しないと判定したとき、プロセスはステップＳ３４へ進む。ステップＳ３４において、制御部１０１は、ステップ３３で検出された正常配列データ中の参照配列と一致しない部位を生殖細胞変異と判定する。その後、プロセスは後述するステップＳ３７へ進む。一方、ステップＳ３３において、制御部１０１が、正常配列データが参照配列と一致すると判定したとき、プロセスはステップＳ３５へ進む。ステップＳ３５において、制御部１０１は、ステップ３３で検出された正常配列データ中の参照配列と一致する部位に対応する腫瘍配列データが、参照配列と一致するか否かを判定する。腫瘍配列データが参照配列と一致しない場合、ステップＳ３５で検出された腫瘍配列データ中の参照配列と一致しない部位は、腫瘍組織の遺伝子にのみ認められる変異である可能性が高い。腫瘍組織の遺伝子にのみ認められる変異は、体細胞変異である。よって、ステップＳ３６において、制御部１０１は、ステップ３５で検出した部位を体細胞変異と判定する。

【0055】

ステップＳ３５において、腫瘍配列データが参照配列と一致する場合、制御部１０１は、処理を終了する。この場合、被検者には体細胞変異も生殖細胞変異もないと考えられる。

【0056】

ステップＳ３７において、制御部１０１は、検出された体細胞変異又は生殖細胞変異に基づいて、変異情報データベース１０７を検索する。変異情報データベース１０７には、既知の遺伝子変異を特定するための情報が蓄積されている。そのような情報としては、変異識別子(変異ID)、遺伝子名、変異の位置情報(例えば染色体番号（Chr）及びゲノム配列の塩基番号（Pos））、REF、ALT、アノテーションなどが挙げられる。変異IDは、変異を識別するための識別子である。変異の位置情報のうち、Chrは、変異が位置する染色体の番号を示す。Posは、ゲノム配列の塩基番号を示す。REFは、野生型における塩基を示し、ALTは、変異後の塩基を示す。アノテーションは、変異により変化するアミノ酸及び／又は塩基の情報を示す。アノテーションは、例えば「p.A146V」、「c.437C>T」のように表示されてもよい。「p.A146V」は、変異によりタンパク質の146番目のアラニン残基がバリン残基に変化したことを意味する。「c.437C>T」は、変異により437番目のシトシンがチミンに変化したことを意味する。

【0057】

例えば、制御部１０１は、検出された体細胞変異又は生殖細胞変異が存在する遺伝子の名称と位置情報に基づいて、変異情報データベース１０７を検索できる。これにより、検出された体細胞変異又は生殖細胞変異が、既知の遺伝子変異のいずれに該当するかを決定できる。

【0058】

変異情報データベース１０７は、既知の遺伝子変異を特定するための情報だけでなく、それらの既知の遺伝子変異と関連する疾患情報、薬剤情報及びバイオマーカーの属性情報がさらに格納されてもよい。疾患情報としては、例えば、既知の遺伝子変異に関連する疾患名(例えば大腸がん、肺がん、乳がんなど)、疾患の種類(例えば、がん、眼疾患、精神神経疾患など)、ドライバー変異に関する情報、変異の病原性評価に関する情報(例えば病原性(pathogenic)、病原性の可能性がある(likely pathogenic)、良性(benign)など)、変異と疾患との関連性レベルに関する情報(例えばエビデンスレベル)、変異と疾患との関連性の種別情報(例えば、腫瘍原性エビデンス(Oncogenic)、疾患素因関連エビデンス(Predisposing)、治療効果予測エビデンス(Predictive)、診断エビデンス(Diagnostic)、予後予測エビデンス(Prognostic))などが挙げられる。薬剤情報としては、例えば、既知の遺伝子変異に関連する治療薬の有無、治療薬の名称、治療薬が承認された国・地域などの情報が挙げられる。バイオマーカーの属性情報としては、例えば、バイオマーカーの種類(例えば、コンパニオン診断(CDx)、悪性度、予後、罹患リスク、発症リスクなど)、マーカー検査の情報(例えば、検査の適用対象の疾患名、治療薬の名称、検査が承認された国・地域など)が挙げられる。

【0059】

ステップＳ３８において、制御部１０１は、検索結果に基づき、検出された体細胞変異又は生殖細胞変異にアノテーションを付与する。ステップＳ３１～Ｓ３８の処理により、制御部１０１は、ステップＳ２２において、変異の検出結果として、解析対象領域における遺伝子変異の情報を得る。遺伝子変異の情報としては、例えば、検出された変異が生じている遺伝子の名称(Gene)、変異の位置情報(染色体番号(Chr)、ゲノム配列の塩基番号(Pos)など)、遺伝子変異におけるアミノ酸変化(AA)、遺伝子変異におけるコーディング領域変化（CDS）、体細胞変異又は生殖細胞変異の種別の情報(Somatic/Germline)、変異の種類(Mutation type)などが挙げられる。

【0060】

制御部１０１は、ステップＳ２２のプロセスにより取得した変異の検出結果を、検査結果データベース１１０の測定結果テーブルに記憶する。表２に測定結果テーブルの一例を示すが、これに限定されない。測定結果テーブルには、ステップＳ２２のプロセスにより検出された全ての遺伝子変異が含まれる。表中、「Chr」は、検出された遺伝子変異の染色体番号を示し、「Pos」は、検出された遺伝子変異のゲノム配列の塩基番号を示し、「CDS」は、検出された遺伝子変異におけるコーディング領域変化を示し、「AA」は、検出された遺伝子変異におけるアミノ酸変化を示し、「Somatic/Germline」は、検出された遺伝子変異が体細胞変異であるか、生殖細胞変異であるかの種別を示し、「Mutation type」は、検出された遺伝子変異の種類を示す。

【0061】

【表2】

【0062】

制御部１０１は、変異の検出結果を取得する処理を終了し、プロセスは、図４のステップＳ２３へ進行する。ステップＳ２３において、制御部１０１は、核酸配列データに基づいて、所定部位に対する核酸解析の品質に関する情報を生成する。

【0063】

「所定部位」とは、解析対象領域の塩基配列から任意に選択される少なくとも１つの部位である。所定部位は、核酸解析の品質を調べ、その品質に関する情報を提供するために選択される。制御部１０１による所定部位の決定については、後述する。解析対象領域の塩基配列において、所定部位は１箇所であってもよいし、複数箇所であってもよい。また、所定部位は、解析対象領域の塩基配列中の１つの塩基又は２つ以上の連続する塩基からなる。すなわち、所定部位は、一塩基であってもよいし、連続する複数の塩基からなる領域であってもよい。所定部位が、連続する複数の塩基からなる領域である場合、その長さは、例えば２塩基、３塩基、４塩基、５塩基、６塩基、７塩基、８塩基、９塩基、10塩基又は11塩基であり得る。

【0064】

所定部位は、変異が生じる可能性のある部位を含むことが好ましい。所定部位は、変異が生じる可能性のある部位であってもよいし、変異が生じる可能性のある部位及びその近傍であってもよい。例えば、解析対象領域中の既知の変異として、ある一塩基に置換又は欠失が生じ得るか、又は一塩基が挿入され得ることが既知であった場合、所定部位は、その変異が生じ得る一塩基自体であってもよい。あるいは、所定部位は、その変異が生じ得る一塩基を中心として上流側及び下流側に１～５塩基ずつの領域であってもよい。この場合、所定部位は、その変異が生じ得る一塩基を含む領域であってもよい。所定部位に実際に変異が生じていたか否かは問わない。核酸解析の結果、所定部位に変異が生じていてもよいし、生じていなくてもよい。

【0065】

所定部位に生じる可能性のある変異は、例えば、解析対象領域において、疾患の診断又は治療に関連する変異である。そのような変異としては、例えば、以下の(1)～(3)に記載の変異が挙げられる。

【0066】

(1) 薬剤の効果及び／又は副作用と関連することが既知の変異、
(2) 疾患の状態、発症及び／又は予後と関連することが既知の変異、及び
(3) 診断又は治療との関連性を示すエビデンスレベルが所定のレベル以上であることが既知の変異。

【0067】

(1)に記載の変異は、例えばコンパニオン診断マーカー（CDxマーカー）である。そのようなマーカーとしては、例えばFoundationOne(登録商標) CDxがんゲノムプロファイル(中外製薬株式会社)などの遺伝子パネル検査に用いられる遺伝子変異が知られている。(2)に記載の変異は、例えばドライバー変異、病原性変異、悪性度マーカーとしての変異、予後予測マーカーとしての変異、罹患リスクマーカーとしての変異、発症リスクマーカーとしての変異である。そのようなマーカーとしては、例えばOncoGuide(商標) NCCオンコパネルシステム(シスメックス株式会社)、FoundationOne(登録商標) CDxがんゲノムプロファイル(中外製薬株式会社) に用いられる遺伝子変異が知られている。

【0068】

エビデンスレベルは、エビデンスについて信頼又は推奨できる度合いを示す。(3)に記載のエビデンスレベルは、例えば腫瘍原性エビデンス、疾患素因関連エビデンス、治療効果予測エビデンス、診断エビデンス又は予後予測エビデンスのエビデンスレベルである。腫瘍原性エビデンスは、体細胞変異や生殖細胞変異のような、細胞のがん化に寄与する遺伝子変異をいう。疾患素因関連エビデンスは、遺伝性の乳がんや卵巣がんなどにおける、がん化関連の生殖細胞変異をいう。治療効果予測エビデンスは、薬剤、放射線治療などの感受性及び耐性に関連するマーカーや、薬物動態に影響する薬物代謝酵素や薬物トランスポーターの遺伝子変異などをいう。診断エビデンスは、患者の診断に関連するマーカーであり、例えば、細胞の形態、腫瘍の組織像、免疫組織染色によるがん種特異的なマーカータンパクの発現や局在などが挙げられる。予後予測エビデンスは、がんの進行、重症度、生存予後などに関するマーカーをいう。これらのエビデンスについてのエビデンスレベルは、例えば、日本臨床腫瘍学会、日本癌治療学会、日本癌学会、米国臨床腫瘍学会(ASCO)、米国病理医協会(CAP)、米国分子病理学会(AMP)、欧州臨床腫瘍学会(ESMO)などの学術団体から発表されている。

【0069】

疾患の診断又は治療に関連する変異は、例えば、FDAに承認されたCDxマーカーから選択されてもよい。具体的には、疾患の診断又は治療に関連する変異は、図６Ａ～６Ｃに示される表に記載のバイオマーカーから選択されてもよい。これらの図に示される各バイオマーカーに対応する検査又はキットの名称及び製造業者を、表３に示す。

【0070】

【表3】

【0071】

所定部位は、上記の変異情報データベース１０７の情報に基づいて、解析対象領域の塩基配列から選択してもよい。具体的には、制御部１０１は、記憶部１０５から、解析対象領域の情報と、既知の遺伝子変異に関する情報とを読み出す。既知の遺伝子変異に関する情報は、変異情報データベース１０７に含まれる。既知の遺伝子変異に関する情報は、例えば、上記の既知の遺伝子変異を特定するための情報、疾患情報、薬剤情報及びバイオマーカーの属性情報である。制御部１０１は、読み出した情報に基づいて、所定部位を決定し、所定部位に関する情報を抽出する。所定部位に関する情報は、品質指標テーブル１０９（図２Ｂ参照）に含まれる情報として記憶部１０５に記憶されてもよい。なお、所定部位は、所定の判定ルール又はユーザーの指示により制御部１０１により選択されてもよいし、記憶部１０５に記憶される核酸の配列を解析するためのコンピュータプログラムの設計者により選択され、選択された所定部位が予めコンピュータプログラムに記載されていてもよい。

【0072】

一つの実施形態として、バイオマーカーの属性情報に基づいて所定部位を決定する例について説明する。この例では、バイオマーカーの属性情報として、CDxマーカーの情報に基づいて所定部位を決定する。しかし、バイオマーカーの属性情報は、CDxマーカーの情報に限定されない。悪性度、予後、罹患リスク、発症リスクなどに関する他のバイオマーカーの情報に基づいて、所定部位を決定してもよい。制御部１０１は、変異情報データベース１０７からCDxマーカーの情報を取得する。次いで、制御部１０１は、取得した情報に基づいて、解析対象テーブル１０８の解析対象領域の中から、CDxマーカーの部位を抽出する。そして、制御部１０１は、抽出したCDxマーカーの部位の位置を示す情報を、記憶部１０５の品質指標テーブル１０９に記憶する。これにより、制御部１０１は、解析対象領域中のCDxマーカーの部位を所定部位として決定できる。この実施形態の品質指標テーブル１０９の例を、表４に示す。表中、「Region」は、CDxマーカーが承認された国及び地域を示す。

【0073】

【表4】

【0074】

表４に示されるように、品質指標テーブル１０９には、所定部位に関する情報として、所定部位を含む遺伝子の名称(Gene)、所定部位の位置情報(所定部位が位置する染色体番号(Chr)、ゲノム配列の塩基番号(Pos)）が記載されている。品質指標テーブル１０９には、表４に示されるように、所定部位に生じる可能性のある変異に関する情報として、遺伝子変異におけるアミノ酸変化(AA)が記載されている。表４に示す品質指標テーブル１０９では、更に、マーカーの種類（Marker type）、CDx検査が承認された国及び地域(Region)、CDx検査が適用される疾患(がん)の種類の情報(Cancer type)が記載されている。

【0075】

さらなる実施形態として、疾患情報に基づいて所定部位を決定する例について説明する。この例では、疾患情報として、既知の遺伝子変異に関連する疾患名に基づいて所定部位を決定する。より具体的には、肺がんに基づいて所定部位を決定する。しかし、疾患情報は、肺がんに限定されない。他の疾患や疾患の種類の情報に基づいて、所定部位を決定してもよい。制御部１０１は、変異情報データベース１０７から、肺がんに関連する遺伝子変異についての情報を取得する。次いで、制御部１０１は、取得した情報に基づいて、解析対象テーブル１０８の解析対象領域の中から、肺がんに関連する一塩基又は複数塩基を抽出する。そして、制御部１０１は、抽出した肺がんに関連する一塩基又は複数塩基の情報を、品質指標テーブル１０９として記憶部１０５に記憶する。これにより、制御部１０１は、解析対象領域中の肺がんに関連する一塩基又は複数塩基を所定部位として決定できる。

【0076】

他の疾患情報に基づいて所定部位を決定する例について説明する。この例では、疾患情報として、変異と疾患との関連性レベルに関する情報に基づいて所定部位を決定する。より具体的には、エビデンスレベルに基づいて所定部位を決定する。しかし、疾患情報は、エビデンスレベルに限定されない。変異と疾患との関連性の種別情報に基づいて、所定部位を決定してもよい。制御部１０１は、変異情報データベース１０７から、エビデンスレベルが所定のレベル以上の遺伝子変異についての情報を取得する。次いで、制御部１０１は、取得した情報に基づいて、解析対象テーブル１０８の解析対象領域の中から、エビデンスレベルが所定のレベル以上の遺伝子変異が生じ得る一塩基又は複数塩基を抽出する。そして、制御部１０１は、抽出した一塩基又は複数塩基の情報を、品質指標テーブル１０９として記憶部１０５に記憶する。これにより、制御部１０１は、解析対象領域中の、エビデンスレベルが所定のレベル以上の遺伝子変異が生じ得る一塩基又は複数塩基を所定部位として決定できる。

【0077】

さらに、他の疾患情報に基づいて所定部位を決定する例について説明する。この例では、疾患情報として、ドライバー変異に関する情報に基づいて所定部位を決定する。しかし、疾患情報は、ドライバー変異に関する情報に限定されない。変異の病原性評価に関する情報に基づいて、所定部位を決定してもよい。制御部１０１は、変異情報データベース１０７から、ドライバー変異に関する情報を取得する。次いで、制御部１０１は、取得した情報に基づいて、解析対象テーブル１０８の解析対象領域の中から、ドライバー変異が生じ得る一塩基又は複数塩基を抽出する。そして、制御部１０１は、抽出した領域の情報を、品質指標テーブル１０９として記憶部１０５に記憶する。これにより、制御部１０１は、解析対象領域中の、ドライバー変異が生じ得る一塩基又は複数塩基を所定部位として決定できる。

【0078】

疾患情報に基づく品質指標テーブル１０９の例を、表５に示す。表中、「Disease type」は、変異に関連する疾患の種類を示し、「Disease name」は、変異に関連する疾患名を示し、「Evidence type」は、変異と疾患との関連性の種別情報を示し、「Evidence level」は、変異と疾患との関連性レベルを示す情報である。表５に示されるように、品質指標テーブル１０９には、所定部位の位置情報(所定部位が位置する染色体番号(Chr)、ゲノム配列の塩基番号(Pos)）が、種々の疾患情報と対応付けられて記載されてもよい。

【0079】

【表5】

【0080】

さらなる実施形態として、薬剤情報に基づいて所定部位を決定する例について説明する。この例では、薬剤情報として、既知の遺伝子変異に関連する治療薬の有無に基づいて所定部位を決定する。しかし、薬剤情報は、治療薬の有無に限定されない。治療薬の名称、治療薬が承認された国・地域などの情報に基づいて、所定部位を決定してもよい。制御部１０１は、変異情報データベース１０７から、既知の遺伝子変異に関連する治療薬の有無についての情報を取得する。次いで、制御部１０１は、取得した情報に基づいて、解析対象テーブル１０８の解析対象領域の中から、治療薬との関連が既知の遺伝子変異が生じ得る一塩基又は複数塩基を抽出する。そして、制御部１０１は、治療薬との関連が既知の遺伝子変異が生じ得る一塩基又は複数塩基の情報を、品質指標テーブル１０９として記憶部１０５に記憶する。これにより、制御部１０１は、解析対象領域において、治療薬との関連が既知の遺伝子変異が生じ得る一塩基又は複数塩基を所定部位として決定できる。この実施形態の品質指標テーブル１０９の例を、表６に示す。表中、「Drug」は、承認された治療薬を示し、「Region」は、治療薬が承認された国及び地域を示し、「Disease name」は、承認された治療薬が対象とするがん種を示す。表６では、「Disease name」として、肺がんを例示した。

【0081】

【表6】

【0082】

表６に示されるように、品質指標テーブル１０９には、所定部位の位置情報(所定部位が位置する染色体番号(Chr)、ゲノム配列の塩基番号(Pos)）が、種々の薬剤情報と対応付けられて記載されてもよい。なお、上記の実施形態では、所定部位の位置情報として、所定部位が位置する染色体番号(Chr)及びゲノム配列の塩基番号(Pos)が用いられたが、これには限定されず、解析対象領域中の塩基の位置を特定する情報であればよい。

【0083】

図４のステップＳ２３に関して、本実施形態の情報処理装置１０の制御部１０１は、第１のリードのうち、所定部位に対応する第２のリードに基づいて、当該所定部位に対する核酸解析の品質に関する情報を生成する。制御部１０１は、被検者由来の核酸に関して、所定部位における変異の存否に関わらず、当該所定部位に対する核酸解析の品質に関する情報を生成する。ここで、「所定部位に対応する第２のリード」とは、解析対象領域中の所定部位を含む領域にアライメントされた第１のリードをいう。以下、所定部位に対応する第２のリードを、単に「第２のリード」とも呼ぶ。図７Ａ及び７Ｂを参照して、解析対象領域にアライメントされた第１のリードと、所定部位に対応する第２のリードとの関係を説明する。図７Ａでは、参照配列中の「Ｘ」及び「Ｙ」で示されるように、解析対象領域の塩基配列から、一塩基の所定部位が２つ選択されている。図中、第１のリードは、白抜きのバー及び黒のバーで示され、解析対象領域にアライメントされている。図７Ａに示されるように、所定部位が一塩基である場合、所定部位に対応する第２のリードは、解析対象領域中の所定部位と同じ位置に塩基を含む第１のリードである。図中、第２のリードは黒のバーで示される。

【0084】

核酸解析の品質に関する情報として、例えば、解析対象領域の所定部位におけるデプス情報を生成できる。「デプス」とは、参照配列上の塩基に対応する位置にアライメントされたリードの数である。デプスはリード深度（read depth）ともいわれ、１回の測定で解析対象領域のある塩基が何度読まれたのかを示す。「デプス情報」とは、所定部位の塩基についてのデプス及び／又は当該デプスから取得される情報をいう。例えば、所定部位が１箇所又は複数箇所の一塩基である場合、デプス情報は、各塩基についてのデプスであり得る。すなわち、所定部位のデプスは、所定部位の各塩基にアライメントされた第２のリードの数である。所定部位が複数の塩基からなる領域である場合、デプス情報は、所定部位に含まれる個々の塩基のデプス、及び／又はそれらのデプスの統計的代表値である。デプスの統計的代表値は、例えば、デプスの平均値、最頻値、中央値、最小値、最大値などが挙げられる。デプス情報は、核酸解析の品質に関する情報の一つである。図７Ａでは、所定部位のＸ及びＹの各塩基について、デプス情報として、それぞれデプスＡ及びデプスＢが取得される。

【0085】

図７Ｂでは、所定部位として、参照配列中の「Ｘ」から「Ｙ」までの領域が選択されている。図７Ａと同様に、第１のリードは、白抜きのバー及び黒のバーで示され、解析対象領域にアライメントされている。また、第２のリードは黒のバーで示される。図７Ｂに示されるように、所定部位が複数の連続する塩基からなる場合、所定部位に対応する第２のリードは、所定部位の一部又は全部に該当する塩基を含む第１のリードである。図７Ｂでは、所定部位(ＸからＹまでの塩基配列)について、デプス情報として、デプスＣを取得できる。

【0086】

ステップＳ２３の一つの実施形態として、腫瘍配列データ及び正常配列データのそれぞれに基づいて、所定部位のデプス情報を取得する処理のフローについて説明する。以下、腫瘍配列データに基づいて取得されるデプス情報を「デプス情報Ｔ」と呼ぶ。また、正常配列データに基づいて取得されるデプス情報を「デプス情報Ｎ」と呼ぶ。図８を参照して、ステップＳ４１において、制御部１０１は、記憶部１０５から、ステップＳ３１で実行した腫瘍配列データと参照配列とのアライメントの結果を読み出す。ステップＳ４２において、制御部１０１は、腫瘍配列データと参照配列とのアライメントの結果を参照し、解析対象領域の所定部位に対応する第１リードである第２のリードの数に基づき、デプス情報Ｔを取得する。ステップＳ４３において、制御部１０１は、記憶部１０５から、ステップＳ３２で実行した正常配列データと参照配列とのアライメントの結果を読み出す。ステップＳ４４において、制御部１０１は、正常配列データと参照配列とのアライメントの結果を参照し、解析対象領域の所定部位に対応する第１リードである第２のリードの数に基づき、デプス情報Ｎを取得する。所定部位が複数ある場合、それぞれの所定部位について、デプス情報Ｔ及びＮを取得する。ステップＳ４５において、制御部１０１は、所定部位におけるデプス情報Ｔ及びＮを、記憶部１０５の検査結果データベース１１０の品質情報テーブルに記憶する。そして、制御部１０１は、所定部位に対する核酸解析の品質に関する情報を生成する処理を終了し、プロセスは、図４のステップＳ２４へ進行する。

【0087】

なお、ステップＳ４２のデプス情報Ｔの取得において、腫瘍配列データと参照配列とのアライメントの結果の参照には、マッピングデータを用いることができる。同様に、ステップＳ４４のデプス情報Ｎの取得において、正常配列データと参照配列とのアライメントの結果の参照にも、マッピングデータを用いることができる。マッピングデータとは、リードを参照配列にアライメントした結果を含む、リードの情報である。なお、ステップＳ４２及びＳ４４において、腫瘍配列データ及び正常配列データと参照配列とのアライメントの結果を参照しない場合には、制御部１０１は、ステップＳ４１において腫瘍配列データと参照配列とを読み出し、ステップＳ４２において、腫瘍配列データと参照配列とのアライメントを実行してもよい。さらに、ステップＳ４３において正常配列データと参照配列とを読み出し、ステップＳ４４において、正常配列データと参照配列とのアライメントを実行してもよい。

【0088】

表７に品質情報テーブルの一例を示すが、これに限定されない。表中、「Chr」、「Gene」、「Pos」、「AA」に対応する各情報は、品質指標テーブル１０９から転記された情報であり、所定部位に関する情報である。「depth T」は、デプス情報Ｔであり、「depth N」は、デプス情報Ｎである。表７の例では、デプス情報Ｔ及びデプス情報Ｎは、それぞれ、3箇所の所定部位のデプスの平均値が記載されているが、これに限定されない。例えば、デプス情報Ｔ及びデプス情報Ｎは、それぞれ、複数個所の所定部位の最大値、中間値、又は最小値などであってもよい。デプス情報Ｔ及びデプス情報Ｎは、それぞれ、所定部位ごとのデプス情報Ｔ及びデプス情報Ｎであってもよい。「変異の検出結果」は、各所定部位について、ステップＳ３３又はＳ３５の処理により生殖細胞変異又は体細胞変異と判定されたか否かを示す情報である。例えば、表７の２番目の所定部位には変異が存在することが示され、３番目及び４番目の所定部位には変異が存在しないことが示される。「変異の検出結果」は、品質情報テーブルに含まれる所定部位における変異が、測定結果テーブルに含まれているか否かで判定することができる。表７に示すように、品質情報テーブルには、所定部位にける変異の検出結果がＹＥＳであるかＮＯであるかに関わらず、すなわち、所定部位における変異の存否に関わらず、デプス情報Ｔ及びデプス情報Ｎが含まれている。デプス情報Ｔ及びデプス情報Ｎは、所定部位に対する核酸解析の品質に関する情報の一例である。なお、「変異の検出結果」は、品質情報テーブルから省略してもよい。

【0089】

【表7】

【0090】

所定部位に対する核酸解析の品質に関する情報としては、例えば、以下の(1)～(4)に記載の情報などが挙げられる。

【0091】

(1) 第２のリードの数及び／又は長さに関する情報、
(2) 第２のリードの各塩基に付与される、シーケンサーの塩基配列の読み取りの精度に関する情報、
(3) 第１のリードを参照配列にマッピングするアライメントにおいて、第２のリードの各塩基に付与される、マッピングの精度に関する情報、及び
(4) 上記の(1)～(3)の少なくとも１つに記載の情報に基づいて品質を判定した結果。

【0092】

(1)に記載の情報のうち、第２のリードの数に関する情報は、例えば、所定部位のデプス情報である。デプス情報については、上記のとおりである。第２のリードの長さに関する情報は、例えば、第２のリードの長さの平均値、最頻値、中央値、最小値、最大値などである。

【0093】

(2)に記載の情報は、例えば、第２のリードの各塩基に付与される、ベースコールの正確さを示す指標値である。そのような指標値としては、例えば上記のクオリティスコアが挙げられる。第２のリードの各塩基に付与されたクオリティスコアは、そのまま、(2)に記載の情報として用いられてもよい。あるいは、第２のリードの各塩基に付与されたクオリティスコアの統計的代表値(各クオリティスコアの平均値、最頻値、中央値、最小値、最大値など)が、(2)に記載の情報として用いられてもよい。

【0094】

(3)に記載の情報は、例えば、第２のリードに付与される、マッピングの正確さを示す指標値である。そのような指標値としては、例えば上記のマッピングクオリティスコアが挙げられる。(1)～(3)に記載の情報は、一塩基又は当該一塩基及び近傍からなる所定部位に対応する短い領域に対する核酸解析の品質を示す。したがって、例えば、(1)に記載のデプス情報は、１つの遺伝子の全長に対するデプスの統計的代表値と比較して、所定部位における核酸解析の品質をより高い精度で示す。

【0095】

(4)に記載の判定は、例えば、上記(1)～(3)に記載の情報から選択されるいずれかの値と、閾値とを比較することにより行ってもよい。例えば、所定部位のデプスが、対応する閾値以上であるとき、核酸解析の品質は良好であると判定してもよい。また、所定部位のデプスが、対応する閾値未満であるとき、核酸解析の品質は良好ではないと判定してもよい。判定結果は、記号、数字、文字などで表示してもよい。例えば、核酸解析の品質は良好であると判定されたときは、判定結果の欄にチェックマークを表示し、核酸解析の品質は良好でないと判定されたときは、判定結果を空欄としてもよい。

【0096】

図４を参照して、ステップＳ２４において、制御部１０１は、ステップＳ２２で取得した変異の検出結果と、ステップＳ２３で取得した所定部位に対する核酸解析の品質に関する情報と、を含む検査結果レポートを出力部１０４に出力する。制御部１０１は、検査結果レポートを、ネットワーク４００を介してデータ送受信装置４０に出力してもよい。

【0097】

図９は、検査結果レポートの例を示す。検査結果レポートＲは、検査依頼情報が記載される領域Ｒ１と、変異の検出結果が記載される領域Ｒ２と、所定部位に対する核酸解析の品質に関する情報が記載される領域Ｒ３と、を含む。領域Ｒ１には、依頼元施設から送信された依頼情報が記載され、例えば、検査依頼ＩＤ、被検者の情報などが記載される。領域Ｒ２には、ステップＳ２２で取得し、記憶部１０５の測定結果テーブルに記憶された変異の検出結果が記載される。領域Ｒ３には、ステップＳ２３で取得し、記憶部１０５の品質情報テーブルに記憶された所定部位に対する核酸解析の品質に関する情報が記載される。図９の例では、領域Ｒ３には、さらに、核酸解析の品質を判定した結果が記載されている。図９の表中、「判定結果T」は、Depth Tの値と閾値とに基づいて、核酸解析の品質を判定した結果を示し、「判定結果N」は、Depth Nの値と閾値とに基づいて、核酸解析の品質を判定した結果を示す。

【0098】

図９に示すように、情報処理装置１０から出力される検査結果レポートの領域Ｒ３には、所定部位における変異の存否にかかわらず、核酸解析の品質に関する情報が記載される。これにより、依頼元施設２００及び／又は依頼先施設３００の担当者は、被検者の核酸の解析対象領域において、所定部位に変異が検出されなかった場合でも、その所定部位についての核酸の品質を確認できる。例えば、領域Ｒ３の２番目の所定部位(染色体２番の29,432,664位)について、変異の検出結果は「NO」であり、Depth Tの判定結果Tの欄にチェックマークが表示されている。これは、この検査では当該所定部位に変異が検出されず、且つその結果が十分な品質の解析に基づくことを示唆する。すなわち、変異の検出結果が真の陰性であることを示唆する。また、領域Ｒ３の３番目の所定部位(染色体２番の29,432,682位)について、変異の検出結果は「NO」であり、Depth Tの判定結果Tは空欄となっている。これは、この検査では当該所定部位に変異が検出されなかったものの、この被検者の核酸には、実際には変異が存在する疑いがあることを示唆する。すなわち、変異の検出結果が偽陰性であることが疑われる。この場合、再度、遺伝子パネル検査を実施したり、この所定部位に対応する遺伝子マーカーに絞った別の検査を実施したりするなど、医療関係者が取るべき次のアクションを具体的に検討することが可能となる。再検査において変異が検出された場合には、適切な診断又は治療へと導くことが可能となる。

【0099】

なお、本実施形態において、変異の検出結果と、所定部位に対する核酸解析の品質に関する情報と、は同じレポート内に記載されたが、変異の検出結果と、所定部位に対する核酸解析の品質に関する情報と、を別々のレポートとして生成してもよい。例えば、変異の検出結果をレポートするための解析結果レポートと、所定部位に対する核酸解析の品質に関する情報をレポートするための品質管理レポートと、を別々に生成してもよい。

【0100】

なお、検査結果レポートは、他の品質情報をさらに含んでもよい。他の品質情報とは、従来のゲノム医療の検査で提供されていた品質情報であり、例えば、解析対象領域の全体の核酸配列データに基づき取得される品質情報が挙げられる。

【0101】

他の品質情報としては、例えば、取得されたリードの総数、マッピング率、重複率、均質性、解析対象領域のデプスの統計的代表値、解析対象領域のデプス頻度の度数分布、リードの平均クオリティスコアの度数分布、リードの長さの度数分布などが挙げられる。「マッピング率」は、総リードのうち、解析対象領域にマッピングされたリード数の割合をいう。「重複率」は、解析対象領域にマッピングされたリードのうち、同じ増幅領域に由来するリード数の割合をいう。「均質性」は、解析対象領域のうち、マッピングされたリード数が所定の値以上となる領域の割合をいう。「デプス頻度の度数分布」は、解析対象領域内の各塩基にマッピングされたリードの数を集計し、塩基の位置及びその塩基に対するデプスを二軸とするヒストグラムをいう。「リードの平均クオリティスコアの度数分布」は、各リードのクオリティスコアの平均値及びその平均値を示すリードの数を二軸とするヒストグラムをいう。「リードの長さの度数分布」は、リードの長さ(塩基数)及びその長さを有するリードの数を二軸とするヒストグラムをいう。

【0102】

検査結果レポートは、ステップＳ２２において検出された変異に、品質情報テーブルに記載されていない部位において検出された変異がある場合、当該部位に対する核酸解析の品質に関する情報（例えば、デプス情報）をさらに含んでもよい。

【0103】

図４を参照して、ステップＳ２５において、制御部１０１は、検査結果レポートを記憶部１０５のレポートテーブルに記憶する。

【0104】

(ユーザーによる所定部位の決定)
さらなる実施形態では、ユーザーが所定部位を決定できる。ユーザーは、検査の依頼先施設３００における情報処理装置１０のユーザーであってもよい。情報処理装置１０のユーザーは、例えば、依頼先施設３００の検査担当者であり得る。この実施形態では、ユーザーが入力した情報に基づいて、所定部位が決定される。以下、情報処理装置１０のユーザーにより所定部位を決定し、リードを解析する例について、図１０を参照して説明する。本実施形態において、記憶部１０５の品質指標テーブル１０９には、例えば、表４～６に示した各品質指標テーブルを統合した品質指標テーブルが記憶される。ステップＳ５１において、制御部１０１は、ユーザーが入力部１０３を操作して入力した情報に基づいて、品質指標テーブル１０９を参照し、所定部位を選択する。ユーザーによる情報の入力は、ディスプレイ又はタッチパネルのような出力部１０４に表示される画面を介して行ってもよい。ステップＳ５２～Ｓ５６についての詳細は、図４のステップＳ２１～Ｓ２５について述べたことと同様である。なお、ユーザーは特に限定されない。例えば、ユーザーは、検査の依頼元施設２００におけるデータ送受信装置４０のユーザーであってもよい。データ送受信装置４０のユーザーは、例えば、被検者を担当する医師などの医療関係者であり得る。所定部位の決定のために入力する操作は、いずれの施設のユーザーであっても同じである。ユーザーが、データ送受信装置４０のユーザーである場合、ステップＳ５１において、制御部１０１は、ユーザーがデータ送受信装置４０に表示された画面を介して入力した情報を、ネットワーク４００を介して受信する。

【0105】

図１１Ａを参照して、画面Ｄ１においてカテゴリー情報を入力して、所定部位を選択する例について説明する。画面Ｄ１のＤ１１において、カテゴリー情報として、バイオマーカーの属性情報が選択可能に表示される。カテゴリー情報の入力は、例えば、プルダウンメニューからバイオマーカーの属性情報を選択することにより行われる。Ｄ１１にカテゴリー情報が入力されると、制御部１０１は、そのカテゴリー情報に応じた所定部位に関する情報を記憶部１０５から読み出す。そして、Ｄ１２に、読み出された所定部位に関する情報が表示される。ユーザーがＤ１２に表示された１又は複数の所定部位をクリック等により選択し、Ｄ１３の設定ボタンをクリックすることにより、選択された所定部位の情報が記憶部１０５に記憶される。ユーザーが、依頼元施設２００のデータ送受信装置４０のユーザーである場合は、選択された所定部位の情報が依頼情報と共に、ネットワーク４００を介して情報処理装置１０に送信される。

【0106】

図１１Ｂを参照して、画面Ｄ２においてカテゴリー情報とサブカテゴリー情報とを入力して、所定部位を選択する例について説明する。画面Ｄ２のＤ２１では、カテゴリー情報として、CDxマーカーが選択されている。この場合、Ｄ２２において、サブカテゴリー情報として、例えばCDxマーカーが承認された国・地域の情報が選択可能に表示される。カテゴリー情報及びサブカテゴリー情報が入力されると、制御部１０１は、それらの情報に応じた所定部位に関する情報を記憶部１０５から読み出し、Ｄ２３に、読み出された所定部位に関する情報が表示される。ユーザーが、Ｄ２３に表示された１又は複数の所定部位をクリック等により選択し、Ｄ２４の設定ボタンをクリックすることにより、選択された所定部位の情報が記憶部１０５に記憶される。これにより、解析対象領域から、所定の国・地域において承認されたCDxマーカーを、所定部位として設定することができる。サブカテゴリー情報は、国・地域以外に、CDx検査の適用対象の疾患名や治療薬名などであってもよい。

【0107】

カテゴリー情報は、バイオマーカーの属性情報以外であってもよい。図１１Ｃを参照して、画面Ｄ３のＤ３１において、カテゴリー情報として、バイオマーカーの属性情報だけでなく、疾患情報、薬剤情報などが選択可能に表示される。画面Ｄ３のＤ３１では、カテゴリー情報として、エビデンスレベルが選択されている。この場合、Ｄ３２において、サブカテゴリー情報として、エビデンスレベルの分類(例えばLv A、Lv B及びLv Cなど)が選択可能に表示される。カテゴリー情報及びサブカテゴリー情報が入力されると、制御部１０１は、それらの情報に応じた所定部位に関する情報を記憶部１０５から読み出し、Ｄ３３に、読み出された所定部位に関する情報が表示される。ユーザーが、Ｄ３３に表示された１又は複数の所定部位をクリック等により選択し、Ｄ３４の設定ボタンをクリックすることにより、選択された所定部位の情報が記憶部１０５に記憶される。

【0108】

ユーザーが、解析対象領域の中から任意の領域を入力することで、所定部位を決定してもよい。図１１Ｄを参照して、画面Ｄ４のＤ４１において、カテゴリー情報として「任意選択」を選択する。この場合、Ｄ４２において、染色体番号(Chr)、ゲノム配列上の塩基番号(Pos_Start及びPos_End)などの位置情報を入力するためのテキストボックスが表示される。ユーザーは、解析対象領域の塩基配列中から、所定部位として、所望の一塩基又は複数塩基の位置情報をテキストボックスに入力する。位置情報の入力後、ユーザーがＤ４３の設定ボタンをクリックすることにより、入力された所定部位の情報が記憶部１０５に記憶される。

【0109】

(マッチドペア検査なしの体細胞変異の検出)
図４のステップＳ２２のさらなる実施形態として、マッチドペア検査なしで、変異を検出する処理のフローについて説明する。この場合、非腫瘍検体は使用されず、腫瘍検体から調製されるライブラリー試料から取得したリードを腫瘍配列データとして用いる。図１２を参照して、ステップＳ６１において、制御部１０１は、参照配列データベース１０６から参照配列を読み出し、腫瘍配列データと、参照配列とのアライメントを実行する。ステップＳ６２において、制御部１０１は、腫瘍配列データにおいて、参照配列と一致しない部位があるか否かを判定する。制御部１０１が、腫瘍配列データが参照配列と一致しないと判定したとき、プロセスはステップＳ６３へ進む。図１２の処理では、参照配列と一致しない部位がある場合、当該部位は、腫瘍組織の遺伝子に認められる変異であると判定する。ステップＳ６２において、腫瘍配列データが参照配列と一致する場合、制御部１０１は、処理を終了する。この場合、腫瘍配列データには変異がないと考えられる。

【0110】

ステップＳ６３において、制御部１０１は、検出された変異に基づいて、変異情報データベース１０７を検索する。ステップＳ６４において、制御部１０１は、検索結果に基づき、検出された変異にアノテーションを付与する。ステップＳ６３及びＳ６４の詳細は、図５のステップＳ３７及びＳ３８について述べたことと同様である。ステップＳ６１～Ｓ６４の処理により、制御部１０１は、ステップＳ２２において、変異の検出結果として、解析対象領域における遺伝子変異の情報を得る。

【0111】

図４のステップＳ２３のさらなる実施形態として、腫瘍配列データに基づいて、所定部位のデプス情報Ｔを取得する処理のフローについて説明する。図１３を参照して、ステップＳ７１において、制御部１０１は、ステップＳ６１で取得した腫瘍配列データと参照配列とのアライメント結果を読み出す。ステップＳ７２において、制御部１０１は、腫瘍配列データと参照配列のアライメントの結果を参照し、解析対象領域の所定部位に対応する第１リードである第２のリードの数に基づき、デプス情報Ｔを取得する。デプス情報Ｔとしては、所定部位の各塩基についてのデプスが好ましい。ステップＳ７３において、制御部１０１は、所定部位におけるデプス情報Ｔを記憶部１０５に記憶する。そして、制御部１０１は、所定部位のデプス情報を取得する処理を終了し、プロセスは、図４のステップＳ２４へ進行する。

【符号の説明】

【0112】

１０情報処理装置
２０ストレージ
３０シーケンサー
４０データ送受信装置
１００核酸解析システム
１１０解析結果データベース
２００依頼元施設
３００依頼先施設
４００ネットワーク

【図1】