【実施例】
【0032】
次に実施例を示して本発明を更に詳細に説明するが、本発明は以下の実施例に限定されるものではない。
【0033】
[方法及び材料]
(細胞株)
発明者らが樹立したハイブリドーマ細胞株(クローンHD1、HD2、HD3及びHD4)を実験に用いた。各ハイブリドーマは、10%ウシ胎児血清(FBS)、1.2%ペニシリン−ストレプトマイシン−グルタミン(ギブコ社)、1ng/mL インターロイキン(IL)−6を添加したハイブリドーマ無血清培地(ギブコ社)、又は、1ng/mL IL−6を添加したGIT培地(和光純薬)を使用して培養した。
【0034】
(mRNA−seq)
各ハイブリドーマ細胞株から、市販のキット(型式「AllPrep DNA/RNA Mini Kit」、キアゲン社)を使用して全RNAを調製した。1μgの全RNAを使用し、市販のキット(型式「NEBNext Ultra Directional RNA Library Prep Kit」、ニュー・イングランド・バイオラボ社)を用いてライブラリーを作製した。なお、このキットは、使用する全RNAを約0.1μgにまで減らしてライブラリーを作製することができる。
【0035】
続いて、次世代シーケンサー(型式「HiSeq1500」、イルミナ社)を用いて、平均リード長50bpでペアードエンドシーケンシングによりmRNA−seqを行った。各ハイブリドーマ細胞株につき、それぞれ40×10
6リード以上のリード数の塩基配列データが得られた。
【0036】
(mRNA−seqデータ解析)
取得されたリードは、発明者らのカスタムトランスクリプトーム参照配列に対してマッピングした。カスタムトランスクリプトーム参照配列は、マウストランスクリプト、ラットトランスクリプト、ラットイムノグロブリン重鎖(Igh)定常領域、イムノグロブリンλ軽鎖(Igl)定常領域及びイムノグロブリンκ軽鎖(Igk)定常領域の塩基配列を含んでいた。
【0037】
マッピングプログラムであるBWA−MEMを使用し、−t 8 −P −L 10000のパラメータでリードをマッピングした。TIGAR2プログラムはデフォルト設定で使用した。各遺伝子の発現レベルはFPKM(fragments per kilobase of exon per million mapped fragments)で定量した。
【0038】
(デノボ・トランスクリプトーム・アセンブリ)
全リード又は「fastq−sample」プログラム(http://homes.cs.washington.edu/~dcjones/fastq-tools)によりサブサンプリングしたリードを、「Trinity」プログラムを用いてデノボ・アセンブリした。CPU及びmax−memoryパラメータはリード数に応じて変更した。例えば、40×10
6リードの場合、CPUパラメータは8、max−memoryパラメータは52Gに設定した。また、例えば、1×10
6リードの場合、CPUパラメータは2、max−memoryパラメータは12Gに設定した。
【0039】
Igh及びIgl/Igkをコードした塩基配列(CDS)は、フィルタリング処理により、コンティグ(アセンブルした塩基配列)が、20〜30bpのIgh又はIgl/Igkの定常領域に特徴的な塩基配列を含んでおり、かつ適切な長さ(Ighの場合1200bp超、Igl/Igkの場合600bp超)を有していた場合に抽出した。
【0040】
(RT−PCR)
各ハイブリドーマのRNAをフェノール/クロロホルム抽出により精製した。市販のキット(型式「PrimeScript(商標)II 1st strand cDNA Synthesis Kit」、タカラバイオ社)を用いて逆転写反応を行った。酵素(型式「KOD Plus」、東洋紡社)及びサーマルサイクラーを用いてPCRを行った。PCR産物はゲル抽出により精製し、非特異的な増幅産物を除去した。その後サンガー法により塩基配列を決定した。PCR使用したプライマーの塩基配列の配列番号を下記表1に示す。
【0041】
【表1】
【0042】
[実験例1]
(ハイブリドーマのmRNA−seq解析)
ラットBリンパ球とマウスミエローマ細胞株SP2との細胞融合により樹立したハイブリドーマ細胞株である、クローンHD1、HD2、HD3及びHD4のmRNA−seqをそれぞれ行った。平均リード長50bpでペアードエンドシーケンシングを行った。
【0043】
続いて、各トランスクリプトームの発現レベルをBWA−TIGAR2プログラムにより定量し、発現レベルに応じて並べた。
図1は、トランスクリプトームを発現レベルが高い順に並べたグラフである。
【0044】
その結果、全てのハイブリドーマクローンにおいて、Igh及びIgl/Igkをコードした塩基配列は、発現量が10,000FPKM超であり、最も発現レベルが高いトランスクリプトに順位づけられることが明らかとなった。
【0045】
この結果は、ハイブリドーマのmRNA−seqデータが、Igh及びIgl/Igkをコードした塩基配列を再構成するのに十分な数のリード数を有していることを示す。
【0046】
[実験例2]
(ラットハイブリドーマのIgh及びIgl/Igkの塩基配列のアセンブリ)
実験例1で得られたmRNA−seqデータのデノボ・トランスクリプトーム・アセンブリにより、Igh及びIgl/Igkの塩基配列の再構成を試みた。
【0047】
まず、Trinityプログラムを用いて、クローンHD1のmRNA−seqデータから完全長トランスクリプトームの再構成を行った。ここで、リードのフィルタリングは行わなかった。リード数は45,406,048リードであり、得られたコンティグ数は58,822個であった。
【0048】
続いて、Ighをコードする塩基配列をフィルタリングにより抽出した。フィルタリングでは、Ighの定常領域に特徴的な20〜30bpの塩基配列を有するコンティグを抽出した。フィルタリングに用いた塩基配列の配列番号を下記表2に示す。
【0049】
【表2】
【0050】
完全長のIgHは400残基以上のアミノ酸を有している。そこで、1,200bp以上の長さを有し、Ighg2bに特徴的な24bpの塩基配列を含むIghの塩基配列として1,395bpの塩基配列を特定した。同定されたIghの塩基配列は、サンガー法により塩基配列を決定したクローンHD1のIghの塩基配列と同一であった。
【0051】
図2(a)は、デノボ・トランスクリプトーム・アセンブリにより塩基配列を決定したクローンHD1のIghの塩基配列(配列番号28)及び推定されるアミノ酸配列(配列番号29)を示す図である。
図2(b)は、デノボ・トランスクリプトーム・アセンブリにより塩基配列を決定したクローンHD1のIgHタンパク質のアミノ酸配列と、既知のラットIgH(IgG2b)の定常領域のアミノ酸配列(アクセッション番号:AAA6078、配列番号30)とをアラインメントした図である。その結果、クローンHD1が産生するIgHのアミノ酸配列のうち第133〜464番目が、既知のラットIgHの定常領域のアミノ酸配列と一致することが明らかとなった。
【0052】
続いて、Igl/Igkをコードする塩基配列をフィルタリングにより抽出した。フィルタリングでは、Igl/Igkの定常領域に特徴的な20〜30bpの塩基配列を有するコンティグを抽出した。フィルタリングに用いた塩基配列の配列番号を下記表3に示す。
【0053】
【表3】
【0054】
完全長のIgKは200残基以上のアミノ酸を有している。そこで、600bp以上の長さを有し、Igkに特徴的な塩基配列を含むIgkの塩基配列として705bpの塩基配列を特定した。同定されたIgkの塩基配列は、サンガー法により塩基配列を決定したクローンHD1のIgkの塩基配列と同一であった。
【0055】
図3(a)は、デノボ・トランスクリプトーム・アセンブリにより塩基配列を決定したクローンHD1のIgkの塩基配列(配列番号31)及び推定されるアミノ酸配列(配列番号32)を示す図である。
図3(b)は、デノボ・トランスクリプトーム・アセンブリにより塩基配列を決定したクローンHD1のIgKタンパク質のアミノ酸配列と、既知のラットIgKの定常領域のアミノ酸配列(アクセッション番号:CAA24558、配列番号33)とをアラインメントした図である。その結果、クローンHD1が産生するIgKのアミノ酸配列のうち第129〜234番目が、既知のラットIgKの定常領域のアミノ酸配列と一致することが明らかとなった。
【0056】
発明者らは、同様に、クローンHD2(Ighg2a/Igk)、クローンHD3(Ighg2a/Igk)、クローンHD4(Ighg2a/Igk)が産生する抗体の遺伝子の塩基配列も同定した。
【0057】
また、クローンHD1〜HD4が産生する抗体のアイソタイプは、ELISAによるアイソタイピングアッセイの結果と一致することが確認された。以上の結果は、mRNA−seqデータのデノボ・アセンブリにより、Igh遺伝子及びIgl/Igk遺伝子の塩基配列を簡便かつ正確に決定できることを示す。
【0058】
[実験例3]
(マウスハイブリドーマのIgh及びIgl/Igkの塩基配列のアセンブリ)
実験例2と同様にして、マウスハイブリドーマであるクローン8A2及び13C7のIgh及びIgkの塩基配列を決定した。マウスIgh及びIgl/Igkのフィルタリングに用いた塩基配列の配列番号を下記表4に示す。
【0059】
【表4】
【0060】
その結果、縮重プライマーにコードされる領域を除いて、サンガー法により決定された、これらのモノクローナル抗体の塩基配列と一致することが確認された。この結果は、mRNA−seqデータのデノボ・アセンブリにより、Igh遺伝子及びIgl/Igk遺伝子の塩基配列を簡便かつ正確に決定できることを更に支持するものである。また、縮重プライマーを用いた方法では、縮重プライマーのミスハイブリダイゼーションにより、本来の塩基配列が失われてしまう場合があることが確認された。
【0061】
[実験例4]
(抗体遺伝子の塩基配列決定のためのデノボ・アセンブリ条件の最適化)
ハイブリドーマのmRNA−seqデータを用いてIgh及びIgl/Igk遺伝子の塩基配列を決定する条件の最適化を試みた。まず、抗体遺伝子の塩基配列の決定に必要なリード数を検討した。
【0062】
具体的には、クローンHD1〜4のmRNA−seqの全リードから、それぞれ、5×10
3リード、10×10
3リード、30×10
3リード、50×10
3リード、100×10
3リード、500×10
3リード、1000×10
3リードのリードをランダムにサブサンプリングした。
【0063】
続いて、これらのリードを用いてデノボ・アセンブリを25回繰り返し実施した。続いて、全リードを用いて同定したIgh及びIgl/Igkの塩基配列を正しい塩基配列であると定義し、完全な塩基配列を得ることができた成功率(再構成率)を算出した。
【0064】
図4(a)は、各リード数のリードからデノボ・アセンブリした場合のIghの再構成率を算出した結果を示すグラフである。その結果、4クローン全てにおいて、Ighの塩基配列は30×10
3リード超のリード数で完全に同定することができることが明らかとなった。また、
図4(b)は、各リード数のリードからデノボ・アセンブリした場合のIgkの再構成率を算出した結果を示すグラフである。その結果、4クローン全てにおいて、Igkの塩基配列は10×10
3リード超のリード数で完全に同定することができることが明らかとなった。
【0065】
この結果は、今回の手法により限られた数のリード数のmRNA−seqデータから抗体遺伝子の塩基配列を正確に特定することができることを示す。
図5は、今回の手法をまとめた図である。まず
図5(a)及び(b)に示すように、細胞からmRNAを抽出し、次世代シークエンシング(NGS)により塩基配列を決定する。続いて、
図5(c)に示すように、mRNA−seqにより得られたデータをデノボ・アセンブリしてコンティグを作成する。続いて、
図5(d)に示すように、特定の塩基配列を有するコンティグをフィルタリングして特定し、標的遺伝子の塩基配列を得る。
【0066】
[実験例5]
(他のハイブリドーマが産生する抗体の遺伝子の塩基配列の決定)
今回の塩基配列決定方法を、更に多数のハイブリドーマに適用し、抗体遺伝子の塩基配列を決定した。その結果、96種類以上のハイブリドーマについて、1サンプルあたり200×10
3リードでmRNA−seqを行い、抗体遺伝子の塩基配列を正確に決定することができた。