特許第6012633号(P6012633)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ シンプロミクス リミテッドの特許一覧

<>
  • 特許6012633-特異的プロモーターの構築のための方法 図000022
  • 特許6012633-特異的プロモーターの構築のための方法 図000023
  • 特許6012633-特異的プロモーターの構築のための方法 図000024
  • 特許6012633-特異的プロモーターの構築のための方法 図000025
  • 特許6012633-特異的プロモーターの構築のための方法 図000026
  • 特許6012633-特異的プロモーターの構築のための方法 図000027
  • 特許6012633-特異的プロモーターの構築のための方法 図000028
  • 特許6012633-特異的プロモーターの構築のための方法 図000029
  • 特許6012633-特異的プロモーターの構築のための方法 図000030
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6012633
(24)【登録日】2016年9月30日
(45)【発行日】2016年10月25日
(54)【発明の名称】特異的プロモーターの構築のための方法
(51)【国際特許分類】
   C12N 15/09 20060101AFI20161011BHJP
   C12Q 1/68 20060101ALI20161011BHJP
   C12N 1/15 20060101ALI20161011BHJP
   C12N 1/19 20060101ALI20161011BHJP
   C12N 1/21 20060101ALI20161011BHJP
   C12N 5/10 20060101ALI20161011BHJP
   C12Q 1/02 20060101ALI20161011BHJP
【FI】
   C12N15/00 AZNA
   C12Q1/68 A
   C12N1/15
   C12N1/19
   C12N1/21
   C12N5/10
   C12Q1/02
【請求項の数】25
【全頁数】67
(21)【出願番号】特願2013-550875(P2013-550875)
(86)(22)【出願日】2012年1月25日
(65)【公表番号】特表2014-506456(P2014-506456A)
(43)【公表日】2014年3月17日
(86)【国際出願番号】EP2012051174
(87)【国際公開番号】WO2012101191
(87)【国際公開日】20120802
【審査請求日】2014年12月18日
(31)【優先権主張番号】11000572.5
(32)【優先日】2011年1月25日
(33)【優先権主張国】EP
(73)【特許権者】
【識別番号】513187036
【氏名又は名称】シンプロミクス リミテッド
(74)【代理人】
【識別番号】100092783
【弁理士】
【氏名又は名称】小林 浩
(74)【代理人】
【識別番号】100120134
【弁理士】
【氏名又は名称】大森 規雄
(74)【代理人】
【識別番号】100126354
【弁理士】
【氏名又は名称】藤田 尚
(74)【代理人】
【識別番号】100104282
【弁理士】
【氏名又は名称】鈴木 康仁
(72)【発明者】
【氏名】ロバーツ,ミッチェル エル.
【審査官】 福間 信子
(56)【参考文献】
【文献】 国際公開第2008/107725(WO,A1)
【文献】 特開2007−334769(JP,A)
【文献】 特表2008−516590(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/00−90
CAplus/MEDLINE/BIOSIS(STN)
JSTPlus/JMEDPlus/JST7580(JDreamIII)
(57)【特許請求の範囲】
【請求項1】
(a)複数の転写因子調節エレメント(TFRE)を提供する工程であって、前記複数のTFREの各々は複数の遺伝子の1つまたはそれ以上と関連(associated)しており、前記複数の遺伝子の各々は特定の細胞型もしくは組織型または特定の条件下で識別的に発現される、工程;および
(b)工程(a)で準備した前記複数のTFREの中からTFREを選択する工程であって、前記選択されたTFREの各々は、(1)工程(a)において規定した前記複数の遺伝子の50パーセントより多くの遺伝子において20キロベース以内に存在しており、(2)0.3より大きいSYN値を有し、ここで、TFREの前記SYN値は頻度(1/長さ)と定義され、式中、頻度は、複数の前記遺伝子のいずれかが20キロベース以内に存在している頻度であり、長さは、前記TFREのヌクレオチド長である、工程
を含む、プロモーターエレメントを選択するための方法。
【請求項2】
(a)複数の転写因子調節エレメント(TFRE)を同定する工程であって、前記複数のTFREの各々は複数の遺伝子の1つまたはそれ以上と関連しており、前記複数の遺伝子の各々は特定の細胞型もしくは組織型または特定の条件下で識別的に発現される、工程;
(b)工程(a)で準備した前記複数のTFREの中からTFREを選択する工程であって、前記選択されたTFREの各々は、(1)工程(a)において規定した前記複数の遺伝子の50パーセントより多くの遺伝子において20キロベース以内に存在しており、(2)0.3より大きいSYN値を有し、ここで、TFREの前記SYN値は頻度(1/長さ)と定義され、式中、頻度は、複数の前記遺伝子のいずれかが20キロベース以内に存在している頻度であり、長さは、前記TFREのヌクレオチド長である、工程;
(c)工程(b)で選択したTFREを無作為に結合することにより、ランダム組合せエレメントのライブラリーを構築する工程;および
(d)前記ライブラリーからの組合せエレメントを、最小限プロモーターとレポーター遺伝子を有するベクター内に挿入し、それにより、組合せプロモーターカセットを生成させる工程
を含む、転写促進組合せプロモーターカセットの作製方法。
【請求項3】
さらに、工程(e):前記ベクターを宿主細胞内に挿入する工程を含む、請求項2に記載の方法。
【請求項4】
工程(e)により複数の宿主細胞が生じ、さらに、工程(f):工程(e)で生じた宿主細胞を、前記レポーター遺伝子の発現の向上を示すものについてスクリーニングする工程を含む、請求項3に記載の方法。
【請求項5】
さらに、工程(e)で生じた前記宿主細胞内または工程(f)で選択された前記宿主細胞内の前記組合せプロモーターカセットを同定する工程を含む、請求項3または請求項4に記載の方法。
【請求項6】
工程(b)の選択された各TFREの前記SYN値が0.5より大きい、請求項1から5のいずれかに記載の方法。
【請求項7】
工程(b)の選択された各TFREの前記SYN値が、工程(a)で準備した前記複数のTFREの中で1番大きいSYN値と10番目に大きいSYN値との間の値を有する、請求項1から6のいずれかに記載の方法。
【請求項8】
工程(b)の前記選択されたTFREの各々が、工程(a)の前記複数の遺伝子の50パーセントより多くの遺伝子において10キロベースまたは5キロベース以内、好ましくは上流領域内に存在しており、前記頻度が、前記複数の遺伝子の50パーセントより多くの遺伝子において10キロベースまたは5キロベース以内、好ましくは上流領域内に存在している頻度である、請求項1から6のいずれかに記載の方法。
【請求項9】
工程(c)の選択されたランダム組合せTFREの前記ライブラリーが、少なくとも前記選択されたTFREをコードしている個々の二本鎖DNA配列エレメントを一緒に、ライゲーション反応条件下で混合することにより作製される、請求項2から8のいずれかに記載の方法。
【請求項10】
工程(d)の前記レポーター遺伝子がLacZまたはGFPである、請求項2から9のいずれかに記載の方法。
【請求項11】
前記複数の遺伝子の各々が特定の条件下で識別的に発現され、前記条件が疾患条件である、請求項1から10のいずれかに記載の方法。
【請求項12】
前記疾患条件ががんである、請求項11に記載の方法。
【請求項13】
前記複数の遺伝子の各々が特定の条件下で識別的に発現され、前記条件が特定の生物学的因子薬剤、化学薬剤または微生物病原体への曝露である、請求項1から10のいずれかに記載の方法。
【請求項14】
組合せプロモーターカセットを含むベクターであって、前記組合せプロモーターカセットはランダム組合せエレメント、最小限プロモーターおよびレポーター遺伝子を含み、前記エレメントの各々は、特定の細胞型もしくは組織型または特定の条件下で識別的に発現されると同定された複数の遺伝子の50パーセントより多くの遺伝子において20キロベース以内に存在しているTFREと90%より高い配列同一性を含み、0.3より大きいSYN値を有し(ここで、前記SYN値は頻度(1/長さ)と定義され、式中、頻度は、前記複数の遺伝子のいずれかの20キロベース以内のTFREの存在頻度であり、長さは、前記TFREのヌクレオチド長である)、
プラスミドであるか、ウイルスであるか、一過性発現されるか、または宿主細胞のゲノム内に組み込まれる、ベクター。
【請求項15】
(a)配列番号130〜191のうちの1つに示した単離された核酸もしくは配列番号130〜191のうちの1つの相補鎖;または
(b)配列番号130〜191もしくは配列番号130〜191のうちの1つの相補鎖のいずれかの配列と少なくとも90%配列同一性を有する単離された核酸;または
(c)ストリンジェント条件下で、配列番号130〜191のうちの1つに示したDNA配列もしくは配列番号130〜191のうちの1つの相補鎖と特異的にハイブリダイズし得る単離された核酸;または
(d)介在配列によって分断されている(a)〜(c)のいずれか1つに規定される単離された核酸
を含む、発現を駆動および/または調節するための単離されたプロモーター。
【請求項16】
最小プロモーターをさらに含む、請求項15に記載の単離されたプロモーター。
【請求項17】
前記プロモーターが、配列番号5〜66または配列番号5〜66の相補鎖のうちの1つに示した配列を有する、請求項16に記載の単離されたプロモーター。
【請求項18】
(a)請求項15〜17のうちの一項に規定した単離されたプロモーター;および
(b)前記単離されたプロモーターに作動可能に連結させた非相同核酸配列;および任意選択で
(c)3’転写ターミネーター
を含む遺伝子構築物。
【請求項19】
請求項14に記載のベクター、請求項15〜17のうちの一項に記載の単離されたプロモーター、または請求項18に記載の遺伝子構築物を含む宿主細胞。
【請求項20】
細胞内の核酸の発現を駆動および/または調節するための方法であって、
(a)前記核酸を、請求項15〜17のうちの一項に記載の単離されたプロモーターに作動可能に連結させる工程、および
(b)前記得られた遺伝子構築物を細胞内に導入する工程
を含む方法。
【請求項21】
作動可能に連結させた核酸の発現を駆動および/または調節するための請求項15〜17のうちの一項に記載のプロモーターの使用。
【請求項22】
複数の組合せプロモーターカセットが工程(d)において生成され、さらに、そのようにして生じた前記組合せプロモーターカセットのうちの1つまたはそれ以上を選択する工程を含み、ここで、前記選択された組合せプロモーターカセットの各々のプロモーター1つあたりのTFREの数は、工程(d)で生成された前記複数の組合せプロモーターカセットでのプロモーター1つあたりのTFREの平均数より大きい、請求項2から13のいずれかに記載の方法。
【請求項23】
複数の組合せプロモーターカセットが工程(d)において生成され、さらに、そのようにして生じた前記組合せプロモーターカセットのうちの1つまたはそれ以上を選択する工程を含み、ここで、前記選択された組合せプロモーターカセットの各々のプロモーター1つあたりのTFREの数は2個より多い、請求項2から13のいずれかに記載の方法。
【請求項24】
前記複数の遺伝子のいずれかの20キロベース以内のTFREの存在頻度が、前記複数の遺伝子のいずれかのセンス鎖における20キロベース以内のTFREの存在頻度である、請求項1から13のいずれかに記載の方法。
【請求項25】
前記複数の遺伝子のいずれかの20キロベース以内のTFREの存在頻度が、前記複数の遺伝子のいずれかのセンス鎖における20キロベース以内のTFREの存在頻度である、請求項14に記載のベクター。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、遺伝子の選択的発現のためのプロモーターを設計するためのシステムに関する。
【背景技術】
【0002】
がんは、細胞DNAの遺伝的および後成的改変の多工程プロセスにより生じ、最終的に細胞の形質転換およびその制御不能な成長、分裂および遊走がもたらされると考えられている複雑な生物学的現象である。細胞の形質転換を媒介する異常な分子経路を特定することは、どのようにして悪性腫瘍が発生するのかの理解において大きな課題となっている。
【0003】
機能ゲノミクスの出現により、科学者らに、遺伝子発現における包括的な変化を調べることの展望が示され、様々ながんにおけるより有効な診断手法および予後の確立が潜在的に補助され得る分子表現型が得られた。
【0004】
腫瘍の進行をもたらす分子事象を解明するためにマイクロアレイを使用することは、特に、マイクロアレイデータでは特定の時点での細胞のトランスクリプトームのスナップショットしか得られないため、より困難な作業であることが示された。多くのがんは多重に遺伝子改変を含むため、遺伝子発現プロフィールにおける特定の変化を形質転換された細胞のゲノムの特定の改変に帰属させることは困難である。
【0005】
しかしながら、過去数年間における進歩により、マイクロアレイデータは、特に比較ゲノムマイクロアレイ解析の出現に伴い、がんの研究において広範な適用を有し得ることが明らかになっている。この型の解析では、遺伝子発現データが染色体にマッピングされ得、特定の型のがんに多く見られ得る染色体異常(例えば、増幅または欠失)の潜在的部位が明らかになる。
【0006】
また、現在、研究者らは、マイクロアレイデータを、識別的に(differentially)調節される遺伝子リストの提示ではなく「遺伝子モジュール」に関して解析する傾向が高まりつつある。遺伝子を機能的に関連(related)しているモジュールに分類することにより、生物学的に(統計学的に有意ではないにしても)重要であり得る遺伝子発現における微妙な変化を特定すること、特定の応答を媒介する分子経路をより容易に解釈すること、および種々の腫瘍型の多くの異なるマイクロアレイ実験を、多くの臨床症状における共通点と相違点を明らかにするための取り組みにおいて比較することが可能である。
【0007】
したがって、我々は、包括的遺伝子発現試験の評価によって得られた大きなデータセットが、コンピュータによる方法の改善によってより充分に解釈され得る機能ゲノミクスという新時代に移行しつつある。がんの研究では、このような改善されたバイオインフォマティクスツールを、この悪性表現型を媒介する分子プロセスを解明するための取り組みにおいて、この複雑な疾患に適用し、最終的に改善された標的化治療薬が有効に設計され得るようにすることが重要である。
【発明の概要】
【0008】
中でも、本発明の目的は、特異的プロモーターの構築のための方法および組成物を提供することである。かかるプロモーターは、細胞、組織または条件の型、例えば、特定の疾患または環境条件、例えば、生物学的因子薬剤もしくは化学薬剤または微生物病原体の存在に特異的であり得る。好ましくは、これは組織特異的発現のためのプロモーターである。
【課題を解決するための手段】
【0009】
本発明は以下を提供する。
[1](a)複数の転写因子調節エレメント(TFRE)を提供する工程であって、前記複数のTFREの各々は複数の遺伝子の1つまたはそれ以上と関連(associated)しており、前記複数の遺伝子の各々は特定の細胞型もしくは組織型または特定の条件下で識別的に発現される、工程;および
(b)工程(a)で準備した前記複数のTFREの中からTFREを選択する工程であって、前記選択されたTFREの各々は、(1)工程(a)において規定した前記複数の遺伝子の50パーセントより多くの遺伝子において20キロベース以内に存在しており、(2)0.3より大きいSYN値を有し、ここで、TFREの前記SYN値は頻度(1/長さ)と定義され、式中、頻度は、複数の前記遺伝子のいずれかが20キロベース以内に存在している頻度であり、長さは、前記TFREのヌクレオチド長である、工程
を含む、プロモーターエレメントを選択するための方法。
[2](a)複数の転写因子調節エレメント(TFRE)を同定する工程であって、前記複数のTFREの各々は複数の遺伝子の1つまたはそれ以上と関連しており、前記複数の遺伝子の各々は特定の細胞型もしくは組織型または特定の条件下で識別的に発現される、工程;
(b)工程(a)で準備した前記複数のTFREの中からTFREを選択する工程であって、前記選択されたTFREの各々は、(1)工程(a)において規定した前記複数の遺伝子の50パーセントより多くの遺伝子において20キロベース以内に存在しており、(2)0.3より大きいSYN値を有し、ここで、TFREの前記SYN値は頻度(1/長さ)と定義され、式中、頻度は、複数の前記遺伝子のいずれかが20キロベース以内に存在している頻度であり、長さは、前記TFREのヌクレオチド長である、工程;
(c)工程(b)で選択したTFREを無作為に結合することにより、ランダム組合せエレメントのライブラリーを構築する工程;および
(d)前記ライブラリーからの組合せエレメントを、最小限プロモーターとレポーター遺伝子を有するベクター内に挿入し、それにより、組合せプロモーターカセットを生成させる工程
を含む、転写促進組合せプロモーターカセットの作製方法。
[3]さらに、工程(e):前記ベクターを宿主細胞内に挿入する工程を含む、上記[2]に記載の方法。
[4]工程(e)により複数の宿主細胞が生じ、さらに、工程(f):工程(e)で生じた宿主細胞を、前記レポーター遺伝子の発現の向上を示すものについてスクリーニングする工程を含む、上記[3]に記載の方法。
[5]さらに、工程(e)で生じた前記宿主細胞内または工程(f)で選択された前記宿主細胞内の前記組合せプロモーターカセットを同定する工程を含む、上記[3]または上記[4]に記載の方法。
[6]工程(b)の選択された各TFREの前記SYN値が0.5より大きい、上記[1]から[5]のいずれかに記載の方法。
[7]工程(b)の選択された各TFREの前記SYN値が、工程(a)で準備した前記複数のTFREの中で1番大きいSYN値と10番目に大きいSYN値との間の値を有する、上記[1]から[6]のいずれかに記載の方法。
[8]工程(b)の前記選択されたTFREの各々が、工程(a)の前記複数の遺伝子の50パーセントより多くの遺伝子において10キロベースまたは5キロベース以内、好ましくは上流領域内に存在しており、前記頻度が、前記複数の遺伝子の50パーセントより多くの遺伝子において10キロベースまたは5キロベース以内、好ましくは上流領域内に存在している頻度である、上記[1]から[6]のいずれかに記載の方法。
[9]工程(c)の選択されたランダム組合せTFREの前記ライブラリーが、少なくとも前記選択されたTFREをコードしている個々の二本鎖DNA配列エレメントを一緒に、ライゲーション反応条件下で混合することにより作製される、上記[2]から[8]のいずれかに記載の方法。
[10]工程(d)の前記レポーター遺伝子がLacZまたはGFPである、上記[2]から[9]のいずれかに記載の方法。
[11]前記複数の遺伝子の各々が特定の条件下で識別的に発現され、前記条件が疾患条件である、上記[1]から[10]のいずれかに記載の方法。
[12]前記疾患条件ががんである、上記[11]に記載の方法。
[13]前記複数の遺伝子の各々が特定の条件下で識別的に発現され、前記条件が特定の生物学的因子薬剤、化学薬剤または微生物病原体への曝露である、上記[1]から[10]のいずれかに記載の方法。
[14]組合せプロモーターカセットを含むベクターであって、前記組合せプロモーターカセットはランダム組合せエレメント、最小限プロモーターおよびレポーター遺伝子を含み、前記エレメントの各々は、特定の細胞型もしくは組織型または特定の条件下で識別的に発現されると同定された複数の遺伝子の50パーセントより多くの遺伝子において20キロベース以内に存在しているTFREと80%より高い配列同一性を含み、0.3より大きいSYN値を有し(ここで、前記SYN値は頻度(1/長さ)と定義され、式中、頻度は、前記複数の遺伝子のいずれかの20キロベース以内のTFREの存在頻度であり、長さは、前記TFREのヌクレオチド長である)、
プラスミドであるか、ウイルスであるか、一過性発現されるか、または宿主細胞のゲノム内に組み込まれる、ベクター。
[15](a)配列番号130〜191のうちの1つに示した単離された核酸もしくは配列番号130〜191のうちの1つの相補鎖;または
(b)配列番号130〜191もしくは配列番号130〜191のうちの1つの相補鎖のいずれかの配列と少なくとも90%配列同一性を有する単離された核酸;または
(c)ストリンジェント条件下で、配列番号130〜191のうちの1つに示したDNA配列もしくは配列番号130〜191のうちの1つの相補鎖と特異的にハイブリダイズし得る単離された核酸;または
(d)介在配列によって分断されている(a)〜(c)のいずれか1つに規定される単離された核酸
を含む、発現を駆動および/または調節するための単離されたプロモーター。
[16]最小プロモーターをさらに含む、上記[15]に記載の単離されたプロモーター。
[17]前記プロモーターが、配列番号5〜66または配列番号5〜66の相補鎖のうちの1つに示した配列を有する、上記[16]に記載の単離されたプロモーター。
[18](a)上記[15]〜[17]のうちの一項に規定した単離されたプロモーター;および
(b)前記単離されたプロモーターに作動可能に連結させた非相同核酸配列;および任意選択で
(c)3’転写ターミネーター
を含む遺伝子構築物。
[19]上記[14]に記載のベクター、上記[15]〜[17]のうちの一項に記載の単離されたプロモーター、または上記[18]に記載の遺伝子構築物を含む宿主細胞。
[20]細胞内の核酸の発現を駆動および/または調節するための方法であって、
(a)前記核酸を、上記[15]〜[17]のうちの一項に記載の単離されたプロモーターに作動可能に連結させる工程、および
(b)前記得られた遺伝子構築物を細胞内に導入する工程
を含む方法。
[21]作動可能に連結させた核酸の発現を駆動および/または調節するための上記[15]〜[17]のうちの一項に記載のプロモーターの使用。
[22]複数の組合せプロモーターカセットが工程(d)において生成され、さらに、そのようにして生じた前記組合せプロモーターカセットのうちの1つまたはそれ以上を選択する工程を含み、ここで、前記選択された組合せプロモーターカセットの各々のプロモーター1つあたりのTFREの数は、工程(d)で生成された前記複数の組合せプロモーターカセットでのプロモーター1つあたりのTFREの平均数より大きい、上記[2]から[13]のいずれかに記載の方法。
[23]複数の組合せプロモーターカセットが工程(d)において生成され、さらに、そのようにして生じた前記組合せプロモーターカセットのうちの1つまたはそれ以上を選択する工程を含み、ここで、前記選択された組合せプロモーターカセットの各々のプロモーター1つあたりのTFREの数は2個より多い、上記[2]から[13]のいずれかに記載の方法。
[24]前記複数の遺伝子のいずれかの20キロベース以内のTFREの存在頻度が、前記複数の遺伝子のいずれかのセンス鎖における20キロベース以内のTFREの存在頻度である、上記[1]から[13]のいずれかに記載の方法。
[25]前記複数の遺伝子のいずれかの20キロベース以内のTFREの存在頻度が、前記複数の遺伝子のいずれかのセンス鎖における20キロベース以内のTFREの存在頻度である、上記[14]に記載のベクター。

特定の実施形態では、この目的は、独立クレームにおいて特許請求している本発明によって達成される。特定の好都合な実施形態を従属クレームに記載しており、他の実施形態を本明細書において記載している。
【0010】
多項従属型の請求項が示されていない場合であっても、特許請求の範囲における特徴の妥当な組合せはすべて開示されているものとする。
【0011】
特定の態様では、本発明の目的は方法によって達成される。以下において、方法の個々の工程をより詳細に説明する。諸工程は、必ずしも、本文に示した順序で行なう必要はない。また、明示していないさらなる工程をその方法の一部としてもよい。
【0012】
プロモーターエレメントを選択するための方法、ならびに細胞−、組織−または条件特異的発現のためのプロモーターカセット、例えば、転写促進組合せ(combined)プロモーターカセットを選択および作製するための方法を提供する。かかる方法は、一般的に、転写因子調節エレメント(TFRE)、例えば、複数のTFREを同定または提供する工程を含む。複数のTFREの各々は、典型的には、複数の遺伝子の1つまたはそれ以上と関連(associated)している。複数の遺伝子の各々は、一般的に識別的に(differentially)発現される、例えば異常に発現される、例えば、特定の細胞型もしくは組織型または特定の条件下で、例えば、別の細胞型、組織型または条件、例えば、正常、対照もしくは標準細胞型もしくは組織または特定の条件の非存在下と比べて上方制御または下方制御される。
【0013】
中でも、細胞型および組織型は、真核生物の細胞、例えば、動物、植物、真菌および他の真核生物の細胞である。例えば、細胞型または組織型は、哺乳動物、酵母、昆虫、ウシ、ブタ、マウス、ウマ、イヌ、ネコ、鳥類、魚類、ヒツジ、昆虫、サルおよび/またはヒトに由来し得る。
【0014】
いくつかの態様では、細胞型または組織型は、大脳、小脳、副腎、卵巣、膵臓、副甲状腺、下垂体、精巣、甲状腺、乳房、脾臓、扁桃、胸腺、リンパ節、骨髄、肺、心筋、食道、胃、小腸、結腸、肝臓、唾液腺、腎臓、前立腺、血液由来の組織もしくは細胞または他の細胞型もしくは組織型である。
【0015】
いくつかの態様では、条件は疾患条件、例えば、がん、炎症性疾患、感染性疾患、遺伝的欠陥、または他の疾患である。がんは、大脳、小脳、副腎、卵巣、膵臓、副甲状腺、下垂体、精巣、甲状腺、乳房、脾臓、扁桃、胸腺、リンパ節、骨髄、肺、心筋、食道、胃、小腸、結腸、肝臓、唾液腺、腎臓、前立腺、血液または他の細胞型または組織型のがんであり得、多くのがんが挙げられ得る。例えば、いくつかの場合では、複数の遺伝子の各々は、いくつかの異なるがんにおいて異常に調節される、または識別的に発現される。
【0016】
いくつかの態様では、条件は遺伝的欠陥の存在下、例えば、遺伝子もしくはその一部分の非存在下、特定の遺伝子変異の存在下、または特定の遺伝経路の機能の非存在下、例えば、遺伝子操作した細胞内もしくは生物体内、または天然に存在している変異もしくは遺伝的欠陥の存在下である。
【0017】
他の場合では、条件は環境条件である。いくつかの場合では、環境条件は、特定の薬物、生物学的因子薬剤、化学薬剤または微生物病原体に対する曝露である。かかる薬剤としては、生物製剤、小分子、抗体および抗体断片、融合タンパク質、組換えタンパク質、核酸、サイトカイン、リガンドおよび/または特定の細胞培養物もしくは生物体(例えば、特定の疾患を有する被検体の組織もしくは液体物(例えば、血液もしくは他の体液))から誘導もしくは分泌される刺激物質が挙げられ得る。
【0018】
複数の遺伝子が特定の細胞型もしくは組織型において、または特定の条件の存在下で識別的に発現されることの判定は、周知の方法、例えば、本明細書に記載の機能ゲノミクスの適用、例えば、マイクロアレイまたは他の解析を用いて判定され得る。
【0019】
一態様において、TFREは、所与の遺伝子の20キロベース以内、10キロベース以内、5キロベース以内、または4、3、2もしくは1キロベース以内に存在している場合、遺伝子と関連(associated)しているといい;多くの場合、かかるTFREは遺伝子の上流領域内に存在している。いくつかの態様では、選択されるTFREの各々は、複数の遺伝子の50パーセントより多くの上流領域内に存在している。いくつかの実施形態では、TFREは、センス鎖に存在している場合のみ、またはアンチセンス鎖に存在している場合のみ、所与の遺伝子と関連しているとみなされる。一実施形態では、TFREは、センス鎖に存在している場合のみ、所与の遺伝子と関連しているとみなされる。特に指定のない限り、TFREは、センス鎖またはアンチセンス鎖に存在している場合、関連しているとみなされる。
【0020】
方法は、典型的には、さらに、複数のTFREの中から1つまたはそれ以上のTFREを選択することを含む。一態様において、選択されたTFREの各々は、複数の遺伝子の50パーセントより多くの遺伝子において近接近距離内、例えば、20キロベース以内、10キロベース以内、5キロベース以内、または4、3、2もしくは1キロベース以内に存在している。いくつかの態様では、各々は複数の遺伝子の50パーセントより多くの遺伝子において10キロベース以内または5キロベース以内、好ましくは上流領域内に存在している。いくつかの態様では、選択されたTFREの各々は、複数の遺伝子の50パーセントより多くの遺伝子において上流領域内に存在している。
【0021】
TFREの選択は、典型的には、さらに、TFREの頻度と長さならびにそれらの関係を基準にする。
【0022】
本明細書において定義される、TFREの頻度は、複数の遺伝子と関連して存在する頻度に関する。いくつかの場合では、頻度は、複数の遺伝子のいずれかと所与の近距離内である頻度、すなわち、複数の遺伝子のいずれかとかかる近距離内である所与のTFREの存在数を、複数の遺伝子のいずれかと近距離内であるTFREの総数で除算したものに関して示され得る。例えば、複数の遺伝子の20キロベース以内の所与のTFREの頻度は、遺伝子のいずれかの20キロベース以内のTFREの存在数を、複数の遺伝子のいずれかの20キロベース以内のすべてのTFREの存在数で除算したものとして規定され得る。
【0023】
いくつかの実施形態では、頻度は、TFREとセンス鎖またはアンチセンス鎖内の遺伝子との関連に関して示され;他の実施形態では、TFREとセンス鎖内の遺伝子との関連の頻度に関して示される。例えば、一部の実施形態では、頻度は、センス鎖内の複数の遺伝子の所与の近距離内、例えば20キロベース以内である所与のTFREの頻度であり;他の実施形態では、頻度は、センス鎖またはアンチセンス鎖内の複数の遺伝子の所与の近距離内、例えば20キロベース以内である所与のTFREの頻度である。特に指定のない限り、頻度は、センス鎖またはアンチセンス鎖のいずれかにおける存在を示す。
【0024】
長さは、所与のTFREのヌクレオチド長を示す。
【0025】
頻度と長さは、一般的に、TFREを選択するために下記式:
頻度(1/長さ)
に従って使用される。
【0026】
この式の値をSYN値と称する。TFREは、典型的にはそのSYN値に基づいて選択される。一部の実施形態では、選択されたTFREの各々は、SYN値(上記の式によって規定)を有する。少なくとも0.1、0.2またはそれより大きい、典型的には、少なくとも0.3、0.4、0.5、0.6、0.7もしくは0.8またはそれより大きい、例えば、または0.3、0.4、0.5、0.6、0.7または0.8あるいは約0.3、約0.4、約0.5、約0.6、約0.7、典型的には、少なくとも0.5または0.6あるいは約0.5または約0.6あるいはそれより大きい値である。他の実施形態では、SYN値を用いてTFREをランク付けし、最も高いSYN値を有するTFREを選択する。一部の態様では、選択されたTFREの各々は、複数のTFREの上位1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25または50位以内のSYN値を有する、典型的には、上位1、2、3、4、5、6、7、8、9または10位以内のSYN値を有するTFREである。
【0027】
いくつかの実施形態では、本発明の方法は、プロモーター−カセット、例えば、転写促進組合せプロモーターカセットを作製または設計することを含む。かかる実施形態では、その方法に、さらに、選択されたランダム組合せTFREまたはランダム組合せエレメントのライブラリーを構築することを含めてもよい。一態様において、ライブラリーは、少なくともその選択されたTFREをコードしている個々の二本鎖DNA配列エレメントをライゲーション反応条件下で一緒に混合することにより作製される。かかるライブラリーは、少なくとも選択された転写因子調節エレメント、好ましくは、選択された転写因子調節エレメントをコードしているDNA配列エレメントを含み得る各々のヌクレオチドをライゲーション条件下で一緒にし、無作為に一体にライゲートして二本鎖DNAオリゴヌクレオチドにすることによって作製してもよい。
【0028】
いくつかの例では、本発明の方法は、さらに、ライブラリーの組合せTFREまたはエレメントを、ベクターまたは多種類のベクター、例えば、最小限プロモーターと典型的にはレポーター遺伝子とを有するベクター内に挿入し、それにより、組合せプロモーターカセットを作製することを含む。いくつかの実施形態では、多種類のベクターが使用され、それにより複数の組合せプロモーターカセットを作製する。一態様において、レポーター遺伝子はLacZまたはGFPである。いくつかの例では、その方法は、さらに、そのベクターを宿主細胞内に挿入することを含む。
いくつかの態様において、ライブラリーおよび/または組合せプロモーターカセット内に存在させるエレメントは、選択されたTFREのうちの1つと少なくとも70、75、80.85、86、87、88、89、90、91、92、93、94、95、96、97、98、99もしくは100%またはそれ以上の同一性、好ましくは、選択されたTFREのうちの1つと100%の同一性を含む。いくつかの態様では、組合せプロモーターカセットは、配列番号:130〜191のうちの1つまたはその相補鎖と少なくとも70、75、80、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99または100%の同一性を含む。いくつかの態様では、配列番号:5〜66のうちの1つまたはその相補鎖と少なくとも70、75、80、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99または100%の同一性を含む。
【0029】
特定の例では、組合せプロモーターカセットまたはプロモーターは、配列番号:50、配列番号:113、配列番号:175または配列番号:237と少なくとも70、75、80、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99または100%の同一性を含む。特定の例では、組合せプロモーターカセットまたはプロモーターは、配列番号:24、配列番号:87、配列番号:149または配列番号:211と少なくとも70、75、80、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99または100%の同一性を含む。特定の例では、組合せプロモーターカセットまたはプロモーターは、配列番号:26、配列番号:89、配列番号:151または配列番号:213と少なくとも70、75、80、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99または100%の同一性を含む。特定の例では、組合せプロモーターカセットまたはプロモーターは、配列番号:59、配列番号:122、配列番号:184または配列番号:246と少なくとも70、75、80、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99または100%の同一性を含む。特定の例では、組合せプロモーターカセットまたはプロモーターは、配列番号:65、配列番号:128、配列番号:190または配列番号:252と少なくとも70、75、80、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99または100%の同一性を含む。
【0030】
ランダム組合せ配列エレメントを制限酵素を用いて切断し、レポーター遺伝子(これは、限定されないがGFPまたはLacZであり得る)の上流にクローニングしてもよく、プラスミドDNAまたはウイルスベクターのライブラリーを作製してもよい。ライブラリーは、限定されないが、レトロウイルスベクターまたはアデノウイルスベクターを用いて作製され得る。
【0031】
いくつかの例では、複数の宿主細胞を生成させる。かかる場合では、その方法にさらに、例えば、その方法により生じた宿主細胞を、レポーター遺伝子の発現の向上を示すものについてスクリーニングすることにより、その方法によって作製した組合せプロモーターカセットをスクリーニングすることを含めてもよい。典型的には、かかるプロモーターカセットを選択する。
【0032】
特定の態様では、本発明の方法は、さらに、組合せプロモーターカセットを、その方法によって生じた宿主細胞において、あるいは上記のスクリーニング工程によって選択された宿主細胞において同定することを含む。いくつかの態様では、その同定は、組合せプロモーターカセットまたはそのTFREの配列または配列の一部の決定を含む。
【0033】
いくつかの場合では、プロモーター1つあたりのTFREの数が多い合成のプロモーターおよびカセットが好都合である(例えば、より有効なプロモーターを作製することにより)。したがって、一実施形態において、本発明の方法によって複数の組合せプロモーターカセットを作製する場合、その方法は、さらに、そのようにして生じた組合せプロモーターカセットのうちの1つまたはそれ以上選択することを含む。一態様において、その選択された組合せプロモーターカセットの各々のプロモーター1つあたりのTFREの数は、その方法によって最初に作製された複数の組合せプロモーターカセットでのプロモーター1つあたりのTFREの平均数より大きい。別の例では、プロモーター1つあたりのTFREの数は、プロモーター1つあたり1、2、3、4、5、6、7、8個もしくはそれ以上より多いか、またはプロモーター1つあたり1、2、3、4、5、6、7、8個もしくはそれ以上であり、好ましくは、プロモーター1つあたり2、3、4、5、6、7もしくは8個またはそれ以上より多いか、あるいはプロモーター1つあたり2、3、4、5、6、7、8個またはそれ以上である。TFREは、プロモーターカセットのセンス鎖に存在させてもアンチセンス鎖に存在させてもよい。
【0034】
一実施形態では、レポーター遺伝子が続く最小限プロモーターの上流にクローニングしたランダムな配列の組合せのライブラリーを含むベクターDNAで標的細胞をトランスフェクトさせるか、または感染させ、FACS(蛍光標示式細胞分取)で分取し、高レベルのそのレポーター遺伝子を発現している細胞を選択する。次いで、分取した細胞を用いて、所望の高性能転写調節エレメントの組合せを含むベクターDNAを回収し、増幅させる。
【0035】
回収し、増幅させた分取した細胞からのベクターを、異なる型の宿主細胞において、さらに高い性能および/または活性を有する転写調節エレメントの組合せに対するさらなるラウンドのスクリーニングに使用してもよい。
【0036】
分取と選択の反復が終了したら、回収したDNAベクターを、その真のプロモーター活性について試験するために標的細胞において、さらに個々にスクリーニングしてもよい。
【0037】
また、対照として、細胞型特異的プロモーターが所望される場合、転写調節エレメントの組合せを含む選択されたベクターを非標的細胞において、非標的細胞において相当なプロモーター活性を有するベクターを除外する目的で試験してもよい。
【0038】
また、かかる方法によって作製される組合せプロモーターカセット、ならびにこれを含むベクター、ライブラリーおよび細胞ならびにその使用方法を提供する。いくつかの場合では、プロモーターカセットは、ランダム組合せTFRE、最小限プロモーター、およびレポーター遺伝子を含む。いくつかの実施形態において、組合せプロモーターカセット内のTFREの各々は、特定の細胞型もしくは組織型または特定の条件下で識別的に発現されると同定された複数の遺伝子の50パーセントより多くの遺伝子において20、10または5キロベース以内、好ましくは上流領域内に存在しており、0.3、0.2.0.1、0.4または0.5より大きいSYN値(ここで、SYN値は上記のとおりに規定される)を有する。ベクターは、プラスミド、ウイルス、一過性発現されるもの、または宿主細胞のゲノム内に組み込まれ得る。
【0039】
また、発現を駆動および/または調節するための単離されたプロモーターを提供する。いくつかの実施形態では、かかるプロモーターは、配列番号130〜191のうちの1つに示した単離された核酸または配列番号130〜191のうちの1つの相補鎖を含む。したがって、配列番号:130〜191またはそのアンチセンス配列(すなわち、相補鎖)のいずれかに示したヌクレオチド配列を含むプロモーターを提供する。他の実施形態では、配列番号130〜191のいずれかの配列と少なくとも70、75、80.85、86、87、88、89、90、91、92、93、94、95、96、97、98、99もしくは100%またはそれ以上の配列同一性、例えば、少なくとも90%の配列同一性を有する単離された核酸を含む。他の実施形態では、ストリンジェント条件下で、配列番号130〜191のうちの1つに示したDNA配列と特異的にハイブリダイズし得る単離された核酸を含む。他の実施形態では、かかるプロモーターは、介在配列あるいは発現を駆動および/または調節し得るかかる核酸配列の断片によってさらに分断されているような単離された核酸を含み得る。
【0040】
単離されたプロモーターに、さらなる最小プロモーター、例えばMuc−1最小プロモーターを含めてもよい。いくつかの実施形態では、かかるプロモーターは、配列番号5〜66のうちの1つに示した単離された核酸、または配列番号5〜66のうちの1つの相補鎖を含む。したがって、配列番号:5〜6のいずれかに示したヌクレオチド配列、またはそのアンチセンス配列(すなわち、相補鎖)を含むプロモーターを提供する。他の実施形態では、配列番号130〜191のいずれかの配列と少なくとも70、75、80.85、86、87、88、89、90、91、92、93、94、95、96、97、98、99もしくは100%またはそれ以上の配列同一性、例えば、少なくとも90%の配列同一性を有する単離された核酸を含む。他の実施形態では、ストリンジェント条件下で、配列番号5〜66のうちの1つに示したDNA配列と特異的にハイブリダイズし得る単離された核酸を含む。他の実施形態では、かかるプロモーターは、介在配列あるいは発現を駆動および/または調節し得るかかる核酸配列の断片によってさらに分断されているような単離された核酸を含み得る。
【0041】
また、かかる単離されたプロモーター、かかるプロモーターに作動可能に連結させた非相同核酸配列を含む遺伝子構築物を提供する。かかる構築物に、任意選択で3’転写ターミネーターを含めてもよい。
【0042】
また、いずれか1種類またはそれ以上のベクター、単離されたプロモーター、および/または上記の遺伝子構築物を含む宿主細胞を提供する。
【0043】
また、提供するプロモーター、構築物、ベクターおよび細胞を用いて発現を駆動および/または調節するための方法を提供する。一態様において、かかる方法は、細胞内の核酸の発現を駆動または調節することを含む。かかる方法は、かかる核酸を上記の、または記載の方法を用いて作製した単離されたプロモーターのいずれかに作動可能に連結させ、得られた遺伝子構築物を細胞内に導入することにより行なわれ得る。
【0044】
また、作動可能に連結させる核酸の発現を駆動および/または調節するための上記のプロモーターの使用を提供する。
【発明を実施するための形態】
【0045】
定義
本明細書で用いる場合、「転写調節エレメント」、「TRE」、「転写因子調節エレメント」、および「TFRE」は、転写調節因子によって認識されるヌクレオチド配列をいい、「シス作用配列」または「シス作用配列エレメント」または「シス作用領域」と同義であり、場合によっては「配列エレメント」と表現している。
【0046】
本明細書で用いる場合、「組合せ転写調節エレメント」は、1つより多くの転写調節エレメントを含む二本鎖DNA分子をいう。組合せ転写調節エレメントは、種々の二本鎖転写調節エレメントをランダム様式でライゲートすることにより作出され得る。任意選択で、組合せ配列エレメントにスペーサー領域を含めてもよく、スペーサーヌクレオチドの長さは、二本鎖DNA分子を、ランダムライゲーション反応に使用する前に経時的なエクソヌクレアーゼ消化に供することにより制御され得る。
【0047】
本明細書で用いる場合、「オリゴヌクレオチド」は、シス作用領域と、おそらく約25個またはそれ以下までの外来ヌクレオチドとを機能的に含む配列をいう。したがって、用語「オリゴヌクレオチド」に包含されるヌクレオチド数は固定され得ず、したがって、なんら特定のヌクレオチド数に限定されない。
【0048】
本明細書で用いる場合、「プロモーターカセット」または「合成プロモーターカセット」は、遺伝子の効率的な転写のための成分を含むDNAセグメントをいい、1つまたはそれ以上の転写調節エレメント、最小限プロモーター領域、5’非翻訳領域由来の配列またはイントロンを含み得る。
【0049】
本明細書で用いる場合、「最小限プロモーター領域」または「最小限プロモーター」は、単独では不活性であるが、他の転写調節エレメントと結合させると強力な転写を媒介し得る短いDNAセグメントをいう。最小限プロモーター配列は、種々の異なる供給源、例えば、原核生物および真核生物の遺伝子から誘導され得る。この例は、ドパミンβ−ヒドロキシラーゼ遺伝子の最小限プロモーターおよびサイトメガロウイルス(CMV)極初期遺伝子の最小限プロモーターである。
【0050】
本明細書で用いる場合、「組合せプロモーターカセット」または「合成組合せプロモーターカセット」は、組合せ転写調節エレメントを含むプロモーターカセットをいう。
【0051】
本明細書で用いる場合、「転写調節因子」は、シス作用領域に結合して遺伝子の発現を正または負のいずれかで調節する任意の因子(例えば、タンパク質)をいう。転写因子もしくはリプレッサまたはコアクチベータもしくはコリプレッサはすべて包含される。
【0052】
近年になされた機能ゲノミクスの進歩により、特定の遺伝子の転写の増大と直接関連し得る多くのさらなるシス調節エレメントの同定がもたらされた。実際、疾患細胞において活性な複雑な転写経路を解明するためにバイオインフォマティクスを使用することが可能なことは、実際に、複雑な病態(がんなど)における合成プロモーターを設計するために使用され得る好適なシスエレメントの選択プロセスを容易にすることに役立ち得る。
【0053】
がんでは、遺伝子発現プロフィールにおける変化は、多くの場合、成長、増殖および遊走を制御しているシグナル伝達経路の異常な活性化によって誘導される細胞の転写機構における改変の結果である。かかる変化により、正常細胞には見られない転写調節ネットワークの活性化がもたらされ、がん性細胞のみで活性となるはずである合成プロモーターを設計する機会が得られる。
【0054】
マイクロアレイ技術によって、予兆されているように本当に個々のがんまたはさらに患者に対するオーダーメード治療薬の設計がもたらされるのであれば、シグナル伝達と転写ネットワークの特定のために設計された機能ゲノミクス方法論を、有効な遺伝子療法ストラテジーが策定され得るようにがん特異的プロモーターの設計に適用することが重要である。
【0055】
マイクロアレイデータセットの解析のためのバイオインフォマティクスアルゴリズムの開発は、主に、異なる疾患および環境条件下で作動性の転写ネットワークを解明するために適用されている。今日まで、この型のアプローチを、このような特定の疾患または環境条件下のみで作動性の合成プロモーターを設計するために使用する取り組みはなかった。
【0056】
本明細書において、機能ゲノミクス実験、例えばマイクロアレイ解析から得られたデータを、広く利用可能なバイオインフォマティクスソフトウェアツール(これは、過剰発現されたシスプロモーターエレメントを見出す機能を果たす)を用いて、がん細胞においてのみ活性な合成プロモーターを設計するために解析する方法を記載する。これにより、後にがんの研究において使用され得るがん特異的プロモーターの設計において、またはヒト悪性腫瘍の安全で有効な遺伝子療法薬の設計において大きな前進飛躍が提示される。
【0057】
合理的なプロモーターの選択と設計
一態様において、提供する方法および組成物は、例えば、特定の環境条件において、例えば、疾患もしくは組織特異的様式で、または外部薬剤(化学的もしくは生物学的いずれか)の導入に応答して遺伝子発現を制御するための合成プロモーターの開発に、機能ゲノミクスを適用することに基づいている。いくつかの系(原核生物および真核生物のどちらも)における使用のための合成プロモーターを構築した。
【0058】
真核生物の系のための合成プロモーターを設計するための利用可能な方法は、充分に特性評価されたシス調節エレメント(50〜100ヌクレオチドの範囲)の自由裁量による選択を伴う。次いで、かかるエレメントを、ランダムライゲーションによって作出した合成プロモーターライブラリーに含め、対象の細胞型に含めるものを選択する(Li, X., Eastman, E. M., Schwartz, R. J., & Draghia-Akli, R. Synthetic muscle promoters:activities exceeding naturally occurring regulatory sequences. Nat. Biotechnol.17, 241-245(1999);Dai, C., McAninch, R. E., & Sutton, R. E. Identification of synthetic endothelial cell-specific promoters by use of a high-throughput screen. J. Virol.78, 6209-6221(2004))。
【0059】
一態様において、提供する方法および組成物は、機能ゲノミクスおよび先端バイオインフォマティクスアプローチをヒトゲノムの配列に適用し、合成プロモーターを合理的様式で設計する。一般的に、提供する方法では、転写因子調節エレメント(TFRE)、例えばシス調節エレメントを、自由裁量でない様式での合成プロモーターライブラリーへの組み入れに選択する。いくつかの態様において、本発明の方法では、包括的遺伝子発現解析による情報を使用し、特定の遺伝子発現プロフィールと関連しているTFRE(例えばシス調節エレメント)を同定して調節エレメントの重み付けおよびランク付け、ならびに改善された選択方法の開発を可能にする。
【0060】
したがって、本明細書において提供する方法は、合成プロモーターにおける使用のためのシスエレメントを自由裁量により選択する方法と比べて好都合である。いくつかの態様では、提供する方法により、利用可能な方法によって選択されるものと比べて短いシス調節エレメントを選択することが可能である。いくつかの態様では、提供する方法により、シスエレメントの選択対象である転写ネットワークに関与していることがこれまでに公知でないか、またはランダム選択アプローチの使用では選択され得ないであろうシスエレメントが同定される。いくつかの態様では、提供する方法では、利用可能な方法と比べてより短く、より複雑な合成プロモーターが生成される、および/またはより多くのシス調節エレメントが含まれる。
【0061】
真核生物における遺伝子発現の調節は非常に複雑であり、多くの場合、多種類の転写因子の協調作用によって起こる。遺伝子発現の制御においてトランス因子の組合せを使用すると、細胞が、相違する生物学的プロセスの調節において比較的少数の転写因子を使用することが可能になる。
【0062】
本明細書において論考しているように、TFRE、例えばシス調節エレメントを同定するためにマイクロアレイデータを利用するための提供する方法での使用に、いくつかのツールが利用可能である。また、この情報を、細胞内で異なる環境条件下で活性な転写ネットワークを解明するために使用することも可能である。酵母において、転写調節のコンビナトリアルな性質の重要性が、上方制御された遺伝子クラスターをシスエレメントの組合せの存在について具体的に調べることによって確立された。様々な条件に曝露した酵母のマイクロアレイデータを調べることにより、転写のネットワークを構築することが可能であり、異なる調節エレメント間の機能的関連性が示される。このアプローチにより、多くの相互作用を伴う枢要なモチーフの同定がもたらされ、一部の因子は、その機能においてその遺伝子特異的パートナーを補助する助長体タンパク質としての機能を果たしていることが示された。
【0063】
したがって、コア数の転写因子が、かかる莫大な数々の生物学的応答を、多種類の立体構成を採用することにより媒介している。一態様において、提供する方法では、この観察結果を使用し、多因子性疾患(例えば、がん)において不首尾となった転写プログラムを乗っ取り疾患特異的または条件特異的調節エレメントを開発する。例えば、がんでは、がんマイクロアレイデータの解釈方法は絶えず進化しており、そのため、現在では、形質転換された細胞での転写調節におけるより包括的な像が示され得る。
【0064】
がんデータセットのメタ解析によって遺伝子モジュールの同定が可能となり、複雑ながんのシグニチャーを少数の活性化転写プログラムに低減させること、さらにはほとんどの型のがんにおいて活性な共通プログラムの特定が可能となった。また、この型の解析により、脱調節が腫瘍発生に枢要な役割を果たしている特異的転写因子の同定が補助され得る。例えば、研究の一例において、がんにおける異常なE2F活性の重要性が、転写因子を特定の型のがんで上方制御されることがわかった標的遺伝子に関連付ける調節プログラムの検索の際に再確認された。(Rhodes, D. R. et al. Mining for regulatory programs in the cancer transcriptome. Nat. Genet.37, 579-583(2005))。E2F標的遺伝子は、調べた遺伝子発現プロフィール(多数の異なる型のがんから取得)の半数より多くにおいて不釣り合いに上方制御されていたことが示された。したがって、統合的なバイオインフォマティクス解析によりがん進行に関する新たな仮説が得られる可能性があることが示唆された。
【0065】
いくつかの態様において、本発明は、疾患特異的転写プログラムの解明により、対象の病態部位に限定された遺伝子発現を駆動するために遺伝子療法において使用され得る合成の条件付きプロモーターエレメントの構築が可能となるという知見に基づいている。統合的コンピュータによるアプローチを使用し、特定の疾患、特定の真核生物細胞型および/または特定の環境条件下(例えば、がん適応症)において活性な転写プログラムを同定する方法を提供する。
【0066】
かかる方法は、特定の疾患、細胞型、組織型および/または1つもしくはそれ以上の環境条件において遺伝子発現を駆動するための、例えば、治療アプローチにおける使用のための合成プロモーターエレメントの設計に有用である。
【0067】
一例において、高度に細胞傷害性の遺伝子を駆動する合成プロモーターエレメントの合理的な設計のための方法、およびこれを使用する抗がん治療アプローチを提供する。一態様では、実験手法によって得たか、または公衆に利用可能なリソース(Oncomineなど)から取得したマイクロアレイデータは、がん幹細胞で上方制御されることがわかっている遺伝子クラスターにおいて過剰発現される調節配列を同定するために使用され得る。
【0068】
バイオインフォマティクスツール
種々のバイオインフォマティクスツール(その例を表1に示す)が、TFRE、例えばシス調節エレメントのスクリーニングに使用され得る。一般に、かかるツールは、識別的に調節された遺伝子間の遺伝子発現プロフィールを比較し、ゲノム配列リソースによって利用可能な上流配列を調べることにより機能を果たす。系統発生的フットプリンティングツールでは、特定の遺伝子の非翻訳領域を種間で比較し、最も高度に保存された配列を戻し、潜在的シスエレメントであると提案する。利用可能なあらゆるアプローチの組合せが、特定の細胞型または組織型、例えばがん幹細胞のプロフィールに多く見られる調節配列を同定するために使用され得る。次いで、同定された最も共通している配列を、合成プロモーターの設計に使用する構成単位として使用する。
【0069】
典型的には、がん細胞で異常に調節される遺伝子の同定に使用されるデータは、マイクロアレイデータにより得られる。この方法では、特定の遺伝子の調節に関する詳細な情報がもたらされ得る。同定された遺伝子を、偽陽性についてスクリーニングすることがさらに必要であり得る(例えば、過剰発現は、染色体の増幅ではなく転写因子活性化の改変の結果であり得る)。
【0070】
対象の細胞または組織
本発明は、特定の態様において、対象の細胞型または組織型に対して行なわれるアッセイに関する。特に、提供する方法および組成物は、1種類またはそれ以上の疾患、状態、環境条件、細胞型、例えば、真核生物の細胞型、組織型、および/または特定の薬剤、例えば、生物学的因子薬剤、例えば、リガンド、化学薬剤もしくは微生物病原体に対する曝露後との関連における遺伝子発現と関連しているTFREに関する。
【0071】
細胞型としては、任意の型の細胞、または複数の細胞、例えば組織が挙げられ得る。提供する方法での使用のための細胞および組織としては、原核生物の細胞および組織、典型的には真核生物の細胞、細胞群および組織が挙げられる。好適な真核生物細胞は、生物体、例えば動物、例えば哺乳動物、好ましくはヒト、または別の真核生物の生物体、例えば植物から誘導され得る。かかる細胞または組織は、かかる生物体から直接採取したものであってもよく、その生物体から誘導されたものであってもよい。例えば、細胞または組織は、一次、二次または不死化細胞株に由来するものであってもよく、かかる生物体から誘導された培養物であってもよい。
【0072】
細胞または組織は天然に存在する細胞または組織であってもよく、人為的に操作されたものであってもよい。例えば、細胞または組織は、改変した環境条件または疾患特異的条件に対する曝露によって操作され得る。例えば、細胞または組織は、薬剤、例えば、生物学的リガンド、化学薬剤または微生物病原体に曝露することにより操作され得る。
【0073】
生物学的リガンドは、細胞に対して効果を、特に遺伝子の転写に対して効果を有し得る任意の生物学的分子であり得る。生物学的リガンドは、細胞に結合し得る、または細胞内で作用し得る分子であってもよい。生物学的リガンドは、例えば、ポリペプチド、タンパク質、核酸または糖質分子であり得る。好適な生物学的リガンドとしては、ホルモン、増殖因子および神経伝達物質が挙げられる。
【0074】
化学薬剤は、細胞に対して作用し、好ましくは、その細胞内での遺伝子の転写に変化をもたらし得る任意の薬剤であり得る。化学薬剤は、例えば、化学療法薬または治療用小分子薬物であり得る。
【0075】
微生物病原体は、哺乳動物に疾患を引き起こし得る任意のウイルス、細菌、真菌または他の感染性薬剤であり得る。
【0076】
細胞または組織は、異常な、または疾患供給源に由来するものであってもよい。例えば、細胞または組織は、疾患に苦しんでいる生物体から採取されたもの、またはその生物体から誘導され得る。好ましくは、細胞または組織は、疾患に侵された組織または器官に由来する。例えば、疾患ががんである場合、細胞または組織は腫瘍から採取され得る。細胞はインビトロ腫瘍細胞株に由来するもの、またはその細胞株から誘導されたものであってもよい。
【0077】
中でも、細胞型および組織型は真核生物細胞、例えば、動物、植物、真菌および他の真核生物細胞である。例えば、細胞型または組織型は、哺乳動物、酵母、昆虫、ウシ、ブタ、マウス、ウマ、イヌ、ネコ、鳥類、魚類、ヒツジ、昆虫、サルおよび/またはヒトに由来し得る。
【0078】
いくつかの態様では、細胞型または組織型は、大脳、小脳、副腎、卵巣、膵臓、副甲状腺、下垂体、精巣、甲状腺、乳房、脾臓、扁桃、胸腺、リンパ節、骨髄、肺、心筋、食道、胃、小腸、結腸、肝臓、唾液腺、腎臓、前立腺、血液由来の組織もしくは細胞または他の細胞型もしくは組織型である。
【0079】
いくつかの態様では、条件は疾患条件、例えば、がん、炎症性疾患、感染性疾患、遺伝的欠陥、または他の疾患である。がんは、大脳、小脳、副腎、卵巣、膵臓、副甲状腺、下垂体、精巣、甲状腺、乳房、脾臓、扁桃、胸腺、リンパ節、骨髄、肺、心筋、食道、胃、小腸、結腸、肝臓、唾液腺、腎臓、前立腺、血液または他の細胞型または組織型のがんであり得、多くのがんが挙げられ得る。例えば、いくつかの場合では、その複数の遺伝子の各々は、いくつかの異なるがんにおいて異常に調節される、または識別的に発現される。
【0080】
いくつかの態様では、条件は遺伝的欠陥の存在下、例えば、遺伝子もしくはその一部分の非存在下、特定の遺伝子変異の存在下、または特定の遺伝経路の機能の非存在下、例えば、遺伝子操作した細胞内もしくは生物体内、または天然に存在している変異もしくは遺伝的欠陥の存在下である。
【0081】
他の場合では、状態は環境条件である。いくつかの場合では、環境条件は、特定の薬物、生物学的因子薬剤、化学薬剤または微生物病原体に対する曝露である。かかる薬剤としては、生物製剤、小分子、抗体および抗体断片、融合タンパク質、組換えタンパク質、核酸、サイトカイン、リガンドおよび/または特定の細胞培養物もしくは生物体(例えば、特定の疾患を有する被検体の組織もしくは液体物(例えば、血液もしくは他の体液))から誘導もしくは分泌される刺激物質が挙げられ得る。
【0082】
転写因子調節エレメント
中でも、提供する方法は、対象の細胞、細胞、組織および/または疾患あるいは条件(例えば、環境条件もしくは疾患条件、特定の薬剤、例えば生物学的因子薬剤、例えばリガンド、化学薬剤もしくは微生物病原体に対する曝露)において活性な転写因子調節エレメント(TFRE)の同定を伴う。また、TFRE、およびプロモーターならびにこれらを含むライブラリーを提供する。
【0083】
提供する方法、組成物、プロモーターおよびライブラリーにおける使用または選択に適した転写因子調節エレメント(TFRE)は、転写因子によって認識される核酸分子である。例えば、TFREは、転写因子が結合し得る配列を含み得る。TFREはシス作用領域を含み得る。転写因子により、かかるシス作用領域に結合して遺伝子の発現を正または負のいずれかで調節することができる任意の因子(例えば、タンパク質)を意図する。例えば、転写因子は、遺伝子のコード配列の上流に結合し、RNAポリメラーゼの結合を補助または阻止することによりその遺伝子の転写の促進または抑制のいずれかを行ない得る。多くの転写因子が当分野で周知であり、STAT、E2F、Oct−4、Nanog、Brachury、Pax遺伝子、Sox2およびMCEFが挙げられる。
【0084】
TFREは、核酸配列、好ましくは二本鎖DNA配列を含む。TFREはシス作用領域を含み得、また、さらなる核酸を含んでいてもよい。プロモーターおよびエンハンサーエレメントのコアの6〜8個のヌクレオチドは、その対応するトランス作用因子の結合に充分であり得る。実際、いくつかの場合では、この短いオリゴヌクレオチドエレメントが単独で遺伝子発現を駆動するのに充分である。
【0085】
したがって、転写因子結合部位は6〜8個の核酸からなり得る。その部位を含むTFREは少なくとも6〜8核酸長である。いくつかの実施形態では、本発明のTFREは、好ましくは6またはそれ以上、8またはそれ以上、10またはそれ以上、15またはそれ以上、20またはそれ以上、25またはそれ以上、または30またはそれ以上の核酸長である。いくつかの態様では、提供する実施形態により、利用可能な合成プロモーターと比べて短い合成プロモーターを提供する。いくつかの実施形態では、TFREは100またはそれ以下、75またはそれ以下、50またはそれ以下、50未満、30またはそれ以下、25またはそれ以下、20またはそれ以下または15またはそれ以下の核酸長であり、好ましくは、示した上限値と下限値の任意の組合せ、好ましくは6〜100または6〜25個の核酸である。
【0086】
TFREの同定
好適なTFREは、対象の細胞もしくは組織において、または対象の条件下で活性なものである。かかるTFREは、対象の細胞または組織において発現される遺伝子と関連していると同定され得る。
【0087】
例えば、TFREは、細胞、組織または条件において、別の細胞、組織または条件と比較したとき識別的に発現される遺伝子と関連し得る。例えば、遺伝子の識別的発現は、その遺伝子の発現を2種類の異なる細胞、組織もしくは条件において、および/または同じ細胞もしくは組織において異なる条件下で比較することにより確認され得る。ある細胞型または組織型における発現は、異なるが関連している組織型におけるものと比較され得る。例えば、対象の細胞もしくは組織が疾患細胞もしくは組織であるか、または本明細書に記載のように人為的に操作されたものである場合、その細胞または組織における遺伝子の発現は、対応する正常または未処理の細胞または組織における同じ遺伝子の発現と比較され得る。これにより、2種類の細胞型もしくは組織型間または異なる条件下で識別的に調節される遺伝子の同定が可能となり得る。
【0088】
かかる遺伝子と関連しているTFREは、一般的に、細胞のゲノム内においてその遺伝子のコード配列に近接して存在している。例えば、かかるTFREは、そのコード配列のすぐ上流または下流の領域に存在し得る。かかるTFREは、プロモーターまたはその遺伝子の発現を調節する他の調節配列に近接して存在していてもよい。TFREの位置は、当業者により、この分野の自身の知識および本明細書に記載の方法を用いて決定され得る。
【0089】
したがって、好適なTFREは、対象の細胞もしくは組織および/または対象の特定の条件下での解析によって同定され得る。対象の細胞または組織において識別的に発現される遺伝子は常套的な方法によって同定され得る。例えば、常套的な方法を使用し、対象の細胞または組織における遺伝子の発現プロフィールが、対照としての機能を果たし得る他の細胞型または組織型のものと比較され得る。したがって、対象の細胞または組織において上方制御または下方制御される遺伝子が同定され得る。かかる解析は、例えば、マイクロアレイ解析または遺伝子発現の連続解析(SAGE)を利用し得る。
【0090】
かかる解析は、対象の細胞または組織で発現された分子の試料を用いて行なってもよく、対象の細胞または組織で発現されたすべての分子を用いて行なってもよい。例えば、一実施形態において、かかる解析は、対象の細胞または組織の全RNA含有量を用いて行なわれ得る。したがって、いくつかの実施形態では、本発明の方法は、対象の細胞または組織のゲノム全体からの発現を解析するために使用され得る。
【0091】
かかる解析を用いて、多種多様な遺伝子または下位群の遺伝子の発現が評価され得る。したがって、本発明の実施形態によれば、多種多様な異なる転写因子によって調節されることが公知である遺伝子の選択を使用してもよく、1種類または2種類の転写因子のみによる各遺伝子を使用してもよい。
【0092】
遺伝子発現データを用いて環境刺激(または疾患状態)に対する特異的応答を媒介する遺伝子モジュールを同定することが可能なこと、およびその調節を、各モジュール内の遺伝子の上流に存在するシス調節エレメントに相関することが可能なことにより、マイクロアレイデータの解釈様式が変化している。例えば、モジュール式アプローチを使用することにより、特定の遺伝子モジュールが様々な異なるがんにおいて活性であるかどうか、または個々のがんは独自の遺伝子モジュールの機能を必要とするかどうかを調べることが可能である。これにより、異なるがん間の転写の共通点についてスクリーニングすることが可能になり、広く適用可能な抗がん治療ストラテジーの設計が補助されるはずである。22種類に及ぶ異なるがんの1975個のマイクロアレイからの遺伝子発現データを使用し、特定の型のがんにおいて活性化または不活化される遺伝子モジュールが同定された(Segal, E., Friedman, N., Koller, D., & Regev, A. A module map showing conditional activity of expression modules in cancer. Nat. Genet.36,1090-1098(2004))。骨の骨芽細胞のモジュールは、一次転移部位が骨であることが公知であるいくつかのがんにおいて活性であった(同上)。したがって、様々な異なるがん間で共通する骨転移機構が同定され、これは、抗がん治療薬の開発における標的となり得る。
【0093】
また、各モジュール内の遺伝子の発現を制御している高レベル転写調節因子を同定することも可能である(Segal, E. et al. Module networks: identifying regulatory modules and their condition-specific regulators from gene expression data. Nat. Genet. 34, 166-176 (2003))。モジュール内の各遺伝子の上流調節配列を調べることにより、モジュールのレギュレータの標的であることが公知である共通するシス調節エレメントの存在が明らかとなり得る。したがって、種々のがんにおいて遺伝子モジュールの活性化を制御している特異的調節タンパク質を同定することにより、形質転換された細胞において転写を媒介する重要なシスエレメントを推定することが可能なはずである。それにより、例えば、いくつかの腫瘍特異的遺伝子モジュール内の最も活性なシス調節エレメントに基づいた腫瘍特異的プロモーターの設計および構築が可能になる。
【0094】
したがって、対象の細胞もしくは組織または特定の条件下で遺伝子の識別的発現が確立されたら、識別的に発現される遺伝子に近い配列、例えば、識別的に発現される遺伝子の上流のものがTFRE、例えばシス調節エレメントについてスクリーニングされ得る。識別的に発現される遺伝子の発現を調節するシス調節エレメントは、対象の細胞または組織において活性であるとみなされる。したがって、そのシスエレメントが活性であるためには、その活性を制御している転写因子がその細胞型に存在していなければならない。したがって、これにより、対象の細胞または組織において活性なTFREの同定が可能となる。
【0095】
TFRE、例えばシスエレメントは、公知の方法を用いて、例えば、公知のバイオインフォマティクス手法を用いてスクリーニングすることにより同定され得る。
【0096】
機能的に関連している遺伝子の発現を制御しているヒトゲノム内の特異的転写エレメントを同定することが可能なことにより、機能ゲノミクスの適用が変化しつつある。最近まで、マイクロアレイ解析によるデータの解釈は、機能が単一の経路または応答において重要であり得る遺伝子の同定に限られていた。どのようにしてこれを細胞表現型における包括的変化に関連付けるかは、単純に、これを調べるために必要なツールが存在しなかったため、看過されているところが大きかった。バイオインフォマティクスの進歩に伴い、本発明者らは、ここに、大規模遺伝子発現解析により得られたすべてのデータを利用し、これをヒトゲノムの完全配列の知識ならびに転写因子、遺伝子存在論および分子機能データベースと併せ、それにより、包括的遺伝子発現試験によって得られた大きなデータセットをより充分に利用する立場にある。
【0097】
ほぼ20年間、科学者らは、遺伝子調節を担うトランス因子およびシスエレメントの目録となるデータベースを編集してきた(Wingender, E. Compilation of transcription regulating proteins. Nucleic Acids Res 16, 1879-1902 (1988))。これにより有用なツール、例えば、TRANSCompel(Kel-Margoulis, O. V., Kel, A. E., Reuter, I., Deineko, I. V., & Wingender, E. TRANSCompel: a database on composite regulatory elements in eukaryotic genes. Nucleic Acids Res 30, 332-334 (2002))、ABS(Blanco, E., Farre, D., Alba, M. M., Messeguer, X., & Guigo, R. ABS: a database of Annotated regulatory Binding Sites from orthologous promoters. Nucleic Acids Res 34, D63-D67 (2006))、JASPAR(Sandelin, A., Alkema, W., Engstrom, P., Wasserman, W. W., & Lenhard, B. JASPAR: an open-access database for eukaryotic transcription factor binding profiles. Nucleic Acids Res 32, D91-D94 (2004))、
【0098】
HTPSELEX(Jagannathan, V., Roulet, E., Delorenzi, M., & Bucher, P. HTPSELEX-a database of high-throughput SELEX libraries for transcription factor binding sites. Nucleic Acids Res 34, D90-D94 (2006))およびTRANSFAC(Matys, V. et al. TRANS-FAC: transcriptional regulation, from patterns to profiles. Nucleic Acids Res 31, 374-378 (2003))(これらは、転写因子および実験データに基づいたその標的配列の索引である)、ならびにTRED(Zhao, F., Xuan, Z., Liu, L., & Zhang, M. Q. TRED: a Transcriptional Regulatory Element Database and a platform for in silico gene regulation studies. Nucleic Acids Res 33, D103-D107 (2005))(これは、実験データと自動化データの両方に基づいた索引である)の出現がもたらされた。
【0099】
公知の転写因子結合部位のデータベースを用いて所与のプロモーター内のタンパク質認識エレメントの存在を検出することができるが、該当するDNA結合タンパク質の結合部位およびそのインビボでのミスマッチに対する許容性が既に公知である場合のみである。この知識は現在、少数サブセットの転写因子に限定されているため、プロモーターのDNA配列の比較解析によって調節モチーフが発見されることは好都合であり得る。多種類のプロモーター間で保存されている領域を見出すことにより、これまでに知識のない転写因子結合部位のモチーフが同定され得る。
【0100】
統計学的過剰発現によってこれを行なういくつかのモデルが出現している。このようなアルゴリズムは、ゲノム全体の多種類の非翻訳領域をアラインメントし、ランダム、例えば、YMF(Sinha, S. & Tompa, M. YMF: A program for discovery of novel transcription factor binding sites by statistical overrepresentation. Nucleic Acids Res 31, 3586-3588 (2003); Sinha, S. & Tompa, M. Discovery of novel transcription factor binding sites by statistical overrepresentation. Nucleic Acids Res 30, 5549-5560 (2002))およびSCORE(Rebeiz, M., Reeves, N. L., & Posakony, J. W. SCORE: a computational approach to the identification of cis-regulatory modules and target genes in whole-genome sequence data. Site clustering over random expectation. Proc. Natl. Acad. Sci. U. S. A 99, 9888-9893 (2002))によって予測されるものと比較して統計学的に有意に過剰発現されている配列を同定することによって機能を果たす。現在、このようなツールは、主にゲノムがあまり複雑でなく、調節エレメントの同定がより容易である下等真核生物の研究において適用されており、このようなアルゴリズムをヒトゲノムに拡張することは、いくぶんより困難であることが証明されている。
【0101】
この問題を是正するため、いくつかのグループにより、例えば、DBTSSリソース(Suzuki, Y., Yamashita, R., Sugano, S., & Nakai, K. DBTSS, DataBase of Transcriptional Start Sites: progress report 2004. Nucleic Acids Res 32, D78-D81 (2004); Suzuki, Y., Yamashita, R., Nakai, K., & Sugano, S. DBTSS: DataBase of human Transcriptional Start Sites and full-length cDNAs. Nucleic Acids Res 30, 328-331 (2002))のカタログに示されたTATAおよびCAATボックスなどの転写開始部位モチーフに隣接している保存された調節エレメントを探すことによって、高等真核生物のゲノムを掘り下げることが可能なことが示されており、あるいは、プロモーター配列内に高い割合で存在しているCpGリッチ領域内の推定シスエレメントを探すことができる(Davuluri, R. V., Grosse, I., & Zhang, M. Q. Computational identification of promoters and first exons in the human genome. Nat. Genet. 29, 412-417 (2001))。
【0102】
あるいはまた、マイクロアレイ技術とヒトゲノムの完全配列の同時出現により、今や、特定の条件下で同様の発現プロフィールを示す多種類の遺伝子の上流非コード領域を比較することによって、潜在的転写因子結合部位を探すことが可能である。比較解析のための遺伝子セットは、クラスタリング、例えば、階層型k平均法に基づいて(Roth, F. P., Hughes, J. D., Estep, P. W., & Church, G. M. Finding DNA regulatory motifs within unaligned noncoding sequences clustered by whole-genome mRNA quantitation. Nat. Biotechnol. 16, 939-945 (1998))、単純な発現比率により(Bussemaker, H. J., Li, H., & Siggia, E. D. Regulatory element detection using correlation with expression. Nat. Genet. 27, 167-171 (2001))または遺伝子産物の機能解析により(Jensen, L. J. & Knudsen, S. Automatic discovery of regulatory patterns in promoter regions based on whole cell expression data and functional annotation. Bioinformatics. 16, 326-333 (2000))選択され得る。これらは、科学者らに、特定の環境条件に応答性であるプロモーターエレメント、または特定の組織の分化の媒介に枢要な役割を果たしているもの、または病態表現型の媒介に特に活性であり得るものを同定する機会が与えている。
【0103】
系統発生的フットプリンティングまたは比較ゲノミクスは、現在、様々な生物体の公知の遺伝子に近位の進化的に保存されている非翻訳エレメントを比較することにより、新規なプロモーターエレメントを同定するために適用されている。種間のゲノム配列の利用可能性によって、比較ゲノミクスおよび進化生物学一般の理解が著しく進歩した。分子進化の中立説は、異なる種のゲノムにおけるDNA配列の同定のための枠組みを示す。
【0104】
その中心的な仮説は、ゲノム内の変異の大部分は、生物体の適応度に関して中立であるということである。有害な変異は選択によって速やかに除去されるが、中立変異は存続し、集団における遺伝的浮動の確率過程が付随する。したがって、非中立DNA配列(機能性DNA配列)は、進化の過程で保存されなければならないが、中立変異は蓄積される。初期の研究で、ヒトゲノムは、他の生物体のゲノムと充分に比較され得、機能性DNA配列内の相同領域の効率的な同定が可能であることが充分に示された。
【0105】
その後、種々の生物体のゲノム間で非コード調節配列を比較することにより機能し、候補遺伝子のプロモーターが有意に富化された、またはマイクロアレイ解析によって同定されたクラスターに由来する保存された転写因子結合部位の同定を可能にするいくつかのバイオインフォマティクスツールが出現した。
【0106】
このような一式のソフトウェアの例としては、TRAFAC(Jegga, A. G. et al. Detection and visualization of compositionally similar cis-regulatory element clusters in orthologous and coordinately controlled genes. Genome Res 12, 1408-1417 (2002))、CORG(Dieterich, C., Wang, H., Rateitschak, K., Luz, H., & Vingron, M. CORG: a database for Comparative Regulatory Genomics. Nucleic Acids Res 31, 55-57 (2003))、CONSITE(Lenhard, B. et al. Identification of conserved regulatory elements by comparative genome analysis. J. Biol. 2, 13 (2003))、CONFAC(Karanam, S. & Moreno, C. S. CONFAC: automated application of comparative genomic promoter analysis to DNA microarray data-sets. Nucleic Acids Res 32, W475-W484 (2004))、VAMP(La Rosa, P. et al. VAMP: visualization and analysis of array-CGH, transcriptome and other molecular profiles. Bioinformatics. 22, 2066-2073 (2006))およびCisMols Analyser(Jegga, A. G. et al. CisMols Analyzer: identification of compositionally similar cis-element clusters in ortholog conserved regions of coordinately expressed genes. Nucleic Acids Res 33, W408-W411 (2005))が挙げられる。典型的には、このようなツールは、種間の標的遺伝子の上流配列をアラインメントし、かくして、潜在的にシス調節エレメントとしての機能を果たし得る保存された領域を同定することにより機能を果たし、その結果、様々なモデルにおける転写調節ネットワークの解明に適用されている。
【0107】
相当量の労力が、転写因子およびその対応するシスエレメントの目録作成に対して費やされている。ごく最近、このようなデータベースが、多様な刺激に応答して活性となる調節ネットワークの解明に利用する目的で編集された。このようなリソースの一例としては、PreMod(Blanchette, M. et al. Genome-wide computational prediction of transcriptional regulatory modules reveals new insights into human gene expression. Genome Res 16, 656-668 (2006); Ferretti, V. et al. PReMod: a database of genome-wide mammalian cis-regulatory module predictions. Nucleic Acids Res 35, D122-D126 (2007))、CisView(Sharov, A. A., Dudekula, D. B., & Ko, M. S. CisView: a browser and database of cis-regulatory modules predicted in the mouse genome. DNA Res 13, 123-134 (2006))、BEARR(Vega, V. B., Bangarusamy, D. K., Miller, L. D., Liu, E. T., & Lin, C. Y. BEARR: Batch Extraction and Analysis of cis-Regulatory Regions. Nucleic Acids Res 32, W257-W260 (2004))、VISTA(Dubchak, I. & Ryaboy, D. V. VISTA family of computational tools for comparative analysis of DNA sequences and whole genomes. Methods Mol. Biol. 338, 69-89 (2006))、PromAn(Lardenois, A. et al. PromAn: an integrated knowledge-based web server dedicated to promoter analysis. Nucleic Acids Res 34, W578-W583 (2006))、CRSD(Liu, C. C. et al. CRSD: a comprehensive web server for composite regulatory signature discovery. Nucleic Acids Res 34, W571-W577 (2006))およびMPromDb(Sun, H. et al. MPromDb: an integrated resource for annotation and visualization of mammalian gene promoters and ChIP-chip experimental data. Nucleic Acids Res 34, D98-103 (2006))が挙げられる。
【0108】
表1に、潜在的調節配列を探す際に使用され得る現在利用可能なデータベースのいくつかを示す。この表は、潜在的シス作用配列を同定する際に利用されるリソースの型の一例を示す。
【0109】
したがって、表1に示した任意のデータベースまたは任意の同等の公衆に利用可能なリソースが、対象の細胞または組織において発現される遺伝子、好ましくは、対象の細胞または組織において識別的に発現される遺伝子と関連しているTFRE、例えばシス調節エレメントの同定に使用され得る。好ましくは、Pubmed、DBTSS、TRAFAC、TRANSCompel、TRANSFAC、Phylofoot、CORG、CONSITE、CONFAC、CisMols、TRED、ABS、JASPAR、HTPSELEX、PAINT、PreMOD、CisView、BEARR、VISTA、PromAn、CRSD、MPromDb、VAMPおよびOncomineから選択される少なくとも1つのデータベースが使用される。
【0110】
提供する方法において、転写調節エレメントは、複数の遺伝子、例えば、発現が対象の細胞型、組織型または条件と関連している遺伝子の近距離の配列内で同定される。典型的には、その配列は、選択された各遺伝子の上流または下流の20キロベースの領域内、このような領域内の各々の好ましくは10キロベース、より好ましくは5キロベースに存在しており、上流が最も好ましい。
【0111】
提供する方法のいくつかの実施形態では、転写調節エレメントの合理的な選択およびその重要性の順のランク付けを容易にするために、各配列の存在頻度を計算する。
【0112】
本明細書で用いる場合、頻度は、複数の遺伝子のいずれかと関連している所与の転写因子調節エレメント(TFRE)の存在数(すなわち、TFREがその複数の遺伝子のいずれかと関連している回数)を、その複数の遺伝子のいずれかと関連している転写因子調節エレメントの総数で除算したものと定義する。いくつかの実施形態では、TFREは、センス鎖に存在しているのかアンチセンス鎖に存在しているのか、すなわち、フォワード方向であるのかリバース方向であるのかの頻度を計算する目的で所与の遺伝子と関連しているとみなされる。別の実施形態では、TFREは、センス鎖に存在している場合のみ、またはアンチセンス鎖に存在している場合のみ、所与の遺伝子と関連しているとみなされる。一実施形態では、TFREは、センス鎖に存在している場合のみの頻度を計算する目的で所与の遺伝子と関連しているとみなされる。特に指定のない限り、TFREは、いずれかの鎖に存在している場合、関連しているとみなされる。いくつかの実施形態では、その頻度は、その複数の遺伝子の所望の近距離の観点で規定される。かかる場合では、その頻度は、その複数の遺伝子のいずれかの所望の近距離内、例えば20、10または5キロベース以内の所与のTFREの存在数を、その複数の遺伝子のかかる近距離内のすべてのTFREの総数で除算したものである。例えば、転写調節エレメントが所望の領域内(例えば、その複数の遺伝子のいずれかの上流または下流の20、10または5kb以内)に150回存在し、総数5000の部位で転写調節エレメントがその複数の遺伝子のその近距離内で同定された場合、この転写調節エレメントの頻度は150/5000であり得る。この場合も、いくつかの実施形態では、その存在は、センス鎖またはアンチセンス鎖に関するもの、すなわち、フォワードまたはリバース方向であり;他の実施形態では、その存在はセンス鎖のみ、またはアンチセンス鎖のみに関する。
【0113】
長い配列の保存が発現媒介におけるその重要性をよく示していることを考慮し、頻度(1/長さ)の関係を用いて、長いシス調節エレメントに対して重み付けを付加する。頻度は上記のとおりと定義され、長さは、転写調節エレメントのヌクレオチド長である。また、計算値(これは頻度のn乗根であり、ここで、nはその長さである)も本明細書ではSYN値と称する。
【0114】
SYN値は、一般的に、閾値の値とともに選択基準として使用され、TFRE、例えばインプットシス調節エレメントの合理的な選択を可能にする。SYN値の閾値は0.1〜0.9の間の任意の数であり得る。好ましくは、SYN値は閾値より大きくなければならない;したがって、特定の実施形態では、少なくとも0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8もしくは0.9またはそれより大きい、あるいは約0.1、約0.2、約0.3、約0.4、約0.5、約0.6、約0.7、約0.8または約0.9のSYN値を有するTFREが選択される。また、最も大きなSYN値を有する所定の数のTFRE、例えばシス作用配列、例えば1〜10個の遺伝子を選択することも可能である。したがって、いくつかの実施形態では、その複数の遺伝子に近いと同定された複数のTFREのうち、選択されるものは、上位1、2、3、4、5、6、7、8、9または10位の高値のSYN値(上記の式により規定)を有する。
【0115】
好ましい実施形態では、閾値の値は0.3より大きく、好ましくは0.4より大きく、より好ましくは0.5より大きい。別の好ましい実施形態では、閾値の値は0.5の値を有する。
【0116】
合成プロモーターの構築
近年、短いオリゴヌクレオチドプロモーターとエンハンサーエレメントをランダム様式で連結することに基づいた、組織特異的転写のための合成プロモーターを構築するためのいくつかの取り組みが行なわれた。
【0117】
アプローチの一例では(これは、筋肉特異的発現のための合成プロモーターを同定することを目的としたものであった)、筋肉特異的転写因子と非特異的転写因子の結合部位の二本鎖オリゴヌクレオチドを、ルシフェラーゼを駆動する筋肉の最小プロモーターの上流に無作為にライゲートし、クローニングした(Li, X., Eastman, E. M., Schwartz, R. J., & Draghia-Akli, R. Synthetic muscle promoters: activities exceeding naturally occurring regulatory sequences. Nat. Biotechnol. 17, 241-245 (1999))。およそ1000個のプラスミドクローンが筋肉細胞内への一過性トランスフェクションによって個々に試験され、ルシフェラーゼ活性が96ウェル形式でルミノメトリーによって測定された。このアプローチにより、いくつかの高度に活性な筋肉特異的プロモーターが同定され、これは、最も一般的に使用されているウイルスプロモーター(CMVなど)と同等の強度を示した。
【0118】
100万個のクローンを調べるための取り組みにおいて、Suttonおよび共同研究者らは、レンチウイルスベクター系ライブラリーの確立に基づいて異なるスクリーニングアプローチを採用した(Dai, C., McAninch, R. E., & Sutton, R. E. Identification of synthetic endothelial cell-specific promoters by use of a high-throughput screen. J. Virol. 78, 6209-6221 (2004))。この研究では、内皮細胞特異的転写因子および非特異的転写因子の結合部位の二本鎖オリゴヌクレオチドを、HIV自己不活化発現ベクター内に、eGFPの発現を駆動する最小プロモーターの上流にランダム様式でクローニングした。次いで、100万個のクローンのプールで内皮細胞をトランスフェクトし、最も高い発現体をFACS分取によって選択した。次いで、合成プロモーターを安定な形質変換体から、HIVベクターが組み込まれたゲノムDNAのPCRによってレスキューした。
【0119】
また、この研究の結果により、いくつかの高度に活性な内皮細胞特異的合成プロモーターエレメントがランダムスクリーニングによって単離される可能性が示された。
【0120】
この型の方法論を組織特異的合成プロモーターの設計に採用する場合、充分に設計された二本鎖オリゴヌクレオチドを使用することが重要である。例えば、各エレメントは、DNAヘリックスが再結合したときその同じ側に調節エレメントがみられるような様式で間隔があいていなければならず、該当する最小プロモーターエレメントは、スクリーニングによって対象の組織内でのみ効率的に発現され得るプロモーターが得られるように使用しなければならず、ある種の機構、例えば、メチル化によるプロモーターのサイレンシングに対する保護のためのSpl部位の付加を存在させなければならない。
【0121】
このアプローチのランダム性により、いくつかの研究において、個々のプロモーターエレメントではなく全プロモーター領域を連結させることにより合成プロモーターを合理的に設計した場合、あまり効率的でない組織特異的プロモーターの同定が実際にもたらされることを考慮すると、活性な組織特異的プロモーターが見出される機会が実際に増える。したがって、このような方法によって効率的な組織特異的プロモーターが得られる該当プロモーター/エンハンサーエレメントを注意深く選択することが可能なことは、このアプローチの好成績のための最優先事項である。
【0122】
したがって、本発明の実施形態では、2つまたはそれ以上の選択された上記のTFREが、合成プロモーターの一部として一体に結合され得る。プロモーターエレメントとしては、遺伝子の転写を可能にする成分を含むDNA配列が挙げられる。
【0123】
プロモーターエレメントは、1つまたはそれ以上の転写調節エレメント、最小限プロモーター領域、および遺伝子の5’非翻訳領域由来の配列またはイントロンを含み得る。一実施形態において、プロモーターエレメントは、遍在的に発現される1つまたはそれ以上の転写因子の結合を可能にする1つまたはそれ以上のシスエレメントもまた含むものであってもよい。プロモーターエレメントは、一過性遺伝子発現を可能にする1つまたはそれ以上の調節エレメントを含むものであってもよい。プロモーターエレメントは、誘導型遺伝子発現を可能にする1つまたはそれ以上の調節エレメントを含むものであってもよい。
【0124】
本明細書で用いる場合、最小プロモーターは、単独では不活性であるが、他の転写調節エレメントと結合させると遺伝子の転写を媒介し得るDNA配列をいう。最小プロモーター配列は、種々の供給源、例えば、原核生物および真核生物の遺伝子から誘導され得る。最小プロモーターの例としては、ドパミンβ−ヒドロキシラーゼプロモーターおよびサイトメガロウイルス(CMV)極初期遺伝子の最小プロモーターが挙げられる。
【0125】
本発明の一態様によれば、2つもしくはそれ以上のTFREを最小プロモーターと結合させて単一のプロモーターエレメントにする。これは、本明細書に記載のいくつかのTFREをライゲーション反応条件下で混合することにより行なわれ得る。TFREを互いに直接連結してもよい。TFREを、スペーサーヌクレオチドによって隔離させてもよい。例えば、TFREは、1個もしくはそれ以上、2個もしくはそれ以上、5個もしくはそれ以上、10個もしくはそれ以上または20個もしくはそれ以上のヌクレオチドによって隔離させ得る。このようなスペーサーヌクレオチドは、例えば1〜20個のヌクレオチドであり得る。
【0126】
本発明の一実施形態において、TRFEをコードしているオリゴヌクレオチドは、さらに、短い突出端の一本鎖ヌクレオチドを含んでおり、これは、別のオリゴヌクレオチドの突出端とハイブリダイズし得る。かかる突出端もまた、1〜20ヌクレオチド長であり得る。
【0127】
このようにして結合されたTFREは、本明細書に記載の方法によって同定され得るか、または対象の細胞または組織において活性であると既に同定され得る。
【0128】
プロモーターエレメントは、好ましくは2つまたはそれ以上のTFREを含む。各プロモーターエレメント内のTFREの数はばらばらであってもよく、各プロモーターエレメントが同じ数のTFREを含んでいてもよい。プロモーターエレメントは、2つもしくはそれ以上、3つもしくはそれ以上、4つもしくはそれ以上、5つもしくはそれ以上、または6つもしくはそれ以上のTFREを含み得る。好ましくは、0.1〜1kBのライゲートオリゴヌクレオチドが、例えばアガロースゲルによるライブラリーに選択される。プロモーターエレメント内のTFREの配列は、プロモーターエレメントのセンス鎖またはアンチセンス鎖(すなわち、フォワードまたはリバース方向)に存在し得る。同じTFREを何度も存在させてもよい。
【0129】
プロモーターエレメントは、TFREが最小プロモーターの上流に存在するように配置され得る。あるいはまた、TFREを最小プロモーターの下流に存在させてもよい。
【0130】
発現ベクター
本明細書に記載の複数のプロモーターエレメントを使用し、発現ベクターのライブラリーを作出する。各発現ベクターには抗生物質耐性遺伝子を含める。例えば、その遺伝子の発現は、ネオマイシン、ゼオシン、ハイグロマイシンまたはピューロマイシンに対する耐性を付与し得る。本明細書に記載のプロモーターエレメントはベクター内に、その遺伝子に作動可能に連結されるように含める。すなわち、プロモーターエレメントは、これが対象の細胞内でその遺伝子のコード配列を発現し得るように存在させる。ベクターは、好ましくは、プロモーターまたはプロモーターエレメント内に存在しているもの以外の調節配列を含まない。これにより、そのプロモーターからの遺伝子の転写(あれば)が、ベクター内に導入されたプロモーターエレメントによって調節されたはずであることが確実となる。
【0131】
ベクターは、対象の細胞または組織における抗生物質耐性遺伝子の発現を可能にする任意のベクターであり得る。例えば、ベクターはプラスミドまたはウイルスベクターであり得る。ベクターは、宿主のゲノム内に組み込まれたベクターであってもよく、組み込まれていないが遺伝子発現を可能にするベクターであってもよい。
【0132】
本明細書に記載の複数の異なるベクターを提供してもよい。これによりライブラリーが形成され得る。例えば、上記の識別的発現の解析によって対象の細胞型または組織型について多種類のTFREの同定がもたらされた場合、そのTFREを含む複数のプロモーターエレメントが作製され得る。多コピーのTFREの混合物を結合させ、様々な異なるプロモーターエレメントを作製してもよい。これらを各々ベクター内に含め、対象の細胞型または組織型に対するベクターのライブラリーが作製され得る。
【0133】
アッセイ方法
本明細書に記載のベクターのライブラリーは、対象の細胞または組織内で抗生物質耐性遺伝子を発現し得るベクターに関してアッセイされ得る。簡単には、かかるアッセイは、対象の細胞または組織の細胞をライブラリーのベクターでトランスフェクトする工程;前記細胞を遺伝子発現に適した条件下で培養する工程;およびその細胞を抗生物質耐性に関してスクリーニングする工程を含む。
【0134】
トランスフェクションは、任意の適当な方法を用いて行なわれ得る。様々なトランスフェクション方法が当分野で公知であり、当業者は、使用が所望されるベクターの型および細胞または組織の型に応じて好適な方法を選択することができよう。
【0135】
培養工程は、トランスフェクト細胞を、遺伝子発現が起こることを可能にする適当な条件下に維持することを伴い得る。また、誘導型調節配列をプロモーターエレメントに含めた場合、細胞または組織を該当する誘導剤に曝露することが必要であり得る。
【0136】
次いで、該当する抗生物質を培地に添加しなければならない。プロモーターエレメントが遺伝子発現が可能な好適な組合せのTFREを含んでいる細胞では、抗生物質耐性遺伝子が発現され、その細胞はその抗生物質の適用に対して耐性である。例えば、対象の細胞または組織に、プロモーターエレメント内のシス作用因子が活性化されるのに必要な特定の組合せの転写因子が含まれている場合、そのプロモーターエレメントにより抗生物質耐性遺伝子の発現が調節され得る。
【0137】
プロモーターエレメントが遺伝子発現が可能な好適な組合せのTFREを含むものでない細胞では、細胞は抗生物質耐性をもたず、抗生物質の存在によって死滅する。例えば、対象の細胞または組織に、的確な転写因子が含まれていないか、またはその転写因子がシス作用エレメントが遺伝子発現を調節することを可能にするのに充分なレベルで含まれていない場合、抗生物質耐性遺伝子は発現され得ない。
【0138】
これにより、プロモーターエレメントが対象の細胞型または組織型において遺伝子発現を調節し得る細胞の選択が可能になる。この工程中にシス作用エレメントに変異を導入することが可能である。
【0139】
一実施形態において、本発明の方法にさらなる工程を含めてもよい。かかるプロモーターエレメントの活性が対象の細胞型または組織型に特異的であるかどうかを判定するため、ベクターで異なる細胞型をトランスフェクトした場合でも抗生物質耐性遺伝子が発現されるかどうかを調べるためのさらなるアッセイ工程が行なわれ得る。例えば、対象の細胞または組織が特定の生物学的リガンド、化学薬剤または微生物病原体で処理されたものである場合、プロモーターエレメントの活性は、そのプロモーターエレメントがその細胞型において一般的に活性であるのか、またはかかる処理後にその細胞に対してのみ活性になるのかを判定するため、未処理細胞においても評価され得る。同様に、細胞型または組織型が疾患組織、例えばがん細胞型である場合、プロモーターエレメントがその組織型において一般的に活性であるのか、またはその疾患状態においてのみ活性であるのかを判定するため、「正常な」対応組織型におけるプロモーターエレメントの活性が評価され得る。
【0140】
合成プロモーターエレメントの設計および構築に採用され得るストラテジーの2つの例は以下のとおりである:
【0141】
細菌ライブラリーアプローチ.
上記に詳述した比較ゲノミクスおよび統合的バイオインフォマティクスアプローチの使用によってがん細胞において上方制御されることがわかった転写プログラムに対応する調節エレメントを無作為に、プロモーターのない哺乳動物発現ベクター内の抗生物質選択遺伝子の上流の最小プロモーターと一体にライゲートする。二本鎖オリゴヌクレオチドは、一体に連結されると調節エレメントが二重鎖ヘリックスの同じ面に存在し、メチル化によるプロモーターのサイレンシングを抑制するためのSpl−エレメントを含むように設計される。プロモーターエレメントを表すオリゴヌクレオチドを異なる比率を用いて一体にライゲートする。各ライゲーションミックスは、典型的には、5種類または6種類の異なるシスエレメントを含む。次いで、抗生物質選択により最適なプロモーターを見出すために、得られたプラスミド構築物を96ウェル形式で、対応するがん細胞株のトランスフェクトに使用し、有望な候補プロモーターを単離し、配列決定した後、腫瘍細胞特異性を確認するために、さらに対照細胞株をトランスフェクトする。次いで、がん細胞株に限定された発現を示す合成プロモーターを含むクローンが選択される。
【0142】
レトロウイルスライブラリーアプローチ.
二本鎖オリゴヌクレオチドを上記のようにして設計し、抗生物質選択遺伝子の発現を駆動する最小プロモーターを含む自己不活化(SIN)マウスモロニーレトロウイルスベクター内にライゲートする。細菌クローンをプールし、レトロウイルスベクターの混合ライブラリーを構築し、選択したがん細胞株を安定的に形質導入するために使用する。がん細胞は、細胞の50%だけが抗生物質選択遺伝子を発現するように感染させ、非常に高い濃度の抗生物質を使用し、最も強く発現している細胞を残りの集団から分取する。次いで、最適な合成プロモーターエレメントで形質導入されたがん細胞株の単一クローンを、希釈クローニングアプローチによって単離する。ゲノムDNAを単離し、合成プロモーターをPCRによってレスキューし、eGFPを含むプロモーターのない哺乳動物発現ベクター内にクローニングし、対照細胞株における発現を評価し、したがって腫瘍特異性を確認する。
【0143】
同定されたプロモーターエレメントの使用
本発明はまた、本発明のプロモーターエレメントおよびベクター、例えば、本発明の方法によって同定されたプロモーターエレメントおよびベクターならびにその使用にも拡張される。
【0144】
本発明の方法によって対象の細胞型または組織型において活性であると同定されたプロモーターエレメントまたはベクターは、遺伝子をその細胞型または組織型に標的化させるために使用され得る。例えば、本発明の方法によりプロモーターエレメントが特定の細胞型において特異的に活性であるが対照細胞型ではそうでないことが示される場合、そのプロモーターエレメントは、対象の細胞型もしくは組織型において、または条件下で発現を特異的に指令するために使用され得る。
【0145】
したがって、本発明のプロモーターエレメントは、特定の細胞型での発現が所望される遺伝子と結合させ得る。例えば、本発明のプロモーターエレメントを遺伝子のコード配列に作動可能に連結させたベクターが作製され得る。次いで、そのベクターは、対象の細胞をトランスフェクトさせるために使用され得る。ベクターは、本明細書に記載の任意のベクター型、例えば、プラスミドまたはウイルスベクターであり得る。あるいはまた、かかるベクターを、本発明の方法によって同定されたベクター内の抗生物質耐性遺伝子を対象遺伝子に置き換えることにより作製してもよい。
【0146】
したがって、遺伝子発現を細胞もしくは組織または特定の条件下で調節し得るプロモーターエレメントを、例えば、プロモーターエレメントを同定するための提供する方法を用いて同定する工程;遺伝子に作動可能に連結させた前記プロモーターエレメントを含む発現ベクターを作製する工程;およびその細胞または組織をそのベクターでトランスフェクトし、遺伝子発現が起こることを可能にする工程を含む、遺伝子を対象の細胞もしくは組織または特定の条件下で発現させる方法を提供する。
【0147】
この方法は、培養細胞を操作するためにインビトロで使用され得る。例えば、インビトロ細胞集団における遺伝子発現は、本発明のプロモーターエレメントを用いて操作され得る。
【0148】
この方法は、ヒトもしくは動物の体内で、または他の真核生物の生物体、例えば植物において細胞を操作するためにインビボで使用され得る。例えば、本発明のプロモーターエレメントまたはベクター、例えば、本明細書に記載のようにして対象の細胞または組織において遺伝子発現を調節し得ると同定されたプロモーターエレメントまたはベクターは、ヒトもしくは動物の身体または生物体に対して行なわれる治療または診断の方法における使用のために提供され得る。かかるプロモーターエレメントまたはベクターを、対象の細胞または組織の治療的処理のための医薬の製造に使用してもよい。例えば、対象の細胞または組織ががんなどの疾患組織に由来する場合、プロモーターエレメントまたはベクターは、その疾患、例えばがんの処置のために使用され得る。例えば、プロモーターエレメントまたはベクターは、特定の疾患組織において治療効果を有するポリペプチドの発現を指令するために使用され得る。したがって、いくつかの実施形態では、本発明は、疾患、例えばがんを処置する方法を提供するために使用され得、その方法は、本発明のプロモーターエレメントまたはベクター、例えば、本発明の方法によって同定されたプロモーターエレメントまたはベクターを、前記疾患に苦しんでいる患者に送達することを含み、そのプロモーターエレメントまたはベクターによりその疾患の細胞または組織において治療用薬剤の発現が指令される。
【0149】
本発明の別の目的は、前述の方法において記載した転写調節エレメントの選択工程を行なうことにより、その組合せにより特定の条件下または特定の細胞もしくは組織で、例えばがん細胞で遺伝子発現が特異的に調節され得る多種類のプロモーターエレメントの選択方法を提供することである。
【0150】
かかる方法の一態様では、第1工程において、特定の細胞型もしくは組織型または特定の条件下で、例えばがん細胞で、例えば、いくつかの異なる供給源に由来するがん細胞で、発現が異常に調節されると同定された複数の遺伝子のいずれかと関連している複数の転写因子調節エレメント(TRFE)を提供するか、または同定する。
【0151】
この複数の転写因子調節エレメントから特定のTFREが、いくつかの所定の基準に従って選択される。基準の1つは、一般的に、選択される転写因子調節エレメントは、その複数の遺伝子の50パーセントより多くの遺伝子において近接近距離内(例えば、その遺伝子の50パーセントより多くの遺伝子において20、10または5kb以内、典型的には、かかる遺伝子の上流領域内)に存在していなければならないことである。近距離という用語は、それにより、転写因子調節エレメントが、関連している遺伝子の上流または下流の20キロベースの領域内、好ましくは10キロベース、さらにより好ましくは5キロベースの領域内、最も好ましくは上流領域内に存在していることを規定する。TFREは、その配列がセンス鎖に存在していようとアンチセンス鎖に存在していようと(すなわち、フォワード方向であれリバース方向であれ)、所与の遺伝子と関連しているとみなされ得る。一実施形態では、センス鎖上(すなわち、フォワード方向)のTFREのみが所与の遺伝子と関連しているとみなされる。
【0152】
別の基準は、一般的に、TFREの存在頻度に関する。その頻度は、本明細書において上記のとおりと定義する。また、選択は、一般的に各転写因子調節エレメントのヌクレオチド長にも関連する。頻度と長さは、一般的に以下の関係:
頻度(1/長さ)
に従って候補調節エレメント(選択されるTFRE)を同定するために使用される。
【0153】
上記において論考したように、計算値(これは頻度のn乗根であり、ここで、nはその長さである)もまたSYN値と称し、これは、一般的に選択基準として、および/またはTFREをランク付けするために使用する。閾値のSYN値は0.1〜0.9の間の任意の数であり得る。好ましくは、選択されたTFREのSYN値は、閾値よりも大きくなければならない;したがって、特定の実施形態では、選択されるTFREは、少なくとも0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8もしくは0.9またはそれより大きい、あるいは約0.1、約0.2、約0.3、約0.4、約0.5、約0.6、約0.7、約0.8または約0.9のSYN値を有する。また、所定の数のTFRE、例えばシス作用配列、例えば1〜10個の遺伝子(これは最も大きなSYN値を有する)を選択することも可能である。したがって、いくつかの実施形態では、その複数の遺伝子に近いと同定された複数のTFREの中で、選択されるものは、上位1、2、3、4、5、6、7、8、9もしくは10位、または11、12、13、14、15、16、17、18、19もしくは20位の高値のSYN値、典型的には上位10位以内のSYN値を有する。
【0154】
本発明の別の目的は、本記載の方法によって得られる組合せプロモーターカセットを含むベクターであり、そのベクターは、プラスミド、ウイルス、一過性発現されるもの、または宿主細胞のゲノム内に組み込まれる。
【0155】
かかる組合せプロモーターカセットは、本発明の方法のために最初に選択されたTFREを2つもしくはそれ以上、3つもしくはそれ以上、4つもしくはそれ以上、5つもしくはそれ以上、または6つもしくはそれ以上含み、プロモーターカセット内の各TFREの配列は、最初に選択されたTFREの配列と70%より高い、好ましくは80%より高い相同性を有する。TFREは、プロモーターカセットのセンス鎖に存在させてもアンチセンス鎖に存在させてもよい。また、好ましい実施形態では、プロモーターカセットに最小限プロモーターもまた含める。好ましい実施形態では、配列内のTFREは、表3に示したTFREおよび/またはその相補鎖から選択される。
【0156】
本発明の別の目的は、本記載のベクターを含む宿主細胞である。好ましい実施形態では、宿主細胞は原核生物または真核生物の細胞、好ましくは哺乳動物細胞である。
【0157】
本発明の別の目的は、
(a)配列番号130〜191のうちの1つに示した単離された核酸もしくは配列番号130〜191のうちの1つの相補鎖;または
(b)配列番号130〜191のうちの1つに示したDNA配列もしくは配列番号130〜191のうちの1つの相補鎖と少なくとも90%の配列同一性を有する単離された核酸;または
(c)ストリンジェント条件下で、配列番号130〜191のうちの1つに示したDNA配列もしくは配列番号130〜191のうちの1つの相補鎖と特異的にハイブリダイズする単離された核酸;または
(d)介在配列によって分断されている(a)〜(c)のいずれか1つに規定される単離された核酸;または
(e)(a)〜(d)に規定されるいずれかの核酸の断片であって、その断片は、発現を駆動および/または調節し得る、
を含む、発現を駆動および/または調節し得る単離されたプロモーターである。
【0158】
単離されたプロモーターに、さらに最小プロモーター、例えば、任意の公知の最小プロモーター、例えば、本明細書に記載の最小プロモーターのうちの1つを含めてもよい。いくつかの実施形態では、さらに最小プロモーターを含む単離されたプロモーターは:
(a)配列番号5〜66のうちの1つに示した単離された核酸もしくは配列番号5〜66のうちの1つの相補鎖;または
(b)配列番号5〜66のうちの1つに示したDNA配列もしくは配列番号5〜66のうちの1つの相補鎖と少なくとも90%の配列同一性を有する単離された核酸;または
(c)ストリンジェント条件下で、配列番号5〜66のうちの1つに示したDNA配列もしくは配列番号5〜66のうちの1つの相補鎖と特異的にハイブリダイズする単離された核酸;または
(d)介在配列によって分断されている(a)〜(c)のいずれか1つに規定される単離された核酸;または
(e)(a)〜(d)に規定されるいずれかの核酸の断片であって、その断片は、発現を駆動および/または調節し得る、
を含む。
【0159】
用語「単離された」は、本明細書で用いる場合、その起源の供給源から取り出されていることを意味する。好ましくは、「単離された」プロモーターは、そのプロモーターが由来する生物体のゲノムDNAにおいて天然状態でそのプロモーターにフランキングしている配列(例えば、タンパク質コード配列または3’末端の他の配列)を含有していない。また、さらに好ましくは、「単離された」プロモーターは、天然状態で5’末端においてフランキングしている配列も含有していない。さらに好ましくは、「単離された」プロモーターは、そのプロモーターが由来する生物体のゲノムDNAにおいて天然状態でそのプロモーターとともに存在する約5kb、約4kb、約3kb、約2kb、約1.5kb、約1.2kb、約1kb、約0.8kb、約0.5kbまたは約0.1kb未満のヌクレオチド配列を含み得る。
【0160】
本発明は、配列番号130〜191または配列番号5〜66のうちの1つに示された核酸に限定されない。当業者には、同じ機能性を維持している核酸のバリアントまたは断片が存在し得ることが認識される。このようなバリアントまたは断片は、人工のものであってもよく(例えば、遺伝子工学による)、さらには天然に存在するものであってもよい。したがって、本発明は、配列番号130〜191もしくはその相補鎖、または配列番号5〜66もしくはその相補鎖のうちの1つのバリアント核酸および断片に拡張され、そのバリアントまたは断片は本発明の方法において有用である。かかるバリアントおよび断片は:
(a)配列番号130〜191もしくは配列番号5〜66のうちの1つに示した単離された核酸あるいは配列番号130〜191もしくは配列番号5〜66のうちの1つの相補鎖;または
(b)配列番号130〜191もしくは配列番号5〜66のうちの1つに示したDNA配列あるいは配列番号130〜191もしくは配列番号5〜66のうちの1つの相補鎖のいずれかと少なくとも90%の配列同一性を有する単離された核酸;または
(c)ストリンジェント条件下で、配列番号130〜191もしくは配列番号5〜66のうちの1つに示したDNA配列あるいは配列番号130〜191もしくは配列番号5〜66のうちの1つの相補鎖のいずれかと特異的にハイブリダイズする単離された核酸;または
(d)介在配列によって分断されている(a)〜(c)のいずれか1つに規定される単離された核酸;または
(e)(a)〜(d)に規定されるいずれかの核酸の断片であって、その断片は、発現を駆動および/または調節し得る、
を含む。
【0161】
配列番号130〜191または配列番号5〜66のうちの1つの好適なバリアントには、配列番号130〜191または配列番号5〜66のうちの1つで表される核酸と、好ましさが上がる順に少なくとも90%、91%、92%、93%、94%、95%、96%、97%、98%または99%の配列同一性を有するホモログが包含される。同じことが配列番号130〜191または配列番号5〜66の相補鎖にもあてはまる。
【0162】
同一性の割合は、アラインメントプログラムを用いて計算され得る。好ましくは、Needleman−Wunsch(J. Mol. Biol.48:443-453,1970)のアルゴリズムがインプリメントされたペアワイズ包括的アラインメントプログラムが使用され得る。このアルゴリズムは、マッチ数が最大であり、ギャップ数が最小である。かかるプログラムは、例えば、GAP、Needle(EMBOSSパッケージ)、stretcher(EMBOSSパッケージ)またはAlign X(Vector NTI suite 5.5)であり、標準パラメータ(例えば、ギャップ開始ペナルティ15およびギャップ伸長ペナルティ6.66)が使用され得る。あるいはまた、Smith−Watermanのアルゴリズムがインプリメントされた局所アラインメントプログラムを使用してもよい。かかるプログラムは、例えば、Water(EMBOSSパッケージ)またはmatcher(EMBOSSパッケージ)である。「配列同一性」は、本明細書で用いる場合、好ましくは、配列番号130〜191または配列番号5〜66のうちの1つで表されるプロモーターの全長にわたって計算されたものである。
【0163】
相同核酸の検索および同定は、充分に当業者の技能(realm)の範囲内であり得る。かかる方法は、本発明によって提供する配列、例えば配列番号5を含む配列データベース(好ましくは、コンピュータ可読形態)のスクリーニングを伴う。有用な配列データベースとしては、限定されないが、Genbank(http:/www.ncbi.nim.nih.gov/web/Genbank)、European Molecular Biology Laboratory Nucleic acid Database(EMBL)(http:/w.ebi.ac.uk/ebi-docs/embl-db.html)もしくはその改訂版、またはMIPSデータベース(http://mips.gsf.de/)が挙げられる。配列のアラインメントおよび比較のための種々の検索アルゴリズムおよびソフトウェアが当分野で周知である。かかるソフトウェアとしては、例えば、GAP、BESTFIT、BLAST、FASTAおよびTFASTAが挙げられる。好ましくは、BLASTソフトウェアが使用され、これは、配列同一性パーセントを計算し、配列間の類似性の統計学的解析を行なう。BLASTプログラムと称される一式のプログラムは、5つの異なるインプリメンテーション:ヌクレオチド配列クエリーのために設計された3つ(BLASTN、BLASTX、およびTBLASTX)ならびにタンパク質配列クエリーのために設計された2つ(BLASTPおよびTBLASTN)を有する。BLAST解析を行なうためのソフトウェアは、National Centre for Biotechnology Informationから公衆に利用可能である。配列番号5の場合、BLASTを用いてホモログは見出され得ない。
【0164】
配列番号130〜191または配列番号5〜66のうちの1つと少なくとも90%の配列同一性を有するホモログの例は、配列番号130〜191または配列番号5〜66のうちの1つの対立遺伝子バリアントである。対立遺伝子バリアントは、同じ種の異なる2つの個体に存在する同じ遺伝子のバリアントであり、通常、対立遺伝子バリアントはわずかな配列の変化によって異なる。対立遺伝子バリアントには、単一ヌクレオチド多型(SNP)ならびに低分子挿入/欠失多型(INDEL)が包含され得る。INDELのサイズは、通常100bp未満である。SNPおよびINDELは、ほとんどの生物体の天然に存在する多形系統の最も大きな配列バリアントの組を構成している。同じことが配列番号130〜191または配列番号5〜66の相補鎖にもあてはまる。
【0165】
本発明による方法における使用に適したホモログは、その供給源生物体から、PCRまたはハイブリダイゼーション手法によって容易に単離され得る。発現を駆動および/または調節するその能力は、例えば、実際の実施例で使用した配列を単純にホモログに置き換えることによって実施例のセクションに記載の方法に従うことにより容易に測定され得る。
【0166】
配列番号130〜191のうちの1つもしくは配列番号5〜66のうちの1つまたはそれらの相補鎖の他の好適なバリアントで本発明に包含されるものは、ストリンジェント条件下で配列番号130〜191もしくは配列番号5〜66のうちの1つまたはその相補鎖のいずれか1つの核酸に特異的にハイブリダイズする核酸である。用語「ハイブリダイズする」とは、ハイブリダイゼーションプロセスにおける実質的に相同な相補的ヌクレオチド配列に対するアニーリングを意味する。かかるハイブリダイゼーションプロセスに依存する分子生物学におけるツールとしては、ポリメラーゼ連鎖反応(PCR;およびこれに基づいたあらゆる方法)、サブトラクティブハイブリダイゼーション、ランダムプライマー伸長、ヌクレアーゼS1マッピング、プライマー伸長、リバース転写、cDNA合成、RNAの識別的ディスプレイ、およびDNA配列決定、ノザンブロッティング(RNAブロッティング)、サザンブロッティング(DNAブロッティング)が挙げられる。また、ハイブリダイゼーションプロセスは、相補核酸の一方をマトリックス、例えば、磁気ビーズ、セファロースビーズまたは任意の他の樹脂に固定化させて行なってもよい。かかるプロセスに依存する分子生物学におけるツールとしては、ポリ(A+)mRNAの単離が挙げられる。さらに、ハイブリダイゼーションプロセスは、相補核酸の一方を固相支持体、例えば、ニトロセルロースもしくはナイロン膜に固定化させるか、または例えばフォトリソグラフィによって、例えばケイ酸含有ガラス支持体に固定化させて行なってもよい(後者は、核酸アレイもしくはマイクロアレイまたは核酸チップとして公知である)。かかるプロセスに依存する分子生物学におけるツールとしては、RNAおよびDNAゲルブロット解析、コロニーハイブリダイゼーション、プラークハイブリダイゼーション、インサイチュハイブリダイゼーションならびにマイクロアレイハイブリダイゼーションが挙げられる。ハイブリダイゼーションが起こることを可能にするためには、一般的に、核酸分子を熱的または化学的に変性させて二本鎖を2本の一本鎖に融解させる、および/またはヘアピンもしくは他の二次構造を一本鎖核酸から除去する。ハイブリダイゼーションのストリンジェンシーは、条件、例えば、温度、塩濃度およびハイブリダイゼーションバッファーの組成によって影響される。慣用的なハイブリダイゼーション条件は、例えば、Sambrook(2001)Molecular Cloning:a laboratory manual,第3版 Cold Spring Harbor Laboratory Press, CSH, New Yorkに記載されているが、当業者には、数多くの種々のハイブリダイゼーション条件が、核酸配列の公知の、または予測される相同性および/または長さの関数として設計され得ることが認識される。ハイブリダイゼーションの高ストリンジェンシー条件としては、高温および/または低ナトリウム/塩濃度(塩としては、例えば、NaClおよびクエン酸Naの場合のようなナトリウムが挙げられる)および/またはハイブリダイゼーションバッファー中のホルムアミドの含有および/または化合物、例えばハイブリダイゼーションバッファー中のSDS(ドデシル硫酸ナトリウムデタージェント)の濃度の低下および/またはハイブリダイゼーションバッファーからの硫酸デキストランもしくはポリエチレングリコール(分子の込み合いを助長する)などの化合物の排除が挙げられる。ストリンジェント条件下で特異的にハイブリダイズするとは、配列が非常に類似しているはずであることを意味する。ストリンジェント条件下での特異的ハイブリダイゼーションは、好ましくは60℃の温度で行なわれ、続いて、0.1〜1×SSC、0.1×SDSおよび1×SSC、0.1×SDS中での洗浄を行なう。
【0167】
また、本発明は、特定の実施形態において、本発明のいずれかの核酸、特に、配列番号130〜191もしくはその相補鎖である配列番号192〜253のうちの1つ、または配列番号5〜66もしくはその相補鎖である配列番号68〜129のうちの1つと特異的にハイブリダイズする少なくとも15ヌクレオチド長の核酸分子に関する。また、本発明は、いくつかの実施形態において、ポリメラーゼ連鎖反応によって本発明の核酸を特異的に増幅させる少なくとも15ヌクレオチド長の核酸分子に関する。
【0168】
配列番号130〜191または配列番号5〜66のうちのいずれか1つの別のバリアントであって本発明に包含されるものは、配列番号130〜191もしくは配列番号5〜66またはそのバリアント(本明細書において上記)のうちの1つに対応する核酸であって、介在配列により分断されている。例えば、配列番号130〜191または配列番号5〜66のうちの1つに示されたいずれかの核酸は、介在配列によって分断されていてもよい。「介在配列」により、別の配列によって分離された任意の核酸またはヌクレオチドを意図する。介在配列の例には、イントロン、核酸タグ、T−DNAおよび可動性核酸配列、例えば、トランスポゾンまたは組換えによって動員され得る核酸が含まれる。具体的なトランスポゾンの例には、Ac(アクチベータ)、Ds(解離)、Spm(サプレッサ−ミューテータ)またはEnが含まれる。現在、プロモーターへのイントロンの導入が広く適用されている。本発明による方法はまた、イントロンを備えた配列番号130〜191または配列番号5〜66のうちの1つによる核酸配列を用いて行なってもよい。介在配列がイントロンである場合、本発明による核酸の選択的スプライスバリアントが生じることがあり得る。用語「選択的スプライスバリアント」は、本明細書で用いる場合、介在イントロンが切除、置換または付加された核酸配列のバリアントを包含する。かかるスプライスバリアントは自然界に見られるものであってもよく、人工のものであってもよい。イントロンを有するかかるプロモーターを作製するため、または対応するスプライスバリアントを作製するための方法は当分野で周知である。
【0169】
本発明による方法における使用に適した介在配列によって分断されたバリアントは、例えば、実際の実施例で使用した配列を単純にバリアントに置き換えることによって実施例のセクションに記載の方法に従うことにより容易に判定され得る。
【0170】
本明細書において上記のバリアント核酸は、自然界に見られるもの(例えば、対立遺伝子バリアントまたはスプライスバリアント)であってもよい。さらにおよび/または択一的に、本明細書において上記の配列番号130〜191または配列番号5〜66のうちの1つのバリアントは、例えば、変異、置換、挿入、欠失または誘導体化を伴う当分野で周知の手法による人工のものであってもよい。本発明は、かかるバリアントならびに本発明の方法におけるその使用も包含している。
【0171】
核酸の「変異バリアント」は、組換えDNA操作手法またはヌクレオチド合成を用いて容易に作製され得る。かかる手法の例としては、M13変異誘発、T7−Genインビトロ変異誘発(USB,Cleveland,OH)、QuickChange Site Directed変異誘発(Stratagene,San Diego,CA)、PCR媒介性部位特異的変異誘発または他の部位特異的変異誘発プロトコルによる部位特異的変異誘発が挙げられる。あるいはまた、本発明の核酸は無作為に変異されたものであってもよい。
【0172】
「置換バリアント」は、核酸配列内の少なくとも1個の残基が除去されて異なる残基がその場所に挿入されているバリアントをいう。核酸の置換は、典型的には単一残基のものであるが、核酸配列に対して課される機能的拘束にもよるがクラスター状であってもよく;挿入は通常、約1〜約10個程度の核酸残基のものであり、欠失は約1〜約20個の残基の範囲であり得る。
【0173】
核酸の「挿入バリアント」は、1個またはそれ以上の核酸残基がその核酸内の所定の部位に導入されているバリアントである。挿入には、5’末端および/または3’末端での融合ならびに単一もしくは多重ヌクレオチドの配列内挿入が包含され得る。一般的に、核酸配列内への挿入は5’−または3’末端融合よりも小さく、約1〜10個程度の残基である。5’−または3’末端融合の例としては、酵母ツーハイブリッド系もしくは酵母ワンハイブリッド系において使用されるような転写アクチベータの結合ドメインもしくは活性化ドメインまたはファージコートタンパク質、(ヒスチジン)_タグ、グルタチオンS−トランスフェラーゼ−タグ、プロテインA、マルトース結合タンパク質、ジヒドロ葉酸還元酵素、Tag 100エピトープ、c−mycエピトープ、FLAG(登録商標)−エピトープ、lacZ、CMP(カルモジュリン結合ペプチド)、HAエピトープ、プロテインCエピトープおよびVSVエピトープのコード配列が挙げられる。
【0174】
核酸の「誘導体」という用語は、天然の核酸と比べて天然に存在する核酸残基および天然に存在しない核酸残基が置換および/または欠失および/または付加されたものが包含され得る。誘導体は、例えば、メチル化ヌクレオチドまたは人工ヌクレオチドを含み得る。
【0175】
また、配列番号130〜191もしくは配列番号5〜66のうちの1つに示されたいずれかの核酸またはそのバリアント(本明細書において上記)の断片を含むプロモーターも本発明に包含される。「断片」は、本明細書で用いる場合、核酸配列の一部分を意味する。本発明の方法に有用な好適な断片は、そのプロモーターの機能性部分の少なくとも1つを保持しており、したがって、依然として発現を駆動および/または調節し得る機能性断片である。プロモーターの機能性断片の例としては、最小プロモーター、上流調節エレメント、またはその任意の組合せが挙げられる。
【0176】
好適な断片は、少なくとも約20塩基対または約50、約100、約150、約200、約250、約300、約350、約400、約450、約500、約550、約600、約650、約700、約750、約800、約850、約900、約950もしくは約1000塩基対からほぼ本発明の完全長配列までの範囲であり得る。このような塩基対は、典型的には、転写開始部位のすぐ上流のものであるが、択一的に、プロモーター配列内のいずれかの箇所に由来するものであってもよい。
【0177】
本発明の方法に有用な好適な断片は、その発現を駆動および/または調節する能力に関して、当業者に周知の標準的な手法によって、または実施例のセクションに記載の以下の方法によって試験され得る。
【0178】
用語「プロモーター」は、本明細書で用いる場合、広義に解釈し、作動可能に連結された配列の発現を実行(駆動および/または調節)し得る調節核酸配列をいう。「プロモーター」は、古典的ゲノム遺伝子から誘導される転写調節配列を包含する。通常、プロモーターにはTATAボックスが含まれており、これは、転写開始複合体を適切な転写開始の開始部位に指向し得る。しかしながら、一部のプロモーターは、TATAボックスを有していない(無TATAプロモーター)が、それでも発現の駆動および/または調節には充分に機能性である。プロモーターに、さらにCCAATボックス配列およびさらなる調節エレメント(すなわち、上流活性化配列またはシスエレメント、例えば、エンハンサーおよびサイレンサー)を含めてもよい。
【0179】
「発現を駆動する」とは、本明細書で用いる場合、核酸の転写の促進を意味する。
【0180】
「発現を調節する」とは、本明細書で用いる場合、核酸の転写のレベル、時点または場所に影響を及ぼすことを意味する。したがって、本発明のプロモーターは、核酸の転写を増大、減少あるいはその時点および/または場所を変化させるために使用され得る。例えば、これは、転写を特定の細胞型、組織もしくは器官に、または特定の期間中に、または特定の環境条件に応答して限定させるために使用され得る。
【0181】
特定の実施形態によれば、本発明は、ハイブリッドプロモーターである本明細書において上記の単離されたプロモーターを提供する。用語「ハイブリッドプロモーター」は、本明細書で用いる場合、例えば合成により、例えば遺伝子工学によって作製されるキメラプロモーターをいう。本発明による好ましいハイブリッドプロモーターは、本発明によるプロモーターのうちの1つの一部分、好ましくは機能性部分と、少なくとも別の部分、好ましくはプロモーターの機能性部分とを含む。後者の部分は、任意のプロモーター、例えば、本発明によるプロモーターのいずれか1つおよび他のプロモーターの一部分であり得る。ハイブリッドプロモーターの一例は、別のプロモーターの最小プロモーターと結合させた本発明によるプロモーターの調節エレメントを含む。ハイブリッドプロモーターの別の例は、その活性をさらに向上させるため、および/またはその空間的および/または時間的発現パターンを改変するためのさらなる調節エレメントを含むプロモーターである。
【0182】
また、本発明は、いくつかの態様において、プロモーターの発現パターンを変化させるための、配列番号130〜191もしくは配列番号5〜66のうちの1つまたはそのバリアントの機能性断片の使用を提供する。かかる方法では、本発明による配列番号130〜191または配列番号5〜66のうちの1つの核酸の少なくとも一部分を、別のプロモーターの少なくとも1つの断片と結合させる。
【0183】
さらに、本発明は、
(a)本明細書において上記に規定の単離されたプロモーター
(b)(a)の単離されたプロモーターに作動可能に連結させた非相同核酸配列、および任意選択で
(c)3’転写ターミネーター
を含む遺伝子構築物を提供する。
用語「遺伝子構築物」は、本明細書で用いる場合、遺伝子工学によって作製された核酸を意味する。
【0184】
プロモーターに「作動可能に連結させた」という用語は、本明細書で用いる場合、転写がそのプロモーターによって駆動および/または調節されることを意味する。当業者には、プロモーターに作動可能に連結されているとは、好ましくは、プロモーターが、作動可能に連結された核酸の上流(すなわち、5’末端部)に位置していることを意味することが理解される。作動可能に連結された核酸との距離は、本発明のプロモーターがその作動可能に連結された核酸の転写を駆動し得るおよび/または調節し得る限り、種々であり得る。例えば、プロモーターと作動可能に連結された核酸との間に、クローニング部位、アダプターおよび/または転写もしくは翻訳エンハンサーを存在させてもよい。
【0185】
作動可能に連結させる核酸は、任意のコード核酸または非コード核酸であり得る。作動可能に連結させる核酸は、センス方向であってもアンチセンス方向であってもよい。典型的には、宿主細胞の遺伝子工学の場合、作動可能に連結させる核酸は宿主細胞内に導入され、その宿主細胞の表現型を変化させることが意図される。あるいはまた、作動可能に連結させる核酸は宿主細胞由来の内在性核酸である。
【0186】
用語「非相同性の」は、本明細書で用いる場合、「本発明のプロモーターと非相同性」であることを意図する。本発明のプロモーターと非相同性である核酸は、その生体ゲノム環境に存在しているときに本発明のプロモーターにフランキングしている核酸配列に天然に存在するものでない。その核酸は、本発明のプロモーターと非相同性であり得るが、宿主細胞に対しては、相同性であっても天然であっても非相同性であっても外来であってもよい。作動可能に連結させる非相同核酸は、任意の核酸であり得る(例えば、任意のタンパク質をコードしている)が、本発明のプロモーターに通常はフランキングしていない少なくとも1個のヌクレオチドを含むか、またはそのヌクレオチドにフランキングしているものとする。
【0187】
用語「転写ターミネーター」は、(c)で用いている場合、転写終結のシグナル伝達を行なう転写単位の末端部のDNA配列をいう。ターミネーターは、通常ポリアデニル化シグナルを含む3’−非翻訳DNA配列であり、そのシグナルは一次転写物の3’末端部へのポリアデニル酸配列の付加を助長する。ウイルス、酵母、カビ、細菌、昆虫、トリ、哺乳動物および植物において活性なおよび/またはこれらから単離されたターミネーターは公知であり、文献に記載されている。本発明の遺伝子構築物における使用に適したターミネーターの例としては、任意の真核生物のターミネーターまたはウイルスターミネーター、例えば、ウシ成長ホルモンポリAまたはSV40ポリAが挙げられる。このようなポリアデニル化シグナルは当分野で公知である。
【0188】
さらに、本発明は、本明細書において上記の本発明による単離されたプロモーターまたは遺伝子構築物を含む宿主細胞を包含する。本発明の特定の実施形態では、宿主細胞は、細菌、藻類、真菌、酵母、植物、昆虫または動物宿主細胞から選択される。
【0189】
好ましい実施形態では、宿主細胞は疾患状態の細胞、好ましくはがん細胞である。
【0190】
さらに、本発明は、
(a)核酸を、本明細書において上記の本発明による単離された核酸に、例えば、配列番号130〜191もしくは配列番号5〜66のうちの1つまたはそのバリアントもしくは断片に作動可能に連結させること、および
(b)得られた遺伝子構築物を細胞内に、好ましくは疾患状態の細胞、より好ましくはがん細胞に導入することを含む、細胞内の核酸の発現を駆動および/または調節するための方法を提供する。
【0191】
好ましくは、(a)の作動可能に連結させる核酸は本発明による核酸と非相同性である。
【0192】
この方法に、さらに、形質転換された細胞を、成長が促進される、再生が促進されるおよび/または成熟が促進される条件下で培養することを含めてもよい。
【0193】
さらに、作動可能に連結された核酸の発現は、生物体、好ましくは哺乳動物の特定の細胞、組織または器官において駆動および/または調節され得る。したがって、本発明は、一部の実施形態において、発現が構成的発現または組織特異的発現である上記の方法を提供する。このような実施形態については、本発明によるプロモーターの特異的発現パターンを記載し、種々の型の組織特異的発現を詳述している実施例のセクションを参照されたい。
【0194】
さらに、本発明は、作動可能に連結された核酸の発現を駆動および/または調節するための本明細書において上記に規定の単離された核酸の使用を包含する。
【0195】
本発明の他の目的および利点は、本明細書および添付の特許請求の範囲を図面とともに読むことで確認され得る。本発明のより完全な理解のためには、添付の図面に関して行なった以下の説明を参照されたい。図において:
【図面の簡単な説明】
【0196】
図1図1は、本発明の方法の一実施形態の模式図である。
図2図2は、ベクターpSmoothyのベクター図である。このベクターの配列は配列番号4である。
図3A図3は、HT29細胞((a)HT29;(b)HT29−SYN 分取前;(c)HT29−SYN 分取後)の蛍光分取データである。
図3B図3は、HT29細胞((a)HT29;(b)HT29−SYN 分取前;(c)HT29−SYN 分取後)の蛍光分取データである。
図4図4は、プライマーSYN1SおよびSYN1ASを用いて増幅させたPCR産物のアガロースゲルである。種々のレーンは、L1:CRC細胞への形質導入前のpSmoothyレトロウイルスライブラリー1;L2:CRC細胞への形質導入前のpSmoothyレトロウイルスライブラリー2;HT29:対照;S1:HT29形質導入細胞の第1分取;S2:HT29形質導入細胞の第2分取を示す。
図5A図5Aは、140種類の潜在的合成プロモーターの各々により、結腸直腸がん細胞(HT29、DLD−1、HCT−116およびRKO細胞の平均;各プロモーターについて上側の欄;薄い灰色)とHELA対照細胞(各プロモーターについて下側の欄;濃い灰色)(対比)で得られたLacZ遺伝子発現レベルである(pCMV−β対照プラスミドで得られた発現レベルに対して標準化)。
図5B図5Bは、異なるプロモーター(CMV−β;ムチン−1;CRCSE配列番号5)でトランスフェクトしたHT29およびNEUR02A細胞のLacZ発現である。
図6A図6Aは、対照HELA細胞ならびにCRC細胞株;HCT116、HT29、DLD1およびRKOにおける平均活性を有するプロモーターでのGFPを発現している細胞の割合を示すFACS解析である。GFP細胞はR2ゲートに存在している。
図6B図6Bは、本発明の方法の一実施形態によって作製した異なるプロモーターに関する活性の測定値である。
【0197】
図1は、転写促進組合せプロモーターカセットを作製および選択する方法の一例の流れ図を示す。
【0198】
この例示的な方法において、第1工程(10)では、いくつかの異なる供給源から単離されたがん細胞において発現が異常に調節されると同定された複数の遺伝子のいずれかと関連している複数の転写因子調節エレメントを提供する。
【0199】
この例示的な方法の第2工程(12)では、前記転写因子調節エレメントをいくつかの所定の基準に従って選択する。この例では、第1基準として、前記転写因子調節エレメントは、がん細胞で異常に調節されることがわかっている遺伝子の50パーセントより多くの遺伝子において近接近距離内に存在していなければならない。この例の第2基準として存在頻度および第3基準として前記転写因子調節エレメントのヌクレオチド長はどちらも、以下の関係:頻度(1/長さ)(頻度は上記に定義したとおり)に従って候補調節エレメントを同定するために使用される。
【0200】
好ましい実施形態では、結腸がんの場合の候補調節エレメントは表3に示した配列である。
【0201】
この例示的な方法の次の工程(14)では、工程(12)で選択したランダム組合せ転写因子調節エレメントのライブラリーを構築する。
【0202】
この例示的な方法の次の工程(16)では、組合せ転写因子調節エレメントを、ベクター内のレポーター遺伝子が続く最小限プロモーターの上流に挿入する。好ましくは、各ベクターには1つの組合せ転写因子調節エレメントを挿入する。
【0203】
この例示的な方法の次の工程(18)では、ベクターを宿主細胞内に挿入する。
【0204】
次の工程(20)では、その細胞をそのレポーター遺伝子の発現の向上を示す細胞に関してスクリーニングし、そのライブラリーからの組合せプロモーターカセットを含む細胞を同定する。
【実施例】
【0205】
1.結腸直腸がんにおいて上方制御される遺伝子の選択
表2は、Rhodesらによって行なわれた試験での結腸がん供給源によるマイクロアレイデータのメタ解析によって同定された遺伝子の選択を示す(Rhodes et al(2004)PNAS 2004;101;9309-14)。これにより、結腸直腸がん生検において上方制御されることが示された表2に示した17個の遺伝子の同定がもたらされた。
【0206】
次いで、転写因子環境の改変の状況において活性なシス調節エレメントを選択するため、過剰発現が染色体の増幅ではなく転写因子活性化の改変の結果であることを確実にするために、これらの遺伝子をスクリーニングした。これにより、3つの遺伝子:TOP2A、SMARCA4およびTRAF4(を表示)の除外がもたらされた。
【0207】
さらに、結腸直腸がんでの過剰発現が以前に独立した方法によって示された遺伝子を見出すため、pubmedを用いて文献を検索した。発現レベルおよび検出に使用されたアッセイに応じて、遺伝子を、「+++」;過剰発現を裏付けるかなりの証拠、「++」;過剰発現を裏付ける有意な証拠、および「+」;過剰発現を裏付ける証拠としてスコアリングした。
【0208】
コンピュータ処理力の改善のため、本発明の目的は、識別的に調節されるすべての遺伝子のすべての調節配列を解析することである。したがって、この選択工程は任意選択にすぎない。
【0209】
遺伝子は、結腸直腸がんにおける過剰発現に関するさらなる証拠がみられない場合は除外した。最後に、結腸がん細胞において特異的に活性な合成プロモーターを形成するためのシス調節エレメントを選択するという考えにより、以下の7つの遺伝子の調節領域を調べた:PLK、G3BP、E2−EPF、MMP9、MCM3、PRDX4およびCDC2。
【0210】
2.上方制御される遺伝子による調節エレメントの同定
結腸直腸がんにおいて上方制御される遺伝子が決定されたら、各遺伝子(合計7つの遺伝子)のヌクレオチド配列を上流/下流5kbとともに、UCSC Golden-Path(www.genome.ucsc.edu)からUCSC Genome Browser on Human March 2006 Assembly(http://genome.ucsc.edu/cgi-bin/hgTracks?org=human)の使用を伴って取得した。BIOBASE Biological Databases(www.gene-regulation.com)を使用し、読み出した各配列をTRANSFAC Factor Tableに対して、調節エレメントを同定するためのヌクレオチド配列に対する検索のためのTFBLASTプログラム(www.gene-regulation.com/cgi-bin/pub/programs/tfblast/tfblast.cgi)のBLASTX検索ツール(バージョン2.0.13)を使用することによりBLAST処理した。調節エレメントの選択は、有意に高い(0.7〜1.0)対応コンセンサス配列との配列相同性(同一性閾値)を基準にしたが、スコアまたは長さの閾値に対する制限は課さなかった。有意なe値(<1e−03)を有するとともに選択した種(ホモサピエンス)に属する共通調節エレメントのリストを得るため、対象遺伝子のBLAST結果を相互参照した。さらに検討すると、結腸がん遺伝子リストにより、(a)有意なe値が7つのすべての遺伝子で示された(b)多くの共通調節エレメントが7つのすべての遺伝子に存在していた、(c)結腸がん遺伝子リストに存在する遺伝子の大部分が他のがん遺伝子リスト(データ示さず)にも存在している、ならびに(d)遺伝子過剰発現を裏付けるかなりの/有意な証拠が発現レベルおよび検出に使用されたアッセイにより確立されたため、調節エレメントの良好な証拠が示された。
【0211】
結腸がん遺伝子リストの対象の7つの遺伝子配列を、PATCH public 1.0(Pattern Search for Transcription Factor Binding Sites)(http://www.gene-regulation.com/cgi-bin/pub/programs/patch/bin/patch.cgi)(BIOBASE Biological Databasesより)の使用を伴ってさらに調査した。検索はすべての部位に対して行ない、最低部位長は7塩基、ミスマッチの最大数は0、ミスマッチペナルティは100、およびスコア下限は100とした。7つのすべての遺伝子配列の結果を、これらをひとまとめにグルーピングし、ホモサピエンス以外すべての転写因子結合部位を除外することによりさらに解析した。
【0212】
次いで、各転写因子結合部位が、結腸がん細胞で上方制御されると最初に同定された7つの遺伝子の近接近距離内に存在する頻度を調べることを進めた。場合によっては、1種類の配列を評価対象の単一の遺伝子の近距離内に何度も存在させた。したがって、転写因子結合部位の存在頻度を調べるため;すべての遺伝子において結合部位が検出された各回数の合計を計算し、次いで、すべての遺伝子に存在するすべての結合部位の合計を共通分母として使用した。
【0213】
3.スクリーニングライブラリーへの導入のための調節エレメントの選択
結腸直腸がんにおいて上方制御されると同定された7つの遺伝子配列に5854回存在した合計328個のシス調節配列を同定した。次いで、最も高い割合で存在し、かつ遺伝子間で最も高いレベルの保存を示すシス調節配列を同定した。
【0214】
これを行なうため、以下の2つの基準:
A:遺伝子発現プロフィールスクリーニングによって同定された7つの遺伝子のうち4つもしくはそれ以上に存在していた、すなわち、候補遺伝子の50パーセントより多くの遺伝子において調節領域内に存在していた
B:次いで、遺伝子調節領域に最も高い頻度で存在するシス調節配列を、続いて以下の選択基準(SYN値):
(シス配列の頻度)(1/シス配列の長さ(単位:bp))>0.5
を用いて解析した
に従ってライブラリー構築のための配列を選択した。
【0215】
選択基準のSYN値は、長い配列(これは、低頻度で存在し得る)ほど実際に高度な保存が示され得、したがって結腸がん細胞における遺伝子発現の特異的な駆動に重要(by important)であり得ることが考慮されているという利点を有する。
【0216】
次いで、最も高いSYN値を有する10個のシス調節配列(表3に示す)を合成し、結腸直腸がん細胞株における合成プロモーターの選択のためのレトロウイルスベクターライブラリーの作出に使用した。
【0217】
4.レトロウイルススクリーニングライブラリーの構築および結腸がん細胞におけるスクリーニング
結腸直腸がん細胞において最適な活性を有するプロモーターを選択するため、Edelmanら(2000)に記載のもの[PNAS 97(7),3038-43]と同様のプロトコルを使用した。簡単には、10個の選択シスエレメントに対応するセンスおよびアンチセンスオリゴヌクレオチドを、アニーリング後にTCGA5’突出端を含むように設計した。次いで、アニーリングしたオリゴヌクレオチドを、T4リガーゼを用いて一緒に無作為にライゲートし、0.3〜1.0kbの範囲のライゲートされたオリゴヌクレオチドを、1.0%アガロースゲルからの抽出によって選択した。また、Gatewayクローニング手法を使用することも可能である。次いで、このような無作為にライゲートさせたオリゴヌクレオチドを、続いてレトロウイルスライブラリーpSmoothyベクター(図2;配列番号4)にライゲートした。このベクターは、Xho I制限酵素で処理しておいたものであり、ライブラリーの複雑さは、エレクトロポレーターを使用し、スーパーコンピテントTop10菌においてライゲーション反応の1/50での形質転換によって測定した。次いで、104コロニーより高い複雑さを有するpSmoothyライブラリー由来プラスミドDNAを拡大培養し、レトロウイルスベクターの作出に使用した。
【0218】
pSmoothyは、標的細胞においてGFPとネオマイシンの両方を発現する能力によって潜在的合成プロモーター配列を選択するために構築した(図2)。これは自己不活化(SIN)レトロウイルスベクターとして構築し、そのため、形質導入された細胞のゲノムに組み込まれると、その3’−UTRは、もはやプロモーターとしての機能を果たし得ない。このベクターはムチン最小プロモーターを含み、これは、プロウイルスゲノム内であってポリリンカーのすぐ下流(ここに、無作為にライゲートしたオリゴヌクレオチドが挿入される)に配置する。GFPおよびネオマイシンのコード配列は、最小プロモーターのすぐ下流に配置し、これは、これらの2つの遺伝子の発現であり、最適な活性を有する潜在的合成プロモーター配列を選択するために使用する。pSmoothy−1の配列を配列番号4に示す。
【0219】
レトロウイルスベクターは、レトロウイルスVSV−Gエンベロープ構築物を有するpSmoothyライブラリーで、GagとPolを安定的に発現する293細胞をトランスフェクトし、ウイルスベクターを48時間にわたって生成させることにより構築した。次いで、このレトロウイルスベクターライブラリーを使用し、種々の力価でHT29、DLD−1、HCT−116およびRKO結腸直腸がん細胞の形質導入を行ない、形質導入された細胞を1mg/mlのG418を用いて数週間にわたる選択に供した。図3Aは、各細胞株におけるGFP発現の有効性を示す。次いで、FACS Ariaセルソーター(BD)を使用し、最も多い量のGFPを発現している10%の細胞を選択することにより、最も多い量のGFPを発現している結腸直腸がん細胞を分取した。次いで、この分取集団を1mg/mlのG418を用いてさらなる選択に供し、次いで2回目の分取を行ない、再度、最も多い量のGFPを発現している10%の細胞を選択した(図3B;(a)HT29;(b)HT29−SYN 分取前;(c)HT29−SYN 分取後)。次いで、分取した結腸直腸がん細胞からゲノムDNAを調製し、pSmoothyベクターに特異的にハイブリダイズする以下のプライマー:
配列番号2:
SYN1S 5’−TAT CTG CAG TAG GCG CCG GAA TTC−3’
配列番号3:
SYN1AS 5’−GCA ATC CAT GGT GGT GGT GAA ATG−3’
を用いたPCRによってプロモーター配列をレスキューした。
図4は、これらのプライマーを用いてレトロウイルスで形質導入したHT29細胞のゲノムDNAの典型的なPCRを示し、このとき、いくつかの種の増幅は、第1分取(S1)後にFACS Ariaを用いて行なう。第2分取(S2)後、290bpの単一の産物が増幅された。
【0220】
次いで、このプロセスを、pSmoothyで形質導入したDLD−1、HCT−116およびRKO細胞株から単離したゲノムDNAを用いて反復し、遺伝子発現を結腸直腸がん細胞において特異的に駆動する可能性を有する合計250個の配列を単離した。
【0221】
次いで、140個の潜在的結腸がん特異的合成エンハンサーエレメント(CRCSE)がLacZレポーター遺伝子の発現を駆動する能力を、調査対象のすべての結腸直腸がん細胞株:HT29、DLD1、RKOおよびHCT116細胞において評価した。4種類の異なる結腸直腸がん細胞株において、様々な度合いのLacZ発現を広く駆動し得る24個の合成プロモーターエレメントを同定した;そのうち10個は高発現を駆動すると思われ、さらなる解析のために選択した。図5Aは、140個の潜在的合成プロモーターの各々について、結腸直腸がん細胞(HT29、DLD−1、HCT−116およびRKO細胞の平均)とHELA対照細胞(対比)で行なったLacZ遺伝子発現のレベルを示す(pCMV−β対照プラスミドで得られた発現レベルに対して標準化)。これらの細胞株から、2つの独立した試験手段、すなわち、β−ガラクトシダーゼおよび細胞染色で活性を示す5つの株を選択した。これらは、図5Aの番号001、102、103、105、106、108に対応する。対応する配列番号を表5に示す。ムチン−1最小限プロモーターなしのプロモーターの配列を、センス鎖は配列番号130〜135およびアンチセンス鎖は配列番号192〜197に示す。
【0222】
全般的に、結果により、この試験で構築した合成プロモーターは、結腸直腸がんの患者から誘導された細胞株においてのみ、効率的な遺伝子発現を駆動することが示された。具体的には、高レベルのβ−ガラクトシダーゼ発現がHT29、RKO、HCT116、Dld−1およびCaco−2細胞で検出され、最小レベルの遺伝子発現がHela、Neuro2A、MCF−7、Panc−1、CV−1および3T3細胞で検出された。さらに、この結果を、ベクターpCMV−β(CMVプロモーター)およびpDRIVE−Mucl(ムチン−1プロモーター;Invitrogen)でトランスフェクトした細胞と比較した。
【0223】
1つの合成プロモーターCRCSE−1(配列番号5,アンチセンス鎖 配列番号11)の結果を表4にまとめる((+++)高発現、(++)中発現、(+)低発現、(+/−)非常に低発現、(−)発現なし)。この結果は、この実施例に概略を示した選択手順によって、結腸がん細胞において特異的活性を有する合成プロモーターが作製され得ることを明白に示す。
【0224】
図5Bは、Lipofectamine 2000を用いてトランスフェクトし、トランスフェクションの48時間後にLacZ発現に関して染色したHT29およびNeuro2A細胞における、CRCSE−1(配列番号5;アンチセンス鎖 配列番号68)によって媒介されたLac Zの代表的な発現レベルを示す。注目すべきことに、対照細胞株、例えば、NEUR02A、NIH3T3、CV1、HELAおよびCOS−7細胞ではCRCSE−1でトランスフェクトした場合、なんらLac Zの発現は示されなかった(表4)。
【0225】
これらの配列のうち、86%相同性を基準として使用し、以下のTFESが同定され得た。全体では、使用したすべての配列はおよそ72%の相同性を示す。表5は、同定されたエレメントを示す。変異は、ネオマイシン選択手順の際に導入された可能性が高かった。最小限プロモーターは必須の結合部位であるため、各配列のこの領域内の変異は少ない。
【0226】
次いで、各プロモーター内に存在するシスエレメントの数がプロモーターの強度と特異性の重要な指標であるかどうかを評価した。高度のストリンジェンシーでプロモーター配列を選択するため;すなわち、インプットオリゴヌクレオチドと100%の相同性を有するシスエレメントを含むプロモーターを選択するための方法を行なった。したがって、CRC細胞ゲノムDNA(上記)から単離したプロモーターライブラリーから、さらに82個の配列をpBluescript II KSM内にサブクローニングした;発現解析前に、各クローンの配列を解析した。これらの82個の配列から、インプットオリゴヌクレオチドと100%の相同性を有するシス調節エレメントを含む55個を同定した(配列番号11〜配列番号66;アンチセンス鎖 配列番号68〜配列番号129,表6および7;これらの配列はすべて、ムチン−1最小限プロモーターを含む。また、このプロモーターを含まない配列を表6に示す)。対照として、10個すべてのシス調節エレメントのランダムライゲーション産物由来の配列を、CRC細胞株での選択前にサブクローニングした。結果により、平均で、非選択配列では配列1つあたり2.2個しかシス調節エレメントが見られないのに対して、CRC細胞株による選択に供したプロモーター1つあたりのエレメントは4.0個であることが示された(p<0.001;マンホイットニーのノンパラメトリック検定)。実際、対照群では3個/22個の配列のみに4つもしくはそれ以上のシス調節エレメントが含まれていたのに対して、選択に供した群のシスエレメントには、31個超/55個のプロモーターに4つもしくはそれ以上が含まれていた。さらに、0.6より大きいSYN値を有するシスエレメントは、55個の同定プロモーター内の全エレメントの70.0%であり、したがって、SYN選択式の重要性が確認された。特定のシス調節エレメントの存在を発現のレベルと特異性に相関させるため、28個/31個のプロモーターをpSmoothyレトロウイルスベクター内に挿入し、CRC細胞においてGFP発現を駆動するその能力を、HELA対照細胞株と比較してモニタリングした。
【0227】
GFP発現の効率をFACS解析によって測定し、FL1チャネルにおいて200単位の閾値の値より高い蛍光を発している細胞の割合をすべてのプロモーターについて求めた。細胞株にもよるが、平均1.0〜10.0%のGFP発現細胞で、このレベルより高い蛍光が示された。解析したすべてのプロモーターで、CRC細胞株(HCT116、HT29、DLD1およびRKO)においてHELA対照細胞株と比べると有意に高いレベルの発現が得られた;このとき、GFP陽性は少数割合の細胞のみであった。これを図6Aに示す。この図は、プロモーター230;すべてのCRC細胞株においてGFPを平均レベルまで発現させた合成プロモーターによるFACSの結果を含む;図6B参照。どのプロモーターが最も効率的であるかを同定するため、すべての細胞株において各プロモーターでの発現比率を求めた;この発現比率は、個々の各プロモーターでの閾値の値より高いGFPを発現している細胞の割合を、すべてのプロモーターでの閾値より高いものの平均割合で除算したものと規定した。この解析の結果を図6Bに示す。この図は、プロモーター239、213、215、248および254が、すべてのCRC細胞株においてその他のプロモーターと比較して最も高い活性を示すことを示す。
【0228】
本発明者らは、さらに、どのシスエレメントによってこのようなより効率的なプロモーターが構成されるかを調べ、最も高いSYN値を有する平均5個のシスエレメントが各プロモーター内の全調節エレメントの64%に相当していることを見出した。したがって、効率的かつ選択的発現を最大限にするための最適なエレメントの選択のためのSYN値の重要性がさらに示される。
【0229】
総合すると、結果は、SYN選択式と本明細書において提供する方法が、合成プロモーターライブラリーに組み入れるシス調節エレメント(すなわち、TFRE)の選択において有用なツールであることを示す。記載の方法論を使用し、CRC細胞株において特異的にGFPまたはLac Zを効率的に発現するであろういくつかのプロモーターを構築したが、対照細胞で示された活性はないか、限定的であった。この方法は、特定の環境または疾患条件において活性となるように設計される任意の真核生物プロモーターの構築において適用され得ることが提案される。
【0230】
本発明を、いくつかの具体的な実施形態に関して説明および図示したが、当業者には、本明細書において図示し、説明し、特許請求の範囲に示した本発明の原理から逸脱することなく、変形および修正が行なわれ得ることが認識される。本発明は、その精神または必須の特徴から逸脱することなく、他の具体的な形態の実施形態で示され得る。記載の本実施形態は、あらゆる点において例示であって限定的ではないとみなされたい。したがって、本発明の範囲は、前述の説明ではなく、添付の特許請求の範囲によって示される。特許請求の範囲の意味および均等範囲に含まれるあらゆる変更は、当該範囲に包含されているものとする。
【0231】
引用した参考文献
Rhodes, D. R. et al. Mining for regulatory programs in the cancer transcriptome. Nat. Genet. 37, 579-583 (2005);
Segal, E., Friedman, N., Roller, D., & Regev, A. A module map showing conditional activity of expression modules in cancer. Nat. Genet. 36, 1090-1098 (2004);
Segal, E. et al. Module networks: identifying regulatory modules and their condition-specific regulators from gene expression data. Nat. Genet. 34, 166-176 (2003);
Wingender, E. Compilation of transcription regulating proteins. Nucleic Acids Res 16, 1879-1902 (1988);
Kel-Margoulis, 0. V., Kel, A. E., Reuter, I., Deineko, I. V., & Wingender, E. TRANSCompel : a database on composite regulatory elements in eukaryotic genes. Nucleic Acids Res 30, 332-334 (2002);
Blanco, E., Farre, D., Alba, M. M., Messeguer, X., & Guigo, R. ABS : a database of Annotated regulatory Binding Sites from orthologous promoters. Nucleic Acids Res 34, D63-D67 (2006);
Sandelin, A., Alkema, W., Engstrom, P., Wasserman, W. W., & Lenhard, B. JASPAR: an open-access database for eukaryotic transcription factor binding profiles. Nucleic Acids Res 32, D91-D94 (2004);
Jagannathan, V., Roulet, E., Delorenzi, M., & Bucher, P. HTPSELEX-a database of high-throughput SELEX libraries for transcription factor binding sites. Nucleic Acids Res 34, D90-D94 (2006);
Matys, V. et al. TRANSFAC: transcriptional regulation, from patterns to profiles. Nucleic Acids Res 31, 374-378 (2003);
Zhao, F., Xuan, Z., Liu, L., & Zhang, M. Q. TRED: a Transcriptional Regulatory Element Database and a platform for in silico gene regulation studies. Nucleic Acids Res 33, D103-D107 (2005);
Sinha, S. & Tompa, M. YMF: A program for discovery of novel transcription factor binding sites by statistical overrepre-sentation. Nucleic Acids Res 31, 3586-3588 (2003);
Sinha, S. & Tompa, M. Discovery of novel transcription factor binding sites by statistical overrepresentation. Nucleic Acids Res 30, 5549-5560 (2002);
Rebeiz, M., Reeves, N. L., & Posakony, J. W. SCORE: a computational approach to the identification of c s-regulatory modules and target genes in whole-genome sequence data. Site clustering over random expectation. Proc. Natl. Acad. Sci. U. S. A 99, 9888-9893 (2002);
Suzuki, Y., Yamashita, R., Sugano, S., & Nakai, K. DBTSS, DataBase of Transcriptional Start Sites: progress report 2004. Nucleic Acids Res 32, D78-D81 (2004);
Suzuki, Y., Yamashita, R., Nakai, K., & Sugano, S. DBTSS: DataBase of human Transcriptional Start Sites and full-length cDNAs. Nucleic Acids Res 30, 328-331 (2002);
Davuluri, R. V., Grosse, I., & Zhang, M. Q. Computational identification of promoters and first exons in the human genome. Nat. Genet. 29, 412-417 (2001);
Roth, F. P., Hughes, J. D., Estep, P. W., & Church, G. M. Finding DNA regulatory motifs within unaligned noncoding sequences clustered by whole-genome mRNA quantitation. Nat. Biotechnol. 16, 939-945 (1998);
Bussemaker, H. J., Li, H., & Siggia, E. D. Regulatory element detection using correlation with expression. Nat. Genet. 27, 167-171 (2001);
Jensen, L. J. & Knudsen, S. Automatic discovery of regulatory patterns in promoter regions based on whole cell expression data and functional annotation. Bioinformatics. 16, 326-333 (2000);
Jegga, A. G. et al. Detection and visualization of composi-tionally similar c s-regulatory element clusters in ortholo-gous and coordinately controlled genes. Genome Res 12, 1408-1417 (2002);
Dieterich, C, Wang, H., Rateitschak, K., Luz, H., & Vingron, M. CORG: a database for Comparative Regulatory Genomics. Nucleic Acids Res 31, 55-57 (2003);
Lenhard, B. et al. Identification of conserved regulatory elements by comparative genome analysis. J.Biol. 2, 13 (2003);
Karanam, S. & Moreno, C. S. CONFAC: automated application of comparative genomic promoter analysis to DNA microarray data-sets. Nucleic Acids Res 32, W475-W484 (2004);
La Rosa, P. et al. VAMP: visualization and analysis of array-CGH, transcriptome and other molecular profiles. Bioinformat-ics. 22, 2066-2073 (2006);
Jegga, A. G. et al. CisMols Analyzer: identification of compo-sitionally similar cis-element clusters in ortholog conserved regions of coordinately expressed genes. Nucleic Acids Res 33, W408-W411 (2005);
Blanchette, M. et al. Genome-wide computational prediction of transcriptional regulatory modules reveals new insights into human gene expression. Genome Res 16, 656-668 (2006);
Ferretti, V. et al. PReMod: a database of genome-wide mammalian c s-regulatory module predictions. Nucleic Acids Res 35, D122-D126 (2007);
Sharov, A. A., Dudekula, D. B., & Ko, M. S. CisView: a browser and database of c s-regulatory modules predicted in the mouse genome. DNA Res 13, 123-134 (2006);
Vega, V. B., Bangarusamy, D. K., Miller, L. D., Liu, E. T., & Lin, C. Y. BEARR: Batch Extraction and Analysis of cis-Regulatory Regions. Nucleic Acids Res 32, W257-W260 (2004);
Dubchak, I. & Ryaboy, D. V. VISTA family of computational tools for comparative analysis of DNA sequences and whole genomes. Methods Mol. Biol. 338, 69-89 (2006);
Lardenois, A. et al. PromAn: an integrated knowledge-based web server dedicated to promoter analysis. Nucleic Acids Res 34, W578-W583 (2006);
Liu, C. C. et al. CRSD: a comprehensive web server for composite regulatory signature discovery. Nucleic Acids Res 34, W571-W577 (2006);
Sun, H. et al. MPromDb: an integrated resource for annotation and visualization of mammalian gene promoters and ChlP-chip experimental data. Nucleic Acids Res 34, D98-103 (2006);
Li, X., Eastman, E. M., Schwartz, R. J., & Draghia-Akli, R. Synthetic muscle promoters: activities exceeding naturally occurring regulatory sequences. Nat. Biotechnol. 17, 241-245 (1999);
Dai, C, McAninch, R. E., & Sutton, R. E. Identification of synthetic endothelial cell-specific promoters by use of a high-throughput screen. J.Virol. 78, 6209-6221 (2004);
Needleman-Wunsch, J. Mol. Biol. 48, 443-453, (1970);
Sambrook (2001) Molecular Cloning: a laboratory manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH, New York
Rhodes et al (2004) PNAS 2004; 101; 9309-14;
Edelman et al (2000) [PNAS 97 (7), 3038-43;
【表1】

【表2】

【表3】

【表4】

【表5】

【表6】
【表7】
図1
図2
図3A
図3B
図4
図5A
図5B
図6A
図6B
【配列表】
[この文献には参照ファイルがあります.J-PlatPatにて入手可能です(IP Forceでは現在のところ参照ファイルは掲載していません)]