IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ イェダ  リサーチ  アンド  ディベロップメント  カンパニー  リミテッドの特許一覧

特表2024-500804CHD2ハプロ不全の処置における使用のための組成物及びその同定方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-01-10
(54)【発明の名称】CHD2ハプロ不全の処置における使用のための組成物及びその同定方法
(51)【国際特許分類】
   C12N 15/113 20100101AFI20231227BHJP
   C12N 15/09 20060101ALI20231227BHJP
   C12Q 1/6869 20180101ALI20231227BHJP
   A61P 25/00 20060101ALI20231227BHJP
   A61P 25/08 20060101ALI20231227BHJP
   A61P 43/00 20060101ALI20231227BHJP
   A61K 48/00 20060101ALI20231227BHJP
   A61K 31/7088 20060101ALI20231227BHJP
   A61K 31/7105 20060101ALI20231227BHJP
【FI】
C12N15/113 Z ZNA
C12N15/09 100
C12Q1/6869 Z
A61P25/00
A61P25/08
A61P43/00 105
A61K48/00
A61K31/7088
A61K31/7105
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023537335
(86)(22)【出願日】2021-12-19
(85)【翻訳文提出日】2023-08-21
(86)【国際出願番号】 IL2021051503
(87)【国際公開番号】W WO2022130388
(87)【国際公開日】2022-06-23
(31)【優先権主張番号】63/127,212
(32)【優先日】2020-12-18
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.TWEEN
(71)【出願人】
【識別番号】516040109
【氏名又は名称】イェダ リサーチ アンド ディベロップメント カンパニー リミテッド
【氏名又は名称原語表記】YEDA RESEARCH AND DEVELOPMENT CO.LTD.
【住所又は居所原語表記】at the Weizmann Institute of Science, P.O.Box 95, 7610002 Rehovot, Israel
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】ウリツキー、イゴル
(72)【発明者】
【氏名】ロス、キャロライン ジェーン
【テーマコード(参考)】
4B063
4C084
4C086
【Fターム(参考)】
4B063QA13
4B063QQ08
4B063QQ42
4B063QQ52
4B063QR08
4B063QR62
4B063QS39
4B063QX01
4C084AA13
4C084MA66
4C084NA14
4C084ZA02
4C084ZA06
4C084ZB21
4C086AA01
4C086AA02
4C086EA16
4C086MA01
4C086MA04
4C086MA66
4C086NA14
4C086ZA02
4C086ZA06
4C086ZB21
(57)【要約】
神経細胞内のクロモドメインヘリカーゼDNA結合タンパク質2(CHD2)の量を増加させる方法を提供する。前記方法は、ヒトChaserrの活性又は発現をダウンレギュレートする核酸剤を前記細胞に導入することを含み、前記核酸剤は、ヒトChaserrの最終エクソンへと指向しており、それによって、前記神経細胞内のCHD2の量を増加させる。
【特許請求の範囲】
【請求項1】
神経細胞内のクロモドメインヘリカーゼDNA結合タンパク質2(CHD2)の量を増加させる方法であって、ヒトChaserrの活性又は発現をダウンレギュレートする核酸剤を前記細胞に導入することを含み、前記核酸剤が、ヒトChaserrの最終エクソンへと指向しており、それによって、前記神経細胞内のCHD2の量を増加させる方法。
【請求項2】
クロモドメインヘリカーゼDNA結合タンパク質2(CHD2)ハプロ不全に関連する疾患又は病状の処置が必要な対象における、前記疾患又は病状を処置する方法であって、治療有効量のヒトChaserrの活性又は発現をダウンレギュレートする核酸剤を前記対象に投与することを含み、前記核酸剤が、ヒトChaserrの最終エクソンへと指向しており、それによって、前記CHD2ハプロ不全に関連する疾患又は病状を処置する方法。
【請求項3】
クロモドメインヘリカーゼDNA結合タンパク質2(CHD2)ハプロ不全に関連する疾患又は病状の処置が必要な対象においての前記疾患又は病状の処置における使用のための、ヒトChaserrの活性又は発現をダウンレギュレートする核酸剤であって、ヒトChaserrの最終エクソンへと指向した核酸剤。
【請求項4】
ヒトChaserrの最終エクソンにハイブリダイズする核酸配列を含む核酸剤である、ヒトChaserrの活性又は発現の核酸剤。
【請求項5】
前記ヒトChaserrが、配列番号11(NR_037600)、配列番号12(NR_037601)、及び配列番号13(NR_037602)からなる群より選択される選択的にスプライシングされた変異体(alternatively spliced variant)を含む、請求項1~請求項4のいずれか一項に記載の方法又は核酸剤。
【請求項6】
前記核酸剤が、配列番号2(AUGG)に相補的な配列を含む、請求項1~請求項5のいずれか一項に記載の方法又は核酸剤。
【請求項7】
前記核酸剤が、AAGAUG(配列番号5)又はAAAUGGA(配列番号6)に相補的な配列を含む、請求項1~請求項5のいずれか一項に記載の方法又は核酸剤。
【請求項8】
前記核酸剤が、UUUUUACCU(配列番号122)に相補的な配列を含む、請求項1~請求項5のいずれか一項に記載の方法又は核酸剤。
【請求項9】
前記核酸剤が、ChaserrへのDHX36の結合を阻害する、請求項1~請求項8のいずれか一項に記載の方法又は核酸剤。
【請求項10】
前記核酸剤が、ChaserrへのCHD2の結合を阻害する、請求項1~請求項8のいずれか一項に記載の方法又は核酸剤。
【請求項11】
前記核酸剤がアンチセンスオリゴヌクレオチドである、請求項1~請求項9のいずれか一項に記載の方法又は核酸剤。
【請求項12】
前記核酸剤が、2’から4’への架橋を含有する1又は複数のヌクレオチド、又は、2’-O修飾を有する1又は複数のヌクレオチドである、請求項1~請求項11のいずれか一項に記載の方法又は核酸剤。
【請求項13】
前記アンチセンスオリゴヌクレオチドが、配列番号92~99に示されるとおりである、請求項9に記載の方法又は核酸剤。
【請求項14】
前記アンチセンスオリゴヌクレオチドが、配列番号128、131、132、133、140、141、142、又は143に示されるとおりである、請求項10又は請求項12に記載の方法又は核酸剤。
【請求項15】
前記アンチセンスオリゴヌクレオチドが、2種以上のアンチセンスオリゴヌクレオチドを含む、請求項11、請求項12、及び請求項13のいずれか一項に記載の方法又は核酸剤。
【請求項16】
前記2種以上のアンチセンスオリゴヌクレオチドが、配列番号140又は配列番号128のASO40、及び配列番号144又は配列番号134のASO41を含む、請求項15に記載の方法又は核酸剤。
【請求項17】
前記核酸剤がRNAサイレンシング剤(RNA silencing agent)である、請求項1~請求項10のいずれか一項に記載の方法又は核酸剤。
【請求項18】
前記核酸剤がゲノム編集剤(genome editing agent)である、請求項1~請求項10のいずれか一項に記載の方法又は核酸剤。
【請求項19】
前記核酸剤が、誘導可能に活性である(is active in an inducible manner)、請求項1~請求項18のいずれか一項に記載の方法又は核酸剤。
【請求項20】
前記核酸剤が、組織特異的又は細胞特異的に活性である(is active in a tissue or cell-specific manner)、請求項1~請求項10のいずれか一項に記載の方法又は核酸剤。
【請求項21】
前記クロモドメインヘリカーゼDNA結合タンパク質2(CHD2)ハプロ不全に関連する疾患又は病状は、知的障害、自閉症、てんかん及びレノックス・ガストー症候群(LGS)からなる群より選択される、請求項2~請求項20のいずれか一項に記載の方法又は核酸剤。
【請求項22】
複数の相同なポリヌクレオチドを記述する配列のセットを分析する方法であって、
層に配置された複数のノードと、連続する層のノード同士を連結する複数のエッジとを有するグラフを構築すること、ここで、第1の層がクエリポリヌクレオチドを記述する配列を表し、各ノードがそれぞれの配列内のk量体(k-mer)を表し、各エッジが同一の又は相同なk量体を表すノード同士を連結し、kが6~12であるように、各層が前記セットのうちのある配列(a sequence of the set)を表す;
前記グラフのエッジに沿った連続的な非交差経路を求めて前記グラフを検索すること;及び
機能に関心が持たれる核酸配列として、少なくとも1つの経路に対応するk量体を同定する出力を生成すること
を含む方法。
【請求項23】
前記出力を生成することの前に、毎回より短くなるについて、前記構築すること及び前記検索することを反復的に繰り返すことを含む、請求項22に記載の方法。
【請求項24】
前記方法が、各反復サイクルで、前記検索のための制約として、前の反復サイクルで得られた経路を適用することを含む、請求項23に記載の方法。
【請求項25】
前記検索することが、浅い方の経路よりも深い方の経路に対して検索が優先的であるように、前記検索のための制約として経路深度による基準を適用することを含む、請求項22~請求項24のいずれか一項に記載の方法。
【請求項26】
前記検索することが、整数線形計画法(Integer Linear Program:ILP)を前記グラフに適用することを含む、請求項22~請求項25のいずれか一項に記載の方法。
【請求項27】
前記相同なポリヌクレオチドがDNA配列である、請求項22~請求項25のいずれか一項に記載の方法。
【請求項28】
前記相同なポリヌクレオチドがRNA配列である、請求項22~請求項25のいずれか一項に記載の方法。
【請求項29】
複数のアライメント層を有するマルチプルアライメントを提供するように、前記セット内の前記配列を所定の順序に従ってアライメントすることを含み、ここで第1の層は、前記複数の相同なポリヌクレオチドのうちの前記クエリポリヌクレオチドであり、前記複数のアライメント層は、前記グラフのそれぞれの層に対応する、請求項22~請求項28のいずれか一項に記載の方法。
【請求項30】
前記所定の順序は、進化によって決定され(evolution-dictated)、任意に(optionally)、前記クエリは、前記相同なポリヌクレオチドにおいて最も進化が進んだものである、請求項29に記載の方法。
【請求項31】
前記相同なk量体の間の相同性が70%以上である、請求項22~請求項30のいずれか一項に記載の方法。
【請求項32】
前記相同なポリヌクレオチドが、部分配列を含む、請求項22~請求項31のいずれか一項に記載の方法。
【請求項33】
前記相同なポリヌクレオチドが、3’UTR、lncRNA及びエンハンサーからなる群より選択される、請求項22~請求項32のいずれか一項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2020年12月18日に出願された米国仮特許出願第63/127,212号明細書の優先権の利益を主張し、その全体を本明細書に組み込む。
【0002】
(配列表の記載)
本出願の出願と同時に提出された、61,440バイトを含む、2021年12月19日に作成された89180SequenceListing.txtという名称のASCIIファイルは、参照により本明細書に組み込まれる。
【0003】
本発明は、そのいくつかの実施形態では、CHD2ハプロ不全の処置に使用するための組成物、及びその同定方法に関する。
【背景技術】
【0004】
クロモドメインヘリカーゼDNA結合タンパク質2(Chd2)遺伝子は、CHD1とともにクロモドメインヘリカーゼDNA結合(CHD)タンパク質ファミリーのサブファミリーIに属するATP依存性クロマチンリモデリング酵素をコードする。このサブファミリーのメンバーは、N末端領域に位置する2つのクロモドメインと、中央に位置するSNF2様ATPアーゼドメインとを特徴とし[Tajul-Arifin,K.et al.Identification and analysis of chromodomain-containing proteins encoded in the mouse transcriptome.Genome Res.13,1416-1429(2003)]、ヌクレオソームの分解、排除、スライド及びスペーシングを促進する[Narlikar,G.J.,Sundaramoorthy,R.&Owen-Hughes,T.Mechanisms and functions of ATP-dependent chromatin-remodeling enzymes.Cell 154,490-503(2013)]。
【0005】
ヒトでは、CHD2ハプロ不全は、神経発達遅延、知的障害、てんかん及び問題行動に関連する[Lamar,K.-M.J.&Carvill,G.L.Chromatin remodeling proteins in epilepsy:lessons from CHD2-associated epilepsy.Front.Mol.Neurosci.11,208(2018)に概説されている]。マウスモデル及び細胞株を対象とした試験もまた、ニューロン機能不全にChd2が関与することを示している。
【0006】
記載されている症例ではいずれも、これらの個体はCHD2に関してハプロ不全であり、したがって、CHD2のインタクトなWTコピーを有する。したがって、例えば、アンチセンスオリゴヌクレオチドを使用することによるChaserrの乱れを介したCHD2発現の増加は、治療上の利益を有する可能性がある。
【0007】
複数の証拠の系統が、長い非コードRNA(lncRNA)機能とクロマチン修飾複合体の機能との間に強い関連があることを指し示している[Han,P.&Chang,C.-P.Long non-coding RNA and chromatin remodeling.RNA Biol.12,1094-1098(2015)]。多数のクロマチン修飾因子がlncRNAと相互作用することが報告されている[Han et al.、上記]。さらに、脊椎動物ゲノム内のlncRNAは、多数のクロマチン関連タンパク質を含む転写関連因子をコードする遺伝子の近傍で富化されているが[Ulitsky,I.,Shkumatava,A.,Jan,C.H.,Sive,H.&Bartel,D.P.Conserved function of lincRNAs in vertebrate embryonic development despite rapid sequence evolution.Cell 147,1537-1550(2011)]、これらのlncRNAの大部分の機能は未知のままである。
【0008】
本発明者らによる以前の研究は、マウスではChd2(Rom et al.Nature Communications 2019 10:5092):1810026B05Rik(Chaserrとして示される、CHD2隣接抑制調節RNA(CHD2 adjacent,suppressive regulatory RNA)について)及びヒトではLINC01578/LOC100507217(CHASERR)の上流に位置する保存されたlncRNAであるChaserrの存在を開示しており、Chd2と同じ鎖の上流に見出され、Chd2と同じ鎖から転写される、ほぼまったく特徴解析されていないlncRNAである。
【0009】
Chaserrは、CHD2タンパク質と協調して作用して、適切なChd2発現レベルを維持する。マウスにおけるChaserrの喪失は、ホモ接合マウスでは早期の出生後致死、及びヘテロ接合体では重度の成長遅延をもたらす。機構的には、Chaserrの喪失は、Chd2 mRNA及びタンパク質のレベルを実質的に増加させ、これにより、高度に発現された遺伝子の下流に見出されるプロモーターを阻害することによる転写干渉がもたらされる。Chaserr産生は、シスのみでChd2発現を抑制し、Chd2が乱された場合にもChaserr喪失の表現型結果が救済される。したがって、Chaserrを標的とすることは、ハプロ不全個体では、CHD2レベルを増加させるための戦略になる可能性がある。
【0010】
追加の背景技術には、以下が含まれる。
www(dot)iscb(dot)org/cms_addon/conferences/ismb2020/postersdotphp?track=RegSys%20COSI&session=Bgithub(dot)com/lncLOOM/lncLOOM
【発明の概要】
【0011】
本発明のいくつかの実施形態の一態様によれば、神経細胞内のクロモドメインヘリカーゼDNA結合タンパク質2(CHD2)の量を増加させる方法であって、ヒトChaserrの活性又は発現をダウンレギュレートする核酸剤(nucleic acid agent)を細胞に導入することを含み、前記核酸剤が、ヒトChaserrの最終エクソンへと指向しており、それによって、神経細胞内のCHD2の量を増加させる方法が提供される。
【0012】
本発明のいくつかの実施形態の一態様によれば、クロモドメインヘリカーゼDNA結合タンパク質2(CHD2)ハプロ不全に関連する疾患又は病状の処置が必要な対象における、前記疾患又は病状を処置する方法であって、治療有効量のヒトChaserrの活性又は発現をダウンレギュレートする核酸剤を前記対象に投与することを含み、前記核酸剤が、ヒトChaserrの最終エクソンへと指向しており、それによって、前記CHD2ハプロ不全に関連する疾患又は病状を処置する方法が提供される。
【0013】
本発明のいくつかの実施形態の一態様によれば、クロモドメインヘリカーゼDNA結合タンパク質2(CHD2)ハプロ不全に関連する疾患又は病状の処置が必要な対象においての前記疾患又は病状の処置における使用のための、ヒトChaserrの活性又は発現をダウンレギュレートする核酸剤であって、ヒトChaserrの最終エクソンへと指向した核酸剤が提供される。
【0014】
本発明のいくつかの実施形態によれば、前記ヒトChaserrは、配列番号11(NR_037600)、配列番号12(NR_037601)、及び配列番号13(NR_037602)からなる群より選択される選択的にスプライシングされた変異体(alternatively spliced variant)を含む。
【0015】
本発明のいくつかの実施形態によれば、前記核酸剤は、配列番号2(AUGG)を含む核酸配列エレメントにハイブリダイズする。
【0016】
本発明のいくつかの実施形態によれば、前記核酸剤は、AAGAUG(配列番号5)及びAAAUGGA(配列番号6)からなる群より選択される核酸配列エレメントにハイブリダイズする。
【0017】
本発明のいくつかの実施形態によれば、前記核酸剤は、AAGAUG(配列番号5)及び/又はAAAUGGA(配列番号6)を含む核酸配列エレメントにハイブリダイズする。
【0018】
本発明のいくつかの実施形態によれば、前記核酸剤は、ChaserrへのDHX36の結合を阻害する。
【0019】
本発明のいくつかの実施形態によれば、前記核酸剤はアンチセンスオリゴヌクレオチドである。
【0020】
本発明のいくつかの実施形態によれば、前記アンチセンスオリゴヌクレオチドは、配列番号92~99(ここで、TはUによって置換されている)に記載の核酸塩基配列を有する。
【0021】
本発明のいくつかの実施形態によれば、前記核酸剤はRNAサイレンシング剤である。
【0022】
本発明のいくつかの実施形態によれば、前記核酸剤はゲノム編集剤(genome editing agent)である。
【0023】
本発明のいくつかの実施形態によれば、前記核酸剤は、誘導可能に活性である(is active in an inducible manner)。
【0024】
本発明のいくつかの実施形態によれば、前記核酸剤は、組織特異的又は細胞特異的に活性である(is active in a tissue or cell-specific manner)。
【0025】
本発明のいくつかの実施形態によれば、前記クロモドメインヘリカーゼDNA結合タンパク質2(CHD2)ハプロ不全に関連する疾患又は病状は、知的障害、自閉症、てんかん及びレノックス・ガストー症候群(LGS)からなる群より選択される。
【0026】
本発明のいくつかの実施形態の一態様によれば、複数の相同なポリヌクレオチドを記述する配列のセットを分析する方法であって、
層に配置された複数のノードと、連続する層のノード同士を連結する複数のエッジとを有するグラフを構築すること、ここで、第1の層がクエリポリヌクレオチドを記述する配列を表し、各ノードがそれぞれの配列内のk量体を表し、各エッジが同一の又は相同なk量体を表すノード同士を連結し、kが6~12であるように、各層が前記セットのうちのある配列(a sequence of the set)を表す;
前記グラフのエッジに沿った連続的な非交差経路を求めて前記グラフを検索すること;及び
機能に関心が持たれる核酸配列として、少なくとも1つの経路に対応するk量体を同定する出力を生成すること、を含む方法が提供される。
【0027】
本発明のいくつかの実施形態によれば、前記方法は、前記出力を生成することの前に、毎回より短くなるk量体について、前記構築すること及び前記検索することを反復的に繰り返すことを含む。
【0028】
本発明のいくつかの実施形態によれば、前記方法は、各反復サイクルで、前記検索のための制約として、前の反復サイクルで得られた経路を適用することを含む。
【0029】
本発明のいくつかの実施形態によれば、前記検索することは、浅い方の経路よりも深い方の経路に対して検索が優先的であるように、前記検索のための制約として経路深度による基準を適用することを含む。
【0030】
本発明のいくつかの実施形態によれば、前記検索することは、整数線形計画法(Integer Linear Program:ILP)を前記グラフに適用することを含む。
【0031】
本発明のいくつかの実施形態によれば、前記相同なポリヌクレオチドはDNA配列である。
【0032】
本発明のいくつかの実施形態によれば、前記相同なポリヌクレオチドはRNA配列である。
【0033】
本発明のいくつかの実施形態によれば、前記方法は、複数のアライメント層を有するマルチプルアライメントを提供するように、前記セット内の前記配列を所定の順序に従ってアライメントすることを含み、ここで第1の層は、前記複数の相同なポリヌクレオチドのうちの前記クエリポリヌクレオチドであり、前記複数のアライメント層は、前記グラフのそれぞれの層に対応する。
【0034】
本発明のいくつかの実施形態によれば、前記所定の順序は、進化によって決定され(evolution-dictated)、任意に、前記クエリは、前記相同なポリヌクレオチドにおいて最も進化が進んだものである。
【0035】
本発明のいくつかの実施形態によれば、前記相同なk量体の間の相同性は70%以上である。
【0036】
本発明のいくつかの実施形態によれば、前記相同なポリヌクレオチドは、部分配列を含む。
【0037】
本発明のいくつかの実施形態によれば、前記相同なポリヌクレオチドは、3’UTR、lncRNA及びエンハンサーからなる群より選択される。
【0038】
他に定義されない限り、本明細書で使用されるすべての技術用語及び/又は科学用語は、本発明が属する技術分野の当業者によって一般的に理解されるのと同じ意味を有する。本明細書に記載の方法及び材料と類似又は同等の方法及び材料を本発明の実施形態の実施又は試験に使用することができるが、例示的な方法及び/又は材料を以下に記載する。矛盾する場合、定義を含む特許明細書が優先する。さらに、材料、方法及び例は例示にすぎず、必ずしも限定することを意図するものではない。
【0039】
本発明のいくつかの実施形態は、添付の図面を参照して、単なる例として本明細書に記載されている。ここで図面を詳細に具体的に参照すると、示されている詳細は例としてのものであり、本発明の実施形態の例示的な説明のためのものであることが強調される。この点に関して、図面を用いて行われる説明は、本発明の実施形態がどのように実施されうるかを当業者に明らかにする。
【図面の簡単な説明】
【0040】
図1A図1A~Bは、「LncLOOM」フレームワークと呼ばれる核酸配列エレメントを発見するための実施形態の概要を提供する。(A)LncLOOM法の概要。LncLOOMは、配列の順序付きリストを処理し、miRNA結合部位又はRBP結合部位としてさらにアノテーションされうる、様々な深度まで保存された順序付きモチーフのセットを回収(recover)する。
図1B】(B)長い非交差経路を見つけるための整数線形計画法(ILP)を使用したグラフ構築及びモチーフ発見の概略図。配列は、最上層(ヒト)からの進化距離が単調に増加するように順序付けられる。エッジの配置を制約するために使用されうるBLAST高スコアリングペア(BLAST high-scoring pair(HSP))(「方法」を参照)は、各配列の下にピンク色及び赤色のブロックとして示されている。グラフをILP問題の構築に使用し、その解を、保存されたシンテニーモチーフ(配列番号29~32)に対応する長い経路のセットの構築に使用する。
図2A図2A~Fは、Cyrano lncRNAにおける保存されたエレメントの発見を示す。(A)選択された種におけるCyranoエクソンのゲノム構成の概要。
図2B】(B)LncLOOMによって、少なくとも17種のCyranoにおいて保存されていると同定された配列エレメント。ヒトCyrano配列とゼブラフィッシュCyrano配列との間でBLASTによってアライメント可能な領域に見られるエレメントを含有する領域を丸で囲んでいる。エレメント間の数字は、18種のエレメント間の範囲距離を示す。各エレメントの上の丸数字は、本文及び他のパネルで使用されるエレメント番号を示す。
図2C】(C)Cyranoにおける予測された結合エレメントと、miR-25/92 miRNA及びmiR-7 miRNAとの間の対合。
図2D】(D)ヒトゲノムにおけるUGUAUAGモチーフ(網掛け領域)へのPUM1及びPUM2の結合の証拠。ENCODEプロジェクトCLIPデータ(上部、K562細胞)及び22(下部、HCT116細胞)。網掛けは、ENCODEプロジェクトによって定義された結合証拠の強度に基づく。
図2E】(E)Pum1/2及びRbfox1/2によるマウスCyrano配列の結合及び調節。上部:マウス脳及びmESCからのPum1/2 CLIP及びRNA-seqデータ。中央:マウス脳及びmESCからのRbfox1 CLIP。Pumilio及びRbfoxの結合モチーフは、それぞれ黄色及び青色で強調されている。PhyloP配列保存スコアは、UCSCゲノムブラウザからのものである。下部:Cyranoの3’末端付近のmiR-153結合部位の領域へのマウス脳におけるAgo2の結合。
図2F-1】(F)からのCLIPデータ 左上:Cyranoの5’末端付近の保存されたAUGGCGモチーフを囲む領域のアライメント。右上及び下部:キュレートされた複数のデータセットからの複合Ribo-seq及びRNA-seqデータ。ENCODEプロジェクトからのK562細胞株におけるYY1のChip-seqデータ。読出しカバレッジ及びIDRピークが示されている。パネルに示される配列は、配列番号33~42及び53~67としてマークされている。
図2F-2】同上。
図3A図3A~Eは、CHASERR lncRNAにおける保存されたエレメントの発見を示す。(A)保存の深度によって色分けされた少なくとも4種で保存されたモチーフとともに、ヒトCHASERR遺伝子構造が示されている。最終エクソンの領域が拡大され、本文で説明されるモチーフが強調されている。
図3B】(B)共有AARAUGRモチーフを網掛けした、2つの最も保存されたモチーフに隣接する配列の配列ロゴ(パネルに示されている配列は、配列番号68としてマークされている)。
図3C】(C)上部:qRT-PCRに使用したプライマーペアの位置と、GapmeR(で使用したものと同じもの)及びASOによって標的とされた領域とを強調したマウスChaserr遺伝子座。下部:示された試薬を用いて処理したN2a細胞内のChaserrエクソン(上部に示す)又はChd2エクソンを標的とするプライマーを用いたqRT-PCR、ASO処理についてはn=4、GapmeRについてはn=5。
図3D】(D)Chaserr最終エクソンのWT配列を有するプルダウンと、保存されたエレメントが変異した最終エクソンとの間のMS強度の比較のためのボルケーノプロット(図8A)。
図3E】(E)示された抗体によるIP後の示された領域を標的とするプライマーを使用するqRT-PCR、n=4。右上:示された試料に対して抗DHX36抗体を使用したウエスタンブロット。図に示される配列は、配列番号68としてマークされている。
図4-1】図4は、PUM1及びPUM2の3’UTRにおける保存されたエレメントの同定を示す。ヒト配列が示されており、少なくとも7つの種において保存されたモチーフは、それらの保存に基づいて色分けされている。超保存UGUACAUU(配列番号14)モチーフの出現がボックス内にある。パネルに示される配列は、配列番号69~70としてマークされている。
図4-2】同上。
図5A図5A~Iは、LncLOOMを用いた3’UTRにおける保存されたモチーフのGlobal分析を示す。(A)ヒト配列(黒色)に対して、又はマウス、イヌ及びニワトリ配列(灰色)に対して有意なアライメントを有しなかった様々な数のオルソログ配列を有する遺伝子の数。
図5B】(B)ヒト3’UTR配列にアライメントしなかった、示された数の配列内において保存されている固有のk量体の組合せの分布。
図5C】(C)種当たりのLncLOOMが同定した固有のk量体(ピンク色)の総数及びそれらの全例(暗赤色)の定量。広く保存されたmiRNA結合部位の総数が緑色で示され、これらの部位に対応する固有のk量体の数が黄色で示されている。いずれかのk量体を含有した遺伝子の数が灰色で示され、miRNA部位に対応する少なくとも1つのk量体を含有した遺伝子の数が黒色で示されている。
図5D】(D)上部:複数の遺伝子においてヒトにアライメント不可能な第1の配列において同定された固有のk量体の分布(灰色)。少なくとも1つの遺伝子において無脊椎動物種で検出されたk量体の数が黒色で示されている。下部:少なくとも50個の遺伝子に共通し、無脊椎動物配列で検出された固有のk量体。AREに似たk量体は赤色に着色され、PASに似たk量体は青色、PREに似たk量体は緑色に着色されている。
図5E】(E)分析した遺伝子のヒト配列内でLncLOOM及びTargetScanによって検出された、広く保存されたmiRNA結合部位を含有する遺伝子の比較。
図5F】(F)LncLOOMによって検出された広く保存されたmiRNA結合の数/アライメント不可能な配列の数;検出されたmiRNA部位を有する遺伝子のパーセンテージ/アライメント不可能な層の数(黒色)、及びmiRNA結合部位に対応する固有のk量体の数(黄色)。
図5G】(G)上部:ヒト配列における、LncLOOMによって予測された広く保存されたmiRNA結合部位。TargetScanによって予測され、LncLOOMによって回収された部位は赤色で示され、新たな部位は青色で示されている。下部:これらの部位の保存/種の数。
図5H】(H)TargetScan及びLncLOOMによって、示された種において検出された少なくとも1つのmiRNA部位を有する遺伝子の画分の比較。TargetScanHumanに見られる部位のみを使用した。
図5I】(I)LncLOOMによって検出されたmiRNA部位を含有する遺伝子のパーセンテージ/アライメント不可能な配列の数:(赤色)ヒト配列においてTargetScanによって以前に予測され、TargetScanによって使用されたMSAの一部ではない追加の配列においてLncLOOMによって回収されたmiRNA部位;(青色)LncLOOMによって予測されたが、ヒト配列においてTargetScanによって以前に予測されなかった新たなmiRNA部位。
図6図6は、libra lncRNA内で保存されたエレメントを示す。ヒト配列が示されており、少なくとも5つの種において保存されたモチーフは、それらの保存に基づいて色分けされている。縦線の対はイントロンの位置を表す。miRNAシード部位と一致するモチーフは、モチーフの上のmiRNAファミリー名によって示されている。ヒト配列とスポッテッドガー配列との間のBLASTNアライメント(E<0.001)の一部である領域に下線が引かれている。パネルに示される配列は、配列番号71としてマークされている。
図7図7は、Chaserr lncRNA遺伝子座の第1のエクソンの周りのゲノムアセンブリ内のギャップを示す。各種について、RNA-seq読出しカバレッジがゲノムアセンブリ内のギャップと並んで示されている(UCSCブラウザから)。
図8A図8A~Dは、Chaserr lncRNAにおける保存されたエレメントの機能的特性評価を示す。(A)マウスChaserrの最終エクソンの配列。深く保存されたエレメントは共有されている。MSベイトにおいて変異した保存されたAUGG例は青色であり、他の全AUGG例は緑色である。ASOによって標的とされる領域がマークされている。
図8B】(B)示されているASO処理について、図3Cにおけると同様。
図8C】(C)示された遺伝子型を有する、HEK293細胞内の示された遺伝子の発現のRNA-seq定量、
図8D】(D)非標的化shRNA(shNT)、又はZFRを標的とするshRNAを用いて処理したTHP1細胞内の示された遺伝子の発現のRNA-seq定量からのデータ。8Aに示される配列からのデータは、配列番号72としてマークされている。
図9-1】図9は、DICER 3’UTRにおける保存されたエレメントの同定を示す。ヒト配列が示されており、少なくとも8つの脊椎動物種において保存されたモチーフが、それらの保存に基づいて色分けされている(9種-ナメクジウオにおいて保存;10種-ナメクジウオ及びウニにおいて保存)。配列同一性を維持する100個のランダム配列がこの長さのモチーフを含有しないモチーフの領域は、淡黄色で網掛けされている。ランダム配列内で正確なモチーフが見出されないモチーフの領域は、淡いシアン色で網掛けされている。パネルに示される配列は、配列番号73としてマークされている。
図9-2】同上。
図10A図10A~Fは、3’UTR内で同定されたLncLOOMモチーフの追加の分析を示す。(A)オルソログ3’UTR配列の分布。左上:様々な深度で分析された遺伝子の頻度。右上:3’UTR配列データセットに含まれた非有羊膜類配列の様々な組合せの分布。右下:示された種において分析された遺伝子の総数。
図10B】(B)3’UTRデータセットにおける、保存された固有のk量体の組合せ/アライメント不可能な配列の数の分布。ヒト、マウス、イヌ及びニワトリへのアライメントを検討した。
図10C】(C)有羊膜類を超えて同定され、複数の遺伝子間で共有されていた固有のk量体の分布。UUU(赤色の線)、AUAA(緑色の線)を含有するか、又は広く保存されたmiRNA部位と一致した(黄色の線)k量体の数を示す。
図10D】(D)TargetScanが何ら予測を報告しなかった遺伝子内でLncLOOMによって検出された広く保存されたmiRNA部位の保存。(上部)検出されたmiRNA部位を有する遺伝子の数/種の数(左)、及びアライメント不可能な配列の数(右)。(左下)検出されたmiRNA部位を有する遺伝子の数/種。(中央)検出された新たなmiRNA部位の数/種。(右)検出された新たなmiRNA部位の数/アライメント不可能な配列の数。
図10E】(E)TargetScan及びLncLOOMによる、種当たりの検出された保存を有するmiRNA部位の比較。TargetScanHumanによって以前に同定された部位のみを比較した。
図10F】(F)ヒト配列に対するアライメントを有しない配列内の、LncLOOMによって検出されたmiRNA部位の保存。ヒト配列においてTargetScanによって以前に予測された部位は赤色に着色され、新たなLncLOOM予測は青色に着色されている。
図11A図11A~Dは、LncLOOMグラフに課される制約を示す。(A)LncLOOMグラフのシナリオの例、及びそれらがILPでどのように表されるか。
図11B】(B)交差エッジに対する条件付き制約。すべての交差が制約されている場合に起こり得る後続の反復における精密化中の複雑な経路における繰り返されるk量体の準最適除外の一例。
図11C】(C)交差エッジに対する条件付き制約を定義するためのフロー図:一対の交差エッジは、いずれかのエッジと交差する固有の経路からの少なくとも1つの他のエッジが存在する場合にのみ制約される。
図11D】(D)交差に対する条件付き制約が、タンデムに繰り返されるk量体の準最適除外をどのように緩和することができるかを示す例。パネルに示される配列は、配列番号74としてマークされている。
図12-1】図12は、LncLOOMグラフの分割、及び選択された繰り返されるk量体の反復精密化を示す。モチーフ発見は、グラフ内の最も深い層から始まって、各工程が、次第に浅くなる深度で保存されているモチーフを検索する反復プロセスによって行われる。ここには、5層のグラフで始まるモチーフ発見の一例が示されている。グラフが解かれ、解で得られた単純な経路(緑色で示されている)が、グラフを次の反復で個々に解かれるサブグラフに分割するために使用され、次の反復はグラフの上位4層に対して行われる。各単純な経路は最終解に直ちに追加されるが、複雑な経路(青色及び赤色で示されている)はモチーフ発見の後続の反復中に精密化される。この場合、最適化中に除去される繰り返されるk量体は、ピンク色で囲まれている。
図12-2】同上。
図13A図13A~Bは、LncLOOMフレームワークにおける処理工程を示す。(A)5’及び3’グラフの構築。LncLOOMは、(各配列の全長が検討される)一次ILPにおいて同定された第1のモチーフ及び最終モチーフの中央位置を使用して、グラフ内の他の配列と比較して伸長された個々の配列の5’及び3’末端を予測し、抽出する。次いで、LncLOOMモチーフ発見が、抽出された5’及び3’領域のサブセットに対して行われる。この例では、最小深度3が課されているため、上位2つの配列のみにおいて保存されているAUUGCU(配列番号15、青色)モチーフは無視され、CAUCCA(配列番号16、暗赤色及び下線)が、代わりに第1のノードとして検討される。
図13B】(B)モチーフ近傍の図解。各近傍の参照配列は、アンカー配列内のすべての重複するk量体を組み合わせることによって決定される。次いで、グラフ内のそれぞれの深度に保存され、参照配列内の重複するk量体のうちの1つに連結されているすべてのk量体が、近傍内に含まれる。パネルに示される配列は、配列番号75~87としてマークされている。
図14図14は、本発明の様々な例示的な実施形態による、配列のセットを分析するのに適した方法のフローチャート図である。
図15図15は、本発明の様々な例示的な実施形態による、配列のセットを分析するように構成されたコンピューティングプラットフォームの概略図である。
図16図16は、示されたASO(配列番号128及び134)のトランスフェクション後のCHASERR、CHD2及びp21(CDKN1A)の、トランスフェクトされていないSH-SY5Y細胞と比較した遺伝子発現の変化のグラフ表示である。
図17図17は、示されたASO(配列番号128及び134)のトランスフェクション後のCHASERR及びCHD2の、トランスフェクトされていないMCF7細胞及びSH-SY5Y細胞と比較した遺伝子発現の変化のグラフ表示である。
【発明を実施するための形態】
【0041】
本発明は、そのいくつかの実施形態では、CHD2ハプロ不全の処置に使用するための組成物、及びその同定方法に関する。
【0042】
本発明の少なくとも1つの実施形態を詳細に説明する前に、本発明は、その適用において、以下の説明に記載されるか又は実施例によって例示される詳細に必ずしも限定されないことを理解されたい。本発明は、他の実施形態が可能であるか、又は様々な方法で実施若しくは実行することができる。
【0043】
CHD2ハプロ不全は、神経発達遅延、知的障害、てんかん及び問題行動に関連する。以前の結果は、CHD2発現が、Chd2の上流に位置する保存されたlncRNAであるChaserrによって厳密に調節されることを示している。Chaserrの喪失は、Chd2 mRNA及びタンパク質のレベルを実質的に増加させ、これにより、高度に発現された遺伝子の下流に見出されるプロモーターを阻害することによる転写干渉を含む、遺伝子発現の変化がもたらされる。
【0044】
本発明の実施形態の着想中に、本発明者は、アライメント可能性を超えて発散した、及び/又は転移因子などの実質的な系統特異的配列を蓄積した、配列内の保存されたエレメントを検出するための新規アルゴリズムを考案した。このアルゴリズム、又は「LncLOOM」と呼ばれるその実施形態を使用して、本発明者らは、機能的に関連する相互作用因子とのCheserrの相互作用を特異的に阻害し、CHD2ハプロ不全を最終的に補償するように優先的に変異されうる/標的とされうる、Chaserrの保存された領域を同定及び検証した。
【0045】
したがって、本発明の一態様によれば、神経細胞内のクロモドメインヘリカーゼDNA結合タンパク質2(CHD2)の量を増加させる方法であって、ヒトChaserrの活性又は発現をダウンレギュレートする核酸剤を細胞に導入することを含み、核酸剤が、ヒトChaserrの最終エクソンへと指向しており、それによって、神経細胞内のCHD2の量を増加させる方法が提供される。
【0046】
本明細書で使用される場合、「ヒトChaserrの活性又は発現をダウンレギュレートする核酸剤」は、ヒトChaserrの活性を阻害するか、又はヒトChaserrの量を減少させる核酸分子を指す。
【0047】
いくつかの実施形態によれば、「ヒトChaserrの活性をダウンレギュレートする核酸剤」は、CHD2の発現(タンパク質及び任意にmRNA)を増加させる核酸剤、CHD2 mRNAの安定性を増加させる核酸剤、CHD2 mRNAの発現を誘導する核酸剤、及びCHD2の翻訳を誘導する核酸剤のうちのいずれか1又は複数を含む。
【0048】
したがって、本発明の一態様によれば、ヒトChaserrの活性又はダウンレギュレートする核酸剤であって、ヒトChaserrの最終エクソンにハイブリダイズする(すなわち、ヒトChaserrの最終エクソン内のヌクレオチド配列に相補的である)核酸配列を含む核酸剤が提供される。
【0049】
本明細書で使用される場合、「クロモドメインヘリカーゼDNA結合タンパク質2(CHD2)」は、ヒトではCHD2遺伝子によってコードされる酵素を指す。ヒトにおけるCHD2スプライス変異体の例には、NCBI参照配列:NM_001271.4及びNM_001042572が挙げられる。
【0050】
スプライス変異体タンパク質産物は、NCBI参照配列:NP_001262.3又はNP_001036037に記載されている通りである。
【0051】
本明細書で使用される場合、「ハプロ不全」は、2倍体生物における優性遺伝子作用のモデルを指し、このモデルでは、変異体対立遺伝子とヘテロ接合で組み合わせた遺伝子座にある標準(いわゆる野生型)対立遺伝子の単一コピーは、標準的な表現型をもたらすには不十分である。典型的には、両対立遺伝子が野生型である健康な状態と比較して、タンパク質の量の約半分が産生されるにすぎない。
【0052】
本明細書で使用される場合、「量を増加させる」は、関心対象のタンパク質又はRNAの量を統計的に有意な量だけ、及び関心対象のタンパク質又はRNAのハプロ不全を処置するための有用性を有する量だけ増加させることを指す。様々な実施形態では、関心対象のタンパク質又はRNAの「量を増加させる」は、少なくとも10%、又はいくつかの実施形態では、少なくとも約20%、少なくとも20%、20~150%、50~150%、例えば、少なくとも50%、60%、70%、80%、90%、少なくとも1.2倍1.4倍1.5倍若しくはそれ以上、例えば、少なくとも2倍の増加を伴う。特定の実施形態によれば、CHD2レベルは、同じタイプ(すなわち、神経の)及び発達段階の正常細胞(ハプロ不全を有しない)内で見出される量まで回復される。
【0053】
本明細書で使用される場合、「神経細胞」は、対象の体内(インビボ)又は体外に見出される細胞、例えば、組織生検材料、細胞株及び初代培養物を指す。
【0054】
他の細胞、すなわち、非神経細胞も企図される。
【0055】
神経細胞は、遺伝子改変されていてもよいか、又は遺伝子改変されていなくてもよく、例えば、ナイーブでありうる。
【0056】
特定の実施形態によれば、神経細胞は、中枢神経系に位置する。
【0057】
CHD2のレベルが本発明のいくつかの実施形態に従って改変されるか又は改変された細胞を識別する方法は、当技術分野で周知である。
【0058】
細胞と前記剤との接触は、例えば、前記剤が細胞と直接接触するように、前記剤を対象に由来する細胞(例えば、初代細胞培養物、細胞株)に、又はそれを含む生物学的試料(例えば、細胞を含む流体、液体)に加えることを含む、いずれかのインビボ条件又はインビトロ条件によって行われ得る。本発明のいくつかの実施形態によれば、対象の細胞は、前記剤とともにインキュベートされる。細胞をインキュベートするために使用される条件は、薬物がCHD2のレベル(量)の増加などの細胞変化を誘導するか、又は特定の遺伝子の転写及び/若しくは翻訳速度、増殖速度、分化、細胞死、壊死、アポトーシスなどの変化などの関連する変化を誘導することを可能にする期間/細胞の濃度/前記剤の濃度/細胞と前記剤との比などのために選択される。
【0059】
CHD2(mRNA及び/又はタンパク質)のレベルは、前記剤を細胞に導入する前、それと同時に及び/又はそれに続いて分析されうる。追加的又は代替的に、ゲノムDNAは、ゲノム編集の場合など、本明細書中下記にさらに記載されるように、前記剤によって導入された修飾について分析される。
【0060】
核酸レベルでのダウンレギュレーション(すなわち、核酸の存在量の減少)は、典型的には、核酸骨格、DNA、RNA、それらの模倣物又はそれらの組合せを有する核酸剤を使用して行われる。核酸剤は、DNA分子からコードされうるか、又は細胞自体に提供されうる。
【0061】
特定の実施形態によれば、ダウンレギュレーション剤はポリヌクレオチドである。
【0062】
核酸剤は、それ自体が本明細書で企図され、核酸構築物から、又は医薬組成物の一部としてコードされることが理解される。
【0063】
特定の実施形態によれば、ダウンレギュレーション剤は、CHD2をコードする遺伝子又はmRNAにハイブリダイズすることができるポリヌクレオチド又はオリゴヌクレオチドである。
【0064】
特定の実施形態によれば、ダウンレギュレーション剤は、CHD2の遺伝子と、又はRNA転写産物と直接相互作用する。
【0065】
特定の実施形態によれば、前記剤は、Chaserrの最終エクソン内の核酸配列に直接結合する。
【0066】
本明細書で使用される場合、「Chaserr」は、CHD2隣接抑制調節RNAを指す。HGNC:48626 Entrez Gene:100507217
【0067】
Chaserrのエクソン構成は、EXON1:ヌクレオチド1..344;EXON2:ヌクレオチド345..538;EXON3:ヌクレオチド539...608;EXON4:ヌクレオチド609...694;EXON5:ヌクレオチド695...763;EXON6:ヌクレオチド764...1787であり、ここでChaserrの最終エクソンとは、配列番号3(NR_037601)のヌクレオチド764..1787を指す。
【0068】
特定の実施形態によれば、核酸剤は、配列番号1(AUG)を含む核酸配列エレメントにハイブリダイズする。
【0069】
別の実施形態によれば、核酸剤は、配列番号2(AUGG)を含む核酸配列エレメントにハイブリダイズする。
【0070】
特定の実施形態によれば、核酸剤は、AAGAUGG(配列番号4)、AAGAUG(配列番号5)又はAAAUGGA(配列番号6)を含む核酸配列エレメントにハイブリダイズする。
【0071】
別の実施形態によれば、核酸剤は、配列番号3(aauaaa)を含む核酸配列エレメントにハイブリダイズする。
【0072】
特定の実施形態によれば、核酸剤は、ChaserrへのDHX36の結合を阻害する。
【0073】
本明細書で使用される場合、「DHX36」は、DEAHボックスタンパク質36(DHX36)若しくはMLE様タンパク質1(MLEL1)若しくはG4リゾルベース1(G4R1)としても知られる、可能性の高いATP依存性RNAヘリカーゼDHX36を指すか、又はAU-リッチエレメント(RHAU)に関連するRNAヘリカーゼは、ヒトではDHX36遺伝子によってコードされる酵素である。
【0074】
特定の実施形態によれば、核酸剤は、UUUUUACCU(配列番号122)に相補的なヌクレオチド配列を含む
【0075】
特定の実施形態によれば、核酸剤は、ChaserrへのCHD2の結合を阻害する。
【0076】
特定の実施形態によれば、ダウンレギュレーション剤は、アンチセンス、RNAサイレンシング剤又はゲノム編集剤である。
【0077】
特定の実施形態によれば、ダウンレギュレーション剤はアンチセンスである。
【0078】
アンチセンスオリゴヌクレオチド-アンチセンスオリゴヌクレオチドは、標的RNAにハイブリダイズし、それによって、その機能又はレベルを阻害するように設計された一本鎖オリゴヌクレオチドである。Chaserr RNAのダウンレギュレーション又は阻害は、例えば、配列番号1、2、4又は6を含むChaserr転写物と特異的にハイブリダイズすることができるアンチセンスオリゴヌクレオチドを使用して行われ得る。好ましくは、アンチセンスオリゴヌクレオチドのハイブリダイゼーションは、Chaserrへのエフェクターエレメントの結合を防止するが、その他の点ではChaserr RNAをインタクトのままにする。特定の実施形態によれば、核酸剤は、RNaseHを動員しない。
【0079】
いくつかの実施形態では、アンチセンスオリゴヌクレオチドは、RNaseHを動員しない。例えば、アンチセンスオリゴヌクレオチドは、RNAヌクレオチドを実質的に含み得る。さらに他の実施形態では、アンチセンスオリゴヌクレオチドは、RNaseHを動員し、したがって、少なくとも一続きのDNAヌクレオチドを含む。例えば、アンチセンスオリゴヌクレオチドはギャップマーであってよい。
【0080】
特定の実施形態によれば、下記の実施例の項でマウスについて例示されるアンチセンスオリゴヌクレオチド(ASO)に対応するアンチセンス配列には、限定するものではないが、AAGATGGCAGTCTACTATGG(配列番号12)を標的とするCCATAGTAGACTGCCATCTT(配列番号7)、及びCACAAATGGACAGTGGAT(配列番号10)を標的とするATCCACTGTCCATTTGTG(配列番号9)が含まれる。ヌクレオチド配列は、便宜上、ここでは完全なDNA配列又はRNA配列として表されているが、アンチセンスオリゴヌクレオチドは、RNAヌクレオチド若しくはDNAヌクレオチド、又はそれらの混合物として構築されうることが理解される。すなわち、オリゴヌクレオチドがヌクレオチドチミン(T)を示す場合、ヌクレオチドは、そのRNA対応物(ウリジン、すなわち、U)によって置換することができ、逆もまた同様であることが理解される。さらに、当技術分野で周知のものなどのDNAヌクレオチド修飾及びRNAヌクレオチド修飾を使用して、アンチセンスオリゴヌクレオチドを構築することができることが理解される。
【0081】
特定の実施形態によれば、核酸剤は、UUUUUACCU(配列番号122)に相補的なヌクレオチド配列を含む。本明細書で使用される場合、用語「相補的」は、カノニカルな(A/T、A/U、及びG/C)塩基対合を指す。
【0082】
特定の実施形態によれば、核酸剤は、ChaserrへのCHD2の結合を阻害する。
【0083】
特定の実施形態によれば、アンチセンスオリゴヌクレオチドは、配列番号140~143(A40、50、51、52に対応)に記載の核酸塩基配列を有する。その修飾版では、アンチセンスオリゴヌクレオチドは、配列番号128、131、132及び133として提供される。
【0084】
Chaserrの量を効率的に阻害するか又は減少させるために使用されうるアンチセンス分子の設計は、アンチセンス手法にとって重要な2つの態様を考慮しながら行われなければならない。第1の態様は、適切な細胞の核へのオリゴヌクレオチドの送達であり、第2の態様は、所望の機能を阻害するように細胞内の指定されたRNAに特異的に結合するオリゴヌクレオチドの設計である。
【0085】
先行技術は、オリゴヌクレオチドを多種多様な細胞型に効率的に送達するために使用されうるいくつかの送達戦略を教示している[例えば、Jaaskelainen et al.Cell Mol Biol Lett.(2002)7(2):236-7;Gait,Cell Mol Life Sci.(2003)60(5):844-53;Martino et al.J Biomed Biotechnol.(2009)2009:410260;Grijalvo et al.Expert Opin Ther Pat.(2014)24(7):801-19;Falzarano et al,Nucleic Acid Ther.(2014)24(1):87-100;Shilakari et al.Biomed Res Int.(2014)2014:526391;Prakash et al.Nucleic Acids Res.(2014)42(13):8796-807及びAsseline et al.J Gene Med.(2014)16(7-8):157-65を参照]
【0086】
さらに、標的RNA及びオリゴヌクレオチドの両方の構造変化のエネルギー機構を説明する熱力学的サイクルに基づいて、それらの標的RNAに対して最も高い予測結合親和性を有する配列を同定するためのアルゴリズムも利用可能である[例えば、Walton et al.Biotechnol Bioeng 65:1-9(1999)を参照]。そのようなアルゴリズムは、細胞内でアンチセンス手法を実施するために首尾よく使用されている。
【0087】
さらに、インビトロ系を使用して特定のオリゴヌクレオチドを設計し、その効率を予測するためのいくつかの手法も公開されている(Matveeva et al.,Nature Biotechnology 16:1374-1375(1998)]。
【0088】
例えば、Chaserr RNAを標的とする好適なアンチセンスオリゴヌクレオチドは、後掲の表3に列挙され(かつ本明細書の不可欠な部分と見なされ)る配列のものであるか、又は配列番号140~143に記載のアンチセンスオリゴヌクレオチドのいずれか、若しくはA40、50、51、52に対応する配列番号128、131、132若しくは133に記載の修飾を有するアンチセンスオリゴヌクレオチドのいずれかである。
【0089】
様々な実施形態によれば、アンチセンスオリゴヌクレオチドは、完全RNAヌクレオチドを含むことができる。そのようなアンチセンスオリゴヌクレオチドはRNaseHを動員しないため、Chaserrは、そのアンチセンス阻害によって分解されないはずである。さらに他の実施形態では、アンチセンスオリゴヌクレオチドは、RNaseHを動員し、Chaserr RNAを分解することができるDNAヌクレオチドとRNAヌクレオチドとの混合物(例えば、ギャップマー)を含む。
【0090】
いくつかの実施形態では、アンチセンスオリゴヌクレオチドは、2’から4’への架橋を含有する1又は複数のヌクレオチド、例えば、ロックドヌクレオチド(LNA)又は拘束エチル(cEt)、及び本明細書に記載の他の架橋ヌクレオチドを含む。
【0091】
いくつかの実施形態では、アンチセンスオリゴヌクレオチドは、2’-OMe又は2’-O-メトキシエチル(2’-O-MOE)などの2’-O修飾を有するヌクレオチドのうちの1又は複数(又はいくつかの実施形態では全部)を含む。
【0092】
いくつかの実施形態では、アンチセンスオリゴヌクレオチドは、ホスホロチオエート又はホスホロジチオエートなどの修飾骨格を含む。さらに他の実施形態では、アンチセンスオリゴヌクレオチドは、モルホリノ骨格を含む。
【0093】
いくつかの実施形態では、アンチセンスオリゴヌクレオチドは、5-メチルシトシンなどの修飾塩基を有する1又は複数のヌクレオチドを含む。
【0094】
使用されうる他のヌクレオチド修飾は、本明細書の他の箇所に記載されている。
【0095】
あるいは、CHD2のダウンレギュレーションは、RNAサイレンシングによって達成されうる。本明細書で使用される場合、「RNAサイレンシング」という語句は、RNAの活性又はアベイラビリティの阻害又は「サイレンシング」をもたらすRNA分子によって媒介される調節機構[例えば、RNA干渉(RNAi)、転写遺伝子サイレンシング(TGS)、転写後遺伝子サイレンシング(PTGS)、クエリング及び共抑制]の群を指す。RNAサイレンシングは、植物、動物及び真菌を含む多くの種類の生物において観察されている。
【0096】
本明細書で使用される場合、用語「RNAサイレンシング剤」は、標的遺伝子の発現を特異的に阻害又は「サイレンシング」することができるRNAを指す。ある特定の実施形態では、RNAサイレンシング剤は、転写後サイレンシング機構を介してmRNA分子の完全なプロセシング(例えば、完全な翻訳及び/又は発現)を防止することができる。RNAサイレンシング剤には、非コードRNA分子、例えば、対の鎖を含むRNA二重鎖、及びそのような小さい非コードRNAを生成することができる前駆体RNAが含まれる。例示的なRNAサイレンシング剤には、siRNA、miRNA及びshRNAなどのdsRNAが含まれる。
【0097】
一実施形態では、RNAサイレンシング剤は、RNA干渉を誘導することができる。
【0098】
本発明の一実施形態によれば、RNAサイレンシング剤は、標的RNAに特異的であり、Chaserrの最終エクソン(以下のエレメント:例えば、配列番号1、2、4又は6を用いて本明細書で上述したように)を含み、PCR、ウエスタンブロット、免疫組織化学的検査及び/又はフローサイトメトリーによって決定された場合に、標的遺伝子に対して99%以下の全体的相同性、例えば、標的遺伝子に対して98%未満、97%未満、96%未満、95%未満、94%未満、93%未満、92%未満、91%未満、90%未満、89%未満、88%未満、87%未満、86%未満、85%未満、84%未満、83%未満、82%未満、81%未満の全体的相同性を示す他の標的(又は同じ標的内の他のエクソン)を交差阻害又はサイレンシングしない核酸領域に実際に特異的である。
【0099】
RNA干渉とは、低分子干渉RNA(siRNA)によって媒介される、動物における配列特異的転写後遺伝子サイレンシングのプロセスを指す。
【0100】
以下は、本発明の特定の実施形態に従って使用されうるRNAサイレンシング剤に関する詳細な説明である。
【0101】
dsRNA、siRNA及びshRNA-細胞内の長いdsRNAの存在は、ダイサーと呼ばれるリボヌクレアーゼIII酵素の活性を刺激する。ダイサーは、低分子干渉RNA(siRNA)として知られる、dsRNAの短い断片へのdsRNAのプロセシングに関与する。ダイサー活性に由来する低分子干渉RNAは、典型的には約21~約23ヌクレオチド長であり、約19塩基対の二重鎖を含む。RNAi応答はまた、siRNA二重鎖のアンチセンス鎖に相補的な配列を有する一本鎖RNAの切断を媒介する、RNA誘導サイレンシング複合体(RISC)と一般に呼ばれるエンドヌクレアーゼ複合体を特徴とする。標的RNAの切断は、siRNA二重鎖のアンチセンス鎖に相補的な領域の中央で起こる。
【0102】
したがって、本発明のいくつかの実施形態は、mRNAからのタンパク質発現をダウンレギュレートするためのdsRNAの使用を企図する。
【0103】
一実施形態によれば、30bpよりも長いdsRNAが使用される。様々な試験により、長いdsRNAを使用して、ストレス応答を誘導することなく、又は顕著なオフターゲット効果を引き起こすことなく、遺伝子発現をサイレンシングすることができることが実証されている。例えば、[Strat et al.,Nucleic Acids Research,2006,Vol.34,No.13 3803-3810;Bhargava A et al.Brain Res.Protoc.2004;13:115-125;Diallo M.,et al.,Oligonucleotides.2003;13:381-392;Paddison P.J.,et al.,Proc.Natl Acad.Sci.USA.2002;99:1443-1448;Tran N.,et al.,FEBS Lett.2004;573:127-134]を参照されたい。
【0104】
本発明のいくつかの実施形態によれば、dsRNAは、インターフェロン経路が活性化されていない細胞内に提供される。例えば、Billy et al.,PNAS 2001,Vol 98,pages 14428-14433及びDiallo et al,Oligonucleotides,October 1,2003,13(5):381-392.doi:10.1089/154545703322617069を参照されたい。
【0105】
本発明の一実施形態によれば、長いdsRNAは、遺伝子発現をダウンレギュレートするためのインターフェロン経路及びPKR経路を誘導しないように特に設計される。例えば、Shinagwa及びIshii[Genes&Dev.17(11):1340-1345,2003]は、RNAポリメラーゼII(Pol II)プロモーターから長い二本鎖RNAを発現させるためのpDECAPと呼ばれるベクターを開発している。pDECAPからの転写物は、細胞質へのds-RNAの輸送を促進する5’-キャップ構造及び3’-ポリ(A)テールの両方を欠くため、pDECAPからの長いds-RNAはインターフェロン応答を誘導しない。
【0106】
哺乳動物系におけるインターフェロン経路及びPKR経路を回避する別の方法は、トランスフェクション又は内因性発現のいずれかによる低分子阻害RNA(siRNA)の導入によるものである。
【0107】
用語「siRNA」は、RNA干渉(RNAi)経路を誘導する低分子阻害RNA二重鎖(一般に18~30塩基対)を指す。典型的には、siRNAは、中央の19bp二重鎖領域と末端に対称的な2塩基3’オーバーハングとを有する21量体として化学合成されるが、近年では、25~30塩基長の化学合成されたRNA二重鎖が、同じ位置の21量体と比較して効力の100倍もの増加を有し得ることが記載されている。RNAiの誘発時にさらに長いRNAを使用して得られた観察された効力の増加は、産物(21量体)の代わりに基質(27量体)をダイサーに提供することに起因すること、及びこれによりRISCへのsiRNA二重鎖の進入の速度又は効率が改善されることが示唆されている。
【0108】
3’-オーバーハングの位置がsiRNAの効力に影響を及ぼし、アンチセンス鎖上に3’-オーバーハングを有する非対称二重鎖が、センス鎖上に3’-オーバーハングを有するものよりも一般に強力であることが見出されている(Rose et al.,2005)。これは、アンチセンス転写物を標的とする際に反対の有効性パターンが観察されることから、RISCへの非対称鎖負荷に起因する可能性がある。
【0109】
二本鎖干渉RNA(例えば、siRNA)の鎖は、ヘアピン又はステム-ループ構造(例えば、shRNA)を形成するように連結されうる。したがって、言及されたように、本発明のいくつかの実施形態のRNAサイレンシング剤はまた、ショートヘアピンRNA(shRNA)でありうる。
【0110】
本明細書で使用される用語「shRNA」は、相補的配列の第1及び第2の領域を含むステム-ループ構造を有するRNA剤(RNA agent)を指し、領域の相補性及び配向の程度は、領域間で塩基対合が起こるのに十分であり、第1及び第2の領域は、ループ領域によって連結され、ループは、ループ領域内のヌクレオチド(又はヌクレオチド類似体)間の塩基対合の欠如から生じる。ループ内のヌクレオチドの数は、3~23、又は5~15、又は7~13、又は4~9、又は9~11の数である。ループ内のヌクレオチドの一部は、ループ内の他のヌクレオチドとの塩基対相互作用に関与し得る。ループを形成するために使用されうるオリゴヌクレオチド配列の例には、国際特許出願番号WO2013126963及びWO2014107763に列挙されているものが挙げられる。得られた一本鎖オリゴヌクレオチドは、RNAi機構と相互作用することができる二本鎖領域を含むステム-ループ構造又はヘアピン構造を形成することが当業者によって認識されるであろう。
【0111】
本発明のいくつかの実施形態とともに使用するのに適したRNAサイレンシング剤の合成は、以下のように行うことができる。第1に、Chaserr mRNA配列をAAジヌクレオチド配列についてスキャンする。各AA及び3’隣接19ヌクレオチドの存在を潜在的なsiRNA標的部位として記録する。
【0112】
第2に、潜在的な標的部位を、NCBIサーバーから入手可能なBLASTソフトウェア(www(dot)ncbi.nlm.nih(dot)gov/BLAST/)などのいずれかの配列アライメントソフトウェアを使用して、適切なゲノムデータベース(例えば、ヒト、マウス、ラットなど)と比較する。
【0113】
適格な標的配列をsiRNA合成の鋳型として選択する。好ましい配列は、G/C含有量が低い配列であり、これは、これらが、55%超のG/C含有量を有する配列よりも、遺伝子サイレンシングを媒介する点で効果的であることが証明されているためである。いくつかの標的部位が、評価のために標的遺伝子の長さに沿って選択されることが好ましい。選択されたsiRNAのさらに良好な評価のために、陰性対照を併用することが好ましい。陰性対照siRNAは、siRNAと同じヌクレオチド組成を含むことが好ましいが、ゲノムとの有意な相同性を欠く。したがって、どのような他の遺伝子に対しても有意な相同性を何ら示さないならば、siRNAのスクランブルされたヌクレオチド配列が使用されることが好ましい。
【0114】
本発明のいくつかの実施形態のRNAサイレンシング剤は、本明細書中上記で言及されるように、RNAのみを含有する分子に限定される必要はなく、化学的に修飾されたヌクレオチド及び非ヌクレオチドをさらに包含することが理解されるであろう。
【0115】
miRNA及びmiRNA模倣物-別の実施形態によれば、RNAサイレンシング剤はmiRNAでありうる。
【0116】
用語「マイクロRNA」、「miRNA」及び「miR」は、同義であり、遺伝子発現を調節する約19~28ヌクレオチド長の非コード一本鎖RNA分子の集合体を指す。miRNAは、広範囲の生物に見出され(viruses(dot)fwdarw(dot)humans)、発生、恒常性及び疾患病因に何らかの役割を果たすことが示されている。
【0117】
miRNA模倣物の調製は、当技術分野で公知のいずれかの方法、例えば、化学合成又は組換え法によって行われ得る。
【0118】
本明細書中上記で提供される記載から、細胞をmiRNAと接触させることが、例えば、成熟二本鎖miRNA、pre-miRNA又はpri-miRNAにより細胞をトランスフェクションすることによって行われ得ることが理解されるであろう。
【0119】
本明細書では、バイオアベイラビリティ、親和性、安定性又はそれらの組合せを改善するために核酸配列修飾も企図される。
【0120】
一実施形態によれば、核酸剤は、少なくとも1つの塩基(例えば、核酸塩基)修飾又は置換を含む。
【0121】
本明細書で使用される場合、「非修飾」又は「天然」塩基には、プリン塩基のアデニン(A)及びグアニン(G)、並びにピリミジン塩基のチミン(T)、シトシン(C)及びウラシル(U)が含まれる。「修飾」塩基には、限定するものではないが、他の合成塩基及び天然塩基、例えば、5-メチルシトシン(5-me-C);5-ヒドロキシメチルシトシン;キサンチン;ヒポキサンチン;2-アミノアデニン;アデニン及びグアニンの6-メチル及び他のアルキル誘導体;アデニン及びグアニンの2-プロピル及び他のアルキル誘導体;2-チオウラシル、2-チオチミン及び2-チオシトシン;5-ハロウラシル及びシトシン;5-プロピニルウラシル及びシトシン;6-アゾウラシル、シトシン及びチミン;5-ウラシル(プソイドウラシル);4-チオウラシル;8-ハロ、8-アミノ、8-チオール、8-チオアルキル、8-ヒドロキシル及び他の8-置換アデニン及びグアニン;5-ハロ、特に5-ブロモ、5-トリフルオロメチル及び他の5-置換ウラシル及びシトシン;7-メチルグアニン及び7-メチルアデニン;8-アザグアニン及び8-アザアデニン;7-デアザグアニン及び7-デアザアデニン;並びに3-デアザグアニン及び3-デアザアデニンが含まれる。追加の修飾塩基には、米国特許第3,687,808号明細書;Kroschwitz,J.I.,ed.(1990),“The Concise Encyclopedia Of Polymer Science And Engineering,” pages 858-859,John Wiley&Sons;Englisch et al.(1991),“Angewandte Chemie,” International Edition,30,613;及びSanghvi,Y.S.,“Antisense Research and Applications,” Chapter 15,pages 289-302,S.T.Crooke and B.Lebleu,eds.,CRC Press,1993に開示されているものが含まれる。このような修飾塩基は、本発明のオリゴマー化合物の結合親和性を増加させるのに特に有用である。これらには、2-アミノプロピルアデニン、5-プロピニルウラシル及び5-プロピニルシトシンを含む5-置換ピリミジン、6-アザピリミジン並びにN-2、N-6及びO-6-置換プリンが含まれる。5-メチルシトシン置換は、核酸二重鎖の安定性を0.6~1.2℃増加させることが示されており(Sanghvi,Y.S.et al.(1993),“Antisense Research and Applications,” pages 276-278,CRC Press,Boca Raton)、現時点で好ましい塩基置換であり、2’-O-メトキシエチル糖修飾と組み合わせた場合にさらになお特に好ましい。追加の塩基修飾は、参照により本明細書に組み込まれるDeleavey and Damha,Chemistry and Biology(2012)19:937-954に記載されている。
【0122】
一実施形態によれば、修飾は、骨格に(すなわち、ヌクレオチド間結合及び/又は糖部分に)ある。
【0123】
核酸分子の糖修飾は、当技術分野で広く記載されている(いずれも参照により本明細書に組み込まれるPCT国際公開番号WO92/07065、WO93/15187、WO98/13526及びWO97/26270;米国特許第5,334,711号明細書;米国特許第5,716,824号明細書;及び米国特許第5,627,053号明細書;Perrault et al.,1990;Pieken et al.,1991;Usman&Cedergren,1992;Beigelman et al.,1995;Karpeisky et al.,1998;Earnshaw&Gait,1998;Verma&Eckstein,1998;Burlina et al.,1997を参照)。そのような刊行物は、触媒作用を調節することなく核酸分子への糖、塩基及び/又はリン酸修飾などの取込みの位置を決定するための一般的な方法及び戦略を記載している。例示的な糖修飾には、限定するものではないが、2’修飾ヌクレオチド、例えば、2’-デオキシ、2’-フルオロ(2’-F)、2’-デオキシ-2’-フルオロ、2’-O-メチル(2’-O-Me)、2’-O-メトキシエチル(2’-O-MOE)、2’-O-アミノプロピル(2’-O-AP)、2’-O-ジメチルアミノエチル(2’-O-DMAOE)、2’-O-ジメチルアミノプロピル(2’-O-DMAP)、2’-O-ジメチルアミノエチルオキシエチル(2’-O-DMAEOE)、2’-フルオロアラビノオリゴヌクレオチド(2’-F-ANA)、2’-O--N-メチルアセトアミド(2’-O-NMA)、2’-NH2又はロックド核酸(LNA)が含まれる。追加の糖修飾は、参照により本明細書に組み込まれるDeleavey and Damha,Chemistry and Biology(2012)19:937-954に記載されている。
【0124】
したがって、例えば、オリゴヌクレオチドは、ヌクレアーゼ耐性基による修飾によってそれらの安定性を増強し、及び/又は生物学的活性を増強するように修飾され得、例えば、本発明の核酸剤は、2’-O-メチル、2’-フッ素、2’-O-メトキシエチル、2’-O-アミノプロピル、2’-アミノ、及び/又はホスホロチオエート結合を含むことができる。ロックド核酸(LNA)を含めると、例えば、リボース環が2’-O原子と4’-C原子とを連結するメチレン架橋によって「ロック」されている核酸類似体、エチレン核酸(ENA)、例えば、2’-4’-エチレン架橋核酸、及び特定の核酸塩基修飾、例えば、2-アミノ-A、2-チオ(例えば、2-チオ-U)、G-クランプ修飾を含めると、標的に対する結合親和性を増加させることもできる。オリゴヌクレオチド骨格にピラノース糖を含めると、エンドヌクレアーゼ切断を減少させることもできる。結合アームは、DNA内のデオキシリボース(又はリボース)リン酸骨格がポリアミド骨格によって置換されているペプチド核酸(PNA)をさらに含んでもよいか、又はポリマー骨格、環状骨格若しくは非環状骨格を含んでもよい。結合領域は、糖模倣物を組み込んでもよく、望ましくない分解を防止するために(以下に説明されるように)、特にその末端に保護基をさらに含んでもよい。
【0125】
例示的なヌクレオチド間結合修飾には、限定するものではないが、ホスホロチオエート、キラルホスホロチオエート、ホスホロジチオエート、ホスホトリエステル、アミノアルキルホスホトリエステル、メチルホスホネート、アルキルホスホネート(3’-アルキレンホスホネートを含む)、キラルホスホネート、ホスフィネート、ホスホルアミデート(3’-アミノホスホルアミデートを含む)、アミノアルキルホスホルアミデート、チオノホスホルアミデート、チオノアルキルホスホネート、チオノアルキルホスホトリエステル、ボラノホスフェート(通常の3’-5’結合を有するもの、これらの2’-5’結合類似体、及び隣接するヌクレオシド単位対が3’-5’から5’-3’へ、又は2’-5’から5’-2’へ結合している逆極性を有するものなど)、ボロンホスホネート、ホスホジエステル、ホスホノアセテート(PACE)、モルホリノ、アミデートカルバメート、カルボキシメチル、アセトアミデート、ポリアミド、スルホネート、スルホンアミド、スルファメート、ホルムアセタール、チオホルムアセタール、アルキルシリル、置換、ペプチド核酸(PNA)及び/又はトレオース核酸(TNA)が含まれる。上記の修飾の様々な塩形態、混合塩形態及び遊離酸形態も使用することができる。追加のヌクレオチド間結合修飾は、いずれも参照により本明細書に組み込まれるDeleavey and Damha,Chemistry and Biology(2012)19:937-954;及びHunziker&Leumann,1995 and De Mesmaeker et al.,1994に記載されている。
【0126】
特定の実施形態によれば、修飾は、修飾ヌクレオシド三リン酸(dNTP)を含む。
【0127】
一実施形態によれば、修飾は、エッジ-ブロッカーオリゴヌクレオチド(edge-blocker oligonucleotide)を含む。
【0128】
特定の実施形態によれば、エッジ-ブロッカーオリゴヌクレオチドは、ホスフェート、逆位dT及びアミノ-C7を含む。
【0129】
一実施形態によれば、核酸剤は、1又は複数の保護基、例えば、5’及び/又は3’キャップ構造を含むように修飾される。
【0130】
本明細書で使用される場合、「キャップ構造」という語句は、オリゴヌクレオチドのいずれかの末端に組み込まれている化学修飾を指すことを意味する(例えば、参照により本明細書に組み込まれる米国特許第5,998,203号明細書を参照)。これらの末端修飾は、核酸分子をエキソヌクレアーゼ分解から保護し、細胞内での送達及び/又は局在化を助けることができる。キャップ修飾は、5’末端(5’-キャップ)若しくは3’末端(3’-キャップ)に存在し得るか、又は両末端に存在し得る。非限定的な例では、5’-キャップは、逆位脱塩基残基(inverted abasic residue)(部分);4’,5’-メチレンヌクレオチド;1-(ベータ-D-エリスロフラノシル)ヌクレオチド、4’-チオヌクレオチド;炭素環ヌクレオチド;1,5-アンヒドロヘキシトールヌクレオチド;L-ヌクレオチド;アルファ-ヌクレオチド;修飾塩基ヌクレオチド;ホスホロジチオエート結合;トレオ-ペントフラノシルヌクレオチド;非環状3’,4’-secoヌクレオチド;非環状3,4-ジヒドロキシブチルヌクレオチド;非環状3,5-ジヒドロキシペンチルヌクレオチド、3’-3’-逆位ヌクレオチド部分;3’-3’-逆位脱塩基部分;3’-2’-逆位ヌクレオチド部分;3’-2’-逆位脱塩基部分;1,4-ブタンジオールホスフェート;3’-ホスホルアミデート;ヘキシルホスフェート;アミノヘキシルホスフェート;3’-ホスフェート;3’-ホスホロチオエート;ホスホロジチオエート;又は架橋若しくは非架橋メチルホスホネート部分を含む群から選択される。
【0131】
いくつかの実施形態では、3’-キャップは、逆位デオキシヌクレオチド、例えば、逆位デオキシチミジン、4’,5’-メチレンヌクレオチド;1-(ベータ-D-エリスロフラノシル)ヌクレオチド;4’-チオヌクレオチド、炭素環ヌクレオチド;5’-アミノ-アルキルホスフェート;1,3-ジアミノ-2-プロピルホスフェート;3-アミノプロピルホスフェート;6-アミノヘキシルホスフェート;1,2-アミノドデシルホスフェート;ヒドロキシプロピルホスフェート;1,5-アンヒドロヘキシトールヌクレオチド;L-ヌクレオチド;アルファ-ヌクレオチド;修飾塩基ヌクレオチド;ホスホロジチオエート;トレオ-ペントフラノシルヌクレオチド;非環状3’,4’-secoヌクレオチド;3,4-ジヒドロキシブチルヌクレオチド;3,5-ジヒドロキシペンチルヌクレオチド、5’-5’-逆位ヌクレオチド部分;5’-5’-逆位脱塩基部分;5’-ホスホルアミデート;5’-ホスホロチオエート;1,4-ブタンジオールホスフェート;5’-アミノ;架橋及び/又は非架橋5’-ホスホルアミデート、ホスホロチオエート及び/又はホスホロジチオエート、架橋又は非架橋メチルホスホネート並びに5’-メルカプト部分などを含む群から選択される(参照により本明細書に組み込まれるBeaucage&Iyer,1993を一般に参照)。
【0132】
核酸剤は、3’カチオン性基を含ませることによって、又は3’-3’結合によって末端のヌクレオシドを逆向きにすることによって、さらに修飾されうる。別の代替では、3’末端は、アミノアルキル基、例えば、3’ C5-アミノアルキルdTによってブロックされうる。他の3’コンジュゲートは、3’-5’エキソヌクレアーゼ切断を阻害することができる。理論に拘束されるものではないが、ナプロキセン又はイブプロフェンなどの3’コンジュゲートは、エキソヌクレアーゼがオリゴヌクレオチドの3’末端に結合するのを立体的にブロックすることによってエキソヌクレアーゼ切断を阻害し得る。小さなアルキル鎖、アリール基、又は複素環コンジュゲート若しくは修飾糖(D-リボース、デオキシリボース、グルコースなど)も、3’-5’-エキソヌクレアーゼをブロックすることができる。
【0133】
一実施形態によれば、5’末端は、アミノアルキル基、例えば、5’-O-アルキルアミノ置換基によってブロックされうる。他の5’コンジュゲートは、5’-3’エキソヌクレアーゼ切断を阻害することができる。理論に拘束されるものではないが、ナプロキセン又はイブプロフェンなどの5’コンジュゲートは、エキソヌクレアーゼがオリゴヌクレオチドの5’末端に結合するのを立体的にブロックすることによってエキソヌクレアーゼ切断を阻害し得る。小さなアルキル鎖、アリール基、又は複素環コンジュゲート若しくは修飾糖(D-リボース、デオキシリボース、グルコースなど)も、3’-5’-エキソヌクレアーゼをブロックすることができる。
【0134】
特定の実施形態によれば、修飾は、ロックド核酸(LNA)、若しくはcEtなどの他の架橋ヌクレオチド、及び/又は2’-O-(2-メトキシエチル)(2’MOEと略される)若しくは2’-OMe修飾を含めることを含み、それによって、配列の少なくとも一部又は全部は、各ヌクレオチドの2’位で修飾される。例えば、限定するものではないが、A40、A50、A51、A35、A49及びA52が挙げられる。
【0135】
本明細書では、ギャップマーも企図される(下記の実施例の項を参照、表5を参照)。ギャップマーは、RNase H切断を誘導するのに十分な長さのデオキシヌクレオチドモノマーの中央ブロックを含有するキメラアンチセンスオリゴヌクレオチドである。
【0136】
核酸剤(及び上記のその修飾)はまた、以下に要約されるようにDNAレベルで作用することができる。
【0137】
Chaserrのダウンレギュレーションはまた、遺伝子構造内の機能喪失変化(例えば、点変異、欠失及び挿入)を伴う標的化変異を導入することによって遺伝子(例えば、Chaserr)を不活性化することによって達成されうる。
【0138】
本明細書で使用される場合、「機能喪失変化(loss-of-function alterations)」という語句は、発現されたlncRNA産物の発現レベル及び/又は活性のダウンレギュレーションをもたらす、遺伝子のDNA配列内(例えば、Chaserrの最終エクソン内)のいずれかの変異を指す。そのような機能喪失変化の非限定的な例には、すなわち、特定の遺伝子産物のダウンレギュレーションをもたらす、通常は遺伝子の転写開始部位の5’側の、プロモーター配列内の変異;調節変異、すなわち、遺伝子産物の発現に影響を及ぼす、遺伝子の上流若しくは下流の領域内、又は遺伝子内の領域内の変異;欠失変異、すなわち、遺伝子配列内のいずれかの核酸を欠失させる変異;挿入変異、すなわち、遺伝子配列に核酸を挿入し、転写終結配列の挿入をもたらし得る変異;逆位、すなわち、逆位配列をもたらす変異;スプライス変異、すなわち、異常なスプライシング又は不十分なスプライシングをもたらす変異;及び重複変異、すなわち、フレーム内でありうるか又はフレームシフトを引き起こし得る重複配列をもたらす変異が挙げられる。
【0139】
特定の実施形態によれば、遺伝子の機能喪失変化は、遺伝子の少なくとも1つの対立遺伝子を含み得る。
【0140】
本明細書で使用される用語「対立遺伝子」は、遺伝子座の1又は複数の代替形態のいずれかを指し、その対立遺伝子はいずれも、形質又は特徴に関連する。2倍体細胞又は2倍体生物では、所与の遺伝子の2つの対立遺伝子は、相同染色体対上の対応する遺伝子座を占める。
【0141】
他の特定の実施形態によれば、遺伝子の機能喪失変化は、遺伝子の両対立遺伝子を含む。そのような場合、例えば、Chaserrの最終エクソン内の変異は、ホモ接合型又はヘテロ接合型でありうる。
【0142】
関心対象の遺伝子に核酸変化を導入する方法は、当技術分野で周知であり[例えば、Menke D.Genesis(2013)51:-618;Capecchi,Science(1989)244:1288-1292;Santiago et al.Proc Natl Acad Sci USA(2008)105:5809-5814;国際特許出願番号WO2014085593、WO2009071334及びWO2011146121;米国特許第8771945号明細書、米国特許第8586526号明細書、米国特許第6774279号明細書及び米国特許出願公開第20030232410号明細書、米国特許出願公開第20050026157号明細書、米国特許出願公開第20060014264号明細書を参照、標的化相同組換え、部位特異的リコンビナーゼ、PBトランスポザーゼ、及び操作されたヌクレアーゼによるゲノム編集を含む。関心対象の遺伝子に核酸変化を導入するための剤は、公的に入手可能な供給源によって設計することができるか、又はTransposagen、Addgene及びSangamo Biosciencesから商業的に入手することができる。
【0143】
例えば、ゲノム編集剤、例えば、CRISPR-Cas、メガヌクレアーゼ、ジンクフィンガーヌクレアーゼ(ZFN)、TALEN、トランスポゾンの使用などが挙げられる。
【0144】
組換えアデノ随伴ウイルス(rAAV)プラットフォームを使用したゲノム編集-このゲノム編集プラットフォームは、哺乳動物生細胞のゲノム内のDNA配列の挿入、欠失又は置換を可能にするrAAVベクターに基づく。rAAVゲノムは、陽性センス又は陰性センスのいずれかである一本鎖デオキシリボ核酸(ssDNA)分子であり、約4.7kbの長さである。これらの一本鎖DNAウイルスベクターは、高い形質導入率を有し、ゲノム内で二本鎖DNA切断の非存在下で内因性相同組換えを刺激するという固有の特性を有する。当業者であれば、所望のゲノム遺伝子座を標的とし、細胞内で全体の及び/又は微妙な内因性遺伝子変化の両方を行うためのrAAVベクターを設計することができる。rAAVゲノム編集は、単一の対立遺伝子を標的とし、いかなるオフターゲットゲノム変化ももたらさないという利点を有する。rAAVゲノム編集技術は、例えば、Horizon(商標)(Cambridge,UK)からrAAV GENESIS(商標)システムとして市販されている。
【0145】
有効性を識別し、配列変化を検出する方法は、当技術分野で周知であり、DNA配列決定、電気泳動、酵素に基づくミスマッチ検出アッセイ、及びハイブリダイゼーションアッセイ、例えば、PCR、RT-PCR、RNase保護、インサイチュハイブリダイゼーション、プライマー伸長、サザンブロット、ノーザンブロット及びドットブロット分析を含むが、これらに限定されない。
【0146】
特定の遺伝子内の配列変化はまた、例えば、クロマトグラフィー、電気泳動法、ELISAなどの免疫検出アッセイ、及びウエスタンブロット分析、並びに免疫組織化学的検査を使用して、タンパク質レベルで決定されうる。
【0147】
さらに、当業者であれば、構築物との相同組換え事象を受けた形質転換細胞を効率的に選択するための陽性及び/又は陰性選択マーカーを含むノックイン/ノックアウト構築物を容易に設計することができる。陽性選択は、外来DNAを取り込んだクローン集団を濃縮する手段を提供する。そのような陽性マーカーの非限定的な例には、グルタミンシンテターゼ、ジヒドロ葉酸レダクターゼ(DHFR)、ネオマイシン、ハイグロマイシン、ピューロマイシン及びブラストサイジンS耐性カセットなどの抗生物質耐性を付与するマーカーが挙げられる。陰性選択マーカーは、マーカー配列(例えば、陽性マーカー)のランダムな組込み及び/又は排除に対して選択するために必要である。そのような陰性マーカーの非限定的な例には、ガンシクロビル(GCV)を細胞傷害性ヌクレオシド類似体に変換する単純ヘルペス-チミジンキナーゼ(HSV-TK)、ヒポキサンチンホスホリボシルトランスフェラーゼ(HPRT)、及びアデニンホスホリボシルトランスフェラーゼ(ARPT)が挙げられる。
【0148】
一実施形態によれば、本技術は、一過性DNA又はDNA不含法(RNAトランスフェクションなど)を使用してRNAサイレンシング分子を導入することに関する。
【0149】
一実施形態によれば、RNAサイレンシング分子(例えば、アンチセンス分子)は、「裸の」オリゴヌクレオチドとして、すなわち、追加の送達ビヒクルを用いず送達される。一実施形態によれば、「裸の」オリゴヌクレオチドは、その組織送達を促進するための化学修飾を含む(例えば、上記のように、逆位ヌクレオチド、ホスホロチオエート結合、又はロックド核酸の組込みを利用する)。
【0150】
RNA又はDNAのトランスフェクションのための当技術分野で公知のいずれかの方法、例えば、限定するものではないが、マイクロインジェクション、エレクトロポレーション、例えば、リポソームを使用するか又はカチオン性分子若しくはナノ材料を使用する脂質媒介トランスフェクションを本教示に従って使用することができる(以下に説明され、参照により本明細書に組み込まれるRoberts et al.Nature Reviews Drug Discovery(2020)19:673-694にさらに説明されている)。
【0151】
一実施形態によれば、上記で言及されるように、RNAサイレンシング分子(例えば、アンチセンス)が化学修飾を含まない場合、RNAサイレンシング分子は、発現構築物の一部として標的細胞(例えば、老化細胞)に投与されうる。この場合、RNAサイレンシング分子(例えば、アンチセンス分子)は、標的細胞(例えば、神経細胞)内でRNAサイレンシング分子(例えば、アンチセンス)の発現を構成的又は誘導的に導くことができるシス作用性調節エレメント(例えば、プロモーター)の制御下で核酸構築物(本明細書では「発現ベクター」とも呼ばれる)にライゲーションされる。
【0152】
本発明の発現構築物はまた、発現構築物を真核生物における複製及び組込みに適したものにする追加の配列(例えば、シャトルベクター)を含み得る。典型的なクローニングベクターは、転写開始配列及び翻訳開始配列(例えば、プロモーター、エンハンサー)並びに転写ターミネーター及び翻訳ターミネーター(例えば、ポリアデニル化シグナル)を含有する。本発明の発現構築物は、エンハンサーをさらに含むことができ、エンハンサーは、プロモーター配列に隣接していてもよいか、又はプロモーター配列から離れていてもよく、プロモーター配列からの転写のアップレギュレート時に機能することができる。また、ポリアデニル化配列は、発現の効率を増加させるために、本発明の発現構築物に付加されうる。
【0153】
既に記載された実施形態に加えて、本発明の発現構築物は、クローニングされた核酸の発現レベルを増加させること、又はRNAサイレンシング分子(例えば、アンチセンス)を有する細胞の同定を容易にすることを意図した他の特殊化されたエレメントを典型的に含有しうる。本発明の発現構築物は、真核生物レプリコンを含んでも含まなくてもよい。
【0154】
核酸構築物は、適切な遺伝子送達ビヒクル/方法(トランスフェクション、形質導入など)及び適切な発現系を使用して、本発明の標的細胞(例えば、神経細胞)に導入されうる。そのような方法は、Sambrook et al.,Molecular Cloning:A Laboratory Manual,Cold Springs Harbor Laboratory,New York(1989,1992),Ausubel et al.,Current Protocols in Molecular Biology,John Wiley and Sons,Baltimore,Md.(1989),Chang et al.,Somatic Gene Therapy,CRC Press,Ann Arbor,Mich.(1995),Vega et al.,Gene Targeting,CRC Press,Ann Arbor Mich.(1995),Vectors:A Survey of Molecular Cloning Vectors and Their Uses,Butterworths,Boston Mass.(1988)及びGilboa et at.[Biotechniques 4(6):504-512,1986]に一般に記載されており、例えば、安定な又は一過性のトランスフェクション、リポフェクション、エレクトロポレーション、及び組換えウイルスベクターによる感染を含む。さらに、陽性-陰性選択法に関して、米国特許第5,464,764号明細書及び米国特許第5,487,992号明細書を参照されたい。
【0155】
追加的又は代替的に、脂質に基づく系が、それによってコードされる構築物又は核酸剤を本発明の標的細胞(例えば、老化細胞又は癌細胞)に送達するために使用されうる。脂質に基づく系には、例えば、リポソーム、リポプレックス及び脂質ナノ粒子(LNP)が含まれる。いくつかの実施形態では、アンチセンスオリゴヌクレオチド又はsiRNAは、コンジュゲートされた脂質又はコレステリル部分を含む、
【0156】
神経細胞特異的プロモーターを使用して、方法の特異性を改善することができる。神経細胞特異的プロモーターの例には、限定するものではないが、シナプシンが挙げられる。シナプシンは、ニューロン特異的タンパク質であると考えられているため(DeGennaro et al.,1983 Cold Spring Harb.Symp.Quant.Biol.1,337-345)、そのニューロン特異的発現パターンを活用して、導入遺伝子をニューロン特異的に発現させることができる。局所注射のためのアデノウイルスベクター及びAAVベクターでは、最小限のヒトシナプシンプロモーターが使用されている(Kugler et al.2003 Human synapsin 1 gene promoter confers highly neuron-specific long-term transgene expression from an adenoviral vector in the adult rat brain depending on the transduced area.Gene Ther.10,337-347)。末梢投与後にCNSに到達することができるAAVキャプシド、例えば、AAV9又は他の天然AAV血清型は、大規模発現をもたらす比較的非侵襲的な投与に有利である。現時点で、神経細胞形質導入効率が増加したいくつかの操作されたキャプシドが存在する。E/SYNプロモーターを有するレンチウイルスは、ニューロン内で強力な持続的発現を示すことが報告されている(Hioki et al.Gene Therapy volume 14,pages872-882(2007))。
【0157】
本教示は、CHD2ハプロ不全に関連する関連疾患、症候群、障害及び病状を処置する点で、診療所向けに活用されうる。
【0158】
したがって、本発明の一態様によれば、処置が必要な対象のクロモドメインヘリカーゼDNA結合タンパク質2(CHD2)ハプロ不全に関連する疾患又は病状を処置する方法であって、ヒトChaserrの活性又は発現をダウンレギュレートする核酸剤の治療有効量を対象に投与することを含み、核酸剤が、ヒトChaserrの最終エクソンへと指向しており、それによって、CHD2ハプロ不全に関連する疾患又は病状を処置する方法が提供される。
【0159】
代替的又は追加的な態様によれば、処置が必要な対象のクロモドメインヘリカーゼDNA結合タンパク質2(CHD2)ハプロ不全に関連する疾患又は病状を処置するのに使用するための、ヒトChaserrの活性又は発現をダウンレギュレートする核酸剤であって、ヒトChaserrの最終エクソンへと指向した核酸剤が提供される。
【0160】
本明細書で使用される場合、「クロモドメインヘリカーゼDNA結合タンパク質2(CHD2)ハプロ不全に関連する疾患又は病状」は、CHD2の発現(タンパク質及び任意にmRNA)の減少を特徴とする、又は発症若しくは進行がCHD2の発現(タンパク質及び任意にmRNA)の減少に関連する病原性状態を指す。
【0161】
特定の実施形態によれば、CHD2ハプロ不全に関連する疾患又は病状とは、早期発症てんかん性脳症(すなわち、頻繁な進行中のてんかん様の活動に関連する難治性発作及び認知の緩慢化又は後退)を典型的に特徴とするCHD2関連神経発達障害を指す。発作の発症は、典型的には6ヶ月齢~4歳である。発作型には、転倒発作、ミオクローヌス、及びEEG上の全般性スパイク波に関連する複数の発作型の急速な発症、アトニー性ミオクローヌス欠神発作(atonic-myoclonic-absence seizure)、並びに臨床的光線過敏が典型的に含まれる。知的障害及び/又は自閉症スペクトラム障害が一般的である。
【0162】
特定の実施形態によれば、病状は、レノックス・ガストー症候群(LGS)、ミオクローヌス欠神てんかん(MAE)、ドラベ症候群、てんかんを伴う知的障害、自閉症スペクトラム障害(ASD)からなる群より選択される。
【0163】
CHD2関連神経発達障害の診断は、分子遺伝子検査で検出されたヘテロ接合CHD2単一ヌクレオチド病原性変異体、小型インデル(挿入/欠失)病原性変異体、又は部分的若しくは全体的な遺伝子欠失を有する被験者を対象に確立される。
【0164】
CHD2遺伝子の変異は、生殖系列変異又はデノボ体細胞変異の結果でありうる。
【0165】
用語「処置する」は、病態(疾患、障害又は状態)の発生を阻害、予防若しくは阻止すること、及び/又は病態の低減、寛解若しくは退行を引き起こすことを指す。当業者であれば、様々な方法及びアッセイを使用して病態の発生を評価することができ、同様に、様々な方法及びアッセイを使用して病態の低減、寛解又は退行を評価してもよいことを理解するであろう。
【0166】
本明細書で使用される場合、用語「予防する」は、疾患、障害又は状態が、疾患のリスクがある可能性があるが、疾患を有すると未だ診断されていない対象に発生するのを防ぐことを指す。
【0167】
本明細書で使用される場合、用語「対象」は、哺乳動物、好ましくは病態に罹患しているいずれかの年齢のヒトを含む。好ましくは、この用語は、病態を発生するリスクがある個体を包含する。哺乳動物は胚又は胎児であってもよいことが理解されるであろう。あるいは、対象は、15歳又は18歳までの小児又は青少年でありうる。
【0168】
インビボ治療のために、核酸剤は、それ自体で、又は医薬組成物の一部として対象に投与される。
【0169】
本明細書で使用される場合、「医薬組成物」は、生理学的に好適な担体及び賦形剤などの他の化学成分を含む、本明細書に記載の活性成分のうちの1又は複数の調製物を指す。医薬組成物の目的は、生物への化合物の投与を容易にすることである。
【0170】
本明細書では、用語「活性成分」は、生物学的効果の主な原因となることができる核酸剤を指す。
【0171】
以下、区別なく使用されうる「生理学的に許容される担体」及び「薬学的に許容される担体」という語句は、生物に対して顕著な刺激を引き起こさず、投与された化合物の生物学的活性及び特性を無効にしない担体又は希釈剤を指す。アジュバントは、これらの語句の下に含まれる。
【0172】
本明細書では、用語「賦形剤」は、活性成分の投与をさらに容易にするために医薬組成物に加えられる不活性物質を指す。賦形剤の例には、限定するものではないが、炭酸カルシウム、リン酸カルシウム、様々な糖、及びデンプンの種類、セルロース誘導体、ゼラチン、植物油、並びにポリエチレングリコールが挙げられる。
【0173】
薬物の製剤化及び投与のための技術は、参照により本明細書に組み込まれる“Remington’s Pharmaceutical Sciences,” Mack Publishing Co.,Easton,PA,latest editionに見出されうる。
【0174】
好適な投与経路には、例えば、全身、経口、直腸、経粘膜、特に経鼻、腸又は非経口送達、例えば、筋肉内、皮下及び髄内注射、並びに髄腔内、直接脳室内、心臓内、例えば、右又は左心室内腔内、総冠動脈(common coronary artery)内、静脈内、腹腔内、鼻腔内、腫瘍内又は眼内注射が含まれ得る。
【0175】
特定の実施形態によれば、前記組成物は吸入投与様式用である。
【0176】
特定の実施形態によれば、前記組成物は鼻腔内投与用である。
【0177】
特定の実施形態によれば、前記組成物は脳室内投与用である。
【0178】
特定の実施形態によれば、前記組成物は髄腔内投与用である。
【0179】
特定の実施形態によれば、前記組成物は腫瘍内投与用である。
【0180】
特定の実施形態によれば、前記組成物は経口投与用である。
【0181】
特定の実施形態によれば、前記組成物は局所注射用である。
【0182】
特定の実施形態によれば、前記組成物は全身投与用である。
【0183】
特定の実施形態によれば、前記組成物は静脈内投与用である。
【0184】
中枢神経系(CNS)への薬物送達のための従来の手法には、神経外科的戦略(例えば、脳内注射又は脳室内注入);BBBの内因性輸送経路の1つを利用するための前記剤の分子操作(例えば、それ自体がBBBを通過することができない剤と組み合わせて、内皮細胞表面分子に対して親和性を有する輸送ペプチドを含むキメラ融合タンパク質の産生);剤の脂質溶解度を増加させるように設計された薬理学的戦略(例えば、水溶性剤と脂質担体又はコレステロール担体とのコンジュゲーション);及び(頸動脈へのマンニトール溶液の注入、又はアンジオテンシンペプチドなどの生物学的に活性な剤の使用に起因する)高浸透圧破壊によるBBBの完全性の一時的な破壊が含まれる。しかし、これらの戦略の各々は、侵襲的外科処置に関連する固有のリスク、内因性輸送系に固有の制限によって課されるサイズ制限、CNSの外側で活性でありうる担体モチーフから構成されるキメラ分子の全身投与に関連する潜在的に望ましくない生物学的副作用、及びBBBが破壊される脳の領域内の脳損傷のリスクの可能性などの制限を有し、これにより、これらの戦略の各々は準最適な送達方法になる。
【0185】
あるいは、例えば、医薬組成物を患者の組織領域に直接注射することによって、全身的ではなく局所的に医薬組成物を投与してもよい。
【0186】
本発明のいくつかの実施形態の医薬組成物は、当技術分野で周知のプロセスによって、例えば、従来の混合、溶解、造粒、糖衣錠作製、湿式粉砕、乳化、カプセル化、捕捉又は凍結乾燥プロセスによって製造されうる。
【0187】
したがって、本発明のいくつかの実施形態に従って使用するための医薬組成物は、賦形剤及び助剤を含む1又は複数の生理学的に許容される担体を使用して従来のように製剤化され得、これにより、活性成分を薬学的に使用されうる調製物に加工するのが容易になる。適切な製剤は、選択される投与経路に依存する。
【0188】
注射の場合、医薬組成物の活性成分は、水溶液、好ましくは生理学的に適合性の緩衝液、例えば、ハンクス液、リンガー液又は生理食塩緩衝液中で製剤化されうる。経粘膜投与の場合、浸透されるバリアにとって適切な浸透剤が製剤に使用される。そのような浸透剤は、当技術分野で一般に公知である。
【0189】
経口投与の場合、医薬組成物は、活性化合物を当技術分野で周知の薬学的に許容される担体と組み合わせることによって容易に製剤化されうる。そのような担体は、患者による経口摂取のために、医薬組成物を錠剤、丸剤、糖衣錠、カプセル、液体、ゲル、シロップ、スラリー、懸濁液などとして製剤化することを可能にする。経口使用のための薬理学的調製物は、錠剤又は糖衣錠コアを得るために、所望であれば好適な助剤を加えた後に、固体賦形剤を使用し、得られた混合物を任意に粉砕し、顆粒の混合物を加工して作製されうる。好適な賦形剤には、特に、ラクトース、スクロース、マンニトール若しくはソルビトールを含む糖などの充填剤;例えば、トウモロコシデンプン、コムギデンプン、コメデンプン、バレイショデンプン、ゼラチン、トラガカントゴム、メチルセルロース、ヒドロキシプロピルメチルセルロース、カルボメチルセルロースナトリウムなどのセルロース調製物;及び/又はポリビニルピロリドン(PVP)などの生理学的に許容されるポリマーがある。所望であれば、架橋ポリビニルピロリドン、寒天、又はアルギン酸若しくはその塩、例えば、アルギン酸ナトリウムなどの崩壊剤を加えてもよい。
【0190】
糖衣錠コアには、好適なコーティングが施される。この目的のために、アラビアゴム、タルク、ポリビニルピロリドン、カルボポールゲル、ポリエチレングリコール、二酸化チタン、ラッカー溶液及び好適な有機溶媒又は溶媒混合物を任意に含有しうる濃縮糖溶液を使用してもよい。識別のために、又は活性化合物用量の様々な組合せを特徴付けるために、染料又は顔料を錠剤又は糖衣錠コーティングに加えてもよい。
【0191】
経口的に使用されうる医薬組成物には、ゼラチン製の押込み式カプセル、並びにゼラチン及び可塑剤、例えば、グリセロール又はソルビトール製の軟密封カプセルが含まれる。押込み式カプセルは、ラクトースなどの充填剤、デンプンなどの結合剤、タルク又はステアリン酸マグネシウムなどの潤滑剤、及び任意に安定剤と混合して活性成分を含有しうる。軟カプセルでは、活性成分は、脂肪油、流動パラフィン又は液体ポリエチレングリコールなどの好適な液体に溶解又は懸濁されてもよい。さらに、安定剤を加えてもよい。経口投与のための製剤はいずれも、選択された投与経路に適した投与量であるべきである。
【0192】
頬側投与の場合、組成物は、従来のように製剤化された錠剤又はトローチ剤の形態をとってもよい。
【0193】
経鼻吸入による投与の場合、本発明のいくつかの実施形態による使用のための活性成分は、好適な噴射剤、例えば、ジクロロジフルオロメタン、トリクロロフルオロメタン、ジクロロ-テトラフルオロエタン又は二酸化炭素を使用して、加圧パック又はネブライザーからエアロゾルスプレー体裁の形態で都合よく送達される。加圧エアロゾルの場合、投与量単位は、計量された量を送達するための弁を設けることによって決定されうる。ディスペンサーで使用するための、例えば、ゼラチンのカプセル及びカートリッジは、化合物とラクトース又はデンプンなどの好適な粉末基剤との粉末混合物を含有して製剤化されうる。
【0194】
本明細書に記載の医薬組成物は、例えば、ボーラス注射又は連続注入による非経口投与のために製剤化されうる。注射用製剤は、単位剤形で、例えば、アンプルで、又は任意に保存剤を加えた複数回投与容器で提供されうる。組成物は、油性又は水性ビヒクル中の懸濁液、溶液又はエマルジョンであってよく、懸濁化剤、安定化剤及び/又は分散剤などの配合剤を含有してもよい。
【0195】
非経口投与のための医薬組成物は、水溶性形態の活性調製物の水溶液を含む。さらに、活性成分の懸濁液は、適切な油性又は水性注射懸濁液として調製されうる。好適な親油性の溶媒又はビヒクルには、ゴマ油などの脂肪油、又はオレイン酸エチル、トリグリセリド若しくはリポソームなどの合成脂肪酸エステルが含まれる。水性注射懸濁液は、懸濁液の粘度を増加させる物質、例えば、カルボキシメチルセルロースナトリウム、ソルビトール又はデキストランを含有しうる。任意に、懸濁液はまた、高濃度溶液の調製を可能にするために、活性成分の溶解度を増加させる好適な安定剤又は剤を含有しうる。
【0196】
あるいは、活性成分は、使用前に好適なビヒクル、例えば、滅菌パイロジェンフリー水性溶液を用いて構成するための粉末形態であってよい。
【0197】
本発明のいくつかの実施形態の医薬組成物はまた、例えば、カカオバター又は他のグリセリドなどの従来の坐剤基剤を使用して、坐剤又は停留浣腸などの直腸組成物に製剤化されうる。
【0198】
本発明のいくつかの実施形態に関連して使用するのに適した医薬組成物には、活性成分が意図された目的を達成するのに有効な量で含有される組成物が含まれる。さらに具体的には、治療有効量とは、障害(例えば、CHD2ハプロ不全に関連する)の症状を予防、緩和若しくは改善するため、又は処置されている対象の生存期間を延長するために有効な、活性成分(例えば、核酸剤)の量を意味する。
【0199】
処置有効量の決定は、特に本明細書で提供される詳細な開示に照らして、十分に当業者の能力の範囲内である。
【0200】
本発明の方法で使用されるいずれかの調製物では、治療有効量又は治療有効用量は、インビトロアッセイ及び細胞培養アッセイから最初に推定されうる。例えば、何らかの用量が、所望の濃度又は力価を達成するために動物モデルを対象に製剤化されうる。そのような情報は、ヒトに対する有用な用量をさらに正確に決定するために使用することができる。
【0201】
本明細書に記載の活性成分の毒性及び治療有効性は、インビトロで標準的な薬学的手順によって、細胞培養又は実験動物を対象とした標準的な薬学的手順によって決定されうる。これらのインビトロアッセイ及び細胞培養アッセイ並びに動物試験から得られたデータは、ヒトに使用するための様々な投与量を製剤化するのに使用されうる。投与量は、使用される剤形及び利用される投与経路に応じて変化し得る。正確な製剤、投与経路及び投与量は、患者の状態を考慮して個々の医師によって選択されうる。(例えば、Fingl,et al.,1975,in “The Pharmacological Basis of Therapeutics”,Ch.1 p.1を参照)。
【0202】
投与量及び間隔は、生物学的効果を誘導又は抑制するのに十分なレベル(最小有効濃度、MEC)の活性成分を提供するように個別に調整されうる。MECは、調製物ごとに変化するが、インビトロデータから推定することができる。MECを達成するために必要な投与量は、個々の特徴及び投与経路に依存する。検出アッセイを使用して血漿濃度を決定することができる。
【0203】
処置される状態の重症度及び応答性に応じて、投薬は、単回又は複数回の投与であってよく、一連の処置は、数日から数週間、又は治癒がもたらされるまで、若しくは疾患状態の縮小が達成されるまで続く。
【0204】
投与される組成物の量は、当然のことながら、処置される対象、苦痛の重症度、投与様式、処方医師の判断などに依存する。
【0205】
本発明のいくつかの実施形態の組成物は、所望であれば、活性成分を含有する1又は複数の単位剤形を含有しうるパック又はディスペンサー装置、例えば、FDAによって承認されたキットで提供されうる。パックは、例えば、ブリスターパックなどの金属又はプラスチック箔を含み得る。パック又はディスペンサー装置は、投与のための説明書を伴ってもよい。パック又はディスペンサーはまた、医薬品の製造、使用又は販売を規制する政府機関によって規定された形態の容器に関連する通知によって対応されてもよく、この通知は、組成物の形態、又はヒト投与若しくは獣医学的投与に関する機関による承認を反映している。そのような通知は、例えば、処方薬について米国食品医薬品局によって承認されたラベル、又は承認された製品インサートであってよい。適合性医薬担体中に製剤化された本発明の調製物を含む組成物もまた、上記でさらに詳述されるように、調製され得、適切な容器に入れられ得、示された状態の処置のためにラベル付けされうる。
【0206】
本発明の核酸剤による処置は、当技術分野で公知の他の管理プロトコルを用いて増強されうる。例えば、抗てんかん薬(AED)。
【0207】
図14は、本発明の様々な例示的な実施形態による、配列のセットを分析するのに適した方法のフローチャート図である。別段の定義がない限り、本明細書中下記に記載される動作は、多くの組合せ又は実行順序で同時に又は順次に実行することができることを理解されたい。具体的には、フローチャート図の順序は、限定と考えられるべきではない。例えば、以下の説明又はフローチャート図に特定の順序で出現する2つ以上の動作は、異なる順序(例えば、逆順)で、又は実質的に同時に実行することができる。さらに、以下に記載するいくつかの動作は、任意選択であり、実行されなくてもよい。
【0208】
本明細書に記載の動作の少なくとも一部は、データを受信し、以下に記載される動作を実行するように構成されたデータ処理システム、例えば、専用回路又は汎用コンピュータによって実施することができる。動作の少なくとも一部は、遠隔地のクラウドコンピューティング施設によって実施することができる。
【0209】
本実施形態の方法を実施するコンピュータプログラムは、通信ネットワークによって、又は限定するものではないが、フロッピーディスク、CD-ROM、フラッシュメモリ装置及びポータブルハードドライブなどの提供媒体上で、ユーザに一般に提供されうる。通信ネットワーク又は提供媒体から、コンピュータプログラムをハードディスク又は同様の中間記憶媒体にコピーすることができる。コンピュータプログラムは、それらの提供媒体又はそれらの中間記憶媒体のいずれかからコンピュータの実行メモリにコード命令をロードし、本発明の方法に従って動作するようにコンピュータを構成することによって実行されうる。動作中、コンピュータは、中間計算によって得られたデータ構造又は値をメモリに記憶することができ、後続の動作で使用するためにこれらのデータ構造又は値を引き出す。これらの動作はいずれも、コンピュータシステムの当業者に周知である。
【0210】
本明細書に記載の処理動作は、DSP、マイクロコントローラ、FPGA、ASICなどのプロセッサ回路、又はいずれかの他の従来の及び/若しくは専用のコンピューティングシステムによって行われ得る。
【0211】
本実施形態の方法は、多くの形態で具現化されうる。例えば、本実施形態の方法は、方法動作を行うためのコンピュータなどの有形媒体上で具現化されうる。本実施形態の方法は、方法動作を行うためのコンピュータ可読命令を備えるコンピュータ可読媒体上で具現化されうる。また、本実施形態の方法は、有形媒体上でコンピュータプログラムを実行するか、又はコンピュータ可読媒体上で命令を実行するように構成されたデジタルコンピュータ機能を有する電子装置で具現化されうる。
【0212】
ここで図14を参照すると、前記方法は、10で開始し、任意に、かつ好ましくは、配列のセットが受信される11に続く。典型的には、セット内の各配列は、限定するものではないが、DNA又はRNAなどのポリヌクレオチドを記述し、ここでセット内の様々な配列によって記述されるポリヌクレオチドは互いに相同であることが、本明細書中下記に、及び下記の実施例の項にさらに記載されるように、手作業で、又は当業者に公知のBlastn、FASTAなどの生物情報学ツールを使用して決定される。特定の実施形態によれば、DNAはゲノムDNAである。別の実施形態によれば、DNAは、cDNA又はライブラリーDNAである。特定の実施形態によれば、DNAは、遺伝子座を表す。別の実施形態によれば、DNAは、コードDNA又は非コードDNAである。特定の実施形態によれば、DNAは、エクソン、イントロン又はそれらの組合せを含む。特定の実施形態によれば、配列はRNA配列である。特定の実施形態によれば、RNAはコードRNAである。別の実施形態によれば、RNAは非コードRNAである。
【0213】
本発明のいくつかの実施形態では、相同なポリヌクレオチドは、3’UTR、lncRNA及びエンハンサーからなる群より選択される。
【0214】
セット内のポリヌクレオチドは、完全配列又は部分配列でありうる。
【0215】
本発明のいくつかの実施形態では、前記方法は12に進み、ここで、セット内の配列が、所定の順序、例えば、進化によって決定された順序に従ってアライメントされて、複数のアライメント層を有するマルチプルアライメントを提供する。
【0216】
アライメントは、複数のアライメントとして、又は系統樹表現-樹状図を使用して順序付けられうる。典型的には、複数のアライメントでは、第1のアライメント層は、クエリポリヌクレオチドを記述する配列である。アライメントが進化によって決定される場合、第1の層は、任意に、かつ好ましくは、関心対象の種を記述する配列である。例えば、ポリヌクレオチドの1つがヒトポリヌクレオチドである場合、第1のアライメント層は、ヒトポリヌクレオチドの配列でありうる。
【0217】
アライメントは、当技術分野で公知のいずれかの技術によるものでありうる。典型的には、アライメント技術はスコアを提供し、順序はスコアに従う。例えば、BLASTを使用して配列の順序を決定することができる。アライメント技術がスコアを提供する場合、第2のアライメント層は、第1のアライメント層に対して最も高いアライメントスコアを有する配列であることが好ましく、第3のアライメント層は、第1のアライメント層に対して次に高いアライメントスコアを有する配列であることが好ましく、以下同様である。これにより、各層内の配列が前の層内の配列に対して最良のアライメントスコアを有するものであるアライメントが提供される。アライメント技術が特定のアライメント層に対して有意なアライメントを提供しない場合、その特定のアライメント層の後にある層は、受信されたセットの順序に従って次に利用可能な配列を含む。
【0218】
ただし、動作12を実行する必要はないことを理解されたい。例えば、前記方法は、受信されたセットの時点で順序を使用することができる。あるいは、前記方法は、ユーザが、例えば、ユーザインターフェース装置によって、前記方法によって使用されるべき順序を選択又は入力することを可能にすることができる。
【0219】
前記方法は、グラフが構築される13に続くことが好ましい。本発明者らは、さらに構造化された前記方法で問題の制約を定義することを可能にするため、配列分析の問題をグラフをトラバースする問題に変換することが有利であることを見出した。グラフは、階層化及び連結されたグラフであることが好ましく、グラフの各エッジは、連続する層のノード同士を連結する。グラフの層は、配列を表すことが好ましく、層内のノードは、それぞれの配列内のk量体を表す。したがって、例えば、グラフのi番目の層がセットの特定の配列(例えば、イヌ生物の配列)を表すと仮定する。この場合、i番目の層の各ノードは、特定の配列のk量体を表す。例えば、i番目の層の第1のノードは、その特定の配列内の第1のk量体(例えば、配列の塩基1~k)を表すことができ、i番目の層の第2のノードは、その特定の配列内の第2のk量体(例えば、配列の塩基2~k+1)を表すことができ、以下同様である。本発明の様々な例示的な実施形態では、6≦k≦12である。
【0220】
動作12が実行されず、前記方法が順序に関するユーザ入力を受信しない場合、前記方法は、受信されたセット内の配列の順序に従ってグラフの層を構築する。具体的には、グラフの第1の層は、受信されたセット内の第1の配列を表し、グラフの第2の層は、受信されたセット内の第2の配列を表し、以下同様である。前記方法が順序に関するユーザ入力を受信すると、前記方法は、ユーザ入力に従ってグラフの層を構築する。具体的には、グラフの第1の層は、ユーザ入力に従って順序が1番目となる配列を表し、グラフの第2の層は、ユーザ入力に従って順序が2番目となる配列を表し、以下同様である。動作12が実行されると、前記方法は、アライメントに従ってグラフの層を構築する。具体的には、グラフの第1の層は第1のアライメント層の配列を表し、グラフの第2の層は第2のアライメント層の配列を表し、以下同様である。
【0221】
本発明の様々な例示的な実施形態では、グラフの第1の層は、クエリポリヌクレオチドを記述する配列を表す。
【0222】
グラフは、各エッジが同一又は相同なk量体を表すノード同士を連結するように、任意に、かつ好ましくは構築される。この実施形態の利点は、複数のポリヌクレオチドにわたって保存されているか又は実質的に保存されているモチーフを同定することができることである。
【0223】
本発明のいくつかの実施形態によれば、グラフのエッジによって連結される相同なk量体間の相同性は、少なくとも60%、さらに好ましくは少なくとも70%、さらに好ましくは少なくとも80%、さらに好ましくは少なくとも90%、95%又はそれ以上である。
【0224】
本発明のいくつかの実施形態による典型的な階層化されたグラフの代表的な例を図11B図11D及び図12に示す。これらの図では、ノードはk量体を形成するヌクレオチド塩基に対応するストリングとして示され、エッジは直線実線として示され、層はL、Lなどによって示されている。
【0225】
前記方法は、グラフがグラフのエッジに沿った連続的な非交差経路を求めて検索される14に続く。検索は、限定するものではないが、線形計画法(例えば、整数線形計画法)、混合線形計画法などのいずれかの公知の最適化技術、又は局所的に最大の解を見つけるためのいずれかの他の手法、例えば、貪欲法アルゴリズムを使用することができる。
【0226】
経路は、1つの特定のk量体を表すノード同士を連結するエッジが、その特定のk量体と同一又は相同ではないk量体を表すノード同士を連結するエッジと交差しないという意味で非交差である。ただし、特定のk量体を表し、2つの連続する層に属するノード同士を連結する複数のエッジエッジが存在する場合、これらのエッジは交差してもよいが、必ずしも交差しなくてもよいことに留意されたい。例えば、図11Dの下部の簡略化されたグラフを参照すると、グラフは、2つのk量体、すなわち、7量体AGAAUCGを表す8つのノードと、6量体CCGUACを表す5つのノードとを含む。(同一又は相同な)7量体を連結するエッジは、(同一又は相同な)6量体を連結するエッジと交差しない。一方、7量体を連結し、互いに交差するエッジが存在する(例えば、層Lの第4のノードを層Lの第4のノードに連結するエッジ、及び層Lの第5のノードを層Lの第3のノードに連結するエッジを参照)。それでも、7量体を連結するエッジのいくつかは、他のエッジと交差しない(例えば、層Lの第4のノードを層Lの第3のノードに連結するエッジは、層Lの第5のノードを層Lの第4のノードに連結するエッジと交差しないことを参照)。
【0227】
本発明のいくつかの実施形態では、検索は、浅い方の経路(すなわち、グラフの少ない方の層を通過する経路)よりも深い方の経路(すなわち、グラフの多い方の層を通過する経路)に対して検索が優先的であるように、検索のための制約として経路深度による基準を適用することを含む。
【0228】
前記方法は、14から、任意に、かつ好ましくは、15に続き、15では、kの値が(好ましくは1だけ)減少し、次いで、13に折り返して、グラフに既に存在するノードによって既に表されているk量体よりも短いk量体を表すノードをグラフに含めることによって、kの減少した値に従ってグラフを再構築する。好ましくは、再構築は、既存のノードの少なくとも一部を維持しながら、より短いk量体に対応するノードを追加することを含み、したがって、グラフの順序(ノードの数)を増加させる。図11Dの簡略化された場合を再び参照すると、この図の最上部のグラフは、7量体を表す8つのノードを有し、k<7のk量体を表すノードを含まない。図11Dの中央のグラフは、グラフの順序が8から8+5=13に増加するように、6量体を表す5つのノードを追加することによるグラフの再構築を示す。
【0229】
より短いk量体を表すノードがグラフに含まれると、前記方法は、連続する層の同一又は相同なk量体を連結するように、グラフのエッジを任意に、かつ好ましくは更新する。これは、図11Dの中央のグラフに例示されており、ここで、6量体を表す新たに追加されたノード同士を連結するためにグラフにエッジが追加された。特定のk量体を表す、層L内のいずれかのノードが、同じ特定のk量体を表す、層Li+1内のあらゆるノードに連結されるように、を組み合わせて追加することができる。
【0230】
グラフの各再構築後、前記方法は、任意に、かつ好ましくは、動作14を再実行して、再構築されたグラフのエッジに沿って連続的な非交差経路を提供する。そのような再実行は、例えば、以前に取得された経路が新たに追加されたエッジと交差することが判明した場合に、以前に取得された経路の除外をもたらし得る。これは、図11Dの上部及びグラフに例示されており、ここで、例えば、層Lの左端のノードで始まり、層Lの右端のノードで終わる経路は、図11Dの上部グラフ(再構築前)に含まれるが、再構築中に追加された、6量体を連結するエッジと交差することが判明したため、図11Dの下部グラフ(再構築後)には含まれない。
【0231】
15を介した14から13への折返しは、任意に、かつ好ましくは反復的に継続される。好ましくは、各反復サイクルで、前記方法は、検索のための制約として、前の反復サイクルで得られた経路を適用する。制約のそのような適用の代表例は、図12に示され、以下の実施例の項でさらに例示される。反復は、追加されるk量体がなくなるまで、又は見つけられる新たな非交差経路がなくなるまで、又は何らかの他の所定の停止基準が満たされるまで、任意に、かつ好ましくは繰り返される。
【0232】
16では、出力が生成される。出力は、経路のうちの少なくとも1つに対応するk量体を機能的に関心対象の核酸配列として同定することが好ましい。出力は、表示装置上にグラフィック若しくはテキストで表示されうるか、又はその後の使用のためにコンピュータ可読記憶媒体に記憶されうる。
【0233】
前記方法は、17で終了する。
【0234】
図15は、入力/出力(I/O)回路134と、ハードウェア中央処理装置(CPU)136(例えば、ハードウェアマイクロプロセッサ)と、揮発性メモリ及び不揮発性メモリの両方を典型的に含むハードウェアメモリ138とを典型的に備えるハードウェアプロセッサ132を有するクライアントコンピュータ130の概略図である。CPU136は、I/O回路134及びメモリ138と通信する。クライアントコンピュータ130は、プロセッサ132と通信するグラフィカルユーザインターフェース(GUI)142を備えることが好ましい。I/O回路134は、適切に構造化された形式でGUI142との間で情報を通信することが好ましい。ハードウェアプロセッサ152、I/O回路154、ハードウェアCPU156、ハードウェアメモリ158を同様に含むことができるサーバコンピュータ150も示されている。クライアントコンピュータ130及びサーバコンピュータ150のI/O回路134及び154は、有線通信又は無線通信を介して互いに情報を通信する送受信器として動作することができる。例えば、クライアントコンピュータ130及びサーバコンピュータ150は、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)又はインターネットなどのネットワーク140を介して通信することができる。サーバコンピュータ150は、いくつかの実施形態では、ネットワーク140を介してクライアントコンピュータ130と通信するクラウドコンピューティング設備のクラウドコンピューティングリソースの一部でありうる。
【0235】
GUI142及びプロセッサ132は、同じハウジング内に一体化されてもよいか、又は互いに通信する別個のユニットであってよい。
【0236】
GUI142は、任意に、かつ好ましくは、GUI142がプロセッサ132と通信することを可能にする専用のCPU及びI/O回路(図示せず)を含むシステムの一部でありうる。プロセッサ132は、CPU136によって生成されたグラフィック出力及びテキスト出力をGUI142に発する。プロセッサ132はまた、ユーザ入力に応答してGUI142によって生成された制御命令に関係する信号をGUI142から受信する。GUI142は、当技術分野で公知のいずれかの種類のもの、例えば、限定するものではないが、キーボード及びディスプレイ、タッチスクリーンなどでありうる。好ましい実施形態では、GUI142は、スマートフォン、タブレット、スマートウォッチなどのモバイル装置のGUIである。GUI142がモバイル装置、プロセッサ132のGUIである場合、モバイル装置のCPU回路は、プロセッサ132として機能することができ、本明細書に記載のコード命令を実行することができる。
【0237】
クライアントコンピュータ130及びサーバコンピュータ150は、それぞれ、1又は複数のコンピュータ可読記憶媒体144、164をさらに備えることができる。媒体144及び164は、本明細書でさらに詳述される方法を実行するためのコンピュータコード命令を記憶する非一時的記憶媒体であることが好ましく、プロセッサ132及び152は、これらのコード命令を実行する。コード命令は、それぞれのコード命令をそれぞれのプロセッサ132及び152のそれぞれの実行メモリ138及び158にロードすることによって実行されうる。
【0238】
記憶媒体144及び164の各々は、それぞれのプロセッサによって読み取られるとプロセッサに本明細書に記載の方法を実行させるプログラム命令を記憶することができる。本発明のいくつかの実施形態では、複数の相同なポリヌクレオチドを記述する配列のセットが、I/O回路134によってプロセッサ132によって受信される。プロセッサ132は、本明細書中上記でさらに詳述されるように、グラフを構築し、連続的な非交差経路を求めてグラフを検索し、少なくとも1つの経路に対応するk量体を機能的に関心対象の核酸配列として同定する出力を生成する。あるいは、プロセッサ132は、ネットワーク140を介してサーバコンピュータ150に配列のセットを送信することができる。コンピュータ150は、本明細書中上記でさらに詳述されるように、配列のセットを受信し、グラフを構築し、連続的な非交差経路を求めてグラフを検索し、少なくとも1つの経路に対応するk量体を機能的に関心対象の核酸配列として同定する。コンピュータ150は、ネットワーク140を介してコンピュータ130に機能的に関心対象の核酸配列を送信し返す。コンピュータ130は、核酸配列を受信し、それをGUI142上に表示する。
【0239】
モチーフが同定されると、分子生物学的手法を使用して、例えば、レポーター配列を典型的に有する発現ベクターへのクローニングによってモチーフを検証することができる。
【0240】
本明細書で使用される場合、用語「約」は、±10%を指す。
【0241】
用語「含む(comprises)」、「含む(comprising)」、「含む(includes)」、「含む(including)」、「有する(having)」及びそれらの同根語は、「を含むが、これらに限定されない」を意味する。
【0242】
用語「からなる(consisting of)」は、「含み、それらに限定される(including and limited to)」を意味する。
【0243】
用語「から本質的になる(consisting essentially of)」は、組成物、方法又は構造が追加の成分、工程及び/又は部分を含み得るが、追加の成分、工程及び/又は部分が、特許請求される組成物、方法又は構造の基本的かつ新規な特徴を実質的に変化させない場合に限ることを意味する。
【0244】
本明細書で使用される場合、単数形「a」、「an」及び「the」は、文脈上他に明確に指示されない限り、複数の言及を含む。例えば、用語「化合物」又は「少なくとも1つの化合物」は、それらの混合物を含む複数の化合物を含み得る。
【0245】
本出願を通して、本発明の様々な実施形態は、範囲形式で提示されうる。範囲形式での説明は、単に便宜及び簡潔さのためのものであり、本発明の範囲に対する柔軟性のない限定として解釈されるべきではないことを理解されたい。したがって、範囲の説明は、すべての可能な部分範囲、及びその範囲内の個々の数値を具体的に開示したと見なされるべきである。例えば、1~6などの範囲の説明は、1~3、1~4、1~5、2~4、2~6、3~6などの部分範囲、並びにその範囲内の個々の数、例えば、1、2、3、4、5及び6を具体的に開示していると見なされるべきである。これは、範囲の幅に関係なく適用される。
【0246】
本明細書において数値範囲が示される場合はいつでも、示された範囲内のいずれかの引用された数字(分数又は整数)を含むことを意味する。第1の指示数と第2の指示数との「間の範囲(ranging/ranges between)」という語句と、第1の指示数「から(from)」第2の指示数「まで(to)の範囲(ranging/ranges)」という語句とは、本明細書では区別なく使用され、第1及び第2の指示数並びにそれらの間のすべての分数及び整数を含むことを意味する。
【0247】
本明細書で使用される場合、用語「方法」は、限定するものではないが、化学、薬理学、生物学、生化学及び医学の分野の当業者に公知であるか、又は当業者に公知の様式、手段、技術及び手順から容易に開発される様式、手段、技術及び手順を含む、所与のタスクを達成するための様式、手段、技術及び手順を指す。
【0248】
RNAアンチセンス配列は、UがTによって置換されているDNA配列として本明細書に提供されうることが理解される。
【0249】
特定の配列表を参照する場合、そのような参照は、例えば、配列決定エラー、クローニングエラー、又は塩基置換、塩基欠失若しくは塩基付加をもたらす他の変化から生じる小さな配列変異を含むものとして、その相補的配列に実質的に対応する配列も包含すると理解されるべきであり、ただし、そのような変異の頻度は、50ヌクレオチド中1個未満、あるいは100ヌクレオチド中1個未満、あるいは200ヌクレオチド中1個未満、あるいは500ヌクレオチド中1個未満、あるいは1000ヌクレオチド中1個未満、あるいは5,000ヌクレオチド中1個未満、あるいは10,000ヌクレオチド中1個未満である。
【0250】
明確にするために別個の実施形態の文脈で説明されている本発明の特定の特徴は、単一の実施形態では組み合わせて提供されてもよいことが理解される。逆に、簡潔にするために単一の実施形態の文脈で説明されている本発明の様々な特徴も、別個に、若しくはいずれかの好適な部分的組合せで、又は本発明のいずれかの他の記載された実施形態で好適であるように提供されてもよい。様々な実施形態の文脈で説明される特定の特徴は、実施形態がそれらの要素なしでは動作不能でない限り、それらの実施形態の本質的な特徴と見なされるべきではない。
【0251】
本明細書中上記で描写され、以下の特許請求の範囲の項で特許請求される本発明の様々な実施形態及び態様は、以下の実施例において実験の裏付けを見出す。
【実施例
【0252】
ここで、上記の説明とともに本発明のいくつかの実施形態を非限定的に示す以下の実施例を参照する。
【0253】
材料及び方法
LncLOOMへの入力
LncLOOMは、様々な種から得られた配列のセットに対して機能する。典型的には、各配列は、様々な種から得られた配列の推定ホモログに対応する。現在、本発明者らは、種当たり1つの配列アイソフォームのみを用いて研究しているが、種当たり複数の配列が存在する場合、例えば、選択的スプライシング産物への適応が可能である。入力配列は、RNA-seq及びESTデータ並びに既存のアノテーションの手動検査によって典型的に構築される。入力配列のいくつかは不完全である可能性があり、本発明のいくつかの実施形態によれば、本フレームワークは、そのようなシナリオに対応するための特定の工程を含むことに留意されたい。グラフ構築の前に、同一の配列を除去するためにセットがフィルタリングされる。これは、閾値を超えるパーセンテージ同一性を有する配列を除去するためにユーザによってさらに調整され得、この場合、LncLOOMは、MAFFT MSAを使用して各配列ペア間のパーセンテージ同一性を計算し、入力データセット内に最初に出現する配列を保持する。
【0254】
配列の順序付け
LncLOOMフレームワークは、理想的にはアンカー配列に対して単調に増加する進化距離を有する種(この原稿では、いずれの例でもヒトである)由来であるべきである配列の順序付きセットの周りに構築される。配列の順序は、ユーザによって提供されうるか、又はBLASTを使用することによって決定されうる。BLASTが使用される場合、アンカー配列は、データセット内の第1の配列であると定義される。第2の配列は、アンカー配列に対するアライメントスコアが最も高い配列である。その後の各配列は、未だ順序付けられていない配列の中で、前の配列に対する最良のアライメントスコアを有する配列である。有意なアライメントが見つからない場合、元の入力内で次の利用可能な配列が選択される。
【0255】
LncLOOM法の概要
配列の順序が確立されると、LncLOOMは、各ヌクレオチド配列をグラフ内ノードによってそれぞれ表されるk量体の配列へと還元することによって、kの様々な値に対する短い保存されたk量体の組合せのセットを同定する。隣接する配列内にある同一のk量体が、追加の制約(図11A~D)及び整数線形計画法(ILP)の使用によってグラフ内で連結されて、これらのグラフ内で長い非交差経路のセットを見つける。各グラフ内で識別された経路のセットは、後続の反復でグラフに対する制約を定義し、グラフを分割するために使用される(グラフ分割の例を図12に示す)。最大のkから開始し、それを反復的に減少させると、LncLOOMは、指定された範囲内のあらゆるk量体長について初期主グラフを構築する。主グラフは、データセット内のあらゆる順序付けられた配列上で構築され、次いで、(上位2つの配列のみが残るまで)層ごとに一連のサブグラフにプルーニングされ、各サブグラフのILP問題が独立して解かれる。いずれかの所与の深度では、サブグラフは、前の反復で見つかった経路に基づいて、さらに小さいサブグラフの追加のセットに分割されうる。実際には、この手法は、より短くあまり保存されていないモチーフよりも深く保存されたより長いモチーフの同定を優先することを可能にし、ILPプログラムのサイズを、迅速に解かれ得る1,000エッジ未満に維持し、数十の長い配列に適用された場合であってもLncLOOMの全体的な実行時間を数分に維持することも可能にする。
【0256】
グラフ構築
D種由来のlncRNA配列のデータセットと、k量体の長さk(k-mer length k)(6~15nt)とを考慮すると、LncLOOMは有向グラフG=(V,E)を構築し、ここで、Vはグラフ内の全ノードのセットであり、Eはエッジのセットである。グラフはD層から構成され、ここでDはデータセット内の配列の数である。各配列は、層(L、L...L)としてモデル化され、層L(長さN(i)の配列に対応)はノード(v、v...vN(i)-k+1)から構成され、ここで各ノードvは、i番目の配列内の位置nにあるk量体を表す(図1B)。同じk量体を表し、連続する層(j=i+1の場合、L及びL)に見られるノードの全ペアが、エッジxuv=(u,v)によって連結され、ここで、u∈Li■かつv∈Lj■である。各サブストリングは、典型的には1つの配列内に複数回出現するため、エッジの数は、グラフ内のノードの数を大幅に超える可能性がある。深く保存されているk量体の順序付きの組合せは、交差せず(すなわち、
【0257】
【数1】
【0258】
)であり、Lにノードを有する、G内の長い経路に対応する。したがって、目標は、各エッジがS内にあるエッジを介してLから到達可能であり、S内の2つのエッジが交差しないように、E内のセットSを見つけることである。理想的には、潜在的な追加の制約を受ける最大のSを見つけることが望ましい。例えば、短い経路は望ましくない場合があり、したがって、これは、S内のエッジがいずれも、特定の層に到達する経路上に見つけられることを必要とする。
【0259】
ILPを使用した長い非交差経路の同定
ILP問題では、G内の各エッジは、(u,v)がS内にある場合に1の値が割り当てられる変数xuvによって表される。目的関数は、下記|S|を最大化するように定義される。
【0260】
【数2】
【0261】
このモデルに課される追加の制約は、いくつかの考慮事項から導出される。第1に、LncLOOMは、LncRNA配列内に同じ順序で出現する短い保存されたk量体を同定することを目的とする。しかし、k量体が各配列内に一度しか出現しない可能性は低い。したがって、ILPモデルに適用される制約は、同じ深度を有しない一致しないk量体の経路と交差しない限り、1又は複数の層に単一のk量体の複数の繰返しを含む複雑な経路を可能にするはずである(図1B及び図11A)。非交差経路の選択を確実にするために、2つの連続する層の間で交差するいずれかのエッジペアに以下の制約が課される:
【0262】
【数3】
【0263】
上記の制約は各ノードの開始位置のみを考慮するため、2つの連続する層内で繰り返される同一のk量体を連結する交差エッジも除外する。k量体が両方の連続する層内で繰り返される場合、各繰返し-繰返し連結からエッジのネットワークが構築される(図11B)。エッジのこのネットワークは、等しく保存されているが連結するk量体がより少ない他の経路の選択を無効にし得る。したがって、この制約は、固有に存在するk量体の経路によって散在させられる複数の非交差経路への複雑な経路の分割を促進するため、同一のk量体を連結するエッジにこの制約を課すことが重要である。しかし、同一の繰返しを連結するエッジのネットワークが、他の経路が存在しない場合にのみ互いに制約される場合、ILPソルバは、複数の繰返し-繰返し連結からエッジのいずれかの可能な解を選択することができる。これは、グラフ精密化の後続の反復中に、繰り返されるk量体の準最適除外につながる可能性がある(図13Bに示されるシナリオ)。このシナリオを回避するために、繰り返されるk量体のネットワークと交差する、等しい深度を有する少なくとも1つの他の経路が存在する場合、交差制約は、同一のk量体を連結するエッジにのみ課される。
【0264】
【数4】
【0265】
ここで、Z及びPは、ノードvのすべての直接の後続ノード及び先行ノードのそれぞれのサブセットを示し、yは最小深度要件であり、Mは十分に大きい定数である(実際には100が使用された)。この制約の下では、Lから少なくともLまで連続した連結を有する経路のみが選択される。同時に、この制約は、1又は複数の層内でタンデムに繰り返されるk量体を含む連結された複雑な経路の選択を可能にする(図1B)。
【0266】
グラフGでは、各層Lは、配列内の連続するあらゆる位置で始まり、k塩基の長さを有するノード(v1、...vN(i)-k+1)からなる。これは、セットSから、セットSunionが、互いに重複する隣接ノードを連結するエッジをマージすることによって形成されうることに従う。ILPが解かれると、これらの重複するノードは、単一のさらに長いk量体に組み合わされる。この工程は、隣接k量体のセットが、単一の繰り返される塩基のストリングを含む、配列の領域を表すシナリオに遭遇し得る(一例については図1Bを参照)。次いで、得られたマージされたk量体に層特異的挿入が含まれる可能性がある。これを克服するために、重複領域の開始及び長さが各層内の2つの隣接ノード間で等しくなるように、L又はLのいずれかで重複する隣接k量体を連結するいずれかのエッジペアに以下の制約が課される。
【0267】
【数5】
【0268】
ILPは、非常に長い配列又は大きなデータセットに対するLncLOOMのスケーラビリティに対して大きな課題を提起する周知のNP難問である。この制限を克服するために、各グラフのILPの複雑さを低減し、また、深く保存されたk量体の選択を優先するいくつかの工程がフレームワークに含まれている。これらには、グラフプルーニング、単純な経路に基づくグラフの分割、エッジ構築に対する追加の制約、及び複雑な非交差経路の反復的な精密化が含まれる。
【0269】
グラフプルーニング
LncLOOMフレームワークでは、2つのプルーニング工程が使用される。第1の工程は、1又は複数の層内で過剰に繰り返されるk量体に対応するノードの除外を伴う。層ごとに許容される繰返しの数は、ユーザによって調整され得、小さいk(例えば、6)が使用される場合、さらに長い配列内のエッジの密度を大幅に減少させることができる。所与のk量体長について、この工程は、データセット内の全配列に対して初期グラフの構築中に行われ、次いで、除外されたノードは、あらゆる結果として得られるサブグラフから除外される。第2のプルーニング工程は、所与のレベルでサブグラフ構築の反復ごとに行われ、Lからその時点の深度までの連結された経路を有しないあらゆるノードを除外する。
【0270】
計算の複雑さを低減するためにグラフを分割する
ILP問題に課される制約は、単純な経路又は複雑な経路の選択を可能にし、ここで、単純な経路は、層ごとにただ1つのノードを含む経路として定義される。単純な経路は、さらに浅い経路と交差すべきではなく、したがって、グラフが、独立して解かれ得るさらに小さいサブグラフに分割されうる境界を提示する、確定的に選択されたエッジからなる(図12)。現在、これらのグラフは連続的に解かれているが、将来的には、少なくとも1つの単純な経路が見つかるならば、さらに大きなデータセットを処理するために並列計算を使用する余地がある。分割は、層ごとの反復では、各レベルで見つけられるその時点のk量体長の単純な経路に基づく。各サブグラフは、深度=yを有する2つの単純な経路τとτとの間に位置する、ノードのサブセットを選択することによって構築され、ここで、境界は、各層LからLy-1について、各経路内のノードの終了位置及び開始位置として定義される:W={v|q+k-1<n,n+k-1<r,v∈τ,v∈τ}(最終層は、次の反復のために除去される)。隣接する単純な経路のk量体が重複する場合、k量体は最初に組み合わされ、境界は組み合わされた長い方のk量体の開始位置及び終了位置で定義される。
【0271】
複雑な非交差経路の精密化
単純な経路とは対照的に、複雑な経路は、特に、グラフが制約されていない場合に早期反復で選択される経路では、繰り返されるk量体を連結する分岐を含むことができる。制約のないグラフでは、どの繰返しが各層に偶然出現するかを解読することはできない。したがって、複雑な経路は、後続の反復では、グラフにおけるエッジ選択を制約するために使用されない。代わりに、各反復で見つけられるセットSは、1)分割及びエッジ制約定義に使用される単純な経路のサブセットと、2)後続の反復で別個に記憶され連続的に精密化される複雑な経路のサブセットとに分割される。精密化中、複雑な経路は、新たに発見された経路と交差する分岐を除去するために最適化される(図12)。複雑な経路の精密化は、層ごとの除外中に2段階で行われる。第1に、y層にまたがるサブグラフを解く前に、複雑な経路のみの個々のグラフが、深度=yを有するより長いk量体のサブセットLCd=yと、最小深度y+1を有するその時点のk量体長の経路(その時点のk量体長での前の反復で選択された複雑な経路)からのサブセットCd>yとから構築される。次いで、上記のILP問題に従って、精密化された複雑な経路のサブセットCrefinedが見つけられる。ただし、LCd=y内のいずれかのより浅い経路にわたってCd>y内のあらゆる複雑な経路の選択を保証するために、以下の追加の制約が課される。
【0272】
【数6】
【0273】
この制約の下で、Cd>y内の各経路τについて、少なくとも1つの繰り返されるk量体がLから選択される。この制約が上記の制約とともに課される場合、少なくともy層にまたがる精密化された経路が解に含まれる。セットCrefinedが見つけられると、その時点の長さ及び深度のあらゆるk量体のサブグラフが構築される。次いで、Crefined内のあらゆる経路がその時点のサブグラフに追加され、Crefined内の各経路τの選択を優先するように課された追加の制約によってILP問題が解かれる。次いで、この解は、次の反復のために単純な経路のセットと複雑な経路のセットとに分割される。LncLOOMはまた、深度が大きくより短いk量体の単純な経路がより長くより浅いk量体よりも優先されるように、単純な経路を記憶及び精密化するオプションを含む。ただし、このオプションが適用される場合、グラフは分割されず、後続の反復ではエッジ構築に制約は課されない。したがって、このオプションは計算コストが高く、短い配列の小さなデータセットを分析するためにのみ使用されうる。
【0274】
グラフの複雑さを低減するためのBLAST高スコアリングペア(HSP)の使用
BLASTは、LncLOOMグラフ構築のプロセスでは、所望により存在する工程として使用されうる。BLAST HSPは、連続する層に見られる配列の、有意な類似性を有するセグメント間の局所的な非ギャップアライメントである。本発明者らは、2つの連続する層の間の同じHSP内に含まれないノードのいずれかのペアが連結されないように、これらのHSPを使用してエッジ構築を制約する。BLASTによって見出されるHSPは、HSPが互いに重複し得、いずれかのセグメントが標的配列内の複数のセグメントに一致し得るという点で冗長である。互いに重複するHSPのいずれかのセットに関して、グラフ構築に使用されるHSPには最も有意なペアのみが含まれる。同様に、1つのセグメントが標的配列内の複数のセグメントとアライメントする場合、最も高いスコアリングアライメントのみが含まれる。BLAST分析から導出されるこれらの制約は、グラフ内の可能な経路の数を効果的に減少させることができ、配列の一部が不完全である層間のエッジの正しい配置を促進することができる(図1A)。
【0275】
グラフサイズ制限
ILP問題の複雑さを低減するための工程が含まれているが、いくつかのシナリオでは、グラフが大きすぎて妥当な時間内に解くことができない。このボトルネックに対処するために、グラフ内のエッジの総数が制限される。デフォルトでは、ILP問題で許容されるエッジの最大数は1200であるが、これは50を超えるいずれかの数に設定することができる。いずれかの反復中に、グラフG内のエッジの数が最大限度を超える場合、グラフは、ILP問題が個別に解かれる一連のサブクラスタに分割される。最も少ないエッジ(最も少ない繰り返されるk量体)を有する経路から開始して、個々のグラフは、G内の各経路τ、及びそれと交差するCrefined内の経路のみから構築される。次いで、ILPを使用してGのこのサブクラスタ内の許容されるエッジが最適化され、次いで、Crefinedがこれらのエッジを含むように更新され、経路τがGから除去される。このプロセスは、全経路がCrefinedに対して個別に最適化されるか、又はG内のエッジの数が最大限度になるまで、G内に残っている各経路に対して繰り返され、その時点で、G内のあらゆる残りの経路が単一のILP問題で互いに最適化される。交差する経路の個々のサブクラスタから構築されたグラフ内のエッジの数が最大限度を超える場合、ILPは進行せず、Crefinedからの経路のみが解に保持される。
【0276】
配列の伸長された5’及び3’領域内のモチーフの発見
LncLOOMへの入力は、5’又は3’が不完全な配列を時折含み得る。データセットは相同性によって順序付けられ、完全性ではないため、これらの配列はグラフ内のいずれかの層に見出され得、これらの領域内のノードの層ごとの連結を妨げる可能性がある。このシナリオで、保存されたモチーフが失われる可能性を低減するために、モチーフ発見は3段階で行われる。第1の段階では、LncLOOMは、データセット内の全配列(Dsequenceの合計)上に構築された一次グラフからモチーフを同定する。次いで、LncLOOMは、全配列にわたる中央位置に対する各配列内の第1のモチーフ及び最終モチーフの位置を考慮することによって、どの配列が潜在的に伸長された5’又は3’末端を有するかを決定する(図13A)。これに基づいて、LncLOOMは、データセット内のさらに完全な配列の伸長された5’及び3’領域の個々のグラフを構築し、解く。5’伸長グラフを構築するために、LncLOOMは、各層L~L内の第1のノード
【0277】
【数7】
【0278】
の開始位置の中央位置Mをまず計算する。次いで、q>t・Mの場合、ノードW={v|n+k-1<q}のサブセットが各層Lから抽出され、ここで、tはユーザによって定義されたいくらかの許容誤差である。伸長3’グラフのノードは、各配列の長さに対する最終モチーフの終了位置に基づいて抽出される。具体的には、LncLOOMは、各層L~L内の最終ノード
【0279】
【数8】
【0280】
の終了位置の中央相対位置MReを計算し、ここで、
【0281】
【数9】
【0282】
である。次いで、Re<MRe・(1+t)の場合、ノードW={v|n<r+k-1}のサブセットが各層Lから抽出される。デフォルトでは、5’及び3’の両グラフの抽出についてはt=0.5であるが、各グラフに対して許容誤差を独立して定義することができる。モチーフ発見のこの工程は、アンカー配列の伸長された領域からのノードがグラフに含まれている場合にのみ進行する。例えば、5’末端の近くに見出されるモチーフが最初の2つの層内でのみ保存されているために、浅く保存されたモチーフがさらに深い層内での5’又は3’切断の同定を妨げるシナリオを回避するために、「最小深度」パラメータを適用して、指定された深度まで保存されたモチーフのサブセットから各配列内の第1のモチーフ及び最終モチーフの位置を選択することができる。最小深度パラメータが適用される場合、指定された深度要件を満たさないあらゆるモチーフも解から除去される。
【0283】
モチーフモジュール及び近傍の計算
フレームワーク内のあらゆるサブグラフについてILP問題が解かれると、一次グラフ、5’伸長グラフ及び3’伸長グラフから選択された非交差経路の各セットは、モチーフモジュール及び近傍に処理される。モチーフモジュールは、配列のセット内に保存されている少なくとも2つの固有のモチーフの順序付きの組合せとして定義され、ここで、各モチーフは、いずれかの数のタンデム繰返しを有することができる。デフォルトでは、モジュールは、LからLまでの全層にまたがる経路を抽出することによって、グラフのあらゆる層、L|2≦i≦Dで計算される。パラメータに最小深度dが指定されている場合、モジュールはあらゆる層L|d≦i≦Dで計算される。上記のように、モチーフ発見は、層ごとの除外の反復プロセスによって行われる。これにより、より密接に関連する配列を含むように配列のセットが連続的に減少するにつれて、より長い同一性領域が選択される。その結果、より深く保存されたより短いモチーフは、最上層間でのみ保存されたより長いモチーフに埋め込まれることが多い(図13B)。本発明者らは、グラフ内のこれらの領域をモチーフ近傍として定義し、ここで、各近傍は、各層内の各ノードの隣接領域とともに、Lの重複するノードの単一領域に連結された、グラフ内の全ノードを含む。モチーフ近傍を計算するために、LncLOOMは、L内のあらゆる重複するノードを最初に組み合わせて、各近傍を表す参照k量体のセットを形成する。各参照k量体について、参照k量体内に埋め込まれている各より短いk量体に連結されている全経路が、その近傍に含まれる。各層内の各モチーフについて、参照k量体内のモチーフの位置に対して、隣接領域の長さが計算される(図13B)。一次グラフ、5’伸長グラフ及び3’伸長グラフの各々からのモチーフモジュール及び近傍は、HTML及びプレーンテキストファイルフォーマットで提示される。
【0284】
モチーフ有意性の計算
モチーフ有意性は、ランダムデータセットの2つのジャンル内の各モチーフの経験的p値を計算することによって推測される。第1に、Lに保存された長さkのモチーフについて、本発明者らは、入力配列内に観察される連続する層の間で同じパーセンテージ同一性を有するランダム配列のセットのL内で少なくとも1回、実際のデータセット、及び同じ長さ又はそれ以上の同じ数のいずれかのモチーフのいずれかの組合せに見出される正確なモチーフを見出す経験的確率を決定する。これは、入力配列のMSAを生成するためにMAFFTを使用し、次いで、MSAの列がランダムにシャッフルされるLncLOOM反復の複数の反復(この原稿に記載されている分析については100)を実行することによって達成される。第2に、本発明者らは、各層が入力配列内の対応する層の同じ長さ及び同じジヌクレオチド組成を有するように生成されたランダム配列のセットのL内で少なくとも1回、正確なモチーフ、及び同じ長さの同じ数のいずれかのモチーフのいずれかの組合せを見出す経験的確率を決定する(ただし、層の間の%同一性を保存しない)。この原稿に記載されている分析では、前者のP値のみを使用した。反復を並列に実行するために、マルチプロセッシングが実施されている。
【0285】
モチーフの機能的アノテーション
LncLOOMは、2つの所望により存在するアノテーション機能を有する。第1に、発見されたモチーフは、保存された(哺乳動物全体にわたって保存された)miRNA及び広く保存された(脊椎動物全体にわたって典型的に見出される)miRNAのシード領域との完全な塩基対合をTargetScanから同定することによって、miRNAの結合部位にマッピングされうる。各モチーフについて、対合のタイプ(6量体、7量体、7量体-A1、7量体-M8、又は8量体)は、モチーフの両側から直接隣接する塩基とモチーフを一緒に考慮することによって、各配列において決定される。完全なシード領域(6量体)がモチーフと直接一致する場合にのみ一致が見出される。第2に、HepG2又はK562細胞株内で発現される遺伝子に見られるモチーフも、ENCODEプロジェクトにおいてeCLIPによって同定されたRBPの結合部位にマッピングされうる。選択されたクエリ配列内の各モチーフの染色体座標を決定するために、LncLOOMは、BLAT(Kent,2002)を使用して配列をゲノムにアライメントし、次いで、pyBigWigパッケージを使用してENCODE bigBedファイルから抽出された、RBPの結合部位の座標との重複を計算する。あるいは、ユーザは、クエリ配列内の各エクソンの染色体座標及び長さを指定するベッドファイルをアップロードすることもできる。抽出されたeCLIPデータは、モック入力を超えてエンリッチメント<2のあらゆるピークを除外するようにフィルタリングされる。アンカー配列の大部分に結合するRBPは、それらの結合ピークといずれかの保存されたモチーフとの重複がその特定のモチーフに機能的に関連する可能性が低いため、マークされる。
【0286】
LncLOOMの実施及び可用性
networkxパッケージを使用してグラフ構築が行われる。整数計画問題は、PuLPを使用してモデル化され、オープンソースのCOIN-OR Branch-及び-Cutソルバ(CBC)(www(dot)coin-or(dot)org/)又は市販のGurobiソルバ(www(dot)gurobi(dot)com/)のいずれかによって解かれる。LncLOOMは、グラフ構築、モチーフアノテーション、及びモチーフ有意性の経験的評価中に、以下のアライメントプログラム、すなわち、BLAST、BLAT及びMAFFTを利用する。統計的反復を並列に計算するためにマルチプロセッシングパイソンパッケージが使用される。
【0287】
モチーフエンリッチメントの計算
配列内の特定のモチーフのエンリッチメントを評価するために、本発明者らは、入力配列のジヌクレオチド組成と一致するランダム配列の1,000セットを生成し、モチーフの出現をカウントして、モチーフの予測される数と、経験的p値とを計算した。
【0288】
lncRNA及び3’UTRのLncLOOM分析
LncLOOMを使用して、18種からのCyrano配列、8種からのlibra(哺乳動物ではNrep)、16種からのChaserr配列、12種からのDICER1配列、並びに16種からのPUM1配列及びPUM2配列を分析した。全遺伝子について、15~6塩基長のk量体を検索するようにLncLOOMパラメータを設定し、各々の場合にアンカー配列として定義されるヒト配列を用いてBLASTによって配列を再順序付けした。HSPの制約は課さなかった。モチーフ有意性を100回の反復にわたって計算した。LncLOOMフレームワークにおける表現としての各遺伝子の配列の順序を表1に示す。
【0289】
また、2,439個の3’UTR遺伝子を分析するためにLncLOOMを使用した。TargetScan7.2 miRNA標的部位予測スイート10によって生成された3’UTR MSAからデータセットを構築し、データセットは、300~3,000ntであった、ヒト、マウス、イヌ及びニワトリの配列を含んでいた。可用性及び長さ(>200塩基)に応じて、カエル、サメ、ゼブラフィッシュ、ガー及びヤツメウナギ、シオアン(cioan)及びハエ由来の配列をEnsemblから入手し、それらのそれぞれの遺伝子データセットに加えた。各データセットについて、BLASTNを0.05のカットオフE値で使用して、それぞれの種の各々のどの配列がそれらのヒトオルソログに対する検出可能なアライメントを有しなかったか、並びにマウス、イヌ及びニワトリにもアライメントしなかった配列を分類する。LncLOOMによって同定されたk量体を、TargetScanHumanがhsa-miRNAを報告した広く保存されたmiRNAファミリーのシードに適合させた。LncLOOMの感度を評価するために、LncLOOMによって同定された広く保存されたmiRNA結合部位と、TargetScan(www(dot)targetscan(dot)org/cgi-bin/targetscan/data_download.vert72.cgi)によって報告された予測とを比較した。具体的には、本発明者らは、TargetScanが本LncLOOMデータセット内で使用される同一の代表的なヒト転写物における部位を報告した遺伝子由来のmiRNA部位のみを比較した。合計で、これは2,439個の遺伝子のうち2,359個に相当した。
【0290】
組織培養
10%ウシ胎児血清と100Uペニシリン/0.1mg ml-1ストレプトマイシンとを含有するDMEM中、37℃、5%COの加湿インキュベーター内で、Neuro2a細胞(ATCC)を常用的に培養した。細胞はマイコプラズマ汚染について常用的に試験し、検証(authenticate)はしなかった。
【0291】
質量分析試料調製
以前に記載されたように47、懸濁液トラッピング(suspension trapping)(S-trap)を使用して試料を溶液中トリプシン消化に供した。要約すると、50mM Tris-HCl中の5%SDSを使用して、ビーズからプルダウンタンパク質を溶出した。溶出したタンパク質を5mMジチオスレイトールを用いて還元し、暗所で10mMヨードアセトアミドを用いてアルキル化した。製造業者の指示に従って、各試料をS-Trapマイクロカラム(Protifi,USA)にロードした。ロード後、90:10%メタノール/50mM重炭酸アンモニウムを用いて試料を洗浄した。次いで、47℃で1.5時間かけてトリプシンを用いて試料を消化した。50mM重炭酸アンモニウムを使用して、消化されたペプチドを溶出した。トリプシンをこの画分に加え、37℃で一晩インキュベートした。0.2%ギ酸と50%アセトニトリル中0.2%ギ酸とを使用して、さらに2回の溶出を行った。3つの溶出液を一緒にプールし、真空遠心分離して乾燥させた。さらに分析するまで試料を-80℃に保った。
【0292】
液体クロマトグラフィー
全クロマトグラフィー工程にULC/MSグレードの溶媒を使用した。乾燥消化試料を97:3%HO/アセトニトリル+0.1%ギ酸に溶解した。スプリットレスナノ-Ultra Performance Liquid Chromatography(10kpsi nanoAcquity;Waters,Milford,MA,USA)を使用して各試料をロードした。移動相は、A)HO+0.1%ギ酸、及びB)アセトニトリル+0.1%ギ酸であった。逆相Symmetry C18トラッピングカラム(内径180μm、長さ20mm、粒径5μm;Waters)を使用して、試料の脱塩をオンラインで行った。次いで、T3 HSSナノカラム(内径75μm、長さ250mm、粒径1.8μm;Waters)を0.35μL/分で使用して、ペプチドを分離した。以下の勾配を使用して、ペプチドをカラムから質量分析計に溶出した:55分で4%から30%B、5分で30%から90%B、5分間90%に維持し、次いで、初期条件に戻した。
【0293】
質量分析
FlexIonナノスプレー装置(Proxeon)を使用して、nanoESIエミッター(10μmチップ;New Objective;Woburn,MA,USA)を介して四重極オービトラップ質量分析計(Q Exactive HF、Thermo Scientific)にnanoUPLCをオンラインで結合した。
【0294】
Top10法を使用して、データ依存型取得(DDA)モードでデータを取得した。MS1分解能を120,000(200m/z)、質量範囲を375~1650m/z、AGCを3e6に設定し、最大注入時間を60ミリ秒に設定した。MS2分解能を15,000、四重極単離を1.7m/z、AGCを1e5、ダイナミックエクスクルージョンを20秒、最大注入時間を60ミリ秒に設定した。
【0295】
質量分析データの処理及び分析
MaxQuant v1.6.6.0を用いて生データを処理した。Uniprot(www(dot)uniprot(dot)com)からダウンロードしたマウス(マウス(Mus musculus))タンパク質データベースに対してAndromeda検索エンジンを用いてデータを検索し、一般的な実験タンパク質汚染物質を付加(append)した。酵素特異性をトリプシンに設定し、最大2回の切断ミスを許容した。固定修飾をシステインのカルバミドメチル化に設定し、可変修飾をメチオニンの酸化、及びタンパク質N末端アセチル化に設定した。ペプチド前駆体イオンを4.5ppmの最大質量偏差で、フラグメントイオンを20ppmの最大質量偏差で検索した。デコイデータベース戦略(MaxQuantの「Revert」モジュール)を使用して、ペプチド及びタンパク質の同定を1%のFDRでフィルタリングした。最小ペプチド長は7アミノ酸であり、修飾ペプチドの最小Andromedaスコアは40であった。実行間の一致オプションをチェックして、ペプチド同定を試料全体にわたって反映させた。無標識定量オプションを選択して検索を行った。Perseus v1.6.0.7を使用して定量的比較を計算した。デコイヒットを除外した。対数変換後にスチューデントのt検定を使用して、生物学的レプリカにわたる実験群間の有意差を識別した。異なる実験群の幾何平均の比に基づいて倍率変化を計算した。
【0296】
RNA-プルダウンアッセイ
合成オリゴ(Twist Bioscience)を増幅し、T7プロモーターをセンス配列では5’末端に、アンチセンス対照配列(完全な配列については表2を参照)では3’末端に付加することによって、インビトロ転写のための鋳型を生成した。MEGAscript T7インビトロ転写反応キット(Ambion)及びビオチンRNA標識混合物(Roche)を使用して、ビオチン化転写物を生成した。DNaseI(Quanta)を用いて処理することによって、鋳型DNAを除去した。Neuro2a細胞(ATCC)を、プロテアーゼ阻害剤カクテル(Sigma-Aldrich、#P8340)+100U/ml RNase阻害剤(#E4210-01)と1mM DTTとを補充したRIPAを用いて氷上で15分間かけて溶解した。溶解物を21130×gで20分間にわたる4℃での遠心分離によって清澄化した。ストレプトアビジン磁気ビーズ(NEB #S1420S)を緩衝液A(NaOH 0.1M及びNaCl 0.05M)で2回洗浄し、緩衝液B(NaCl 0.05M)で1回洗浄し、次いで、結合/洗浄の2本のチューブ内で再懸濁した(PI+100U/ml RNase阻害剤と1mM DTTとを含むNaCl 1M、5mM Tris-HCl pH7.5及び0.5mM EDTA補足物質)。ビーズの1本のチューブを、PI及びDTT 1mMを補充したRIPA中で3回洗浄し、その後、細胞溶解物を加え、4℃で30分間上方に回転させて事前に清澄化した。第2のチューブを各RNAプローブの個々のチューブに等しく分割した。次いで、2~10pmolのビオチン化転写物をそれぞれのチューブに加え、4℃で30分間上方に回転させた。次いで、ビーズを結合/洗浄緩衝液で3回洗浄し、その後、等量の事前に清澄化された細胞溶解物をビーズ及びRNAプローブの各試料に加えた。次いで、試料を4℃で30分間上方に回転させた。回転後、ビーズを高塩CEB(10mM HEPES pH7.5、3mM MgCl、250mM NaCl、1mM DTT及び10%グリセロール)を用いて3回洗浄した。次いで、室温で10分間かけて、50mM Tris pH7.4中の5%SDS中でタンパク質をビーズから溶出した。
【0297】
アンチセンスオリゴヌクレオチド及びLNA GapmeRトランスフェクション
マウスChaserrの最終エクソンでLncLOOMによって同定された保存されたATGG部位を標的とするように、ASO(Integrated DNA Technologies)を設計した(図8A)。全ASOを2’-O-メトキシ-エチル塩基によって修飾した。Chaserrイントロンを標的とするLNAギャップマー(Qiagen)をChaserrノックダウンに使用した(完全なオリゴ配列については表3を参照)。トランスフェクション:2×10個のNeuro2A細胞を6ウェルプレートに播種し、LNA1~4の混合物を用いて、若しくはASO1、ASO2、ASO3を用いて、又はASO1とASO3との混合物、若しくはASO1~3の混合物を用いて、25nMの最終濃度まで、製造業者のプロトコルに従ってリポフェクタミン3000(Life Technologies、L3000-008)を使用してトランスフェクトした。全実験の終了点はトランスフェクションの48時間後であり、その後、RNA抽出、及びRT-qPCR分析による評価のために、TRIZOLを用いて細胞を回収した。
【0298】
RNA免疫沈降(RIP)
Neuro2a細胞(ATCC)を回収し、94×gで5分間、4℃で遠心分離し、リボヌクレアーゼ阻害剤(100U/mL、#E4210-01)とプロテアーゼ阻害剤カクテル(Sigma-Aldrich、#P8340)とを補充した氷冷リン酸緩衝生理食塩水(PBS)を用いて2回洗浄した。次に、氷上で10分間かけて、1mLの溶解緩衝液(プロテアーゼ阻害剤カクテル+100U/ml RNase阻害剤と1mM DTTとを補充した5mM PIPES、200mM KCl、1mM CaCl、1.5mM MgCl、5%スクロース、0.5%NP-40)中で細胞を溶解した。溶解物を1秒間ON、30秒間OFFで30%振幅で3回超音波処理し(Vibra-cell VCX-130)、続いて、21130×gで10分間4℃で遠心分離した。次いで、上清を新しい2mLチューブに移し、1mLのIP結合/洗浄緩衝液(プロテアーゼ阻害剤カクテル+100U/ml RNase阻害剤と0.25mM DTTとを補充した150mM KCl、25mM Tris(pH7.5)、5mM EDTA、0.5%NP-40)を補充した。次いで、反応1回当たり5μgの抗体を用いて、試料を4℃で2~4時間回転させた。反応1回当たり50μlのビーズGenScript A/Gビーズ(#L00277)をIP結合/洗浄緩衝液を用いて3回洗浄し、続いて、溶解物に加えて一晩回転させながらインキュベートした。インキュベーション後、ビーズをIP結合/洗浄緩衝液で3回洗浄した。各試料の10%を回収し、ウエスタンブロットによるその後の分析のために95℃で5分間煮沸した。RNA抽出、及びRT-qPCR分析による評価のために、残りのビーズを0.5mLのTRIZOLに再懸濁し、免疫沈降材料を細胞溶解物全体に対して正規化した。
【0299】
ウエスタンブロット
RIPから収集したタンパク質試料を8~10%SDS-PAGEゲル上で分離し、ポリフッ化ビニリデン(PVDF)メンブレンに転写した。0.1%Tween-20(PBST)を含むPBS中の5%脱脂乳を用いてブロッキングした後、メンブレンを一次抗体、続いて、西洋ワサビペルオキシダーゼとコンジュゲートした二次抗体とインキュベートした。Image Labソフトウェアを用いてブロットを定量した。一次抗体抗Dhx36(Bethyl、#A300-525A、1:1,000希釈)と、二次抗体抗ウサギ(JIR#111-035、1:10,000希釈)とを使用した。
【0300】
qRT-PCR
製造業者のプロトコルに従って、TRIREAGENT(MRC)を使用して、トランスフェクトされたN2a細胞から全RNAを抽出した。ランダムプライマーを用いたqScript Flex cDNA合成キット(95049、Quanta)を使用してcDNAを合成した。Fast SYBR Greenマスターミックス(4385614)をqPCRに使用した。遺伝子発現レベルをハウスキーピング遺伝子Actin及びGapdhに対して正規化した。
【0301】
【表1】
【0302】
【表2】
【0303】
【表3】
【0304】
【表4】
【0305】
実施例1
LncLOOMフレームワーク
LncLOOMは、関心対象のゲノム配列の推定的に相同な配列の集合体を受信する。一実施形態では、lncRNA及び3’UTRに焦点を当てているが、エンハンサーなどの他のエレメントも同様に容易に使用することができる。lncRNAの場合、エクソン配列のみがモチーフ同定のために使用されるが、LncLOOMはエクソン-エクソン接合部の位置を可視化する。入力配列は、種間の進化距離と理想的には一致し、配列類似性に基づいて自動的に設定されうる特定の順序で提供される(図1A)。LncLOOMで使用されるデータ構造及びアルゴリズムの正確な定義は、「材料及び方法」に登場し、フレームワークの概要は、図1A~Bに示されている。LncLOOMは、ネットワークグラフ(図1B)内のノードの「層」としての各RNA配列を表し、各ノードは、短いk量体(例えば、6~15のk)を表す。層の順序は、グラフの第1の層(本明細書に記載の分析ではヒト)に配置されるクエリ配列からの入力配列の進化距離を反映し、他の種からの配列は、グラフの追加の連続層に配置される。グラフ内のエッジは、連続する層内の同一のk量体を有するノード間を連結する。「類似の」k量体を連結することも可能であることが理解される。これらの定義の下で、目的は、互いに交差しない、グラフ内の長い「経路」の組合せを同定し、したがって、様々な配列内で同じ順序を維持する短いモチーフを連結することである。関心対象は、典型的には、最上層に存在するモチーフであるため、経路がその中で始まることが必要条件である。k=1の場合、最長共通部分列問題と同じであるため、そのような経路の最大セットを同定するという問題は計算的に困難であるが、現時点の結果は、整数線形計画法(ILP)を解くという問題に変換することができることを示しており、整数線形計画法(ILP)に対して最適解を見つけることは計算的に困難であるが、効率的なソルバが利用可能である(図1B及び「方法」)。
【0306】
グラフが構築されると、プロセスは、最大k値の経路を同定することから始まり、次いで、これらの経路を使用して(見つかった場合)、さらに小さいkの経路の可能な位置を制約する。この手法は、より長い保存されたエレメントを優先することを可能にするが、有意に保存された短いk量体を同定することも可能にする。あらゆるk値が試験されると、得られたグラフは、モチーフとそれらが保存されている深度との組合せを得るためにマージされる。モチーフ保存の統計的有意性を計算するために、入力配列のMSAが生成され、アライメントカラムがシャッフルされて、入力配列と類似の内部類似性構造を有するランダム配列を導出する。次いで、完全なLncLOOMパイプラインがこれらの配列に適用され、層Dに保存される元の入力配列に見られる各モチーフについて、層Dに保存された正確に同じモチーフ、又は同じ数のその長さのいずれかのモチーフの組合せを同定する経験的確率が適用される。追加のP値は、同じジヌクレオチド組成を有するランダム配列が生成され、配列間類似性構造が保存されていない、それほどストリンジェントでない対照について計算される。
【0307】
リッチHTMLベースのスイートが、例えば、保存の深度に基づいてそれらを色分けし、クエリ配列及び他の配列の両方でモチーフを強調する様々な方法でこれらのモチーフを視覚化するために使用される(LncLOOM出力の例については、図3A~E及び図4を参照)。LncLOOM出力はまた、UCSCゲノムブラウザで見ることができる、クエリ配列内で同定されたモチーフの色分けされたカスタムトラックを含む。モチーフは、保存されたマイクロRNAのシード部位のセット(TargetScanから)と、ENCODEプロジェクトからのeCLIPデータに見出されるRBP結合部位とを使用してアノテーションされる。
【0308】
実施例2
LncLOOMは、Cyrano lncRNA内の深く保存されたエレメントを同定する
Cyrano lncRNAは、広くかつ高度に発現されるlncRNAである12、13。脊椎動物全体にわたって保存されているにもかかわらず、Cyranoは、エクソン配列長全体で約5倍の変動を示す(メダカの2,340ntからオポッサムの10,155ntまで、図2A)。Cyranoの以前に同定された67ntの高度に拘束されたエレメントは、ゼブラフィッシュ配列とヒト配列とを比較した場合にBLASTが有意な類似性を報告する唯一の領域である。さらに、Cyrano遺伝子座全体は、100ウェイ全ゲノムアライメント(100-way whole genome alignment)(UCSCゲノムブラウザ)では、哺乳動物と魚との間でアライメント不可能である。高度に保存されたエレメントは、CyranoによるmiR-7の分解に必要とされる非常に広範囲に相補的なmiR-7結合部位を含有する。
【0309】
追加の保存されたエレメントを同定するために、8種の哺乳動物、ニワトリ、X.トロピカリス(X.tropicalis)、7種の脊椎動物魚種、及びゾウザメ(図示せず)を含む、使用可能なRNA-seqデータが位置し得る18種からCyrano配列をキュレートした。LncLOOMは、全種で保存された7つのエレメントと、サメを除く全種で保存された9つのエレメント(図2B)と、哺乳動物全体にわたって保存された37個のモチーフとを同定した。以下の研究は、サメを除く全種で保存された9つのエレメントに焦点を当てている(図2Bでは番号1~9)。
【0310】
AUGGCG(配列番号17)
UGUGCAAUA(配列番号18)
ACAAGU(配列番号19)
CAACAAAAU(配列番号20)
GUCUUCCAUU(配列番号21)
UGUAUAG(配列番号22)
UGCAUGA(配列番号23)
CUAUGCA(配列番号24)
GCAAUAAA(配列番号25)
【0311】
これらのうちの7つは、両LncLOOM検定によって統計的に有意であることが見出された(P<0.01)(材料及び方法に記載)。エレメント3~6のみが、miR-7の5’及び3’との対合に対応する2つ(図2C)、並びにPumilio Recognition Element(PRE、エレメント#6)に似たもう1つUGUAUAG(配列番号22)を含む、BLASTによって同定可能な67ntの保存された領域内に入る。このエレメントは、実際に、ヒト及びマウスからのCLIPデータにおいてPUM1及びPUM2に結合し(図2D~E)、Cyranoレベルが比較的高いマウス新生児の脳では、Pum1及びPum2の枯渇は、RNA崩壊におけるこれらのタンパク質の機能と一致して15、Cyrano発現の増加をもたらす(調整済みP値3.49×10-314からのデータ、図2E)。この抑制は、この高度に保存されたPREと他のものとの複合効果によるものである可能性が高い。異なる種由来の18個のCyrano配列は、平均して3.2個のコンセンサスPREを有した(マウス配列内の2つを含む、1,000のランダムシャッフル配列内の平均1.3と比較して、P<0.001、「方法」を参照)。
【0312】
LncLOOMによって同定される、Cyrano配列内のいくつかの追加の保存されたエレメントに、推定される生物学的機能を割り当てることができる。18個全部のインプット種で保存されている9量体UGUGCAAUA(図2Bのエレメント#2、配列番号35)が、miR-7結合部位の約60nt上流に、BLASTによってアライメント可能な領域の外側に見出される。このエレメントは、miR-25/92ファミリーのシードマッチに対応し(図2C)、マウス胎児心臓では、miR-25/92ファミリーのメンバーによって結合及び調節されることが近年示された16。Cyranoの3’末端では、1つの保存されたエレメント(配列番号25、GCAAUAAA)が、Cyranoポリアデニル化シグナル(PAS)及びmiR-137部位に対応する。PASの約100nt上流に見出される別の配列CUAUGCA(配列番号24)は、miR-153のシードマッチに対応し、この領域は、マウス脳ではAgo2によって結合される(図2E)。興味深いことに、HeLa細胞内のCyranoレベルは、miR-137及びmiR-153のトランスフェクション後にそれぞれ41%及び11%低下する17。したがって、Cyranoは、miR-7及びmiR-25/92との報告された相互作用を超えて、追加のマイクロRNAによる高度に保存された調節下にある。
【0313】
保存されたPumilio結合部位の約55nt下流には、Rbfox RBPのコンセンサス結合モチーフと一致する保存されたWGCAUGAモチーフ(W=A/U、配列番号27)が存在する。このモチーフは、Cyranoの3’ハーフにWGCAUGAの例を含有する追加の領域と同様に、マウスではRbfox1/2によって結合される(図2E)。実際、18個のCyrano種の分析は、WGCAUGAの有意なエンリッチメントを示した(偶然予測された9.8例対4.5例、P<0.001、「方法」を参照)。miRNA結合部位及びPumilio結合部位とは対照的に、Rbfox1/2機能喪失の様々なRNA-seqデータセットの検査では、Cyranoレベルに対する影響は同定されず(図示せず)、Rbfox1/2による広範囲かつ保存された結合が、発現ではなく、Cyranoの機能性に影響を及ぼし得ることが示唆された。
【0314】
別の高度に保存された6量体AUGGCG(配列番号17)は、Cyranoのまさに5’に見出される。ヒト、マウス及びゼブラフィッシュ由来のCyrano配列及びRibo-seqデータの検査により、この6量体が、保存された短い2~3aa ORFの最初の2つのコドンに対応することが明らかにされた(図2F)。明確なリボソーム会合がこのORFでのCyranoの5’末端に見られ、非常に限られた数のリボソーム保護断片がヒト及びゼブラフィッシュの両方でこのエレメントの下流に観察され(図2F)、この短いORFでの効率的な翻訳及びリボソーム放出を示唆している。ORF内のAUG開始コドンの状況は、転写及び翻訳の両方に影響を及ぼす調節エレメントであるTISUモチーフの12塩基に完全に一致する。TISUは、転写物の5’末端に位置し、転写開始部位を決定し得るYY1結合部位として、及びスキャニングを伴わず動作する、翻訳のための非常に効率的かつ正確なキャップ依存性翻訳イニシエーターエレメントとして作用する18、19。このモチーフのゲノム領域は、DNAへの強いYY1結合を示す(図2F)。このモチーフは、他のlncRNAについて示唆されるように、Cyrano発現を調節するYY1エレメントとして、及びCyrano機能に寄与し得る短いORFの始まりとして二重の機能を有し得ることが示唆されている20。全体として、推定される生物学的機能は、Cyranoでは9つの保存されたエレメントのうちの8つ、すなわち、miRNA結合部位としての4つ、RBP結合部位としての2つ、保存された短いORFとしての1つ、及びPASとしての1つに対して仮定されうる。これらのエレメントは、保存されていない配列の長いストレッチによって分離されており(図2B)、これにより、lncRNA生物学を明らかにするためにLncLOOMをアノテーション及び直交データと組み合わせる能力が強調される。
【0315】
実施例3
LncLOOMは、libra lncRNA内の深く保存されたエレメントを同定する
LncLOOMの、miRNA生物学に関連することが知られている転写物中の保存されたエレメントを見出す能力の、別の例として、これをゼブラフィッシュにおけるlibra lncRNAの8つのホモログと、哺乳動物におけるNrepタンパク質とに適用した。これは、その3’領域内で実質的な配列相同性を保持しながら、可能性のある祖先lncRNAからタンパク質コード遺伝子に変化した遺伝子の数少ない例のうちの1つである12、21。libraは、高度に保存されかつ高度に相補的な部位を介して、ゼブラフィッシュ及びマウスではmiR-29bの分解を引き起こす21。BLASTNを使用してゼブラフィッシュlibraとヒト及びマウスの配列とを比較すると、約2.2kbのヒト配列から約250ntのアライメントが回収され、スポッテッドガーでは、さらに短い有意なアライメントがある(E値<0.001)。LncLOOMは、全種間で保存された17個のエレメントと、ゼブラフィッシュを除く全種で保存された>25個のエレメントとを見出した(図6)。これらには、miR-29部位、及び8つの追加のmiRNAに関する保存された結合部位が含まれ、3つは、BLASTによって哺乳動物種と魚種との間のアライメント領域の外側に見出された(図6)。したがって、標的特異的miRNA分解(target-directed miRNA degradation)(TDMD)を効果的に誘発することが示された2つのlncRNAであるCyrano及びlibraは、いくつかの追加の高度に保存されたmiRNA結合部位を有するが、TDMD媒介部位とは対照的に、これらはmiRNAではなくlncRNAレベルに影響を及ぼし得る「規則的な」シード部位であると思われる。
【0316】
実施例4
LncLOOMは、CHASERR lncRNA内の保存されたモチーフを同定する
BLAST比較に適していない、配列内の保存されたモジュールを同定するLncLOOMの能力を試験するために、本発明者らは、マウス生存率に必須であると近年特徴解析されたlncRNAであるCHASERRに注目した27。CHASERRホモログは、CHD2の転写開始部位への近接度(<2kb)、及びそれらの特徴的な5-エクソン遺伝子構造に基づいて、様々な種において容易に同定可能である27。本発明者らは、CHASERRの極端にG/Cリッチなプロモーター及び第1のエクソンの周りのゲノムアセンブリのいくつかにギャップがあるために、長さが579~1313ntであり、そのうちの4つが5’不完全である可能性が高い、16種の脊椎動物由来のCHASERR配列を手作業でキュレートした27図7)。BLASTNは、ヒトCHASERRと、有羊膜類由来の9つの配列との間に有意な(E値<0.01)アライメントを見出したが、他の6種の脊椎動物のいずれにも見出さなかった。逆に、ゼブラフィッシュ配列をクエリとして使用した場合、BLASTは、他の魚種及びオポッサムにおいてのみ相同性を見出した。CHASERR配列がClustalO MSAに供給されると28、3つの同一の位置のみが見出される。したがって、CHASERRの保存が限られていることは、比較ゲノミクスのために一般的に使用されるツールを使用した分析の課題である。
【0317】
LncLOOMは、全層で保存されている2つのk量体、すなわち、PASに対応する3’末端の:AAUAAA(配列番号3)、及び全CHASERR配列の最終エクソンに1回又は2回見出されるAAGAUG(配列番号2)(図3Aのモチーフ1)を同定した。AAUAAA(配列番号1モチーフは、CHASERRの3’末端付近に見出され、ポリアデニル化シグナル(PAS)に対応する可能性が最も高く、それ以上試験しなかった。CHASERR配列の検査により、AAGAUG モチーフ(配列番号5)が実質的に過剰提示されていることが見出された。CHASERRホモログは、偶然予測されたわずか0.45と比較して、平均で2.1例のモチーフを有した(P<0.01)。モチーフの状況もまた、これらの34例にわたって典型的に同様であり、モチーフにはプリンが典型的に続いた(図3B)。明らかに関連するモチーフAUGG(図3Aのモチーフ2)(配列番号2)は、11個の配列で保存されていた。隣接配列を含めて、モチーフ2は、モチーフ1とARAUGRコアを共有する(図3B)。これらの配列は、いかなるRBPの既知の結合優先性とも一致しなかったことが示唆され、eCLIPデータの検査では、バインダーの明らかな候補は明らかにされなかった。したがって、これらの配列の機能性を実験的にさらに探索した。
【0318】
保存されたエレメントの機能的有意性を試験するために、マウスChaserrにおける保存されたモチーフの3つの例に相補的なアンチセンスオリゴヌクレオチド(ASO)を設計し(図8A)、マウスNeuro2a(N2a)細胞にトランスフェクトした。Chaserrの枯渇がChd2 RNA及びタンパク質のレベルの増加をもたらすことが以前に示された27。これらのASOに対応するヒト配列は、AAGATGGCAGTCTACTATGG(配列番号12)を標的とするCCATAGTAGACTGCCATCTT(配列番号7)、及びCACAAATGGACAGTGGAT(配列番号10)を標的とするATCCACTGTCCATTTGTG(配列番号9)である。
【0319】
ASO1及びASO3を個別に又は混合してトランスフェクションすると、Chaserrのノックダウンによって引き起こされるものと同等のChd2レベルの有意な増加がもたらされた(図3C)。興味深いことに、ASO処理は、ASO標的化領域の上流又は下流のいずれかに見出されるRT-PCRプライマーペアによって評価されるように、Chaserrレベルの増加をもたらした(図3C)。
【0320】
保存された領域に潜在的に結合するタンパク質を同定するために、本発明者らは、インビトロ転写を使用して、Chaserrの最終エクソンのWT配列と、4つの保存されたモチーフにAUGG→UACC変異を有する同じ配列と、最終エクソン内のAUGG部位の7つ全部がUACCに変異した第2の変異体とを含有するビオチン化RNAを作製した(図8A)。これらの配列をそれらのアンチセンス対照と一緒にN2a細胞由来の溶解物とともにインキュベートし、様々なRNA変異体に関連するタンパク質を質量分析を使用して単離及び同定した。これらの実験で典型的であるように、938個という多数のタンパク質がWT配列と関連していると同定され(図示せず)、これらのうちの74個がアンチセンス配列の3倍以上エンリッチメントされたが、これらのうちの9個のみが、WT配列を使用した場合に両変異体の2倍以上の回収を有した(図3D)。次いで、本発明者らは、公開されているRNA-seqデータセットを調査し、これらのタンパク質が乱された場合のChd2及び/又はChaserrレベルの変化の証拠を探した。このような証拠は、DHX36及びZFRについて利用可能であった(図8B~C)。RNA免疫沈降(RIP)及び特異的抗体を使用して、ChaserrとDHX36(変異配列と比較して最も高いエンリッチメントを示したタンパク質)との有意な関連を検証した(図3D)。興味深いことに、DHX36はG-四重鎖配列に結合することが知られており29、30、保存されたエレメントはGG対を実際に含有するが、それらは互いにかなり遠く、典型的なG-四重鎖は少なくとも3Gのラン(run)を含有する。QGRSマッパ31は、Chaserrの最終エクソン内に1つのG四重鎖を予測するが(図8A)、異なるスコアリングシステムを組み込んだG4RNAスキャナ32を含む他のツールは、Chaserrの最終エクソン内に高スコアのG-四重鎖を何ら見出さなかった。非カノニカルG四重鎖形成がこの配列内で形成されること、又はDHX36による異なる認識様式を有する可能性もある。
【0321】
したがって、LncLOOMは、lncRNAの機能を乱すための標的試薬の設計の基礎として役立ちうる、lncRNA内の機能的に関連するエレメントを同定することができ、特異的であり機能的に関連するlncRNA相互作用パートナーを同定するためのプロテオーム法の使用を可能にする。
【0322】
実施例5
DICER1 mRNA及びPumilio mRNAの3’UTR内の深く保存されたエレメント
本発明者らは、次に、lncRNAを超え、さらに長い進化距離にわたって配列を比較するためのLncLOOMの適用性を評価することを求めた。3’UTRは、mRNAのRNA安定性と翻訳効率とを決定することができ、他のmRNA領域よりもはるかに迅速に典型的に進化する34。3’UTR間のオルソロジーは、非常に長い進化距離にわたって容易に比較可能であることが多いそれらの隣接するコード配列に基づいて定義することがかなり容易である。しかし、脊椎動物と無脊椎動物との間の3’UTR内の機能的エレメントの長距離保存に関する既知の事例はほとんどない。LncLOOMを使用して3’UTRの保存を試験するために、本発明者らは、特に複雑な転写後調節を典型的に受けるため、転写後調節時に作用する遺伝子に最初に注目した。利用可能なRNA-seq及び発現配列タグ(EST)データを使用して、本発明者らは、8つの脊椎動物、ナメクジウオ、ヤツメウナギ、ウニ、C.インテスティナリス(C.intestinalis)、及びショウジョウバエにおける2つのDICERを含む12種から、miRNA経路の重要な成分をコードするDICER1の3’UTR配列の集合体を編集した。BLASTNによって、ヒトDICER1を脊椎動物種由来の3’UTRにアライメントすることができたが、それを超えることはできなかった。LncLOOMは、全脊椎動物配列内で保存された15個のエレメントを同定し、そのうちの6個は、ランダム配列内では見出されなかった長さであった(P<0.01、図9)。保存されたモチーフのうちの8つは脊椎動物を超えて保存され(かつMSA又はBLASTによって評価することができなかった)、保存されたmiR-219に関する結合部位に対応する1つは、ハエDicer2 3’UTRを含む全種に見出された。
【0323】
次いで、本発明者らは、遺伝子発現を転写後に抑制するPumilioタンパク質をコードするPUM1 mRNA及びPUM2 mRNAの3’UTRに注目した。Pumilioタンパク質は深く保存されており、脊椎動物にはPUM1及びPUM2の2つのPumilioタンパク質が存在し、他の脊索動物及びハエでは単一のオルソログが存在する。12の脊椎動物及び4つの無脊椎動物(ヤツメウナギ、ナメクジウオ、C.インテスティナリス及びショウジョウバエ)由来の3’UTR配列をキュレートした。ヒト及びゼブラフィッシュの3’UTRは、BLASTNによって容易にアライメント可能であり、ヒトPUM1の3’UTRと、ヤツメウナギ及びナメクジウオPumilio mRNAの3’UTRとの間には有意な相同性さえあるが、ハエ及びC.インテスティナリスのものとは有意な相同性はない。LncLOOMは、脊椎動物PUM1 3’UTR全体にわたって保存された8つのエレメントを同定し、そのうちの1つUGUACAUU(配列番号14)は、分析された16個の3’UTRではいずれも、ハエpum 3’UTRまで保存された(図4、上部)。PUM2では、全配列に見出されたUGUACAUUも含めて、脊椎動物全体にわたって保存された3つのエレメントが存在した(図4、下部)。興味深いことに、このUGUACAUUモチーフはPREコンセンサスUGUANAUA(配列番号28)と部分的に一致し、ヒトENCODEデータではPUM1及びPUM2の両方によって結合され、この古来のエレメントが、Pumilio mRNAに存在することが知られている自己調節プログラムの一部であることを示唆している15。したがって、LncLOOMは、利用可能なツールが有意な配列保存を検出しない場合、5億年超離れたものを含めて、3’UTR配列内で深く保存されたエレメントを同定することができる。
【0324】
実施例6
3’UTR内の保存されたモチーフの体系的な分析は、深く保存されたエレメントを明らかにする
LncLOOMの予測力を広く評価するために、3’UTR配列の包括的分析を行った。本発明者らは、数億年の進化に及ぶ高信頼性入力データセットを構築することを可能にし、そこからLncLOOMを使用して数千のエレメントを体系的に試験することが可能であった、3’UTRに隣接する高度に保存されたコード配列に基づいて明確に定義された3’UTRに注目した。データセットは、TargetScan7.2 miRNA標的部位予測スイートの一部として生成された3’UTR MSAを有する2,439個の遺伝子に基づいた10。各遺伝子について、4つの種(ヒト、マウス、イヌ及びニワトリ)の各々では、それらが300~3,000nt長であった場合にのみ、TargetScan MSAからのアライメントされた配列を含むLncLOOM分析のために、3’UTR配列のデータセットを生成した。いくつかの3’UTRアイソフォームを有する遺伝子について、本発明者らは、最長の3’UTRを選択した。次いで、本発明者らは、追加の種においてEnsemblでアノテーションされた3’UTRの配列を、それらが200塩基よりも長い場合、利用可能であればデータセットに追加した。これらには、5つの非有羊膜類脊椎動物種(カエル、サメ、ゼブラフィッシュ、ガー及びヤツメウナギ)及び2つの無脊椎動物(ユウレイボヤ及びハエ)由来の配列を含めた。主な目的は、LncLOOMが深く保存されたエレメントを同定する能力を評価することであり、そのため、少なくとも1つの非有羊膜類由来の好適な配列を有する遺伝子のみを使用した。様々な深度で分析されうる配列の数を図10Aに示す。2,439個の3’UTRデータセットのうち、2,117個は、BLASTNがヒト配列に対する有意なアライメントを何ら報告していない(E値<0.05)少なくとも1つの配列を含み、2,031個のデータセットは、4つの種のいずれに対しても有意なアライメントを有しなかった少なくとも1つの配列を含んでいた(図5A)。したがって、MSAに基づく手法が保存の全深度を潜在的に調べることができなかった多数の配列を分析することが可能であった。
【0325】
LncLOOMを使用して、全LncLOOM試験において、最小長が6塩基であり、P<0.05である保存されたモチーフを検索した。LncLOOMは、ヒト配列では150,000個を超える有意なモチーフを検出し、そのうち27,826個(18.3%)は、広く保存されたmiRNAファミリーのシード部位に対応した(TargetScanによって定義した場合)。11,725個のk量体が有羊膜類を超えて保存され、少なくとも1つのアライメント不可能な配列では、そのうち3,897個が検出された(図5A~I及び図10)。LncLOOMは、それらのそれぞれのヒトオルソログにアライメントしなかった配列を含有する2,117個の遺伝子のうちの1,640個の第1のアライメント不可能な層では少なくとも1つの固有のk量体を検出し、少なくとも3つの固有のk量体の組合せが1,088個の遺伝子に見出された(図5B)。4つの有羊膜類種のいずれにもアライメントしなかった配列のみを考慮すると、少なくとも1つの固有のk量体が、1,529個のデータセット内の第1のアライメント不可能な配列内で検出された(図10A~F)。114個の遺伝子では、保存は脊椎動物を超えて見出され、97個では、保存はヒトからショウジョウバエまで見出された。合計170個の固有のk量体(265例)がハエ遺伝子では見出され、そのうち2つのみが広く保存されたmiRNA結合部位と一致した(図5C)。
【0326】
本発明者らは、次に、複数の遺伝子の3’UTR間で共有される特定の保存されたk量体を検討した。アライメント不可能な配列内で検出されたk量体の中で、42個が少なくとも50個の遺伝子に共通であり、少なくとも50個の遺伝子のうち2個のみが広く保存されたmiRNA結合部位に対応し、30個が無脊椎動物配列内で保存された(図5D)。これらの30個のうち、AU-リッチエレメント(ARE)に似たA/Uリッチな状況でUUU配列を含有した18個のk量体、及びPASに似たAUAAを含有した5個のk量体。他のk量体は、PREに似たUGUAコアを含有した。したがって、miRNA非関連エレメントのこれらの3つの群はまた、3’UTR内で非常に深く保存されていることが多く、これらの保存された出現がLncLOOMによって検出されうる。
【0327】
LncLOOMの感度を評価するために、LncLOOMによって同定された広く保存されたmiRNAの結合部位と、2,439個の遺伝子の各々に関するTargetScan予測とを比較し、そのうちの2,121個では、TargetScanはヒト配列内の結合部位を予測した。lncLOOMは、TargetScanアライメントが広く保存された部位を同定しなかった217個を含む2,330個の遺伝子内の結合部位を予測した(図5E)。lncLOOMによって予測された全miRNA部位の概要は、github(dot)com/LncLOOM/LncLOOMに見出すことができる。かなりの数の例(2,117個の遺伝子の29%)では、LncLOOMは、MSAでは3’UTRがヒト配列にアライメント不可能な種において有意に保存されたmiRNA結合部位を見出した(図5F)。lncLOOM予測とTargetScan予測とをさらに正確に比較するために、本発明者らは、TargetScanがlncLOOM分析に使用された同一のヒト転写物中の結合部位を予測した2,359個の遺伝子に注目し(図5E)、そのうち、lncLOOMは、ヒト配列内のTargetScanによって予測されたあらゆる広く保存された部位の90.24%を回収した(図5G)。217個の遺伝子の中で、42個は哺乳動物を超えて保存された部位を有し、いくつかの遺伝子では、魚種及びショウジョウバエ種で保存が見られた(図10A~F)。回収されたmiRNA部位に加えて、lncLOOMは、以前には予測されなかったさらなる21,615個の広く保存された部位を同定した。保存の深度を比較すると、lncLOOMは、さらに遠位の種においてTargetScanによって回収された部位を多くの場合検出した(図5G及び図10A~F)。重要なことに、それぞれ遺伝子の24%及び13%では、831個の回収された予測及び331個の新たな予測が、アライメント不可能な配列内で検出された。
【0328】
このように、LncLOOMは、3’UTR配列の分析のための強力なツールでもあり、MSAに基づく手法によって可能であるよりも、miRNA又は他の機能的結合部位の保存の大きな深度を明らかにしながら、感度については限られた妥協しか有しない。
【0329】
実施例7
CHASERRの標的化は、神経芽細胞内でCHD2のアップレギュレーションを引き起こす
以下に配列を提供する。
【0330】
【化1】
【0331】
(CHASERRを標的とするASO:)
A35:マウスに使用したものと同じASO。このASOは、マウス配列に相補的である。
A40:マウスではASO1と同じ領域を標的とするが、ヒト配列に完全に相補的なASO。
A49:A35及びA40に類似するが、G-U対合を使用してヒト配列及びマウス配列の両方と塩基対合する可能性を有するASO。
A50:A40と同一であるが、2’MOEの代わりに2’MO修飾を有し、3’末端で2塩基だけ切断されている
A51:A40と同一であるが、2’MOEの代わりに2’MO修飾を有し、5’末端で2塩基だけ切断されている
A52:A40と同一であるが、LNA修飾を含む
【0332】
結果
CHD2 mRNA及びタンパク質のレベルに対する効果と、非標的化ASO A27及びA28とを比較した。A28は、SH-SY5Y細胞内でp21のアップレギュレーションとストレス応答とを引き起こしているため(図16)、A27との比較を行った。
【0333】
細胞を2.5×10/35mmプレートの密度でプレーティングした。DharmaFECT4トランスフェクション試薬(T-2004-03、horizon)を使用して、25nMのASOによって細胞をトランスフェクトした。トランスフェクションの48時間後にRNAを抽出した。
【0334】
ASO A40、A50、A51及びA52は、トランスフェクトされていない細胞、又は対照ASOによってトランスフェクトされた細胞と比較して、CHD2をアップレギュレートする点で最も強力であった(図16)。
【0335】
実施例8
CHASERRの標的化は、MCF7細胞及びSH-SY5Y内でCHD2のアップレギュレーションを引き起こす
アンチセンスオリゴヌクレオチド及びLNA GapmeRトランスフェクション
10%ウシ胎児血清と100Uペニシリン/0.1mg ml-1ストレプトマイシンとを含有するDMEM中で、MCF7細胞株(ATCCから入手)を培養した。10%ウシ胎児血清と、100Uペニシリン/0.1mg ml-1ストレプトマイシンと、2mM GlutaMAX(Thermofisher:35050061)とを含有するDMEM/Nutrient Mixture F-12 Ham(Sigma:D6421)中で、SH-SY5Y細胞株(ATCCから入手)を培養した。全細胞を、5%COの加湿インキュベーター内で37℃で培養し、マイコプラズマ汚染について常用的に試験した。ASOの第1のセット:ASO1(A40、配列番号128)及びASO3(A41、配列番号134)を2’-O-メトキシエチル塩基によって修飾した。ヒトChaserrの第2のイントロンを標的とするLNAギャップマーをChaserrノックダウンに使用した。トランスフェクション:2×10個のMCF7又はSH-SY5Yを6ウェルプレートに播種し、製造業者のプロトコルに従ってDharmafect4(Dharmacon)トランスフェクション試薬を使用して、最終濃度が50nMになるようにASO1(ASO40)とASO3(ASO41)との混合物、又はChaserr gapmeR(表5)を用いてトランスフェクトした。全実験の終了点はトランスフェクションの48時間後であり、その後、RNA抽出、及びRT-qPCR分析による評価のために、TRIZOLを用いて細胞を回収した。Chasser及びCHD2の発現に対する効果を図17に示す。
【0336】
【表5】
【0337】
本発明をその特定の実施形態と併せて説明してきたが、多くの代替形態、修正形態及び変形形態が当業者には明らかであることは明白である。したがって、添付の特許請求の範囲の趣旨及び広い範囲に含まれるすべてのそのような代替形態、修正形態及び変形形態を包含することが意図されている。
【0338】
本明細書で言及されるすべての刊行物、特許及び特許出願は、あたかも各個々の刊行物、特許又は特許出願が参照により本明細書に組み込まれることが言及される際に具体的かつ個別に言及されたかのように、参照によりその全体が本明細書に組み込まれることが本出願人の意図である。さらに、本出願におけるいずれかの参考文献の引用又は特定は、そのような参考文献が本発明の先行技術として利用可能であることの承認として解釈されるべきではない。項の見出しが使用される限り、それらは必ずしも限定的であると解釈されるべきではない。さらに、本出願のあらゆる優先権書類は、参照によりその全体が本明細書に組み込まれる。
【0339】
参照文献(本文にはその他の文献が含まれる)
1. Ulitsky, I. & Bartel, D. P. lincRNAs: genomics, evolution, and mechanisms. Cell 154, 26-46 (2013).
2. Iyer, M. K. et al. The landscape of long noncoding RNAs in the human transcriptome. Nat. Genet. 47, 199-208 (2015).
3. Ulitsky, I. Evolution to the rescue: using comparative genomics to understand long non-coding RNAs. Nat. Rev. Genet. (2016) doi:10.1038/nrg.2016.85.
4. Hezroni, H. et al. Principles of Long Noncoding RNA Evolution Derived from Direct Comparison of Transcriptomes in 17 Species. Cell Rep. (2015) doi:10.1016/j.celrep.2015.04.023.
5. Wang, A. X., Ruzzo, W. L. & Tompa, M. How accurately is ncRNA aligned within whole-genome multiple alignments? BMC Bioinformatics 8, 417 (2007).
6. Bartel, D. P. Metazoan MicroRNAs. Cell 173, 20-51 (2018).
7. Dominguez, D. et al. Sequence, Structure, and Context Preferences of Human RNA Binding Proteins. Mol. Cell 70, 854-867.e9 (2018).
8. Maier, D. The Complexity of Some Problems on Subsequences and Supersequences. (1978).
9. Atamturk, A. & Savelsbergh, M. W. P. Integer-Programming Software Systems. Ann. Oper. Res. 140, 67-124 (2005).
10. Agarwal, V., Bell, G. W., Nam, J.-W. & Bartel, D. P. Predicting effective microRNA target sites in mammalian mRNAs. Elife 4, e05005 (2015).
11. Van Nostrand, E. L. et al. A Large-Scale Binding and Functional Map of Human RNA Binding Proteins. bioRxiv 179648 (2017) doi:10.1101/179648.
12. Ulitsky, I., Shkumatava, A., Jan, C. H., Sive, H. & Bartel, D. P. Conserved function of lincRNAs in vertebrate embryonic development despite rapid sequence evolution. Cell 147, 1537-1550 (2011).
13. Kleaveland, B., Shi, C. Y., Stefano, J. & Bartel, D. P. A Network of Noncoding Regulatory RNAs Acts in the Mammalian Brain. bioRxiv (2018).
14. Zhang, M. et al. Post-transcriptional regulation of mouse neurogenesis by Pumilio proteins. Genes Dev. 31, 1354-1369 (2017).
15. Goldstrohm, A. C., Hall, T. M. T. & McKenney, K. M. Post-transcriptional Regulatory Functions of Mammalian Pumilio Proteins. Trends Genet. 34, 972-990 (2018).
16. Li, X., Pritykin, Y., Concepcion, C. P., Lu, Y. & La Rocca, G. High-resolution in vivo identification of miRNA targets by Halo-Enhanced Ago2 Pulldown. bioRxiv (2019).
17. McGeary, S. E., Lin, K. S., Shi, C. Y., Bisaria, N. & Bartel, D. P. The biochemical basis of microRNA targeting efficacy. doi:10.1101/414763.
18. Elfakess, R. & Dikstein, R. A translation initiation element specific to mRNAs with very short 5’UTR that also regulates transcription. PLoS One 3, e3094 (2008).
19. Elfakess, R. et al. Unique translation initiation of mRNAs-containing TISU element. Nucleic Acids Res. 39, 7598-7609 (2011).
20. Housman, G. & Ulitsky, I. Methods for distinguishing between protein-coding and long noncoding RNAs and the elusive biological purpose of translation of long noncoding RNAs. Biochim. Biophys. Acta (2015) doi:10.1016/j.bbagrm.2015.07.017.
21. Bitetti, A. et al. MicroRNA degradation by a conserved target RNA regulates animal behavior. Nat. Struct. Mol. Biol. 25, 244-251 (2018).
22. Munschauer, M. et al. The NORAD lncRNA assembles a topoisomerase complex critical for genome stability. Nature 561, 132-136 (2018).
23. Lovci, M. T. et al. Rbfox proteins regulate alternative mRNA splicing through evolutionarily conserved RNA bridges. Nat. Struct. Mol. Biol. 20, 1434-1442 (2013).
【0340】
24. Jangi, M., Boutz, P. L., Paul, P. & Sharp, P. A. Rbfox2 controls autoregulation in RNA-binding protein networks. Genes Dev. 28, 637-651 (2014).
25. Chi, S. W., Zang, J. B., Mele, A. & Darnell, R. B. Argonaute HITS-CLIP decodes microRNA-mRNA interaction maps. Nature 460, 479-486 (2009).
26. Michel, A. M. et al. GWIPS-viz: development of a ribo-seq genome browser. Nucleic Acids Res. 42, D859-64 (2014).
27. Rom, A. et al. Regulation of CHD2 expression by the Chaserr long noncoding RNA gene is essential for viability. Nat. Commun. 10, 5092 (2019).
28. Sievers, F. et al. Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega. Mol. Syst. Biol. 7, (2011).
29. Chen, M. C. et al. Structural basis of G-quadruplex unfolding by the DEAH/RHA helicase DHX36. Nature 558, 465-469 (2018).
30. Sauer, M. et al. DHX36 prevents the accumulation of translationally inactive mRNAs with G4-structures in untranslated regions. Nat. Commun. 10, 2421 (2019).
31. Kikin, O., D’Antonio, L. & Bagga, P. S. QGRS Mapper: a web-based server for predicting G-quadruplexes in nucleotide sequences. Nucleic Acids Res. 34, W676-82 (2006).
32. Garant, J.-M., Perreault, J.-P. & Scott, M. S. G4RNA screener web server: User focused interface for RNA G-quadruplex prediction. Biochimie vol. 151 115-118 (2018).
33. Haque, N., Ouda, R., Chen, C., Ozato, K. & Hogg, J. R. ZFR coordinates crosstalk between RNA decay and transcription in innate immunity. Nat. Commun. 9, 1145 (2018).
34. Shabalina, S. A., Ogurtsov, A. Y., Rogozin, I. B., Koonin, E. V. & Lipman, D. J. Comparative analysis of orthologous eukaryotic mRNAs: potential hidden functional signals. Nucleic Acids Res. 32, 1774-1782 (2004).
35. Kirk, J. M. et al. Functional classification of long non-coding RNAs by k-mer content. Nat. Genet. 50, 1474-1482 (2018).
36. Quinn, J. J. et al. Rapid evolutionary turnover underlies conserved lncRNA-genome interactions. Genes Dev. 30, 191-207 (2016).
37. Tycowski, K. T., Shu, M. D., Borah, S., Shi, M. & Steitz, J. A. Conservation of a triple-helix-forming RNA stability element in noncoding and genomic RNAs of diverse viruses. Cell Rep. 2, 26-32 (2012).
38. Deveson, I. W. et al. Universal Alternative Splicing of Noncoding Exons. Cell Syst 6, 245-255.e5 (2018).
39. Katoh, K., Misawa, K., Kuma, K.-I. & Miyata, T. MAFFT: a novel method for rapid multiple sequence alignment based on fast Fourier transform. Nucleic Acids Res. 30, 3059-3066 (2002).
40. Altschul, S. F., Gish, W., Miller, W., Myers, E. W. & Lipman, D. J. Basic local alignment search tool. J. Mol. Biol. 215, 403-410 (1990).
41. Karp, R. M. Reducibility among Combinatorial Problems. in Complexity of Computer Computations: Proceedings of a symposium on the Complexity of Computer Computations, held March 20-22, 1972, at the IBM Thomas J. Watson Research Center, Yorktown Heights, New York, and sponsored by the Office of Naval Research, Mathematics Program, IBM World Trade Corporation, and the IBM Research Mathematical Sciences Department (eds. Miller, R. E., Thatcher, J. W. & Bohlinger, J. D.) 85-103 (Springer US, 1972).
42. Hagberg, A., Swart, P. & S Chult, D. Exploring network structure, dynamics, and function using NetworkX. www(dot)osti(dot)gov/biblio/960616 (2008).
43. Mitchell, S., OSullivan, M. & Dunning, I. PuLP: a linear programming toolkit for python. The University of Auckland, Auckland, New Zealand (2011).
44. Kent, W. J. BLAT-The BLAST-Like Alignment Tool. Genome Res. 12, 656-664 (2002).
45. Dobin, A. et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics 29, 15-21 (2013).
46. Li, B. & Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinformatics 12, 323 (2011).
【0341】
47. Elinger, D., Gabashvili, A. & Levin, Y. Suspension Trapping (S-Trap) Is Compatible with Typical Protein Extraction Buffers and Detergents for Bottom-Up Proteomics. J. Proteome Res. 18, 1441-1445 (2019).
48. Cox, J. & Mann, M. MaxQuant enables high peptide identification rates, individualized p.p.b.-range mass accuracies and proteome-wide protein quantification. Nat. Biotechnol. 26, 1367-1372 (2008).
図1A
図1B
図2A
図2B
図2C
図2D
図2E
図2F-1】
図2F-2】
図3A
図3B
図3C
図3D
図3E
図4-1】
図4-2】
図5A
図5B
図5C
図5D
図5E
図5F
図5G
図5H
図5I
図6
図7
図8A
図8B
図8C
図8D
図9-1】
図9-2】
図10A
図10B
図10C
図10D
図10E
図10F
図11A
図11B
図11C
図11D
図12-1】
図12-2】
図13A
図13B
図14
図15
図16
図17
【配列表】
2024500804000001.app
【国際調査報告】