(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-12-26
(54)【発明の名称】関心ヌクレオチド変異を検出するために用いられるオリゴヌクレオチドを提供するためのコンピュータ-具現方法
(51)【国際特許分類】
C12Q 1/6811 20180101AFI20231219BHJP
G16B 20/20 20190101ALI20231219BHJP
C12Q 1/6827 20180101ALN20231219BHJP
C12N 15/09 20060101ALN20231219BHJP
C12Q 1/6876 20180101ALN20231219BHJP
【FI】
C12Q1/6811 Z
G16B20/20
C12Q1/6827 Z ZNA
C12N15/09 Z
C12Q1/6876 Z
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023535564
(86)(22)【出願日】2021-12-10
(85)【翻訳文提出日】2023-06-09
(86)【国際出願番号】 KR2021018746
(87)【国際公開番号】W WO2022124848
(87)【国際公開日】2022-06-16
(31)【優先権主張番号】10-2020-0173648
(32)【優先日】2020-12-11
(33)【優先権主張国・地域又は機関】KR
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】507292955
【氏名又は名称】シージーン アイエヌシー
(74)【代理人】
【識別番号】110000338
【氏名又は名称】弁理士法人 HARAKENZO WORLD PATENT & TRADEMARK
(72)【発明者】
【氏名】キム,ヒョン ホ
(72)【発明者】
【氏名】キム,デヨン
(72)【発明者】
【氏名】ユン,ギソク
(72)【発明者】
【氏名】シン,ナ ヨン
(72)【発明者】
【氏名】リュ,ヒョン ジュ
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA17
4B063QQ42
4B063QR55
4B063QR62
4B063QS25
(57)【要約】
本発明はターゲット核酸配列における関心ヌクレオチド変異を検出するために用いられるオリゴヌクレオチドを提供するためのコンピュータ-具現方法に関する。本発明は、野生型ターゲット核酸配列及び関心ヌクレオチド変異に関する情報を入力し、前記入力された情報を用いて野生型及び変異ターゲット核酸配列を提供し、前記変異ターゲット核酸配列に対するオリゴヌクレオチドをデザインした後、前記デザインされたオリゴヌクレオチドと野生型ターゲット核酸配列とのマッチング有無を分析し、所定の選別基準を満たすオリゴヌクレオチドを選別して提供することによって、ヌクレオチド変異のタイプ、変異の大きさ、検出するターゲットが野生型及び/又は変異配列であるか否か及び配列コンテンツなどを考慮して細部デザイン規則及びモジュールを開発する必要無しに、統合的なデザイン規則に基づいてヌクレオチド変異を検出可能なオリゴヌクレオチドを提供できる。
【特許請求の範囲】
【請求項1】
次の段階を含むターゲット核酸配列における関心ヌクレオチド変異を検出するために用いられるオリゴヌクレオチドを提供するためのコンピュータ-具現方法:
(a)野生型ターゲット核酸配列及び関心ヌクレオチド変異に関する情報を入力する段階;前記野生型ターゲット核酸配列は、関心ヌクレオチド変異を含まないターゲット核酸配列であり、前記情報は、(i)野生型ターゲット核酸配列、(ii)前記野生型ターゲット核酸配列内で発生した前記関心ヌクレオチド変異の位置、及び(iii)前記関心ヌクレオチド変異の位置における野生型塩基及び変異塩基に関する情報を含み、前記関心ヌクレオチド変異の位置は開始位置及び終了位置と表示され、
(b)前記入力された情報を用いて前記野生型ターゲット核酸配列及び変異ターゲット核酸配列を提供する段階;前記変異ターゲット核酸配列は、関心ヌクレオチド変異を含むターゲット核酸配列であり、前記野生型及び変異ターゲット核酸配列は、正方向及び逆方向の野生型及び変異ターゲット核酸配列をそれぞれ含み、
(c)前記変異ターゲット核酸配列内の前記関心ヌクレオチド変異を含む所定の領域で前記関心ヌクレオチド変異を検出するために用いられるオリゴヌクレオチドをデザインし、前記変異ターゲット核酸配列に対する第1オリゴヌクレオチド候補群を提供する段階;
(d)前記変異ターゲット核酸配列に対する第1オリゴヌクレオチド候補群に含まれるオリゴヌクレオチドと前記野生型ターゲット核酸配列とのマッチング有無を分析し、次の選別基準を満たすオリゴヌクレオチドを、前記変異ターゲット核酸配列に対する第2オリゴヌクレオチド候補群として提供する段階;前記選別基準は、(i)前記野生型ターゲット核酸配列とオリゴヌクレオチドの5’末端、中央又は3’末端の所定の領域とのミスマッチが1個以上存在すること;又は、(ii)前記野生型ターゲット核酸配列とオリゴヌクレオチドとのミスマッチが所定の比率以上であること;を含み、及び
(e)前記変異ターゲット核酸配列に対する第2オリゴヌクレオチド候補群からオリゴヌクレオチドを選別して第3オリゴヌクレオチド候補群を提供する段階;前記第3オリゴヌクレオチド候補群は、前記ターゲット核酸配列における関心ヌクレオチド変異を検出するために用いられる。
【請求項2】
前記関心ヌクレオチド変異は、置換(substitution)、逆転(inversion)、挿入(insertion)、欠失(deletion)、反復(duplication)又はその組合せ(complex)であることを特徴とする、請求項1に記載の方法。
【請求項3】
前記オリゴヌクレオチドは、プローブ及び/又はプライマーであることを特徴とする、請求項1に記載の方法。
【請求項4】
前記段階(a)の野生型ターゲット核酸配列は、前記関心ヌクレオチド変異の位置を含む所定の長さを有することを特徴とする、請求項1に記載の方法。
【請求項5】
前記段階(c)のオリゴヌクレオチドは、前記変異ターゲット核酸配列内の前記関心ヌクレオチド変異を含む所定の領域にマッチされる配列又は相補的な配列を有するようにデザインされることを特徴とする、請求項1に記載の方法。
【請求項6】
前記段階(c)のオリゴヌクレオチドは、前記変異ターゲット核酸配列内前記関心ヌクレオチド変異の開始位置を基準にしてアップストリームに所定の位置から終了位置までの位置で長さ別にデザインされることを特徴とする、請求項1に記載の方法。
【請求項7】
前記段階(c)でデザインされるオリゴヌクレオチドは、次の条件のうち少なくとも一つの条件を満たすようにデザインされることを特徴とする、請求項1に記載の方法:
(i)10~60ヌクレオチドの長さ、
(ii)50~85℃のTm値、
(iii)3個以上のG-ラン配列排除、及び
(iv)5’末端部位のGCコンテンツは40%以上。
【請求項8】
前記段階(d)(i)のミスマッチは、前記野生型ターゲット核酸配列とオリゴヌクレオチドの5’末端、中央又は3’末端の所定の領域との最小ミスマッチであり、前記段階(d)(ii)のミスマッチは、前記野生型ターゲット核酸配列とオリゴヌクレオチドとの最小ミスマッチであることを特徴とする、請求項1に記載の方法。
【請求項9】
前記方法は、前記段階(d)後に、d-1)前記第2オリゴヌクレオチド候補群に含まれるオリゴヌクレオチドを次の整列基準のうち少なくとも一つの基準によって順位(rank)を付与して整列する段階;をさらに含むことを特徴とする、請求項1に記載の方法:
(i)前記段階(d)のマッチング有無の分析の結果、オリゴヌクレオチド内のミスマッチの位置;前記ミスマッチの位置が5’末端、3’末端又は中央に近いほど順位が高く、
(ii)前記段階(d)のマッチング有無の分析の結果、オリゴヌクレオチドのミスマッチの個数;前記ミスマッチの個数が大きいほど順位が高く、
(iii)オリゴヌクレオチドのTm値;前記Tm値が大きいほど順位が高く、
(iv)オリゴヌクレオチドの5’末端、中央又は3’末端の所定の領域のGCコンテンツ;前記GCコンテンツが高いほど順位が高く、
(v)オリゴヌクレオチドに含まれる連続G塩基の個数;前記連続G塩基の個数が少ないほど順位が高く、
(vi)前記オリゴヌクレオチドがホモダイマーを形成する場合に、ホモダイマーの形成に関与する連続したヌクレオチド個数又は比率;前記個数又は比率が小さいほど順位が高く、
(vii)ヘアピン構造形成自由エネルギー値(ΔG値);自由エネルギー値が大きいほど順位が高く、
(viii)長さ:長さが短いほど順位が高い。
【請求項10】
前記段階(e)の第3オリゴヌクレオチド候補群は、次の段階を含む方法によって選別されることを特徴とする、請求項1に記載の方法:
(e-1)前記第2オリゴヌクレオチド候補群に含まれるオリゴヌクレオチドのうち、オリゴヌクレオチドをデザインした開始位置が同一であるオリゴヌクレオチドに対して次の整列基準のうち少なくとも一つの基準によって順位(rank)を付与して整列する段階;及び
(e-2)前記整列されたオリゴヌクレオチドをデザインした開始位置が同一であるオリゴヌクレオチドの中から最上位オリゴヌクレオチドを選別する段階;を含み、前記整列基準は次を含む:
(i)前記段階(d)のマッチング有無の分析の結果、オリゴヌクレオチド内のミスマッチの位置;前記ミスマッチの位置が5’末端、3’末端又は中央に近いほど順位が高く、
(ii)前記段階(d)のマッチング有無の分析の結果、オリゴヌクレオチドのミスマッチの個数;前記ミスマッチの個数が大きいほど順位が高く、
(iii)オリゴヌクレオチドのTm値;前記Tm値が大きいほど順位が高く、
(iv)オリゴヌクレオチドの5’末端、中央又は3’末端の所定の領域のGCコンテンツ;前記GCコンテンツが高いほど順位が高く、
(v)オリゴヌクレオチドの含まれる連続G塩基の個数;前記連続G塩基の個数が少ないほど順位が高く、
(vi)前記オリゴヌクレオチドがホモダイマーを形成する場合に、ホモダイマーの形成に関与する連続したヌクレオチドの個数又は比率;前記個数又は比率が小さいほど順位が高く、
(vii)ヘアピン構造形成自由エネルギー値(ΔG値);自由エネルギー値が大きいほど順位が高く、及び
(viii)長さ:長さが短いほど順位が高い。
【請求項11】
前記第1~3オリゴヌクレオチド候補群はそれぞれ、第1~3プローブ候補群であり、前記方法は、前記段階(e)後に、次の段階をさらに含むことを特徴とする、請求項1に記載の方法:
(f)前記変異ターゲット核酸配列内の前記関心ヌクレオチド変異を含む所定の領域を増幅するようにプライマーをデザインし、前記変異ターゲット核酸配列に対するプライマー候補群を提供する段階;及び
(g)前記第3プローブ候補群及びプライマー候補群を組み合わせてプローブ及びプライマーの組合せを提供する段階。
【請求項12】
前記段階(f)でプライマーは次の条件のうち少なくとも一つの条件を満たすようにデザインされることを特徴とする、請求項11に記載の方法:
(i)40~70℃のTm値、
(ii)15~50bpヌクレオチドの長さ、及び
(iii)5個以上のG-ラン配列排除。
【請求項13】
前記方法は、前記段階(f)後に、次の段階をさらに含むことを特徴とする、請求項11に記載の方法:
(f-1)前記プライマー候補群に含まれるプライマーのうち、プライマーをデザインした開始位置が同一であるプライマーに対して次の整列基準のうち少なくとも一つの基準によって順位(rank)を付与して整列する段階;及び
(f-2)前記整列されたプライマーをデザインした開始位置が同一であるプライマーの中から最上位プライマーを選別する段階;を含み、前記整列基準は次を含む:
(i)前記プライマーに導入された縮退性塩基及び/又はユニバーザル塩基の使用個数又は比率;前記使用個数又は比率が少ないほど順位が高く、
(ii)縮退性塩基の導入によって生成されるプライマーのパターン数;前記パターン数が少ないほど順位が高く、
(iii)(A)
n、(T)
n、又は(C)
nモノヌクレオチドラン(mononucleotide run)配列の個数;前記配列の個数が少ないほど順位が高く、
(iv)前記プライマーがホモダイマーを形成する場合に、ホモダイマーの形成に関与する連続したヌクレオチドの個数又は比率;前記個数又は比率が小さいほど順位が高く、
(v)ヘアピン構造形成自由エネルギー値(ΔG値);前記自由エネルギー値が大きいほど順位が高く、
(vi)Tm値;前記Tm値が大きいほど順位が高く、
(vii)GCコンテンツ;前記GCコンテンツが高いほど順位が高く、及び
(viii)長さ;前記長さが短いほど順位が高い。
【請求項14】
ターゲット核酸配列における関心ヌクレオチド変異を検出するために用いられるオリゴヌクレオチドを提供するための方法を実行するためのプロセッサを具現する指示を含むコンピュータ可読記録媒体であって、前記方法は次の段階を含む:
(a)野生型ターゲット核酸配列及び関心ヌクレオチド変異に関する情報を入力する段階;前記野生型ターゲット核酸配列は、関心ヌクレオチド変異を含まないターゲット核酸配列であり、前記情報は、(i)野生型ターゲット核酸配列、(ii)前記野生型ターゲット核酸配列内で発生した前記関心ヌクレオチド変異の位置、及び(iii)前記関心ヌクレオチド変異の位置における野生型塩基及び変異塩基に関する情報を含み、前記関心ヌクレオチド変異の位置は開始位置及び終了位置と表示され、
(b)前記入力された情報を用いて前記野生型ターゲット核酸配列及び変異ターゲット核酸配列を提供する段階;前記変異ターゲット核酸配列は、関心ヌクレオチド変異を含むターゲット核酸配列であり、前記野生型及び変異ターゲット核酸配列は、正方向及び逆方向の野生型及び変異ターゲット核酸配列をそれぞれ含み、
(c)前記変異ターゲット核酸配列内の前記関心ヌクレオチド変異を含む所定の領域で前記関心ヌクレオチド変異を検出するために用いられるオリゴヌクレオチドをデザインし、前記変異ターゲット核酸配列に対する第1オリゴヌクレオチド候補群を提供する段階;
(d)前記変異ターゲット核酸配列に対する第1オリゴヌクレオチド候補群に含まれるオリゴヌクレオチドと前記野生型ターゲット核酸配列とのマッチング有無を分析し、次の選別基準を満たすオリゴヌクレオチドを、前記変異ターゲット核酸配列に対する第2オリゴヌクレオチド候補群として提供する段階;前記選別基準は、(i)前記野生型ターゲット核酸配列とオリゴヌクレオチドの5’末端、中央又は3’末端の所定の領域とのミスマッチが1個以上存在すること;又は、(ii)前記野生型ターゲット核酸配列とオリゴヌクレオチドとのミスマッチが所定の比率以上であること;を含み、及び
(e)前記変異ターゲット核酸配列に対する第2オリゴヌクレオチド候補群からオリゴヌクレオチドを選別して第3オリゴヌクレオチド候補群を提供する段階;前記第3オリゴヌクレオチド候補群は、前記ターゲット核酸配列における関心ヌクレオチド変異を検出するために用いられる。
【発明の詳細な説明】
【技術分野】
【0001】
〔関連出願の相互参照〕
本特許出願は2020年12月11日に大韓民国特許庁に出願された大韓民国特許出願第2020-0173648号に対して優先権を主張し、当該特許出願の開示事項は本明細書に参照によって組み込まれる。
【0002】
〔技術分野〕
本発明は、ターゲット核酸配列における関心ヌクレオチド変異(nucleotide mutations of interest)を検出するために用いられるオリゴヌクレオチドを提供するためのコンピュータ-具現方法に関する。
【背景技術】
【0003】
ターゲット核酸配列の検出のための様々な方法が当業界に知られている。当該様々な検出方法の例は、次を含む:PTOCE(PTO cleavage and extension)方法(WO2012/096523)、TaqManプローブ方法(米国特許第5,210,015号)、分子ビーコン方法(Tyagi等、Nature Biotechnology 14:303(1996))、スコルピオン(Scorpion)方法(Whitcombe等、Nature Biotechnology 17:804-807(1999))、サンライズ(Sunrise又はAmplifluor)方法(Nazarenko等、2516-2521 Nucleic Acids Research,25(12):2516-2521(1997)、及び米国特許第6,117,635号)、ルクス(Lux)方法(米国特許第7,537,886号)、CPT(Duck P,等、Biotechniques,9:142-148(1990))、LNA方法(米国特許第6,977,295号)、プレクサ(Plexor)方法(Sherrill CB,等、Journal of the American Chemical Society,126:4550-4556(2004))、Hybeacons方法(D.J.French,et al.,Molecular and Cellular Probes(2001)13,363-374及び米国特許第7,348,141号)、二重標識された自己クエンチングされたプローブ(Dual-labeled,self-quenched probe;米国特許第5,876,930号)、混成化プローブ(Bernard PS,et al.,Clin Chem 2000,46,147-148)、Invader分析(米国特許第5,691,142号)、PCE-SH(PTO Cleavage and Extension-Dependent Signaling Oligonucleotide Hybridization)方法(WO2013/115442)、PCE-NH(PTO Cleavage and Extension-Dependent Non-Hybridization)方法(WO2014/104818)及びCER方法(WO2011/037306)。
【0004】
ターゲット核酸配列の検出のために用いられるオリゴヌクレオチド(プローブ及び/又はプライマー)は、適切な特異度(specificity)及び検出度(sensitivity)を有し、且つ、特定検出方法に適合するとともに、分析者の設定した条件に符合しなければならない。したがって、分析目的に合うオリゴヌクレオチドのデザインが非常に重要である。
【0005】
一方、置換(substitution)(例えば、SNP(single nucleotide polymorphism))、逆転(inversion)、挿入(insertion)、欠失(deletion)、反復(duplication)又はこれらの組合せ(complex)などを含むヌクレオチド変異は、研究及び臨床領域において重要である。このうち、SNPは、ヒトゲノムから最も頻繁に発見され、疾病関連位置及び薬物遺伝学に対するマーカーとして働く。SNPは、ヒトゲノムにおいて1,000bp当たりに約1個の比率で発見され、これらの総数字は約300万個と推定される。
【0006】
従来、ヌクレオチド変異を検出するためのオリゴヌクレオチドをデザインするためには、ヌクレオチド変異のタイプ(例えば、置換、挿入など)、変異の大きさ(例えば、変異塩基の数)、及び検出するターゲットが野生型及び/又は変異配列であるかを考慮しなければならなかった。その結果、このような考慮事項によって少なくとも20個のデザイン規則及びモジュールを開発しなければならないという問題点があった。
【0007】
また、従来方法によれば、配列コンテンツを考慮し難い問題点があった。例えば、野生型ターゲット核酸配列が5’-CAGATCTGTTTTAAACGACT-3’(SEQ ID NO:1)であり、前記野生型ターゲット核酸配列の5’末端から11番目の位置と12番目の位置との間に塩基Tが挿入される変異が発生し(すなわち、変異ターゲット核酸配列5’-CAGATCTGTTTTTAAACGACT-3’;SEQ ID NO:2)、オリゴヌクレオチドの5’末端から3番目の位置に挿入変異の塩基が位置するようにオリゴヌクレオチドをデザインする挿入変異に対するデザイン規則を定める場合に(すなわち、5’-TTTTAAACGACT-3’;SEQ ID NO:3)、前記デザイン規則によってデザインされたオリゴヌクレオチドが、野生型ターゲット核酸配列と変異ターゲット核酸配列を区別して検出できない問題点があった。
【0008】
そこで、本発明者らは、様々なヌクレオチド変異タイプを全て考慮して野生型及び変異ターゲット核酸配列を区別検出するために用いられるオリゴヌクレオチドをデザインできる統合的なデザイン方法を開発しようと努力した。
【0009】
本明細書全体を通じて多数の引用文献及び特許文献が参照され、その引用が表示されている。引用された文献及び特許の開示内容はその全体として本明細書に参照によって援用され、本発明の属する技術分野のレベル及び本発明の内容がより明確に説明される。
【発明の概要】
【発明が解決しようとする課題】
【0010】
本発明者らは、上述した従来方法の問題点を克服し、ターゲット核酸配列における関心ヌクレオチド変異を検出するために用いられるオリゴヌクレオチドを効果的に提供できるコンピュータ-具現方法(Computer-Implemented Method)を開発しようと努力した。その結果、本発明者らは、野生型ターゲット核酸配列及び関心ヌクレオチド変異に関する情報を入力し、前記入力された情報を用いて野生型及び変異ターゲット核酸配列を提供し、前記変異ターゲット核酸配列に対するオリゴヌクレオチドをデザインした後、前記デザインされたオリゴヌクレオチドと野生型ターゲット核酸配列とのマッチング有無を分析し、所定の選別基準を満たすオリゴヌクレオチドを選別して提供することによって、ヌクレオチド変異のタイプ、変異の大きさ、検出するターゲットが野生型及び/又は変異配列であるか否か及び配列コンテンツなどを考慮して細部デザイン規則及びモジュールを開発する必要無しに、統合的なデザイン規則に基づいてヌクレオチド変異を検出可能なオリゴヌクレオチドを提供できることを確認し、本発明を完成するに至った。
【0011】
したがって、本発明の目的は、ターゲット核酸配列における関心ヌクレオチド変異を検出するために用いられるオリゴヌクレオチドを提供するためのコンピュータ-具現方法を提供することにある。
【0012】
本発明の他の目的はターゲット核酸配列における関心ヌクレオチド変異を検出するために用いられるオリゴヌクレオチドを提供するための方法を実行するためのプロセッサを具現する指示を含むコンピュータ可読記録媒体を提供することにある。
【0013】
本発明の他の目的及び利点は、下記の具現例、特許請求の範囲及び図面によってより明確になる。
【課題を解決するための手段】
【0014】
本発明の一態様によれば、本発明は、次の段階を含むターゲット核酸配列における関心ヌクレオチド変異を検出するために用いられるオリゴヌクレオチドを提供するためのコンピュータ-具現方法を提供する:
(a)野生型ターゲット核酸配列、及び関心ヌクレオチド変異に関する情報を入力する段階であって、前記野生型ターゲット核酸配列は、関心ヌクレオチド変異を含まないターゲット核酸配列であり、前記情報は、(i)野生型ターゲット核酸配列、(ii)前記野生型ターゲット核酸配列内で発生する前記関心ヌクレオチド変異の位置、及び(iii)前記関心ヌクレオチド変異の位置における野生型塩基及び変異塩基に関する情報を含み、前記関心ヌクレオチド変異の位置は開始位置及び終了位置と表示される、段階;
(b)前記入力された情報を用いて前記野生型ターゲット核酸配列及び変異ターゲット核酸配列を提供する段階であって、前記変異ターゲット核酸配列は、関心ヌクレオチド変異を含むターゲット核酸配列であり、前記野生型及び変異ターゲット核酸配列は、正方向及び逆方向野生型及び変異ターゲット核酸配列をそれぞれ含む、段階;
(c)前記変異ターゲット核酸配列内の前記関心ヌクレオチド変異を含む所定の領域で前記関心ヌクレオチド変異を検出するために用いられるオリゴヌクレオチドをデザインし、前記変異ターゲット核酸配列に対する第1オリゴヌクレオチド候補群を提供する段階;
(d)前記変異ターゲット核酸配列に対する第1オリゴヌクレオチド候補群に含まれるオリゴヌクレオチドと前記野生型ターゲット核酸配列とのマッチング有無を分析し、次の選別基準を満たすオリゴヌクレオチドを、前記変異ターゲット核酸配列に対する第2オリゴヌクレオチド候補群として提供する段階であって、前記選別基準は、(i)前記野生型ターゲット核酸配列とオリゴヌクレオチドの5’末端、中央又は3’末端の所定の領域とのミスマッチが1個以上存在すること;又は、(ii)前記野生型ターゲット核酸配列とオリゴヌクレオチドとのミスマッチが所定の比率以上であることを含む、段階;及び
(e)前記変異ターゲット核酸配列に対する第2オリゴヌクレオチド候補群からオリゴヌクレオチドを選別して第3オリゴヌクレオチド候補群を提供する段階であって、前記第3オリゴヌクレオチド候補群は、前記ターゲット核酸配列における関心ヌクレオチド変異を検出するために用いられる、段階;を含む。
【0015】
本発明者らは、上述した従来方法の問題点を克服し、ターゲット核酸配列における関心ヌクレオチド変異を検出するために用いられるオリゴヌクレオチドを効果的に提供できるコンピュータ-具現方法を開発しようと努力した。その結果、本発明者らは、野生型ターゲット核酸配列及び関心ヌクレオチド変異に関する情報を入力し、前記入力された情報を用いて野生型及び変異ターゲット核酸配列を提供し、前記変異ターゲット核酸配列に対するオリゴヌクレオチドをデザインした後、前記デザインされたオリゴヌクレオチドと野生型ターゲット核酸配列とのマッチング有無を分析し、所定の選別基準を満たすオリゴヌクレオチドを選別して提供することによって、ヌクレオチド変異のタイプ、変異の大きさ、検出するターゲットが野生型及び/又は変異配列であるか否か及び配列コンテンツなどを考慮して細部デザイン規則及びモジュールを開発する必要無しに、統合的なデザイン規則に基づいてヌクレオチド変異を検出可能なオリゴヌクレオチドを提供できることを確認した。
【0016】
本明細書において、オリゴヌクレオチドを言及しながら使われる用語「提供(preparing)」は、オリゴヌクレオチドの配列情報の提供及びオリゴヌクレオチド物質の製造を含む。
【0017】
本明細書において用語「ターゲット核酸配列」又は「ターゲット配列」は、ターゲット核酸分子を特定核酸配列で示したものである。
【0018】
本明細書において用語「ターゲット核酸分子」、「ターゲット分子」又は「ターゲット核酸」は、検出しようとする有機体内ヌクレオチド分子を意味する。ターゲット核酸分子は一般に特定名が付けられており、ゲノム全体及びゲノムを構成する全てのヌクレオチド分子(例えば、遺伝子、シュード遺伝子、非コーディング配列分子、非解読区域及びゲノムの一部区域)を含む。ターゲット核酸分子は、例えば、有機体の核酸を含む。
【0019】
本明細書において用語「有機体」は、生物学的分類体系、例えば、界、門、綱、目、科、属、種、亜種、品種、変種、サブタイプ、ジェノタイプ、セロタイプ、ストレイン、分離種(isolate)又は裁培種(cultivar)に属した有機体を意味する。有機体は、例えば、原核細胞(例えば、Mycoplasma pneumoniae、Chlamydophila pneumoniae、Legionella pneumophila、Haemophilus influenzae、Streptococcus pneumoniae、Bordetella pertussis、Bordetella parapertussis、Neisseria meningitidis、Listeria monocytogenes、Streptococcus agalactiae、Campylobacter、Clostridium difficile、Clostridium perfringens、Salmonella、Escherichia coli、Shigella、Vibrio、Yersinia enterocolitica、Aeromonas、Chlamydia trachomatis、Neisseria gonorrhoeae、Trichomonas vaginalis、Mycoplasma hominis、Mycoplasma genitalium、Ureaplasma urealyticum、Ureaplasma parvum、Mycobacterium tuberculosis)、真核細胞(例えば、原生動物、寄生動物、菌類、酵母、高等植物、下等動物、及び哺乳動物とヒトを含む高等動物)、ウイルス又はビロイドを含む。前記真核細胞のうち、寄生虫(parasite)の例は、Giardia lamblia、Entamoeba histolytica、Cryptosporidium、Blastocystis hominis、Dientamoeba fragilis、Cyclospora cayetanensisを含む。前記ウイルスの例は、呼吸器疾患を誘発するインフルエンザーAウイルス(Flu A)、インフルエンザーBウイルス(Flu B)、呼吸シンシチアルウイルスA(Respiratory syncytial virus A:RSV A)、呼吸シンシチアルウイルスB(Respiratory syncytial virus B:RSV B)、パラインフルエンザーウイルス1(PIV1)、パラインフルエンザーウイルス2(PIV2)、パラインフルエンザーウイルス3(PIV3)、パラインフルエンザーウイルス4(PIV4)、メタニューモウイルス(MPV)、ヒトエンテロウイルス(HEV)、ヒトボカウイルス(HBoV)、ヒトライノウイルス(HRV)、コロナウイルス及びアデノウイルス;胃腸管疾患を誘発するノロウイルス、ロタウイルス、アデノウイルス、アストロウイルス及びサポウイルスを含む。また、前記ウイルスの例は、HPV(human papillomavirus)、MERS-CoV(Middle East respiratory syndrome-related coronavirus)、デングウイルス(Dengue virus)、HSV(Herpes simplex virus)、HHV(Human herpes virus)、EMV(Epstein-Barr virus)、VZV(Varicella zoster virus)、CMV(Cytomegalovirus)、HIV、肝炎ウイルス及びポリオウイルスを含む。
【0020】
本明細書において用語「関心ヌクレオチド変異(nucleotide mutations of interest)」は、オリゴヌクレオチド(例えば、プライマー又はプローブ)を用いて増幅及び/又は検出しようとするターゲット核酸配列におけるヌクレオチド変異のことを指す。
【0021】
明細書で使われる用語「ヌクレオチド変異」は、連続したDNAセグメント又は配列が類似するDNAセグメントにおいて特定位置のDNA配列における全ての単一又は複数のヌクレオチド置換、逆転、挿入、欠失、反復又はその組合せなどを意味する。このような連続したDNA断片は、一つの遺伝子又は一つの染色体のいずれか異なる部位を含む。このようなヌクレオチド変異は、突然変異(mutant)又は多形成対立遺伝子変異(polymorphic allele variations)であってよい。例えば、SNP(single nucleotide polymorphism)、突然変異(mutation)、欠失、挿入、置換及び転座を含み、ヒトゲノムにある様々な変異(例えば、MTHFR(methylenetetrahydrofolate reductase)遺伝子の変異)、病源体の薬剤耐性と関連した変異及び癌発生関連変異を含む。
【0022】
本発明の一具現例によれば、前記関心ヌクレオチド変異は、置換(substitution)、逆転(inversion)、挿入(insertion)、欠失(deletion)、反復(duplication)、又はその組合せ(complex)である。
【0023】
本明細書で使われる用語「オリゴヌクレオチド(oligonucleotide)」は、自然の又は変形されたモノマー又は連鎖(linkages)の線形オリゴマーを意味し、デオキシリボヌクレオチド及びリボヌクレオチドを含み、ターゲット核酸配列に特異的に混成化でき、自然的に存在したり又は人為的に合成されるものである。オリゴヌクレオチドは、混成化において最大効率のために特に単一鎖である。具体的には、オリゴヌクレオチドは、オリゴデオキシリボヌクレオチドである。本発明において、オリゴヌクレオチドは、自然(naturally occurring)dNMP(すなわち、dAMP、dGMP、dCMP及びdTMP)、ヌクレオチド類似体又は誘導体を含んでよい。また、オリゴヌクレオチドはリボヌクレオチドも含んでよい。例えば、本発明において、オリゴヌクレオチドは、骨格変形されたヌクレオチド、例えば、ペプチド核酸(Peptide Nucleic Acid:PNA)(M.Egholm et al.,Nature,365:566-568(1993))、ロック核酸(Locked Nucleic Acid:LNA)(WO1999/014226)、架橋核酸(Bridged Nucleic Acid:BNA)(WO2005/021570)、ホスホロチオエートDNA、ホスホロジチオエートDNA、ホスホロアミデートDNA、アミド-連結されたDNA、MMI連結されたDNA、2’-O-メチルRNA、アルファ-DNA及びメチルホスホネートDNA、糖変形されたヌクレオチド、例えば、2’-O-メチルRNA、2’-フルオロRNA、2’-アミノRNA、2’-O-アルキルDNA、2’-O-アリルDNA、2’-O-アルカイニルDNA、ヘキソースDNA、ピラノシルRNA及びアンヒドロヘキシトルDNA、及び塩基変形を有するヌクレオチド、例えば、C-5置換されたピリミジン(置換基は、フルオロ-、ブロモ-、クロロ-、ヨード-、メチル-、エチル-、ビニル-、ホルミル-、エチニル-、プロピニル-、アルカイニル-、チアゾリル-、イミダゾリル-、ピリジル-を含む。)、C-7置換基を有する7-デアザプリン(置換基は、フルオロ-、ブロモ-、クロロ-、ヨード-、メチル-、エチル-、ビニル-、ホルミル-、アルカイニル-、アルケニル-、チアゾリル-、イミダゾリル-、ピリジル-)、イノシン及びジアミノプリンを含んでよい。特に、本明細書で使われる用語「オリゴヌクレオチド」は、デオキシリボヌクレオチドからなる一本鎖である。用語「オリゴヌクレオチド」は、ターゲット核酸配列に依存的に発生する切断断片と混成化されるオリゴヌクレオチドを含む。
【0024】
本発明の一具現例によれば、前記オリゴヌクレオチドは、プローブ及び/又はプライマーである。
【0025】
本明細書に使われた用語「プライマー」は、核酸鎖(鋳型)に相補的なプライマー延長産物の合成が誘導される条件、すなわち、ヌクレオチドとDNA重合酵素のような重合剤の存在、そして適度の温度とpHの条件において合成の開始点として働き得るオリゴヌクレオチドを意味する。プライマーは、重合剤の存在下で延長産物の合成をプライミングさせ得る程度に十分に長い必要がある。プライマーの適切な長さは、例えば、温度、応用分野及びプライマーのソース(source)を含む複数の要素によって決定される。
【0026】
本明細書で使われる用語「プローブ(probe)」は、ターゲット核酸配列に相補的な部位又は部位を含む一本鎖核酸分子を意味する。また、前記プローブは、ターゲット検出のための信号を発生させ得る標識を含んでよい。
【0027】
前記オリゴヌクレオチドは、ターゲット核酸配列に混成化される配列で構成された通常のプライマー及びプローブ構造を有し得る。又は、前記オリゴヌクレオチドの構造を変形して独特の構造を有するオリゴヌクレオチドであってよい。例えば、前記オリゴヌクレオチドは、スコルピオンプライマー、モレキュラービーコンプローブ、サンライズプライマー、ハイビーコンプローブ、タギングプローブ、DPOプライマー又はプローブ(WO2006/095981)、及びPTOプローブ(参照:WO2012/096523)の構造を有し得る。
【0028】
前記オリゴヌクレオチドは、通常の(conventional)プライマー又はプローブに縮退性塩基及び/又はユニバーサル塩基が導入された縮退性塩基含有のオリゴヌクレオチド及び/又はユニバーサル塩基含有のオリゴヌクレオチドのような変形オリゴヌクレオチドであってよい。本明細書で使われる用語「通常のプライマー」、「通常のプローブ」及び「通常のオリゴヌクレオチド」は、縮退性塩基又は非自然塩基が導入されていない一般的なプライマー、プローブ及びオリゴヌクレオチドを意味する。本発明の一具現例によれば、前記縮退性塩基含有のオリゴヌクレオチド又はユニバーサル塩基含有のオリゴヌクレオチドは、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%又は少なくとも95%は非変形オリゴヌクレオチドである。本発明の一具現例によれば、前記通常のオリゴヌクレオチドに導入される縮退性塩基又はユニバーサル塩基の個数の範囲は、具体的には、7個以下、5個以下、4個以下、3個以下又は2個以下である。又は、前記通常のオリゴヌクレオチドに導入される縮退性塩基及び/又はユニバーサル塩基の使用比率は、具体的には、25%以下、20%以下、18%以下、16%以下、14%以下、12%以下、10%以下、8%以下又は6%以下である。前記縮退性塩基又はユニバーザル塩基の使用比率は、縮退性塩基又はユニバーザル塩基が導入されたオリゴヌクレオチドの総ヌクレオチドに対する縮退性塩基又はユニバーザル塩基の比率を表す。前記縮退性塩基は、当業界に公知の様々な縮退性塩基を含む:R:A又はG;Y:C又はT;S:G又はC;W:A又はT;K:G又はT;M:A又はC;B:C、G又はT;D:A、G又はT;H:A、C又はT;V:A、C又はG;N:A、C、G又はT。前記ユニバーザル塩基は、当業界に公知の次の様々なユニバーザル塩基を含む:ジオキシイノシン、イノシン、7-ジアザ-2’-ジオキシイノシン、2-アザ-2’-ジオキシイノシン、2’-OMeイノシン、2’-Fイノシン、ジオキシ3-ニトロピロール、3-ニトロピロール、2’-OMe 3-ニトロピロール、2’-F 3-ニトロピロール、1-(2’-ジオキシ-ベータ-D-リボフラノシル)-3-ニトロピロール、ジオキシ5-ニトロピロール、5-ニトロインドール、2’-OMe 5-ニトロインドール、2’-F 5-ニトロインドール、ジオキシ4-ニトロベンズイミダゾール、4-ニトロベンズイミダゾール、ジオキシ4-アミノベンズイミダゾール、4-アミノベンズイミダゾール、ジオキシネブラリン、2’-Fネブラリン、2’-F 4-ニトロベンズイミダゾール、PNA-5-イントロインドール、PNA-ネブラリン、PNA-イノシン、PNA-4-ニトロベンズイミダゾール、PNA-3-ニトロピロール、モルホリノ-5-ニトロインドール、モルホリノ-ネブラリン、モルホリノ-イノシン、モルホリノ-4-ニトロベンズイミダゾール、モルホリノ-3-ニトロピロール、ホスホラミデート-5-ニトロインドール、ホスホラミデート-ネブラリン、ホスホラミデート-イノシン、ホスホラミデート-4-ニトロベンズイミダゾール、ホスホラミデート-3-ニトロピロール、2’-0-メトキシエチルイノシン、2’-0-メトキシエチルネブラリン、2’-0-メトキシエチル5-ニトロインドール、2’-0-メトキシエチル4-ニトロ-ベンズイミダゾール、2’-0-メトキシエチル3-ニトロピロール及び前記塩基の組合せ。より具体的には、前記ユニバーザル塩基は、ジオキシイノシン、イノシン、又はそれらの組合せである。
【0029】
図1は、本発明の一具現例によって本発明の方法を実施する過程のフローチャートである。本発明の方法を
図1を参照して詳細に説明すると、次の通りである:
(段階(a):野生型ターゲット核酸配列及び関心ヌクレオチド変異に関する情報を入力(110))
まず、本発明の方法は、(a)野生型ターゲット核酸配列及び関心ヌクレオチド変異に関する情報を入力する段階を含む。前記野生型ターゲット核酸配列は、関心ヌクレオチド変異を含まないターゲット核酸配列であり、前記情報は、(i)野生型ターゲット核酸配列、(ii)前記野生型ターゲット核酸配列内で発生した前記関心ヌクレオチド変異の位置、及び(iii)前記関心ヌクレオチド変異の位置における野生型塩基及び変異塩基に関する情報を含み、前記関心ヌクレオチド変異の位置は、開始位置及び終了位置と表示される。
【0030】
本発明の方法はコンピュータ-具現方法であり、野生型ターゲット核酸配列の配列及び関心ヌクレオチド変異に関する情報の入力は、ユーザインターフェース(UI)を介して実施される。
【0031】
本明細書において、前記情報を入力する段階は、情報を受信する段階を表す。例えば、UIを介して情報を入力する段階は、UIを介して情報を受信する段階を表す。
【0032】
前記野生型ターゲット核酸配列は、前記野生型ターゲット核酸配列内で発生したヌクレオチド変異の位置を特定するための基準配列である。
【0033】
前記情報のうち、野生型ターゲット核酸配列は、関心ヌクレオチド変異が存在する遺伝子を確認し、公衆接近が可能なデータベース(具体的には、NCBIのヌクレオチドデータベース)において遺伝子で配列を検索し、前記関心ヌクレオチド変異を含む有機体情報(例えば、タクソノミー(taxonomy)名又はタクソノミーID)を選択した後、Refseqデータベースから検索できる。あるいは、前記野生型ターゲット核酸配列内で発生した変異に対するアイデンティファイア(identifier)としてrs番号情報を確認し、公衆接近が可能なデータベース(具体的には、NCBIのSNPデータベース)においてrs番号で野生型ターゲット核酸配列を検索してもよい。
【0034】
本発明の一具現例によれば、前記段階(a)の野生型ターゲット核酸配列は、前記関心ヌクレオチド変異の位置を含む所定の長さを有する。
【0035】
本発明の一具現例によれば、前記段階(a)の野生型ターゲット核酸配列は、関心ヌクレオチド変異の位置から所定の長さを有する。
【0036】
具体的には、野生型ターゲット核酸配列は、前記野生型ターゲット核酸配列内で発生した関心ヌクレオチド変異の位置を基準にしてアップストリーム(upstream、左、-)に所定の長さ及びダウンストリーム(downstream、右、+)に所定の長さを含む配列を含む。より具体的には、前記関心ヌクレオチド変異の開始位置を基準にしてアップストリーム(upstream、左、-)に所定の長さ及び終了位置を基準にしてダウンストリーム(downstream、右、+)に所定の長さを含む配列である。
【0037】
前記所定の長さは、例えば、1500bp~100bpから選択するか、1500bp、1400bp、1300bp、1200bp、1100bp、1000bp、900bp、800bp、700bp、600bp、500bp、400bp、300bp、200bp又は100bpであってよい。
【0038】
本明細書において、方向性を言及しながら使われる用語「アップストリーム(upstream)」は、核酸配列のいずれか一位置を基準に「左側」、「左」又は「-」と同じ意味で使われてよく、用語「ダウンストリーム(downstream)」は、核酸配列のいずれか一位置を基準に「右側」、「右」又は「+」と同じ意味で使われてよい。
【0039】
本明細書においてヌクレオチドの長さを言及しながら使われる用語「ヌクレオチド(nucleotide)」は、「mer」、「base」又は「bp」と同じ意味で使われてよい。
【0040】
前記情報のうち、前記野生型ターゲット核酸配列内で発生した前記関心ヌクレオチド変異の位置は、前記野生型ターゲット核酸配列内における位置であり、前記野生型ターゲット核酸配列内における開始位置及び終了位置と表示される。例えば、前記野生型ターゲット核酸配列の305番位置で塩基TがGに置換される置換(substitution)変異が発生した場合に、前記変異の開始位置及び終了位置は305番位置となる。前記野生型ターゲット核酸配列の333番位置~337番位置で塩基CGTATが塩基TATGCに逆転(inversion)変異が発生した場合に、前記変異の開始位置は333番位置となり、終了位置は337番位置となる。前記野生型ターゲット核酸配列の354番位置の塩基Gと355番位置の塩基Tとの間に塩基TGCの挿入(insertion)変異が発生した場合に、前記変異の開始位置及び終了位置は354番位置となる。前記野生型ターゲット核酸配列の324番位置~327番位置の塩基GCATのうちCATが欠失される欠失(deletion)変異が発生した場合に、前記変異の開始位置は324番位置となり、終了位置は327番位置となる。前記野生型ターゲット核酸配列の544番位置~547番位置の塩基GCATのうち塩基CATが欠失され、塩基ACGACTが挿入される組合せ(complex)変異が発生した場合に、前記変異の開始位置は544番位置であり、終了位置は547番位置である。変異によって核酸配列の長さが変わる場合には、例えば、挿入及び欠失変異では、挿入及び欠失される位置の前の位置を開始位置と表示する。
【0041】
前記情報のうち、前記関心ヌクレオチド変異の位置における野生型塩基及び変異塩基に関する情報は、例えば、前記開始位置及び終了位置に関する説明において、置換変異の場合、野生型塩基は塩基Tであり、変異塩基はGであり、逆転変異の場合、野生型塩基は塩基CGTATであり、変異塩基は塩基TATGCであり、挿入変異の場合、野生型塩基は塩基Gであり、変異塩基は塩基GTGCであり、欠失変異の場合、野生型塩基は塩基GCATであり、変異塩基は塩基Gであり、組合せ(complex)変異の場合、野生型塩基は塩基GCATであり、変異塩基は塩基GACGACTである。変異によって配列の長さが変わる場合には、例えば、挿入及び欠失変異の場合には、挿入及び欠失される位置の前の位置の塩基も含めて情報を入力することができる。
【0042】
(段階(b):野生型ターゲット核酸配列及び変異ターゲット核酸配列を提供(120))
その後、本発明の方法は、(b)前記入力された情報を用いて前記野生型ターゲット核酸配列及び変異ターゲット核酸配列を提供する段階を含む。前記変異ターゲット核酸配列は、関心ヌクレオチド変異を含むターゲット核酸配列であり、前記野生型及び変異ターゲット核酸配列は、正方向及び逆方向の野生型ターゲット核酸配列、及び正方向及び逆方向の変異ターゲット核酸配列をそれぞれ含む。
【0043】
本段階は、後述する段階においてオリゴヌクレオチドをデザインする対象としてのテンプレート(template)を提供する段階である。
【0044】
前記野生型及び変異ターゲット核酸配列は、前記段階(a)で入力された情報を用いて提供される。具体的には、前記段階(a)で野生型ターゲット核酸配列内で発生した関心ヌクレオチド変異の位置情報及び変異塩基に関する情報を前記野生型ターゲット核酸配列に適用して変異ターゲット核酸配列を提供することができる。そして、前記野生型ターゲット核酸配列が正方向の野生型ターゲット核酸配列である場合に、逆方向の野生型ターゲット核酸配列を提供し、前記提供された変異ターゲット核酸配列が正方向の野生型ターゲット核酸配列から提供されたものであれば、前記正方向の変異ターゲット核酸配列から逆方向の変異ターゲット核酸配列を提供することができる。
【0045】
言い換えると、前記段階(a)で正方向の野生型ターゲット核酸配列に関する情報が入力された場合に、正方向(forward,5’to 3’)野生型ターゲット核酸配列及び逆方向(reverse complementary,3’to 5’)野生型ターゲット核酸配列がテンプレートとして提供される。前記段階(a)で入力された前記野生型のターゲット核酸配列内で発生した前記関心ヌクレオチド変異の位置、及び前記関心ヌクレオチド変異の位置における野生型塩基及び変異塩基に関する情報により、正方向(forward,5’to 3’)変異ターゲット核酸配列及び逆方向(reverse complementary,3’to 5’)変異ターゲット核酸配列がテンプレートとして提供される。
【0046】
本明細書においてテンプレートとしてターゲット核酸配列の方向性を言及しながら使われる用語「正方向(forward)」は、5’末端から3’末端への方向性を表し、用語「逆方向(reverse)」は、前記正方向ターゲット核酸配列に対して相補的であり、3’末端から5’末端への方向性を表す。
【0047】
本明細書において前記野生型及び変異ターゲット核酸配列を言及しながら使われる用語「提供」は、ターゲット核酸配列の配列情報の提示を表す。
【0048】
本発明の一具現例によれば、前記変異ターゲット核酸配列は、関心ヌクレオチド変異以外に他のヌクレオチド変異に関する情報を含む。例えば、検出しようとする関心ヌクレオチド変異以外に収集された複数のターゲット核酸配列のいずれかの位置で非保存性を示す塩基を有する変異を含む場合に、それに関する情報も前記変異ターゲット核酸配列に含めることができる。前記非保存性を示す塩基を有する変異は、有機体別に又は大陸別に異なっても同一であってもよい。
【0049】
本明細書において用語「非保存性」は、複数のターゲット核酸配列のアラインメント位置において保存性を示さない場合を意味し、複数のターゲット核酸配列のアラインメント位置において全体塩基に比べて異なる特定塩基の比率又は個数が所定の値を超えている場合を意味する。例えば、関心ヌクレオチド変異以外に他のヌクレオチド変異は、全体塩基に対して異なる特定塩基の比率が少なくとも0.1%、少なくとも0.2%、少なくとも0.3%、少なくとも0.4%、少なくとも0.5%、少なくとも0.6%又は少なくとも0.7%である場合を意味するが、これに限定されない。
【0050】
(段階(c):変異ターゲット核酸配列に対する第1オリゴヌクレオチド候補群を提供(130))
そして、本発明の方法は、(c)前記変異ターゲット核酸配列内の前記関心ヌクレオチド変異を含む所定の領域で前記関心ヌクレオチド変異を検出するために用いられるオリゴヌクレオチドをデザインし、前記変異ターゲット核酸配列に対する第1オリゴヌクレオチド候補群を提供する段階を含む。
【0051】
本段階では、前記変異ターゲット核酸配列を検出するために用いられるオリゴヌクレオチドをデザインし、前記変異ターゲット核酸配列に対する第1オリゴヌクレオチド候補群を提供する。
【0052】
上述した段階(a)で野生型ターゲット核酸配列内で発生した関心ヌクレオチド変異の位置及び前記位置における変異塩基を知っているので、本段階におけるオリゴヌクレオチドのデザインは、前記変異ターゲット核酸配列内の前記関心ヌクレオチド変異を含む所定の領域で実施する。そして、前記関心ヌクレオチド変異を含む所定の領域は、オリゴヌクレオチドのデザイン範囲と命名できる。
【0053】
本発明の一具現例によれば、前記段階(c)のオリゴヌクレオチドは、前記変異ターゲット核酸配列内の前記関心ヌクレオチド変異を含む所定の領域にマッチされる配列又は相補的な配列を有するようにデザインされる。
【0054】
本具現例によれば、前記デザインされるオリゴヌクレオチドは、前記オリゴヌクレオチドのデザイン範囲に該当する配列にマッチされたり或いは相補的な配列を有するようにデザインされる。
【0055】
前記オリゴヌクレオチドのデザイン範囲として、前記関心ヌクレオチド変異を含む所定の領域は、20~200bp、30~180bp、40~160bp、50~150bp、60~130bp又は70~120bpの範囲から選択されてよい。
【0056】
前記オリゴヌクレオチドのデザイン範囲として、前記関心ヌクレオチド変異を含む所定の領域は、前記変異ターゲット核酸配列内に存在する前記関心ヌクレオチド変異位置を基準にしてアップストリームに所定の長さ及びダウンストリームに所定の長さを含む領域であり、前記アップストリームに所定の長さは0bp~60bpから選択でき、前記ダウンストリームに所定の長さは0bp~60bpから選択できる。そして、前記アップストリームへの所定の長さと前記ダウンストリームへの所定の長さは互いに同一であっても異なってもよい。例えば、前記オリゴヌクレオチドのデザイン範囲が関心ヌクレオチド変異位置を基準にしてアップストリームに0bp及びダウンストリームに60bpを含む領域である場合に、前記変異ターゲット核酸配列内で関心ヌクレオチド変異からダウンストリームに60bpを含む領域でオリゴヌクレオチドをデザインすることをを表す。又は、前記オリゴヌクレオチドのデザイン範囲が、関心ヌクレオチド変異の開始位置を基準にしてアップストリームに10bp、終了位置を基準にしてダウンストリームに60bp、及び前記開始位置と終了位置の長さが10bpを含む領域である場合に、変異ターゲット核酸配列内の80bpの領域でオリゴヌクレオチドをデザインすることを表す。
【0057】
本発明の一具現例によれば、前記段階(c)のオリゴヌクレオチドは、前記変異ターゲット核酸配列内の前記関心ヌクレオチド変異の開始位置を基準にしてアップストリームに所定の位置から終了位置までの位置で長さ別にデザインされる。特に、前記段階(c)のオリゴヌクレオチドは、前記変異ターゲット核酸配列内の前記関心ヌクレオチド変異の開始位置を基準にしてアップストリームに所定の位置から終了位置までの位置で所定の長さ別にデザインされる。特に、前記段階(c)のオリゴヌクレオチドは、前記変異ターゲット核酸配列内の前記関心ヌクレオチド変異の開始位置を基準にしてアップストリームに所定の位置から終了位置までの各位置で所定の長さ別にデザインされる。あるいは、前記段階(c)のオリゴヌクレオチドは、前記変異ターゲット核酸配列内の前記関心ヌクレオチド変異の開始位置を基準にしてアップストリームに所定の位置から終了位置までの各位置で長さ別にデザインされる。
【0058】
変異ターゲット核酸配列内の前記関心ヌクレオチド変異の位置は、前記段階(b)で提供された変異ターゲット核酸配列内に存在する関心ヌクレオチド変異の位置を表し、前記変異の位置は開始位置及び終了位置と表現されてよい。
【0059】
前記関心ヌクレオチド変異の開始位置を基準にしてアップストリームに所定の位置は1~50bp又は2~40bpから選択されてよく、例えば、1bp、2bp、3bp、4bp、38bp、39bp、40bp又は41bpであってよい。
【0060】
前記長さ別にデザインされるオリゴヌクレオチドの長さ(特に、所定の長さ)は、例えば、10~60ヌクレオチド、10~50ヌクレオチド、10~45ヌクレオチド、10~40ヌクレオチド、10~35ヌクレオチド、15~60ヌクレオチド、15~50ヌクレオチド、15~45ヌクレオチド、15~40ヌクレオチド、15~35ヌクレオチド、20~60ヌクレオチド、20~50ヌクレオチド、20~45ヌクレオチド、20~40ヌクレオチド、又は20~35ヌクレオチドである。
【0061】
本具現例によってオリゴヌクレオチドをデザインするとき、例えば、関心ヌクレオチド変異の開始位置を基準にしてアップストリームに所定の位置が2bpであり、長さ別にデザインされるオリゴヌクレオチドの長さ(所定の長さ)の範囲が3~4ヌクレオチドであり、変異ターゲット核酸配列が5’-ATGCGGTTG-3’であり、前記変異ターゲット核酸配列の5’末端の4番目の位置の塩基Cが変異塩基であり、これは、塩基Aが塩基Cに置換された置換(substitution)変異である場合に、前記変異ターゲット核酸配列内の変異の開始位置及び終了位置の塩基であるCを基準にしてアップストリームの2bpである塩基Tから塩基Cまでの各位置で3~4ヌクレオチド別にオリゴヌクレオチドがデザインされる(すなわち、5’-TGC-3’、5’-TGCG-3’、5’-GCG-3’、5’-GCGG-3’、5’-CGG-3’、及び5’-CGGT-3’)。
【0062】
本明細書において、表現「オリゴヌクレオチドをデザインした開始位置が同一であるオリゴヌクレオチド」は、長さ別にオリゴヌクレオチドをデザインした開始位置が同一であるオリゴヌクレオチドを意味する。上記の例において、オリゴヌクレオチド5’-TGC-3’及び5’-TGCG-3’は、オリゴヌクレオチドをデザインした開始位置が同一であるオリゴヌクレオチドである。
【0063】
本具現例によってオリゴヌクレオチドをデザインするとき、例えば、関心ヌクレオチド変異の開始位置を基準にしてアップストリームに所定の位置が2bpであり、長さ別にデザインされるオリゴヌクレオチドの長さの範囲が3~5ヌクレオチドであり、変異ターゲット核酸配列が5’-ATGCTCTGGC-3’であり、前記変異ターゲット核酸配列の5’末端である塩基Aから4番目及び5番目の塩基であるCTが挿入された変異が存在する場合に、関心ヌクレオチド変異の開始位置に存在する塩基Cを基準にしてアップストリームに2bpに存在する塩基Tから前記関心ヌクレオチド変異の終了位置に存在する塩基Tまでの各位置で3~5ヌクレオチド別にオリゴヌクレオチドをデザインできる。具体的には、前記変異ターゲット核酸配列の5’末端から2度目の塩基であるT、すなわち、変異の開始位置に存在する塩基Cを基準にしてアップストリームに2bpに存在する塩基Tから5’-TGC-3’、5’-TGCT-3’、5’-TGCTC-3’、5’-GCT-3’、5’-GCTC-3’、5’-GCTCT-3’、5’-CTC-3’、5’-CTCT-3’、5’-CTCTG-3’、5’-TCT-3’、5’-TCTG-3’、5’-TCTGG-3’をデザインする。そして、前記変異ターゲット核酸配列の逆方向配列に対しても同一の方式でオリゴヌクレオチドをデザインする。
【0064】
前記挿入変異に対するオリゴヌクレオチドのデザイン例を説明しながら変異ターゲット核酸配列の5’末端から位置を説明し始めるとき、5’末端の塩基であるAを最初の位置とし、関心ヌクレオチド変異の開始位置を基準にしてアップストリームに所定の位置を説明するとき、開始位置の塩基であるCのアップストリームにある塩基Gを最初の位置として考慮して説明した。
【0065】
言い換えると、本明細書において基準点を核酸配列の末端とする場合には、前記核酸配列の末端に存在する塩基を含めて前記塩基を最初の塩基と考慮し、核酸配列内に存在する塩基を基準とする場合には、前記塩基を除く前記塩基のアップストリーム又はダウンストリームにある塩基を最初の塩基と考慮する。一方、核酸配列内に存在する塩基を基準とするとき、上述の説明と異なる場合には別に説明する。
【0066】
本発明の一具現例によれば、前記段階(c)でデザインされるオリゴヌクレオチドは、次の条件のうち少なくとも1個の条件を満たすようにデザインされる:
(i)10~60ヌクレオチドの長さ、
(ii)50~85℃のTm値、
(iii)3個以上のG-ラン配列排除、及び
(iv)5’末端部位のGCコンテンツは40%以上。
【0067】
より具体的には、前記オリゴヌクレオチドデザイン条件は、上述した条件のうち少なくとも2個、より具体的には少なくとも3個、さらに具体的には4個の条件を含む。
【0068】
前記デザイン条件のうち長さは、例えば、10~60ヌクレオチド、10~50ヌクレオチド、10~45ヌクレオチド、10~40ヌクレオチド、10~35ヌクレオチド、15~60ヌクレオチド、15~50ヌクレオチド、15~45ヌクレオチド、15~40ヌクレオチド又は15~35ヌクレオチドである。
【0069】
前記デザイン条件のうち、Tm値は、例えば、50~80℃、50~75℃、55~80℃、55~75℃、60~80℃、60~75℃、65~80℃又は60~75℃である。具体的には、デザイン条件のうち、Tm値は、55~80℃、60~78℃、63~78℃、65~75℃、67~75℃又は65~73℃である。
【0070】
前記デザイン条件のうち、G-ラン配列は、例えば、3個以上又は4個以上のG-ラン配列排除である。
【0071】
オリゴヌクレオチドの5’末端部位のGCコンテンツは、40%以上、具体的には40~70%又は40~60%である。前記5’末端部位は、オリゴヌクレオチドの5’末端から10ヌクレオチド以内の部位を意味する。
【0072】
(段階(d):第1オリゴヌクレオチド候補群と野生型ターゲット核酸配列とのマッチング有無を分析し、選別基準を満たすオリゴヌクレオチドを第2オリゴヌクレオチド候補群として提供(140))
続いて、本発明の方法は、(d)前記変異ターゲット核酸配列に対する第1オリゴヌクレオチド候補群に含まれるオリゴヌクレオチドと前記野生型ターゲット核酸配列とのマッチング有無を分析し、次の選別基準を満たすオリゴヌクレオチドを、前記変異ターゲット核酸配列に対する第2オリゴヌクレオチド候補群として提供する段階を含む。前記選別基準は、(i)前記野生型ターゲット核酸配列とオリゴヌクレオチドの5’末端、中央又は3’末端の所定の領域とのミスマッチが1個以上存在すること;又は、(ii)前記野生型ターゲット核酸配列とオリゴヌクレオチドとのミスマッチが所定の比率以上であること;を含む
本段階は、変異ターゲット核酸配列に対してデザインされたオリゴヌクレオチドが野生型ターゲット核酸配列から変異ターゲット核酸配列を区別検出できるように、所定の選別基準を満たすオリゴヌクレオチドを選別する過程である。このような選別過程により、従ヌクレオチド変異のタイプ別にオリゴヌクレオチドをデザインする方法を異ならせなければならない従来の問題点を解決できる。
【0073】
前記第1オリゴヌクレオチド候補群に含まれるオリゴヌクレオチドとのマッチング有無を分析する野生型ターゲット核酸配列の領域は、野生型ターゲット核酸配列の全体又は一部の領域であってよい。具体的には、野生型ターゲット核酸配列において関心ヌクレオチド変異が発生する位置を知っているので、関心ヌクレオチド変異を検出するために利用するオリゴヌクレオチドがデザインされた変異ターゲット核酸配列における配列領域に相応する野生型ターゲット核酸配列における一部領域に対してマッチングの有無を分析することができる。
【0074】
前記マッチングの有無の分析方法は、当業界に知られた様々な方法で実施できる。例えば、変異ターゲット核酸配列に対してデザインされたオリゴヌクレオチドを、前記オリゴヌクレオチドのデザイン範囲に相応する野生型ターゲット核酸配列における配列領域を移動させながらマッチングの有無を分析するか、前記デザインされたオリゴヌクレオチドをクエリー(query)配列にし、前記野生型ターゲット核酸配列に対してBLASTを行う方法でマッチングの有無を分析することができる。
【0075】
マッチング分析は、同じ方向性を有するターゲット核酸配列及びオリゴヌクレオチドの間で実施されてよい。
【0076】
本発明の方法がヌクレオチド変異のタイプを統合してオリゴヌクレオチドをデザインできるようにする前記選別基準は次を含む:(i)前記野生型ターゲット核酸配列とオリゴヌクレオチドの5’末端、中央又は3’末端の所定の領域とのミスマッチが1個以上存在すること;又は、(ii)前記野生型ターゲット核酸配列とオリゴヌクレオチドとの間にミスマッチがオリゴヌクレオチド配列に対して所定の比率以上であること。
【0077】
前記選別基準(i)は、オリゴヌクレオチドの特定一部領域と野生型ターゲット核酸配列とのミスマッチによって変異ターゲット核酸配列と野生型ターゲット核酸配列を区別検出できる基準である。ここで、オリゴヌクレオチドの特定一部領域以外の領域は、野生型ターゲット核酸配列とマッチされる配列を含む。
【0078】
このような区別検出のためのオリゴヌクレオチドの特定一部領域は、オリゴヌクレオチドの5’末端、中央又は3’末端の所定の領域であり、具体的には、オリゴヌクレオチドの5’末端又は中央の所定の領域、又はオリゴヌクレオチドの5’末端又は3’末端の所定の領域、より具体的には、オリゴヌクレオチドの5’末端の所定の領域である。前記所定の領域は、例えば、オリゴヌクレオチドの5’末端又は3’末端から10ヌクレオチド以内、7ヌクレオチド以内、5ヌクレオチド以内、3ヌクレオチド以内、2ヌクレオチド以内の領域又は1ヌクレオチドの領域であってよい。また、オリゴヌクレオチドの中央の所定の領域は、中央のヌクレオチドを含めて前記中央のヌクレオチドからアップストリーム及びダウンストリームにそれぞれ5ヌクレオチド以内、3ヌクレオチド以内、2ヌクレオチド以内の領域又は中央のヌクレオチドであってよい。
【0079】
オリゴヌクレオチドの5’末端、中央又は3’末端の所定の領域と野生型ターゲット核酸配列とのミスマッチによって変異ターゲット核酸配列を野生型ターゲット核酸配列に対して区別検出できる例は次の通りである:
デザインされたオリゴヌクレオチドが関心ヌクレオチド変異に該当する塩基を含むようにデザインされる場合に、前記関心ヌクレオチド変異を含む変異ターゲット核酸配列に相補的なターゲット核酸配列は、本明細書においてマッチング鋳型(matching template)と記載され、前記関心ヌクレオチド変異に該当する塩基を含まない野生型ターゲット核酸配列に相補的なターゲット核酸配列は、本明細書においてミスマッチング鋳型(mismatching template)と記載される。
【0080】
例えば、上述した選別基準(i)を満たすオリゴヌクレオチドが、本出願人によって開発されたPTOCE方法(WO2012/096523)又はVD-PTOCE方法(WO2013/133561)に用いられる場合には、PTO(Probing and Tagging Oligonucleotide)の3’-ターゲッティング部位(上述の本発明においてデザインされたオリゴヌクレオチド)の5’末端の所定の領域(例えば、5’末端)に、マッチング鋳型に相補的な塩基を有し、非マッチング鋳型に非相補的な塩基を有する場合に、例えば、アップストリームプライマー依存的切断誘導下でマッチング鋳型に混成化されたPTOの切断は、PTOの3’-ターゲッティング部位の5’末端に3’方向にすぐに近接(immediately adjacent)した一位置で誘導されてよい。PTO断片は、関心ヌクレオチド変異に該当する配列を含むキャプチャリング部位を有するCTO(Capturing and Templating Oligonucleotide)に混成化された後に延長されて延長二合体を形成し、ターゲットシグナルを提供する。
【0081】
万一、同一のPTOが、関心ヌクレオチド変異を除けばマッチング鋳型に対して同じ配列を有するミスマッチング鋳型に混成化されると、PTOの3’-ターゲッティング部位の5’末端から3’方向に2個のヌクレオチドだけ離隔した位置でPTOの切断が発生し得る。PTO断片の3’末端は、単一ヌクレオチド変異に相補的なヌクレオチド以外に追加に切断されるヌクレオチドを有する。追加に切断されたヌクレオチドに混成化されるCTOの位置が、前記追加に切断されるヌクレオチドに対して非相補的な配列を有するようにデザインされた場合に、PTO断片の3’末端はCTOに混成化されず、調節された条件でPTO断片が延長されない。万一PTO断片が延長されて延長二合体を形成しても、前記二合体は、PTO及びミスマッチング鋳型間の混成化による二合体とは異なるTm値を有する。
【0082】
このような方式により、上述した選別基準(i)を満たすオリゴヌクレオチドは、野生型ターゲット核酸配列に対して変異ターゲット核酸配列を区別検出できる。
【0083】
また、上述した選別基準(i)においてオリゴヌクレオチドの3’末端の所定の領域とのミスマッチに関連した基準を満たすオリゴヌクレオチドの場合には、次のような方法で変異ターゲット核酸配列を区別検出することができる。
【0084】
例えば、アップストリームプライマーの3’末端にミスマッチが存在する場合に、アップストリームプライマーの3’末端はマッチング鋳型にアニールされ延長されてPTO切断を誘導する。結果として、PTO断片は、CTOに混成化されてターゲットシグナルを提供する。逆に、アップストリームプライマーの3’末端がミスマッチング鋳型においてヌクレオチド変異にミスマッチされる場合に、アップストリームプライマーがミスマッチング鋳型に混成化されても、延長反応のためにプライマーの3’末端のアニーリングが必須である条件下では延長されず、よって、ターゲットシグナルが発生しない。
【0085】
そして、上述した選別基準(i)においてオリゴヌクレオチドの中央の所定の領域とのミスマッチに関連した基準を満たすオリゴヌクレオチドの場合には、次のような方法で変異ターゲット核酸配列を区別検出できる。
【0086】
例えば、関心ヌクレオチド変異に対する配列がPTOの3’-ターゲッティング部位(上述の本発明においてデザインされたオリゴヌクレオチド)の中間に位置する場合に、調節された条件下で、PTOはマッチング鋳型に混成化された後に切断される。結果として、PTO断片はCTOに混成化されてターゲットシグナルを提供する。一方、調節された条件下で、PTOはミスマッチング鋳型には混成化されず、切断されない。
【0087】
本発明の一具現例によれば、前記選別基準(i)は、前記野生型ターゲット核酸配列とオリゴヌクレオチドの5’末端の所定の領域とのミスマッチが1個以上存在すること;であり、最も具体的には、前記野生型ターゲット核酸配列とオリゴヌクレオチドの5’末端間にミスマッチが1個存在すること;である。
【0088】
本発明の一具現例によれば、前記段階(d)(i)のミスマッチは、前記野生型ターゲット核酸配列とオリゴヌクレオチドの5’末端、中央又は3’末端の所定の領域間の最小ミスマッチである。
【0089】
例えば、前記選別基準(i)におけるオリゴヌクレオチドの5’末端の所定の領域が2merであり、デザインされたオリゴヌクレオチドが5’-ATGCT-3’であり、マッチング有無の分析対象である野生型ターゲット核酸配列の領域が5’-AAGCT-3’である場合に、前記オリゴヌクレオチドの5’末端の2merの塩基であるATを、マッチング有無の分析対象である5’-AAGCT-3’に対してマッチングの有無を分析すれば、少なくともミスマッチが1個存在するので、前記デザインされたオリゴヌクレオチド5’-AATGC-3’は選別され、第2オリゴヌクレオチド候補群として提供される。
【0090】
前記選別基準(ii)は、オリゴヌクレオチドの全体配列と野生型ターゲット核酸配列との所定のミスマッチ割合のために前記オリゴヌクレオチドが変異ターゲット核酸配列(又は、変異ターゲット核酸配列に相補的な配列)には混成化し、野生型ターゲット核酸配列(又は、野生型ターゲット核酸配列に相補的な配列)には非混成化する方式によって野生型ターゲット核酸配列に対して変異ターゲット核酸配列を区別検出できる基準である。
【0091】
例えば、上述した選別基準(ii)を満たすオリゴヌクレオチドが、本出願人によって開発されたPTOCE方法(WO2012/096523)に用いられると、PTO(Probing and Tagging Oligonucleotide)の3’-ターゲッティング部位(上述の本発明においてデザインされたオリゴヌクレオチド)に、変異ターゲット核酸配列に相補的な塩基を有し、野生型ターゲット核酸配列に非混成化するように所定の比率以上の非相補的な塩基を有する場合に、例えば、アップストリームプライマー依存的切断誘導下で変異ターゲット核酸配列に混成化されたPTOの切断は、PTOの3’-ターゲッティング部位の5’末端のいずれか一位置で誘導されてよい。PTO断片は、前記断片と相補的な配列を含むキャプチャリング部位を有するCTO(Capturing and Templating Oligonucleotide)に混成化された後に延長されて延長二合体を形成し、ターゲットシグナルを提供する。
【0092】
万一、同一のPTOが関心ヌクレオチド変異を含めて野生型ターゲット核酸配列に対して所定の比率以上の非相補的塩基を含む場合に、前記PTOは野生型ターゲット核酸配列に混成化されないため前記PTOは切断されず、CTOに混成化されても延長されない。
【0093】
このような方式により、上述した選別基準(ii)を満たすオリゴヌクレオチドは、野生型ターゲット核酸配列に対して変異ターゲット核酸配列を区別検出できる。
【0094】
前記ミスマッチの所定の比率は、変異ターゲット核酸配列に対してデザインされたオリゴヌクレオチドが野生型ターゲット核酸配列に混成化されないように選択されてよい。例えば、10%~100%から選択されるか、10%、20%、30%、40%、50%、60%、70%、80%、90%又は100%であってよい。
【0095】
本発明の一具現例によれば、前記段階(d)(ii)のミスマッチは、前記野生型ターゲット核酸配列とオリゴヌクレオチドとの最小ミスマッチを表す。より具体的には、前記段階(d)(ii)のミスマッチは、前記野生型ターゲット核酸配列とオリゴヌクレオチドとの最小ミスマッチの個数を表す。
【0096】
本具現例は、オリゴヌクレオチド配列に対して所定の比率以上のミスマッチは、前記野生型ターゲット核酸配列とオリゴヌクレオチド全体配列間のマッチ有無の分析の結果、前記野生型ターゲット核酸配列とオリゴヌクレオチド間に最小ミスマッチを示すオリゴヌクレオチドのミスマッチ個数の比率を表す。
【0097】
例えば、30merとデザインされたオリゴヌクレオチドの、野生型ターゲット核酸配列に対するマッチ有無の分析の結果、ミスマッチの個数が20mer、17mer、10mer、18mer、21merのようである場合に、このうち最小ミスマッチの個数は10merであり、オリゴヌクレオチド配列が30merであるので、ミスマッチ比率は33.3%となる。この場合、所定の比率が30%であれば、前記デザインされたオリゴヌクレオチドは前記選別基準(ii)を満たし、第2オリゴヌクレオチド候補群として提供する。
【0098】
本発明の一具現例によれば、前記選別基準は次を含む:(i)前記野生型ターゲット核酸配列とオリゴヌクレオチドの5’末端、中央又は3’末端の所定の領域とのミスマッチが1個以上存在すること;又は、(ii)前記野生型ターゲット核酸配列とオリゴヌクレオチドとのミスマッチが所定の比率以上であること。
【0099】
本発明の一具現例によれば、前記第2オリゴヌクレオチド候補群は、前記関心ヌクレオチド変異以外に他のヌクレオチド変異を含む変異ターゲット核酸配列に対するターゲット-カバレッジを増加させるように、前記デザインされたオリゴヌクレオチドの少なくとも1個の塩基を縮退性塩基及び/又はユニバーザル塩基に置換し、ターゲット-カバレッジの増加した変形オリゴヌクレオチドを含む。
【0100】
本発明の一具現例によれば、上記の方法は、前記段階(d)の後に、d-1)前記第2オリゴヌクレオチド候補群に含まれるオリゴヌクレオチドを、次の整列基準のうち少なくとも一つの基準によって順位(rank)を与えて整列する段階;をさらに含む:
(i)前記段階(d)のマッチング有無の分析の結果、オリゴヌクレオチド内のミスマッチの位置;前記ミスマッチの位置が5’末端、3’末端又は中央に近いほど順位が高く、
(ii)前記段階(d)のマッチング有無の分析の結果、オリゴヌクレオチドのミスマッチの個数;前記ミスマッチの個数が大きいほど順位が高く、
(iii)オリゴヌクレオチドのTm値;前記Tm値が大きいほど順位が高く、
(iv)オリゴヌクレオチドの5’末端、中央又は3’末端の所定の領域のGCコンテンツ;前記GCコンテンツが高いほど順位が高く、
(v)オリゴヌクレオチドに含まれる連続G塩基の個数;前記連続G塩基の個数が少ないほど順位が高く、
(vi)前記オリゴヌクレオチドがホモダイマーを形成する場合に、ホモダイマーの形成に関与する連続したヌクレオチド個数又は比率;前記個数又は比率が小さいほど順位が高く、
(vii)ヘアピン構造形成自由エネルギー値(ΔG値);自由エネルギー値が大きいほど順位が高く、
(viii)長さ:長さが短いほど順位が高い。
【0101】
本具現例は、後述する段階(e)で第2オリゴヌクレオチド候補群を選別して第3オリゴヌクレオチド候補群を提供するための順位を付与する過程である。
【0102】
本具現例によれば、第2オリゴヌクレオチド候補群に含まれるオリゴヌクレオチドを少なくとも1個(具体的には、(i)番の整列基準)、具体的には少なくとも2個、より具体的には少なくとも3個、少なくとも4個、少なくとも5個、少なくとも6個、少なくとも7個又は少なくとも8個、最も具体的には8個の順位を考慮した整列基準を満たすように整列する。
【0103】
第2オリゴヌクレオチド候補群に含まれるオリゴヌクレオチドを整列する方法は、大きく、2つの方式があり得る:
第一の方式によれば、前記少なくとも2個の整列基準は重要度(criticality)が異なり、重要度が最も高い整列基準(例えば、(i)番の整列基準)を満たすようにオリゴヌクレオチドを整列できる。
【0104】
万一、重要度が最も高い整列基準を満たすオリゴヌクレオチドが複数個である場合に、次順位の整列基準を満たすようにオリゴヌクレオチドを整列できる。
【0105】
例えば、整列基準の重要度が(i)、(ii)、(iii)、(iv)、(v)、(vi)、(vii)及び(viii)の順序である場合に、(i)番の整列基準を満たすオリゴヌクレオチドが3個であれば、この3個のオリゴヌクレオチドを(ii)番の整列基準にしたがって整列する。万一、(ii)番の整列基準を満たすオリゴヌクレオチドが3個であれば、(iii)番の整列基準を満たすようにオリゴヌクレオチドを整列する。
【0106】
第二の方式によれば、整列基準に互いに異なるウェイト(weight)を割り当て、それぞれの整列基準における値(又は、値の範囲)にスコアを割り当て、これに対する順位を考慮すると、それぞれのオリゴヌクレオチドの総スコアを得ることができ、この計算された総スコアを考慮してオリゴヌクレオチドを整列することができる。
【0107】
本発明の一具現例によれば、前記少なくとも2個の整列基準は、重要度(criticality)が異なり、本発明の方法は、前記重要度を考慮した前記少なくとも2個の整列基準を満たすように第2オリゴヌクレオチド候補群に含まれるオリゴヌクレオチドを整列する段階をさらに含む。
【0108】
(段階(e):第3オリゴヌクレオチド候補群を提供(150))
最後に、本発明の方法は、(e)前記変異ターゲット核酸配列に対する第2オリゴヌクレオチド候補群からオリゴヌクレオチドを選別して第3オリゴヌクレオチド候補群を提供する段階を含む。前記第3オリゴヌクレオチド候補群は、前記ターゲット核酸配列における関心ヌクレオチド変異を検出するために用いられる。
【0109】
本発明の一具現例によれば、前記段階(e)の第3オリゴヌクレオチド候補群は、次の段階を含む方法によって選別される:
(e-1)前記第2オリゴヌクレオチド候補群に含まれるオリゴヌクレオチドのうち、オリゴヌクレオチドをデザインした開始位置が同一であるオリゴヌクレオチドに対して次の整列基準のうち少なくとも一つの基準によって順位(rank)を付与して整列する段階;及び
(e-2)前記整列されたオリゴヌクレオチドをデザインした開始位置が同一であるオリゴヌクレオチドから最上位オリゴヌクレオチドを選別する段階;を含み、前記整列基準は次を含む:
(i)前記段階(d)のマッチング有無の分析の結果、オリゴヌクレオチド内のミスマッチの位置;前記ミスマッチの位置が5’末端、3’末端又は中央に近いほど順位が高く、
(ii)前記段階(d)のマッチング有無の分析の結果、オリゴヌクレオチドのミスマッチの個数;前記ミスマッチの個数が大きいほど順位が高く、
(iii)オリゴヌクレオチドのTm値;前記Tm値が大きいほど順位が高く、
(iv)オリゴヌクレオチドの5’末端、中央又は3’末端の所定の領域のGCコンテンツ;前記GCコンテンツが高いほど順位が高く、
(v)オリゴヌクレオチドに含まれる連続G塩基の個数;前記連続G塩基の個数が少ないほど順位が高く、
(vi)前記オリゴヌクレオチドがホモダイマーを形成する場合に、ホモダイマーの形成に関与する連続したヌクレオチドの個数又は比率;前記個数又は比率が小さいほど順位が高く、
(vii)ヘアピン構造形成自由エネルギー値(ΔG値);自由エネルギー値が大きいほど順位が高く、及び
(viii)長さ:長さが短いほど順位が高い。
【0110】
本具現例は、前記第2オリゴヌクレオチド候補群に含まれるオリゴヌクレオチドのうち、オリゴヌクレオチドをデザインした開始位置が同一であるオリゴヌクレオチドに対して順位を付与して整列した後、その中から最上位オリゴヌクレオチドを選定する過程である。第2オリゴヌクレオチド候補群に含まれるオリゴヌクレオチドのうち、オリゴヌクレオチドをデザインした開始位置が同一であるオリゴヌクレオチドが、変異ターゲット核酸配列内のオリゴヌクレオチドデザイン位置別にそれぞれ存在するはずであり、よって、各デザイン位置別に最上位オリゴヌクレオチドが選定される。
【0111】
前記段階d-1)における順位を付与し整列するオリゴヌクレオチドの対象は、第2オリゴヌクレオチド候補群に含まれる全てのオリゴヌクレオチドであるが、本具現例によって順位を付与し整列するオリゴヌクレオチドの対象は、前記第2オリゴヌクレオチド候補群に含まれるオリゴヌクレオチドのうち、オリゴヌクレオチドをデザインした開始位置が同一であるオリゴヌクレオチドであるという点で、本具現例と比べて前記段階d-1)が異なる。
【0112】
本具現例によれば、前記段階(e-1)で前記第2オリゴヌクレオチド候補群に含まれるオリゴヌクレオチドのうち、オリゴヌクレオチドをデザインした開始位置が同一であるオリゴヌクレオチドを少なくとも1個(具体的には、(i)番の整列基準)、具体的には少なくとも2個、より具体的には少なくとも3個、少なくとも4個、少なくとも5個、少なくとも6個、少なくとも7個又は少なくとも8個、最も具体的には8個の順位を考慮した整列基準を満たすように整列する。
【0113】
前記第2オリゴヌクレオチド候補群に含まれるオリゴヌクレオチドのうち、オリゴヌクレオチドをデザインした開始位置が同一であるオリゴヌクレオチドを整列する方法は、大きく、2つの方式があり得る:
第一の方式によれば、前記最小2個の整列基準は重要度(criticality)が異なり、重要度が最も高い整列基準(例えば、(i)番の整列基準)を満たすようにオリゴヌクレオチドを整列できる。
【0114】
万一、重要度が最も高い整列基準を満たすオリゴヌクレオチドが複数個である場合に、次順位の整列基準を満たすようにオリゴヌクレオチドを整列できる。
【0115】
例えば、整列基準の重要度が(i)、(ii)、(iii)、(iv)、(v)、(vi)、(vii)及び(viii)の順序である場合に、(i)番の整列基準を満たすオリゴヌクレオチドが3個であれば、この3個のオリゴヌクレオチドを(ii)番の整列基準にしたがって整列する。万一、(ii)番の整列基準を満たすオリゴヌクレオチドが3個であれば、(iii)番の整列基準を満たすようにオリゴヌクレオチドを整列し、最上位のオリゴヌクレオチドを第3オリゴヌクレオチド候補群として選定できる。
【0116】
第二の方式によれば、整列基準に互いに異なるウェイト(weight)を割り当て、それぞれの整列基準における値(又は、値の範囲)にスコアを割り当て、それに対する順位を考慮すると、それぞれのオリゴヌクレオチドの総スコアを得ることができ、この計算された総スコアを考慮して、オリゴヌクレオチドを整列でき、総スコアによる順位によって最上位のオリゴヌクレオチドを第3オリゴヌクレオチド候補群として選定できる。
【0117】
本発明の一具現例によれば、前記少なくとも2個の整列基準は重要度(criticality)が異なり、本発明の方法は、前記重要度を考慮した前記少なくとも2個の整列基準を満たすように、前記第2オリゴヌクレオチド候補群に含まれるオリゴヌクレオチドのうち、オリゴヌクレオチドをデザインした開始位置が同一であるオリゴヌクレオチドを整列する段階をさらに含む。
【0118】
このような方法により、前記ターゲット核酸配列における関心ヌクレオチド変異を検出するために用いられる前記第3オリゴヌクレオチド候補群を提供できる。
【0119】
本発明の一具現例によれば、前記第1~3オリゴヌクレオチド候補群はそれぞれ、第1~3プローブ候補群であり、前記方法は、前記段階(e)後に、次の段階をさらに含む:
(f)前記変異ターゲット核酸配列内の前記関心ヌクレオチド変異を含む所定の領域を増幅するようにプライマーをデザインし、前記変異ターゲット核酸配列に対するプライマー候補群を提供する段階;及び
(g)前記第3プローブ候補群及びプライマー候補群を組み合わせてプローブ及びプライマーの組合せを提供する段階。
【0120】
本具現例は、上述した方法によって第1~3プローブ候補群を提供した後にプライマー候補群を提供し、前記第3プローブ候補群及びプライマー候補群を組み合わせてプローブ及びプライマーの組合せを提供する過程を表す。
【0121】
(段階(f):前記変異ターゲット核酸配列に対するプライマー候補群を提供)
前記段階(f)で、前記変異ターゲット核酸配列内の前記関心ヌクレオチド変異を含む所定の領域を増幅するようにプライマーをデザインする。
【0122】
プライマーをデザインする範囲、すなわち、プライマーを用いて増幅するための前記関心ヌクレオチドを含む所定の領域は、前記段階(c)で第1プローブ候補群に含まれるプローブをデザインする領域(すなわち、プローブのデザイン範囲)と異なるが、前記プローブをデザインする所定の領域を含む領域を増幅するようにプライマーのデザイン範囲を設定することができる。
【0123】
前記プライマーをデザインする範囲、すなわち、プライマーを用いて増幅するための前記関心ヌクレオチドを含む所定の領域は、前記関心ヌクレオチド変異の開始位置のアップストリームに500bp(具体的には、400bp、350bp、300bp、250bp、200bp、150bp、100bp、又は50bp)乃至前記関心ヌクレオチド変異の終了位置のダウンストリームに500bp(具体的には、400bp、350bp、300bp、250bp、200bp、150bp、100bp、又は50bp)までの領域内で選択されてよい。
【0124】
本発明の一具現例によれば、前記段階(f)でデザインされるプライマーは、次の条件のうち少なくとも一つの条件を満たすようにデザインされる:
(i)40~70℃のTm値、
(ii)15~50bpヌクレオチドの長さ、及び
(iii)5個以上のG-ラン配列排除。
【0125】
前記デザイン条件のうち、Tm値は、例えば、40~70℃、50~70℃、55~70℃、45~65℃、50~65℃、55~65℃、45~60℃又は50~65℃である。具体的には、デザイン条件のうち、Tm値は、40~70℃、45~65℃、50~65℃、50~60℃、55~65℃又は55~60℃である。
【0126】
前記デザイン条件のうち、長さは、例えば、15~60ヌクレオチド、15~50ヌクレオチド、15~45ヌクレオチド、15~40ヌクレオチド、15~35ヌクレオチド、15~30ヌクレオチド、15~25ヌクレオチド、18~45ヌクレオチド、18~40ヌクレオチド、18~35ヌクレオチド、18~30ヌクレオチド又は18~25ヌクレオチドである。具体的には、デザイン条件のうち、長さは、15~40ヌクレオチド、16~40ヌクレオチド、17~40ヌクレオチド、18~40ヌクレオチド、15~35ヌクレオチド、16~35ヌクレオチド、17~35ヌクレオチド、18~35ヌクレオチド、15~30ヌクレオチド、16~30ヌクレオチド、17~30ヌクレオチド、18~30ヌクレオチド、18~25ヌクレオチド又は17~25ヌクレオチドである。
【0127】
前記デザイン条件のうち、G-ラン配列は、例えば、5個以上のG-ラン配列排除である。
【0128】
前記プライマーが本出願人によって開発されたDPOプライマー(参照:米国特許第8092997号)である場合には、前記特許文献に開示されたDPOプライマーのTm及び長さに関する説明が前記デザイン条件として提示されてよい。
【0129】
より具体的には、前記プライマーデザイン条件は、上述した条件のうち少なくとも2個、より具体的には少なくとも3個の条件を含む。
【0130】
本発明の一具現例によれば、前記方法は、前記段階(f)後に、次の段階をさらに含む:
(f-1)前記プライマー候補群に含まれるプライマーのうち、プライマーをデザインした開始位置が同一であるプライマーに対して、次の整列基準のうち少なくとも一つの基準によって順位(rank)を付与して整列する段階;及び
(f-2)前記整列されたプライマーをデザインした開始位置が同一であるプライマーの中から最上位プライマーを選別する段階;を含み、前記整列基準は次を含む:
(i)前記プライマーに導入された縮退性塩基及び/又はユニバーザル塩基の使用個数又は比率;前記使用個数又は比率が少ないほど順位が高く、
(ii)縮退性塩基の導入によって生成されるプライマーのパターン数;前記パターン数が少ないほど順位が高く、
(iii)(A)n、(T)n、又は(C)nモノヌクレオチドラン(mononucleotide run)配列の個数;前記配列の個数が少ないほど順位が高く、
(iv)前記プライマーがホモダイマーを形成する場合に、ホモダイマーの形成に関与する連続したヌクレオチドの個数又は比率;前記個数又は比率が小さいほど順位が高く、
(v)ヘアピン構造形成自由エネルギー値(ΔG値);前記自由エネルギー値が大きいほど順位が高く、
(vi)Tm値;前記Tm値が大きいほど順位が高く、
(vii)GCコンテンツ;前記GCコンテンツが高いほど順位が高く、及び
(viii)長さ;前記長さが短いほど順位が高い。
【0131】
本具現例は、前記プライマー候補群に含まれるプライマーのうち、プライマーをデザインした開始位置が同一であるプライマーに対して順位を付与して整列した後、その中から最上位プライマーを選定する過程である。前記プライマー候補群に含まれるプライマーのうち、プライマーをデザインした開始位置が同一であるプライマーが変異ターゲット核酸配列内のプライマーデザイン位置別にそれぞれ存在するはずであり、よって、各デザイン位置別に最上位プライマーが選定される。
【0132】
本具現例によれば、前記段階(f-1)で前記プライマー候補群に含まれるプライマーのうち、プライマーをデザインした開始位置が同一であるプライマーを少なくとも1個(具体的には、(i)番の整列基準)、具体的には少なくとも2個、より具体的には少なくとも3個、少なくとも4個、少なくとも5個、少なくとも6個、少なくとも7個又は少なくとも8個、最も具体的には8個の順位を考慮した整列基準を満たすように整列する。
【0133】
前記プライマー候補群に含まれるプライマーのうち、プライマーをデザインした開始位置が同一であるプライマーを整列する方法は、大きく、2つの方式があり得る:
第一の方式によれば、前記少なくとも2個の整列基準は重要度(criticality)が異なり、重要度が最も高い整列基準(例えば、(i)番の整列基準)を満たすようにプライマーを整列できる。
【0134】
万一、重要度が最も高い整列基準を満たすプライマーが複数個である場合に、次順位の整列基準を満たすようにプライマーを整列できる。
【0135】
例えば、整列基準の重要度が(i)、(ii)、(iii)、(iv)、(v)、(vi)、(vii)及び(viii)の順序である場合に、(i)番の整列基準を満たすプライマーが3個であれば、この3個のプライマーを(ii)番の整列基準にしたがって整列する。万一、(ii)番の整列基準を満たすプライマーが3個であれば、(iii)番の整列基準を満たすようにプライマーを整列し、最上位のオリゴヌクレオチドをプライマー候補群として選定できる。
【0136】
第二の方式によれば、整列基準に互いに異なるウェイト(weight)を割り当て、それぞれの整列基準における値(又は、値の範囲)にスコアを割り当て、それに対する順位を考慮すると、それぞれのプライマーの総スコアを得ることができ、この計算された総スコアを考慮してプライマーを整列でき、総スコアによる順位によって最上位のプライマーをプライマー候補群として選定できる。
【0137】
本発明の一具現例によれば、前記少なくとも2個の整列基準は重要度(criticality)が異なり、本発明の方法は、前記重要度を考慮した前記少なくとも2個の整列基準を満たすように、前記プライマー候補群に含まれるプライマーのうち、プライマーをデザインした開始位置が同一であるプライマーを整列する段階をさらに含む。
【0138】
(段階(g):プローブ及びプライマーの組合せを提供)
前記第3プローブ候補群及びプライマー候補群を組み合わせてプローブ及びプライマーの組合せを提供する。
【0139】
万一、PTOCE、VD-PTOCE及びTaqManプローブ方法のようにプローブとプライマーの適切な組合せを用いてターゲット核酸配列における関心ヌクレオチド変異の検出を実施する場合には、プローブ及びプライマーそれ自体の優れた特性も重要であるが、関心ヌクレオチド変異の検出におけるプローブ及びプライマー間のパートナーシップも重要である。
【0140】
例えば、プライマーは、選別したプローブを基準にしてアップストリーム及びダウンストリームに位置しているとともに、適切な大きさ(具体的には100~1000、より具体的には200~800、さらに具体的には300~700、特に具体的には300~500、とりわけ具体的には300~400ヌクレオチド)のアンプリコンを生成可能でなければならない。
【0141】
また、プライマーは、プローブとの干渉(interference)がないことが好ましい。このような干渉の代表的な現象は、ダイマー形成である。プライマー及びプローブが優れた特性を有しても、プライマーがプローブとヘテロダイマーを形成すると前記プライマーは適切なプライマーになり得ない。
【0142】
プライマーは、プローブに比べてTm値が低いことが好ましい。例えば、プライマーのTm値はプローブと関連して[55℃ to(プローブのTm minus 10℃)℃]の範囲にあることが好ましい。
【0143】
本発明の一具現例によれば、前記第3プローブ候補群に含まれたプローブの中から最上位プローブを選択し、前記プライマー候補群に含まれたプライマーの中から前記最上位プローブに適合するプライマーを選択する。前記用語「適合する」とは、選択したプローブと関連して、プライマーと前記プローブがヘテロダイマーを形成しないこと、所望する大きさのアンプリコンを形成すること、及び[55℃ to(プローブのTm minus 10℃)℃]のTm値を有すること、のうち少なくともいずれか一つの特性を有することを意味する。
【0144】
例えば、本発明によって実施して選別されたプローブを含む第3プローブ候補群及びプライマーを含むプライマー候補群が提供された場合に、前記第3プローブ候補群の中から最上位プローブを選択し、このプローブに適合する最上位プライマーを前記プライマー候補群から選択する。万一、最上位プローブに適合するプライマーが前記プライマー候補群にない場合には、次上位プローブに対して適合するプライマーを前記プライマー候補群から選択し、この次上位プローブとプライマーとの組合せがターゲット核酸配列における関心ヌクレオチド変異の検出用オリゴヌクレオチドとして用いられる。
【0145】
本発明において、プライマーは、プローブと関連して次の適合性によって選択できる:第一に、プライマーがプローブとヘテロダイマーを形成する場合に、ヘテロダイマーの形成に関与する連続したヌクレオチドの比率が65%以下(具体的には60%以下、より具体的に55%以下、さらに具体的には50%以下、特に具体的には40%以下)であれば、適合性を満たすものと判断されてよい。第二に、プライマーが適切な大きさ(具体的には100~1000、より具体的には200~800、さらに具体的には300~700、特に具体的には300~500、とりわけ具体的には300~400ヌクレオチド)のアンプリコンを生成すれば、適合性を満たすものと判断されてよい。第三に、プライマーのTm値が[55℃ to(プローブのTm minus 10℃)℃]である場合に、適合性を満たすものと判断されてよい。
【0146】
本明細書において、オリゴヌクレオチドを言及しながら使われる用語「提供」は、オリゴヌクレオチドの配列情報の提示(providing)及びオリゴヌクレオチド物質の製造を含む。
【0147】
本発明の一具現例によれば、前記プローブは、前記変異ターゲット核酸配列に非混成化ヌクレオチド配列を含むタギング部位を追加に含むタギングプローブである。前記プローブは、タギング部位を追加に含むタギングプローブであってよい。
【0148】
このようなタギングプローブの代表の例は、PTOCE方法に用いられるPTO、又はVD-PTOCE方法に用いられるPTO-NVであってよい。
【0149】
タギングプローブは、プローブのデザイン条件の他にも、タギング部位のデザイン条件を満たすようにタギング部位をデザインする。
【0150】
本発明の一具現例によれば、前記タギングプローブのタギング部位は、次の条件のうち少なくとも一つの条件を満たすようにデザインされる:(i)6~30ヌクレオチドのタギング部位の長さ、(ii)タギング部位の長さに対して30%以上ミスマッチング配列を含むこと、及び(iii)タギング部位3’末端部位の長さに対して40%以上ミスマッチング配列を含むこと。
【0151】
前記タギング部位の長さは、具体的には、6~20ヌクレオチド、10~30ヌクレオチド、10~20ヌクレオチド、12~30ヌクレオチド又は12~20ヌクレオチドである。
【0152】
前記タギング部位は、タギングプローブが混成化される変異ターゲット核酸配列の特定地域に対して十分に非相補性を有することにより、タギングプローブのプローブ(ターゲッティング部位)が混成化される条件で前記特定地域に混成化されてはならない。具体的には、タギング部位は、その長さに対して30%以上、40%以上、又は50%以上のミスマッチング配列を含む。具体的には、タギング部位の3’末端部位は、その長さに対して40%以上又は50%以上のミスマッチング配列を含む。
【0153】
タギング部位の3’末端部位の長さは、例えば、3~8ヌクレオチド、3~7ヌクレオチド、3~6ヌクレオチド、3~5ヌクレオチド、3~4ヌクレオチド、4~8ヌクレオチド、4~7ヌクレオチド、4~6ヌクレオチド又は4~5ヌクレオチドの長さを有してよい。
【0154】
〔記録媒体、装置及びプログラム〕
本発明の他の態様によれば、本発明は、ターゲット核酸配列における関心ヌクレオチド変異を検出するために用いられるオリゴヌクレオチドを提供するための方法を実行するためのプロセッサを具現する指示を含むコンピュータ可読記録媒体であって、前記方法は次の段階を含む:(a)野生型ターゲット核酸配列及び関心ヌクレオチド変異に関する情報を入力する段階;前記野生型ターゲット核酸配列は、関心ヌクレオチド変異を含まないターゲット核酸配列であり、前記情報は、(i)野生型ターゲット核酸配列、(ii)前記野生型ターゲット核酸配列内で発生した前記関心ヌクレオチド変異の位置、及び(iii)前記関心ヌクレオチド変異の位置における野生型塩基及び変異塩基に関する情報を含み、前記関心ヌクレオチド変異の位置は開始位置及び終了位置と表示され、(b)前記入力された情報を用いて前記野生型ターゲット核酸配列及び変異ターゲット核酸配列を提供する段階;前記変異ターゲット核酸配列は、関心ヌクレオチド変異を含むターゲット核酸配列であり、前記野生型及び変異ターゲット核酸配列は、正方向及び逆方向の野生型及び変異ターゲット核酸配列をそれぞれ含み、(c)前記変異ターゲット核酸配列内の前記関心ヌクレオチド変異を含む所定の領域で前記関心ヌクレオチド変異を検出するために用いられるオリゴヌクレオチドをデザインし、前記変異ターゲット核酸配列に対する第1オリゴヌクレオチド候補群を提供する段階;(d)前記変異ターゲット核酸配列に対する第1オリゴヌクレオチド候補群に含まれるオリゴヌクレオチドと前記野生型ターゲット核酸配列とのマッチング有無を分析し、次の選別基準を満たすオリゴヌクレオチドを、前記変異ターゲット核酸配列に対する第2オリゴヌクレオチド候補群として提供する段階;前記選別基準は、(i)前記野生型ターゲット核酸配列とオリゴヌクレオチドの5’末端、中央又は3’末端の所定の領域とのミスマッチが1個以上存在すること;又は、(ii)前記野生型ターゲット核酸配列とオリゴヌクレオチドとのミスマッチが所定の比率以上であること;を含み、及び(e)前記変異ターゲット核酸配列に対する第2オリゴヌクレオチド候補群からオリゴヌクレオチドを選別して第3オリゴヌクレオチド候補群を提供する段階;前記第3オリゴヌクレオチド候補群は、前記ターゲット核酸配列における関心ヌクレオチド変異を検出するために用いられる。
【0155】
本発明のさらに他の態様によれば、本発明は、ターゲット核酸配列における関心ヌクレオチド変異を検出するために用いられるオリゴヌクレオチドを提供するための方法を実行するためのプロセッサを具現する、コンピュータ可読記録媒体に記憶されるコンピュータプログラムを提供し、前記方法は次の段階を含む:(a)野生型ターゲット核酸配列及び関心ヌクレオチド変異に関する情報を入力する段階;前記野生型ターゲット核酸配列は、関心ヌクレオチド変異を含まないターゲット核酸配列であり、前記情報は、(i)野生型ターゲット核酸配列、(ii)前記野生型ターゲット核酸配列内で発生した前記関心ヌクレオチド変異の位置、及び(iii)前記関心ヌクレオチド変異の位置における野生型塩基及び変異塩基に関する情報を含み、前記関心ヌクレオチド変異の位置は開始位置及び終了位置と表示され、(b)前記入力された情報を用いて前記野生型ターゲット核酸配列及び変異ターゲット核酸配列を提供する段階;前記変異ターゲット核酸配列は、関心ヌクレオチド変異を含むターゲット核酸配列であり、前記野生型及び変異ターゲット核酸配列は、正方向及び逆方向の野生型及び変異ターゲット核酸配列をそれぞれ含み、(c)前記変異ターゲット核酸配列内の前記関心ヌクレオチド変異を含む所定の領域で前記関心ヌクレオチド変異を検出するために用いられるオリゴヌクレオチドをデザインし、前記変異ターゲット核酸配列に対する第1オリゴヌクレオチド候補群を提供する段階;(d)前記変異ターゲット核酸配列に対する第1オリゴヌクレオチド候補群に含まれるオリゴヌクレオチドと前記野生型ターゲット核酸配列とのマッチング有無を分析し、次の選別基準を満たすオリゴヌクレオチドを、前記変異ターゲット核酸配列に対する第2オリゴヌクレオチド候補群として提供する段階;前記選別基準は、(i)前記野生型ターゲット核酸配列とオリゴヌクレオチドの5’末端、中央又は3’末端の所定の領域とのミスマッチが1個以上存在すること;又は、(ii)前記野生型ターゲット核酸配列とオリゴヌクレオチドとのミスマッチが所定の比率以上であること;を含み、及び(e)前記変異ターゲット核酸配列に対する第2オリゴヌクレオチド候補群からオリゴヌクレオチドを選別して第3オリゴヌクレオチド候補群を提供する段階;前記第3オリゴヌクレオチド候補群は、前記ターゲット核酸配列における関心ヌクレオチド変異を検出するために用いられる。
【0156】
本発明の他の態様によれば、本発明は、(a)コンピュータプロセッサ、及び(b)前記コンピュータプロセッサにカップリングされた前記本発明のコンピュータ可読記録媒体を含む、ターゲット核酸配列における関心ヌクレオチド変異を検出するために用いられるオリゴヌクレオチドを提供するための装置を提供する。
【0157】
本発明の記録媒体、装置及びコンピュータプログラムは、上述した本発明の方法をコンピュータで実施可能にしたものであり、これらに共通する内容は、反復記載による本明細書の過度な複雑性を避けるためにその記載を省略する。
【0158】
プログラム指示は、プロセッサによって実行される時に、プロセッサが上述の本発明の方法を実行するようにする。ターゲット核酸配列における関心ヌクレオチド変異を検出するために用いられるオリゴヌクレオチドを提供するための方法を実行するプログラム指示は、次の指示を含むことができる:(i)野生型ターゲット核酸配列及び関心ヌクレオチド変異に関する情報を入力するようにする指示;(ii)前記入力された情報を用いて前記野生型ターゲット核酸配列及び変異ターゲット核酸配列を提供するようにする指示;(iii)前記変異ターゲット核酸配列内の前記関心ヌクレオチド変異を含む所定の領域で前記関心ヌクレオチド変異を検出するために用いられるオリゴヌクレオチドをデザインし、前記変異ターゲット核酸配列に対する第1オリゴヌクレオチド候補群を提供するようにする指示;(iv)前記変異ターゲット核酸配列に対する第1オリゴヌクレオチド候補群に含まれるオリゴヌクレオチドと前記野生型ターゲット核酸配列とのマッチング有無を分析し、所定の選別基準を満たすオリゴヌクレオチドを、前記変異ターゲット核酸配列に対する第2オリゴヌクレオチド候補群として提供するようにする指示;(v)前記変異ターゲット核酸配列に対する第2オリゴヌクレオチド候補群からオリゴヌクレオチドを選別して第3オリゴヌクレオチド候補群を提供(例えば、出力装置にディスプレイ)するようにする指示。
【0159】
本発明の方法はプロセッサで実行され、前記プロセッサは、独立実行型コンピュータ(stand alone computer)、ネットワーク付着コンピュータ又は実時間PCR装置のようなデータ取得装置にあるプロセッサであってよい。
【0160】
コンピュータ可読記録媒体は、当業界に公知された様々な記憶媒体、例えば、CD-R、CD-ROM、DVD、フラッシュメモリ、フロッピーディスク、ハードドライブ、ポータブルHDD、USB、マグネチックテープ、MINIDISC、不揮発性メモリカード、EEPROM、光学ディスク、光学記憶媒体、RAM、ROM、システムメモリ及びウェブサーバーを含むが、これに限定されるものではない。
【0161】
ターゲット核酸配列における関心ヌクレオチド変異を検出するために用いられるオリゴヌクレオチドは様々な方式で提供されてよい。例えば、オリゴヌクレオチドは、ネットワーク連結(例えば、LAN、VPN、インターネット及びイントラネット)又は直接連結(例えば、USB又は他の直接有線連結又は無線連結)によってデスクトップコンピュータシステムのような別途のシステムに提供されてよく、又は、CD、DVD、フロッピーディスク及びポータブルHDDのようなポータブル媒体上に提供されてよい。類似に、オリゴヌクレオチドは、ノートパソコン又はデスクトップコンピュータシステムのようなクライアントにネットワーク連結(例えば、LAN、VPN、インターネット、イントラネット及び無線通信ネットワーク)を通じてサーバーシステムに供されてよい。
【0162】
本発明を実行するプロセッサを具現する指示は、ロジックシステムに含まれてよい。前記指示は、たとえソフトウェア記録媒体(例えば、ポータブルHDD、USB、フロッピーディスク、CD及びDVD)に提供され得るが、ダウンロード可能であり、メモリモジュール(例えば、ハードドライブ又はローカル又は組込RAM又はROMのような他のメモリ)に保存されてよい。本発明を実行するコンピュータコードは、C、C++、Java、Visual Basic、VBScript、JavaScript、Perl及びXMLのような様々なコーディング言語で実行されてよい。また、様々な言語及びプロトコルは、本発明に係る信号と命令の外部及び内部保存と伝達に用いられてよい。
【0163】
コンピュータプロセッサは、一つのプロセッサが上述したパフォーマンスを全て果たし得るように構築されてよい。あるいは、プロセッサユニットは複数個のプロセッサがそれぞれのパフォーマンスを実行するように構築されてよい。
【発明の効果】
【0164】
本発明の特徴及び利点を要約すれば、次の通りである:
(a)置換、逆転、挿入、欠失、反復又はその組合せのような関心ヌクレオチド変異を検出するためのオリゴヌクレオチドをデザインするために、従来方法によれば、ヌクレオチド変異のタイプ、変異の大きさ、及び検出するターゲットが野生型及び/又は変異配列であるか否かを考慮し、このような考慮事項別に様々なデザイン規則及びモジュールを開発しなければならない問題点があった。また、このような従来方法によれば、配列のコンテンツを考慮しないでオリゴヌクレオチドをデザインする場合に、野生型ターゲット核酸配列と変異ターゲット核酸配列を区別できない問題点がある一方、このような配列のコンテンツを考慮するとデザイン規則が複雑になる不具合があった。
【0165】
(b)これに対し、本発明は、野生型ターゲット核酸配列及び関心ヌクレオチド変異に関する情報を入力し、前記入力された情報を用いて野生型及び変異ターゲット核酸配列を提供し、前記変異ターゲット核酸配列に対するオリゴヌクレオチドをデザインした後、前記デザインされたオリゴヌクレオチドと野生型ターゲット核酸配列とのマッチング有無を分析し、所定の選別基準を満たすオリゴヌクレオチドを選別して提供することによって、ターゲット核酸配列における関心ヌクレオチド変異を検出するために用いられるオリゴヌクレオチドを効果的に提供することができる。
【0166】
(c)そして、本発明は、ヌクレオチド変異のタイプ、変異の大きさ、検出するターゲットが野生型及び/又は変異配列であるか否か、及び配列コンテンツなどを考慮して細部デザイン規則及びモジュールを開発する必要無しに、統合的なデザイン規則に基づいてヌクレオチド変異を検出可能なオリゴヌクレオチドを提供することができる。
【図面の簡単な説明】
【0167】
【
図1】本発明の一具現例によってターゲット核酸配列における関心ヌクレオチド変異を検出するために用いられるオリゴヌクレオチドを提供する過程を示すフローチャートである。
【
図2】本発明の一具現例によって野生型ターゲット核酸配列及び関心ヌクレオチド変異に関する情報を入力するUI(User Interface)を示す図である。
【発明を実施するための形態】
【0168】
以下、実施例を用いて本発明をより詳細に説明する。これらの具現例は単に本発明をより具体的に説明するためのものであり、本発明の要旨によって本発明の範囲がこれらの具現例に限定されないということは、本発明の属する技術の分野における通常の知識を有する者にとって明らかであろう。
【実施例】
【0169】
〔実施例1:ヒト遺伝子ApoEで変異(T112C,TからCへの置換)を検出するために用いられるオリゴヌクレオチドの提供〕
ターゲット核酸配列における関心ヌクレオチド変異を検出するために用いられるオリゴヌクレオチドを提供するプログラム(HMOD)を実行し、ヒト遺伝子ApoEで置換変異(T112C)を検出するために用いられるオリゴヌクレオチドを提供した。
【0170】
(ApoE遺伝子の野生型ターゲット核酸配列及び置換変異(T112C)に関する情報入力)
HMODプログラムのユーザインターフェース(User Interface;UI)ウィンドウ(
図2)に、HMODプログラムの駆動のためのApoE遺伝子の野生型ターゲット核酸配列及び置換変異(T112C)に関する情報を入力した。具体的には、
図2のUIのGene NameにApoE、Gene Abb.にApoE、Mutation NameにT112C、Mutation Abb.にT112C、Analyte TypeにMutant、Mutation Typeにsubstitution、Mutation Position InfoのStartに501及びEndに501、Sequence VariantsのWildにT及びMutantにC、Acc.IDにNC_018930.2、及びSequenceに下表1に記載の配列を入力し、HMODプログラムを実行した。前記Mutation Position InfoのStart及びEndに入力された関心ヌクレオチド変異の開始位置及び終了位置は、下表1に記載された野生型ターゲット核酸配列における位置を表す。
【0171】
【0172】
上記表1で太字で記載された塩基Tは、前記配列において501番目の位置であり、置換変異T112Cは、前記配列の501番目の位置の塩基Tが塩基Cに置換される変異を表す。
【0173】
HMODプログラムを実行して次のような順序で進行した:
(野生型及び変異ターゲット核酸配列の提供)
前記入力された情報を用いてオリゴヌクレオチドをデザインし、変異ターゲット核酸配列に対してデザインされたオリゴヌクレオチドが野生型ターゲット核酸配列と区別検出可能であることを確認するためのテンプレートとして用いる正方向及び逆方向の野生型及び変異ターゲット核酸配列を作製した。
【0174】
前記正方向及び逆方向の野生型及び変異ターゲット核酸配列は下表2に整理した:
【0175】
【0176】
(第1プローブ候補群の提供)
変異ターゲット核酸配列内関心ヌクレオチド変異を検出するために用いられるプローブは、次の条件を満たすようにデザインした:(i)10~60ヌクレオチドの長さ、(ii)50~85℃のTm値、(iii)3個以上のG-ラン配列排除、及び(iv)5’末端部位のGCコンテンツは40%以上。
【0177】
具体的には、前記提供された正方向変異ターゲット核酸配列内関心ヌクレオチド変異(塩基C)の開始位置501を基準にしてアップストリームに2bpの位置にある499位置から関心ヌクレオチド変異の終了位置である501までの各位置で長さ別(所定の長さ:17~35mer)にプローブをデザインし、これを第1プローブ候補群として提供した。また、前記提供された逆方向変異ターゲット核酸配列内関心ヌクレオチド変異(塩基G)の開始位置639を基準にしてアップストリームに2bpの位置にある637位置から関心ヌクレオチド変異の終了位置である639までの各位置で長さ別(所定の長さ:17~35mer)にプローブをデザインし、これを第1プローブ候補群として提供した。正方向及び逆方向変異ターゲット核酸配列においてデザインされたプローブは、114個であり、そのうち、19及び20merを有する正方向プローブを下表3に整理した。
【0178】
【0179】
(第2プローブ候補群の提供)
前記変異ターゲット核酸配列に対してデザインされた第1プローブ候補群に含まれるプローブと前記野生型ターゲット核酸配列とのマッチング有無を分析し、次の選別基準を満たすプローブを、前記変異ターゲット核酸配列に対する第2プローブ候補群として提供した。前記選別基準は次の通りである:(i)前記野生型ターゲット核酸配列とプローブの5’末端にミスマッチが1個存在すること;又は、(ii)前記野生型ターゲット核酸配列とプローブの最小ミスマッチの個数がプローブ配列に対して30%以上であること。
【0180】
第1プローブ候補群に含まれたプローブのうち、前記選別基準を満たすプローブは10個だったし、そのうち5個のプローブのみを下表4に整理した。
【0181】
【0182】
そして、前記10個のプローブを、下の整列基準によって順位を付与して整列した:(i)前記マッチング有無の分析の結果、プローブの内の最小ミスマッチの位置;前記最小ミスマッチの位置がプローブの5’末端に近いほど順位が高く、(ii)前記マッチング有無の分析の結果、プローブの最小ミスマッチの個数;前記最小ミスマッチの個数が大きいほど順位が高く、(iii)プローブのTm値;前記Tm値が大きいほど順位が高く、(iv)プローブの5’末端の所定の領域のGCコンテンツ;前記GCコンテンツが高いほど順位が高く、(v)プローブに含まれる連続G塩基の個数;前記連続G塩基の個数が少ないほど順位が高く、(vi)前記プローブがホモダイマーを形成する場合に、ホモダイマーの形成に関与する連続したヌクレオチド個数又は比率;前記個数又は比率が小さいほど順位が高く、(vii)ヘアピン構造形成自由エネルギー値(ΔG値);自由エネルギー値が大きいほど順位が高く、(viii)長さ:長さが短いほど順位が高い。
【0183】
(第3プローブ候補群の提供)
前記第2プローブ候補群に含まれるプローブのうち、プローブをデザインした開始位置が同じプローブのうち、前記整列基準による順位において最上位のプローブを第3プローブ候補群として提供したし、前記10個の第2プローブ候補群のうち2個の第3プローブ候補群が選別され、その結果は下表5に整理した:
【0184】
【0185】
(プライマー候補群の提供)
前記変異ターゲット核酸配列内の前記関心ヌクレオチド変異を含む所定の領域を増幅するようにプライマーをデザインし、前記変異ターゲット核酸配列に対するプライマー候補群を提供した。具体的には、前記関心ヌクレオチド変異を含む所定を領域を増幅するようにデザインするプライマーのデザイン範囲は、前記関心ヌクレオチド変異の開始位置のアップストリームに300bp乃至前記関心ヌクレオチド変異の終了位置のダウンストリームに300bpまでの領域内から選択された。そして、前記デザインされるプライマーは次の条件を満たすようにデザインされた:(i)40~70℃のTm値、(ii)15~50bpヌクレオチドの長さ、及び(iii)5個以上のG-ラン配列排除。
【0186】
そして、前記プライマー候補群に含まれるプライマーのうち、プライマーをデザインする開始位置が同一であるプライマーに対して、次の整列基準によって順位(rank)を付与して整列し、最上位オリゴヌクレオチドを選別した:(i)前記プライマーに導入された縮退性塩基及び/又はユニバーザル塩基の使用個数又は比率;前記使用個数又は比率が少ないほど順位が高く、(ii)縮退性塩基の導入によって生成されるプライマーのパターン数;前記パターン数が少ないほど順位が高く、(iii)(A)n、(T)n、又は(C)nモノヌクレオチドラン(mononucleotide run)配列の個数;前記配列の個数が少ないほど順位が高く、(iv)前記プライマーがホモダイマーを形成する場合に、ホモダイマーの形成に関与する連続したヌクレオチド個数又は比率;前記個数又は比率が小さいほど順位が高く、(v)ヘアピン構造形成自由エネルギー値(ΔG値);前記自由エネルギー値が大きいほど順位が高く、(vi)Tm値;前記Tm値が大きいほど順位が高く、(vii)GCコンテンツ;前記GCコンテンツが高いほど順位が高く、及び(viii)長さ;前記長さが短いほど順位が高い。
【0187】
その結果、プライマー候補群として12289個のプライマーがデザインされ、これらのデザインされたプライマーのうち、プライマーをデザインした開始位置が同一であるプライマーの中から最上位のプライマーは103個が選定され、選定された最上位プライマーの例は下表6に整理した:
【0188】
【0189】
(プローブ及びプライマーの組合せ)
前記選定された第3プローブ候補群及びプライマー候補群を組み合わせてプローブ及びプライマーの組合せを提供した。具体的には、前記選定された2個のプローブと103個のプライマーを組み合わせて300~350bpのアンプリコンを生成しながら組み合わせられるプローブ及びプライマー間にダイマーが生成されない組合せを10個生成し、これらのうち3つの組合せの例を下表7に整理した:
【0190】
【0191】
〔実施例2:ヒト遺伝子HBBで変異(FS89、塩基Cの挿入)を検出するために用いられるオリゴヌクレオチドの提供〕
実施例1と同じプログラム(HMOD)を行って、ヒト遺伝子HBBにおいて挿入(insertion)変異を検出するために用いられるオリゴヌクレオチドを提供した。
【0192】
(HBB遺伝子の野生型ターゲット核酸配列及び挿入変異に関する情報入力)
HMODプログラムのユーザインターフェース(User Interface;UI)ウィンドウ(
図2)に、HMODプログラムの駆動のためのHBB遺伝子の野生型ターゲット核酸配列及び挿入変異に関する情報を入力した。具体的には、
図2のUIのGene NameにHBB、Gene Abb.にHBB、Mutation NameにFS89、Mutation Abb.にFS89、Analyte TypeにMutant、Mutation Typeにinsertion、Mutation Position InfoのStartに396及びEndに396、Sequence VariantsのWildにC及びMutantにCC、Acc.IDにNG_046672.1、及びSequenceに下表8に記載された配列を入力し、HMODプログラムを実行した。前記Mutation Position InfoのStart及びEndに入力された関心ヌクレオチド変異の開始位置及び終了位置は、下表8に記載された野生型ターゲット核酸配列における位置を表す。
【0193】
【0194】
上記表8で、太字で記載された塩基Cは、前記配列において396位置であり、挿入変異FS89は、前記配列の396位置と397位置との間に塩基Cが挿入される変異を表す。
【0195】
HMODプログラムを実行して次のような順序で進行した:
(野生型及び変異ターゲット核酸配列の提供)
前記実施例1と同一に正方向及び逆方向の野生型及び変異ターゲット核酸配列を作製し、その結果を下表9に整理した:
【0196】
【0197】
(第1プローブ候補群の提供)
実施例1と同じ方法により、前記提供された正方向変異ターゲット核酸配列内関心ヌクレオチド変異(塩基C)の開始位置396を基準にしてアップストリームに2bpの位置にある394位置から関心ヌクレオチド変異の終了位置である397までの各位置で長さ別(所定の長さ:17~35mer)にプローブをデザインし、これを第1プローブ候補群として提供した。また、前記提供された逆方向変異ターゲット核酸配列内関心ヌクレオチド変異(塩基G)の開始位置312を基準にしてアップストリームに2bpの位置にある310位置から関心ヌクレオチド変異の終了位置である313までの各位置で長さ別(所定の長さ:17~35mer)にプローブをデザインし、これを第1プローブ候補群として提供した。正方向及び逆方向変異ターゲット核酸配列においてデザインされたプローブは152個であり、それらのうち、19及び20merを有する正方向プローブを下表10に整理した。
【0198】
【0199】
(第2プローブ候補群の提供)
前記実施例1と同じ方法及び選別基準によって前記変異ターゲット核酸配列に対する第2プローブ候補群を提供した。
【0200】
第1プローブ候補群に含まれたプローブのうち、前記選別基準を満たすプローブは43個だったし、そのうち5個のプローブのみを下表11に整理した。
【0201】
【0202】
そして、前記43個のプローブを、前記実施例1の整列基準によって順位を付与して整列した。
【0203】
(第3プローブ候補群の提供)
前記実施例1と同じ方法により、前記第2プローブ候補群に含まれるプローブのうち、プローブをデザインした開始位置が同一であるプローブの中から最上位のプローブを第3プローブ候補群として提供したし、前記43個の第2プローブ候補群のうち5個の第3プローブ候補群が選別され、その結果を下表12に整理した:
【0204】
【0205】
(プライマー候補群の提供)
前記実施例1と同じ方法、デザイン条件及び整列基準によってプライマー候補群を提供した。
【0206】
その結果、プライマー候補群として12287個のプライマーがデザインされ、前記デザインされたプライマーのうち、プライマーをデザインした開始位置が同一であるプライマーの中から最上位のプライマーは190個が選定され、選定された最上位プライマーの例は下表13に整理した:
【0207】
【0208】
(プローブ及びプライマーの組合せ)
前記実施例1と同じ方法により、前記選定された第3プローブ候補群及びプライマー候補群を組み合わせてプローブ及びプライマーの組合せを提供した。具体的には、前記選定された5個のプローブと190個のプライマーを組み合わせて300~350bpのアンプリコンを生成しながら組み合わせられるプローブ及びプライマー間にダイマーが生成されない組合せを10個生成した、それらのうち3つの組合せの例を下表14に整理した:
【0209】
【0210】
以上、本発明の特定の部分を詳細に記述したところ、当業界における通常の知識を有する者にとって、このような具体的な技術は単に好ましい具現例に過ぎず、これに本発明の範囲が限定されない点は明らかである。したがって、本発明の実質的な範囲は、添付する請求項とその等価物によって定義されるといえよう。
【配列表】
【国際調査報告】