IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ エンテローム エスエーの特許一覧

特表2023-514064ヒトマイクロバイオームメタセクレトームタンパク質に由来する薬剤候補の同定及び合成
<>
  • 特表-ヒトマイクロバイオームメタセクレトームタンパク質に由来する薬剤候補の同定及び合成 図1
  • 特表-ヒトマイクロバイオームメタセクレトームタンパク質に由来する薬剤候補の同定及び合成 図2
  • 特表-ヒトマイクロバイオームメタセクレトームタンパク質に由来する薬剤候補の同定及び合成 図3
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-04-05
(54)【発明の名称】ヒトマイクロバイオームメタセクレトームタンパク質に由来する薬剤候補の同定及び合成
(51)【国際特許分類】
   C12N 15/31 20060101AFI20230329BHJP
   C40B 40/02 20060101ALI20230329BHJP
   C07K 14/195 20060101ALI20230329BHJP
   A61K 48/00 20060101ALI20230329BHJP
   A61P 37/02 20060101ALI20230329BHJP
   A61P 5/00 20060101ALI20230329BHJP
   A61K 38/19 20060101ALI20230329BHJP
   A61K 38/20 20060101ALI20230329BHJP
   A61K 38/18 20060101ALI20230329BHJP
   A61K 38/16 20060101ALI20230329BHJP
   A61K 38/22 20060101ALI20230329BHJP
   G01N 33/50 20060101ALI20230329BHJP
   G01N 33/68 20060101ALI20230329BHJP
   G16B 30/00 20190101ALI20230329BHJP
   C07K 1/00 20060101ALI20230329BHJP
   C40B 40/10 20060101ALI20230329BHJP
   C40B 40/08 20060101ALI20230329BHJP
【FI】
C12N15/31
C40B40/02 ZNA
C07K14/195
A61K48/00
A61P37/02
A61P5/00
A61K38/19
A61K38/20
A61K38/18
A61K38/16
A61K38/22
G01N33/50 P
G01N33/68
G16B30/00
C07K1/00
C40B40/10
C40B40/08
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022544650
(86)(22)【出願日】2021-01-22
(85)【翻訳文提出日】2022-08-12
(86)【国際出願番号】 EP2021051523
(87)【国際公開番号】W WO2021148650
(87)【国際公開日】2021-07-29
(31)【優先権主張番号】20305060.4
(32)【優先日】2020-01-24
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
(71)【出願人】
【識別番号】519122286
【氏名又は名称】エンテローム エスエー
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100107515
【弁理士】
【氏名又は名称】廣田 浩一
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】シェーヌ,ローラン
(72)【発明者】
【氏名】ストロッツィ,フランチェスコ
(72)【発明者】
【氏名】ボニー,クリストフ
【テーマコード(参考)】
2G045
4C084
4H045
【Fターム(参考)】
2G045AA40
2G045DA13
2G045DA14
2G045DA36
2G045FB02
2G045FB03
4C084AA13
4C084BA44
4C084CA04
4C084DA01
4C084DA12
4C084DB01
4C084DB52
4C084MA66
4C084NA14
4C084ZB071
4C084ZB072
4C084ZC211
4C084ZC212
4H045AA10
4H045AA30
4H045BA10
4H045CA11
4H045EA20
(57)【要約】
本発明は、ヒトマイクロバイオームメタセクレトームのタンパク質に関する疾患の治療に関し、マイクロバイオーム相互作用、特に、マイクロバイオーム-宿主間相互作用に関する。特に、本発明は、ヒトマイクロバイオームの分泌されたペプチド及びタンパク質を同定するための方法に関する。
【選択図】なし
【特許請求の範囲】
【請求項1】
ヒトマイクロバイオータタンパク質薬剤候補を提供するための方法であって、以下の工程:
(i)複数のヒトマイクロバイオータタンパク質配列及び/又は複数のヒトマイクロバイオータタンパク質をコードする複数の核酸配列を提供することと;
(ii)前記工程(i)で提供された前記配列において、ヒトマイクロバイオータタンパク質薬剤候補の1以上の配列を同定することと;
(iii)前記工程(ii)で同定された前記配列を有する、又は前記工程(ii)で同定された前記配列によってコードされる1以上のヒトマイクロバイオータタンパク質を調製することと、を含み、
前記工程(ii)における、前記ヒトマイクロバイオータタンパク質薬剤候補の前記配列が、以下の基準:
- シグナルペプチドを有する配列、又はシグナルペプチドを有するタンパク質をコードする配列である;
- 20~500アミノ酸長を有する配列、又は20~500アミノ酸長を有するタンパク質をコードする配列である;及び
- 少なくとも2つのシステイン残基及び/又は立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを含む配列、又は少なくとも2つのシステイン残基及び/又は立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを含むタンパク質をコードする配列である、
にしたがって選択されることを特徴とする、方法。
【請求項2】
前記マイクロバイオータが、胃腸管マイクロバイオータ、肺マイクロバイオータ、唾液マイクロバイオータ、精液マイクロバイオータ、皮膚マイクロバイオータ、及び膣マイクロバイオータからなる群から選択されるマイクロバイオータである、請求項1に記載の方法。
【請求項3】
前記マイクロバイオータが、腸マイクロバイオータ及び口腔マイクロバイオータから選択される胃腸管マイクロバイオータである、請求項1又は2に記載の方法。
【請求項4】
前記ヒトマイクロバイオータタンパク質が、細菌タンパク質、古細菌タンパク質、原生生物タンパク質、真菌タンパク質、ウイルスタンパク質、及び/又はファージタンパク質である、請求項1から3のいずれかに記載の方法。
【請求項5】
前記ヒトマイクロバイオータタンパク質が、細菌タンパク質、好ましくは、ヒトの胃腸管マイクロバイオータメタセクレトームのものである、請求項1から4のいずれかに記載の方法。
【請求項6】
前記ヒトマイクロバイオータタンパク質が、ヒトの胃腸管マイクロバイオータの細菌タンパク質である、請求項1から4のいずれかに記載の方法。
【請求項7】
前記工程(i)において、ヒトマイクロバイオータタンパク質配列のデータベース及び/又はヒトマイクロバイオータタンパク質をコードする核酸配列のデータベースが提供される、請求項1から6のいずれかに記載の方法。
【請求項8】
前記マイクロバイオータのデータベースが、複数の宿主個体のマイクロバイオータ配列を含む、請求項7に記載の方法。
【請求項9】
前記マイクロバイオータのデータベースが、複数の宿主個体のマイクロバイオータデータではなく、単一の宿主個体のマイクロバイオータデータを含む、請求項8に記載の方法。
【請求項10】
前記工程(i)が、以下のサブ工程を含む、請求項7から9のいずれかに記載の方法。
(i-a)任意に、単一又は複数の個体のサンプルから、マイクロバイオータタンパク質配列又は核酸配列を同定すること、及び
(i-b)単一又は複数の個体のマイクロバイオータタンパク質配列又は核酸配列を含むデータベースを編集すること。
【請求項11】
前記工程(i-a)におけるサンプルが、便サンプルである、請求項10に記載の方法。
【請求項12】
前記工程(ii)におけるシグナルペプチドの同定が、インシリコで行われる、請求項1から11のいずれかに記載の方法。
【請求項13】
前記工程(ii)におけるシグナルペプチドの同定が、2つの異なる方法を用いることによって行われ、両方の方法にしたがうシグナルペプチドを有する配列又はコードする配列が選択される、請求項1から12のいずれかに記載の方法。
【請求項14】
前記工程(ii)におけるシグナルペプチドの同定が、Phobius及び/又はSignalPを用いることによって行われる、請求項1から13のいずれかに記載の方法。
【請求項15】
前記ヒトマイクロバイオータタンパク質が、20~350アミノ酸長を有する、請求項1から14のいずれかに記載の方法。
【請求項16】
前記ヒトマイクロバイオータタンパク質が、少なくとも2つのシステイン残基を含む、請求項1から15のいずれかに記載の方法。
【請求項17】
前記システイン残基が、前記ヒトマイクロバイオータタンパク質の総アミノ酸の4%超を占める、請求項16に記載の方法。
【請求項18】
前記ヒトマイクロバイオータタンパク質が、偶数個のシステイン残基を含み、例えば、少なくとも1つ又は2つのシステイン対を形成する、請求項16又は17に記載の方法。
【請求項19】
前記ヒトマイクロバイオータタンパク質のシステイン含量が、KAPPAを使用して同定される、請求項16から18のいずれかに記載の方法。
【請求項20】
前記立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントが、システインモチーフ、ジスルフィド架橋、ロイシンリッチリピート、アルファヘリックス、ベータシート、及びコイルからなる群から選択される、請求項1から19のいずれかに記載の方法。
【請求項21】
前記立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントが、ジスルフィド架橋である、請求項1から20のいずれかに記載の方法。
【請求項22】
前記ヒトマイクロバイオータタンパク質が、20~200アミノ酸長を有し、且つ少なくとも2つのシステイン残基を含み、例えば、少なくとも1つのシステイン対を形成する、請求項1から21のいずれかに記載の方法。
【請求項23】
前記ヒトマイクロバイオータタンパク質が、50~150アミノ酸長を有し、且つ少なくとも4つのシステイン残基を含み、例えば、少なくとも2つのシステイン対を形成する、請求項1から22のいずれかに記載の方法。
【請求項24】
前記ヒトマイクロバイオータタンパク質が、20~50アミノ酸長を有し、且つアルファヘリックス、ベータシート、及びコイルからなる群から選択される二次構造エレメントを含む、請求項1から22のいずれかに記載の方法。
【請求項25】
前記工程(ii)において、シグナルペプチドを有する又はコードする配列の同定が、以下の前に行われる、請求項1から24のいずれかに記載の方法。
- 20~500アミノ酸長を有する配列又は20~500アミノ酸長を有する配列をコードする配列の同定;及び/又は
- 少なくとも2つのシステイン残基及び/又は立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを含む配列の同定。
【請求項26】
前記シグナルペプチドの配列が、以下に含まれない、請求項25に記載の方法。
- 20~500アミノ酸長を有する配列又は20~500アミノ酸長を有する配列をコードする配列の同定;及び/又は
- 少なくとも2つのシステイン残基及び/又は立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを含む配列の同定。
【請求項27】
前記工程(ii)において、未知の機能を有するタンパク質又は核酸配列を、好ましくはインシリコ法を用いて、アノテートする、請求項1から26のいずれかに記載の方法。
【請求項28】
前記配列を、HMMSCAN及び/又はPFAMを用いて、アノテートする、請求項27に記載の方法。
【請求項29】
前記工程(ii)において、冗長な配列が、同定され除去される、請求項1から28のいずれかに記載の方法。
【請求項30】
前記工程(ii)において、別の配列と、少なくとも95%、好ましくは少なくとも90%、より好ましくは少なくとも85%、更により好ましくは少なくとも80%、最も好ましくは少なくとも75%の配列同一性を有する配列が、同定され除去される、請求項29に記載の方法。
【請求項31】
CD-HITを使用して冗長な配列を同定する、請求項29又は30に記載の方法。
【請求項32】
前記工程(ii)において、分泌タンパク質のシグナルペプチドが、グラム陰性菌のリポタンパク質と区別される、請求項1から31のいずれかに記載の方法。
【請求項33】
分泌タンパク質のシグナルペプチドを、グラム陰性菌のリポタンパク質から区別する工程が、LipoPを用いて行われる、請求項32に記載の方法。
【請求項34】
前記ヒトマイクロバイオータタンパク質が、ヒト宿主タンパク質の模倣物又は分泌促進物質(secretagogue)であり、例えば、サイトカイン、インターロイキン、ケモカイン、成長因子、神経ペプチド、及びペプチドホルモンからなる群から選択される、請求項1から33のいずれかに記載の方法。
【請求項35】
前記ヒトマイクロバイオータタンパク質が、分泌促進物質である、請求項1から34のいずれかに記載の方法。
【請求項36】
前記分泌促進物質が、ヒト免疫細胞によるインターロイキン-10(IL-10)の分泌を誘導する、請求項35に記載の方法。
【請求項37】
同定された前記タンパク質が、免疫調節性である、請求項1から36のいずれかに記載の方法。
【請求項38】
前記ヒトマイクロバイオータタンパク質が、前記工程(iii)において、化学合成によって調製される、請求項1から37のいずれかに記載の方法。
【請求項39】
前記ヒトマイクロバイオータタンパク質が、前記工程(iii)において、インビトロ合成(無細胞発現)又は組換え過剰発現によって調製される、請求項1から38のいずれかに記載の方法。
【請求項40】
核酸分子が、前記タンパク質を調製するためのテンプレートとして使用され、前記方法が、以下の工程を含む、請求項39に記載の方法。
-前記核酸配列の開始コドンと終止コドンを同定すること。
【請求項41】
前記工程(iii)で調製された前記ヒトマイクロバイオータタンパク質が、前記工程(ii)で同定された前記シグナルペプチドなしで合成される、請求項1から40のいずれかに記載の方法。
【請求項42】
前記タンパク質の調製前に、前記シグナルペプチドをインシリコで除去する、請求項41に記載の方法。
【請求項43】
前記方法が、(得られた)タンパク質の少なくとも1つの生物学的活性、特に、ヒト宿主との相互作用に関する生物学的活性、を決定する更なる工程(iv)を含む、請求項1から42のいずれかに記載の方法。
【請求項44】
前記生物学的活性が、インシリコで試験される、請求項43に記載の方法。
【請求項45】
前記ヒトマイクロバイオータタンパク質の構造が決定され、ヒト宿主分子、特に、ヒト宿主タンパク質の構造と比較される、請求項43又は44に記載の方法。
【請求項46】
前記生物学的活性が、インビトロ又はインビボで試験される、請求項43から45のいずれかに記載の方法。
【請求項47】
生物学的活性試験が、共免疫沈降、二分子蛍光補完、アフィニティ電気泳動、ラベルトランスファー、ファージディスプレイ、タンデムアフィニティ精製、光反応性アミノ酸類似体(インビボ)、SPINE、ノックダウンと組み合わせた定量的免疫沈降(QUICK)、バイオレイヤー干渉法、二重分極干渉法(DPI)、静的光散乱(SLS)、動的光散乱(DLS)、表面プラズモン共鳴、蛍光分極/異方性、蛍光相関分光法、蛍光相互相関分光法(fluorescence cross-correlation spectroscopy)(FCCS)、蛍光共鳴エネルギー移動(FRET)、NMR、等温滴定熱量測定(ITC)、マイクロスケール熱泳動(MST)、回転セルベースリガンド結合アッセイ(Rotating cell-based ligand binding assay)、単色反射率測定(SCORE)、マイクロアレイ、特に、ペプチドアレイ及びタンパク質アレイ、並びにペプチドファージディスプレイ、酵母表面ディスプレイ、酵母ツーハイブリッド及び細菌ツーハイブリッドスクリーンなどのディスプレイ法からなる群から選択される、請求項46に記載の方法。
【請求項48】
得られた前記タンパク質の、代謝、免疫、又は細胞完全性などの生物学的メカニズムへの関与を調べるために、前記生物学的活性をスクリーニング法によって試験する、請求項43から47のいずれかに記載の方法。
【請求項49】
得られた前記タンパク質を、Gタンパク質結合受容体(GPCR)専用のアッセイを用いて試験する、請求項43から48のいずれかに記載の方法。
【請求項50】
得られた前記タンパク質を、ヒト細胞からのカルシウム放出の誘導に関するアッセイを用いて試験する、請求項43から49のいずれかに記載の方法。
【請求項51】
得られた前記タンパク質を、任意に、末梢血単核細胞(PBMC)などのヒト免疫細胞、又はヒト免疫細胞の選択されたサブセットを伴う、免疫に関するアッセイを用いて試験する、請求項43から50のいずれかに記載の方法。
【請求項52】
得られた前記タンパク質に曝露されたヒト細胞からのサイトカイン放出を決定する、請求項43から51のいずれかに記載の方法。
【請求項53】
請求項1から52のいずれかに記載の方法によって得ることができることを特徴とする、ヒトマイクロバイオータタンパク質薬剤候補のライブラリー。
【請求項54】
ヒトマイクロバイオータメタセクレトームのタンパク質を同定するための方法であって、以下の工程:
(i)複数のヒトマイクロバイオータタンパク質配列及び/又は複数のヒトマイクロバイオータタンパク質をコードする複数の核酸配列を提供することと;
(ii)前記工程(i)で提供された前記配列において、ヒトマイクロバイオータメタセクレトームのタンパク質の1以上の配列を同定することと、を含み、
前記ヒトマイクロバイオータメタセクレトームのタンパク質の前記配列が、以下の基準:
- シグナルペプチドを有する配列、又はシグナルペプチドを有するタンパク質をコードする配列である;
- 20~500アミノ酸長を有する配列、又は20~500アミノ酸長を有するタンパク質をコードする配列である;及び
- 少なくとも2つのシステイン残基及び/又は立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを含む配列、又は少なくとも2つのシステイン残基及び/又は立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを含むタンパク質をコードする配列である、
にしたがって選択されることを特徴とする、方法。
【請求項55】
請求項2から37のいずれかに定義されるように行われる、請求項54に記載の方法。
【請求項56】
請求項54又は55に記載の複数のヒトマイクロバイオータメタセクレトーム配列の同定を含むことを特徴とする、ヒトマイクロバイオータメタセクレトーム配列データベースを生成するための方法。
【請求項57】
前記工程(i)において、複数のヒトマイクロバイオータタンパク質配列及び/又は複数のヒトマイクロバイオータタンパク質をコードする複数の核酸配列が提供され、データベースに編集され、その後の工程が、前記データベース又は前記データベースに含まれる配列に対して行われる、請求項56に記載の方法。
【請求項58】
請求項54又は55に記載の、複数のヒトマイクロバイオータメタセクレトームタンパク質配列及び/又は複数のヒトマイクロバイオータタンパク質をコードする複数の核酸配列の同定と、それに続く以下の工程とを含むことを特徴とする、ヒトマイクロバイオータメタセクレトームのタンパク質を調製するための方法。
- ヒトマイクロバイオータメタセクレトームの1以上のタンパク質を、これまでに同定された配列に基づいて調製すること。
【請求項59】
ヒトマイクロバイオータメタセクレトームのタンパク質を調製するための方法であって、前記タンパク質が、請求項38から42のいずれかで定義されるように調製されることを特徴とする、方法。
【請求項60】
ヒト宿主分子と相互作用するヒトマイクロバイオータメタセクレトームのタンパク質を同定及び/又は提供するための方法であって、
- 請求項54又は55に記載の、複数のヒトマイクロバイオータメタセクレトームタンパク質配列及び/又は複数のヒトマイクロバイオータタンパク質をコードする複数の核酸配列の同定と、
- 任意に、請求項58又は59に記載の、ヒトマイクロバイオータメタセクレトームの1以上のタンパク質の調製と、
続いて、前記ヒトマイクロバイオータメタセクレトームの同定/調製されたタンパク質の、ヒト宿主分子、特に、ヒト宿主タンパク質との相互作用を試験する工程とを含むことを特徴とする、方法。
【請求項61】
請求項44から52のいずれかに定義されるように、生物学的活性を試験する、請求項60に記載の方法。
【請求項62】
医学における使用のための、請求項1から52及び58から61のいずれかに記載の方法によって得ることができることを特徴とする、ヒトマイクロバイオータメタセクレトームタンパク質。
【請求項63】
配列番号1~10のいずれかで表されるアミノ酸配列を含むことを特徴とする、請求項62にしたがって使用するためのヒトマイクロバイオータメタセクレトームタンパク質。
【請求項64】
以下の工程を含むことを特徴とする、疾患の予防及び/又は治療のための薬剤を調製するための方法。
(a)請求項1から52及び54から61のいずれかにしたがって、ヒトマイクロバイオータタンパク質薬剤候補を提供すること;
(b)以下を含む医薬組成物を調製すること:
(1)前記ヒトマイクロバイオータメタセクレトームの前記タンパク質、又はその機能的断片若しくは配列変異体;
(2)(1)に記載の前記タンパク質をコードする核酸分子;
(3)(1)に記載の前記タンパク質を発現する又は(2)に記載の前記核酸分子を含む細胞;
(4)(1)に記載の前記タンパク質に結合する抗体;
(5)(4)に記載の前記抗体をコードする核酸分子;
(6)(4)に記載の前記抗体を発現する又は(5)に記載の前記核酸分子を含む細胞;
(7)(1)に記載の前記タンパク質と相互作用する化合物;又は
(8)(1)に記載の前記タンパク質の、前記ヒト宿主分子との相互作用(結合)に干渉する化合物、
及び、任意に、薬学的に許容される担体及び/又はアジュバント。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、マイクロバイオーム(microbiome)相互作用、特に、マイクロバイオーム-宿主間相互作用だけでなく、細菌-細菌間相互作用などの他の相互作用にも関する。特に、本発明は、薬剤候補となり得るヒトマイクロバイオームの分泌ペプチド及びタンパク質の同定及び任意に、それらの合成のための方法に関する。本発明はまた、ヒトマイクロバイオームメタセクレトーム(metasecretome)タンパク質配列のデータベースを生成するための方法に関する。更に、本発明は、ヒトマイクロバイオームメタセクレトームのタンパク質を調製するための方法、及び医学におけるかかるタンパク質の使用に関する。ヒトマイクロバイオームメタセクレトームのタンパク質は、様々な疾患に関与するヒトタンパク質と相互作用することができ、したがって、かかる疾患の治療のための薬剤候補となり得る。
【背景技術】
【0002】
ヒトの腸のマイクロバイオータ(microbiota)(HIM)は、ヒトの胃腸管(GIT)にコロニーを形成する、1014個の細菌の巨大で複雑なコミュニティーであり、現在では、ヒトの隠れた器官と考えられている。HIMは、腸の恒常性を維持すること、病原体の増殖を阻害すること、抗微生物化合物を生成すること、及び腸のバリア機能を改善することなどの重要な機能を有する。多くの証拠によって、炎症性腸疾患(IBD)、刺激性腸症候群、非アルコール性脂肪肝炎、アルコール性肝疾患、更には脳の活性(腸脳軸(gut brain axis))などのいくつかの胃腸障害が、腸のマイクロバイオータのバランス変化(ディスバイオシス)の結果であるという事実が裏付けられている。より最近の報告では、ヒトマイクロバイオータの組成が、化学療法及びチェックポイント阻害剤治療としての抗腫瘍治療の有効性とも関連するとされている。したがって、有益な細菌種と、中性又は攻撃的な細菌種との比の変化は、通常、宿主と相互作用する代謝物及び細菌成分のレベルに変化をもたらし、かかる疾患又は治療的治療で観察される腸の恒常性に変化をもたらす。
【0003】
更に、根底にあるメカニズムの多くは未だ特定されていないものの、ヒトマイクロバイオームは、宿主の炎症と免疫調節応答に重要な役割を果たす。例えば、最近の研究では、特定の細菌種が宿主の免疫応答を活性化又は阻害する可能性があることが示された(非特許文献1)。この研究では、53種類のヒトマイクロバイオーム細菌種が、無菌マウスの単コロニー形成後に明確な免疫調節作用を有することが特定されている。
【0004】
宿主に対するヒトマイクロバイオームの前記した効果及び記載した相互作用は、マイクロバイオームそれ自体によって生成及び分泌される分子の集合体によって仲介され、これは、ヒト宿主細胞、特に免疫系受容体と直接相互作用することができる。Ratnerら、2017(非特許文献2)に記載されるように、特定の病原性細菌によって産生される分泌タンパク質は、この免疫調節作用において重要な役割を果たす。Ratnerらは、分泌系を介した活性化と阻害との間に微妙なバランスが存在し、その結果、生じ得る感染の炎症制御、クリアランス、又は拡散の正味の活性化がもたらされることを提案している。共生、延いてはヒトマイクロバイオームが受ける選択圧を考慮すると、これらの細菌が更に細かい調節、及び宿主免疫系との相互作用に関与していることは驚くべきことではない。結果として、マイクロバイオームと宿主との間のこれらの相互作用は、多くの疾患と免疫応答の調節における重要な要素である(非特許文献3)。
【0005】
宿主との相互作用を仲介する共生分子は、主に代謝物とタンパク質であり、これらは宿主の受容体に作用し、ヒト細胞で特定のシグナル伝達を引き起こす。しかし、この分野の大部分の研究は、これまでのところ、免疫系の恒常性又は全体的な宿主代謝をサポートする共生代謝物の同定に着目していた(非特許文献4~7)。
【0006】
これらの代謝物の同定は、メタボロミクスツールと、全糞便サンプル又は培養細菌における研究によってサポートされている新たな分野である。しかし、治療効果に関連し得る代謝物の同定及び使用は、化合物の合成及び完全な構造決定の困難性など、HPLC、LC-MS、及びNMRなどの分析ツールを必要とし且つ長時間かかることがあるという、いくつかのハードルを伴う(非特許文献8及び非特許文献9)。
【0007】
微生物代謝物とは別に、微生物タンパク質も宿主と相互作用する分子とみなされる(非特許文献10~12)。微生物タンパク質は、Gタンパク質結合受容体(GPCR)、キナーゼ受容体、トランスポーターなどの多くのヒト受容体と相互作用できる可能性があり、免疫監視、代謝、細胞完全性などの様々な機能に関与する多くの異なるシグナル伝達経路に影響を与え得る。最近、ヒトと微生物タンパク質との間の分子模倣が、多くの細菌タンパク質の作用メカニズムとして提案された。例えば、E.coliのタンパク質分解マルチシャペロン系のメンバーであるClpBは、アルファMSHを模倣することが報告された(非特許文献13);Helicobacter pylori CagAは、ヒト腫瘍抑制剤TP53BP2と相互作用することが示された(非特許文献14);Lactobacillus acidophilusのSLPAは、DC及びT細胞機能の調節に機能的に関与するDC-SIGNリガンドであると報告された;L.rhamnosusのP40は、若年成体マウス結腸上皮細胞及びヒト結腸上皮細胞株で、EGFRを活性化することが示された;fusobacterium nucleatumのタンパク質FAp2は、腫瘍が発現したGal-GalNAcに結合することにより、fusobacterium nucleatumの結腸直腸腺癌の濃縮を仲介し、TIGIT受容体に結合することが示された(非特許文献15)。したがって、共生細菌に由来する多くの異なるタンパク質は、宿主タンパク質を模倣する能力を有しており、いくつかの細胞経路にアゴナイズ又はアンタゴナイズする能力を有する。更に、ヒトマイクロバイオームに由来する様々なタンパク質は、宿主タンパク質の分泌を上昇させ得る(分泌促進物質、即ち、他の(ヒトの)物質の分泌を引き起こす(マイクロバイオームの)物質)。
【0008】
したがって、かかる微生物タンパク質は、様々な治療用途において有用であり得る。例えば、特定の状態又は疾患でのタンパク質の発現レベル及び発現の調節は、宿主に対する生物学的効果を示唆し得る。同定すれば、微生物タンパク質は、次いで、適切な細胞アッセイ、リガンド結合アッセイ、並びに生化学的及び酵素的アッセイに対する生物学的効果に関して、試験及び検証することができる。
【0009】
従来、微生物の培養、及び所望の表現型を有する個々の株のスクリーニングが広く使用されている。しかし、新たな培養方法が出現した(非特許文献16)にもかかわらず、ヒトの腸の複雑な微生物コミュニティーは、標準的な実験技術では培養できない。したがって、機能的メタゲノミクスとして知られる、培養に依存しないアプローチは、ヒトマイクロバイオームを評価するための主要ツールである。ハイスループットシークエンシング及び関するメタゲノム技術の近年の発展は、この複雑なコミュニティーを理解し始めるための新たな機会を開いている。ハイスループットスクリーニング(HTS)技術は、培養不可能な微生物を含む、生態学的ニッチに属する全ての微生物の全ゲノムの分析を可能にする。
【0010】
治療用途において有用であり得る、ヒト宿主と相互作用する、かかる微生物タンパク質(又は細菌-細菌間相互作用などの、関心のある他の相互作用)を同定するために、ヒト宿主と相互作用する可能性を有する、全マイクロバイオームのタンパク質を含むデータベース/ライブラリーが望まれている。したがって、共生細菌に由来するタンパク質の大規模なライブラリー/データベースが必要である。かかるライブラリー/データベースは、次いで、例えば、GPCRなどの選択されたヒト受容体に結合することができるタンパク質、又は、より一般的には、代謝、免疫、又は細胞完全性に対する特定の生物学的作用を引き起こすことができるタンパク質について、専用のリードアウトを用いることによって、スクリーニングされることができる。
【0011】
ヒトの腸のマイクロバイオームに対処する多様なメタゲノミクスアプローチにもかかわらず、かかるヒトの腸のマイクロバイオームタンパク質、特に、ヒト宿主と潜在的に相互作用して、治療用途のための標的及び/又は薬剤候補を提供するタンパク質に着目したライブラリー又はデータベースは存在しない。
【先行技術文献】
【非特許文献】
【0012】
【非特許文献1】Geva-Zatorsky N, Sefik E, Kua L, Pasman L, Tan TG, Ortiz-Lopez A, Yanortsang TB, Yang L, Jupp R, Mathis D, Benoist C, Kasper DL. Mining the Human Gut Microbiota for Immunomodulatory Organisms. Cell. 2017 Feb 23;168(5):928-943.e11
【非特許文献2】Ratner, D., Orning, M. P. A., & Lien, E. (2017). Bacterial secretion systems and regulation of inflammasome activation. Journal of Leukocyte Biology, 101(1), 165-181
【非特許文献3】Kinross, J. M., Darzi, A. W., & Nicholson, J. K. (2011). Gut microbiome-host interactions in health and disease. Genome Medicine, 3(3), 14
【非特許文献4】Nicholson JK, Holmes E, Kinross J, Burcelin R, Gibson G, Jia W, Pettersson S. Host-gut microbiota metabolic interactions. Science. 2012 Jun 8;336(6086):1262-7
【非特許文献5】Levy M, Thaiss CA, Elinav E. Metabolites: messengers between the microbiota and the immune system. Genes Dev. 2016 Jul 15;30(14):1589-97
【非特許文献6】Guo CJ, Chang FY, Wyche TP, Backus KM, Acker TM, Funabashi M, Taketani M, Donia MS, Nayfach S, Pollard KS, Craik CS, Cravatt BF, Clardy J, Voigt CA, Fischbach MA. Discovery of Reactive Microbiota-Derived Metabolites that Inhibit Host Proteases. Cell. 2017 Jan 26;168(3):517-526.e18
【非特許文献7】Cohen LJ, Kang HS, Chu J, Huang YH, Gordon EA, Reddy BV, Ternei MA, Craig JW, Brady SF. Functional metagenomic discovery of bacterial effectors in the human microbiome and isolation of commendamide, a GPCR G2A/132 agonist. Proc Natl Acad Sci U S A. 2015 Sep 1;112(35):E4825-34
【非特許文献8】Sharon G, Garg N, Debelius J, Knight R, Dorrestein PC, Mazmanian SK. Specialized metabolites from the microbiome in health and disease. Cell metabolism. 2014;20(5):719-730
【非特許文献9】Wilson MR, Zha L, Balskus EP. Natural product discovery from the human microbiome. J Biol Chem. 2017 May 26;292(21):8546-8552
【非特許文献10】Weigele BA, Orchard RC, Jimenez A, Cox GW, Alto NM. A systematic exploration of the interactions between bacterial effector proteins and host cell membranes. Nat Commun. 2017 Sep 14;8(1):532
【非特許文献11】Devin K. Schweppe, Christopher Harding, Juan D. Chavez, Xia Wu, Elizabeth Ramage, Pradeep K. Singh, Colin Manoil, James E. Bruce, Host-Microbe Protein Interactions during Bacterial Infection, Chemistry & Biology, 2015, 22(11):1521-1530
【非特許文献12】Guven-Maiorov E, Tsai CJ, Nussinov R. Structural host-microbiota interaction networks. PLoS Comput Biol. 2017 Oct 12;13(10):e1005579
【非特許文献13】Breton J, Tennoune N, Lucas N, Francois M, Legrand R, Jacquemot J, Goichon A, Guerin C, Peltier J, Pestel-Caron M, Chan P, Vaudry D, do Rego JC, Lienard F,Penicaud L, Fioramonti X, Ebenezer IS, Hokfelt T, Dechelotte P, Fetissov SO. Gut Commensal E.coli Proteins Activate Host Satiety Pathways following Nutrient-Induced Bacterial Growth. Cell Metab. 2016 Feb 9;23(2):324-34
【非特許文献14】Buti L, Spooner E, Van der Veen AG, Rappuoli R, Covacci A, Ploegh HL. Helicobacter pylori cytotoxin-associated gene A (CagA) subverts the apoptosis-stimulating protein of p53 (ASPP2) tumor suppressor pathway of the host. Proc Natl Acad Sci U S A. 2011 May 31;108(22):9238-43
【非特許文献15】Gur C, Ibrahim Y, Isaacson B, Yamin R, Abed J, Gamliel M, Enk J, Bar-On Y, Stanietsky-Kaynan N, Coppenhagen-Glazer S, Shussman N, Almogy G, Cuapio A, Hofer E, Mevorach D, Tabib A, Ortenberg R, Markel G, Miklic K, Jonjic S, Brennan CA, Garrett WS, Bachrach G, Mandelboim O. Binding of the Fap2 protein of Fusobacterium nucleatum to human inhibitory receptor TIGIT protects tumors from immune cell attack. Immunity. 2015 Feb 17;42(2):344-355
【非特許文献16】Sommer MO. Advancing gut microbiome research using cultivation. Curr Opin Microbiol. 2015 Oct;27:127-32
【発明の概要】
【発明が解決しようとする課題】
【0013】
前記に鑑みて、本発明の目的は、ヒトマイクロバイオームタンパク質、特に、ヒト宿主と相互作用するタンパク質のデータベース、例えば、ヒト宿主と相互作用するヒトの腸のマイクロバイオームタンパク質のデータベースなどを生成するための方法を提供することである。特に、本発明の目的は、ヒトの腸のマイクロバイオームメタセクレトームを含む、ヒトマイクロバイオームメタセクレトームのペプチド又はタンパク質を同定するための方法を提供することである。更に、本発明の目的は、また、かかるタンパク質を(インビトロで)合成するための方法を提供すること、及び医療用途のためのかかるタンパク質を提供することである。
【0014】
これらの目的は、以下及び添付の特許請求の範囲に示す発明主題によって達成される。
【0015】
以下、本発明を詳細に説明するが、本発明は、本明細書に記載の特定の方法、プロトコル、及び試薬に、これらは変わる可能性があるので、限定されないことを理解されたい。また、本明細書で使用する用語は、添付の特許請求の範囲によってのみ限定される本発明の範囲を限定するものではないことを理解されたい。特段の断りがない限り、本明細書で使用されるすべての技術用語及び科学用語は、当業者によって通常理解されるのと同じ意味を有する。
【0016】
以下に、本発明の要素について説明する。これら要素は、具体的な実施形態と共に列挙されるが、これらを任意の方式で任意の数組み合わせて更なる実施形態を生み出すことができることを理解すべきである。様々に記載される実施例及び好ましい実施形態は、本発明を明示的に記載される実施形態に限定することを意図するものではない。この記載は、明示的に記載された実施形態を任意の数の開示された及び/又は好ましい要素と組み合わせる実施形態をサポート及び包含すると理解すべきである。更に、特に指定しない限り、本願におけるすべての記載された要素の任意の入れ換え及び組合せが本願の記載によって開示されるとみなすべきである。
【0017】
本明細書及びその後に続く特許請求の範囲全体を通して、特に必要としない限り、用語「含む」並びに「含み」及び「含んでいる」などの変形は、指定されている部材、整数、又は工程を含むが、任意の他の指定されていない部材、整数、又は工程を除外するものではないことを意味すると理解される。用語「からなる」は、任意の他の指定されていない部材、整数、又は工程が除外される、用語「含む」の具体的な実施形態である。本発明において、用語「含む」は、用語「からなる」を包含する。したがって、用語「含む(comprising)」は、「含む(including)」及び「からなる(consisting)」を包含し、例えば、Xを「含む」組成物は、Xのみからなっていてもよく、追加の何かを含んでいてもよい(例えば、X+Y)。
【0018】
用語「a」及び「an」及び「the」、並びに本発明の説明(特に、特許請求の範囲)において使用される同様の参照は、本明細書に指定されているか又は文脈上明示的に否定されていない限り、単数及び複数の両方を網羅すると解釈すべきである。本明細書における値の範囲の列挙は、単に、範囲内の各別個の値を個別に参照する簡易的な方法として機能することを意図する。本明細書において特に指定しない限り、各個別の値は、本明細書に個々に列挙されているかのように明細書に組み込まれる。明細書中のいずれの言語も、本発明の実施に必須の任意の請求されていない要素を示すと解釈されるべきではない。
【0019】
用語「実質的に」は、「完全に」を除外するものではなく、例えば、Yを「実質的に含まない」組成物は、Yを完全に含んでいなくてもよい。必要な場合、用語「実質的に」は、本発明の定義から省略されることもある。
【0020】
数値xに関する用語「約」は、x±10%を意味する。
【0021】
本発明の項目
本発明は、特に、以下の項目を提供する。
1.ヒトマイクロバイオータタンパク質薬剤候補を提供するための方法であって、以下の工程:
(i)複数のヒトマイクロバイオータタンパク質配列及び/又は複数のヒトマイクロバイオータタンパク質をコードする複数の核酸配列を提供することと;
(ii)前記工程(i)で提供された前記配列において、ヒトマイクロバイオータタンパク質薬剤候補の1以上の配列を同定することと;
(iii)前記工程(ii)で同定された前記配列を有する、又は前記工程(ii)で同定された前記配列によってコードされる1以上のヒトマイクロバイオータタンパク質を調製することと、を含み、
前記工程(ii)における、前記ヒトマイクロバイオータタンパク質薬剤候補の前記配列が、以下の基準にしたがって選択されることを特徴とする、方法。
- シグナルペプチドを有する配列、又はシグナルペプチドを有するタンパク質をコードする配列である;
- 20~500アミノ酸長を有する配列、又は20~500アミノ酸長を有するタンパク質をコードする配列である;及び
- 少なくとも2つのシステイン残基及び/又は立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを含む配列、又は少なくとも2つのシステイン残基及び/又は立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを含むタンパク質をコードする配列である。
2.前記マイクロバイオータが、胃腸管マイクロバイオータ、肺マイクロバイオータ、唾液マイクロバイオータ、精液マイクロバイオータ、皮膚マイクロバイオータ、及び膣マイクロバイオータからなる群から選択されるマイクロバイオータである、項目1に記載の方法。
3.前記マイクロバイオータが、腸マイクロバイオータ及び口腔マイクロバイオータから選択される胃腸管マイクロバイオータである、項目1又は2に記載の方法。
4.前記ヒトマイクロバイオータタンパク質が、細菌タンパク質、古細菌タンパク質、原生生物タンパク質、真菌タンパク質、ウイルスタンパク質、及び/又はファージタンパク質である、項目1から3のいずれかに記載の方法。
5.前記ヒトマイクロバイオータタンパク質が、細菌タンパク質、好ましくは、ヒトの胃腸管マイクロバイオータメタセクレトームのものである、項目1から4のいずれかに記載の方法。
6.前記ヒトマイクロバイオータタンパク質が、ヒトの胃腸管マイクロバイオータの細菌タンパク質である、項目1から4のいずれかに記載の方法。
7.前記工程(i)において、ヒトマイクロバイオータタンパク質配列のデータベース及び/又はヒトマイクロバイオータタンパク質をコードする核酸配列のデータベースが提供される、項目1から6のいずれかに記載の方法。
8.前記マイクロバイオータのデータベースが、複数の宿主個体のマイクロバイオータ配列を含む、項目7に記載の方法。
9.前記マイクロバイオータのデータベースが、複数の宿主個体のマイクロバイオータデータではなく、単一の宿主個体のマイクロバイオータデータを含む、項目8に記載の方法。
10.前記工程(i)が、以下のサブ工程を含む、項目7から9のいずれかに記載の方法。
(i-a)任意に、単一又は複数の個体のサンプルから、マイクロバイオータタンパク質配列又は核酸配列を同定すること、及び
(i-b)単一又は複数の個体のマイクロバイオータタンパク質配列又は核酸配列を含むデータベースを編集すること。
11.前記工程(i-a)におけるサンプルが、便サンプルである、項目10に記載の方法。
12.前記工程(ii)におけるシグナルペプチドの同定が、インシリコで行われる、項目1から11のいずれかに記載の方法。
13.前記工程(ii)におけるシグナルペプチドの同定が、2つの異なる方法を用いることによって行われ、両方の方法にしたがうシグナルペプチドを有する配列又はコードする配列が選択される、項目1から12のいずれかに記載の方法。
14.前記工程(ii)におけるシグナルペプチドの同定が、Phobius及び/又はSignalPを用いることによって行われる、項目1から13のいずれかに記載の方法。
15.前記ヒトマイクロバイオータタンパク質が、20~350アミノ酸長を有する、項目1から14のいずれかに記載の方法。
16.前記ヒトマイクロバイオータタンパク質が、少なくとも2つのシステイン残基を含む、項目1から15のいずれかに記載の方法。
17.前記システイン残基が、前記ヒトマイクロバイオータタンパク質の総アミノ酸の4%超を占める、項目16に記載の方法。
18.前記ヒトマイクロバイオータタンパク質が、偶数個のシステイン残基を含み、例えば、少なくとも1つ又は2つのシステイン対を形成する、項目16又は17に記載の方法。
19.前記ヒトマイクロバイオータタンパク質のシステイン含量が、KAPPAを使用して同定される、項目16から18のいずれかに記載の方法。
20.前記立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントが、システインモチーフ、ロイシンリッチリピート、アルファヘリックス、ベータシート、及びコイルからなる群から選択される、項目1から19のいずれかに記載の方法。
21.前記立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントが、ジスルフィド架橋である、項目1から20のいずれかに記載の方法。
22.前記ヒトマイクロバイオータタンパク質が、20~200アミノ酸長を有し、且つ少なくとも2つのシステイン残基を含み、例えば、少なくとも1つのシステイン対を形成する、項目1から21のいずれかに記載の方法。
23.前記ヒトマイクロバイオータタンパク質が、50~150アミノ酸長を有し、且つ少なくとも4つのシステイン残基を含み、例えば、少なくとも2つのシステイン対を形成する、項目1から22のいずれかに記載の方法。
24.前記ヒトマイクロバイオータタンパク質が、20~50アミノ酸長を有し、且つアルファヘリックス、ベータシート、及びコイルからなる群から選択される二次構造エレメントを含む、項目1から22のいずれかに記載の方法。
25.前記工程(ii)において、シグナルペプチドを有する又はコードする配列の同定が、以下の前に行われる、項目1から24のいずれかに記載の方法。
- 20~500アミノ酸長を有する配列又は20~500アミノ酸長を有する配列をコードする配列の同定;及び/又は
- 少なくとも2つのシステイン残基及び/又は立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを含む配列の同定。
26.前記シグナルペプチドの配列が、以下に含まれない、項目25に記載の方法。
- 20~500アミノ酸長を有する配列又は20~500アミノ酸長を有する配列をコードする配列の同定;及び/又は
- 少なくとも2つのシステイン残基及び/又は立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを含む配列の同定。
27.前記工程(ii)において、未知の機能を有するタンパク質又は核酸配列を、好ましくはインシリコ法を用いて、アノテートする、項目1から26のいずれかに記載の方法。
28.前記配列を、HMMSCAN及び/又はPFAMを用いて、アノテートする、項目27に記載の方法。
29.前記工程(ii)において、冗長な配列が、同定され除去される、項目1から28のいずれかに記載の方法。
30.前記工程(ii)において、別の配列と、少なくとも95%、好ましくは少なくとも90%、より好ましくは少なくとも85%、更により好ましくは少なくとも80%、最も好ましくは少なくとも75%の配列同一性を有する配列が、同定され除去される、項目29に記載の方法。
31.CD-HITを使用して冗長な配列を同定する、項目29又は30に記載の方法。
32.前記工程(ii)において、分泌タンパク質のシグナルペプチドが、グラム陰性菌のリポタンパク質と区別される、項目1から31のいずれかに記載の方法。
33.分泌タンパク質のシグナルペプチドを、グラム陰性菌のリポタンパク質から区別する工程が、LipoPを用いて行われる、項目32に記載の方法。
34.前記ヒトマイクロバイオータタンパク質が、ヒト宿主タンパク質の模倣物又は分泌促進物質(secretagogue)であり、例えば、サイトカイン、インターロイキン、ケモカイン、成長因子、神経ペプチド、及びペプチドホルモンからなる群から選択される、項目1から33のいずれかに記載の方法。
35.前記ヒトマイクロバイオータタンパク質が、分泌促進物質である、項目1から34のいずれかに記載の方法。
36.前記分泌促進物質が、ヒト免疫細胞によるインターロイキン-10(IL-10)の分泌を誘導する、項目35に記載の方法。
37.同定された前記タンパク質が、免疫調節性である、項目1から36のいずれかに記載の方法。
38.前記ヒトマイクロバイオータタンパク質が、前記工程(iii)において、化学合成によって調製される、項目1から37のいずれかに記載の方法。
39.前記ヒトマイクロバイオータタンパク質が、前記工程(iii)において、インビトロ合成(無細胞発現)又は組換え過剰発現によって調製される、項目1から38のいずれかに記載の方法。
40.核酸分子が、前記タンパク質を調製するためのテンプレートとして使用され、前記方法が、以下の工程を含む、項目39に記載の方法。
-前記核酸配列の開始コドンと終止コドンを同定すること。
41.前記工程(iii)で調製された前記ヒトマイクロバイオータタンパク質が、前記工程(ii)で同定された前記シグナルペプチドなしで合成される、項目1から40のいずれかに記載の方法。
42.前記タンパク質の調製前に、前記シグナルペプチドをインシリコで除去する、項目41に記載の方法。
43.前記方法が、(得られた)タンパク質の少なくとも1つの生物学的活性、特に、ヒト宿主との相互作用に関する生物学的活性、を決定する更なる工程(iv)を含む、項目1から42のいずれかに記載の方法。
44.前記生物学的活性が、インシリコで試験される、項目43に記載の方法。
45.前記ヒトマイクロバイオータタンパク質の構造が決定され、ヒト宿主分子、特に、ヒト宿主タンパク質の構造と比較される、項目43又は44に記載の方法。
46.前記生物学的活性が、インビトロ又はインビボで試験される、項目43から45のいずれかに記載の方法。
47.生物学的活性試験が、共免疫沈降、二分子蛍光補完、アフィニティ電気泳動、ラベルトランスファー、ファージディスプレイ、タンデムアフィニティ精製、光反応性アミノ酸類似体(インビボ)、SPINE、ノックダウンと組み合わせた定量的免疫沈降(QUICK)、バイオレイヤー干渉法、二重分極干渉法(DPI)、静的光散乱(SLS)、動的光散乱(DLS)、表面プラズモン共鳴、蛍光分極/異方性、蛍光相関分光法、蛍光相互相関分光法(fluorescence cross-correlation spectroscopy)(FCCS)、蛍光共鳴エネルギー移動(FRET)、NMR、等温滴定熱量測定(ITC)、マイクロスケール熱泳動(MST)、回転セルベースリガンド結合アッセイ(Rotating cell-based ligand binding assay)、単色反射率測定(SCORE)、マイクロアレイ、特に、ペプチドアレイ及びタンパク質アレイ、並びにペプチドファージディスプレイ、酵母表面ディスプレイ、酵母ツーハイブリッド及び細菌ツーハイブリッドスクリーンなどのディスプレイ法からなる群から選択される、項目46に記載の方法。
48.得られた前記タンパク質の、代謝、免疫、又は細胞完全性などの生物学的メカニズムへの関与を調べるために、前記生物学的活性をスクリーニング法によって試験する、項目43から47のいずれかに記載の方法。
49.得られた前記タンパク質を、Gタンパク質結合受容体(GPCR)専用のアッセイを用いて試験する、項目43から48のいずれかに記載の方法。
50.得られた前記タンパク質を、ヒト細胞からのカルシウム放出の誘導に関するアッセイを用いて試験する、項目43から49のいずれかに記載の方法。
51.得られた前記タンパク質を、任意に、末梢血単核細胞(PBMC)などのヒト免疫細胞、又はヒト免疫細胞の選択されたサブセットを伴う、免疫に関するアッセイを用いて試験する、項目43から50のいずれかに記載の方法。
52.得られた前記タンパク質に曝露されたヒト細胞からのサイトカイン放出を決定する、項目43から51のいずれかに記載の方法。
53.項目1から52のいずれかに記載の方法によって得ることができることを特徴とする、ヒトマイクロバイオータタンパク質薬剤候補のライブラリー。
54.ヒトマイクロバイオータメタセクレトームのタンパク質を同定するための方法であって、以下の工程:
(i)複数のヒトマイクロバイオータタンパク質配列及び/又は複数のヒトマイクロバイオータタンパク質をコードする複数の核酸配列を提供することと;
(ii)前記工程(i)で提供された前記配列において、ヒトマイクロバイオータメタセクレトームのタンパク質の1以上の配列を同定することと、を含み、
前記ヒトマイクロバイオータメタセクレトームのタンパク質の前記配列が、以下の基準にしたがって選択されることを特徴とする、方法。
- シグナルペプチドを有する配列、又はシグナルペプチドを有するタンパク質をコードする配列である;
- 20~500アミノ酸長を有する配列、又は20~500アミノ酸長を有するタンパク質をコードする配列である;及び
- 少なくとも2つのシステイン残基及び/又は立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを含む配列、又は少なくとも2つのシステイン残基及び/又は立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを含むタンパク質をコードする配列である。
55.項目2から37のいずれかに定義されるように行われる、項目54に記載の方法。
56.項目54又は55に記載の複数のヒトマイクロバイオータメタセクレトーム配列の同定を含むことを特徴とする、ヒトマイクロバイオータメタセクレトーム配列データベースを生成するための方法。
57.前記工程(i)において、複数のヒトマイクロバイオータタンパク質配列及び/又は複数のヒトマイクロバイオータタンパク質をコードする複数の核酸配列が提供され、データベースに編集され、その後の工程が、前記データベース又は前記データベースに含まれる配列に対して行われる、項目56に記載の方法。
58.項目54又は55に記載の、複数のヒトマイクロバイオータメタセクレトームタンパク質配列及び/又は複数のヒトマイクロバイオータタンパク質をコードする複数の核酸配列の同定と、それに続く以下の工程とを含むことを特徴とする、ヒトマイクロバイオータメタセクレトームのタンパク質を調製するための方法。
- ヒトマイクロバイオータメタセクレトームの1以上のタンパク質を、これまでに同定された配列に基づいて調製すること。
59.ヒトマイクロバイオータメタセクレトームのタンパク質を調製するための方法であって、前記タンパク質が、項目38から42のいずれかで定義されるように調製されることを特徴とする、方法。
60.ヒト宿主分子と相互作用するヒトマイクロバイオータメタセクレトームのタンパク質を同定及び/又は提供するための方法であって、
- 項目54又は55に記載の、複数のヒトマイクロバイオータメタセクレトームタンパク質配列及び/又は複数のヒトマイクロバイオータタンパク質をコードする複数の核酸配列の同定と、
- 任意に、項目58又は59に記載の、ヒトマイクロバイオータメタセクレトームの1以上のタンパク質の調製と、
続いて、前記ヒトマイクロバイオータメタセクレトームの同定/調製されたタンパク質の、ヒト宿主分子、特に、ヒト宿主タンパク質との相互作用を試験する工程とを含むことを特徴とする、方法。
61.項目44から52のいずれかに定義されるように、生物学的活性を試験する、項目60に記載の方法。
62.医学における使用のための、項目1から52及び58から61のいずれかに記載の方法によって得ることができることを特徴とする、ヒトマイクロバイオータメタセクレトームタンパク質。
63.配列番号1~10のいずれかで表されるアミノ酸配列を含むことを特徴とする、項目62にしたがって使用するためのヒトマイクロバイオータメタセクレトームタンパク質。
64.以下の工程を含むことを特徴とする、疾患の予防及び/又は治療のための薬剤を調製するための方法。
(a)項目1から52及び54から61のいずれかにしたがって、ヒトマイクロバイオータタンパク質薬剤候補を提供すること;
(b)以下を含む医薬組成物を調製すること:
(1)前記ヒトマイクロバイオータメタセクレトームの前記タンパク質、又はその機能的断片若しくは配列変異体;
(2)(1)に記載の前記タンパク質をコードする核酸分子;
(3)(1)に記載の前記タンパク質を発現する又は(2)に記載の前記核酸分子を含む細胞;
(4)(1)に記載の前記タンパク質に結合する抗体;
(5)(4)に記載の前記抗体をコードする核酸分子;
(6)(4)に記載の前記抗体を発現する又は(5)に記載の前記核酸分子を含む細胞;
(7)(1)に記載の前記タンパク質と相互作用する化合物;又は
(8)(1)に記載の前記タンパク質の、前記ヒト宿主分子との相互作用(結合)に干渉する化合物、
及び、任意に、薬学的に許容される担体及び/又はアジュバント。
【0022】
本発明、特に上で概説した項目について、以下、より詳細に説明する。
【0023】
ヒトマイクロバイオータタンパク質薬剤候補を提供するための方法
第1の態様において、本発明は、ヒトマイクロバイオータタンパク質薬剤候補を提供するための方法を提供し、前記方法は、以下の工程:
(i)複数のヒトマイクロバイオータタンパク質配列及び/又は複数のヒトマイクロバイオータタンパク質をコードする複数の核酸配列を提供することと;
(ii)前記工程(i)で提供された前記配列において、ヒトマイクロバイオータタンパク質薬剤候補の1以上の配列を同定することと;
(iii)前記工程(ii)で同定された前記配列を有する、又は前記工程(ii)で同定された前記配列によってコードされる1以上のヒトマイクロバイオータタンパク質を調製することと、を含み、
前記工程(ii)における、前記ヒトマイクロバイオータタンパク質薬剤候補の前記配列が、以下の基準にしたがって選択される。
- シグナルペプチドを有する配列、又はシグナルペプチドを有するタンパク質をコードする配列である;
- 20~500アミノ酸長を有する配列、又は20~500アミノ酸長を有するタンパク質をコードする配列である;及び
- 少なくとも2つのシステイン残基及び/又は立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを含む配列、又は少なくとも2つのシステイン残基及び/又は立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを含むタンパク質をコードする配列である。
【0024】
いかなる理論にも拘束されるものではないが、本発明者らは、共生マイクロバイオータ、特に、ヒトマイクロバイオームのマイクロバイオータが、数千世代に亘る細菌の進化、特に、活性、バイオアベイラビリティ、毒性などに関する細菌の進化によって、特にそれらの(ヒトの)宿主だけでなく、細菌-細菌間相互作用などのマイクロバイオータコミュニティーを含む、環境との相互作用/コミュニケーションのための分泌タンパク質を最適化していると仮定している。前記に鑑みると、ヒトマイクロバイオームメタセクレトームのタンパク質は、様々な(ヒトの)疾患の予防及び治療のための理想的な薬剤候補である。したがって、ヒト宿主に存在するマイクロバイオータによって発現される多くのタンパク質の中から、ヒト宿主と相互作用するタンパク質を同定するために、本発明者らは、ヒトマイクロバイオータのメタセクレトームに着目した。ヒトマイクロバイオータとヒト宿主との間のクロストークは、直接的な細胞-細胞間接触又は細胞によって分泌される低分子によって仲介されると想定されている。したがって、細胞表面に位置する、又は分泌されるマイクロバイオータタンパク質は、マイクロバイオータ-宿主間相互作用などの相互作用に関与している。
【0025】
前記に鑑みると、「ヒトマイクロバイオータタンパク質薬剤候補」は、ヒトマイクロバイオームのマイクロバイオータ、即ち、ヒトマイクロバイオームのメタセクレトームによって発現される(又は発現されると予測される)微生物タンパク質である。したがって、本明細書においては、しばしば、「ヒトマイクロバイオータタンパク質薬剤候補」を、「ヒトマイクロバイオータ(メタセクレトーム)タンパク質」又は「ヒトマイクロバイオータ(メタセクレトーム)のタンパク質」などとも称する。
【0026】
本発明において、即ち、本願全体を通して、用語「ペプチド」、「ポリペプチド」、「タンパク質」、及びこれらの用語の変形は、好ましくは通常のペプチド結合によって、或いは、イソステリックペプチド(isosteric peptides)の場合などのように、修飾されたペプチド結合によって互いに結合された少なくとも2つのアミノ酸を含むペプチド、オリゴペプチド、ポリペプチド、又はタンパク質を意味する。特に、用語「タンパク質」は、それらの長さに関係なく、ペプチド及びタンパク質を意味する。したがって、用語「タンパク質」は、特に、短いペプチド(例えば、オリゴペプチド)並びに長い(より長い)ポリペプチド及びタンパク質を含む。
【0027】
用語「ペプチド」、「ポリペプチド」、「タンパク質」は、非ペプチド構造要素を含むペプチド類似体として定義される「ペプチド模倣物」も含むことができ、これらのペプチドは、天然の親ペプチドの生物学的作用を模倣する又はそれに拮抗することができる。ペプチド模倣体は、酵素で切断可能なペプチド結合などの古典的なペプチド特性を欠く。特に、ペプチド、ポリペプチド、又はタンパク質は、遺伝暗号によって定義された20個のアミノ酸以外のアミノ酸を、これらのアミノ酸に加えて含むことができ、又は遺伝暗号によって定義された20個のアミノ酸以外のアミノ酸から構成されることができる。特に、本発明におけるペプチド、ポリペプチド、又はタンパク質は、翻訳後成熟プロセスなどの天然プロセス又は化学プロセスによって修飾されたアミノ酸から等しく構成することができ、これらは当業者によく知られている。かかる修飾は、文献に十分詳述されている。これらの修飾は、ポリペプチドの任意の箇所に現れることがあり、即ち、ペプチド骨格中、アミノ酸鎖中、更にはカルボキシ又はアミノ末端に現れることがある。特に、ペプチド又はポリペプチドは、ユビキチン化に続いて分岐する、又は分岐の有無にかかわらず環状であり得る。このタイプの修飾は、当業者によく知られた天然又は合成の翻訳後プロセスの結果であり得る。本発明における用語「ペプチド」、「ポリペプチド」、「タンパク質」は、特に、修飾されたペプチド、ポリペプチド、及びタンパク質も含む。例えば、ペプチド、ポリペプチド、又はタンパク質の修飾には、アセチル化、アシル化、ADP-リボシル化、アミド化、ヌクレオチド又はヌクレオチド誘導体の共有結合固定、脂質又は脂質誘導体の共有結合固定、ホスファチジルイノシトールの共有結合固定、共有結合又は非共有結合の架橋、環化、ジスルフィド結合形成、脱メチル化、PEG化を含むグリコシル化、ヒドロキシル化、ヨウ素化、メチル化、ミリストイル化、酸化、タンパク質分解プロセス、リン酸化、プレニル化、ラセミ化、セネロイル化、硫酸化(sulfatation)、アルギニル化又はユビキチン化などのアミノ酸付加などを含むことができる。かかる修飾は、文献に十分に詳述されている(Proteins Structure and Molecular Properties(1993)2nd Ed.,T.E.Creighton,New York;Post-translational Covalent Modifications of Proteins(1983)B.C.Johnson,Ed.,Academic Press,New York;Seifter et al.(1990)Analysis for protein modifications and nonprotein cofactors,Meth.Enzymol.182:626-646 and Rattan et al.,(1992)Protein Synthesis:Post-translational Modifications and Aging,Ann NY Acad Sci,663:48-62)。したがって、用語「ペプチド」、「ポリペプチド」、「タンパク質」は、好ましくは、リポペプチド、リポタンパク質、糖ペプチド、糖タンパク質などを含む。
【0028】
いくつかの実施形態においては、本発明に係るヒトマイクロバイオータメタセクレトームのタンパク質は、「古典的」(ポリ)ペプチド又はタンパク質であり、それにより「古典的」(ポリ)ペプチド/タンパク質は、典型的には、遺伝暗号によって定義される20種のアミノ酸から選択されるアミノ酸が、通常のペプチド結合により互いに結合されて構成される。
【0029】
本明細書で使用される用語「マイクロバイオータ」は、これまでに植物から動物に至るまで研究されたあらゆる多細胞生物中又は上に存在する、片利共生微生物、相利共生微生物、及び病原微生物を意味する。特に、マイクロバイオータは、宿主の免疫学的、ホルモン的、代謝的恒常性にとって重要であることが分かっている。マイクロバイオータは、細菌、古細菌、原生生物、真菌、ウイルス、及びファージを含む。したがって、ヒトマイクロバイオータタンパク質は、細菌タンパク質、古細菌タンパク質、原生生物タンパク質、真菌タンパク質、ウイルスタンパク質、及び/又はファージタンパク質であり得る。好ましくは、ヒトマイクロバイオータタンパク質は、細菌タンパク質又は古細菌タンパク質である。より好ましくは、マイクロバイオータタンパク質は、細菌タンパク質である。
【0030】
解剖学的には、マイクロバイオータは、胃腸管、特に、腸(及び口腔、特に、口腔粘膜)、皮膚、結膜、乳腺、膣、胎盤、精液、子宮、卵巣濾胞、肺、及び唾液を含む、多くの組織及び体液のいずれかの上又は中に存在する。したがって、マイクロバイオータは、胃腸管マイクロバイオータ、肺マイクロバイオータ、唾液マイクロバイオータ、精液マイクロバイオータ、皮膚マイクロバイオータ、及び膣マイクロバイオータからなる群から選択することができる。いくつかの実施形態においては、マイクロバイオータは、腸マイクロバイオータ及び口腔マイクロバイオータから選択される胃腸管マイクロバイオータである。したがって、ヒトマイクロバイオータメタセクレトームのタンパク質は、ヒトの胃腸管に存在するマイクロバイオータ、即ち、「ヒトの胃腸管マイクロバイオータ」によって発現される微生物タンパク質であり得る。これは、例えば、腸内及び/又はヒトの口腔内に存在するマイクロバイオータによって発現されるタンパク質を含む。他の実施形態では、ヒトマイクロバイオータタンパク質のタンパク質は、胃腸管以外の(胃腸管の外側の)組織及び体液、例えば、皮膚又は生殖器系(特に、膣)に存在するマイクロバイオータによって発現される微生物タンパク質である。好ましくは、前記タンパク質は、ヒト腸マイクロバイオータメタセクレトームなどのヒト胃腸管マイクロバイオータメタセクレトームのタンパク質、即ち、ヒトの胃腸管、特に、ヒトの腸に存在するマイクロバイオータによって発現される微生物タンパク質である。より好ましくは、前記タンパク質は、ヒトの腸内細菌メタセクレトームのタンパク質、即ち、ヒトの腸内に存在する細菌によって発現される細菌タンパク質である。
【0031】
本発明は、特に、ヒトの内部及びヒトの表面に存在するマイクロバイオータに関する。かかるマイクロバイオータを、本明細書では「ヒトマイクロバイオータ」とも称する(ここで、ヒトという用語は、具体的に、マイクロバイオータの局在/所在を意味する)。
【0032】
本明細書においては、用語「メタセクレトーム」は、前記したヒトの組織及び/又は体液上又はその内部、例えば、ヒトの胃腸管に存在する微生物コミュニティーなどの、環境の(微生物の)コミュニティー(マイクロバイオーム)からの分泌タンパク質、外表面タンパク質、内表面タンパク質、及び膜貫通タンパク質の集合体を意味する。したがって、「ヒトマイクロバイオータメタセクレトーム」という表現は、ヒト宿主内に(又はその上に)存在するマイクロバイオータからの分泌タンパク質、外表面タンパク質、及び膜貫通タンパク質の集合体を意味する。いかなる理論にも拘束されるものではないが、メタセクレトームのオープンリーディングフレーム(ORF)は、総メタゲノムの僅か10%~30%を構成すると想定される。用語「セクレトーム」は、膜貫通タンパク質(TM)、外表面タンパク質、内表面タンパク質、及び細胞によって細胞外環境/空間に分泌されるタンパク質からなるタンパク質の集合体を意味する。いくつかの実施形態においては、メタセクレトームタンパク質は、分泌タンパク質である。換言すれば、いくつかの実施形態においては、前記タンパク質は、マイクロバイオータ(前記タンパク質を発現する)から、特に、細胞外環境/空間に放出され、前記マイクロバイオータ(又はその外表面)に結合しない。
【0033】
一般に、本発明においては、ヒトマイクロバイオータメタセクレトームのタンパク質は、そのタンパク質配列(アミノ酸配列)に基づいて、又はそのタンパク質配列をコードする核酸配列に基づいて同定することができる。したがって、本発明に係る方法のいずれの工程も、タンパク質配列(アミノ酸配列)及び/又は前記タンパク質配列をコードする核酸配列に対して行うことができる。したがって、本明細書で使用される用語「配列/複数の配列」は、タンパク質配列(アミノ酸配列)及び/又は(前記タンパク質配列をコードする)核酸配列を意味する。
【0034】
一般に、用語「核酸」又は「核酸分子」は、ゲノムDNA、cDNA、RNA、siRNA、アンチセンスDNA、アンチセンスRNA、リボザイム、発現エレメントを含む又は含まない相補的RNA/DNA配列、ミニ遺伝子、遺伝子断片、調節エレメント、プロモーター、及びそれらの組合せから好ましくは選択される、一本鎖、二本鎖、又は部分二本鎖核酸などの任意の核酸を含む。核酸(分子)及び/又はポリヌクレオチドの更なる例としては、例えば、組換えポリヌクレオチド、ベクター、オリゴヌクレオチド、mRNAなどのRNA分子、又は前記したDNA分子が挙げられる。したがって、核酸(分子)は、DNA分子又はRNA分子であることができ、好ましくは、ゲノムDNA;cDNA;mRNA;発現エレメント、調節エレメント、及び/又はプロモーターを含む又は含まないRNA及び/又はDNA配列;ベクター;及びそれらの組合せであることができる。
【0035】
複数のヒトマイクロバイオータタンパク質配列の提供
本発明に係るヒトマイクロバイオータのタンパク質を同定するための方法の工程(i)において、複数のヒトマイクロバイオータタンパク質配列及び/又は複数のヒトマイクロバイオータタンパク質をコードする複数の核酸配列が提供される。
【0036】
用語「ヒトマイクロバイオータタンパク質配列」は、予測されるタンパク質配列を含むことが理解される。したがって、ヒトマイクロバイオータタンパク質をコードする「核酸配列」は、予測されるマイクロバイオータタンパク質をコードする核酸配列、又はマイクロバイオータタンパク質をコードすると予測される核酸配列であり得る。
【0037】
(ヒト)マイクロバイオームの分野では、マイクロバイオームタンパク質の同定は、ショットガン次世代シークエンシング法などの現代のハイスループットシークエンシングで通常取得される、利用可能な核酸配列に基づくコード化タンパク質の予測によって広く行われている。例えば、腸のマイクロバイオームに関しては、糞便サンプルのマイクロバイオータが、しばしば、全ゲノムショットガン次世代シークエンシング(NGS)を用いて、腸のマイクロバイオータの代わりとして分析される。これにより、短い核酸セグメントの配列(「リード」)が得られ、複数の重複するリードを連続配列(「コンティグ」)にアセンブルすることができる。マイクロバイオームコンティグは、当技術分野で知られている方法で取得することができる、又はNIH Human Microbiome Project(URL:https://www.hmpdacc.org/hmasm2/)の「HMASM2-Assembled Metagenomes」などの公開ライブラリーからダウンロードすることができる。かかる配列中のマイクロバイオーム遺伝子及びタンパク質を同定するために、原核生物遺伝子検出ツールを使用することができる。原核生物の遺伝子検出ツールの非限定的な例としては、以下が挙げられる。
- GeneMarkファミリーのツール(URL: http://exon.gatech.edu/GeneMark/)、例えば、GeneMarkS (URL: http://exon.gatech.edu/GeneMark/genemarks.cgi; John Besemer, Alexandre Lomsadze and Mark Borodovsky, GeneMarkS: a self-training method for prediction of gene starts in microbial genomes. Implications for finding sequence motifs in regulatory regions. Nucleic Acids Research (2001) 29, pp 2607-2618);GeneMark.hmm prokaryotic (URL: http://exon.gatech.edu/GeneMark/gmhmmp.cgi;Alexander Lukashin and Mark Borodovsky, GeneMark.hmm: new solutions for gene finding. Nucleic Acids Research (1998) 26, pp 1107-1115); MetaGeneMark (URL: http://exon.gatech.edu/GeneMark/meta_gmhmmp.cgi; Wenhan Zhu, Alex Lomsadze and Mark Borodovsky, Ab initio gene identification in metagenomic sequences Nucleic Acids Research (2010) 38, e132);及びGeneMarkS2 (URL: http://exon.gatech.edu/GeneMark/genemarks2.cgi; Lomsadze A, Gemayel K, Tang S, Borodovsky M, Modeling leaderless transcription and atypical genes results in more accurate gene prediction in prokaryotes. Genome Res, 2018, 29(7), pp 1079-1089);
- GLIMMER(Gene Locator and Interpolated Markov ModelER)、GLIMMER 3.0が、現在、最新バージョンである(URL: http://ccb.jhu.edu/software/glimmer/index.shtml; S. Salzberg, A. Delcher, S. Kasif, and O. White. Microbial gene identification using interpolated Markov models, Nucleic Acids Research 26:2 (1998), 544-548; A.L. Delcher, K.A. Bratke, E.C. Powers, and S.L. Salzberg. Identifying bacterial genes and endosymbiont DNA with Glimmer, Bioinformatics 23:6 (2007), 673-679);及び
- PRODIGAL(Prokaryotic Dynamic Programming Genefinding Algorithm)及びMetaProdigal(URL: http://code.google.com/p/prodigal/; Hyatt D, Chen GL, Locascio PF, Land ML, Larimer FW, Hauser LJ, Prodigal: prokaryotic gene recognition and translation initiation site identification. BMC Bioinformatics11 (1):119 (2010); Hyatt D, LoCascio PF, Hauser LJ, Uberbacher EC. Gene and translation initiation site prediction in metagenomic sequences. Bioinformatics. 2012;28(17):2223-30).
【0038】
これらの遺伝子検出ツールのうち、GeneMarkファミリー、特に、GeneMarkS2が好ましい。
【0039】
複数のヒトマイクロバイオータタンパク質配列及び/又は複数のヒトマイクロバイオータタンパク質をコードする複数の核酸配列は、好ましくは、データベースに基づいて提供される。したがって、工程(i)において、好ましくは、ヒトマイクロバイオータタンパク質配列のデータベース及び/又はヒトマイクロバイオータタンパク質をコードする、又はコードすると予測される核酸配列のデータベースが提供される。用語「データベース」は、(組織化された)データの集合を意味する。したがって、ヒトマイクロバイオータデータ又は核酸配列データの任意の集合は、複数のヒトマイクロバイオータタンパク質配列及び/又は複数のヒトマイクロバイオータタンパク質をコードする複数の核酸配列を提供するための出発点となり得る。
【0040】
本明細書においては、用語「複数」は、通常、1超、例えば、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、又はそれ以上、例えば、25、30、35、40、45、50、60、70、80、90、100、又はそれ以上の項目(配列)を意味する。特に、複数の項目は異なっている。したがって、「複数のヒトマイクロバイオータタンパク質/タンパク質配列」という表現は、少なくとも2つの異なるヒトマイクロバイオータタンパク質/タンパク質配列を意味し、「複数の核酸配列」という表現は、少なくとも2つの異なる核酸配列を意味する。
【0041】
好ましくは、複数のヒトマイクロバイオータタンパク質配列及び/又は核酸配列は、(マイクロバイオータ)(配列)データベースに基づいて、工程(i)で提供される。かかるデータベースは、好ましくは、複数のヒト個体(宿主個体;ヒト対象)のヒトマイクロバイオータ配列を含む。
【0042】
かかるデータベースの好ましい例は、「Integrated reference catalog of the human gut microbiome」(version 1.0, March 2014; Li et al., MetaHIT Consortium. An integrated catalog of reference genes in the human gut microbiome. Nat Biotechnol. 2014 Aug;32(8):834-41; URL: http://meta.genomics.cn/meta/home)であり、これは、主要なヒトマイクロバイオームプロファイリングの取り組み、American National Institutes of Health Human Microbiome Project (NIH-HMP)、及びEuropean Metagenomics of the Human Intestinal Tract Initiative (MetaHIT)からのデータを含む。
【0043】
かかるデータベースの別の好ましい例は、Unified Human Gastrointestinal Genome(UHGG)の集合であり、ヒトの腸からの4,644種の原核生物種に対応する286,997ゲノムを組み合わせたリソースである(Alexandre Almeida, Stephen Nayfach, Miguel Boland, Francesco Strozzi, Martin Beracochea, Zhou Jason Shi, Katherine S. Pollard, Donovan H. Parks, Philip Hugenholtz, Nicola Segata, Nikos C. Kyrpides, Robert D. Finn. A unified sequence catalogue of over 280,000 genomes obtained from the human gut microbiome. bioRxiv 762682; 19 Sep 2019, doi: https://doi.org/10.1101/762682)。これらのゲノムは、Integrated Gene Catalogueの2倍を超える腸タンパク質クラスター数の集合である、Unified Human Gastrointestinal Protein(UHGP)カタログを生成するために使用される6億2500万を超えるタンパク質配列を含む。
【0044】
更に、別の好ましい例は、より大きなデータベースからヒトマイクロバイオータ配列を選択することによって編集されるデータベースである。例えば、ヒトの腸管に存在することが知られているマイクロバイオータ種を、(例えば、当業者に知られている文献に基づいて)選択することができ、それらの選択されたマイクロバイオータ種の(利用可能な全ての)配列を、より大きなマイクロバイオータデータベース、例えば、Ensembl Bacteriaデータベース(URL: http://bacteria.ensembl.org/index.html; P.J. Kersey, J.E. Allen, A. Allot, M. Barba, S. Boddu, B.J. Bolt, D. Carvalho-Silva, M. Christensen, P. Davis, C. Grabmueller, N. Kumar, Z. Liu, T. Maurel, B. Moore, M. D. McDowall, U. Maheswari, G. Naamati, V. Newman, C.K. Ong, D.M. Bolser., N. De Silva, K.L. Howe, N. Langridge, G. Maslen, D.M. Staines, A. Yates. Ensembl Genomes 2018: an integrated omics infrastructure for non-vertebrate species Nucleic Acids Research 2018 46(D1) D802-D808)から取得することができる。いくつかの実施形態においては、前記データベースは、例えば、選択された障害の治療のためにヒト宿主と相互作用する微生物タンパク質を同定するために、選択された疾患又は障害に関して編集することができる。この文脈においては、前記データベースは、前記障害に関する、例えば、胃腸管の、ヒトの微生物種の配列に着目することができる。更に、かかるデータベースは、例えば、便サンプルなどの、選択された疾患/障害と診断された患者及び/又は選択された疾患/障害に対して耐性/免疫性を有する対象のサンプル中で同定された配列を含むことができる。
【0045】
したがって、データベースは、ヒトマイクロバイオータを含む(便)サンプルのシークエンシングによって編集することもできる。
【0046】
いくつかの実施形態においては、複数のヒトマイクロバイオータ配列は、関心のある1以上のヒトマイクロバイオータ種を選択し、選択されたヒトマイクロバイオータ種のタンパク質及び/又は遺伝子配列を得ることによって提供することができる。例えば、免疫調節性及び/又は炎症関連薬剤候補が関心の対象である場合、免疫調節及び炎症反応制御におけるそれらの役割に関して、ヒトマイクロバイオータ種を選択することができる。かかるヒトマイクロバイオータ種の非限定的な例としては、Alistipes shahiiAkkermansia muciniphilaBacteroides fragilisBacteroides thetaiotaomicronBarnesiella intestinihominisBifidobacterium breveBifidobacterium longumBurkholderia cepaciaEnterococcus hiraeFusobacterium variumLactobacillus johnsonii、及びLactobacillus plantarumが挙げられる。選択されたヒトマイクロバイオータ種の(タンパク質及び/又は遺伝子)配列は、例えば、Ensembl Bacteriaデータベース(http://bacteria.ensembl.org/index.html; P.J. Kersey, J.E. Allen, A. Allot, M. Barba, S. Boddu, B.J. Bolt, D. Carvalho-Silva, M. Christensen, P. Davis, C. Grabmueller, N. Kumar, Z. Liu, T. Maurel, B. Moore, M. D. McDowall, U. Maheswari, G. Naamati, V. Newman, C.K. Ong, D.M. Bolser., N. De Silva, K.L. Howe, N. Langridge, G. Maslen, D.M. Staines, A. Yates. Ensembl Genomes 2018: an integrated omics infrastructure for non-vertebrate species Nucleic Acids Research 2018 46(D1) D802-D808)などの公開データベースから取得することができる。
【0047】
いくつかの実施形態においては、例えば前記したような様々なデータベースをプールして、可能な限り多くのヒトマイクロバイオータ配列を含むデータベースを得ることができる。
【0048】
いくつかの例においては、前記データベースは、複数のヒト個体(宿主個体)のヒトマイクロバイオータ配列ではなく、単一のヒト個体(宿主個体)のヒトマイクロバイオータ配列を含んでもよい。かかるデータベースは、例えば、パーソナライズされた医学的アプローチにおいて有利であり得る。複数の個体のマイクロバイオータデータではなく、単一の個体のマイクロバイオータデータを含むデータベースは、例えば、個体の1以上の便サンプルを使用することによって編集することができる。例えば、微生物の(特に、細菌の)核酸(DNAなど)又は(ポリ)ペプチドを、便サンプルから抽出し、当技術分野で知られた方法によってシークエンシングすることができる。次いで、前記配列を、マイクロバイオータデータのみ、特に、配列を含むデータベースに編集することができる。例えば、便サンプルから抽出したDNAのシークエンシングは、例えば、Illumina HiSeqでは、例えば、4,000万個のペアエンドリードで行うことができる。配列は、例えば、ヒトマイクロバイオータメタセクレトームのタンパク質(例えば、細菌ペプチド)を発現する候補細菌のゲノム部分を同定するためのバイオインフォマティクスパイプラインを用いて分析することができる。
【0049】
本発明に係るヒトマイクロバイオータタンパク質薬剤候補を提供するための方法の工程(i)は、任意に、以下のサブ工程を含んでもよい。
(i-a)任意に、単一又は複数の個体のサンプルから、マイクロバイオータタンパク質配列又は核酸配列を同定すること、及び
(i-b)単一又は複数の個体のマイクロバイオータタンパク質配列又は核酸配列を含むデータベースを編集すること。
【0050】
工程(i-a)のサンプルは、便サンプルであることができる。編集されるデータベースが単一又は複数の個体に関するかどうかに応じて、単一又は複数の個体の1以上の便サンプルを用いることができる。同定工程(i-a)は、好ましくは、例えば、前記したように、サンプル、特に、便サンプルからの微生物の(特に、細菌の)核酸(DNAなど)又は(ポリ)ペプチドの抽出及びそのシークエンシングを含む。任意に、配列を、前記したように分析することができる。
【0051】
ヒトマイクロバイオータタンパク質薬剤候補の同定
本発明に係るヒトマイクロバイオータタンパク質薬剤候補を提供するための方法の工程(ii)において、薬剤候補は、工程(i)において提供されるマイクロバイオータ配列の中から同定される。この薬剤候補は、ヒトマイクロバイオータタンパク質(即ち、ヒトマイクロバイオームによって発現される、又は発現されると予測される微生物タンパク質)であり、以下の3つの重要な基準を満たす:
-(未切断(プロドラッグ)バージョンに)シグナルペプチドを含む;
-20~500アミノ酸長を有する;及び
-(a)少なくとも2つのシステイン残基、及び/又は(b)立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを含む。
したがって、かかるタンパク質配列、又はかかるタンパク質配列をコードする(コードすると予測される)核酸配列は、工程(i)で提供される配列の中から、工程(ii)において同定及び選択される。
【0052】
本発明者らは、潜在的なマイクロバイオータ薬剤候補について前記3つの基準を特定した。その理由は、それらが、シグナルペプチド、及び公知の相互作用分子、例えば、サイトカイン(インターロイキンなど)、ケモカイン、成長因子、神経ペプチド、ペプチドホルモンなどのサイズに対応する比較的小さなサイズによって反映される、マイクロバイオータタンパク質が宿主との相互作用に関与することを示すためである。更に、立体構造的に剛性な構造を与えるシステイン又は他の構造エレメントは、マイクロバイオータタンパク質を適切なコンフォメーションに「拘束」し、受容体又は他の相互作用タンパク質などの適切な(ヒト)標的に結合できるようにする。したがって、前記3つの基準を満たすヒトマイクロバイオータタンパク質は、後に調製でき且つ任意に以下に説明される関連するインビトロ又はインビボアッセイを行うことにより、それらの生物学的作用を試験できるタンパク質薬剤候補を、最も高い確率で表す。
【0053】
工程(i)で得られた配列を、工程(ii)における前記3つの選択基準について任意の順序で試験することができる。例えば、
-まず、シグナルペプチドについて試験し、その後、長さについて試験し、次いで、システイン又は剛性な構造を与える他のエレメントについて試験する、
-まず、シグナルペプチドについて試験し、その後、システイン又は剛性な構造を与える他のエレメントについて試験し、次いで、長さについて試験する、
-まず、長さについて試験し、その後、シグナルペプチドについて試験し、次いで、システイン又は剛性な構造を与える他のエレメントについて試験する、
-まず、長さについて試験し、その後、システイン又は剛体な構造を与える他のエレメントについて試験し、次いで、シグナルペプチドについて試験する、
-まず、システイン又は剛性な構造を与える他のエレメントについて試験し、その後、長さについて試験し、次いで、シグナルペプチドについて試験する、又は、
-まず、システイン又は剛性な構造を与える他のエレメントについて試験し、その後、シグナルペプチドをテストし、次いで、長さについて試験する。
【0054】
好ましくは、工程(i)で提供された配列における、シグナルペプチドを含む(又はコードする/コードするように予測される)配列は、(コードされた)タンパク質の長さ及び/又はシステイン含量(又は立体構造的に剛性な構造を与える構造エレメント)を決定する前に、同定される。次いで、シグナルペプチドの配列は、例えば、(コードされた)タンパク質の長さ及び/又はシステイン含量(又は立体構造的に剛性な構造を与える構造エレメント)を決定する前に、除去(「切断」、例えば、インシリコで)することができる。シグナルペプチドの長さ又はシグナルペプチドにおけるシステイン含量(又は他の構造エレメント)は、通常、「成熟した」マイクロバイオータタンパク質の宿主相互作用にとって重要ではない。その理由は、シグナルペプチドは、(例えば、マイクロバイオータ細胞の外側への)タンパク質の輸送/「放出」後に、切断されることが多いからである。したがって、工程(ii)では、好ましくは、(コードされた)タンパク質の長さ及び/又はシステイン含量(又は立体構造的に剛性な構造を与える構造エレメント)が決定される前に、シグナルペプチドの存在が決定される。シグナルペプチドを含まない配列は、「削除」されることがある、即ち、更なる分析において考慮されない。いくつかの実施形態においては、シグナルペプチドは、シグナルペプチドを(元々)含む(又はコードする)選択された配列から除去される(「切断される」、例えば、インシリコで)ので、シグナルペプチドは、更なる分析において考慮されない。
【0055】
したがって、工程(ii)において、シグナルペプチドを有する又はコードする配列の同定が、以下の前に行われることが好ましい。
-20~500アミノ酸長を有する配列又は20~500アミノ酸長を有する配列をコードする配列の同定;及び/又は
-システイン残基、又は立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを含む配列の同定。
【0056】
更に、前記シグナルペプチドの配列が、以下に含まれないことが好ましい。
-20~500アミノ酸長を有する配列又は20~500アミノ酸長を有する配列をコードする配列の同定;及び/又は
-システイン残基、又は立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを含む配列の同定。
【0057】
いくつかの実施形態においては、SignalPからのYスコアによって与えられる切断部位を使用して、シグナルペプチドを除去することができる。いくつかの場合においては、SignalPの2つの予測モード、グラム陽性とグラム陰性の両方が、タンパク質上の陽性シグナルペプチドを予測できるが、切断位置は異なる。かかる場合、ソフトウェアがシグナルペプチドの終端を示す、2つのSignalP予測間のタンパク質配列の最小座標として定義される、より小さな切断部位を考慮することができる。
【0058】
更に、シグナルペプチド切断部位を同定するためのバイオインフォマティクスツール(ソフトウェア)の更に好ましい例としては、以下が挙げられる。
- EMBOSS SigCleave (URL: http://emboss.bioinformatics.nl/cgi-bin/emboss/sigcleave; von Heijne, G. “A new method for predicting signal sequence cleavage sites” Nucleic Acids Res.: 14:4683 (1986); von Heijne, G. “Sequence Analysis in Molecular Biology: Treasure Trove or Trivial Pursuit” (Acad. Press, (1987), 113-117)); Peter M. Rice,Peter M. Rice, Alan J. Bleasby, Jon C. Ison,Alan J. Bleasby,Jon C. Ison: EMBOSS User’s Guide: Practical Bioinformatics, Cambridge University Press, 1st edition, June 2011);
- SignalCF (URL: http://www.csbio.sjtu.edu.cn/bioinf/Signal-CF/; Kuo-Chen Chou and Hong-Bin Shen, Signal-CF: A subsite-coupled and window-fusing approach for predicting signal peptides, Biochem Biophys Res Comm, 2007,357: 633-640);
- SPEPlip (URL: http://gpcr.biocomp.unibo.it/cgi/predictors/spep/pred_spepcgi.cgi; Piero Fariselli, Giacomo Finocchiaro, Rita Casadio; SPEPlip: the detection of signal peptide and lipoprotein cleavage sites, Bioinformatics, Volume 19, Issue 18, 12 December 2003, Pages 2498-2499);
- PrediSi (URL: http://www.predisi.de/; Hiller K, Grote A, Scheer M, Munch R, Jahn D. PrediSi: prediction of signal peptides and their cleavage positions. Nucleic Acids Res. 2004 Jul 1;32(Web Server issue):W375-9));及び
- ANTHEPROT (URL: http://antheprot-pbil.ibcp.fr/signal_prediction.html; Deleage G, Combet C, Blanchet C, Geourjon C. ANTHEPROT: an integrated protein sequence analysis software with client/server capabilities. Computers in biology and medicine. 2001;31:259-267)。
【0059】
いくつかの実施形態においては、(コードされた)マイクロバイオータタンパク質の長さが、(コードされた)タンパク質のシステイン含量(又は立体構造的に剛性な構造を与える構造エレメント)が決定される前に、20~500アミノ酸であるかどうか決定することができる。例えば、システイン含量は、パーセンテージで表すことができる(システイン:総アミノ酸)。かかる場合、システインのパーセンテージを計算するために、タンパク質の長さが必要である。
【0060】
前記を考慮すると、以下の順序で前記3つの基準を試験することが有利であり得る:
1.(未切断(プレタンパク質/プロドラッグ)バージョンで)シグナルペプチドを含むタンパク質を選択する;
2.20~500アミノ酸長のタンパク質を選択する;及び
3.少なくとも2つのシステイン残基及び/又は立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを含むタンパク質を選択する。
【0061】
前記基準の3つ全ては満たさないマイクロバイオータタンパク質の配列(又はマイクロバイオータタンパク質をコードする核酸配列)は、更なる分析において無視される(「削除される」)。換言すれば、3つの基準の全てを満たし、ヒトマイクロバイオータタンパク質薬剤候補となる、マイクロバイオータタンパク質のかかる配列(又はマイクロバイオータタンパク質をコードする核酸配列)のみが、前記方法の更なる工程に選択される。
【0062】
シグナルペプチド
工程(ii)において、シグナルペプチドを有する複数の配列が同定される。シグナルペプチドを有さない配列は、除去/消去され得る。
【0063】
本明細書においては、用語「シグナルペプチド」は、細胞質膜を横切る移行のためのカーゴタンパク質を標的とする遍在タンパク質選別シグナルを意味する。通常、シグナルペプチドは短いペプチド(例えば、16~30アミノ酸長)であり、通常、新たに合成され、分泌されるタンパク質のN末端に位置する。したがって、シグナルペプチドの存在は、タンパク質が分泌されることを示す。用語「シグナルペプチド」は、「シグナルアンカー配列」と称されることもあるシグナルペプチドとして機能する膜貫通ドメインも含み得る。
【0064】
原核生物では、シグナルペプチドは、新たに合成されたタンパク質を、原形質膜に存在するSecYEGタンパク質伝達チャネルに向ける。Sec経路は、グラム陽性菌とグラム陰性菌の両方に存在する古典的経路であり、通常、折り畳まれていないタンパク質の輸送に用いられる。別のタンパク質標的経路は、Tat経路であり、これは、ごく一部のタンパク質にのみ用いられる(例えば、E.coliの分泌タンパク質の6%)。Tat経路は、通常、より長く、既に折り畳まれた、通常、ペリプラズマに送達されるタンパク質の輸送に用いられる。Tat経路も、タンパク質のN末端の非常に類似したシグナルペプチドに基づくが、更に2つのアルギニンモチーフを有している。
【0065】
シグナルペプチドは、共通の構造モチーフによって認識され得る。各種タンパク質からのシグナルペプチドの共通構造は、通常、単一のアルファヘリックスを形成する傾向があり、「h領域」とも称される、疎水性アミノ酸の長い領域(stretch)(約5~16残基長)を含む疎水性コアによって特徴付けられる。多くのシグナルペプチドは、短い正に帯電したアミノ酸の領域で始まる。これは、ポジティブインサイド規則として知られているものによって、移行中にポリペプチドの適切なトポロジーを強制するのに役立ち得る。N末端近傍に位置することから、「n領域」と称される。更に、多くのシグナルペプチドは、C末端に、中性であるが極性の「c領域」を含む。シグナルペプチドは、通常、輸送プロセスの最後に切断される。(-3、-1)規則は、切断が正しく行われるためには、(切断部位に対して)-3位及び-1位の残基が小さく、中性である必要がることを述べている。しかし、この切断部位は、通常、シグナルペプチドとして機能する膜貫通ドメインには存在しない。シグナルペプチダーゼは、移行中又は移行完了後に切断されて、遊離シグナルペプチド及び成熟タンパク質を生成し得る。
【0066】
更に、多数のシグナルペプチド配列が当技術分野で知られており、例えば、シグナルペプチドデータベースで利用可能である。かかるシグナルペプチドデータベースの例としては、シグナルペプチドのウェブサイト(URL: http://www.signalpeptide.de/)、SPdb(URL: http://proline.bic.nus.edu.sg/spdb/; Choo KH, Tan TW, Ranganathan S. SPdb--a signal peptide database. BMC Bioinformatics. 2005 Oct 13;6:249)、及びLocSigDB(URL: http://genome.unmc.edu/LocSigDB/; Simarjeet Negi, Sanjit Pandey, Satish M. Srinivasan, Akram Mohammed, Chittibabu Guda; LocSigDB: a database of protein localization signals, Database, Volume 2015, 1 January 2015, bav003)が挙げられる。更に、シグナルペプチドは、タンパク質データベース、例えば、UniProt(URL: https://www.uniprot.org/; The UniProt Consortium. UniProt: the universal protein knowledgebase. Nucleic Acids Res. 45: D158-D169 (2017))でのアノテーションから取得することができる。
【0067】
更に、シグナルペプチドは、バイオアッセイに基づいて決定することができる。例えば、タンパク質を発現させることができ、その位置(例えば、細胞の内側又は外側、膜内又は膜上)を調べることができる。この目的のために、タンパク質を、ラベル化又はタグ付けすることができる。更に、変異分析を行うことができる。
【0068】
しかし、好ましくは、シグナルペプチドの同定は、インシリコで行われる。いくつかの実施形態においては、シグナルペプチドは、膜貫通ヘリックスの非常に類似した疎水性領域とシグナルペプチドのそれとを区別することができるバイオインフォマティックツールを使用することによって同定することができる。更に、Hidden Markov Models又はNeural Networkベースのソフトウェアを用いるバイオインフォマティックツールを使用することもできる。
【0069】
シグナルペプチドを同定するための好ましいバイオインフォマティクスツール(ソフトウェア)の例としては、以下が挙げられる。
- Phobius (A combined transmembrane topology and signal peptide predictor, Stockholm Bioinformatics Centre; URL: http://phobius.sbc.su.se/; Lukas Kall, Anders Krogh and Erik L. L. Sonnhammer. A Combined Transmembrane Topology and Signal Peptide Prediction Method. Journal of Molecular Biology, 338(5):1027-1036, May 2004; Lukas Kall, Anders Krogh and Erik L. L. Sonnhammer. Advantages of combined transmembrane topology and signal peptide prediction--the Phobius web server Nucleic Acids Res., 35:W429-32, July 2007);
- SignalP (current version: 4.1; Center for biological sequence analysis, Technical University of Denmark DTU; URL: www.cbs.dtu.dk/services/SignalP; Henrik Nielsen, Jacob Engelbrecht, Soren Brunak and Gunnar von Heijne. Identification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites. Protein Engineering, 10:1-6, 1997; Thomas Nordahl Petersen, Soren Brunak, Gunnar von Heijne & Henrik Nielsen. SignalP 4.0: discriminating signal peptides from transmembrane regions. Nature Methods, 8:785-786, 2011):
- PSORT (URL: https://psort.hgc.jp/; Nakai, K. and Horton, P., PSORT: a program for detecting the sorting signals of proteins and predicting their subcellular localization, Trends Biochem. Sci, 24(1) 34-35 (1999));
- SignalCF (URL: http://www.csbio.sjtu.edu.cn/bioinf/Signal-CF/; Kuo-Chen Chou and Hong-Bin Shen, Signal-CF: A subsite-coupled and window-fusing approach for predicting signal peptides, Biochem Biophys Res Comm, 2007,357: 633-640);
- Signal-3L (URL: http://www.csbio.sjtu.edu.cn/bioinf/Signal-3L/; Yi-Ze Zhang and Hong-Bin Shen, “Signal-3L 2.0: A hierarchical mixture model for enhancing protein signal peptide prediction by incorporating residue-domain cross level features”, Journal of Chemical Information and Modeling, 2017, 57: 988-999; Hong-Bin Shen and Kuo-Chen Chou, “Signal-3L: a 3-layer approach for predicting signal peptides”, Biochemical and Biophysical Research Communications, 2007, 363: 297-303);
- Signal-BLAST (URL: http://sigpep.services.came.sbg.ac.at/signalblast.html; Karl Frank; Manfred J. Sippl: High Performance Signal Peptide Prediction Based on Sequence Alignment Techniques. Bioinformatics, 24, pp. 2172-2176 (2008);
- PrediSi (URL: http://www.predisi.de/; Hiller K, Grote A, Scheer M, Munch R, Jahn D. PrediSi: prediction of signal peptides and their cleavage positions. Nucleic Acids Res. 2004 Jul 1;32(Web Server issue):W375-9));
- OCTOPUS/SPOCTOPUS (URL: http://octopus.cbr.su.se/; Viklund H, Elofsson A. OCTOPUS: improving topology prediction by two-track ANN-based preference scores and an extended topological grammar. Bioinformatics. 2008 Aug 1;24(15):1662-8; Viklund H, Bernsel A, Skwark M, Elofsson A. SPOCTOPUS: a combined predictor of signal peptides and membrane protein topology. Bioinformatics. 2008 Dec 15;24(24):2928-9);
- Philius (URL: http://www.yeastrc.org/philius; Reynolds SM, Kall L, Riffle ME, Bilmes JA, Noble WS (2008) Transmembrane Topology and Signal Peptide Prediction Using Dynamic Bayesian Networks. PLoS Comput Biol 4(11): e1000213);
- ANTHEPROT (URL: http://antheprot-pbil.ibcp.fr/signal_prediction.html; Deleage G, Combet C, Blanchet C, Geourjon C. ANTHEPROT: an integrated protein sequence analysis software with client/server capabilities. Computers in biology and medicine. 2001;31:259-267);
- SOSUIsignal (URL: http://harrier.nagahama-i-bio.ac.jp/sosui/sosuisignal/sosuisignal_submit.html; Gomi M., Sonoyama M., and Mitaku S., High performance system for signal peptide prediction: SOSUIsignal. Chem-Bio Info. J., 4 142-147 (2004));
- TMHMM (URL: http://www.cbs.dtu.dk/services/TMHMM/; Krogh A, Larsson B, von Heijne G, Sonnhammer EL. Predicting transmembrane protein topology with a hidden Markov model: application to complete genomes. J Mol Biol. 2001;305(3):567-80; for prediction of transmembrane helices in proteins);及び
- SPEPlip (URL: http://gpcr.biocomp.unibo.it/cgi/predictors/spep/pred_spepcgi.cgi; Piero Fariselli, Giacomo Finocchiaro, Rita Casadio; SPEPlip: the detection of signal peptide and lipoprotein cleavage sites, Bioinformatics, Volume 19, Issue 18, 12 December 2003, Pages 2498-2499)。
【0070】
これらの例示されたバイオインフォマティクスツール(ソフトウェア)の1以上を、本発明に係るヒトマイクロバイオータタンパク質薬剤候補を提供するための方法におけるシグナルペプチドの同定に用いることができる。
【0071】
好ましくは、本発明に係るヒトマイクロバイオータタンパク質薬剤候補を提供するための方法におけるシグナルペプチドの同定は、Phobius及び/又はSignalPなどのシグナルペプチドを予測するためのソフトウェアを使用することによって行われる。シグナルペプチドを予測するためのかかるソフトウェアは、デフォルト設定を適用することによって使用することができる。例えば、工程(ii)におけるシグナルペプチドの同定は、Phobius及び/又はSignalPを使用することによって行われる。
【0072】
いくつかの実施形態においては、本発明の方法は、シグナルペプチドを同定するための単一の工程を含み、シグナルペプチドを同定するための単一の方法(例えば、前記した単一のバイオインフォマティクスツール)が1度行われる。しかし、より好ましくは、工程(ii)におけるシグナルペプチドの同定は、2つの異なる方法を用いることによって行われ、両方の方法にしたがうシグナルペプチドを有する配列又はコードする配列が選択される。いくつかの実施形態においては、2つの異なるバイオインフォマティックツール(即ち、2つの異なる方法)が、シグナルペプチドの同定に使用され、シグナルペプチドを含む得られたタンパク質が、両方の方法によって同定されるタンパク質に対応する。これにより、アノテーションの信頼性が向上する。例えば、PhobiusとSignalPを(組み合わせて)使用して、シグナルペプチドを含むタンパク質を同定することができる。いくつかの実施形態においては、Phobiusが、シグナルペプチドを含むタンパク質を同定するために使用され、その後、SignalPが、シグナルペプチドを含むタンパク質を同定するために使用されて、シグナルペプチドを含む得られたタンパク質が、両方の方法によって同定されるタンパク質に対応する。他の実施形態においては、SignalPが、シグナルペプチドを含むタンパク質を同定するために使用され、その後、Phobiusが、シグナルペプチドを含むタンパク質を同定するために使用されて、シグナルペプチドを含む得られたタンパク質が、両方の方法によって同定されるタンパク質に対応する。したがって、本発明の方法は、複数の、例えば、2つ又は3つのシグナルペプチドの同定工程を含むことができる。
【0073】
複数の、例えば、2つ又は3つのシグナルペプチドの同定工程は、互いに対してその直後に行うことができるが、2以上のシグナルペプチドの同定工程の間に他の工程を行うもできる。例えば、シグナルペプチドは、第1の方法によって決定することができ、その後、他の工程、例えば、配列のアノテーション及び/又は冗長な配列の除去を行うことができ、その後、選択されたペプチドを、シグナルペプチドを同定するための前記第1の方法とは異なる第2の方法によってシグナルペプチドについてチェックすることができる。
【0074】
また、(例えば、前記したように同定され得るSecシグナルペプチドに加えて)Tatシグナルペプチドが同定されることも好ましい。Tatシグナルペプチドは、Secターゲティング経路に使用されるものと同一の予測方法(即ち、前記予測方法)で検出することができる。また、TatP(URL: http://www.cbs.dtu.dk/services/TatP/; Jannick Dyrlov Bendtsen, Henrik Nielsen, David Widdick, Tracy Palmer and Soren Brunak. Prediction of twin-arginine signal peptides. BMC bioinformatics 2005 6: 167)又はSignal Find Server(URL: http://signalfind.org/)とTATFIND(URL: http://signalfind.org/tatfind.html; Rose, R.W., T. Bruser,. J. C. Kissinger, and M. Pohlschroder. 2002. Adaptation of protein secretion to extremely high salt concentrations by extensive use of the twin arginine translocation pathway. Mol. Microbiol. 5: 943-950; Dilks, K., W. R. Rose, E. Hartmann, and M. Pohlschorder. 2003. Prokaryotic use of the twin arginine translocation pathway: A Genomic Survey. J. Bacteriol. 185:1478-1483)などの、専用のバイオインフォマティックツール/ソフトウェアによっても同定することができる。更に、PFAMデータベース(PFAM PF10518; URL: http://pfam.xfam.org/family/TAT_signal; Berks BC; A common export pathway for proteins binding complex redox cofactors? Mol Microbiol. 1996;22:393-404)に存在するものなど、2つのアルギニンモチーフを検出する保存されたタンパク質モチーフ及びファミリーを検出できるソフトウェアを使用することができる。
【0075】
いくつかの実施形態においては、シグナルペプチドを有する配列を同定する工程は、分泌タンパク質のシグナルペプチド及び膜貫通ドメインを意味する。例えば、シグナルペプチドを予測するためのバイオインフォマティクスツール(SignalPなど)を、膜貫通ドメインを同定するためのバイオインフォマティクスツール(TMHMMなど)と組み合わせることができ、その結果、シグナルペプチド及び/又は膜貫通ドメイン(いずれか又は両方)を有すると予測されるタンパク質を選択することができる。他の実施形態においては、シグナルペプチドを有する配列を同定する工程は、分泌タンパク質についてのみに関するシグナルペプチドを意味する。
【0076】
いくつかの実施形態においては、ヒトマイクロバイオータタンパク質薬剤候補は、膜貫通ドメインを含まない。この目的のために、本発明に係るヒトマイクロバイオータタンパク質薬剤候補を提供するための方法の工程(ii)は、膜貫通ドメインを有するタンパク質を排除又は除去する任意のサブ工程を含むことができる。これは、前記したように、膜貫通ヘリックスの非常に類似した疎水性領域とシグナルペプチドのそれとを区別することができるバイオインフォマティックツールを使用することによって達成することができる。いくつかの実施形態においては、膜貫通ドメインを含むタンパク質は、(膜貫通ドメインの同定のための)専用のバイオインフォマティクスツールによって同定することができ、かかる膜貫通タンパク質を除去することができる。それにより、分泌タンパク質であるヒトマイクロバイオータタンパク質薬剤候補を得ることができる。本発明においては、ヒトマイクロバイオータタンパク質薬剤候補は、分泌タンパク質であることが好ましい。
【0077】
いくつかの実施形態においては、本発明に係るヒトマイクロバイオータタンパク質薬剤候補を提供するための方法の工程(ii)は、分泌タンパク質のシグナルペプチドをグラム陰性菌のリポタンパク質から区別する任意のサブ工程を更に含む。
【0078】
分泌タンパク質のシグナルペプチドをグラム陰性菌のリポタンパク質から区別するかかるサブ工程は、好ましくは、前記したようにシグナルペプチドの同定後に行われる。分泌タンパク質のシグナルペプチドをグラム陰性菌のリポタンパク質から区別するサブ工程は、シグナルペプチドの同定の直後に行うことができるが、例えば、シグナルペプチドの切断後及び/又はシステイン含量(又は剛性なタンパク質)の決定後などの後の段階で行うこともできる。
【0079】
グラム陰性菌のリポタンパク質のシグナルペプチドは、分泌タンパク質のシグナルペプチドに類似していることがある。したがって、これらの2つのグループ間を区別し(即ち、グラム陰性菌のリポタンパク質の配列を同定し)、グラム陰性菌のリポタンパク質の配列を除去する(又は、分泌タンパク質のシグナルペプチドを含むが、グラム陰性菌のリポタンパク質のシグナルペプチドを含まない配列のみを維持する)ことが有利であり得る。
【0080】
細菌のリポタンパク質を同定するためのバイオインフォマティクスツール(ソフトウェア)の好ましい例としては、以下が挙げられる。
- LipoP (URL: http://www.cbs.dtu.dk/services/LipoP/; Juncker, A. S., Willenbrock, H., von Heijne, G., Brunak, S., Nielsen, H., & Krogh, A. (2003). Prediction of lipoprotein signal peptides in Gram-negative bacteria. Protein Science, 12(8), 1652-1662; O. Rahman, S. P. Cummings, D. J. Harrington and I. C. Sutcliffe: Methods for the bioinformatic identification of bacterial lipoproteins encoded in the genomes of Gram-positive bacteria. World Journal of Microbiology and Biotechnology 24(11):2377-2382 (2008));
- PRED-LIPO (URL: http://biophysics.biol.uoa.gr/PRED-LIPO/; Bagos PG, Tsirigos KD, Liakopoulos TD, Hamodrakas SJ. Prediction of lipoprotein signal peptides in Gram-positive bacteria with a Hidden Markov Model. J Proteome Res. 2008 Dec;7(12):5082-93);
- DOLOP (URL: https://www.mrc-lmb.cam.ac.uk/genomes/dolop/; Babu MM, Priya ML, Selvan AT, Madera M, Gough J, Aravind L, Sankaran K. A database of bacterial lipoproteins (DOLOP) with functional assignments to predicted lipoproteins. J Bacteriol. 2006 Apr;188(8):2761-73);
- LIPPRED (URL: http://www.jenner.ac.uk/LipPred/; Taylor PD, Toseland CP, Attwood TK, Flower DR. LIPPRED: A web server for accurate prediction of lipoprotein signal sequences and cleavage sites. Bioinformation. 2006;1(5):176-179);
- LIPO (URL: http://services.cbu.uib.no/tools/lipo; Berven FS, Karlsen OA, Straume AH, Flikka K, Murrell JC, Fjellbirkeland A, Lillehaug JR, Eidhammer I, Jensen HB. Analysing the outer membrane subproteome of Methylococcus capsulatus (Bath) using proteomics and novel biocomputing tools. Arch Microbiol. 2006 Feb;184(6):362-77);及び
- SPEPlip (URL: http://gpcr.biocomp.unibo.it/cgi/predictors/spep/pred_spepcgi.cgi; Piero Fariselli, Giacomo Finocchiaro, Rita Casadio; SPEPlip: the detection of signal peptide and lipoprotein cleavage sites, Bioinformatics, Volume 19, Issue 18, 12 December 2003, Pages 2498-2499)。
【0081】
好ましくは、LipoPは、分泌タンパク質のシグナルペプチドとグラム陰性菌のリポタンパク質のシグナルペプチドとを区別するために使用される。特に、LipoPは、タンパク質配列に対して予測を行って、コードされたリポタンパク質シグナルペプチドのタイプを決定する。タイプI(SpI)は、通常のシグナルペプチドであり、タイプII(SpII)は、リポタンパク質シグナルペプチドであり、通常、ペリプラズム内に位置するタンパク質にみられる。
【0082】
分泌タンパク質のシグナルペプチドと、グラム陰性菌のリポタンパク質のシグナルペプチドとを区別するためのバイオインフォマティクスツールに加えて、配列の分類学的割り当てを考慮することも好ましい。該当タンパク質をコードする対応する遺伝子に分類学的割り当てが利用可能な場合、その割り当てを用いて、可能なリポタンパク質を区別することができる。ヒト腸内微生物遺伝子の分類学的アノテーションは、Li J, Jia H, Cai X, Zhong H, Feng Q, Sunagawa S, Arumugam M, Kultima JR, Prifti E, Nielsen T, Juncker AS, Manichanh C, Chen B, Zhang W, Levenez F, Wang J, Xu X, Xiao L, Liang S, Zhang D, Zhang Z, Chen W, Zhao H, Al-Aama JY, Edris S, Yang H, Wang J, Hansen T, Nielsen HB, Brunak S, Kristiansen K, Guarner F, Pedersen O, Dore J, Ehrlich SD; MetaHIT Consortium, Bork P, Wang J; MetaHIT Consortium. An integrated catalog of reference genes in the human gut microbiome. Nat Biotechnol. 2014 Aug;32(8):834-41に記載される手順にしたがって行うことができる。
【0083】
タンパク質長
本発明に係るヒトマイクロバイオータタンパク質薬剤候補を提供するための方法の工程(ii)は、配列の長さを評価し、配列が所定長範囲の長さ、即ち、20~500アミノ酸を有する配列を選択するサブ工程を含む。タンパク質は、好ましくは20~350アミノ酸長、より好ましくは20~200アミノ酸長を有する。
【0084】
したがって、この工程においては、タンパク質長の分布が評価され、長さのカットオフが、関心のあるタンパク質の特定グループ、例えば、短い非酵素的タンパク質及び/又は機能的活性を有するタンパク質をコードするより長い配列に応じて設定される。
【0085】
このサブ工程においては、20アミノ酸以上のタンパク質をコードする配列又は20アミノ酸以上のタンパク質の配列が選択される。いくつかの場合においては、25以上、好ましくは30以上、より好ましくは35以上、更により好ましくは40以上、更により好ましくは45以上、最も好ましくは50以上のアミノ酸長を有する、タンパク質をコードする配列又はタンパク質の配列が選択される。これにより、アノテーションの偏り及びアーチファクトに起因し得る小さなペプチドを避けることができる。
【0086】
更に、500以下のアミノ酸長、好ましくは450以下のアミノ酸長、より好ましくは400以下のアミノ酸長、更により好ましくは350以下のアミノ酸長、更により好ましくは300以下のアミノ酸長、最も好ましくは250以下のアミノ酸長(例えば、200アミノ酸長以下又は150アミノ酸長以下)を有するタンパク質をコードする配列又はタンパク質の配列が選択される。これにより、サイトカイン、ケモカイン、成長因子、神経ペプチド、ペプチドホルモンなどの、相互作用分子に通常見られるサイズを有する比較的小さなタンパク質を選択するために、選択されるタンパク質の最大長が限定される。
【0087】
いくつかの実施形態においては、25~450アミノ酸長、好ましくは30~400アミノ酸長、より好ましくは35~350アミノ酸長、更により好ましくは40~300アミノ酸長、更に好ましくは45~250アミノ酸長を有する、タンパク質をコードする配列又はタンパク質の配列が選択される。例えば、50~200アミノ酸長又は50~150アミノ酸長を有するタンパク質をコードする配列又はタンパク質の配列が選択される。
【0088】
いくつかの実施形態においては、タンパク質長は、(その機能状態の)「成熟」タンパク質で評価される、即ち、成熟/機能タンパク質で除去されるシグナルペプチドなどの「補助的な」プレタンパク質配列は、タンパク質長に考慮されないことがある。この目的のために、シグナルペプチドは、前記したように同定及び除去(「切断」、例えば、適切なバイオインフォマティクスツールを用いたインシリコで)することができる。好ましくは、(シグナルペプチドを含まない)ヒトマイクロバイオータタンパク質の長さは、20~500アミノ酸長の(シグナルペプチドを含まない)タンパク質など、500アミノ酸を超えない。例えば、(シグナルペプチドを含まない)タンパク質の最大長は、400又は350アミノ酸であり得る。より好ましくは、(シグナルペプチドを含まない)マイクロバイオータタンパク質の最大長は、250アミノ酸を超えず、例えば、240、230、220、210、200、190、180、170、160、150、140、130、120、110、100、95、90、85、80、75、70、65、60、55、50、45、40、35、30、29、28、27、26、25、24、23、22、21、又は20アミノ酸以下である。(シグナルペプチドを含まない)最小の長さは、通常、20アミノ酸である。いくつかの実施形態においては、(シグナルペプチドを含まない)マイクロバイオータタンパク質は、20~350アミノ酸長、好ましくは20~300アミノ酸長、より好ましくは20~250アミノ酸長、更により好ましくは20~200アミノ酸長、更に好ましくは20~150アミノ酸長、例えば、20~40、50、60、70、80、90、100、110、120、130、又は140アミノ酸長を有する。
【0089】
他の実施形態においては、タンパク質長は、「プレタンパク質」、即ち、シグナルペプチドを含んで評価される。好ましくは、(シグナルペプチドを含む)ヒトマイクロバイオータタンパク質の長さは、(シグナルペプチドを含まない)50~550アミノ酸長のタンパク質など、550アミノ酸を超えない。例えば、(シグナルペプチドを含む)タンパク質の最大長は、500アミノ酸又は400アミノ酸であり得る。より好ましくは、(シグナルペプチドを含む)マイクロバイオータタンパク質の最大長は、350アミノ酸を超えない、例えば、340、330、320、310、200、290、280、270、260、250、240、230、220、210、200、190、180、170、160、150、140、130、120、110、100、95、90、85、80、75、70、65、60、55、又は50アミノ酸以下である。(シグナルペプチドを含む)最小の長さは、通常、50アミノ酸である。いくつかの実施形態においては、(シグナルペプチドを含む)マイクロバイオータタンパク質は、50~400アミノ酸長、好ましくは50~350アミノ酸長、より好ましくは50~300アミノ酸長、更により好ましくは50~250アミノ酸長、更に好ましくは50~200アミノ酸長、例えば、50~60、70、80、90、100、110、120、130、140、150、160、170、180、又は190アミノ酸長である。
【0090】
システイン含量、及び立体構造的に剛性な構造を与える構造エレメント
本発明に係るヒトマイクロバイオータタンパク質薬剤候補を提供するための方法の工程(ii)において、かかるタンパク質配列又はかかるタンパク質をコードする核酸配列が同定及び選択され、前記タンパク質は、
(a)少なくとも2つのシステイン残基、及び/又は
(b)立体構造的に剛性な構造を前記タンパク質に与える一次及び/又は二次構造エレメントを含む。
かかるタンパク質は、それらのコンフォメーションを容易には変更できない、即ち、タンパク質のコンフォメーションは拘束される。これにより、タンパク質は、標的(例えば、マイクロバイオータタンパク質のヒト標的)と相互作用する(例えば、結合する)ために必要なコンフォメーションを維持する。
【0091】
前記を考慮すると、少なくとも2つのシステイン残基(システイン対を形成し得る)を含むタンパク質を、同定及び選択することができる。システイン残基は、タンパク質を正しいコンフォメーションで安定化させる。いくつかの実施形態においては、前記タンパク質は、3、4、5、6、7、8、9、10、またそれ以上のシステイン残基を含む。例えば、マイクロバイオータタンパク質は、2つ又は3つのシステイン残基(例えば、1つのシステイン対を形成する)、より好ましくは4つ又は5つのシステイン残基(例えば、2つのシステイン対を形成する)、更により好ましくは6つ又は7つのシステイン残基(例えば、3つのシステイン対を形成する)、更により好ましくは8つ又は9つのシステイン残基(例えば、4つのシステイン対を形成する)を含み得る。システイン残基、特に、システイン対間のジスルフィド結合は、タンパク質に剛性の高い構造を与える。したがって、システイン結合をもたらし得るシステインモチーフを含むタンパク質の配列が同定されることが好ましい。したがって、マイクロバイオータタンパク質は、好ましくは、偶数個のシステイン残基を含む。
【0092】
マイクロバイオータタンパク質のシステイン含量は、タンパク質長を考慮して計算することもできる。好ましくは、マイクロバイオータタンパク質は、少なくとも1%のシステイン含量を有する。より好ましくは、マイクロバイオータタンパク質は、少なくとも2%のシステイン含量を有する。更により好ましくは、マイクロバイオータタンパク質は、少なくとも3%のシステイン含量を有する。更により好ましくは、マイクロバイオータタンパク質は、少なくとも4%のシステイン含量を有する。最も好ましくは、マイクロバイオータタンパク質(又はその断片又は配列変異体)は、少なくとも5%のシステイン含量を有する。例えば、タンパク質(又はその断片又は配列変異体)は、約6~8%、例えば、約6.5~7%のシステイン含量を有することができる。
【0093】
マイクロバイオータタンパク質が、偶数個のシステイン残基を含むことも好ましい。これにより、タンパク質中の全てのシステイン残基が、ジスルフィド結合(「ジスルフィド架橋」とも称される)の形成に関与する可能性が高まる。しかし、システイン残基の数が偶数個ではないタンパク質も、3つ以上のシステイン残基を含む場合、ジスルフィド結合を含むことができることが理解される。
【0094】
いくつかの実施形態においては、タンパク質内のシステイン数が決定される(数えられる)。例えば、少なくとも2つのシステイン残基を含むタンパク質は、タンパク質中のシステイン残基数を数えることによって同定することができる。
【0095】
他の実施形態においては、タンパク質のシステイン含量は、KAPPA(http://kappa-sequence-search.sourceforge.net; Joly V, Matton DP. KAPPA, a simple algorithm for discovery and clustering of proteins defined by a key amino acid pattern: a case study of the cysteine-rich proteins. Bioinformatics. 2015 Jun 1;31(11):1716-23)などのバイオインフォマティクスツールを使用して同定することができる。KAPPAは、システインモチーフとこれらのモチーフの類似性にしたがってタンパク質をグループ化するの追加情報を提供できる。したがって、KAPPAは、システイン数に加えて、分泌タンパク質内の特定のシステインモチーフの存在を同定するのに特に有用である。
【0096】
いくつかの実施形態においては、少なくとも2つのシステイン残基を含むタンパク質の同定及び選択は、シグナルペプチドのアミノ酸/配列を考慮せずに行われる。その理由は、シグナルペプチドが通常、切断され、成熟タンパク質はシグナルペプチドを含まないためである。したがって、少なくとも2つのシステイン残基を含むタンパク質の同定において、シグナルペプチドのアミノ酸/配列は、考慮しないことが好ましい。したがって、少なくとも2つのシステイン残基を含むタンパク質の同定及び選択に先立ち、シグナルペプチドの配列をタンパク質配列から除去(インシリコで切断)することが好ましい。シグナルペプチドの除去(「切断」)は、前記したように、例えば、切断部位を同定し、シグナルペプチドを除去(例えば、インシリコで)することによって行うことができる。
【0097】
好ましくは、ヒトマイクロバイオータタンパク質(特に、シグナルペプチドを考慮しない)は、20~200アミノ酸長を有し、少なくとも2つのシステイン残基を含む(例えば、1つのシステイン対を形成する)。例えば、マイクロバイオータタンパク質(特に、シグナルペプチドを考慮しない)は、50~150アミノ酸長を有し、少なくとも4つのシステイン残基を含み得る(例えば、2つのシステイン対を形成する);又はマイクロバイオータタンパク質は、75~150アミノ酸長を有し、少なくとも6つのシステイン残基を含み得る(例えば、3つのシステイン対を形成する)。より好ましくは、マイクロバイオータタンパク質(特に、シグナルペプチドを考慮しない)は、(i)20~100アミノ酸長を有し、少なくとも4つのシステイン残基を含む(例えば、2つのシステイン対を形成する);(ii)50~150アミノ酸長を有し、少なくとも6つのシステイン残基を含む(例えば、3つのシステイン対を形成する);又は(iii)75~200アミノ酸長を有し、少なくとも8つのシステイン残基を含む(例えば、4つのシステイン対を形成する)。かかるタンパク質は、少なくとも4%のシステイン含量を有する。更により好ましくは、マイクロバイオータタンパク質(特に、シグナルペプチドを考慮しない)は、(i)20~75アミノ酸長を有し、少なくとも4つのシステイン残基を含む(例えば、2つのシステイン対を形成する);(ii)50~100アミノ酸長を有し、少なくとも6つのシステイン残基を含む(例えば、3つのシステイン対を形成する);又は(iii)75~125アミノ酸長を有し、少なくとも8つのシステイン残基を含む(例えば、4つのシステイン対を形成する)。かかるタンパク質は、5%を超えるシステイン含量を有する。
【0098】
マイクロバイオータタンパク質が、立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを含むことも好ましい。かかる一次及び/又は二次構造エレメントは、システインモチーフ、ロイシンリッチリピート(LRR)、アルファヘリックス(αヘリックス)、ベータシート(βシート)、及びコイルからなる群から選択することができる。例えば、立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントは、ジスルフィド架橋である。
【0099】
或いは、剛性なタンパク質、即ち、立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを含むタンパク質は、特に、剛性なタンパク質の同定のためのバイオインフォマティクスツールを使用することによって、インシリコで同定することができる。剛性なタンパク質の同定のためのバイオインフォマティクスツールの例としては、以下が挙げられる。
- PSIpred (Predict Secondary Structure) (URL: http://bioinf.cs.ucl.ac.uk/psipred/; Jones DT, Protein secondary structure prediction based on position-specific scoring matrices, J Mol Biol. 1999 Sep 17;292(2):195-202);
- HHblits (Remmert M, Biegert A, Hauser A, Soding J, HHblits: lightning-fast iterative protein sequence searching by HMM-HMM alignment, Nature Methods volume 9, 173-175(2012);
- MADOKA (Deng L, Zhong G, Liu C, Luo J, Liu H, MADOKA: an ultra-fast approach for large-scale protein structure similarity searching, BMC Bioinformatics. 2019 Dec 24;20(Suppl 19):662);
- JPRED (URL: https://www.compbio.dundee.ac.uk/jpred/index.html; Drozdetskiy A, Cole C, Procter J, Barton GJ. JPred4: a protein secondary structure prediction server. Nucleic Acids Res. 2015 Jul 1;43(W1):W389-94);
- SWISS-MODEL (URL: https://swissmodel.expasy.org/; Waterhouse, A., Bertoni, M., Bienert, S., Studer, G., Tauriello, G., Gumienny, R., Heer, F.T., de Beer, T.A.P., Rempfer, C., Bordoli, L., Lepore, R., Schwede, T. SWISS-MODEL: homology modelling of protein structures and complexes. Nucleic Acids Res. 46(W1), W296-W303 (2018); Bertoni, M., Kiefer, F., Biasini, M., Bordoli, L., Schwede, T. Modeling protein quaternary structure of homo- and hetero-oligomers beyond binary interactions by homology. Scientific Reports 7 (2017));
- KINARI (KINematics And Rigidity) and Kinari-2 (URL: http://kinari.cs.umass.edu/Site/index.html; Naomi Fox, Filip Jagodzinski, Yang Li, Ileana Streinu. KINARI-Web: A Server for Protein Rigidity Analysis, Nucleic Acids Research, 39 (Web Server Issue), 2011; Streinu I. Large scale rigidity-based flexibility analysis of biomolecules. Struct Dyn. 2016;3(1):012005);及び
- PredyFlexy (URL: https://www.dsimb.inserm.fr/dsimb_tools/predyflexy/; de Brevern AG, Bornot A, Craveur P, Etchebest C, Gelly JC. PredyFlexy: flexibility and local structure prediction from sequence. Nucleic Acids Res. 2012;40(Web Server issue):W317-W322)。
【0100】
例えば、マイクロバイオータタンパク質(特に、シグナルペプチドを考慮しない)は、(i)20~50アミノ酸長を有し、立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを含む;又は(ii)20~50アミノ酸長を有し、アルファヘリックス(αヘリックス)、ベータシート(βシート)、及びコイルからなる群から選択される二次構造エレメントを含む。
【0101】
追加の任意のサブ工程
前記3つの基準にしたがう配列の選択に加えて、工程(ii)の1以上の更なるサブ工程を行うことができる。かかる任意の追加サブ工程としては、配列のアノテーション及び/又は冗長な配列の除去が挙げられる。
【0102】
いくつかの実施形態においては、未知の機能を有するタンパク質又は核酸配列が、工程(ii)においてアノテートされる。したがって、本発明に係る方法は、未知の機能を有するヒトマイクロバイオータ配列を同定し、前記配列をアノテートするサブ工程を含み得る。
【0103】
本明細書においては、用語「アノテーション」又は「アノテートする」は、配列に対して、構造的及び/又は生物学的情報を付加することを意味する。特に、配列アノテーションは、構造又は機能に関する記述情報を使用して、核酸配列又はタンパク質配列における特定の特徴をマークするプロセスである。したがって、配列アノテーションは、翻訳後修飾、結合部位、酵素活性部位、局所的二次構造、又は他の特性など、タンパク質配列における関心のある領域又は部位を記述することができる。例えば、ゲノムコンテキスト情報、類似性スコア、実験データ、及び他のリソースの統合を使用して、配列アノテーションを提供することができる。
【0104】
アノテーションは、(予測された)分泌タンパク質の下流のフィルタリングと選択を容易にする。
【0105】
アノテーションは、前記したように、工程(ii)の他のサブ工程の前後又はそれらの間に行うことができる。いくつかの実施形態においては、アノテーションは、以下の後に行われる。
- シグナルペプチドを有する配列、又はシグナルペプチドを有するタンパク質をコードする配列を選択すること;
- 20~500アミノ酸長を有する配列、又は20~500アミノ酸長を有するタンパク質をコードする配列を選択すること;
- 少なくとも2つのシステイン残基及び/又は立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを少なくとも含む配列、又は少なくとも2つのシステイン残基及び/又は立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを含むタンパク質をコードする配列を選択すること。
【0106】
アノテーションは、ヒトの専門知識を含む手動によるアノテーション、及び/又はコンピュータ分析によりアノテーションを行う自動アノテーションツールによって行うことができる。例えば、インシリコ法をアノテーションに使用することができる。いくつかの実施形態においては、これらのアプローチ(手動及び自動)は、例えば、相互に補完することによって、同一のアノテーションパイプラインで組み合わされる。
【0107】
アノテーションは、BLASTなどの相同性ベースの検索ツールによって行われ、特定のデータベースにおける既知の構造/機能を有する相同遺伝子又はタンパク質を検索することができる。得られた情報は、次いで、核酸及び/又はタンパク質配列をアノテートするために使用される。
【0108】
一般に、アノテーションは、構造的及び/又は機能的情報を提供することができる。構造的アノテーションは、核酸又はタンパク質配列の構造的エレメント、例えば、ORF、遺伝子構造、コーディング領域、及び核酸配列内の調節モチーフの位置の同定に関する。構造的アノテーションのより好ましい例は、タンパク質ドメイン及びモチーフの同定など、タンパク質レベル(タンパク質及び核酸配列の両方でアノテートされ得る)に関する構造的情報に関する。機能的アノテーションは、生化学的機能、生物学的機能、関与する調節及び相互作用、並びに発現に関する情報などの付加的生物学的情報に関する。本発明においては、アノテーションは、好ましくは、機能的アノテーションを含む又はからなる。より好ましくは、アノテーションは、機能に関する構造化ビューを提供する。
【0109】
一般に、機能的アノテーションは、好ましくは、相同性ベースの方法、配列モチーフベースの方法、ドメインベースの方法、構造ベースの方法、ゲノムコンテキストベースの方法、計算溶媒マッピング法、及び/又はネットワークベースの方法によって行われる。より好ましくは、これらの方法の2以上の組合せが用いられる。
【0110】
好ましくは、工程(ii)において、未知の機能を有するタンパク質又は核酸配列が、インシリコでアノテートされる。
【0111】
アノテーションは、レファレンスデータベース、例えば、Kyoto Encyclopedia of Genes and Genomes (KEGG)及び/又はNational Center for Biotechnology Information (NCBI) Reference Sequence Database (RefSeq)に対する(BLASTベースの)比較によって行うことができる。RefSeqは、ゲノムDNA、転写産物、タンパク質など、統合された非冗長な配列のセットを提供する。KEGGでは、KO(KEGG Orthology)データベースに格納されている分子レベルの機能を用いることができる。これらの機能は、共通の祖先から進化した様々な種の遺伝子によってコードされるタンパク質を含む、オルソログのグループに分類される。
【0112】
Conserved Domain Database (CDD) (https://www.ncbi.nlm.nih.gov/cdd/; Marchler-Bauer A et al. (2011), “CDD: a Conserved Domain Database for the functional annotation of proteins.”, Nucleic Acids Res.39(D)225-9)は、保存されたドメインフットプリントの位置、及びこれらのフットプリントから推測される機能的部位による、タンパク質配列のアノテーションの代替データベースである。
【0113】
アノテーションに好ましいデータベースは、PFAM(http://pfam.xfam.org/; R.D. Finn, P. Coggill, R.Y. Eberhardt, S.R. Eddy, J. Mistry, A.L. Mitchell, S.C. Potter, M. Punta, M. Qureshi, A. Sangrador-Vegas, G.A. Salazar, J. Tate, A. Bateman: The Pfam protein families database: towards a more sustainable future. Nucleic Acids Research (2016) Database Issue 44: D279-D285; E. L. Sonnhammer, S. R. Eddy, R. Durbin: Pfam: a comprehensive database of protein domain families based on seed alignments. In: Proteins. 28, 1997, S. 405-420)である。
【0114】
アノテーションに好ましいバイオインフォマティクスツール(ソフトウェア)の更なる例としては、以下が挙げられる。
- HMMSCAN (https://www.ebi.ac.uk/Tools/hmmer/search/hmmscan; Finn, R. D., Clements, J. & Eddy, S. R. HMMER web server: interactive sequence similarity searching. Nucleic Acids Res 39, W29-37, doi:10.1093/nar/gkr367 (2011); Eddy, S. R. Accelerated Profile HMM Searches. PLoS Comput Biol 7, e1002195, doi:10.1371/journal.pcbi.1002195 (2011); R.D.Finn, J.Clements, W.Arndt, B.L.Miller, T.J.Wheeler, F.Schreiber, A.Bateman and S.R.Eddy: HMMER web server: 2015 update. Nucleic Acids Research (2015) Web Server Issue 43:W30-W38);
- HAMAP and/or HAMAP-Scan (https://hamap.expasy.org/; https://hamap.expasy.org/hamap_scan.html; Ivo Pedruzzi, Catherine Rivoire, Andrea H. Auchincloss, Elisabeth Coudert, Guillaume Keller, Edouard de Castro, Delphine Baratin, Beatrice A. Cuche, Lydie Bougueleret, Sylvain Poux, Nicole Redaschi, Ioannis Xenarios, Alan Bridge; HAMAP in 2015: updates to the protein family classification and annotation system, Nucleic Acids Research, Volume 43, Issue D1, 28 January 2015, Pages D1064-D1070; Tania Lima, Andrea H. Auchincloss, Elisabeth Coudert, Guillaume Keller, Karine Michoud, Catherine Rivoire, Virginie Bulliard, Edouard de Castro, Corinne Lachaize, Delphine Baratin, Isabelle Phan, Lydie Bougueleret, Amos Bairoch; HAMAP: a database of completely sequenced microbial proteome sets and manually curated microbial protein families in UniProtKB/Swiss-Prot, Nucleic Acids Research, Volume 37, Issue suppl_1, 1 January 2009, Pages D471-D478);
- iPtgxDB (https://iptgxdb.expasy.org/; U. Omasits, A. R. Varadarajan, et al. An integrative strategy to identify the entire protein coding potential of prokaryotic genomes by proteogenomics. 2017. Genome Research, 27: 2083-2095; A. I. Nesvizhskii. 2014. Proteogenomics: concepts, applications and computational strategies. Nature Methods 11: 1114-1125);
- OrthoDB (http://www.orthodb.org/; Zdobnov EM, Tegenfeldt F, Kuznetsov D, Waterhouse RM, Simao FA, Ioannidis P, Seppey M, Loetscher A, Kriventseva EV. OrthoDB v9.1: cataloging evolutionary and functional annotations for animal, fungal, plant, archaeal, bacterial and viral orthologs. Nucleic Acids Res. 2017 Jan 4;45(D1):D744-D749);
- UniProt (URL: https://www.uniprot.org/; The UniProt Consortium. UniProt: the universal protein knowledgebase. Nucleic Acids Res. 45: D158-D169 (2017));
- CATH (URL: http://www.cathdb.info/; Ian Sillitoe, Tony E. Lewis, Alison Cuff, Sayoni Das, Paul Ashford, Natalie L. Dawson, Nicholas Furnham, Roman A. Laskowski, David Lee, Jonathan G. Lees, Sonja Lehtinen, Romain A. Studer, Janet Thornton, Christine A. Orengo; CATH: comprehensive structural and functional annotations for genome sequences, Nucleic Acids Research, Volume 43, Issue D1, 28 January 2015, Pages D376-D381);
- PANTHER (URL: http://www.pantherdb.org/; Thomas PD, Campbell MJ, Kejariwal A, Mi H, Karlak B, Daverman R, Diemer K, Muruganujan A, Narechania A. PANTHER: a library of protein families and subfamilies indexed by function. Genome Res. 2003 Sep;13(9):2129-41; Mi H, Muruganujan A, Thomas PD. PANTHER in 2013: modeling the evolution of gene function, and other gene attributes, in the context of phylogenetic trees. Nucleic Acids Res. 2013 Jan;41(Database issue):D377-86);
- PIRSF (URL: https://pir.georgetown.edu/pirwww/dbinfo/pirsf.shtml; Nikolskaya AN, Arighi CN, Huang H, Barker WC, Wu CH. PIRSF family classification system for protein functional and evolutionary analysis. Evol Bioinform Online. 2007 Feb 10;2:197-209; Wu CH, Nikolskaya A, Huang H, Yeh LS, Natale DA, Vinayaka CR, Hu ZZ, Mazumder R, Kumar S, Kourtesis P, Ledley RS, Suzek BE, Arminski L, Chen Y, Zhang J, Cardenas JL, Chung S, Castro-Alvear J, Dinkov G, Barker WC. PIRSF: family classification system at the Protein Information Resource. Nucleic Acids Res. 2004 Jan 1;32(Database issue):D112-4);
- PRINTS (URL: http://130.88.97.239/PRINTS/index.php; Attwood TK, Coletta A, Muirhead G, Pavlopoulou A, Philippou PB, Popov I, Roma-Mateo C, Theodosiou A, Mitchell AL. The PRINTS database: a fine-grained protein sequence annotation and analysis resource--its status in 2012. Database (Oxford). 2012 Apr 15;2012:bas019; Attwood TK. The PRINTS database: a resource for identification of protein families. Brief Bioinform. 2002 Sep;3(3):252-63; Attwood TK, Beck ME, Bleasby AJ, Parry-Smith DJ. PRINTS--a database of protein motif fingerprints. Nucleic Acids Res. 1994 Sep;22(17):3590-6);
- ProDom (URL: http://prodom.prabi.fr/prodom/current/html/home.php; Kahn, D., Rezvoy, C. and Vivien, F. (2008) Parallel large-scale inference of protein domain families. Proceedings of the 14th International Conference on Parallel and Distributed Systems, December 8-10, 2008, Melbourne, Australia, IEEE, pp. 72-79; Catherine Bru, Emmanuel Courcelle, Sebastien Carrere, Yoann Beausse, Sandrine Dalmar, and Daniel Kahn (2005) The ProDom database of protein domain families: more emphasis on 3D. Nucleic Acids Res. 33: D212-D215; orpet F, Servant F, Gouzy J, Kahn D (2000) ProDom and ProDom-CG: tools for protein domain analysis and whole genome comparisons. Nucleic Acids Res. 28:267-269);
- PROSITE (URL: https://prosite.expasy.org/; Sigrist CJ, de Castro E, Cerutti L, Cuche BA, Hulo N, Bridge A, Bougueleret L, Xenarios I. New and continuing developments at PROSITE. Nucleic Acids Res. 2013 Jan;41(Database issue):D344-7);
- SMART (URL: https://smart.embl.de/; http://smart.embl-heidelberg.de/; Ivica Letunic, Peer Bork; 20 years of the SMART protein domain annotation resource, Nucleic Acids Research, Volume 46, Issue D1, 4 January 2018, Pages D493-D496; Letunic I, Doerks T, Bork P. SMART: recent updates, new developments and status in 2015. Nucleic Acids Res. 2015 Jan;43(Database issue):D257-60; Ivica Letunic, Supriya Khedkar, Peer Bork, SMART: recent updates, new developments and status in 2020, Nucleic Acids Research, Volume 49, Issue D1, 8 January 2021, Pages D458-D460);
- SUPERFAMILY (URL: http://supfam.cs.bris.ac.uk/SUPERFAMILY/; Julian Gough, Kevin Karplus, Richard Hughey, Cyrus Chothia (2001): Assignment of homology to genome sequences using a library of hidden Markov models that represent all proteins of known structure. Edited by G. Von Heijne, Journal of Molecular Biology, Volume 313, Issue 4, Pages 903-919; Derek Wilson, Ralph Pethica, Yiduo Zhou, Charles Talbot, Christine Vogel, Martin Madera, Cyrus Chothia, Julian Gough; SUPERFAMILY-sophisticated comparative genomics, data mining, visualization and phylogeny, Nucleic Acids Research, Volume 37, Issue suppl_1, 1 January 2009, Pages D380-D386);及び
- TIGRFAM (URL: http://www.jcvi.org/cgi-bin/tigrfams/index.cgi; Daniel H. Haft, Jeremy D. Selengut, Owen White: The TIGRFAMs database of protein families. Nucleic Acids Res. 2003 Jan 1; 31(1): 371-373; Daniel H. Haft, Brendan, J. Loftus, Delwood L. Richardson, Fan Yang, Jonathan, A. Eisen, Ian T. Paulsen, Owen White: TIGRFAMs: a protein family resource for the functional identification of proteins. Nucleic Acids Res. 2001 Jan 1; 29(1): 41-43)。
これらの例示されたバイオインフォマティクスツール(ソフトウェア)の1以上を、配列のアノテーションに使用することができる。
【0115】
好ましくは、配列は、HMMSCAN及び/又はPFAMを使用することによってアノテートされる。PFAMは、タンパク質ファミリードメインの最大の公開データベースであり、HMMSCANソフトウェアを使用して、これらのドメインについて、タンパク質配列を検索することができる。より好ましくは、配列は、SMARTを使用することによってアノテートされる。
【0116】
いくつかの実施形態においては、ヒト宿主分子からの特定の機能的ドメインが、前記3つの基準の全てを満たすヒトマイクロバイオータタンパク質の配列内で検索される。ヒト宿主分子は、サイトカイン、ケモカイン、成長因子、神経ペプチド、及びペプチドホルモンからなる群から選択され得る。
【0117】
代替的に又は追加的に、本発明に係るヒトマイクロバイオータタンパク質薬剤候補を提供するための方法は、冗長な配列が同定されるサブ工程を含むこともできる。次いで、任意に、同定された冗長な配列が除去される。特に、前記方法の工程(ii)において、冗長な配列を同定及び除去することができる。
【0118】
本明細書においては、用語「冗長な配列(redundant sequence)」は、(データセット内に)2度含まれるタンパク質(アミノ酸)又は核酸配列を意味する。通常、配列が2重に存在しても、単一の配列の場合と比較して、更なる情報がデータセットに追加されない。したがって、かかる配列は、「冗長な」と称される。特に、用語「冗長性」は、100%同一である配列を意味するだけでなく、大部分が同一である配列(少なくとも95%、好ましくは少なくとも90%、より好ましくは少なくとも85%、更により好ましくは少なくとも80%、最も好ましくは少なくとも75%の配列同一性を有する配列)も意味する。
【0119】
したがって、本発明に係る方法の工程(ii)において、別の配列と同一である全ての配列が同定され、除去される。これにより、得られたデータセットは、各配列を1回だけ含む。より好ましくは、本発明に係る方法の工程(ii)において、別の(選択された)配列に対して、少なくとも95%、好ましくは少なくとも90%、より好ましくは少なくとも85%、更により好ましくは少なくとも80%、最も好ましくは少なくとも75%の同一性を有する配列が同定され、除去される。
【0120】
本発明においては、クエリ(レファレンス)アミノ酸配列に対して、少なくとも、例えば95%の「配列同一性を共有する」アミノ酸配列は、対象のアミノ酸配列の配列がクエリアミノ酸配列の100アミノ酸ごとに最大5つのアミノ酸変化を含み得ること以外は、対象のアミノ酸配列は、クエリ配列と同一であることを意味することが意図される。換言すれば、クエリアミノ酸配列に対して少なくとも95%の同一性の配列を有するアミノ酸配列を得るためには、対象配列中のアミノ酸残基の最大5%(100個のうち5個)を、好ましくは変異体又は断片の前記定義内で、挿入する、別のアミノ酸で置換する、又は欠失させることができる。言うまでもなく、同じことが、核酸配列にも同様に当てはまる。
【0121】
正確に対応していない(アミノ酸又は核酸)配列の場合、第1の配列(対象配列)の「%同一性」は、第2の配列(例えば、クエリ/レファレンス配列)に対して決定することができる。一般に、比較対象の2つの配列は、配列間に最大の相関関係がもたらされるようにアラインさせることができる。これは、アラインメントの程度を高めるために、一方又は両方の配列に「ギャップ」を挿入することを含み得る。次いで、比較される配列それぞれの全長に亘って(いわゆる、「グローバルアラインメント」)(同一又は同様な長さの配列に特に好適である)又はより短い決まった長さに亘って(いわゆる、「ローカルアラインメント」)(長さが等しくない配列により好適である)%同一性を決定することができる。
【0122】
2以上の配列の同一性(「類似性」又は「相同性」とも称されることがある)を比較するための方法は、当技術分野でよく知られている。2つ(又はそれ以上)の配列が同一であるパーセンテージは、例えば、数学的アルゴリズムを用いて決定することができる。好ましいが限定的ではない、使用可能な数学的アルゴリズムの例としては、Karlin et al.(1993), PNAS USA, 90:5873-5877のアルゴリズムである。かかるアルゴリズムは、BLASTファミリーのプログラム、例えば、BLAST又はNBLASTプログラム(Altschul et al., 1990, J. Mol. Biol. 215, 403-410 or Altschul et al. (1997), Nucleic Acids Res, 25:3389-3402も参照、world wide web site ncbi.nlm.nih.govでNCBIのホームページからアクセス可能)及びFASTA(Pearson (1990), Methods Enzymol. 183, 63-98; Pearson and Lipman (1988), Proc. Natl. Acad. Sci. U. S. A 85, 2444-2448.)に統合されている。別の配列と、ある程度同一な配列は、これらのプログラムによって同定することができる。更に、Wisconsin Sequence Analysis Package, version 9.1(Devereux et al., 1984, Nucleic Acids Res., 387-395)で利用可能なプログラム、例えば、BESTFIT及びGAPプログラムを、2つのポリヌクレオチド間の%同一性、及び2つのポリペプチド配列間の%同一性及び%相同性又は同一性を決定するために使用することができる。BESTFITは、(Smith and Waterman (1981), J. Mol. Biol. 147, 195-197.)の「ローカルホモロジー」アルゴリズムを使用し、2つの配列間における類似性の最良の単一領域を見つける。
【0123】
冗長性を低減する、及び/又は冗長な配列を同定及び除去するためのバイオインフォマティクスツール(ソフトウェア)の好ましい例としては、以下が挙げられる。
- CD-HIT (URL: http://cd-hit.org; http://weizhongli-lab.org/cd-hit/; Weizhong Li, Lukasz Jaroszewski & Adam Godzik. Clustering of highly homologous sequences to reduce the size of large protein databases. Bioinformatics (2001) 17:282-283; Weizhong Li & Adam Godzik. Cd-hit: a fast program for clustering and comparing large sets of protein or nucleotide sequences. Bioinformatics (2006) 22:1658-1659; Weizhong Li, Limin Fu, Beifang Niu, Sitao Wu and John Wooley. Ultrafast clustering algorithms for metagenomic of CD-HIT-OTU-MiSeqsequence analysis. Briefings in Bioinformatics, (2012) 13 (6): 656-668);
- Decrease Redundancy (URL: https://web.expasy.org/decrease_redundancy/; Gasteiger E, Gattiker A, Hoogland C, Ivanyi I, Appel RD, Bairoch A: ExPASy: The proteomics server for in-depth protein knowledge and analysis. Nucleic Acids Res. 2003 Jul 1; 31(13):3784-8);
- Pisces (URL: http://dunbrack.fccc.edu/PISCES.php; Wang G, Dunbrack RL Jr: PISCES: recent improvements to a PDB sequence culling server. Nucleic Acids Res. 2005 Jul 1; 33(Web Server issue):W94-8; Wang G, Dunbrack RL Jr: PISCES: a protein sequence culling server. Bioinformatics. 2003 Aug 12; 19(12):1589-91);
- BlastClust (BLAST; URL: http://blast.ncbi.nlm.nih.gov; Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ: Basic local alignment search tool. J Mol Biol. 1990 Oct 5; 215(3):403-10; Wheeler D, et al. 2007);
- SkipRedundant (EMBOSS; URL: http://www.bioinformatics.nl/cgi-bin/emboss/skipredundant; Rice P, Longden I, Bleasby A: EMBOSS: the European Molecular Biology Open Software Suite. Trends Genet. 2000 Jun; 16(6):276-7);
- kClust (URL: ftp://toolkit.lmb.uni-muenchen.de/pub/kClust/; Hauser M, Mayer CE, Soding J. kClust: fast and sensitive clustering of large protein sequence databases. BMC Bioinformatics. 2013;14:248);
- UCLUST (URL: drive5.com/usearch/manual/uclust_algo.html; http://www.drive5.com/usearch/; Edgar, R. C. (2010). “Search and clustering orders of magnitude faster than BLAST”. Bioinformatics. 26 (19): 2460-2461);及び
- MMSeqs2 (Steinegger, M Soding, MMseqs2 enables sensitive protein sequence searching for the analysis of massive data sets. Nat Biotechnol. 2017 Nov;35(11):1026-1028.)。
これらの例示されたバイオインフォマティクスツール(ソフトウェア)の1以上を、冗長性を低減する、及び/又は冗長な配列を同定及び除去するために使用することができる。
【0124】
最も好ましくは、CD-HITを用いて、本発明に係る方法において冗長な配列を除去する。CD-HITは、最も広く使用されている配列クラスタリングソフトウェアであり、パブリックデータベース(Uniprotなど)に日常的に適用されている。CD-HITは、70%以上、例えば、75%又は80%の同一性カットオフで使用されることが特に好ましい。
【0125】
冗長な配列の除去は、前記したように、工程(ii)の他のサブ工程の前後又はそれらの間に行うことができる。いくつかの実施形態においては、冗長な配列の除去は、以下の後に行われる。
- シグナルペプチドを有する配列、又はシグナルペプチドを有するタンパク質をコードする配列を選択すること;
- 20~500アミノ酸長を有する配列、又は20~500アミノ酸長を有するタンパク質をコードする配列を選択すること;
- 少なくとも2つのシステイン残基及び/又は立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを含む配列、又は少なくとも2つのシステイン残基及び/又は立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを含むタンパク質をコードする配列を選択すること。
任意に、冗長な配列を同定し、除去する前に、アノテーションのサブ工程を行うこともできる。
【0126】
ヒトマイクロバイオータタンパク質(薬剤候補)の調製
本発明に係るヒトマイクロバイオータタンパク質薬剤候補を提供するための方法の工程(iii)において、薬剤候補、即ち、工程(ii)の選択プロセスにおいて得られたヒトマイクロバイオータタンパク質が調製される。
【0127】
特に、前記タンパク質は、組換え手段によって調製される(即ち、前記タンパク質は、人工的に調製される)。例えば、前記タンパク質は、化学合成によって、又は生物学的に、例えば、インビトロ(無細胞発現系など)で調製することができる、又は(配列が得られる生物以外)の宿主細胞又は別の生物によって発現させることができる。したがって、前記方法で得られるタンパク質は、特に、組換えタンパク質である。いくつかの実施形態においては、ヒトマイクロバイオータタンパク質は、化学合成によって工程(iii)で調製される。いくつかの実施形態においては、ヒトマイクロバイオータタンパク質は、工程(iii)において生物学的に、特に、インビトロ合成(無細胞発現)又は宿主細胞若しくは生物における組換え(過剰)発現によって調製される。好ましくは、タンパク質は、工程(iii)で生物学的に(例えば、宿主細胞又は無細胞発現系において)調製される。即ち、化学合成によってではなく調製される。生成後、タンパク質を精製してもよい。
【0128】
当業者は、アミノ酸配列又は核酸配列に基づいてタンパク質を調製するための様々な方法を知っている。例えば、前記タンパク質は、化学合成、インビトロ合成(無細胞発現)、又は(インビボ)組換え(過剰)発現によって調製することができる。
【0129】
インビトロタンパク質合成(「インビトロタンパク質発現」、「無細胞タンパク質発現」、及び「無細胞タンパク質合成」とも称される)は、細胞から抽出された生体分子翻訳機構を使用する溶液中での組換えタンパク質の生成である。インビトロタンパク質合成は、培養細胞内ではなく、細胞溶解物又は組換えタンパク質のカクテル中で生じるので、生細胞を使用せずに達成される。インビトロタンパク質合成環境は、細胞の生存能力を維持するために必要な細胞壁又はホメオスタシス条件によって制約されない。したがって、インビトロタンパク質合成は、翻訳環境への直接的なアクセス及び制御を可能にする。更に、この技術は、機能性タンパク質の迅速な発現と製造を可能にする。インビトロタンパク質合成は、タンパク質産生の最適化、タンパク質複合体の最適化、タンパク質合成の研究、非天然アミノ酸の取込み、ハイスループットスクリーニング、機能性分析、分子相互作用検出、分子構造及び局在化分析、並びに分子診断などの様々な用途に有用である。
【0130】
無細胞反応の共通成分は、組換えタンパク質又は細胞抽出物のカクテルなど、インビトロでの転写及び形質導入を達成するために必要なタンパク質を含む。更に、エネルギー源、アミノ酸の供給、発現されるタンパク質をコードする核酸、及び任意に、マグネシウムなどの補因子を添加することができる。インビトロタンパク質合成は、いくつかの種類及び種の細胞抽出物又は組換えタンパク質のカクテルを用いて達成することができる。細胞抽出物は、例えば、目的の細胞を溶解し、細胞壁、DNAゲノム、及び他の破片を遠心分離して、必要な細胞機構(リボソーム、アミノアシル-tRNAシンテターゼ、翻訳開始及び伸長因子、ヌクレアーゼなど)が残存するようにして得ることができる。例としては、E.coli(ECE)、ウサギ網赤血球(RRL)、コムギ胚芽(WGE)、昆虫細胞(ICE、例えば、SF9又はSF21)、及びヒト細胞から調製される細胞抽出物を挙げることができ、これらはいずれも市販されている。市販のインビトロタンパク質合成系の例としては、限定するものではないが、RTS(5 PRIME);ExpresswayTM(Life Technologies);S30 T7 high yield(Promega);One-step human IVT (Thermo Scientific);WEPRO(登録商標)(CellFree Sciences);TNT(登録商標) coupled (Promega);RTS CECF (5 PRIME);TNT(登録商標) Coupled (Promega);Retic lysate IVTTM (Life Technologies);TNT(登録商標) T7 (Promega);EasyXpress Insect kit(Qiagen/RiN A);PURExpress(登録商標) (New England Biolabs);及びPURESYSTEM(登録商標) (BioComber))が挙げられる。いくつかの実施形態においては、PURExpress(登録商標)(New England Biolabs)を用いることができ、これは、インビトロでの転写及び形質導入を達成するために必要な組換えタンパク質のカクテルである。他の実施形態においては、細菌抽出物、特にECE(E.coli抽出物)は、(細菌タンパク質の発現に理想的な)細菌機構を提供し、通常、高収量を達成するので、使用することができる。細菌抽出物におけるインビトロでのタンパク質合成のより詳細な説明は、Hani S. Zaher, Rachel Green: Chapter One - In Vitro Synthesis of Proteins in Bacterial Extracts, Editor(s): Jon Lorsch, Methods in Enzymology, Academic Press, Vol. 539, 2014, p. 3-15, ISSN 0076-6879, ISBN 9780124201200に見ることができる。
【0131】
インビトロでのタンパク質合成で使用される核酸は、好ましくはRNA又はDNAである。例えば、インビボ又はインビトロで合成された単離RNA(特に、mRNA)は、翻訳のためのテンプレートとして使用することができる。DNA、特に、遺伝子/プラスミドベクター(cDNA)にクローン化されたORFなどの環状又は線状DNA、又はPCRで生成されたテンプレートなどの線状DNAテンプレートを使用することも好ましい。核酸は、コドン最適化することができる。いくつかの実施形態においては、DNAの直接合成が、好ましくはコドン最適化と共に用いられる。
【0132】
核酸、例えば、合成DNA分子は、ベクターにサブクローニングすることができる。ベクターは、ペプチド、ポリペプチド、又はタンパク質などの発現産物の産生に使用され得る発現ベクターであることができる。例えば、発現ベクターは、プロモーター配列(例えば、T7プロモーター)などの、ベクターの配列領域の転写に必要な配列を含むことができる。したがって、ベクターは、(T7)プロモーターを含むことができる。更に、必要に応じて、ベクターは、特定のタグを含むことができる。
【0133】
インビトロ/無細胞タンパク質合成は、好ましくは、最小20アミノ酸長、好ましくは最小30アミノ酸長、より好ましくは最小40アミノ酸長、更により好ましくは最小45アミノ酸長、更により好ましくは最小50アミノ酸長を有するタンパク質に適用される。例えば、50~350アミノ酸長又は50~500アミノ酸長(好ましくは、シグナルペプチドを含まない)を有するタンパク質は、前記したようにインビトロ/無細胞タンパク質合成によって合成される。
【0134】
或いは、タンパク質は、当技術分野で知られ、例えば、Fields GB. Introduction to peptide synthesis. Curr Protoc Protein Sci. 2002;Chapter 18:Unit-18.1. doi:10.1002/0471140864.ps1801s26に記載される化学合成によって調製することができる。例えば、当技術分野で知られている固相技術(固相ペプチド合成(SPPS))を、例えば、Fmocベースの化学を適用して使用することができる。SPPSは、不溶性の多孔質支持体上でのアミノ酸誘導体の連続反応によって、ペプチド鎖の迅速な組み立てを可能にする。化学タンパク質及びペプチド合成の様々な商業的サプライヤーが利用可能であり、例えば、Pepscan (Lelystad, Netherlands)、GenScript (Piscataway, NJ, USA)、LifeTein (Somerset, NJ, USA)、JPT (Berlin, Germany)などが挙げられる。
【0135】
化学合成、例えば、SPPSは、最大100アミノ酸、好ましくは最大90アミノ酸長、より好ましくは最大80アミノ酸長、更により好ましくは最大70又は60アミノ酸長、更により好ましくは最大50アミノ酸長を有するタンパク質に適用することができる。例えば、15~50アミノ酸長又は20~50アミノ酸長(好ましくは、シグナルペプチドを含まない)を有するタンパク質は、SPPSなどの化学合成によって合成される。
【0136】
したがって、より長いタンパク質、例えば、前記した長さ(例えば、50~350アミノ酸)を有するタンパク質は、インビトロ/無細胞タンパク質合成によって合成することができ、より短いタンパク質、例えば、前記した長さ(例えば、20~50アミノ酸)を有するタンパク質は、例えば、SPPSなどの化学合成によって合成することができる。
【0137】
タンパク質はまた、インビボ組換え(過剰)発現によって調製することができる。これは通常、組換え核酸、特に組換え遺伝子を(大量に)発現するように、生物における遺伝子発現を操作することによって達成される。したがって、この方法は、生細胞及び細胞ベース系を伴う。このプロセスには、特に、組換えDNAのメッセンジャーRNA(mRNA)への転写と、mRNAのポリペプチド鎖への翻訳(ポリペプチド鎖は、機能性タンパク質に折り畳まれ得る)とを含む。次いで、タンパク質を、特定の細胞内又は細胞外の位置を標的にすることできる。
【0138】
本明細書においては、用語「過剰発現」は、(過度に)高レベルの遺伝子発現を意味し、これは、顕著な遺伝子に関連づけられた表現型を生じる可能性がある。組換え細胞ベースの発現系においては、外来核酸が発現のために細胞に導入される。外来核酸を細胞に導入する多くの方法が、当技術分野で知られている。核酸源及び送達メカニズムの例としては、ウイルス(バキュロウイルス、レトロウイルス、アデノウイルスなど)、プラスミド、人工染色体、及びバクテリオファージ(ラムダなど)が挙げられる。更に、当業者は、多くの異なる宿主系について知っている。例えば、細菌(E.coliB. subtilisなど)、酵母(S.cerevisiaeなど)、糸状菌(AspergillusTrichoderma、及びMyceliophthora thermophila C1など)、昆虫細胞(SF9、SF21、及びHigh Five株など)、及び哺乳動物細胞株(HeLa、CHO、HEK293、Crucell’ Per.C6、Glycotope、及びCEVEC)が挙げられる。
【0139】
細菌宿主細胞は、(細菌タンパク質の発現に理想的な)細菌機構を提供し、通常、高収量を達成するため、最も好ましい。細菌宿主の好ましい例としては、E.coliB.subtilisCorynebacterium、及びPseudomonas fluorescensが挙げられる。P.fluorescens及びE.coliが最も好ましい。P.fluorescensは、代謝的に広用途の生物であり、ハイスループットスクリーニングと複雑なタンパク質の迅速な開発を可能にする。P.fluorescensは、高力価の活性の可溶性タンパク質を迅速且つ成功裏に生成する能力で最もよく知られている。E.coliにおける過剰発現の技術は当技術分野でよく知られており、遺伝子のコピー数を増やす、又はプロモーター領域の結合強度を高めて転写を支援することによって機能する。DNAは、プラスミド発現ベクターを使用して導入することが好ましい。
【0140】
宿主細胞、特に、細菌細胞は、好ましくは、(組換え技術によって)発現させたタンパク質におけるジスルフィド結合形成を支援するようにエンジニアードされることができる。この目的のために、例えば、還元酵素を排除することができ、及び/又はペリプラズムのジスルフィド結合イソメラーゼ、DsbCを増加させる、例えば、過剰発現させることができる。DsbCは、複数のジスルフィド結合を有するタンパク質に作用して、誤って酸化された結合(mis-oxidized bonds)を修正し、適切な折り畳みを促進する。例えば、E.coliのSHuffle(登録商標)株(New England Biolabs)は、細胞質でのジスルフィド結合形成を特異的に支援する。この株では、グルタレドキシンレダクターゼとチオレドキシンレダクターゼの遺伝子(Δgor ΔtrxB)が欠失されて、ジスルフィド結合形成を可能にする。更に、SHuffle(登録商標)株は、シグナル配列を欠いた、ペリプラズムのジスルフィド結合イソメラーゼ、DsbCのバージョンを発現し、それを細胞質に保持する。したがって、本発明に係るヒトマイクロバイオータメタセクレトームのタンパク質を調製するための方法のいくつかの実施形態において、核酸分子は、タンパク質を調製するためのテンプレートとして使用される。この文脈においては、本発明に係るヒトマイクロバイオータメタセクレトームのタンパク質を調製するための方法(特に、核酸分子がタンパク質を調製するためのテンプレートとして使用される場合)は、以下の工程:
- 核酸配列の開始コドン及び終止コドンを特定すること、
を含むことができる。
【0141】
開始コドンは、リボソームによって翻訳されたメッセンジャーRNA(mRNA)の転写産物の最初のコドンである。開始コドンは、常に、真核生物ではメチオニンをコードし、原核生物では修飾Met(fMet)をコードする。最も一般的な開始コドンは、AUG(又は対応するDNA配列におけるATG)である。開始コドンの前には、しばしば、5’の非翻訳領域(5’UTR)が存在する。原核生物では、5’UTRは、通常、リボソーム結合部位を含む。代替開始コドンは、標準的なAUGコドンと異なり、原核生物(細菌)と真核生物との両方に見られる。代替開始コドンは、タンパク質の最初にMetとして翻訳される(コドンが、異なるアミノ酸をコードしている場合でも)。例えば、E.coliは、83%がAUG(ATG)、14%がGUG(GTG)、3%がUUG(TTG)、及びその他の1つ又は2つの他のもの(例えば、AUU(ATT)及び場合によってはCUG(CTG))を使用する。
【0142】
終止コドン(又は終結コドン)は、タンパク質への翻訳の終結をシグナリングするメッセンジャーRNA内のヌクレオチドトリプレットである。終止コドンは、リボソームサブユニットを分離させる放出因子に結合することによって、このプロセスの終結をシグナリングし、アミノ酸鎖が放出される。特に、終止コドンは、核酸配列UAA(TAA)、UAG(TAG)、又はUGA(TGA)からなる。
【0143】
好ましくは、開始コドンの同定は、インシリコで行われる。バイオインフォマティクスプログラムは、通常、タンパク質コード遺伝子の検索時に、交番的な開始コドンと終止コドンとを可能にする。
【0144】
工程(iii)で調製されたヒトマイクロバイオータタンパク質は、工程(ii)で同定されたシグナルペプチドなしで合成されることも好ましい。したがって、特に、前記した工程(ii)において、まだ行われていない場合であっても、工程(iii)は、タンパク質又は核酸配列からシグナルペプチドを除去する工程を含むことができる(例えば、前記したように)。これは、更なる分析で成熟タンパク質のみが用いられることを確実にするためである。更に、特定の分析では、アミノ酸頻度の計算が必要であり、これは、通常、シグナルペプチドなしで行われ、正しい値に達する。
【0145】
シグナルペプチドの除去は、例えば、インビボ又はインシリコで行うことができる。いくつかの実施形態においては、シグナルペプチドは、インビボで、例えば、細胞ベースの組換え発現系で、送達/移行後の細胞の機構のために除去される。
【0146】
特にタンパク質の調製前に、シグナルペプチドをインシリコで除去することも好ましい。これにより、特に、インビトロタンパク質合成の場合に、タンパク質の正しい合成と折り畳みが確実になる。一般に、シグナルペプチドのインシリコでの除去/切断は、特に、前記したバイオインフォマティクスツールを使用することにより、前記したように行うことができる。
【0147】
いくつかの実施形態においては、本発明に係るヒトマイクロバイオータメタセクレトームのタンパク質を調製するための方法は、以下の工程:
- ヒトマイクロバイオータメタセクレトームの調製タンパク質をチェックすること、
を更に含むことができる。
【0148】
例えば、調製されたタンパク質が正しく折り畳まれているかどうか、及び/又は調製されたタンパク質が正しいサイズ及び/又はコンフォメーションを有するかどうかをチェックすることができる。
【0149】
調製されたタンパク質をチェックするための好ましい方法は、ウエスタンブロットである。ウエスタンブロットは、タンパク質のサイズに関する情報を提供し、例えば、ウエスタンブロットで使用される抗体がタンパク質に結合できるかどうかに関する情報を提供する(これにより、少なくともエピトープが、正しいコンフォメーションを有することが示される)。タンパク質が適切に折り畳まれているかどうかを確認する方法の他の例としては、核磁気共鳴分光法(NMR)、X線結晶学、蛍光分光法、円二色性、タンパク質の振動円形二色性、二重分極干渉法、及び原子力顕微鏡(AFM)が挙げられる。タンパク質分解アッセイは、タンパク質の安定性を定量化するために使用できる。
【0150】
特に、調製されたタンパク質に、ジスルフィド結合を確認することができる。この目的のために、様々な方法が当技術分野で知られており、例えば、X線結晶学(例えば、Jones TA, Kjeldgaard M. Electron-density map interpretation. Methods Enzymol. 1997;277:173-208. doi: 10.1016/s0076-6879(97)77012-5に記載);エドマンシークエンシング(例えば、Haniu M et al. Direct assignment of disulfide bonds by Edman degradation of selected peptide fragments. Int J Pept Protein Res. 1994 Jan;43(1):81-6. doi: 10.1111/j.1399-3011.1994.tb00378.xに記載);及びNMR(例えば、Klaus W et al. Determination of the disulphide bonding pattern in proteins by local and global analysis of nuclear magnetic resonance data. Application to flavoridin. J Mol Biol. 1993 Aug 5;232(3):897-906. doi: 10.1006/jmbi.1993.1438に記載)が、ジスルフィド結合を特定するために、当技術分野でよく知られている。更に、質量分析(MS)は、特に少量のタンパク質のジスルフィド結合をマッピングすることで知られている。
【0151】
調製されたタンパク質のジスルフィド結合を同定するための好ましい方法は、Cuiら、2018(Cui C, Liu T, Chen T, Lu J, Casaren I, Lima DB, Carvalho PC, Beuve A, Li H. Comprehensive identification of protein disulfide bonds with pepsin/trypsin digestion, Orbitrap HCD and Spectrum Identification Machine. J Proteomics. 2019 Apr 30;198:78-86. doi: 10.1016/j.jprot.2018.12.010. Epub 2018 Dec 14)に記載されており、この文献全体を、参照により本明細書に援用する。簡潔に説明すれば、ペプシン/トリプシン消化の後に、液体クロマトグラフィー(LC)/質量分析(MS)分析を行うことができる。例えば、pH1.3での4時間のペプシン消化と、それに続く、pH6.5での一晩のトリプシン消化を、サンプル調製に使用して、SSスクランブリングを最小限に抑えながら非還元型タンパク質からのSS含有ペプチドの放出を最大限にすることができる。HPLC/MS分析の場合、SS含有ペプチドは、Q Exactive Orbitrap質量分析計で高エネルギー衝突解離(HCD)を使用して効率的に断片化でき、その後の同定のためにSSを保存する。
【0152】
一般に、調製されたタンパク質のジスルフィド結合を決定するために、タンパク質は、好ましくは生物学的に調製される(例えば、宿主細胞又は無細胞発現系において)。いくつかの実施形態においては、タンパク質は、特に、(i)ポリペプチド鎖の(化学的)合成、及び(ii)ジスルフィド結合の形成を得るための酸化によって、化学的に調製されないことがある。
【0153】
いくつかの実施形態においては、得られたタンパク質を、定量化することができる。例えば、得られたタンパク質は、6HIS又はHibitなどの適切なタグを含むことができ、タンパク質のレベルは、例えば、HIStag-biotynプローブが競合する競合的定量アッセイによるalphalisa又はHTRFなどの定量的方法を使用することによって決定することができる。Hibitを使用する場合、タンパク質のレベルは、Hibitルシフェラーゼアッセイを使用して決定することができる。
【0154】
特に宿主との相互作用に関する生物学的活性の決定
好ましくは、本発明に係るヒトマイクロバイオータタンパク質薬剤候補を提供するための方法は、特にヒト宿主との相互作用及び/又は細菌-細菌間相互作用などの関心のある任意の(他の)相互作用に関する、ヒトマイクロバイオータタンパク質薬剤候補の少なくとも1つの生物学的活性が決定される追加工程(iv)を含む。かかる工程(iv)は、前記タンパク質を調製する工程(iii)の直後又は別工程を介して行うことができる。
【0155】
本明細書においては、用語「相互作用」は、疎水性効果を含む静電力によって引き起こされる生化学的事象の結果として、2以上の(タンパク質)分子間に確立される高特異性の物理的接触を意味する。
【0156】
一般に、相互作用は、当技術分野で知られる様々な方法、例えば、インシリコ、インビトロ、インビボなどによって試験することができる。
【0157】
いくつかの実施形態においては、生物学的活性、例えば、相互作用は、インシリコで試験することができる。相互作用試験に適した多くのインシリコ法が、当技術分野で知られている。例えば、多くの構造タンパク質モチーフは当技術分野で知られており、適切なソフトウェア/バイオインフォマティクスツール、例えば、アノテーション用の前記したものなどによって予測することができる。
【0158】
インシリコ法の好ましい例としては、以下が挙げられる。
- 系統発生プロファイリング(多数の種に亘って同様の存在又は不存在パターンを有するタンパク質ファミリーのペアを検出する;この方法は、タンパク質レベル又はタンパク質ドメインのレベルで適用できる);
- 類似の系統樹に基づく共進化タンパク質対の予測(タンパク質対の系統樹を使用して、目的のタンパク質の相同体を検索することによって、相互作用が存在するかどうかを判定する);
- ロゼッタストーン法(例えば、STRINGによって使用される;Date SV. The Rosetta stone method. Methods Mol Biol. 2008;453:169-80);
- 分類法(データを使用してプログラム(分類子)を訓練し、相互作用するタンパク質/ドメイン対の肯定的な例を、相互作用しない対の否定的な例で区別する);
- 同族体構造からの相互作用の干渉(既知のタンパク質複合体構造を使用して、クエリタンパク質配列間の相互作用を予測及び構造的にモデル化する);
- アソシエーション法(相互作用する対と相互作用しない対とを区別するのに役立つ特徴的な配列又はモチーフを探索する、即ち、偶然よりも高頻繁で一緒に見つかる配列特徴を探索する);
- 構造パターンの同定(Protein Data Bank(PDB)から既知のタンパク質-タンパク質界面のライブラリーを構築し、前記界面は、関与する原子のファンデルワールス半径より僅かに大きい閾値を下回るポリペプチド断片の対として定義される);
- ベイジアンネットワークモデリング(実験結果と過去の計算予測の両方を含む様々なソースからのデータを統合し、これらの特徴を用いて、特定の潜在的なタンパク質相互作用が真のポジティブな結果である可能性を評価する);及び
- ドメイン対除外分析。
【0159】
ヒトマイクロバイオータメタセクレトームの同定/調製されたタンパク質の、ヒト宿主タンパク質との相互作用を予測/試験するためのバイオインフォマティクスツール/ソフトウェアの好ましい例としては、以下が挙げられる。
- STRING (URL: https://string-db.org/; Szklarczyk D, Morris JH, Cook H, Kuhn M, Wyder S, Simonovic M, Santos A, Doncheva NT, Roth A, Bork P, Jensen LJ, von Mering C. The STRING database in 2017: quality-controlled protein-protein association networks, made broadly accessible. Nucleic Acids Res. 2017 Jan 45:D362-68; von Mering C, Huynen M, Jaeggi D, Schmidt S, Bork P, Snel B. STRING: a database of predicted functional associations between proteins. Nucleic Acids Res. 2003 Jan; 31:258-61);
- Prediction of Interaction Specificity in Two-component Systems (URL: http://www.swissregulon.unibas.ch/cgi-bin/TCS.pl; Lukas Burger and Erik van Nimwegen (2008): Accurate prediction of protein-protein interactions from sequence alignments using a Bayesian method. Molecular Systems Biology 4:165);
- Mentha (URL: http://mentha.uniroma2.it/; Alberto Calderone, Luisa Castagnoli & Gianni Cesareni (2013): mentha: a resource for browsing integrated protein-interaction networks. Nature Methods 10, 690);
- GPS-Prot (URL: http://gpsprot.org/index.php; Fahey ME, Bennett MJ, Mahon C, Jager S, Pache L, Kumar D, Shapiro A, Rao K, Chanda SK, Craik CS, Frankel AD, Krogan NJ. GPS-Prot: a web-based visualization platform for integrating host-pathogen interaction data. BMC Bioinformatics. 2011 Jul 22;12:298);
- COMPASS (URL: http://prodata.swmed.edu/compass/compass.php; R.I. Sadreyev, M. Tang, B. Kim and N.V. Grishin (2009) COMPASS server for homology detection: improved statistical accuracy, speed, and functionality. Nucleic Acids Res doi:10.1093/nar/gkp360);
- PSICQUIC (URL: http://www.ebi.ac.uk/Tools/webservices/psicquic/view/home.xhtml; Aranda B, Blankenburg H, Kerrien S, Brinkman FS, Ceol A, Chautard E, Dana JM, De Las Rivas J, Dumousseau M, Galeota E, Gaulton A, Goll J, Hancock RE, Isserlin R, Jimenez RC, Kerssemakers J, Khadake J, Lynn DJ, Michaut M, O’Kelly G, Ono K, Orchard S, Prieto C, Razick S, Rigina O, Salwinski L, Simonovic M, Velankar S, Winter A, Wu G, Bader GD, Cesareni G, Donaldson IM, Eisenberg D, Kleywegt GJ, Overington J, Ricard-Blum S, Tyers M, Albrecht M, Hermjakob H. PSICQUIC and PSISCORE: accessing and scoring molecular interactions. Nat Methods. 2011 Jun 29;8(7):528-9);
- Struct2Net (URL: http://cb.csail.mit.edu/cb/struct2net/webserver/; R. Hosur, J. Peng, A. Vinayagam, U. Stelzl, J. Xu, N. Perrimon, J. Beinkowska, and B. Berger. 2012. “Coev2Net: a computational framework for boosting confidence in high-throughput protein-protein interaction datasets.” Genome Biology, doi:10.1186/gb-2012-13-8-r76; R. Singh, D. Park, J. Xu, R. Hosur, and B. Berger. 2010. “Struct2Net: a Web-Service to Predict Protein-Protein Interactions Using a Structure-based Approach.” Nucleic Acids Research, doi:10.1093/nar/gkq481);
- APID (Agile Protein Interactomes Dataserver; URL: http://cicblade.dep.usal.es:8080/APID/init.action; Alonso-Lopez D, Gutierrez MA, Lopes KP, Prieto C, Santamaria R, De Las Rivas J. APID interactomes: providing proteome-based interactomes with controlled quality for multiple species and derived networks. Nucleic Acids Research 2016; doi: 10.1093/nar/gkw363; Prieto C, De Las Rivas J. APID: Agile Protein Interaction DataAnalyzer. Nucleic Acids Res. 2006, 34(Web Server issue):W298-302);
- Interactome3D (URL: https://interactome3d.irbbarcelona.org/; Mosca R, Ceol A, Aloy P, Interactome3D: adding structural details to protein networks,Nature Methods (2013) 10(1):47-53, doi:10.1038/nmeth.2289);及び
- InterPreTS (URL: http://www.russelllab.org/cgi-bin/tools/interprets.pl; Aloy P, Russell RB. InterPreTS: protein interaction prediction through tertiary structure. Bioinformatics. 2003 Jan;19(1):161-2)。
【0160】
いくつかの実施形態においては、ヒトマイクロバイオータタンパク質の構造を(例えば、インシリコで)決定し、1以上のヒト宿主分子、特に、1以上のヒト宿主タンパク質の(既知の)構造と比較することができる。これにより、例えば、ヒト宿主分子のマイクロバイオーム模倣物を同定することができる。ヒト宿主分子は、サイトカイン、ケモカイン、成長因子、神経ペプチド、ペプチドホルモンからなる群から選択することができる。いくつかの実施形態においては、ヒト宿主分子からの特定の機能ドメインは、前記3つの基準の全てを満たすヒトマイクロバイオータタンパク質の配列内で検索することができる。この目的のために、例えば、前記したように、SMARTを用いることができる。
【0161】
好ましくは、ヒトマイクロバイオータメタセクレトームの同定/調製されたタンパク質と、ヒト宿主分子、特にヒト宿主タンパク質との相互作用を、インビトロ又はインビボで試験する。したがって、ヒトマイクロバイオータメタセクレトームの同定/調製されたタンパク質の生物学的活性(例えば、ヒト系、ヒト細胞、又はヒト分子との相互作用に基づく)を、インビトロ又はインビボで決定することができる。これに関連して、スクリーニング法を用いて、生物学的メカニズム(代謝、免疫、細胞完全性)における得られたタンパク質(例えば、タンパク質ライブラリー)の関与を調べることができる。
【0162】
例えば、得られたタンパク質(例えば、タンパク質ライブラリー)は、G-タンパク質結合受容体(GPCR)専用の試験、例えば、細胞へのcAMP放出又はIP3生成などの一般的なアッセイによって(例えば、競合アルファスクリーン又はHomogeneous Time Resolved Fluorescence(HTRF)法を使用することによって)スクリーニングすることができる。一般に、GPCRsi経路を研究するために、様々なリードアウトを用いることができる。簡単に説明すれば、GPCRsiへのリガンドの結合は、アデニル酸シクラーゼの活性化とcAMPの生成をもたらす。cAMPは、プロテインキナーゼA(PKA)を含むいくつかのプロテインキナーゼを活性化する。PKAの活性化は、リン酸化カスケードを開始し、cAMP応答エレメント結合タンパク質(CREB)のリン酸化と、cAMP応答エレメント(CRE)への固定をもたらす。次いで、CREBのCREへの固定は、標的遺伝子の制御をもたらす。この経路のリードアウトとして、例えば、cAMPを用いることができる。cAMPを定量化するためのキットが、いくつか市販されている。例えば、HTRF(cAMP-GS-Hirangeキットなど、Cisbio)、LANCE(LANCE Ultra cAMPアッセイ、PerkinElmer)又はGloアッセイ(cAMP-GloTM Maxアッセイ、Promega)を用いることができる。いくつかの実施形態においては、CREの活性化は、リードアウトとして用いることができる。その理由は、GPCRsi経路の中心的なリードアウトであるからである。
【0163】
得られたタンパク質の生物学的活性の有用なリードアウトの別の例は、ヒト細胞からのカルシウム放出の誘導であることができる。
【0164】
いくつかの実施形態においては、得られたタンパク質の免疫に対する効果は、例えば、末梢血単核細胞(PBMC)などのヒト免疫細胞、又はヒト免疫細胞の選択されたサブセット(例えば、マクロファージ、樹状細胞(DC)、T細胞(例えば、サブタイプ特異的))を用いることによって試験することができる。この文脈において、例えば、得られたタンパク質に曝露されたヒト細胞からのサイトカイン放出を、Elisa、Alphascreen、又はHTRFなどの方法によって決定することができる。
【0165】
いくつかの実施形態においては、生物学的活性は、生存能力及び経上皮/内皮抵抗(TEER)を試験することによって、(ヒト)上皮細胞の損傷についてチェックすることによって試験することができる;qPCRを使用する、又はプロモーターアッセイでスクリーニングすることによって、特定の標的遺伝子の発現についてチェックすることによって試験することができる;又は、例えば、alphalisa/alphascreen又はHTRF技術に基づく市販のアッセイでPPIアッセイを使用することによって、チェックポイント分子の潜在的なリガンド/モジュレーターをチェックすることによって試験することができる。
【0166】
(生物学的活性を試験すること;例えば、生物学的活性の試験後に)追加的に又は代替的に、ヒト系との相互作用は、タンパク質-タンパク質間相互作用(PPI)、特に、(i)ヒトマイクロバイオータメタセクレトームの同定された/得られたタンパク質及び(ii)ヒトタンパク質のタンパク質-タンパク質間相互作用(PPI)を調べることによって試験することができる。例えば、タンパク質-タンパク質間相互作用を試験するための方法は、アフィニティ精製/質量分析、共免疫沈降、二分子蛍光補完、アフィニティ電気泳動、ラベルトランスファー、ファージディスプレイ、タンデムアフィニティ精製、光反応性アミノ酸類似体(インビボ)、SPINE、ノックダウンと組み合わせた定量的免疫沈降(QUICK)、バイオレイヤー干渉法、二重分極干渉法(DPI)、静的光散乱(SLS)、動的光散乱(DLS)、表面プラズモン共鳴、蛍光分極/異方性、蛍光相関分光法、蛍光相互相関分光法(fluorescence cross-correlation spectroscopy)(FCCS)、蛍光共鳴エネルギー移動(FRET)、NMR、等温滴定熱量測定(ITC)、マイクロスケール熱泳動(MST)、回転セルベースリガンド結合アッセイ(Rotating cell-based ligand binding assay)、単色反射率測定(SCORE)、タンパク質断片補完アッセイ(PCA)、マイクロアレイ、特に、ペプチドアレイ及びタンパク質アレイ、ファーウェスタンブロット分析、ペプチドファージディスプレイ、酵母表面ディスプレイ、酵母ツーハイブリッド及び細菌ツーハイブリッドスクリーンなどのディスプレイ法、並びにそれらの任意の組合せからなる群から選択することができる。ペプチドマイクロアレイ、タンパク質アレイ、ペプチドファージディスプレイ、酵母表面ディスプレイ、酵母ツーハイブリッド及び細菌ツーハイブリッドスクリーンは、ハイスループットアプローチに特に好適である。
【0167】
例えば、前記したインシリコ技術を用いて、ヒトミクロバイオータメタセクレトームの同定/調製されたタンパク質と、ヒト宿主分子、特に、ヒト宿主タンパク質との相互作用を予測することができ、その後、この相互作用を(例えば、前記したように)実験的に試験することができる。例えば、生化学的又は生物学的実験、例えば、インビトロ又はインビボで試験することができる。
【0168】
好ましくは、本発明に係るヒトマイクロバイオータタンパク質薬剤候補を提供するための方法において、同定されたタンパク質は、ヒト細胞からの(目的の)物質、特に(免疫調節性)化合物の分泌を調節することができる。ヒト細胞から分泌される(免疫調節性)化合物は、当技術分野で知られており、例えば、サイトカイン(インターロイキンなど)、ケモカイン、成長因子、神経ペプチド、インクレチン、及びペプチドホルモンである。より好ましくは、ヒトマイクロバイオータタンパク質薬剤候補は、分泌促進物質である。分泌促進物質は、他の物質を分泌させる物質である。分泌される物質は、サイトカイン(インターロイキンなど)、ケモカイン、成長因子、神経ペプチド、及びペプチドホルモンからなる群から選択することができる。好ましくは、同定されたヒトマイクロバイオータタンパク質薬剤候補は、IL-2、IL-10、IL-15、IL-22、IL-23、IL-33、及び/又はTGF-ベータなどの(抗炎症性)インターロイキン;GLP-1、GLP-2、GIP、グルカゴン、ペプチドYY(PYY)、オキシントモジュリン、及び/又はグレリンなどのインクレチン;血管作動性腸管ペプチド(VIP)、ニューロペプチドY(NPY)、又はコレシストキニン(CCK)などの神経ペプチド;又はTNFアルファ又はインターフェロンガンマなどの(炎症誘発性)サイトカインの(特に、ヒト細胞からの)分泌を誘導又は向上させることができる。いくつかの実施形態においては、同定されたヒトマイクロバイオータタンパク質薬剤候補は、ヒト免疫細胞からのインターロイキン-10(IL-10)の分泌を誘導又は向上させる分泌促進物質であることができる。
【0169】
更に、本発明に係るヒトマイクロバイオータタンパク質薬剤候補を提供するための方法において、同定されたタンパク質は、ヒト細胞からの(通常は分泌される)物質の分泌を低減又は阻害することができる。例えば、同定されたヒトマイクロバイオータタンパク質薬剤候補は、IL-1ベータ、IL-4、IL-6、IL-8、IL-12、及び/又はIL-17などの(炎症誘発性)インターロイキン;IL-2及び/又はIL-22などの(抗炎症性)インターロイキン;又はTNFアルファ若しくはインターフェロンガンマなどの(炎症誘発性)サイトカインの(特にヒト細胞から)分泌を低減又は阻害することができる。
【0170】
ヒトマイクロバイオータタンパク質薬剤候補が、ヒト細胞からの(免疫調節性)化合物などの、関心のある物質の分泌を誘発/向上又は低減/阻害するかどうかは、当技術分野で知られている様々なバイオアッセイで評価することができる。一般に、当業者は、関心のある物質(ヒト細胞からの分泌が調節される、即ち、誘導/向上又は低減/阻害される)に応じてアッセイを選択することができる。この目的のために、当業者は、関心のある物質を分泌できることが知られているヒト細胞の細胞型を選択することができる。例えば、末梢血単核細胞(PBMC)などのヒト免疫細胞によって、様々な免疫調節化合物が分泌され得る。PBMCから分泌される免疫調節性化合物(関心のある潜在的物質)の例としては、IL-1ベータ、IL-6、IL-10、IL-2、IL-17、TNFアルファ、IFNガンマ、IL-22、IL-23、及びIL-33が挙げられる。例えば、ヒト細胞からのIL-8、IL-10、及びIL-33の分泌はまた、T84細胞又はHT-29細胞において評価することができる。関心のある物質の分泌に対するヒトマイクロバイオータタンパク質薬剤候補の効果を評価するために、ヒト細胞をヒトマイクロバイオータタンパク質薬剤候補に曝露し(例えば、ヒトマイクロバイオータタンパク質薬剤候補を細胞培養物に添加することにより)、関心のある物質の分泌を測定することができる(そして、ヒトマイクロバイオータタンパク質薬剤候補に曝露されていない対照と比較することができる)。
【0171】
更に、同定されたヒトマイクロバイオータタンパク質薬剤候補は、免疫調節性であることができる。
【0172】
本明細書においては、用語「免疫調節性」及び「免疫調節」は、免疫応答の変化(例えば、誘導、増幅、減衰、防止、又は低減)を意味する。これにより、この用語は、特に宿主の免疫応答、即ち、ヒトの免疫応答について言及される。
【0173】
ヒトマイクロバイオータタンパク質薬剤候補のライブラリー及びデータベース
更なる態様において、本発明はまた、前記したヒトミクロバイオータタンパク質薬剤候補を提供するための方法によって得られる、ヒトマイクロバイオータタンパク質薬剤候補のライブラリーを提供する。
【0174】
一般に、ライブラリーは、タンパク質ライブラリー、即ち、ヒトマイクロバイオータタンパク質薬剤候補を含むライブラリー、又は核酸ライブラリー、特に、ヒトマイクロバイオータタンパク質薬剤候補をコードする核酸分子(例えば、クローン化されたDNA断片)を含むDNAライブラリーであることができる。換言すれば、「ライブラリー」は単なる情報ではなく、分子(タンパク質及び/又は核酸分子)を含み、一方、「データベース」は、情報(配列情報など)を含むが、分子は含まない。いくつかの実施形態においては、ライブラリーは、ヒトマイクロバイオータタンパク質薬剤候補を含むタンパク質ライブラリーである。他の実施形態においては、ライブラリーは、ヒトマイクロバイオータタンパク質薬剤候補をコードするDNA分子を含むDNAライブラリーである。DNAライブラリーを得るために、ヒトマイクロバイオータタンパク質薬剤候補をコードするDNA分子を合成(又は抽出)し、適切なベクター(例えば、プラスミド又はバクテリオファージのゲノム)にクローン化することができる。
【0175】
したがって、本発明はまた、ヒトマイクロバイオータタンパク質薬剤候補のライブラリーを調製するための方法を提供する。ヒトマイクロバイオータタンパク質薬剤候補は、前記したように同定され、その後、DNA又はタンパク質ライブラリーが調製される。これらのライブラリーは、調製されたタンパク質の収集によって、又は前記したように当技術分野で知られたDNAライブラリーを調製することによって調製される。
【0176】
更に、本発明はまた、前記したヒトマイクロバイオータタンパク質薬剤候補を提供するための方法によって得られる、ヒトマイクロバイオータタンパク質薬剤候補のデータベースを提供する。
【0177】
一般に、データベースは、前記したヒトマイクロバイオータタンパク質薬剤候補を提供するための方法によって得られる、ヒトマイクロバイオータタンパク質薬剤候補のタンパク質及び/又は核酸配列を含む。更に、データベースは、例えば、アノテーション及び/又は生物学的活性に関する更なる情報も含むことができる。データベースは、前記したヒトマイクロバイオータタンパク質薬剤候補を提供するための方法の工程(ii)において、ヒトマイクロバイオータタンパク質薬剤候補として選択した配列に基づいて容易に得ることができる。
【0178】
したがって、本発明はまた、ヒトマイクロバイオータタンパク質薬剤候補のデータベースを調製するための方法を提供する。ヒトマイクロバイオータタンパク質薬剤候補は、前記したように同定/選択されて、データベースは、ヒトマイクロバイオータタンパク質薬剤候補のタンパク質及び/又は核酸配列のそれぞれの集合を提供する。
【0179】
ヒトマイクロバイオームメタセクレトームのタンパク質を同定するための方法
更なる態様において、本発明はまた、ヒトマイクロバイオータメタセクレトームのタンパク質を同定するための方法を提供し、前記方法は、以下の工程:
(i)複数のヒトマイクロバイオータタンパク質配列及び/又は複数のヒトマイクロバイオータタンパク質をコードする複数の核酸配列を提供することと;
(ii)前記工程(i)で提供された前記配列において、ヒトマイクロバイオータメタセクレトームのタンパク質の1以上の配列を同定することと、を含み、
前記ヒトマイクロバイオータメタセクレトームのタンパク質の前記配列が、以下の基準にしたがって選択される。
- シグナルペプチドを有する配列、又はシグナルペプチドを有するタンパク質をコードする配列である;
- 20~500アミノ酸長を有する配列、又は20~500アミノ酸長を有するタンパク質をコードする配列である;及び
- 少なくとも2つのシステイン残基を含む配列、又は立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを含む配列、又は立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを含むタンパク質をコードする配列である。
【0180】
ヒトマイクロバイオータメタセクレトームのタンパク質を同定するための方法の工程(i)及び(ii)は、前記した本発明のヒトマイクロバイオータタンパク質薬剤候補を提供するための方法の工程(i)及び(ii)に正確に対応する。「ヒトマイクロバイオータメタセクレトームのタンパク質」は、前記した方法で記載される「ヒトマイクロバイオータタンパク質薬剤候補」に対応する。したがって、本発明のヒトマイクロバイオータタンパク質薬剤候補を提供するための方法について上に概説した詳細な説明、実施形態、及び実施例が、同様に、ヒトマイクロバイオータメタセクレトームのタンパク質を同定するための方法に適用される。これらの方法間の唯一の違いは、ヒトマイクロバイオータメタセクレトームのタンパク質を同定するための方法では、タンパク質を調製する工程(iii)は必須ではないという点である(ヒトマイクロバイオータタンパク質薬剤候補を提供するための前記方法の場合では必須であるが)。
【0181】
本発明に係るヒトマイクロバイオータメタセクレトームのタンパク質を同定するための例示的な方法においては、工程(ii)は、以下のサブ工程を(好ましくは、記載された順序で)含むことができる。
1.シグナルペプチドを有する複数の配列を、Phobiusを用いて同定する、
2.アノテーションを、HMMSCANとPFAMを用いて行う、
3.冗長な配列の同定及び除去を、CD-HITを用いて、好ましくは75%の同一性カットオフで行う、
4.50~350アミノ酸長のタンパク質をコードする配列、又は50~350アミノ酸長のタンパク質の配列を選択する;
5.シグナルペプチドを有する配列を、SignalPを用いて同定する;及び
6.少なくとも2つのシステイン残基を含む配列、又は立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを含む配列、又は立体構造的に剛性な構造を与える一次及び/又は二次構造エレメントを含むタンパク質をコードする配列を選択する。
【0182】
上で概説したように、本発明のヒトマイクロバイオータタンパク質薬剤候補を提供するための方法の詳細な説明が、同様に適用される。
【0183】
更なる態様において、本発明はまた、ヒトマイクロバイオータメタセクレトーム配列データベースを生成するための方法を提供し、前記方法は、前記したように、即ち、本発明に係るヒトマイクロバイオータメタセクレトームのタンパク質を同定するための方法による、複数のヒトマイクロバイオータメタセクレトーム(タンパク質及び/又は核酸)配列の同定を含む。
【0184】
特に、ヒトマイクロバイオータメタセクレトーム配列データベースを生成するための方法は、複数のヒトマイクロバイオータメタセクレトームタンパク質配列を編集する工程を含む。
【0185】
データベースは、メタセクレトームタンパク質をコードする核酸配列及び/又はタンパク質(アミノ酸)配列を含むことができる。好ましくは、データベースは、タンパク質(アミノ酸)配列を含む。より好ましくは、データベースは、タンパク質(アミノ酸)配列及び(対応する)核酸配列を含む。
【0186】
更に、データベースは、(i)(例えば、ENSEMBL、UniProtなどの他のデータベースからの)元の配列と組み合わせて、及び/又は(ii)前記した本発明に係るヒトマイクロバイオータメタセクレトームのタンパク質の同定のための方法におけるアノテーション工程を行うことによって好ましくは得られるアノテーション情報を含むことができる。
【0187】
本発明に係るヒトマイクロバイオータメタセクレトーム配列データベースを生成するための方法において、本発明に係るヒトマイクロバイオータメタセクレトームのタンパク質を同定するための方法の工程(i)においては、複数のヒトマイクロバイオータタンパク質配列及び/又は複数のヒトマイクロバイオータタンパク質をコードする複数の核酸配列が提供され、データベースに編集され、その後の工程(即ち、工程(ii)のサブ工程)が、データベース又はデータベースに含まれる配列に対して行われることが好ましい。
【0188】
換言すれば、第1のデータベースは、本発明に係るヒトマイクロバイオータメタセクレトームのタンパク質を同定するための方法の工程(i)で編集され、その後の工程のそれぞれが、データベース又はデータベースに含まれる配列に対して行われることが好ましい。
【0189】
好ましくは、リレーショナルデータベース管理システム(RDBMS)が使用される。用語「リレーショナルデータベース管理システム(RDBMS)」は、リレーショナルモデル(Codd E.F. (1970): A Relational Model of Data for Large Shared Data Banks; Communications of the ACM; 13(6): 377-387)に基づくデータベース管理システム(DBMS)を意味する。
【0190】
リレーショナルデータベース管理システムの好ましい例としては、以下が挙げられる。
- MySQL (URL: https://www.mysql.com/; Oracle Corporation, Redwood City, USA)
- Oracle Database (URL: https://www.oracle.com/database/index.html; Oracle Corporation, Redwood City, USA);
- Microsoft SQL server (URL: https://www.microsoft.com/en-us/sql-server; Microsoft corporation);
- PostgreSQL (URL: https://www.postgresql.org/; The PostgreSQL Global Development Group);及び
- IBM DB2 (URL: https://www.ibm.com/analytics/us/en/db2/; IBM)。
【0191】
ヒトマイクロバイオームメタセクレトームのタンパク質を調製するための方法
更なる態様において、本発明はまた、前記した本発明に記載の、複数のヒトマイクロバイオータメタセクレトームタンパク質配列及び/又は複数のヒトマイクロバイオータタンパク質をコードする複数の核酸配列の同定と、それに続く以下の工程とを含む、ヒトマイクロバイオータメタセクレトームのタンパク質を調製するための方法を提供する。
-ヒトマイクロバイオータメタセクレトームの1以上のタンパク質を、これまでに同定された配列に基づいて調製すること。
【0192】
この方法は、前記した本発明のヒトマイクロバイオータタンパク質薬剤候補を提供するための方法に対応する。即ち、複数のヒトマイクロバイオータメタセクレトームタンパク質配列及び/又は複数のヒトマイクロバイオータメタセクレトームタンパク質をコードする複数の核酸配列の同定は、前記した本発明のヒトマイクロバイオータタンパク質薬剤候補を提供するための方法の工程(i)及び(ii)に対応する。これまでに同定された配列に基づいてヒトマイクロバイオータメタセクレトームの1以上のタンパク質を調製する工程は、前記した本発明のヒトマイクロバイオータタンパク質薬剤候補を提供するための方法の工程(iii)に対応する。「ヒトマイクロバイオータメタセクレトームのタンパク質」は、前記した方法に記載される「ヒトマイクロバイオータタンパク質薬剤候補」に対応する。したがって、本発明のヒトマイクロバイオータタンパク質薬剤候補を提供するための方法について上に概説した詳細な説明、実施形態、及び実施例は、同様に、ヒトマイクロバイオータメタセクレトームのタンパク質を調製するための方法に適用される。
【0193】
更なる態様において、本発明はまた、ヒト宿主分子と相互作用するヒトマイクロバイオータメタセクレトームのタンパク質を同定及び/又は提供するための方法を提供し、前記方法は、
-前記した本発明に係る、複数のヒトマイクロバイオータメタセクレトームタンパク質配列及び/又は複数のヒトマイクロバイオータタンパク質をコードする複数の核酸配列の同定と、
-任意に、前記した本発明に係る、ヒトマイクロバイオータメタセクレトームの1以上のタンパク質の調製のための方法と、
続いて、前記ヒトマイクロバイオータメタセクレトームの同定/調製されたタンパク質の、ヒト宿主分子、特に、ヒト宿主タンパク質との相互作用を試験する工程を行うこととを含む。
【0194】
この方法の追加工程は、上記した本発明のヒトマイクロバイオータタンパク質薬剤候補を提供するための方法の工程(iv)に対応する。したがって、本発明のヒトマイクロバイオータタンパク質薬剤候補を提供するための方法について上に概説した詳細な説明、実施形態、及び実施例は、同様に、ヒト宿主分子と相互作用するヒトマイクロバイオータメタセクレトームのタンパク質を同定及び/又は提供するための方法に適用される。
【0195】
更なる態様において、本発明はまた、医学における使用のための、前記した本発明に係る方法によって得ることができるヒトマイクロバイオータメタセクレトームタンパク質を提供する。かかるマイクロバイオータタンパク質は、通常、細胞表面に分泌される又は位置し、20~500アミノ酸長を有し、前記したように、少なくとも2つのシステイン残基及び/又は剛性な構造を有する。具体的な詳細、例えば、ヒトマイクロバイオータメタセクレトームタンパク質に関して本発明の方法の文脈で前記した好ましい実施形態は、同様に、本態様に適用される。
【0196】
即ち、前記した本発明の方法にしたがって得ることができるヒトマイクロバイオータメタセクレトームのタンパク質は、ヒトにおける予防及び治療用途において有用である。このことは、マイクロバイオームタンパク質の発現レベルと、特定の状態又は疾患での発現の調節の、ヒト宿主に対する生物学的影響を示唆することを示す様々な報告によって裏付けられている。
【0197】
好ましい実施形態においては、ヒトマイクロバイオータメタセクレトームタンパク質が、ヒト宿主分子、特に、前記したヒト宿主タンパク質と相互作用することが予測及び/又は判明した。かかる相互作用は、マイクロバイオームタンパク質がヒトタンパク質の機能を模倣して、それに関連する医学用途に有用である得ることを示唆している。
【0198】
いくつかの実施形態においては、かかるタンパク質は、例えば、ヒト免疫細胞によるIL-10の分泌を誘導する分泌促進物質である。更に、タンパク質は、免疫調節性であることができる。
【0199】
したがって、ヒトマイクロバイオータタンパク質は、ヒト宿主タンパク質の模倣物又は分泌促進物質であることができ、これらは、例えば、サイトカイン、インターロイキン、ケモカイン、成長因子、神経ペプチド、及びペプチドホルモンからなる群から選択される。
【0200】
例示されたヒトマイクロバイオータタンパク質薬剤候補は、本発明者らによって、前記したように、より詳細には、実施例セクションで同定された。それらの例示マイクロバイオータ薬剤候補のアミノ酸配列を、以下の表1に示す。
【表1】
表1:ヒト細胞からのIL-10分泌を誘導する及び/又は向上させる例示マイクロバイオータタンパク質の配列。
【0201】
したがって、配列番号1で表される配列を含むヒトマイクロバイオータタンパク質薬剤候補が好ましい。更に、配列番号2で表される配列を含むヒトマイクロバイオータタンパク質薬剤候補も好ましい。更に、配列番号3で表される配列を含むヒトマイクロバイオータタンパク質薬剤候補も好ましい。更に、配列番号4で表される配列を含むヒトマイクロバイオータタンパク質薬剤候補も好ましい。更に、配列番号5で表される配列を含むヒトマイクロバイオータタンパク質薬剤候補も好ましい。更に、配列番号6で表される配列を含むヒトマイクロバイオータタンパク質薬剤候補も好ましい。更に、配列番号7で表される配列を含むヒトマイクロバイオータタンパク質薬剤候補も好ましい。更に、配列番号8で表される配列を含むヒトマイクロバイオータタンパク質薬剤候補も好ましい。更に、配列番号9で表される配列を含むヒトマイクロバイオータタンパク質薬剤候補も好ましい。更に、配列番号10で表される配列を含むヒトマイクロバイオータタンパク質薬剤候補も好ましい。最も好ましくは、ヒトマイクロバイオータタンパク質薬剤候補は、配列番号1で表される配列を含む又はからなる。
【0202】
実施例1(図1)に示されるように、配列番号1~10の例示マイクロバイオータタンパク質で刺激されたヒト細胞からのIL-10分泌は、E.coli溶解物で刺激された同一タイプのヒト細胞からのIL-10分泌よりも高い。したがって、配列番号1~10のヒトマイクロバイオータ薬剤候補は、ヒト細胞からのIL-10の分泌を誘導する及び/又は向上させる。したがって、配列番号1~10のタンパク質は、炎症性疾患及び自己免疫障害の治療に有用であり得る。
【0203】
したがって、本発明はまた、配列番号1~10のいずれかによるアミノ酸配列を含むヒトマイクロバイオータメタセクレトームタンパク質も提供する。
【0204】
薬剤を調製するための方法
更なる態様において、本発明はまた、疾患の予防及び/又は治療のための薬剤を調製するための方法を提供し、前記方法は、以下の工程を含む。
(a)前記したヒトマイクロバイオータタンパク質薬剤候補を提供すること;
(b)以下を含む医薬組成物を調製すること:
(1)前記ヒトマイクロバイオータメタセクレトームの前記タンパク質、又はその(機能的)断片若しくは配列変異体;
(2)(1)に記載の前記タンパク質をコードする核酸分子;
(3)(1)に記載の前記タンパク質を発現する又は(2)に記載の前記核酸分子を含む細胞;
(4)(1)に記載の前記タンパク質に結合する抗体;
(5)(4)に記載の前記抗体をコードする核酸分子;
(6)(4)に記載の前記抗体を発現する又は(5)に記載の前記核酸分子を含む細胞;
(7)(1)に記載の前記タンパク質と相互作用する化合物;又は
(8)(1)に記載の前記タンパク質の、前記ヒト宿主分子との相互作用(結合)に干渉する化合物、
及び、任意に、薬学的に許容される担体及び/又はアジュバント。
【0205】
更に、本発明は、疾患の予防及び/又は治療のための薬剤を調製するための方法を提供し、前記方法は、以下の工程を含む。
(a)前記した本発明に係る、ヒト宿主分子と相互作用するヒトマイクロバイオータのタンパク質の同定;
(b)以下を含む医薬組成物を調製すること:
(1)前記ヒトマイクロバイオータメタセクレトームの前記タンパク質、又はその(機能的)断片若しくは配列変異体;
(2)(1)に記載の前記タンパク質をコードする核酸分子;
(3)(1)に記載の前記タンパク質を発現する又は(2)に記載の前記核酸分子を含む細胞;
(4)(1)に記載の前記タンパク質に結合する抗体;
(5)(4)に記載の前記抗体をコードする核酸分子;
(6)(4)に記載の前記抗体を発現する又は(5)に記載の前記核酸分子を含む細胞;
(7)(1)に記載の前記タンパク質と相互作用する化合物;又は
(8)(1)に記載の前記タンパク質の、前記ヒト宿主分子との相互作用(結合)に干渉する化合物、
及び、任意に、薬学的に許容される担体及び/又はアジュバント。
【0206】
本明細書においては、用語「配列変異体」は、レファレンス配列と類似している(特に、少なくとも50%の配列同一性、以下を参照)が、(100%)同一ではない配列を意味する。したがって、配列変異体は、レファレンス配列と比較して少なくとも1つの変更を含む。一般に、配列変異体は、特に、配列の全長に亘って、レファレンス配列と少なくとも50%の配列同一性を共有し、配列同一性は、前記したように計算することができる。好ましくは、配列変異体は、特に、配列の全長に亘って、レファレンス配列と、少なくとも60%、好ましくは少なくとも70%、より好ましくは少なくとも75%、より好ましくは少なくとも80%、更により好ましくは少なくとも85%、更により好ましくは少なくとも90%、特に好ましくは少なくとも95%、最も好ましくは少なくとも99%の配列同一性を共有する(これは、前記したように計算することができる)。
【0207】
一般に、用語「配列変異体」は、ヌクレオチド配列変異体及びアミノ酸配列変異体を含む。例えば、アミノ酸配列変異体は、レファレンス配列と比較して、アミノ酸の1以上が欠失若しくは置換されている、又はレファレンスアミノ酸配列と比較して、アミノ酸の1以上が挿入されている、変更された配列を有する。変更の結果、アミノ酸配列変異体は、レファレンス配列と、少なくとも50%、好ましくは少なくとも60%、より好ましくは少なくとも70%、より好ましくは少なくとも75%、更により好ましくは少なくとも80%、更により好ましくは少なくとも85%、更により好ましくは少なくとも90%、特に好ましくは少なくとも95%、最も好ましくは少なくとも99%が同一である。例えば、少なくとも90%同一である変異配列は、レファレンス配列の100アミノ酸当たり10以下の変更(即ち、欠失、挿入、又は置換の任意の組合せ)を有する。
【0208】
本明細書においては、マイクロバイオータタンパク質の「断片」は、マイクロバイオータタンパク質の少なくとも10個の連続するアミノ酸、好ましくはマイクロバイオータタンパク質の少なくとも15個の連続するアミノ酸、より好ましくはマイクロバイオータタンパク質の少なくとも20個の連続するアミノ酸、より好ましくは、マイクロバイオータタンパク質の少なくとも25個の連続するアミノ酸、更により好ましくはマイクロバイオータタンパク質の少なくとも30個の連続するアミノ酸、特に好ましくはマイクロバイオータタンパク質の少なくとも35個の連続するアミノ酸を含む。したがって、マイクロバイオータタンパク質の断片は、少なくとも10アミノ酸長、好ましくは少なくとも15アミノ酸長、より好ましくは少なくとも20アミノ酸長、更により好ましくは少なくとも25アミノ酸長、更により好ましくは少なくとも30アミノ酸長、最も好ましくは少なくとも35アミノ酸長を有する。例えば、マイクロバイオータタンパク質の断片は、マイクロバイオータタンパク質の11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、又はそれ以上の個数の連続するアミノ酸を含むことができる。マイクロバイオータタンパク質の断片は、いずれの場合でも、(完全長)マイクロバイオータタンパク質より短い(最も短い長さは、10アミノ酸長である)ことが理解される。
【0209】
例えば、マイクロバイオータタンパク質の断片は、少なくとも1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、又はそれ以上、例えば、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、又はそれ以上、完全長のマイクロバイオータタンパク質(100%の「レファレンス」を表す)より短いことができる。
【0210】
好ましくは、配列変異体又は断片は、レファレンス配列の特定の機能を保持する。本発明の文脈において、この機能は、例えば、前記した(宿主)相互作用及び/又は生物学的活性に関するヒトマイクロバイオータメタセクレトームのタンパク質の機能性である。
【0211】
本発明に係る、薬剤、特に、医薬組成物及びワクチンの調製の文脈において有用である製剤処理技術は、“Part 5 of Remington’s “The Science and Practice of Pharmacy”, 22nd Edition, 2012, University of the Sciences in Philadelphia, Lippincott Williams & Wilkins”に記載されている。
【0212】
更なる成分として、前記医薬組成物は、特に、薬学的に許容される担体及び/又はビヒクルを含むことができる。本発明の文脈においては、薬学的に許容される担体は、典型的には、本発明の医薬組成物の液体又は非液体ベースを含む。本発明の医薬組成物が液体形態で提供される場合、担体は、通常、パイロジェンフリー水、等張食塩水、又は緩衝(水)溶液、例えば、リン酸塩、クエン酸塩などの緩衝溶液である。特に本発明の医薬組成物の注射の場合には、水又は、好ましくは、ナトリウム塩、好ましくは少なくとも30mMのナトリウム塩、カルシウム塩、好ましくは少なくとも0.05mMのカルシウム塩、及び、任意に、カリウム塩、好ましくは少なくとも1mMのカリウム塩を含む緩衝溶液、より好ましくは緩衝水溶液を用いることができる。好ましい実施形態によれば、ナトリウム塩、カルシウム塩、及び任意に、カリウム塩は、それらのハロゲニド(例えば、塩化物、ヨウ化物、又は臭化物の形態)、それらの水酸化物、炭酸塩、水素炭酸塩、又は硫酸塩などの形態で生じ得る。限定されるものではないが、ナトリウム塩の例としては、例えば、NaCl、NaI、NaBr、NaCO、NaHCO、NaSOが挙げられ、任意のカリウム塩の例としては、例えば、KCl、KI、KBr、KCO、KHCO、KSOが挙げられ、カルシウム塩の例としては、例えば、CaCl、CaI、CaBr、CaCO、CaSO、Ca(OH)が挙げられる。更に、前記カチオンの有機アニオンが、緩衝溶液に含まれていてもよい。より好ましい実施形態によれば、上で定義される注射目的に適した緩衝溶液は、塩化ナトリウム(NaCl)、塩化カルシウム(CaCl)、及び任意に、塩化カリウム(KCl)から選択される塩を含むことができ、塩化物に加えて、更なるアニオンが存在してもよい。CaClは、KClなどの別の塩に置き換えることもできる。通常、注射用緩衝溶液中の塩は、少なくとも30mMの塩化ナトリウム(NaCl)、少なくとも1mMの塩化カリウム(KCl)、及び少なくとも0.05mMの塩化カルシウム(CaCl)で存在する。注射用緩衝溶液は、特定のレファレンス媒体に関して高張性、等張性、又は低張性であることができ、即ち、緩衝溶液は、特定のレファレンス媒体に関して、より高い、同一、又はより低い塩含量を有することができ、好ましくは、かかる濃度の前述の塩を用いることができ、この場合、浸透又は他の濃度効果による細胞損傷を引き起こさない。レファレンス媒体は、例えば、血液、リンパ液、細胞質液、又は他の体液などの「インビトロ」法で生じる液体、又は一般的な緩衝溶液若しくは液体など、「インビボ」法におけるレファレンス媒体として使用され得る液体などである。かかる一般的な緩衝溶液又は液体は、当業者に知られている。生理食塩水(0.9%NaCl)及びリンゲルラクテート溶液は、液体ベースとして特に好ましい
【0213】
更に、1以上の相溶性のある固体状又は液体状のフィラー若しくは希釈剤又はカプセル化化合物も、治療対象への投与に適した本発明の医薬組成物に使用することができる。本明細書においては、用語「相溶性」は、本発明の医薬組成物のこれらの成分が、本明細書で定義されるヒトマイクロバイオータメタセクレトームのタンパク質と、典型的な使用条件下において本発明の医薬組成物の実質的に医薬効果を低下させる相互作用が生じないように混合することができることを意味する。言うまでもなく、薬学的に許容される担体、フィラー、及び希釈剤は、治療対象への投与に適したものにするために、十分に高い純度及び十分に低い毒性を有している必要がある。薬学的に許容される担体、フィラー、又は構成成分として使用することができる化合物のいくつかの例は、例えば、ラクトース、グルコース及びスクロースなどの糖;例えば、コーンスターチ又はポテトスターチなどのスターチ;例えば、カルボキシメチルセルロースナトリウム、エチルセルロース、酢酸セルロースなどの、セルロース及びその誘導体;トラガント末;麦芽;ゼラチン;獣脂;例えば、ステアリン酸、ステアリン酸マグネシウムなどの固体流動化剤;硫酸カルシウム;例えば、落花生油、綿実油、ゴマ油、オリーブ油、トウモロコシ油、及びカカオ由来油などの植物油;例えば、ポリプロピレングリコール、グリセロール、ソルビトール、マンニトール、及びポリエチレングリコールなどのポリオール;アルギン酸である。
【0214】
本発明の医薬組成物に含まれ得る更なる添加剤は、例えば、Tween(登録商標)などの乳化剤;例えば、ラウリル硫酸ナトリウムなどの湿潤剤;着色剤;矯味剤、医薬担体;錠剤形成剤;安定化剤;抗酸化剤;保存料である。
【0215】
例えば、薬剤は、ワクチンであってもよい。本発明の文脈においては、用語「ワクチン」は、典型的には特定の疾患に対して、先天性及び/又は適応性の免疫を与える生物学的製剤を意味する。したがって、ワクチンは、特に、治療対象の免疫系の生来の及び/又は適応性の免疫応答を支援する。ワクチンは、生来の免疫応答をもたらし得る又はそれを支援し得るアジュバントを更に含んでもよい。
【0216】
したがって、前記医薬組成物、特に、前記ワクチンは、その免疫原性を更に高めるために、1以上の補助物質、好ましくは前記したアジュバントを更に含むことができる。それによって、上で定義したヒトマイクロバイオータメタセクレトームのタンパク質と、前記した本発明のワクチンに任意に含まれ得る補助物質との相乗作用が達成されることが好ましい。様々な種類の補助物質に応じて、様々なメカニズムをこの点で考慮することができる。例えば、樹状細胞(DC)の成熟を可能にする化合物、例えば、リポ多糖、TNF-α、又はCD40リガンドは、好適な補助物質の第1のクラスを形成する。一般に、「危険シグナル」(LPS、GP96、など)又はGM-CSFなどのサイトカインのように、免疫系に影響を与える任意の剤を補助物質として使用することができ、これにより、本発明に係る免疫刺激アジュバントによる免疫応答が、標的化された方法で向上する及び/又は影響される。特に好ましい補助物質は、モノキン、リンフォカイン、インターロイキン、又はケモカインなどの、生来の免疫応答を更に促進するサイトカインであり、例えば、IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-12、IL-13、IL-14、IL-15、IL-16、IL-17、IL-18、IL-19、IL-20、IL-21、IL-22、IL-23、IL-24、IL-25、IL-26、IL-27、IL-28、IL-29、IL-30、IL-31、IL-32、IL-33、IFN-アルファ、IFN-ベータ、IFN-ガンマ、GM-CSF、G-CSF、M-CSF、LT-ベータ又はTNF-アルファ、hGHなどの成長因子である。
【0217】
本発明の医薬組成物はまた、ヒトのToll様受容体TLR1、TLR2、TLR3、TLR4、TLR5、TLR6、TLR7、TLR8、TLR9、TLR10に対する結合アフィニティ(リガンドとしての)により、又は齧歯類のToll様受容体TLR1、TLR2、TLR3、TLR4、TLR5、TLR6、TLR7、TLR8、TLR9、TLR10、TLR11、TLR12、又はTLR13に対する結合アフィニティ(リガンドとしての)により、免疫刺激性であることが知られている任意の更なる化合物を更に含むことができる。
【0218】
この文脈において、本発明の医薬組成物、特に本発明のワクチンに添加することができる別のクラスの化合物は、CpG核酸、特に、CpG-RNA又はCpG-DNAであることができる。CpG-RNA又はCpG-DNAは、一本鎖CpG-DNA(ss CpG-DNA)、二本鎖CpG-DNA(dsDNA)、一本鎖CpG-RNA(ss CpG-RNA)、又は二本鎖CpG-RNA(ds CpG-RNA)であることができる。CpG核酸は、好ましくはCpG-RNAの形態であり、より好ましくは一本鎖CpG-RNA(ss CpG-RNA)の形態である。CpG核酸は、好ましくは、少なくとも1以上の(分裂促進的な)シトシン/グアニンジヌクレオチド配列(CpGモチーフ)を含む。第1の好ましい代替案によれば、これらの配列に含まれる少なくとも1つのCpGモチーフ、特に、CpGモチーフのC(シトシン)及びG(グアニン)は、メチル化されていない。これらの配列に任意に含まれる全ての更なるシトシン又はグアニンは、メチル化又は非メチル化のいずれかであり得る。しかし、更に好ましい代替案によれば、CpGモチーフのC(シトシン)及びG(グアニン)も、メチル化された形態で存在することができる。
【0219】
特に好ましいアジュバントは、ポリイノシン酸:ポリシチジル酸(「ポリI:C」とも称される)及び/又はその誘導体ポリICLCである。ポリI:Cは、ミスマッチの二本鎖RNAで、一方の鎖はイノシン酸のポリマーであり、他方の鎖はシチジル酸のポリマーである。ポリI:Cは、toll様受容体3(TLR3)と相互作用することが知られている免疫刺激剤である。ポリI:Cは、TLR3の「天然」刺激剤である二本鎖RNAと構造的に類似している。したがって、ポリI:Cは、二本鎖RNAの合成類似体とみなすことができる。ポリ-ICLCは、カルボキシメチルセルロース、ポリイノシン酸-ポリシチジル酸、及びポリ-L-リジン二本鎖RNAの合成複合体である。ポリI:Cと同様に、ポリICLCもTLR3のリガンドである。ポリI:C及びポリICLCは、通常、細胞毒性サイトカインの放出を刺激する。ポリ-ICLCの好ましい例は、Hiltonol(登録商標)である。
【0220】
以下では、添付図面の簡単な説明が与えられる。これらの図面は、本発明をより詳細に説明することを意図している。しかし、これらの図面は、本発明の主題を何ら限定することを意図しない。
【図面の簡単な説明】
【0221】
図1図1は、実施例1に関し、Phobiusで行った種ごとのシグナルペプチド予測の概要を示す。
図2図2は、例示的な実施形態のワークフローの概要を示す。
図3図3は、実施例4に関し、本発明に係る方法で同定された10個のヒトマイクロバイオータ薬剤候補を用いた刺激による、ヒトPBMCからのIL-10分泌についてのAlfalLISAの結果を示す。
【実施例
【0222】
以下に、本発明の様々な実施形態及び態様を説明する具体例を提示する。しかし、本発明は、本明細書に記載する特定の実施形態によって範囲が限定されるものではない。以下の調製及び実施例は、当業者が本発明をより明確に理解し、実施することができるように与えられるものである。しかし、本発明は、例示される実施形態によって範囲が限定されるものではなく、前記実施形態は、本発明の1つの態様を説明することのみを意図し、機能的に等価な方法は、本発明の範囲内である。実際、本明細書に記載するものに加えて本発明の様々な変形例は、上述の記載、添付図面、及び以下の実施例から当業者に容易に明らかになる。すべてのかかる変形例は、添付の特許請求の範囲の範囲内である。
【0223】
実施例1:ヒトマイクロバイオームの分泌タンパク質の同定
1.ヒトマイクロバイオームタンパク質のアノテーション及びシグナルペプチドを有するタンパク質の選択
第1の試験を行った。同試験では、処理及び選択するマイクロバイオーム遺伝子とゲノムを、ヒトの腸マイクロバイオームの一部であり、免疫調節活性においてそれらの役割が知られている単離された細菌ゲノムと、メタゲノムカタログに由来する遺伝子との組合せに基づいて選択した。
【0224】
種の第1のリストを編集した。同リストは、免疫調節と炎症応答制御における役割に基づいて選択された12種類が含まれた。
Alistipes shahii
Akkermansia muciniphila
Bacteroides fragilis
Bacteroides thetaiotaomicron
Barnesiella intestinihominis
Bifidobacterium breve
Bifidobacterium longum
Burkholderia cepacia
Enterococcus hirae
Fusobacterium varium
Lactobacillus johnsonii
Lactobacillus plantarum
【0225】
選択された12種類の細菌のタンパク質及び遺伝子配列を、Ensembl Bacteriaデータベース(http://bacteria.ensembl.org/index.html; P.J. Kersey, J.E. Allen, A. Allot, M. Barba, S. Boddu, B.J. Bolt, D. Carvalho-Silva, M. Christensen, P. Davis, C. Grabmueller, N. Kumar, Z. Liu, T. Maurel, B. Moore, M. D. McDowall, U. Maheswari, G. Naamati, V. Newman, C.K. Ong, D.M. Bolser., N. De Silva, K.L. Howe, N. Langridge, G. Maslen, D.M. Staines, A. Yates. Ensembl Genomes 2018: an integrated omics infrastructure for non-vertebrate species Nucleic Acids Research 2018 46(D1) D802-D808)からダウンロードした。
【0226】
次いで、各遺伝子のタンパク質とヌクレオチド配列を、この試験用に構築したMySQLデータベース(https://www.mysql.com/; Oracle Corporation, Redwood City, USA)にインポートした。
【0227】
それぞれの種で利用可能なタンパク質の総数を、以下の表2に示す。
表2:Ensembl Bacteriaデータベースから取得した、種ごとのタンパク質配列の総数
【表2】
【0228】
特に、種ごとのタンパク質数の違いは、公開データベースにおけるそれぞれの種のゲノム及び株の数によるものである。
【0229】
選択した12種類に亘る791,638の利用可能なタンパク質を全て、Phobiusソフトウェア(A combined transmembrane topology and signal peptide predictor, Stockholm Bioinformatics Centre; URL: http://phobius.sbc.su.se/; Lukas Kall, Anders Krogh and Erik L. L. Sonnhammer. A Combined Transmembrane Topology and Signal Peptide Prediction Method. Journal of Molecular Biology, 338(5):1027-1036, May 2004; Lukas Kall, Anders Krogh and Erik L. L. Sonnhammer. Advantages of combined transmembrane topology and signal peptide prediction--the Phobius web server Nucleic Acids Res., 35:W429-32, July 2007)を用いて処理し、シグナルペプチドの存在を予測した。791,638のタンパク質のうち、155,336のタンパク質がポジティブであることが分かった。各タンパク質のPhobiusの結果を、MySQLデータベースにインポートした。図1は、Phobiusがシグナルペプチドを検出したタンパク質の数を示す。
【0230】
次に、HMMSCAN(HmmerWeb version 2.21.0; https://www.ebi.ac.uk/Tools/hmmer/search/hmmscan; Finn, R. D., Clements, J. & Eddy, S. R. HMMER web server: interactive sequence similarity searching. Nucleic Acids Res 39, W29-37, doi:10.1093/nar/gkr367 (2011); Eddy, S. R. Accelerated Profile HMM Searches. PLoS Comput Biol 7, e1002195, doi:10.1371/journal.pcbi.1002195 (2011); R.D.Finn, J.Clements, W.Arndt, B.L.Miller, T.J.Wheeler, F.Schreiber, A.Bateman and S.R.Eddy: HMMER web server: 2015 update. Nucleic Acids Research (2015) Web Server Issue 43:W30-W38)及びPFAMデータベース(Version 31.0; http://pfam.xfam.org/; R.D.Finn, P.Coggill, R.Y.Eberhardt, S.R.Eddy, J.Mistry, A.L.Mitchell, S.C.Potter, M.Punta, M.Qureshi, A.Sangrador-Vegas, G.A.Salazar, J.Tate, A.Bateman: The Pfam protein families database: towards a more sustainable future. Nucleic Acids Research(2016)Database Issue 44: D279-D285; E. L. Sonnhammer, S. R. Eddy, R. Durbin: Pfam: a comprehensive database of protein domain families based on seed alignments. In: Proteins. 28, 1997, S. 405-420)を使用してタンパク質の完全なセットをアノテートし、下流のフィルタリングと、予測される分泌タンパク質の選択を容易にした。PFAMドメインの結果はいずれも、タンパク質配列及びPhobius予測と共に同一のMySQLデータベースにインポートした。
【0231】
2.冗長なタンパク質の除去及び長さフィルター
それぞれの種内の冗長性を低減するために、CD-HIT(http://cd-hit.org; http://weizhongli-lab.org/cd-hit/; Weizhong Li, Lukasz Jaroszewski & Adam Godzik. Clustering of highly homologous sequences to reduce the size of large protein databases. Bioinformatics (2001) 17:282-283; Weizhong Li & Adam Godzik. Cd-hit: a fast program for clustering and comparing large sets of protein or nucleotide sequences. Bioinformatics (2006) 22:1658-1659; Weizhong Li, Limin Fu, Beifang Niu, Sitao Wu and John Wooley. Ultrafast clustering algorithms for metagenomic of CD-HIT-OTU-MiSeqsequence analysis. Briefings in Bioinformatics, (2012) 13 (6): 656-668)を使用してPhobiusでシグナルペプチド予測についてポジティブであることが分かったタンパク質のサブセットに対し、配列クラスタリングを行った。75%の同一性カットオフを適用した。シグナルペプチドを有する、種ごとの非冗長なタンパク質の数を、以下の表3に示す。
表3:CD-HITでクラスタリングした後の、種ごとのシグナルペプチド陽性及び非冗長なタンパク質配列の数
【表3】
【0232】
タンパク質配列の長さに追加のフィルターを適用して、50~250アミノ酸長のタンパク質のみを選択した。このフィルタリングの理由は、この段階において、アノテーションの偏り又はアーチファクトに起因し得るより小さなペプチドを考慮することを避けると同時に、選択したタンパク質の最大長を制限して、この段階において、インビトロ合成及び下流の実験室試験に最も適したものとするためである。更に、250アミノ酸を超えるタンパク質は、通常、酵素であるが、ペプチドホルモン、成長因子、及びサイトカイン様タンパク質は、一般に、250アミノ酸よりも短く、これらのタイプのペプチドは、いくつかの細胞受容体上で、インビトロで直接試験して、それらの可能な調節作用を評価することができる。長さフィルター後の種ごとのタンパク質の数を、以下の表4に示す。
表4:Phobius分析によるシグナルペプチドと、50~250アミノ酸長を有する非冗長なタンパク質の数
【表4】
【0233】
したがって、5,055個のタンパク質のリストを編集した。
【0234】
3.個別のアルゴリズムに基づいてシグナルペプチドを含むタンパク質の選択、及び不完全な/トランケートされた配列の除去
追加のフィルタリング工程を行い、得られたタンパク質配列をSignalP v4.1ソフトウェア(Center for biological sequence analysis, Technical University of Denmark DTU; URL: www.cbs.dtu.dk/services/SignalP; Henrik Nielsen, Jacob Engelbrecht, Soren Brunak and Gunnar von Heijne. Identification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites. Protein Engineering, 10:1-6, 1997; Thomas Nordahl Petersen, Soren Brunak, Gunnar von Heijne & Henrik Nielsen. SignalP 4.0: discriminating signal peptides from transmembrane regions. Nature Methods, 8:785-786, 2011)で処理した。(SignalPによって用いられるグラム+又はグラム-法のいずれかで)シグナルペプチドのポジティブな予測を示すタンパク質のみが維持された。
【0235】
その後、対応するヌクレオチド配列を、適切な開始コドンと終止コドンについて検索し、元の遺伝子が「完全」であることを確認した。これにより、不完全な遺伝子(及びトランケートされたタンパク質配列)をリストから除去した。
【0236】
前記フィルタリング工程と、Phobius及びSignalP法による二重シグナルペプチド予測の後、この段階におけるタンパク質配列の最終的な数は、分泌されたヒトマイクロバイオームタンパク質の2,573配列を含んでいた。
【0237】
実施例2:シグナルペプチドのインシリコ切断
下流のタンパク質の合成と分析には、最終的な「リーダーレス」タンパク質のみが、例えば、正しく折り畳まれたタンパク質の取得、及び各配列におけるアミノ酸頻度の正しい計算に重要である。したがって、上で同定されたタンパク質配列では、シグナルペプチドを除去した。
【0238】
この目的のために、SignalPからの「Yスコア」によって与えられる切断部位を用いた。グラム+とグラム-SignalP予測の両方が同一配列に対してポジティブであった場合、より小さな切断部位を考慮した。
【0239】
実施例3:システインモチーフの同定
剛性な構造が増したタンパク質を同定するために、2,573個のタンパク質の最終リストを、システインがジスルフィド結合を形成するシステインリッチなタンパク質について検索した。
【0240】
この目的のために、KAPPA(http://kappa-sequence-search.sourceforge.net; Joly V, Matton DP. KAPPA, a simple algorithm for discovery and clustering of proteins defined by a key amino acid pattern: a case study of the cysteine-rich proteins. Bioinformatics. 2015 Jun 1;31(11):1716-23)(重要なアミノ酸パターンによって定義されるタンパク質の発見とクラスタリングのための最近公開されたアルゴリズム)を用いて、シグナルペプチドのフィルタリング、二重シグナルペプチド予測、及びインシリコ切断の後に得られた2,573個の配列を処理した。KAPPA分析では、共通のシステインモチーフを共有する25個のタンパク質クラスターが同定された。以下の表は、KAPPA実行の結果をまとめたものである。
表5:各KAPPAクラスターのタンパク質と、各クラスターのタンパク質当たりのシステインのメジアン数。
【表5】
【0241】
特に実施例1~3に記載の方法が行われた、例示実施形態のワークフローに関する概要を、図2に示す。
【0242】
実施例1~3で同定したヒトマイクロバイオータタンパク質薬剤候補は、本明細書に記載されるように製造した。
【0243】
実施例4:ヒト細胞からのIL-10放出を誘発するヒトマイクロバイオータ由来のタンパク質薬剤候補の同定
この試験の目的は、ヒト免疫細胞からのIL-10の分泌を誘導することができる、ヒトマイクロバイオータによって発現されるタンパク質を同定することとした。この目的のために、ヒトマイクロバイオータによって発現されるタンパク質のライブラリーを構築及びスクリーニングして、ヒト免疫細胞からのIL-10の分泌を誘導するタンパク質を同定した。
【0244】
実験手順:
ライブラリー:インシリコ法
腸内共生細菌からの分泌タンパク質の化合物ライブラリーを、インシリコベースのアプローチによって生成した。ライブラリーには、ヒト腸マイクロバイオームカタログ及び免疫調節における役割が知られている細菌種から予測された12,000を超えるタンパク質が含まれた。ライブラリーを得るために、50~350アミノ酸長(シグナルペプチドを含むプレタンパク質の長さ)を有する細菌タンパク質を、バイオインフォマティックツールPhobiusを使用して分泌シグナルペプチドの存在についてスクリーニングし、HMMSCAN及びPFAMデータベースを用いてアノテートした。配列の冗長性を低減するために、75%のカットオフを適用した。
【0245】
免疫調節における小さなシステインリッチタンパク質の関連性を考慮して、追加の選択基準を適用し、システインリッチタンパク質を同定した。ジスルフィド結合を形成するためには、少なくとも2つのシステインが存在する必要があった。インビトロでの正しい合成及び折り畳みを確実にするために、シグナルペプチドに対応するアミノ酸配列を除去した。
【0246】
ライブラリー:無細胞タンパク質の合成及び定量
タンパク質ライブラリーを、サプライヤーのプロトコルにしたがい、ジスルフィド結合の生成に適したEscherichia coli Cell Free kit(RTS 100 E. coli Disulfide Kit; Biotechrabbit, Hennigsdorf, Germany)を用いて生成した。無細胞系は、転写及び翻訳のための成分を含む反応コンパートメントと、アミノ酸及び他のエネルギー成分を含む供給チャンバーとの間の、半透膜を介した連続的な交換に基づく。
【0247】
E.coliの転写機構を使用する異種タンパク質発現は、選択した全配列に適用されるコドン最適化アルゴリズム(Twist Bioscience, San Francisco, USA)によって改善した。合成された全ORFは、Hisタグ付きタンパク質の高収率無細胞発現用に特別に設計されたpIVEX 2.4ベクター(Biotechrabbit、Hennigsdorf、Germany)にサブクローニングした。
【0248】
Hisタグ付きタンパク質の検出のために、HTRF(登録商標)技術(Cisbio, Codolet, France)を用いる6His Check kit Goldを、サプライヤーのプロトコルにしたがって用いた。事前に1×PBSで1:20に希釈したタンパク質を、無細胞合成に用いた溶解物中における段階希釈した(溶解物も1×PBS中で1:20に希釈した)0.1μg/mLの6×His GFP(ThermoFisher, Waltham, USA)の標準曲線に対して384ウェルプレートで定量した。
【0249】
組換えタンパク質のE.coli産生
ポジティブなヒット(positive hits)のDNAを、N末端に6×His-Tagを有するpET-28aベクター(Twist Bioscience, San Francisco, USA)にサブクローニングし、次いで、E.coli BL21(DE3)サーモコンピテントセル(New England Biolabs, Ipswich, MA, USA)に形質転換した。組換えタンパク質の発現のために、BL21(DE3)クローンの前培養を、LB培地中、30℃で、振とう(180rpm)条件下で行った。同一条件下で培養を行い、0.5mMのIPTGを用いて、OD600が0.4~0.8に達したときに誘導を開始した。各タンパク質の性質に応じて、誘導を2時間から一晩行った。
【0250】
培養物を、4℃、4500rpmで15分間遠心分離した。上清を除去し、ペレットを-80℃で凍結して細胞を破壊した。次いで、ペレットを解凍し、Benzonase(登録商標)Nuclease(Sigma-Aldrich, St. Louis, USA)及びリゾチーム(Sigma-Aldrich, St. Louis, USA)を添加した1×BugBuster(登録商標)(Novagen(登録商標), Merck KGaA, Darmstadt, Germany)に再懸濁した。サンプルを穏やかに振とうすることにより室温でインキュベートし、4℃、15,000gで30分間遠心分離した。可溶性タンパク質を、サプライヤーのプロトコルにしたがい、上清からニッケル充填カラム(Protino(登録商標), Macherey-Nagel, Duren, Germany)上に精製した。封入体で生成されたタンパク質を、8M尿素を使用してペレットから可溶化した。タンパク質溶出に用いられるイミダゾール(250mM)を、3kDaカットオフフィルター(Amicon(登録商標), Merck Millipore Ltd., Burlington, USA)を使用するバッファー交換により除去した。タンパク質を、12%Bis-Trisアクリルアミドゲル(ThermoFisher, Waltham, USA)上で、クマシーブルー(Imperial protein Stain; ThermoFisher, Waltham, USA)で染色して可視化し、1:3000で希釈した6×-HisTagモノクローナル抗体HIS.H8(ThermoFisher, Waltham, USA)を用いるウエスタンブロットによって検出し、二次抗体であるヤギ抗マウスIgG H+L WesternDot625 (ThermoFisher, Waltham, USA)を用いて視覚化した。精製後タンパク質を、ブラッドフォードタンパク質アッセイ(Bradford M (1976) A rapid and sensitive method for the quantitation of microgram quantities of protein utilizing the principle of protein-dye binding. Anal. Biochem. 72:248-254)によって定量した。
【0251】
IL10スクリーニング
マイクロバイオータタンパク質ライブラリーのIL-10スクリーニングは、CD14枯渇ヒト末梢血単核細胞(PBMC)で行った。この細胞モデルは、合成後(未精製)のタンパク質の無細胞合成キットの溶解物に存在し得る、細胞壁成分及びその他の細菌汚染物質によるバックグラウンドを低減するために選択した。
【0252】
CD14枯渇PBMC:
PBMCを、バフィーコートから、以下のように単離した。80mlのPBSを50mlの血液に添加し;4SepMateTM-50IVDチューブ(Stemcell Technologies, Vancouver, Canada)を、1ドナー当たり15mlのFicoll(登録商標)(Ficoll(登録商標) Paque Plus; Sigma-Aldrich, St. Louis, USA)で充填し、次いで、PBSで希釈した血液30mlを穏やかに添加した。サンプルを、1200g、室温で20分間遠心分離し、PBSで3回洗浄した。赤血球を溶解するために、ペレットを赤血球溶解緩衝溶液1×(Miltenyi Biotec, Bergisch Gladbach, Germany)に再懸濁し、室温で10分間インキュベートした。次に、細胞をMACS緩衝溶液で洗浄し、カウントした。
【0253】
サプライヤーのプロトコルにしたがい、PBMC枯渇を、CD14 Microbeadsキット(Miltenyi Biotec, Bergisch Gladbach, Germany)を用いて行った。枯渇させた単球を、1%のL-グルタミン(Sigma-Aldrich, St. Louis, USA)、1%のペニシリン-ストレプトマイシン(Sigma-Aldrich, St. Louis, USA)、及び10%の熱不活化FBS(Sigma-Aldrich, St. Louis, USA)を添加したIscove’s Modified Dulbecco’s Medium(IMDM; GIBCOTM, Life Technologies, Carlsbad, USA)に再懸濁した。
【0254】
IL10スクリーニング:
スクリーニングは、最終体積60μlで、384ウェルプレートで行った。PBMCを、マルチドロップ(Hamilton Robotics, Martinsried, Germany)により、72,000細胞/ウェルで播種し、37℃の加湿5%CO雰囲気にて、PBSで1:10に事前希釈したライブラリー(タンパク質)の10%(vol/vol)で72時間刺激した。無細胞キットに含まれるE.coli溶解物を、陰性対照として使用した(ライブラリーと同じ希釈率で)。10μg/ml(0.087μM)のフィトヘマグルチニン(PHA)を、陽性対照として使用した。技術的ロバスト性を保証するために、少なくとも2名の異なるドナーのCD14枯渇PBMCに対してスクリーニングを行った。
【0255】
サプライヤーのプロトコルにしたがい、IL-10の分泌を、AlphaLISA(登録商標)(IL10 (ヒト) AlphaLISA Detection Kit; PerkinElmer, Waltham MA, USA)によって、未希釈上清について測定した。結果は、AlphaLISAシグナル(カウント)として表した。(2名のPBMCドナーの2つのシグナルのうちの)少なくとも1つの生データシグナルが、対応するプレート平均+3SD(標準偏差)より高かった場合、又は(2名のPBMCドナーの2つのシグナルのうちの)両方の生データシグナルが、対応するプレート平均+2SD(標準偏差)より高かった場合に、結果をポジティブなヒットとみなした。偽ポジティブを避けるために、一次スクリーニングによって得られた潜在的なヒットの濃度を、対応するプレート平均の濃度と比較した。
【0256】
次いで、潜在的なヒットを、無細胞合成の新たなラウンドと、数名のドナーのCD14枯渇PBMCに対する試験によって検証した(前記した通り)。標的配列を含むpET-28aベクターで形質転換された、E.coli BL21(DE3)株で産生された組換えタンパク質について、更なる特性評価を行った(前記した通り、段落「組換えタンパク質のE.coli産生」を参照)。或いは、一部のタンパク質の無細胞産生は、商業的サプライヤー(Synthelis, La Tronche, France)によって行われた。
【0257】
結果
スクリーニング
ヒトPBMCからのIL-10分泌を刺激することができるタンパク質を同定するために、ライブラリーの合計11904個のタンパク質をCD14枯渇PBMCでスクリーニングした。一次スクリーニングで得られた様々な潜在的なヒットから、これまでに、無細胞合成の第2ラウンドで10個のタンパク質が確認された。ヒトPBMCからのIL-10分泌を刺激することができるこれらのマイクロバイオータタンパク質は、ID3166(配列番号1);ID6359(配列番号2);ID1888(配列番号3);ID1889(配列番号4);ID2661(配列番号5);ID5682(配列番号6);ID5138(配列番号7);ID6077(配列番号8);ID6274(配列番号9);及びID6298(配列番号10)を含む。
【0258】
無細胞合成の第2ラウンドのヒトPBMCからのIL-10分泌に対するAlphaLISAの結果を、図1に示す。データは、ヒトPBMCからのIL-10放出の刺激によるヒトマイクロバイオームメタセクレトームタンパク質ライブラリーのスクリーニングによって、10個のIL-10分泌促進物質のタンパク質が同定されたことを示す。これらのマイクロバイオータタンパク質は、ヒト免疫細胞からのIL-10放出を誘発する。
【0259】
配列及び配列番号表(配列表)
図1
図2
図3
【配列表】
2023514064000001.app
【国際調査報告】