特許7542443 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ナンジンジンスールイ　サイエンス　アンド　テクノロジー　バイオロジー　コーポレイションの特許一覧

特許7542443コドン最適化

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2A
2B
3
4

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-08-22

(45)【発行日】2024-08-30

(54)【発明の名称】コドン最適化

(51)【国際特許分類】

G16B 30/00 20190101AFI20240823BHJP

C12N 15/11 20060101ALI20240823BHJP

C12P 21/02 20060101ALI20240823BHJP

C12N 15/63 20060101ALI20240823BHJP

C12N 1/15 20060101ALI20240823BHJP

C12N 1/19 20060101ALI20240823BHJP

C12N 1/21 20060101ALI20240823BHJP

C12N 5/10 20060101ALI20240823BHJP

【ＦＩ】

G16B30/00

C12N15/11 Z ZNA

C12P21/02 C

C12N15/63 Z

C12N1/15

C12N1/19

C12N1/21

C12N5/10

【請求項の数】 24

(21)【出願番号】P 2020566849

(86)(22)【出願日】2019-07-30

(65)【公表番号】

(43)【公表日】2021-11-25

(86)【国際出願番号】 CN2019098258

(87)【国際公開番号】W WO2020024917

(87)【国際公開日】2020-02-06

【審査請求日】2022-05-25

(31)【優先権主張番号】PCT/CN2018/097745

(32)【優先日】2018-07-30

(33)【優先権主張国・地域又は機関】CN

(73)【特許権者】

【識別番号】515134069

【氏名又は名称】ナンジンジェンスクリプトバイオテックカンパニー，リミテッド

(74)【代理人】

【識別番号】100078282

【弁理士】

【氏名又は名称】山本秀策

(74)【代理人】

【識別番号】100113413

【弁理士】

【氏名又は名称】森下夏樹

(74)【代理人】

【識別番号】100181674

【弁理士】

【氏名又は名称】飯田貴敏

(74)【代理人】

【識別番号】100181641

【弁理士】

【氏名又は名称】石川大輔

(74)【代理人】

【識別番号】230113332

【弁護士】

【氏名又は名称】山本健策

(72)【発明者】

【氏名】ファン，ロン

【審査官】渡邉加寿磨

(56)【参考文献】

【文献】国際公開第２０１７／１６９７３６（ＷＯ，Ａ１）

【文献】米国特許出願公開第２０１４／０２５６５５７（ＵＳ，Ａ１）

【文献】米国特許出願公開第２０１３／００１１９０９（ＵＳ，Ａ１）

【文献】米国特許出願公開第２０１４／０２４４２２８（ＵＳ，Ａ１）

【文献】米国特許出願公開第２０１１／００８１７０８（ＵＳ，Ａ１）

【文献】米国特許出願公開第２０１７／０３６２６２７（ＵＳ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｑ１０／００－９９／００

Ｇ１６Ｂ５／００－９９／００

Ｇ１６Ｚ９９／００

Ｃ１２Ｎ１／１５

Ｃ１２Ｎ１／１９

Ｃ１２Ｎ１／２１

Ｃ１２Ｎ５／１０

Ｃ１２Ｎ１５／１１

Ｃ１２Ｎ１５／６３

Ｃ１２Ｐ２１／０２

(57)【特許請求の範囲】

【請求項1】

宿主におけるタンパク質の発現のための、核酸配列を最適化するためのコンピュータ実施方法であって、前記コンピュータ実施方法は、
ａ）初期集団セットを受け取ることであって、前記初期集団セットが、前記タンパク質を発現することができる複数の初期候補核酸配列を含む、前記受け取ることと、
ｂ）前記初期集団セットに基づいて、コンピュータ支援ＮＳＧＡ－ＩＩＩアルゴリズムまたはその変形を使用して、調和インデックス、コドン文脈インデックス、及び外れ値インデックスの最適化を実行し、それによって前記タンパク質を発現することができる複数の最適化された核酸配列を得ることを含み、
候補核酸配列の前記調和インデックスは、複数の高発現遺伝子と前記候補核酸配列との間の同義コドンの使用頻度分布の一貫性を示し、
前記候補核酸配列の前記コドン文脈インデックスは、同義コドンを好適な場所に配置するための尺度であり、
前記候補核酸配列の前記外れ値インデックスは、前記候補核酸配列に対する複数の所定の配列特徴の負の効果の尺度であり、
調和インデックス、コドン文脈インデックス、及び外れ値インデックスの最適化を実行することは、
前記初期集団セットの各初期候補核酸配列について、それぞれの初期候補核酸配列のそれぞれの調和インデックス値、それぞれのコドン文脈インデックス値、及びそれぞれの外れ値インデックス値を計算することと、
前記計算に基づいて、前記複数の初期候補核酸配列に対応する複数の適合値を割り当てることと、
前記複数の適合値に基づいて、前記複数の初期候補核酸配列を分類することと、
後続の集団セット内に前記分類された複数の初期候補核酸配列のサブセットを含むことを含み、
調和インデックス、コドン文脈インデックス、及び外れ値のインデックスの最適化を実行することは、複数の反復を含み、前記複数の反復の１つ以上の終了条件は、一定の反復数に到達することと、最良の適合性がプラトーに到達し、これ以上良好な結果が生成されないことと、ほぼ最適な解決策の最小基準がいくつかの解決策によって満たされることと、またはそれらの任意の組み合わせを含む、前記コンピュータ実施方法。

【請求項2】

前記複数の最適化された核酸配列のうちの少なくとも１つの最適化された核酸配列を示す出力を提供することをさらに含む、請求項１に記載の方法。

【請求項3】

初期集団セットを受け取ることは、
タンパク質配列を受け取ることと、
前記受け取ったタンパク質配列に基づいて、前記初期集団セットを生成することを含む、請求項１または２に記載の方法。

【請求項4】

初期集団セットを受け取ることは、
核酸配列を受け取ることと、
前記受け取った核酸配列をタンパク質配列に翻訳することと、
前記タンパク質配列に基づいて、前記初期集団セットを生成することを含む、
請求項１または２に記載の方法。

【請求項5】

調和インデックス、コドン文脈インデックス、及び外れ値インデックスの最適化を実行することは、
前記調和インデックスを最大化することと、
前記コドン文脈インデックスを最大化することと、
前記外れ値インデックスを最小化することを含む、
請求項１～４のいずれか１項に記載の方法。

【請求項6】

前記初期集団セットに基づいて子孫集団を生成することと、
前記後続の集団セットに前記子孫集団を含むことと、をさらに含む、
請求項５に記載の方法。

【請求項7】

調和インデックス、コドン文脈インデックス、及び外れ値のインデックスの最適化を実行することは、複数の反復を含み、
前記複数の反復のｉ番目の反復は、
（ｉ－１）番目の反復に対応する核酸配列の集団セットを受け取ることと、
前記（ｉ－１）番目の反復に対応する前記集団セットの各核酸配列を非優勢レベルに関連付けることと、
前記関連付けた非優勢レベルに基づいて、前記（ｉ－１）番目の反復に対応する前記集団セット内の前記核酸配列を分類することと、
前記ｉ番目の反復に対応する集団セットを生成することであって、前記ｉ番目の反復に対応する前記集団セットには、前記（ｉ－１）番目の反復に対応する前記分類された核酸配列のサブセット及び前記（ｉ－１）番目の反復に対応する前記分類された核酸配列に基づいて生成された子孫集団が含まれる、前記生成することと、
１つ以上の終了条件に基づいて、前記ｉ番目の反復に対応する前記集団セットを使用して、（ｉ＋１）番目の反復に進むか否かを決定することを含む、
請求項１～６のいずれか１項に記載の方法。

【請求項8】

各核酸配列を非優勢レベルと関連付けることは、前記（ｉ－１）番目の反復に対応する前記集団セットの各核酸配列について、それぞれの調和インデックス値、それぞれのコドン文脈インデックス値、及びそれぞれの外れ値インデックス値を計算することを含む、請求項７に記載の方法。

【請求項9】

候補核酸配列の前記調和インデックスが、以下の式：

【数16】

に基づいて計算され、
式中、Ｄ（）は距離関数を示し、
Ｆ_ｈｓが、複数の高発現遺伝子内の複数のアミノ酸の同義コドンの頻度を含むベクトルを含み、
Ｆ_ｔｓが、前記候補核酸配列のコーディング遺伝子内の前記複数のアミノ酸の同義コドンの頻度を含むベクトルを含む、
請求項１～８のいずれか１項に記載の方法。

【請求項10】

Ｄ（）は、限定されないが、２つのベクトルのユークリッド距離、コサイン距離、マンハッタン距離、またはミンコフスキー距離などの距離関数である、請求項９に記載の方法。

【請求項11】

前記複数の高発現遺伝子または候補核酸配列の同義コドンの頻度が以下のように定義される、請求項１０に記載の方法。

【数17】

【請求項12】

候補核酸配列の前記コドン文脈インデックスが、以下の式：

【数18】

に基づいて計算され、
式中、Ｄ（）は距離関数を示し、
Ｆ_ｈｃｃは、複数の高発現遺伝子内の２つの連続的なアミノ酸の同義コドンペアの頻度を含むベクトルを含み、
Ｆ_ｔｃｃは、前記候補核酸配列のコーディング遺伝子内の２つの連続アミノ酸の同義コドンペアの頻度を含むベクトルを含む、
請求項１～１１のいずれか１項に記載の方法。

【請求項13】

Ｄ（）は、限定されないが、２つのベクトルのユークリッド距離、コサイン距離、マンハッタン距離、またはミンコフスキー距離などの距離関数である、請求項１２に記載の方法。

【請求項14】

前記複数の高発現遺伝子または候補核酸配列の同義コドンペアの頻度が、以下のように定義される、請求項１２～１３のいずれかに記載の方法。

【数19】

【請求項15】

前記外れ値インデックスが、以下の式：

【数20】

に基づいて計算され、
Ｎが、前記複数の所定の配列特徴の数であり、
ｆ_ｉ（ｘ）は、前記複数の所定の配列特徴のｉ番目の配列特徴のペナルティスコアリング関数の特徴を表し；
ｗ_ｉは、ｆ_ｉ（ｘ）に関連付けられる相対的な重み付けを示す、請求項１～１４のいずれか１項に記載の方法。

【請求項16】

前記複数の所定の配列特徴が、
ＧＣ含有値、
ＣＩＳエレメント、
反復エレメント、
ＲＮＡスプライシング部位、
リボソーム結合配列、
ｍＲＮＡの最小自由エネルギー、または
それらの任意の組み合わせを含む、
請求項１５に記載の方法。

【請求項17】

前記コンピュータ支援ＮＳＧＡ－ＩＩＩアルゴリズムの変形が、ＥｌｉｔｅＮＳＧＡ－ＩＩＩアルゴリズムまたはＮＳＧＡ－ＩＩベースの免疫アルゴリズムを含む、請求項１～１６のいずれか１項に記載の方法。

【請求項18】

調和インデックス、コドン文脈インデックス、及び外れ値インデックスの最適化を実行することは、
調和インデックスの降順、次にコドン文脈インデックスの降順、次に外れ値インデックスの昇順によって、前記複数の最適化された核酸配列をランク付けすることと、
合成のために１つ以上のトップランクの最適化された核酸配列を選択することを含む、請求項１～１７のいずれか１項に記載の方法。

【請求項19】

ｃ）前記複数の最適化された核酸配列のうちの最適化された核酸配列から所定の有害な部分配列またはモチーフを除去すること、
をさらに含む、請求項１～１８のいずれか１項に記載の方法。

【請求項20】

前記所定の有害な部分配列またはモチーフを除去することは、
前記最適化された核酸配列における前記所定の有害な部分配列またはモチーフを同定することと、
同定された所定の有害な部分配列またはモチーフに基づいて複数の同義コドンを同定することと、
前記最適化された核酸配列において前記同定された所定の有害な部分配列で置換するために、前記複数の同義コドンから同義コドンを選択すること、
を含む、請求項１９に記載の方法。

【請求項21】

前記調和インデックス、前記コドン文脈インデックス、及び前記外れ値インデックスのうちの少なくとも１つが、１つ以上のデータベースからの複数の高発現遺伝子の１つ以上の特徴に基づいて計算される、請求項１～２０のいずれか１項に記載の方法。

【請求項22】

前記１つ以上の特徴が、コドン頻度、同義コドンの頻度、コドンペア頻度、またはそれらの組み合わせを含む、請求項２１に記載の方法。

【請求項23】

宿主においてタンパク質を発現させるために核酸配列を最適化するためのシステムであって、前記システムが、
１つ以上のプロセッサと、
メモリと、
１つ以上のプログラムと、を備え、前記１つ以上のプログラムが前記メモリに格納され、前記１つ以上のプロセッサによって実行されるように構成され、前記１つ以上のプログラムが、請求項１～２２のいずれか１項に記載の方法を実行するための命令を含む、前記システム。

【請求項24】

宿主においてタンパク質を発現させるために核酸配列を最適化するための電子デバイスであって、請求項１～２２のいずれか１項に記載の方法を実行するためのソフトウェアを含む、前記電子デバイス。

【発明の詳細な説明】

【技術分野】

【0001】

ＡＳＣＩＩテキストファイルでの配列表の提出
ＡＳＣＩＩテキストファイルでの以下の提出内容の全体が、参照により本明細書に組み込まれる：コンピュータ可読形態（ＣＲＦ）の配列表（ファイル名：７５９８９２０００４４０ＳＥＱＬＩＳＴ．ＴＸＴ、データ記録日：２０１８年７月２５日、サイズ：４ＫＢ）。

【0002】

発明の分野
本開示は、一般に、最適化技術、より具体的には、宿主においてタンパク質を発現させるために配列（例えば、核酸配列）を最適化するためのシステム及び方法に関する。

【背景技術】

【0003】

コドン縮重とは、遺伝暗号の冗長性を指し、それはアミノ酸が異なる同義コドンによって指定され得る現象として示される。特に、これらの同義コドンは、配列決定されたほとんどのゲノムにおいて均等でない頻度で使用されていることが発見された。この現象は、コドン使用頻度バイアスと呼ばれる。

【0004】

生物医学及び生物工学の研究ならびに工業生産には、正しいフォールディング及び修飾を有する高品質のタンパク質が必要であるため、タンパク質の発現レベルを改善するには、高発現遺伝子のコドン使用頻度バイアスを反映する潜在的に有益なルール及びパターンを探索し、要約する方法が不可欠である。しかし、タンパク質の発現は、転写、ｍＲＮＡターンオーバー、翻訳、及び翻訳後修飾のレベルでの調節を伴う多段階プロセスであり、これにより、安定した生成物の形成が可能になる。単一の同義コドンの置換であっても、導入遺伝子の発現を１，０００倍以上増加させることができる。したがって、コドン最適化は、組換え宿主において合成遺伝子を最適に発現させるようになっている。

【発明の概要】

【課題を解決するための手段】

【0005】

本明細書で提供されるのは、多目的最適化アルゴリズムを使用して複数の因子を考慮し、バランスをとる、コドン最適化を向上させるためのシステム及び方法である。いくつかの実施形態によれば、コドン最適化は、とりわけ、（ｉ）ある特定のアミノ酸の同義コドンの数を最初にどのように割り当てるか、（ｉｉ）同義コドンをその最も好適な場所にどのように配置するか、及び（ｉｉｉ）有害であるが誤って生成された部分配列及び／またはモチーフをどのように減少させるかの３つの目的に基づく。いくつかの実施形態では、これらの３つの目的は、調和インデックス、コドン文脈インデックス、及び外れ値インデックスとして定量化される。最適化中に、これらの目的は、非優勢ソート遺伝的アルゴリズムＩＩＩ（ＮＳＧＡ－ＩＩＩ）またはその変形などの多目的アルゴリズムを使用して考慮される。具体的には、これらの目的は、高発現遺伝子の既知の特徴を参照して、所与の候補核酸配列について計算することができる。いくつかの実施形態では、様々な既知の有害なモチーフ及び／または特徴（例えば、文献から同定されるもの）は、遺伝子合成及びタンパク質発現の前に、１つ以上の最適化された配列から除去される。

【0006】

したがって、本発明は、好ましくは、限定されないが、コドン調和、コドン使用頻度（例えば、同義コドンの分布）、コドン文脈インデックス、シス作用性ｍＲＮＡ不安定化モチーフ、ＲＮａｓｅスプライシング部位、ＧＣ含有率、リボソーム結合部位（ＲＢＳ）、遺伝子のｍＲＮＡ二次構造（例えば、ｍＲＮＡ自由エネルギー）など、タンパク質発現に影響を与えるパラメータ及び因子のすべてまたはほとんどを提供する体系的な方法を提供し、哺乳動物、昆虫、酵母、細菌、藻類などの真核細胞及び原核細胞の両方などの発現宿主細胞などの発現系、ならびに無細胞発現系における遺伝子のタンパク質発現を高めるために、核酸配列を改善し、最適化するために反復エレメントを考慮する。

【0007】

いくつかの実施形態では、宿主においてタンパク質を発現させるために核酸配列を最適化するためのコンピュータ実施方法が提供され、本方法は、ａ）初期集団セットを受け取ることであって、初期集団セットが、タンパク質を発現できる複数の初期候補核酸を含む、受け取ることと、ｂ）初期集団セットに基づいて、コンピュータ支援ＮＳＧＡ－ＩＩＩアルゴリズムまたはその変形を使用して、調和インデックス、コドン文脈インデックス、及び外れ値インデックスの最適化を実行し、それにより、当該タンパク質を発現させ得る複数の最適化された核酸配列を得ることを含み、候補核酸配列の調和インデックスは、複数の高発現遺伝子と候補核酸配列との間の同義コドンの使用頻度分布の一貫性を示し、候補核酸配列のコドン文脈インデックスは、同義コドンを好適な場所に配置するための尺度であり、候補核酸配列の外れ値インデックスは、候補核酸配列に対する複数の所定の配列特徴の負の効果の尺度である。

【0008】

いくつかの実施形態では、この方法は、複数の最適化された核酸配列のうちの少なくとも１つの最適化された核酸配列を示す出力を提供することをさらに含む。

【0009】

いくつかの実施形態では、初期集団セットを受け取ることは、タンパク質配列を受け取ることと、受け取ったタンパク質配列に基づいて初期集団セットを生成することを含む。

【0010】

いくつかの実施形態では、初期集団セットを受け取ることは、核酸配列を受け取ることと、受け取った核酸配列をタンパク質配列に翻訳することと、タンパク質配列に基づいて初期集団セットを生成することを含む。

【0011】

いくつかの実施形態では、初期集団セットは、所定のサイズのものである。

【0012】

いくつかの実施形態では、初期集団セットは、複数の初期候補核酸配列のバイナリ表現を含む。

【0013】

いくつかの実施形態では、調和インデックス、コドン文脈インデックス、及び外れ値インデックスの最適化を実行することは、調和インデックスを最大化することと、コドン文脈インデックスを最大化することと、外れ値インデックスを最小化することを含む。

【0014】

いくつかの実施形態では、調和インデックス、コドン文脈インデックス、及び外れ値インデックスの最適化を実行することは、初期集団セットの各初期候補核酸配列について、それぞれの初期候補核酸配列のそれぞれの調和インデックス値、それぞれのコドン文脈インデックス値及びそれぞれの外れ値インデックス値を計算することと、この計算に基づいて、複数の初期候補核酸配列に対応する複数の適合性値を割り当てることと、この複数の適合性値に基づいて、複数の初期候補核酸配列を分類することと、分類された複数の初期候補核酸配列のサブセットを後続の集団セットに含めることを含む。いくつかの実施形態では、複数の適合性値は、候補核酸配列の調和インデックス、コドン文脈インデックス、及び外れ値インデックスを含む。

【0015】

いくつかの実施形態では、この方法は、初期集団に基づいて子孫集団を生成することと、子孫集団を後続の集団セットに含めることと、をさらに含む。

【0016】

いくつかの実施形態では、子孫集団は、バイナリトーナメント選択、クロスオーバー／組換え、変異、またはそれらの任意の組み合わせを介して生成される。

【0017】

いくつかの実施形態では、初期集団セット及び後続の集団セットは、同じサイズである。

【0018】

いくつかの実施形態では、調和インデックス、コドン文脈インデックス、及び外れ値インデックスの最適化を実施することは、複数の反復を含み、複数の反復のｉ番目の反復は、（ｉ－１）番目の反復に対応する核酸配列の集団セットを受け取ることと、（ｉ－１）番目の反復に対応する集団セットの各核酸配列を非優勢レベルに関連付けることと、関連付けた非優勢レベルに基づいて、（ｉ－１）番目の反復に対応する集団セット内の核酸配列を分類することと、ｉ番目の反復に対応する集団セットを生成することであって、ｉ番目の反復に対応する集団セットが、（ｉ－１）番目の反復に対応する分類された核酸配列のサブセットと、（ｉ－１）番目の反復に対応する分類された核酸配列に基づいて生成された子孫集団と、を含む、生成することと、１つ以上の終了条件に基づいて、ｉ番目の反復に対応する集団セットを使用して、（ｉ＋１）番目の反復に進むか否かを決定することを含む。

【0019】

いくつかの実施形態では、各核酸配列を非優勢レベルに関連付けることは、（ｉ－１）番目の反復に対応する集団セットの各核酸配列について、それぞれの調和インデックス値、それぞれのコドン文脈インデックス値、及びそれぞれの外れ値インデックス値を計算することを含む。

【0020】

いくつかの実施形態では、ｉ番目の反復に対応する集団セットを生成することは、（ｉ－１）番目の反復に対応する分類された核酸配列の少なくとも１つの核酸配列を複数の所定の参照点のうちの１つに関連付けることを含む。

【0021】

いくつかの実施形態では、１つ以上の終了条件は、一定の反復数に到達すること、最良の適合性がプラトーに到達し、これ以上の良い結果が生成されないこと、ほぼ最適な解決策の最小基準がいくつかの解決策によって満たされていること、またはそれらの任意の組み合わせを含む。

【0022】

いくつかの実施形態では、候補核酸配列の調和インデックスは、以下の式：

【数1】

に基づいて計算され、式中、Ｄ（）は距離関数を示し、Ｆ_ｈｓは、複数の高発現遺伝子内の複数のアミノ酸の同義コドンの頻度を含むベクトルを含み、Ｆ_ｔｓは、候補核酸配列のコード遺伝子内の複数のアミノ酸の同義コドンの頻度を含むベクトルを含む。

【0023】

いくつかの実施形態では、Ｄ（）は、２つのベクトル間の距離を測定する関数を示す。いくつかの実施形態では、Ｄ（）は、２つのベクトルのユークリッド距離、コサイン距離、マンハッタン距離、またはミンコフスキー距離を含むがこれらに限定されない距離関数である。

【0024】

いくつかの実施形態では、複数の高発現遺伝子または候補核酸配列の同義コドンの頻度は、以下のとおり定義される。

【数2】

【0025】

いくつかの実施形態では、候補核酸配列のコドン文脈インデックスは、以下の式：

【数3】

に基づいて計算され、
式中、Ｄ（）は距離関数を示し、Ｆ_ｈｃｃは、複数の高発現遺伝子内の２つの連続したアミノ酸の同義コドンペアの頻度を含むベクトルを含み、Ｆ_ｔｃｃは、候補核酸配列のコード遺伝子内の２つの連続するアミノ酸の同義コドンペアの頻度を含むベクトルを含む。

【0026】

【0027】

いくつかの実施形態では、複数の高発現遺伝子または候補核酸配列の同義コドンペアの頻度は、以下のように定義される。

【数4】

【0028】

いくつかの実施形態では、外れ値インデックスは、以下の式：

【数5】

に基づいて計算され、
式中、Ｎは、複数の所定の配列特徴の数であり、ｆ_ｉ（ｘ）は、複数の所定の配列特徴のｉ番目の配列特徴のペナルティスコアリング関数を示し、ｗ_ｉはｆ_ｉ（ｘ）に関連付けられた相対的な重み付けを示す。

【0029】

いくつかの実施形態では、複数の所定の特徴としては、ＧＣ含有値、ＣＩＳエレメント、反復エレメント、ＲＮＡスプライシング部位、リボソーム結合配列、ｍＲＮＡの最小自由エネルギー、またはそれらの任意の組み合わせが挙げられる。

【0030】

いくつかの実施形態では、複数の所定の特徴は、選択された発現系に基づいて同定される。

【0031】

いくつかの実施形態では、ＮＳＧＡ－ＩＩＩアルゴリズムの変形としては、ＥｌｉｔｅＮＳＧＡ－ＩＩＩアルゴリズムまたはＮＳＧＡ－ＩＩベースの免疫アルゴリズムが挙げられる。

【0032】

いくつかの実施形態では、調和インデックス、コドン文脈インデックス、及び外れ値インデックスの最適化を実施することは、調和インデックスの降順、次にコドン文脈インデックスの降順、次に外れ値インデックスの昇順によって複数の最適化された核酸配列をランク付けすることと、合成のために１つ以上のトップランクの最適化された核酸配列を選択することを含む。

【0033】

いくつかの実施形態では、この方法は、ｃ）複数の最適化された核酸配列のうちの最適化された核酸配列から、所定の有害な部分配列またはモチーフを除去することをさらに含む。

【0034】

いくつかの実施形態では、所定の有害な部分配列またはモチーフは、複数のテキスト部分の分析に基づいて同定される。

【0035】

いくつかの実施形態では、所定の有害な部分配列またはモチーフを除去することは、最適化された核酸配列において所定の有害な部分配列またはモチーフを同定することと、同定された所定の有害な部分配列またはモチーフに基づいて複数の同義コドンを同定することと、最適化された核酸配列において同定された所定の有害な部分配列を置換するために、複数の同義コドンから同義コドンを選択することを含む。

【0036】

いくつかの実施形態では、調和インデックス、コドン文脈インデックス、及び外れ値インデックスのうちの少なくとも１つは、１つ以上のデータベースからの複数の高発現遺伝子の１つ以上の特徴に基づいて計算される。

【0037】

いくつかの実施形態では、１つ以上の特徴には、コドン頻度、同義コドンの頻度、コドンペア頻度、またはそれらの組み合わせが含まれる。

【0038】

いくつかの実施形態では、方法は、１つ以上のパラメータを設定することをさらに含み、１つ以上のパラメータには、集団セットのサイズ、分割数、シミュレートされたバイナリクロスオーバーの分布インデックス、シミュレートされたバイナリクロスオーバーのクロスオーバー率、ビット反転変異の変異率、ビット反転変異の分布インデックス、またはそれらの任意の組み合わせが含まれる。

【0039】

いくつかの実施形態では、１つ以上のプログラムを格納する非一時的コンピュータ可読記憶媒体が提供され、１つ以上のプログラムは、電子デバイスの１つ以上のプロセッサによって実行されたときに、電子デバイスに本明細書に記載の方法のうちのいずれかを実行させる命令を含む。

【0040】

いくつかの実施形態では、宿主においてタンパク質を発現させるために核酸配列を最適化するためのシステムが提供され、このシステムは、１つ以上のプロセッサ、メモリ、及び１つ以上のプログラムを備え、１つ以上のプログラムは、メモリに格納され、１つ以上のプロセッサによって実行されるように構成され、また１つ以上のプログラムは、本明細書に記載の方法のいずれかを実行するための命令を含む。

【0041】

いくつかの実施形態では、宿主においてタンパク質を発現させるために核酸配列を最適化するための電子デバイスが提供され、デバイスは、本明細書に記載の方法のいずれかを実行するための手段を含む。

【0042】

いくつかの実施形態では、宿主においてタンパク質を発現させるために核酸配列を最適化するための記録可能媒体に格納されたプログラム製品が提供され、プログラム製品は、本明細書に記載の方法のいずれかを実行するためのコンピュータソフトウェアを備える。

【0043】

いくつかの実施形態では、本明細書に記載の方法のいずれかから得られた最適化された核酸配列を含む単離された核酸分子が提供される。

【0044】

いくつかの実施形態では、上記の単離された核酸分子を含むベクターが提供される。

【0045】

いくつかの実施形態では、上記の単離された核酸分子または上記のベクターを含む組換え宿主細胞が提供される。

【0046】

いくつかの実施形態では、宿主細胞においてタンパク質を発現させるための方法が提供され、この方法は、（ａ）本明細書に記載の方法のいずれかを使用して、宿主細胞においてタンパク質を発現させるための最適化された核酸配列を得ることと、（ｂ）最適化された核酸配列を含む核酸分子を合成することと、（ｃ）核酸分子を宿主細胞に導入して組換え宿主細胞を得ることと、（ｄ）最適化された核酸配列からのタンパク質の発現を可能にする条件下で組換え宿主細胞を培養することを含む。
本発明は、以下の項目を提供する。
（項目１）
宿主におけるタンパク質の発現のための、核酸配列を最適化するためのコンピュータ実施方法であって、前記方法は、
ａ）初期集団セットを受け取ることであって、前記初期集団セットが、前記タンパク質を発現することができる複数の初期候補核酸配列を含む、前記受け取ることと、
ｂ）前記初期集団セットに基づいて、コンピュータ支援ＮＳＧＡ－ＩＩＩアルゴリズムまたはその変形を使用して、調和インデックス、コドン文脈インデックス、及び外れ値インデックスの最適化を実行し、それによって前記タンパク質を発現することができる複数の最適化された核酸配列を得ることを含み、
候補核酸配列の前記調和インデックスは、複数の高発現遺伝子と前記候補核酸配列との間の同義コドンの使用頻度分布の一貫性を示し、
前記候補核酸配列の前記コドン文脈インデックスは、同義コドンを好適な場所に配置するための尺度であり、
前記候補核酸配列の前記外れ値インデックスは、前記候補核酸配列に対する複数の所定の配列特徴の負の効果の尺度である、
前記方法。
（項目２）
前記複数の最適化された核酸配列のうちの少なくとも１つの最適化された核酸配列を示す出力を提供することをさらに含む、項目１に記載の方法。
（項目３）
初期集団セットを受け取ることは、
タンパク質配列を受け取ることと、
前記受け取ったタンパク質配列に基づいて、前記初期集団セットを生成することを含む、項目１または２に記載の方法。
（項目４）
初期集団セットを受け取ることは、
核酸配列を受け取ることと、
前記受け取った核酸配列をタンパク質配列に翻訳することと、
前記タンパク質配列に基づいて、前記初期集団セットを生成することを含む、
項目１または２に記載の方法。
（項目５）
前記初期集団セットが所定のサイズである、項目１～４のいずれか１項に記載の方法。
（項目６）
前記初期集団セットが、前記複数の初期候補核酸配列のバイナリ表現を含む、項目１～５のいずれか１項に記載の方法。
（項目７）
調和インデックス、コドン文脈インデックス、及び外れ値インデックスの最適化を実行することは、
前記調和インデックスを最大化することと、
前記コドン文脈インデックスを最大化することと、
前記外れ値インデックスを最小化することを含む、
項目１～６のいずれか１項に記載の方法。
（項目８）
調和インデックス、コドン文脈インデックス、及び外れ値インデックスの最適化を実行することは、
前記初期集団セットの各初期候補核酸配列について、それぞれの初期候補核酸配列のそれぞれの調和インデックス値、それぞれのコドン文脈インデックス値、及びそれぞれの外れ値インデックス値を計算することと、
前記計算に基づいて、前記複数の初期候補核酸配列に対応する複数の適合値を割り当てることと、
前記複数の適合値に基づいて、前記複数の初期候補核酸配列を分類することと、
後続の集団セット内に前記分類された複数の初期候補核酸配列のサブセットを含むことを含む、
項目１～７のいずれか１項に記載の方法。
（項目９）
前記初期集団に基づいて子孫集団を生成することと、
前記後続の集団セットに前記子孫の集団を含むことと、をさらに含む、
項目８に記載の方法。
（項目１０）
前記子孫集団が、バイナリトーナメント選択、クロスオーバー／組換え、変異、またはそれらの任意の組み合わせを介して生成される、項目９に記載の方法。
（項目１１）
前記初期集団セット及び前記後続の集団セットが同じサイズである、項目８～１０のいずれか１項に記載の方法。
（項目１２）
調和インデックス、コドン文脈インデックス、及び外れ値のインデックスの最適化を実行することは、複数の反復を含み、
前記複数の反復のｉ番目の反復は、
（ｉ－１）番目の反復に対応する核酸配列の集団セットを受け取ることと、
前記（ｉ－１）番目の反復に対応する前記集団セットの各核酸配列を非優勢レベルに関連付けることと、
前記関連付けた非優勢レベルに基づいて、前記（ｉ－１）番目の反復に対応する前記集団セット内の前記核酸配列を分類することと、
前記ｉ番目の反復に対応する集団セットを生成することであって、前記ｉ番目の反復に対応する前記集団セットには、前記（ｉ－１）番目の反復に対応する前記分類された核酸配列のサブセット及び前記（ｉ－１）番目の反復に対応する前記分類された核酸配列に基づいて生成された子孫集団が含まれる、前記生成することと、
１つ以上の終了条件に基づいて、前記ｉ番目の反復に対応する前記集団セットを使用して、（ｉ＋１）番目の反復に進むか否かを決定することを含む、
項目１～１１のいずれか１項に記載の方法。
（項目１３）
各核酸配列を非優勢レベルと関連付けることは、前記（ｉ－１）番目の反復に対応する前記集団セットの各核酸配列について、それぞれの調和インデックス値、それぞれのコドン文脈インデックス値、及びそれぞれの外れ値インデックス値を計算することを含む、項目１２に記載の方法。
（項目１４）
前記ｉ番目の反復に対応する集団セットを生成することは、
前記（ｉ－１）番目の反復に対応する前記分類された核酸配列の少なくとも１つの核酸配列を、複数の所定の参照点のうちの１つに関連付けることを含む、
項目１０または１１に記載の方法。
（項目１５）
前記１つ以上の終了条件は、一定の反復数に到達することと、最良の適合性がプラトーに到達し、これ以上良好な結果が生成されないことと、ほぼ最適な解決策の最小基準がいくつかの解決策によって満たされることと、またはそれらの任意の組み合わせを含む、項目１０～１２のいずれか１項に記載の方法。
（項目１６）
候補核酸配列の前記調和インデックスが、以下の式：

【数16】

に基づいて計算され、
式中、Ｄ（）は距離関数を示し、
Ｆ _ｈｓが、複数の高発現遺伝子内の複数のアミノ酸の同義コドンの頻度を含むベクトルを含み、
Ｆ _ｔｓが、前記候補核酸配列のコーディング遺伝子内の前記複数のアミノ酸の同義コドンの頻度を含むベクトルを含む、
項目１～１５のいずれか１項に記載の方法。
（項目１７）
Ｄ（）が２つのベクトル間の距離を測定する関数を示す、項目１６に記載の方法。
（項目１８）
Ｄ（）は、限定されないが、２つのベクトルのユークリッド距離、コサイン距離、マンハッタン距離、またはミンコフスキー距離などの距離関数である、項目１７に記載の方法。
（項目１９）
前記複数の高発現遺伝子または候補核酸配列の同義コドンの頻度が以下のように定義される、項目１８に記載の方法。

【数17】

（項目２０）
候補核酸配列の前記コドン文脈インデックスが、以下の式：

【数18】

に基づいて計算され、
式中、Ｄ（）は距離関数を示し、
Ｆ _ｈｃｃは、複数の高発現遺伝子内の２つの連続的なアミノ酸の同義コドンペアの頻度を含むベクトルを含み、
Ｆ _ｔｃｃは、前記候補核酸配列のコーディング遺伝子内の２つの連続アミノ酸の同義コドンペアの頻度を含むベクトルを含む、
項目１～１９のいずれか１項に記載の方法。
（項目２１）
Ｄ（）が２つのベクトル間の距離を測定する関数を示す、項目２０に記載の方法。
（項目２２）
Ｄ（）は、限定されないが、２つのベクトルのユークリッド距離、コサイン距離、マンハッタン距離、またはミンコフスキー距離などの距離関数である、項目２１に記載の方法。
（項目２３）
前記複数の高発現遺伝子または候補核酸配列の同義コドンペアの頻度が、以下のように定義される、項目２０～２２のいずれかに記載の方法。

【数19】

（項目２４）
前記外れ値インデックスが、以下の式：

【数20】

に基づいて計算され、
Ｎが、前記複数の所定の配列特徴の数であり、
ｆ _ｉ（ｘ）は、前記複数の所定の配列特徴のｉ番目の配列特徴のペナルティスコアリング関数の特徴を表し；
ｗ _ｉは、ｆ _ｉ（ｘ）に関連付けられる相対的な重み付けを示す、項目１～２３のいずれか１項に記載の方法。
（項目２５）
前記複数の所定の特徴が、
ＧＣ含有値、
ＣＩＳエレメント、
反復エレメント、
ＲＮＡスプライシング部位、
リボソーム結合配列、
ｍＲＮＡの最小自由エネルギー、または
それらの任意の組み合わせを含む、
項目２４に記載の方法。
（項目２６）
前記複数の所定の特徴が、選択された発現系に基づいて同定される、項目２４に記載の方法。
（項目２７）
前記ＮＳＧＡ－ＩＩＩアルゴリズムの変形が、ＥｌｉｔｅＮＳＧＡ－ＩＩＩアルゴリズムまたはＮＳＧＡ－ＩＩベースの免疫アルゴリズムを含む、先行項目のいずれか１～２６項に記載の方法。
（項目２８）
調和インデックス、コドン文脈インデックス、及び外れ値インデックスの最適化を実行することは、
調和インデックスの降順、次にコドン文脈インデックスの降順、次に外れ値インデックスの昇順によって、前記複数の最適化された核酸配列をランク付けすることと、
合成のために１つ以上のトップランクの最適化された核酸配列を選択することを含む、項目１～２７のいずれか１項に記載の方法。
（項目２９）
ｃ）前記複数の最適化された核酸配列のうちの最適化された核酸配列から所定の有害な部分配列またはモチーフを除去すること、
をさらに含む、項目１～２８のいずれか１項に記載の方法。
（項目３０）
複数のテキスト部分の分析に基づいて、前記所定の有害な部分配列またはモチーフを同定する、項目２９に記載の方法。
（項目３１）
前記所定の有害な部分配列またはモチーフを除去することは、
前記最適化された核酸配列における前記所定の有害な部分配列またはモチーフを同定することと、
同定された所定の有害な部分配列またはモチーフに基づいて複数の同義コドンを同定することと、
前記最適化された核酸配列において前記同定された所定の有害な部分配列で置換するために、前記複数の同義コドンから同義コドンを選択すること、
を含む、項目２９に記載の方法。
（項目３２）
前記調和インデックス、前記コドン文脈インデックス、及び前記外れ値インデックスのうちの少なくとも１つが、１つ以上のデータベースからの複数の高発現遺伝子の１つ以上の特徴に基づいて計算される、項目１～３１のいずれか１項に記載の方法。
（項目３３）
前記１つ以上の特徴が、コドン頻度、同義コドンの頻度、コドンペア頻度、またはそれらの組み合わせを含む、項目３２に記載の方法。
（項目３４）
１つ以上のパラメータを設定することをさらに含み、前記１つ以上のパラメータは、集団セットのサイズ、分割数、シミュレートされたバイナリクロスオーバーの分布インデックス、シミュレートされたバイナリクロスオーバーのクロスオーバー率、ビット反転変異の変異率、ビット反転変異の分布インデックス、またはそれらの任意の組み合わせを含む、項目１～３３のいずれか１項に記載の方法。
（項目３５）
１つ以上のプログラムを格納する非一時的コンピュータ可読記憶媒体であって、前記１つ以上のプログラムが、電子デバイスの１つ以上のプロセッサによって実行されたときに、前記電子デバイスに項目１～３４のいずれか１項に記載の方法を実行させる命令を含む、前記媒体。
（項目３６）
宿主においてタンパク質を発現させるために核酸配列を最適化するためのシステムであって、前記システムが、
１つ以上のプロセッサと、
メモリと、
１つ以上のプログラムと、を備え、前記１つ以上のプログラムが前記メモリに格納され、前記１つ以上のプロセッサによって実行されるように構成され、前記１つ以上のプログラムが、項目１～３４のいずれか１項に記載の方法を実行するための命令を含む、前記システム。
（項目３７）
宿主においてタンパク質を発現させるために核酸配列を最適化するための電子デバイスであって、項目１～３４のいずれか１項に記載の方法を実行するための手段を含む、前記デバイス。
（項目３８）
宿主においてタンパク質を発現させるために核酸配列を最適化するための記録可能媒体に格納されたプログラム製品であって、項目１～３４のいずれか１項に記載の方法を実行するためのコンピュータソフトウェアを含むプログラム製品。
（項目３９）
項目１～３４のいずれか１項に記載の方法から得られる前記最適化された核酸配列を含む単離された核酸分子。
（項目４０）
項目３９に記載の前記単離された核酸を含む、ベクター。
（項目４１）
項目３９に記載の単離された核酸分子または項目４０に記載のベクターを含む組換え宿主細胞。
（項目４２）
宿主細胞においてタンパク質を発現させるための方法であって、
（ａ）項目１～３４のいずれか１項に記載の方法を使用して、前記宿主細胞において前記タンパク質を発現させるために最適化された核酸配列を得ることと、
（ｂ）前記最適化された核酸配列を含む核酸分子を合成することと、
（ｃ）前記核酸分子を前記宿主細胞に導入して、組換え宿主細胞を得ることと、
（ｄ）前記最適化された核酸配列からの前記タンパク質の発現を可能にする条件下で前記組換え宿主細胞を培養すること、
を含む、前記方法。

【図面の簡単な説明】

【0047】

【図1】いくつかの実施形態によるコドン最適化するための例示的なプロセスを示すブロック図である。

【図2A】いくつかの実施形態による、宿主においてタンパク質を発現させるための配列（例えば、核酸配列）を最適化するためのアルゴリズムを構築し、実行するための例示的なパイプラインを示す図である。

【図2B】いくつかの実施形態による、遺伝的アルゴリズムの例示的な一般的なワークフローを示す図である。

【図3】いくつかの実施形態による、それらの野生型と比較した最適化されたＧＦＰ及びＪＮＫ３Ａ１のウエスタンブロット結果を示す図である。

【図4】いくつかの実施形態による、例示的な電子デバイスを示す図である。

【発明を実施するための形態】

【0048】

本発明は、限定されないが、Ｅ．ｃｏｌｉ、ＣＨＯ、ＨＥＫ２９３、酵母、昆虫、無細胞発現系など様々な宿主における遺伝子の組換え発現を改善するための増強されたコドン最適化を提供する。本発明によるシステムでは、ある発現系の高発現遺伝子を収集し、基本的な配列特徴を抽出し、目的の配列（例えば、核酸配列）における有益な包括的パターンを複製し、有害な特徴を除去することで、その発現系において標的遺伝子の発現を改善するようにする。

【0049】

現在、複数のコドン最適化ツールが開発されており、以下の表１にまとめる。細菌、酵母、昆虫及び哺乳類細胞のコドン最適化中の発現を高めるために、コドン使用頻度（例えば、コドン適応インデックス［ＣＡＩ］、有効コドン数［ＥＮｃ］、相対的同義コドン使用頻度［ＲＳＣＵ］及び同義コドン使用順序［ＳＣＵＯ］）、コドンペア、ｔＲＮＡ使用頻度（例えば、ｔＲＮＡ適応インデックス［ｔＡＩ］）、ＧＣ含有率、リボソーム結合部位（ＲＢＳ）、隠れた終始コドン、モチーフ回避、制限部位の除去、遺伝子のｍＲＮＡ二次構造（例えば、ｍＲＮＡ自由エネルギー）及びハイドロパシーインデックスの最適化を含む複数の（好ましくはほとんどまたはすべての）パラメータ及び因子が、これらのツールでは考慮されている。

【表1】

【0050】

しかし、重要なポイントには非常に多くの因子が考慮され得ることから、これらの因子のバランスをどのように取るかについては、依然として課題である。これは、複数の目的の最適化問題ではあるが、それらの目的が互いに矛盾する可能性があるためである。その一方で、１つ以上の因子またはパラメータを考慮しない場合には、発現系における標的遺伝子の発現が少なくなるか、または全く発現しなくなり得る。

【0051】

【0052】

したがって、本発明は、体系的な方法を提供し、この方法によって、好ましくは、限定されないが、コドン調和、コドン使用頻度（例えば、同義のコドン分布）、コドン文脈インデックス、シス作用性ｍＲＮＡ不安定化モチーフ、ＲＮａｓｅスプライシング部位、ＧＣ含有率、リボソーム結合部位（ＲＢＳ）、遺伝子のｍＲＮＡ二次構造（例えば、ｍＲＮＡ自由エネルギー）、及び反復エレメントを含む、タンパク質発現に影響を与えるパラメータ及び因子のすべてまたはほとんどを考慮し、哺乳動物、昆虫、酵母、細菌、藻類などの真核細胞及び原核細胞の両方などの発現宿主細胞、ならびに無細胞発現系などの、発現系における遺伝子のタンパク質発現を高めるために、核酸を改善し、最適化する。

【0053】

したがって、一態様における本発明は、ＮＳＧＡ－ＩＩＩアルゴリズムまたはその変形を使用して、複数の（例えば、２つ以上の）目的を最適化して、改善された組換えタンパク質を発現させるために配列を最適化するための方法を提供する。別の態様では、遺伝子合成及びタンパク質発現の前に（例えば、ＮＳＧＡ－ＩＩＩアルゴリズムの反復が完了した後）、核酸配列から有害なモチーフ及び特徴を除去するための方法が提供される。また、最適化アルゴリズムにおいて複数の目的を定量化し、計算するための方法、ならびに有害なモチーフ及び特徴を減少させるかまたは除去するために同定するための方法も提供される。

【0054】

本明細書に記載の方法の任意の１つ以上のステップを実行するための１つ以上のプログラムを格納するためのシステム、非一時的コンピュータ可読記憶媒体、電子デバイス、及びプログラム製品も提供される。本明細書に記載の方法から得られた最適化核酸配列を含む単離された核酸分子、前記単離された核酸分子を含むベクター、前記単離された核酸分子または前記ベクターを含む組換え宿主細胞も提供される。本明細書に記載の方法のいずれかを伴う、宿主細胞においてタンパク質を発現させるための方法も提供される。

【0055】

本明細書に記載されている本発明の実施形態は、実施形態「からなる」及び／または実施形態「から本質的になる」ものを含むことを理解されたい。

【0056】

本明細書において「約」ある値または「約」パラメータへの言及は、その値またはパラメータ自体を対象とする変動を含む（かつ記述する）。例えば、「約Ｘ」としている記載には、「Ｘ」の記載が含まれる。

【0057】

本明細書で使用する場合、ある値またはパラメータ「ではない」と言及している場合には概して、その値またはパラメータ「以外の」値またはパラメータを意味し、説明する。例えば、Ｘという種類のがんを治療するのに、その方法を使用しないとは、その方法を用いて、Ｘ以外の種類のがんを治療することを意味する。

【0058】

本明細書及び添付の特許請求の範囲で使用されるとき、単数形「ａ（１つの）」、「ｏｒ（または）」、及び「ｔｈｅ（その）」は、文脈が別途明確に指示しない限り、複数の指示対象を含む。

【0059】

本明細書及び添付の特許請求の範囲で使用される場合、「セット」は、文脈が明らかに他のことを指示しない限り、１つまたは複数の指示対象を指す。

【0060】

コドン最適化方法

【0061】

一態様における本発明は、宿主においてタンパク質を発現させるために核酸配列を最適化するための方法（例えば、コンピュータ実施方法またはコンピュータ支援方法）を提供する。これらの方法に関連するのは、遺伝子合成及びタンパク質発現の前に（例えば、ＮＳＧＡ－ＩＩＩアルゴリズムの反復が完了した後）、核酸配列から有害なモチーフ及び特徴を除去するための方法である。また、これらの方法に関連するのは、最適化アルゴリズムにおける複数の目的を定量化、計算するための方法、ならびに減少させるかまたは削除する有害なモチーフ及び特徴を特定するための方法である。

【0062】

図１は、コドン最適化のための例示的なプロセス１００を示しており、点線ブロックは任意のステップを示す。プロセス１００の一部は、特定のデバイスによって実施されるものとして本明細書に記載されているが、プロセス１００は、そのように限定されないことは理解されよう。他の実施例では、プロセス１００は、単一の電子デバイス（例えば、電子デバイス４００）のみまたは複数の電子デバイスを使用して実施される。プロセス１００では、いくつかのブロックが任意により組み合わされ、いくつかのブロックの順序が任意により変更され、いくつかのブロックが任意により省略される。いくつかの実施例では、プロセス１００と組み合わせて追加のステップを実行することができる。

【0063】

ブロック１０６において、電子デバイスは、初期集団セットを受け取り、そこで初期集団セットは、タンパク質を発現することができる複数の初期候補核酸配列を含む。いくつかの実施形態では、初期集団セットはランダムに生成される。いくつかの実施形態では、初期集団セットは、所定のサイズ（例えば、ユーザによって決定される）のものである。

【0064】

いくつかの実施形態では、ブロック１０６に示すとおり、初期集団セットを受け取ることは、タンパク質配列に基づいて初期集団セットを生成することを含む。例えば、初期集団セットを受け取ることは、タンパク質配列を受け取ることと（例えば、ユーザーからの入力として）、受け取ったタンパク質配列に基づいて初期集団セットを生成することを含むことができる。別の実施例として、初期集団セットを受け取ることは、核酸配列を受け取ることと（例えば、ユーザーからの入力として）、受け取った核酸配列をタンパク質配列に翻訳することと、そのタンパク質配列に基づいて初期集団セットを生成することを含むことができる。

【0065】

いくつかの実施形態では、初期集団セットは、複数の初期候補核酸配列のバイナリ表現（例えば、バイナリ文字列）を含む。一般に、コーディング遺伝子を示すためのデータ構造として、コドンリスト／アレイ／ベクトルではなく、バイナリ文字列が選択され、選択前の遺伝子の適合性評価を除いて、集団の初期化、クロスオーバー／再結合、変異、選択などの遺伝的アルゴリズムの操作オブジェクトはすべて、バイナリ文字列である。以下でさらに説明するように、いくつかの実施形態では、選択前に集団全体の各個体について適合性関数（すなわち、３つのインデックス関数）を評価する必要がある場合、バイナリ表現を一時的にコドン文字列に戻す必要がある。

【0066】

ブロック１０８においては、電子デバイスは、初期集団セットに基づいて、コンピュータ支援ＮＳＧＡ－ＩＩＩアルゴリズムまたはその変形を使用して、調和インデックス、コドン文脈インデックス、及び外れ値インデックスの最適化を実行し、それによってタンパク質を発現させることができる複数の最適化された核酸配列を得る。

【0067】

常に、またはいくつかの実施形態では、候補核酸配列の調和インデックスは、複数の高発現遺伝子と候補核酸配列（すなわち、最適化中の候補タンパク質をコードする遺伝子）との間の同義コドンの使用頻度分布の一貫性を示し、これらは、特定のアミノ酸の同義コドンの数を割り当てる方法を解決するのに有用である。候補核酸配列のコドン文脈インデックスは、同義コドンを好適な場所に配置するための尺度である。候補核酸配列の外れ値インデックスは、候補核酸配列に対する複数の所定の配列特徴の負の効果の尺度である。

【0068】

いくつかの実施形態では、ブロック１０６に示すとおり、調和インデックス、コドン文脈インデックス、及び外れ値インデックスの最適化を実行することは、調和インデックスを最大化することと、コドン文脈インデックスを最大化することと、外れ値インデックスを最小化することを含む。

【0069】

最適化は、多目的遺伝的アルゴリズムを使用して実行できる。これらの３つの目的は、調和インデックスを最大化すること、コドン文脈インデックスを最大化すること、及び外れ値インデックスを最小化することである。いくつかの実施形態では、ＮＳＧＡ－ＩＩＩアルゴリズムまたは変形が使用される。従来の遺伝的アルゴリズムとは異なり、ＮＳＧＡ－ＩＩＩの集団メンバー間での多様性の維持が、十分に広がっている複数の事前定義された参照点を提供して、適応的に更新することによって支援され、したがって、ＮＳＧＡ－ＩＩＩでは、その選択演算子が大幅に変更される。さらに、ＮＳＧＡ－ＩＩＩは、ＮＳＧＡ－ＩＩなどの他の遺伝的アルゴリズムと比較して、３目的から１５目的の最適化問題を解決する効果を呈する。ＮＳＧＡ－ＩＩＩアルゴリズムの変形としては、ＥｌｉｔｅＮＳＧＡ－ＩＩＩアルゴリズム、ＮＳＧＡ－ＩＩベースの免疫アルゴリズム、ＭＡＭ－ＭＯＩＡまたはＭＯＬＡが挙げられる。ＥｌｉｔｅＮＳＧＡ－ＩＩＩアルゴリズムは、２０１６年に発行されたＡｍｉｎＩｂｒａｈｉｍｅｔａｌ．による表題「ＥｌｉｔｅＮＳＧＡ－ＩＩＩ：ＡｎＩｍｐｒｏｖｅｄＥｖｏｌｕｔｉｏｎａｒｙＭａｎｙ－ＯｂｊｅｃｔｉｖｅＯｐｔｉｍｉｚａｔｉｏｎＡｌｇｏｒｉｔｈｍ」の刊行物（その全体が参照により本明細書に組み込まれる）に記載されている。様々な免疫アルゴリズムが、例えば、２０１０年９月に発行のＧｕａｎ－ＣｈｕｎＬｕｈｅｔａｌ．による表題「ＭＯＩＡ：Ｍｕｌｔｉ－ｏｂｊｅｃｔｉｖｅＩｍｍｕｎｅＡｌｇｏｒｉｔｈｍ」の刊行物、２００７年に発行のＦｅｌｉｐｅＣａｍｐｅｌｏｅｔａｌ．による表題「ＯｖｅｒｖｉｅｗｏｆＡｒｔｉｆｉｃｉａｌＩｍｍｕｎｅＳｙｓｔｅｍｓｆｏｒＭｕｌｔｉ－ｏｂｊｅｃｔｉｖｅＯｐｔｉｍｉｚａｔｉｏｎ」の刊行物、２０１０年４月に発行のＺｈｉ－ＨｕａＨｕによる「Ａｍｕｌｔｉｏｂｊｅｃｔｉｖｅｉｍｍｕｎｅａｌｇｏｒｉｔｈｍｂａｓｅｄｏｎａｍｕｌｔｉｐｌｅ－ａｆｆｉｎｉｔｙｍｏｄｅｌ」、及び２０１７年７月２５日に出願の中国特許出願第２０１７１０６１１７５２．５号に記載されており、これらは参照によりその全体が本明細書に組み込まれる。

【0070】

ＮＳＧＡ－ＩＩＩアルゴリズム（または同様の遺伝的アルゴリズム）の動作に従って、調和インデックス、コドン文脈インデックス、及び外れ値インデックスの最適化を実行することは、初期集団セットの各初期候補塩基配列について、それぞれの初期候補核酸配列のそれぞれの調和インデックス値、それぞれのコドン文脈インデックス値、及びそれぞれの外れ値インデックス値を計算することと、その計算に基づいて、複数の初期候補核酸配列に対応する複数の適合性値を割り当てることと、それらの複数の適合性値に基づいて、複数の初期候補核酸配列を分類することと、後続の集団セット内に分類された複数の初期候補核酸配列のサブセットを含むことと（すなわち、２番目の反復で使用されるように）を含む。

【0071】

ＮＳＧＡ－ＩＩＩアルゴリズム（または同様の遺伝的アルゴリズム）の動作に従って、この方法は、初期集団に基づいて子孫集団を生成することと、子孫集団を後続の集団セットに含めること（すなわち、２番目の反復で使用されるように）と、をさらに含む。いくつかの実施形態では、子孫集団は、バイナリトーナメント選択、クロスオーバー／組換え、変異、またはそれらの任意の組み合わせを介して生成される。

【0072】

いくつかの実施形態では、初期集団セットと後続の集団セット（すなわち、２番目の反復で使用されるように）と同じ大きさである。

【0073】

ＮＳＧＡ－ＩＩＩアルゴリズム（または同様の遺伝的アルゴリズム）の動作に従って、調和インデックス、コドン文脈インデックス、及び外れ値インデックスの最適化を実行することは、複数の反復を含む。複数の反復のｉ番目の反復（ここで、ｉは２、３、４、５、６．．．ｎであり得る）は、（ｉ－１）番目の反復に対応する核酸配列の集団セットを受け取ることと、（ｉ－１）番目の反復に対応する集団セットの各核酸配列を非優勢レベルに関連付けることと、関連付けた非優勢レベルに基づいて、（ｉ－１）番目の反復に対応する集団セット内の核酸配列を分類することと、ｉ番目の反復に対応する集団セットを生成することであって、ｉ番目の反復に対応する集団セットは、（ｉ－１）番目の反復に対応する分類された核酸配列のサブセット及び（ｉ－１）番目の反復に対応する分類された核酸配列に基づいて生成された子孫集団を含む、生成することと、１つ以上の終了条件に基づいて、ｉ番目の反復に対応する集団セットを使用して、（ｉ＋１）番目の反復に進むか否かを決定することを含む。

【0074】

【0075】

ＮＳＧＡ－ＩＩＩアルゴリズムの動作に従って、いくつかの実施形態では、ｉ番目の反復に対応する集団セットを生成することは、（ｉ－１）番目の反復に対応する分類された核酸配列の少なくとも１つの核酸配列を複数の所定の参照点のうちの１つに関連付けることを含む。

【0076】

【0077】

いくつかの実施形態では、この方法は、最適化アルゴリズムのための１つ以上のパラメータを設定することをさらに含み、１つ以上のパラメータには、集団セットのサイズ、分割数、シミュレートされたバイナリクロスオーバーの分布インデックス、シミュレートされたバイナリクロスオーバーのクロスオーバー率、ビット反転変異の変異率、ビット反転変異の分布インデックス、またはそれらの任意の組み合わせが含まれる。

【0078】

いくつかの実施形態では、最適化中に、調和インデックス、コドン文脈インデックス、及び外れ値インデックスのうちの少なくとも１つが、１つ以上のデータベースからの複数の高発現遺伝子の１つ以上の特徴に基づいて計算される。いくつかの実施形態では、１つ以上の特徴には、コドン頻度、同義コドンの頻度、コドンペア頻度、またはそれらの組み合わせが含まれる。高発現遺伝子のこれらの特徴を使用して、以下の式に示すとおり、特定の候補核酸配列の調和インデックス、コドン文脈インデックス、及び外れ値インデックスを計算できる。

【0079】

いくつかの実施形態では、ブロック１０２に示すとおり、高発現遺伝子のこれらの特徴は、プライベートまたはパブリックデータベースに基づいて同定される。例えば、データベース（複数可）は、ある企業の順序システムから収集された、以前に成功裏に最適化された順序を含む独自のデータベースであってもよい。別の実施例として、データは、公開情報であり得る様々な培養条件下でのＲＮＡ－ｓｅｑデータのデータマイニングによって得ることができる。データ処理は、コドン頻度、同義コドンの頻度、及びコドンペア頻度など、高発現遺伝子の基本情報を得ることを目的として実行される。

【0080】

いくつかの実施形態では、候補核酸配列の調和インデックスは、以下の式：

【数6】

に基づいて計算され、
式中、Ｄ（）は距離関数を示し、Ｆ_ｈｓは、複数の高発現遺伝子内の複数のアミノ酸の同義コドンの頻度を含むベクトルを含み、Ｆ_ｔｓは、候補核酸配列のコード遺伝子内の複数のアミノ酸の同義コドンの頻度を含むベクトルを含む。

【0081】

【0082】

いくつかの実施形態では、複数の高発現遺伝子または候補核酸配列の同義コドンの頻度は、以下のとおり定義される。

【数7】

【0083】

いくつかの実施形態では、候補核酸配列のコドン文脈インデックスは、以下の式：

【数8】

【0084】

【0085】

いくつかの実施形態では、複数の高発現遺伝子または候補核酸配列の同義コドンペアの頻度は、以下のように定義される。

【数9】

【0086】

いくつかの実施形態では、外れ値インデックスは、以下の式：

【数10】

【0087】

【0088】

いくつかの実施形態では、複数の所定の特徴は、選択された発現系に基づいて同定される。様々な発現系では、有害因子のカタログが変更される可能性があり、その影響または重み付けも等しくない。

【0089】

【0090】

ブロック１１０では、この方法は、任意にｃ）複数の最適化された核酸配列のうちの最適化された核酸配列から、所定の有害な部分配列またはモチーフを除去することをさらに含む。いくつかの実施形態では、所定の有害な部分配列またはモチーフを除去することは、最適化された核酸配列において所定の有害な部分配列またはモチーフを同定することと、同定された所定の有害な部分配列またはモチーフに基づいて複数の同義コドンを同定することと、最適化された核酸配列において同定された所定の有害な部分配列を置換するために、複数の同義コドンから同義コドンを選択することを含む。

【0091】

いくつかの実施形態では、ブロック１０４に示すとおり、所定の有害な部分配列またはモチーフは、複数のテキスト部分の分析（例えば、自動テキストマイニングまたは文献の手作業によるチェック）に基づいて同定される。

【0092】

【0093】

【0094】

【0095】

【0096】

【0097】

いくつかの実施形態では、本明細書に記載の方法のいずれかから得られた最適化された核酸配列を含む単離された核酸分子が提供される。

【0098】

いくつかの実施形態では、上記の単離された核酸分子を含むベクターが提供される。

【0099】

いくつかの実施形態では、上記の単離された核酸分子または上記のベクターを含む組換え宿主細胞が提供される。

【0100】

【0101】

図２Ａは、いくつかの実施形態による、宿主においてタンパク質を発現させるための配列（例えば、核酸配列）を最適化するためのアルゴリズムを構築し、実行するための例示的なパイプライン２００を示す。プロセス２００は、例えば、図４に例解する１つ以上の電子デバイスを使用して実行される。いくつかの実施例では、プロセス２００は、クライアントサーバーシステムを使用して実行され、プロセス２００のブロックは、サーバーとクライアントデバイスとの間で任意の方法で分割される。他の実施例では、プロセス２００のブロックは、サーバー及び／または複数のクライアントデバイスとの間で分割される。したがって、プロセス２００の一部は、特定のデバイスによって実行されるものとして本明細書で説明されているが、プロセス２００は、そのように限定されないことが理解されよう。他の実施例では、プロセス２００は、単一の電子デバイス（例えば、電子デバイス４００）のみまたは複数の電子デバイスを使用して実行される。プロセス２００では、いくつかのブロックが任意により組み合わされ、いくつかのブロックの順序が任意により変更され、いくつかのブロックが任意により省略される。いくつかの実施例では、プロセス２００と組み合わせて追加のステップを実行することができる。

【0102】

データ収集及び文献レビュー
図２Ａを参照すると、ブロック２０２において、複数の高発現遺伝子は、１つ以上のデータベースから同定され得る。データベースは、パブリックまたはプライベートであり得る。例えば、データベース（複数可）は、ある企業の順序システムから収集された、以前に成功裏に最適化された順序を含む独自のデータベースであってもよい。別の例として、データは、公開情報であり得る様々な培養条件下でのＲＮＡ－ｓｅｑデータのデータマイニングによって得ることができる。

【0103】

ブロック２０４では、高発現遺伝子の基本的な特徴が同定される。例示的な実施では、ｍＲＮＡ－ｓｅｑ実験及びデータ分析は、標準サンプルに対してＩｌｌｕｍｉｎａ推奨のｍＲＮＡ－Ｓｅｑワークフローに従って実行する。過程中、ＴｒｕＳｅｑＳｔｒａｎｄｅｄｍＲＮＡＬｉｂｒａｒｙＰｒｅｐＫｉｔをライブラリー調製に使用でき、ＮｅｘｔＳｅｑのＰＥ３００をシーケンシングに使用できる。その後、コドン頻度、同義コドン頻度、及びコドンペア頻度などの高発現遺伝子の基本情報を得ることを目的として、ＴｏｐＨａｔ、Ｃｕｆｆｌｉｎｋｓ、及び自家製スクリプトによるデータ処理を適用することができる。

【0104】

ブロック２０６及び２０８において、例示的なシステムはまた、確立された利点を維持するために回避する報告され検証されたあらゆる有害な特徴を同定することができる。タンパク質発現の低下をもたらし得る負の因子を発見するために、このシステムでは、文献レビューを実施することができる。例えば、自動テキストマイニング及び／または手作業によるチェックにより、様々な宿主に対して、報告された発現関連の有害なモチーフ及びｍＲＮＡの特徴を特定することができる。

【0105】

最適化アルゴリズムの主な因子／適合性関数
コーディング遺伝子の発現には、複数のステップがあり、これは、転写レベル、ｍＲＮＡターンオーバー、翻訳（開始、プロモーターエスケープ、伸長、及び終了など）、及び翻訳後修飾に依存する。それにもかかわらず、コドン最適化は組み合わせ問題として単純化でき、（ｉ）最初にある特定のアミノ酸の同義コドンの数を割り当てる方法、（ｉｉ）同義コドンを最も好適な場所に配置する方法、及び（ｉｉｉ）有害であるが誤って生成された部分配列及び／またはモチーフを減少させる方法の３つの直感的な操作にグループ化できる。

【0106】

本発明のいくつかの実施形態によれば、以下に提供するのは、上記の３つの操作にそれぞれ一致し、タンパク質発現と高度に相関する３つの重要な因子、すなわち調和インデックス、コドン文脈インデックス、及び外れ値インデックスである。以下に説明するように、これら３つのインデックスは、様々なデータソースから収集された上記の基礎データに基づいて計算される。

【0107】

図２Ａを参照すると、ブロック２１０において、２つのステップ２１２及び２１４を含む最適化手順が実行される。ブロック２１２に示すステップ１において、システムは、ＮＳＧＡ－ＩＩＩアルゴリズムまたはその変形に基づいて多目的コドン最適化を実行し、これには、調和インデックスの最大化、コドン文脈インデックスの最大化、及び外れ値インデックスの最小化を伴う。

【0108】

１．調和インデックス
調和インデックスは、高発現遺伝子と候補核酸配列との間の同義コドンの使用頻度分布の一貫性を表す。候補核酸配列は、最適化アルゴリズムの少なくとも１回の反復において評価した候補タンパク質をコードする遺伝子を指し、これは、「多目的最適化アルゴリズム」の見出しにおいて詳細に説明する。いくつかの実施形態では、調和インデックスは次のとおり定義される。

【数11】

【0109】

上記の式で、Ｈは調和インデックスであり、Ｄ（）は、２つのベクトル間の距離関数であり、限定されないが、ユークリッド距離、コサイン距離、マンハッタン距離、またはミンコフスキー距離であり得る。Ｆ_ｈｓは、高発現遺伝子内の１８個のアミノ酸（Ｍｅｔ／Ｍ及びＴｒｐ／Ｗを除く）の同義コドンの頻度を含むベクトルであり、６４個のコドンから３つの終始コドン（すなわち、ＴＡＡ、ＴＡＧ、及びＴＧＡ）、アミノ酸Ｍｅｔ／Ｍのコドン（すなわち、ＡＴＧ）、及びアミノ酸Ｔｒｐ／Ｗのコドン（すなわち、ＴＧＧ）を除いた５９個のエレメントを有する。Ｆ_ｔｓは、コドン最適化を待機している候補タンパク質のコーディング遺伝子（すなわち、候補核酸配列）内の１８個のアミノ酸の同義コドンの頻度を含むベクトルである。

【0110】

コドン適応インデックス（ＣＡＩ）と比較して、調和インデックスは同義コドンの分布（すなわち、使用頻度のバランス／負荷のバランス）に集中するが、最も高頻度で発生する一意の上位１つの同義コドンを選択することによって、常にＣＡＩを最大化することを目的にするものではない。

【0111】

いくつかの実施形態では、調和インデックスの計算中に使用される高発現遺伝子または候補核酸配列のある特定の同義コドンの頻度は、以下のように定義される。

【数12】

【0112】

調和インデックスは、コドン使用頻度を考慮に入れているが、これは、同義コドンの頻度分布のみを考慮しており、１８個のアミノ酸のうちの１つの異なる遺伝子座での割り当てについては、依然として問題である（すなわち、同じアミノ酸の同義コドンの設定の順序付け）。したがって、同義コドンのほぼ最適なランク付けを選択するために、同義コドンのペアリングを通じてこのボトルネックを解決するには、以下に説明するコドン文脈インデックスが必要である。
２．コドン文脈インデックス

【0113】

候補核酸配列のコドン文脈インデックスは、同義コドンを好適な場所に配置するための尺度である。いくつかの実施形態では、コドン文脈インデックスは次のように定義される。

【数13】

【0114】

上記の式で、ＣＣは、コドン文脈インデックスを意味し、Ｄ（）は、２つのベクトル間の距離関数であり、限定されないが、ユークリッド距離、コサイン距離、マンハッタン距離、またはミンコフスキー距離であり得る。Ｆ_ｈｃｃは、高発現遺伝子内の２つの連続したアミノ酸のすべての種類の同義コドンペアの頻度で構成されたベクトルである。例えば、アミノ酸Ｐｈｅ／Ｆは、２つの同義のコドン、すなわちＴＴＴ及びＴＴＣを有する。アミノ酸Ｌｙｓ／Ｋは、コドンとしてＡＡＡ及びＡＡＧも有する。それらの同義のコドンペアは、ＴＴＴＡＡＡ、ＴＴＴＡＡＧ、ＴＴＣＡＡＡ、及びＴＴＣＡＡＧを含む２ｘ２の組み合わせであろう。２つのアミノ酸メチオニン／Ｍ及びトリプトファン／Ｗ（すなわち、ＭＭ、ＭＷ、ＷＷ、及びＷＭ）の順列には同義のコドンペアが存在しないため、ＣＣの長さは６１ｘ６１マイナス４であり、最終的に３７１７に等しくなる。Ｆ_ｔｃｃは、候補タンパク質のコード遺伝子（すなわち、候補核酸配列）内のすべての種類の２つの連続するアミノ酸の同義コドンペアの頻度で構成されたベクトルであり、その長さは同様に３７１７である。

【0115】

コドン文脈インデックスの計算中に使用される、高発現遺伝子または候補核酸配列の特定の同義コドンペアの頻度は、次のように定義される。

【数14】

【0116】

３．外れ値インデックス
外れ値インデックスは、タンパク質発現に対する同定された複数の配列特徴の悪影響を評価するために重み付け関数によって計算された尺度である。いくつかの実施形態では、外れ値インデックスは次のように定義される。

【数15】

【0117】

上記の式において、Ｎは、同定された複数の配列因子の数であり、Ｎ＞１である。ｆ_ｉ（ｘ）は、同定されたＮ個の配列特徴のｉ番目の配列因子のペナルティスコアリング関数を示し、ｗ_ｉは、ｆ_ｉ（ｘ）に付与される相対的な重み付けを示す。したがって、最適化された遺伝子は、可能な限り低い値の外れ値インデックスを有するであろう。

【0118】

いくつかの実施形態では、複数の配列因子は、図２Ａに示すステップ２０２、２０４、及び２０８のうちの１つ以上を介して同定され得る。いくつかの実施形態では、複数の配列因子は、限定されないが、ＧＣ含有率、ＣＩＳエレメント、反復エレメント、ＲＮＡスプライシング部位、リボソーム結合配列、ｍＲＮＡの最小自由エネルギーを含む（以下に詳細に記載する）。

【0119】

３（ａ）．ｍＲＮＡの最小自由エネルギー（ＭＦＥ）
開始コドンの下流に位置するｍＲＮＡの潜在的な強力なステムループ二次構造により、リボソーム複合体の動きが妨げられ、したがって翻訳を減速させ、翻訳効率を低下させ得る。ｍＲＮＡの安定した二次構造は、リボソーム複合体をｍＲＮＡから脱落させ、翻訳の早期終了を引き起こす可能性さえある。Ｍｆｏｌｄ、ＲＮＡｆｏｌｄ、ＲＮＡｓｔｒｕｃｔｕｒｅなど、自由エネルギーの計算及び二次構造予測のための方法が複数存在する。本発明の実施形態によれば、低い自由エネルギー（△Ｇ＜－１８Ｋｃａｌ／モル）または長い相補的幹（＞１０ｂｐ）を有するｍＲＮＡの局所二次構造は、効率的な翻訳には安定しすぎると定義される。遺伝子配列は、好ましくは、局所構造がそれほど安定しないように最適化される。ｍＲＮＡ構造の自由エネルギーの計算及び二次構造の予測には、ｍＲＮＡの５’－ＵＴＲ及び３’－ＵＴＲの両方を考慮することが好ましい。

【0120】

いくつかの実施形態では、安定しすぎると見なされる二次構造は、より高いペナルティに対応付けられる。より高いペナルティスコアを付与するために使用される重み付けは柔軟である。

【0121】

３（ｂ）．ＧＣ含有率
ｍＲＮＡのＧＣ含有率も考慮に入れることが好ましい。ＧＣ％の理想的な範囲は、約３０～７０％である。ＧＣ含有率が高い場合には、ｍＲＮＡが強力なステムループ二次構造を形成する。また、ＰＣＲ増幅及び遺伝子クローニングにも問題が生じることになる。標的配列の高いＧＣ含有率は、好ましくは、コドン縮重が約５０～６０％であることを使用して変異させる（例えば、ＮＳＧＡ－ＩＩＩアルゴリズムの動作中に、バイナリ文字列のクロスオーバー及び変異など）。

【0122】

ＧＣ％には、２つの異なる測定値がある。１つは、その配列全体で平均化された全体的ＧＣ％であり、もう１つは、より有用であり、固定サイズ（例えば、６０ｂｐ）のシフトされた「ウィンドウ」内で計算された局所ＧＣ％である。本発明の実施形態によれば、局所ＧＣ％は、約３５～６５％に最適化される。

【0123】

３（ｃ）．不安定因子（例えば、シス作用性ｍＲＮＡ不安定化モチーフ、ＲＮａｓｅスプライシング部位及び反復エレメントなど）
ｍＲＮＡ分解を減少させるかもしくは最小化するか、またはｍＲＮＡの安定性を増大させ、これによりｍＲＮＡのターンオーバー時間を短縮するためには、限定されないが、ＡＵリッチエレメント（ＡＲＥ）ならびにＲＮａｓｅ認識及び切断部位などのシス作用性ｍＲＮＡ不安定化モチーフを遺伝子配列から変異させるか、または欠失させることが好ましい。ＡＵＵＵＡ（配列番号１）のコアモチーフを有するＡＵリッチエレメント（ＡＲＥ）は、通常、ｍＲＮＡの３’非翻訳領域に見られる。ｍＲＮＡシスエレメントの別の例は、配列モチーフＴＧＹＹＧＡＴＧＹＹＹＹＹ（配列番号２）で構成され、Ｙは、ＴまたはＣのいずれかを表す。ＲＮａｓｅ認識配列には、限定されないが、ＲＮａｓｅＥ認識配列を含む。ＲＮａｓｅの欠損を有する宿主株も、タンパク質発現に使用され得る。

【0124】

ＲＮａｓｅスプライシング部位は、ＲＮＡスプライシングによって異なるｍＲＮＡを生成し、したがって元のｍＲＮＡレベルを低下させることができる。ＲＮａｓｅスプライシング部位もまた、ｍＲＮＡレベルを維持するために非機能的に変異させることが好ましい。

【0125】

高レベルのｍＲＮＡを生成するために、最適な転写プロモーター配列が遺伝子配列において使用されることが好ましい。Ｅ．ｃｏｌｉなどの原核生物宿主の場合、強力なプロモーターのうちの１つは、Ｔ７ＲＮＡポリメラーゼ（Ｔ７ＲＮＡＰ）のＴ７プロモーターである。長いまたは短いタンデム単純配列反復（ＳＳＲ）のうちのいくつかの塩基は、好ましくは、コドン縮重を使用して変異させて反復を破壊し、ポリメラーゼのずれを減少させ、したがって、時期尚早のタンパク質またはタンパク質の変異を減少させる。

【0126】

ｍＲＮＡの翻訳及び結果として生じるタンパク質の発現レベルに影響を与える追加の因子及びパラメータが存在する。これらの因子は、翻訳開始から翻訳終了までの翻訳に影響を与える。リボソームは、リボソーム結合部位（ＲＢＳ）においてｍＲＮＡと結合し、翻訳を開始する。リボソームは、二本鎖ＲＮＡに結合しないため、この領域の周囲の局所的なｍＲＮＡ構造は、一本鎖であり、いかなる安定した二次構造も形成しないことが望ましい。シャイン－ダルガノ配列とも呼ばれるＥ．ｃｏｌｉなどの原核細胞のコンセンサスＲＢＳ配列ＡＧＧＡＧＧ（配列番号３）は、好ましくは発現する遺伝子内の翻訳開始部位の数塩基直前に配置される。しかし、内部リボソーム侵入部位（ＩＲＥＳ）は、好ましくは、非特異的翻訳開始を回避するためにリボソーム結合を防ぐために変異される。

【0127】

上記の因子の説明は、例えば、２０１８年５月発行のＳａｅｉｄＫａｄｋｈｏｄａｅｉｅｔａｌ．，による表題「Ｃｉｓ／ＴｒａｎｓｇｅｎｅＯｐｔｉｍｉｚａｔｉｏｎ：ＳｙｓｔｅｍａｔｉｃＤｉｓｃｏｖｅｒｙｏｆＮｏｖｅｌＧｅｎｅＥｘｐｒｅｓｓｉｏｎＵｓｉｎｇｂｉｏｉｎｆｏｒｍａｔｉｃｓａｎｄｃｏｍｐｕｔａｔｉｏｎａｌｂｉｏｌｏｇｙａｐｐｒｏａｃｈｅｓ」の刊行物、２０１４年７月に発行のＴｉｍｏｔｈｙＪＧｉｎｇｅｒｉｃｈｅｔａｌ．，による表題「ＡＵ－ｒｉｃｈｅｌｅｍｅｎｔｓａｎｄｔｈｅｃｏｎｔｒｏｌｏｆｇｅｎｅｅｘｐｒｅｓｓｉｏｎｔｈｒｏｕｇｈｒｅｇｕｌａｔｅｄｍＲＮＡｓｔａｂｉｌｉｔｙ」の刊行物、２０１７年１０月に発行のＴａｌａＢａｋｈｅｅｔによる表題「ＡＲＥＤ－ＰＬＵＳ：ＡＮＵＰＤＡＴＥＤＡＮＤＥＸＰＡＮＤＥＤＤＡＴＡＢＡＳＥＯＦＡＵ－ＲＩＣＨＥＬＥＭＥＮＴ－ＣＯＮＴＡＩＮＩＮＧＭＲＮＡＳＡＮＤＰＲＥ－ＭＲＮＡＳ」の刊行物、１９９５年に発行のＳｈｕａｎｇＺｈａｎｇｅｔａｌ．，による表題「Ｉｄｅｎｔｉｆｉｃａｔｉｏｎａｎｄｃｈａｒａｃｔｅｒｉｚａｔｉｏｎｏｆａｓｅｑｕｅｎｃｅｍｏｔｉｆｉｎｖｏｌｖｅｄｉｎｎｏｎｓｅｎｓｅ－ｍｅｄｉａｔｅｄｍＲＮＡｄｅｃａｙ」の刊行物、２００２年に発行のＪｉｏｎｇＭａｅｔａｌ．，による表題「ＣＯＲＲＥＬＡＴＩＯＮＳＢＥＴＷＥＥＮＳＨＩＮＥ－ＤＡＬＧＡＲＮＯＳＥＱＵＥＮＣＥＳＡＮＤＧＥＮＥＦＥＡＴＵＲＥＳＳＵＣＨＡＳＰＲＥＤＩＣＴＥＤＥＸＰＲＥＳＳＩＯＮＬＥＶＥＬＳＡＮＤＯＰＥＲＯＮＳＴＲＵＣＴＵＲＥＳ」の刊行物に見い出され、これらは、参照によりその全体が本明細書に組み込まれる。

【0128】

様々な発現系では、有害因子のカタログが変更され得、その影響または重み付けも等しくない。したがって、ｆ_ｉ（ｘ）及びその重みは、様々な表現系において動的に変更でき得る。例えば、ＧＣ含有率及びＭＦＥの許容範囲を設定した後、「範囲外」の範囲は、その比率でペナルティを引き起こす。同様に、不安定因子の発生数をペナルティスコアとして直接記録してもよい。

【0129】

候補核酸配列の外れ値インデックスが高くても、集団全体の多様性を維持するために、候補配列は、反復において残存する可能性を依然として幾分有することを認識すべきである。換言すると、外れ値インデックス（すなわちペナルティ）が高いと生存率が低くなるだけであり得るので、有害なモチーフ／特徴の外れ値インデックスによるフィルタリングは必須ではない。対照的に、ＮＳＧＡ－ＩＩＩアルゴリズムの反復が完了した後（すなわち、図１のステップ１１０または図２のステップ２１４）の有害なモチーフ／特徴の除去は必須である。

【0130】

結論として、本発明は、調和インデックス及びコドン文脈インデックスの値を最大化することによって正の効果を促進する試みのみでなく、外れ値インデックスを最小化することによって負の影響を回避するために最善の試みを行っている。

【0131】

多目的（例えば、２つ以上の目的）最適化アルゴリズム
本発明は３つの包括的な目的の最適化タスクであるため、多目的遺伝的アルゴリズムを使用することができる。いくつかの実施形態では、ＮＳＧＡ－ＩＩＩアルゴリズムまたはＥｌｉｔｅＮＳＧＡ－ＩＩＩ（Ｋ．Ｄｅｂによっても提示される）などのその変形は、遺伝的アルゴリズムの古典的なフレームワークの選択操作の間、集団の多様性を維持することにより、多目的最適化問題を解決する上での利点のために使用可能である。

【0132】

ＮＳＧＡ－ＩＩＩは、２０１４年にＫａｌｙａｎｍｏｙＤｅｂ及びＨｉｍａｎｓｈｕＪａｉｎによって提唱された。これは、ＮＳＧＡ－ＩＩフレームワークに従った参照点ベースの多目的進化的アルゴリズムであり、優先でないが、提供された参照点のセットに近い集団メンバーに重点を置いている。ＮＳＧＡ－ＩＩＩは、ＮＳＧＡ－ＩＩなどの他の遺伝的アルゴリズムと比較して、３目的から１５目的の最適化問題を解決する効果を示している。従来の遺伝的アルゴリズムとは異なり、ＮＳＧＡ－ＩＩＩの集団メンバー間での多様性の維持が、十分に広がっている複数の事前定義された参照点を提供して、適応的に更新することによって支援され、したがって、ＮＳＧＡ－ＩＩＩでは、その選択演算子が大幅に変更される。

【0133】

ＮＳＧＡ－ＩＩＩアルゴリズムは、２０１４年８月に発行のＫａｌｙａｎｍｏｙＤｅｂｅｔａｌ．，による表題「ＡｎＥｖｏｌｕｔｉｏｎａｒｙＭａｎｙ－ＯｂｊｅｃｔｉｖｅＯｐｔｉｍｉｚａｔｉｏｎＡｌｇｏｒｉｔｈｍＵｓｉｎｇＲｅｆｅｒｅｎｃｅ－Ｐｏｉｎｔ－ＢａｓｅｄＮｏｎｄｏｍｉｎａｔｅｄＳｏｒｔｉｎｇＡｐｐｒｏａｃｈ，ＰａｒｔＩ：ＳｏｌｖｉｎｇＰｒｏｂｌｅｍｓＷｉｔｈＢｏｘＣｏｎｓｔｒａｉｎｔｓ」の刊行物に記載されており、これは、その全体が参照により本明細書に組み込まれる。関連するＮＳＧＡ－ＩＩアルゴリズムは、２００２年８月に発行のＫａｌｙａｎｍｏｙＤｅｂｅｔａｌ．，による表題「Ａｆａｓｔａｎｄｅｌｉｔｉｓｔｍｕｌｔｉｏｂｊｅｃｔｉｖｅｇｅｎｅｔｉｃａｌｇｏｒｉｔｈｍ：ＮＳＧＡ－ＩＩ」の刊行物に記載されており、その全体が参照により本明細書に組み込まれる。

【0134】

ＮＳＧＡ－ＩＩＩの実施中に、核酸配列を表すデータ構造として、コドンリスト／アレイ／ベクトルではなく、バイナリ文字列が選択されるが、バイナリ文字列では、データ構造としてのコドンリスト／アレイ／ベクトルと比較して、より小さいコンピュータメモリが必要であり、より速い操作速度が可能になるため、集団の初期化、クロスオーバー／組換え、変異などの一般的な遺伝的アルゴリズムのすべての一般的な操作オブジェクトは、バイナリ文字列である。いくつかの実施形態では、３つのビットのすべての組み合わせの数は、特定のアミノ酸の考えられる同義コドンの候補のすべてに一致するのに十分であるため、３つの連続ビットを使用して、１つの位置でのコドンを示す。例えば、３ビットには８種類の組み合わせ、例えば０００、００１、０１０、０１１、１００、１０１、１１０、及び１１１があり、その数は任意のアミノ酸、さらにはそれぞれ６つの同義コドンを所有しているアミノ酸Ｌ、Ｒ及びＳの同義コドンの数よりも多くなる。

【0135】

したがって、３つのビット文字列のそれぞれは、所与のアミノ酸の同義のコドンを表す。適合性の計算（例えば、調和インデックス、コドン文脈インデックス、及び外れ値インデックスの計算）中に、集団の個々の候補を表すバイナリ文字列がコーディング配列（すなわち、ＤＮＡ）に変換して戻される。一方、前述のように、遺伝的アルゴリズムの動作オブジェクト（クロスオーバー、変異、選択など）は、すべてバイナリ文字列であるため、変換は一時的なものである。したがって、適応性の計算は配列に基づくが、他のすべての動作は、効率及び速度のためにバイナリ文字列に基づく。

【0136】

ＮＳＧＡ－ＩＩＩを開始する前に、集団のサイズ、分割数、シミュレートされたバイナリクロスオーバーの分布インデックス、シミュレートされたバイナリクロスオーバーのクロスオーバー率、ビット反転変異の変異率、ビット反転変異の分布インデックスなど、複数のパラメータを設定する必要がある。ＮＳＧＡ－ＩＩＩの作成者は、外側と内側の分割数が指定されている多目的問題の分割に対して２層アプローチを提案している。２層アプローチを使用するために、分割数を外部分割数及び内部分割数に置き換えることができ得る。それぞれの個体の初期化プロセスはランダムであり、クロスオーバー及び変異の操作は、図２Ｂに示す古典的な遺伝的アルゴリズムと大きな差はない。

【0137】

図２Ｂは、クロスオーバー、変異、及び集団進化の選択など、生体から発想された演算子を含む遺伝的アルゴリズムの例示的な一般的なワークフローを示している。本発明の実施中、バイナリ文字列は、配列を示し、したがって、上記のすべての演算子のオブジェクトはバイナリ文字列である。

【0138】

選択する前に、集団全体の各個体について適合性関数（すなわち、前述の３つのインデックス関数）を評価する必要がある場合、バイナリ文字列は、一時的にコドン文字列に戻される。複数の進化世代及び進化の終了の後、最終的に生成されたコドン文字列が連結され、組換え発現に使用される最適な遺伝子として出力される。

【0139】

いくつかの実施形態では、終了条件としては、限定されないが、一定数の世代に到達すること、最良の適合性がプラトーに達し、これ以上良好な結果が生成されないこと、ほぼ最適な解決策の最小基準がいくつかの解決策によって満たされていることが挙げられる。

【0140】

ＮＳＧＡ－ＩＩＩアルゴリズムの教示によれば、これらの最適な遺伝子は、３次元空間のパレート面に配置され、等しく扱われるソリューションである必要がある。実用目的上、遺伝子合成及び発現試験に使用するリソースが限られているため、最初に調和インデックスの降順、次にコドン文脈インデックスの降順、最後に外れ値インデックスの昇順でランク付けする。クォータが１つの配列のみである場合、最上位１つを合成用に選択できる。厳密なコスト管理がないと仮定すると、例えば、調和インデックスが最も高い候補、コドン文脈インデックスが最も高い候補、及び外れ値インデックスが最も低い候補など、パレート面で十分な間隔を有するいくつかをテストすることが勧められる。本発明において、予備的最適遺伝子は終止コドンを有さないため、２つの連続的な終止コドンをコード配列の３’末端に付加することができる。

【0141】

分子クローニングのための特定の部分配列の除去
図２Ａを参照すると、ブロック２１４において、最適化手順は、モチーフを回避し、制限部位を除去するステップを含む。分子クローニングの利便性を高めることを目的として、遺伝子合成及びタンパク質発現の前に、いくつかの有害なモチーフ及び制限部位（例えば、顧客が好まないもの）を１つ以上の最適化された配列から除去する。この過程には、以下を含む：
ステップ１：回避する必要のあるすべての部分配列を配置する。
ステップ２：部分配列内の置換に使用でき得るすべての同義コドンをリスト化する。
ステップ３：高発現遺伝子内でより頻繁に使用される同義コドンは、必ず新しい部分配列が同時に出現しないことを条件として、より高い選択優先度を有する。
ステップ４：ステップ２～３を使用して、見つかったすべての部分配列を繰り返し処理する。

【0142】

いくつかの実施形態では、ブロック２０６及び２０８に示すとおり、有害なモチーフ及び特徴は、テキストマイニング及び文献レビューによって、様々な宿主について別々に同定する。

【0143】

例示的な実現形態
本明細書に記載の例示的な実現形態は、ＣＨＯ３Ｅ７細胞株における２つの遺伝子（ＪＮＫ３Ａ１及びＧＦＰ）の最適化及び発現によるコドン最適化に関する本発明の効率を示し、その基本情報を以下に要約する。発現レベルを評価するためにＦｌａｇタグの抗体を適用してウエスタンブロットを行ったため、Ｆｌａｇタグを２つのタンパク質のＣ末端に付加し、添加対照としてベータアクチンを使用した。各発現実験を２回繰り返した。

【表A】

【0144】

ＦｒｅｅＳｔｙｌｅＣＨＯ発現培地及びＣＤＣＨＯ培地（Ｔｈｅｒｍｏｆｉｓｈ）などいくつかの培地で培養されたＣＨＯ３Ｅ７のｍＲＮＡ－ｓｅｑを、Ｉｌｌｕｍｉｎａ推奨の古典的なｍＲＮＡ－ｓｅｑの提案に従って実行した。当社の最適化に成功した部分的順序と統合することにより、合計５００の配列をＣＨＯ３Ｅ７細胞株の高発現遺伝子として定義した。文献レビューの後、以下の部分配列を、有害なモチーフにグループ化し、その出現はペナルティ（すなわち、外れ値インデックスの増加）とした。好適な局所（６０ｂｐスライディングウィンドウ）及び全体的ＧＣ含有率は、約３５～６５％であり、ｍＲＮＡ二次構造の許容可能な最小ＭＦＥ△Ｇは、－１８Ｋｃａｌ／ｍｏｌであり、これらのパラメータの外れ値がペナルティとなった。
１）スプライス部位：ＧＧＴＡＡＧ、ＧＧＴＧＡＴ
２）ＡＴリッチエレメント：ＡＴＴＴＴＡ、ＡＴＴＴＴＴＡ、ＡＴＴＴＴＴＴＡ
３）リボソーム結合部位：ＡＣＣＡＣＣＡＴＧＧ（配列番号４）、ＧＣＣＡＣＣＡＴＧＧ（配列番号５）
４）抗ウイルスモチーフ：ＴＧＴＧＴ、ＡＡＣＧＴＴ、ＣＧＴＴＣＧ、ＡＧＣＧＣＴ、ＧＡＣＧＴＣ、ＧＡＣＧＴＴ
５）ＣｐＧアイランド：ＣＧＣＧＣＧＣＧ
６）ポリメラーゼずれ部位：ＧＧＧＧＧＧ、ＣＣＣＣＣＣ
７）アミロイド前駆体タンパク質３プライム安定性エレメント：ＴＣＴＣＴＴＴＡＣＡＴＴＴＴＧＧＴＣＴＣＴＡＴＡＣＴＡＣＡ（配列番号６）
８）Ｋ－Ｂｏｘ：ＣＴＧＴＧＡＴＡ
９）Ｂｒｄ－Ｂｏｘ：ＡＧＣＴＴＴＡ

【0145】

ＮＳＧＡ－ＩＩＩによるコドン最適化中に、集団サイズを１００に設定し、個々は、バイナリコード化させてランダムに生成した。その長さはタンパク質のアミノ酸数の３倍に等しく、進化世代数は２００，０００に等しく、分割数は適合性関数の数に依存し、シミュレートされたバイナリクロスオーバーの分布インデックスは１５．０であり、シミュレートされたバイナリクロスオーバーのシングルポイントクロスオーバー率は０．９であり、ビット反転変異の変異率は１．０／Ｌであり、ビット反転変異の分布インデックスは、２０．０であった。

【0146】

外れ値インデックスを最小化すると共に調和インデックス及びコドン文脈インデックスを最大化した後、各タンパク質は、いくつかの出力最適コーディング遺伝子を有し、そのうちの１つの遺伝子のみが最大調和インデックスを有し、以下の発現試験のために選択した。ＥｃｏＲＩ及びＨｉｎｄＩＩＩ酵素をベクターの構築及びクローニングに使用したため、ＧＡＡＴＴＣ及びＡＡＧＣＴＴは、コドン置換によって回避した。

【0147】

本明細書においてＡＳＣＩＩテキストファイルで提出し配列表には、２つのタンパク質ＧＦＰ＿Ｆｌａｇ（配列番号７）及びＪＮＫ３＿Ｆｌａｇ（配列番号８）の最適化配列が含まれる。

【0148】

同じ遺伝子の野生型と比較して、最適化遺伝子の性能を評価するために使用する実験の詳細なステップを以下に記載する。

【0149】

ステップ１：一過性のトランスフェクション及び細胞培養
１．合成された遺伝子は、ＥｃｏＲＩ及びＨｉｎｄＩＩＩ酵素を使用して、ｐＴＴ５ベクターにクローン化した。ＣＨＯ３Ｅ７細胞をＦｒｅｅＳｔｙｌｅＣＨＯ発現培地で培養し、ベクターの一過性トランスフェクションを、好適な細胞－ベクター比で、標準的な分子生物学的技術を用いて行った（すなわち、細胞密度１～１．２ｘ１０^６／ｍＬ、ベクター濃度１μｇ／ｍｌ以上）。
２．一過性トランスフェクション後、ＣＨＯ３Ｅ７細胞は３７℃、５％ＣＯ_２で、浮遊培養を必要とし、これを４８時間継続させた。

【0150】

ステップ２：細胞破壊
１．上流から培養細胞を採取し、４℃で２分間遠心分離（１０，０００ｘｇ）する。上澄みを廃棄する。
２．１ｍＬの１＊ＰＢＳを添加して、エッペンドルフチューブの底に細胞を再懸濁する。次に、４℃で２分間遠心分離（１０，０００×ｇ）し、上澄みを廃棄する。
３．１×１０^６細胞あたり、２００μＬ溶解緩衝液（低張性緩衝液［１０ｍＭトリス、１．５ｍＭのＭｇＣｌ_２、１０ｍＭのＫＣｌ、ｐＨ７．９］＋０．５％ＤＤＭ、ＰＭＳＦ［最終濃度１ｍＭ］、ヌクレアーゼ、カクテル）をエッペンドルフチューブに添加する。ピペットで細胞を再懸濁する。
４．細胞をカップ型超音波セルディスラプターに入れて細胞を破砕させる（４℃、３秒超音波、１秒間隔、合計１０分）。
５．破砕後、４℃で２０分間遠心分離（１２，０００×ｇ）する。上澄みを回収する。

【0151】

ステップ３：サンプル処理
１．ＢＣＡ法を使用して上澄みの濃度を測定する。
２．上澄みの一部をローディングバッファーで処理した。

【0152】

ステップ４：電気泳動及びウエスタンブロット
１．ＳＯＰに従ってＳＤＳ－ＰＡＧＥ用に処理したサンプルをロードする（サンプルあたり８μｇ）。
２．電気泳動後、ＳＯＰに従ってウエスタンブロット実験を行った。
１）トランスファー：ＳＤＳ－ＰＡＧＥ後にゲルを除去し、タンパク質をゲルからＰＶＤＦメンブレンに移す（トランスファーバッファー：２００ｍＬの５×トランスファー溶液を１５０ｍＬの無水エタノールに加えて１Ｌに希釈し、１時間トランスファーする）。
２）ブロッキング：トランスファー後、ＰＶＤＦを高速ブロッキング溶液で１０分間ブロックした。
３）インキュベーション：ブロッキング後、５％ミルク及び対応する標識抗体と４５分間インキュベートする（フラグタグ：マウス抗フラグｍＡｂＧｅｎＳｃｒｉｐｔ、カタログ番号Ａ００１８７、１：５０００希釈、ＴＨＥＴＭベータアクチン抗体、ｍＡｂ、マウスＧｅｎＳｃｒｉｐｔ、カタログ番号Ａ００７０２を１：１０００希釈で１時間添加し、次に標識二次抗体ヤギ抗マウスＩｇＧ－ＨＲＰＧｅｎＳｃｒｉｐｔ、カタログ番号Ａ００１６０を１：２５００希釈で添加する）。
４）露光：露光撮像を、抗体のインキュベーション後にＣｈｅｍｉＤｏｃ（商標）ＴｏｕｃｈＩｍａｇｉｎｇＳｙｓｔｅｍｓを使用して実行し、これらの画像は、編集のために指定された場所に保存する。
５）ＩｍａｇｅＬａｂをタンパク質の定量分析に使用した。

【0153】

図３は、本開示の実施形態による、ＣＨＯ３Ｅ７細胞株における最適化された配列と野生型の２つの遺伝子（すなわち、ＧＦＰ及びＪＮＫ３Ａ１）との間の発現の比較を示すウエスタンブロット結果であり、各遺伝子の調和インデックスが最も高い最適化された溶液のみを、発現を比較するために試験した。本発明がコドン最適化に有効であり、ほとんど変化しない内部対照ベータアクチンと比較して発現を増強することが明らかに示されている。左レーンは常にラダーマーカーであり、単一プラスミドのすべての発現が２回繰り返された。大まかな定量分析によれば、ＧＦＰの発現は約６．２倍改善されたと推定され、ＪＮＫ３の発現は本発明のコドン最適化後に約２．４倍促進された。

【0154】

例示的な電子デバイス
図４には、一実施形態によるコンピューティングデバイスの一例を示す。デバイス４００は、ネットワークに接続されたホストコンピュータであり得る。デバイス４００は、クライアントコンピュータまたはサーバーであり得る。図４に示すように、デバイス４００は、パーソナルコンピュータ、ワークステーション、サーバ、または電話またはタブレットなどのハンドヘルドコンピューティングデバイス（携帯電子デバイス）など、任意の好適なタイプのマイクロプロセッサベースのデバイスであり得る。デバイスは、例えば、プロセッサ４１０、入力デバイス４２０、出力デバイス４３０、ストレージ４４０、及び通信デバイス４６０のうちの１つ以上を備えることができる。入力デバイス４２０及び出力デバイス４３０は、一般に、上記のものに対応することができ、コンピュータに接続可能であるか、またはコンピュータと統合することができる。

【0155】

入力デバイス４２０は、タッチスクリーン、キーボードまたはキーパッド、マウス、または音声認識デバイスなど、入力を提供する任意の好適なデバイスであり得る。出力デバイス４３０は、タッチスクリーン、触覚デバイス、またはスピーカーなど、出力を提供する任意の好適なデバイスであり得る。

【0156】

ストレージ４４０は、ＲＡＭ、キャッシュ、ハードドライブ、またはリムーバブルストレージディスクを含む、電気的、磁気的または光学的メモリなどのストレージを提供する任意の好適なデバイスであり得る。通信デバイス４６０は、ネットワークインターフェースチップまたはデバイスなど、ネットワークを介して信号を送受信することができる任意の好適なデバイスを含むことができる。コンピュータの構成要素は、物理バスまたはワイヤレスなど、任意の好適な方法で接続され得る。

【0157】

ストレージ４４０に格納され、プロセッサ４１０によって実行され得るソフトウェア４５０は、例えば、本開示の機能を具現するプログラミングを含むことができる（例えば、上記のようにデバイスに具現されるように）。

【0158】

ソフトウェア４５０はまた、命令実行システム、装置、またはデバイスからのソフトウェアに関連する命令を取得して、命令を実行することができる、上記のものなど、命令実行システム、装置、またはデバイスによってまたはそれらに接続して使用するために、任意の非一時的コンピュータ可読記憶媒体内に格納及び／または輸送することができる。本文書の文脈において、コンピュータ可読記憶媒体は、命令実行システム、装置、もしくはデバイスによる使用のためにまたはそれらと接続してプログラムを含むかまたは格納することができる、ストレージ４４０など、任意の媒体であり得る。

【0159】

ソフトウェア４５０はまた、命令実行システム、装置、またはデバイスからソフトウェアに関連する命令を取得して、その命令を実行することができる、上記のものなどの命令実行システム、装置、またはデバイスによってまたはそれらに接続して使用するために、任意の輸送媒体内で伝播させることができる。本開示の文脈において、輸送媒体は、命令実行システム、装置、またはデバイスによって、またはそれらに接続して使用するために、プログラミングを通信、伝播、または輸送することができる任意の媒体であり得る。輸送可読媒体は、限定されないが、電子的、磁気的、光学的、電磁的または赤外線有線または無線伝搬媒体を含むことができる。

【0160】

デバイス４００は、任意の好適な型の相互接続された通信システムであり得るネットワークに接続され得る。ネットワークは、任意の好適な通信プロトコルを実施でき、任意の好適なセキュリティプロトコルによって保護され得る。ネットワークは、無線ネットワーク接続、Ｔ１またはＴ３回線、ケーブルネットワーク、ＤＳＬ、または電話回線など、ネットワーク信号の送受信を実施できる任意の好適な構成のネットワークリンクを含むことができる。

【0161】

デバイス４００は、ネットワーク上での動作に好適である任意のオペレーティングシステムを実装することができる。ソフトウェア４５０は、Ｃ、Ｃ＋＋、Ｊａｖａ（登録商標）、Ｐｙｔｈｏｎなどの任意の好適なプログラミング言語で記述できる。様々な実施形態では、本開示の機能を具現するアプリケーションソフトウェアは、例えば、クライアント／サーバー構成において、またはウェブベースのアプリケーションまたはウェブサービスとしてのウェブブラウザを介してなど、異なる構成で展開され得る。

【0162】

本開示及び実施例は、添付の図を参照して完全に説明されているが、様々な変更及び修正が当業者に明らかであろうことに留意されたい。そのような変更及び修正は、特許請求の範囲によって定義される開示及び実施例の範囲内に含まれるものとして理解されるべきである。

【0163】

説明のための上記記述は、具体的な実施形態を参照して説明した。しかしながら、上記の例示的な考察は、網羅的であることを意図するものではなく、また、本発明を開示されている正確な形態に限定することを意図するものでもない。上述の教示に照らして多くの変更形態及び変形形態が可能である。実施形態は、技術の原理及びそれらの実際の適用を最もよく説明するために選択され、記載した。これにより、当業者は、企図される特定の用途に適した様々な修正を加えた技術及び様々な実施形態を最もよく利用することが可能になる。

【図1】

【図2A】

【図2B】

【図3】

【図4】

【配列表】

0007542443000001.app

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版