(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022103706
(43)【公開日】2022-07-08
(54)【発明の名称】計算機システム、及び、その方法
(51)【国際特許分類】
G16B 30/10 20190101AFI20220701BHJP
【FI】
G16B30/10
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2020218498
(22)【出願日】2020-12-28
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成29年度、国立研究開発法人新エネルギー・産業技術総合開発機構、「植物等の生物を用いた高機能品生産技術の開発/高生産性微生物創製に資する情報解析システムの開発」委託研究、産業技術力強化法第17条の適用を受ける特許出願
(71)【出願人】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(71)【出願人】
【識別番号】504132272
【氏名又は名称】国立大学法人京都大学
(74)【代理人】
【識別番号】110002365
【氏名又は名称】特許業務法人サンネクスト国際特許事務所
(72)【発明者】
【氏名】伊藤 潔人
(72)【発明者】
【氏名】中澤 志織
(72)【発明者】
【氏名】今一 修
(72)【発明者】
【氏名】荒木 通啓
(57)【要約】 (修正有)
【課題】高生産性微生物等である生物資源の性質を向上するための設計支援を効率的に実行し、以って、人類に有用な生物資源を、研究資源、研究資金等の浪費を避けながら、開発するのに好適な計算機システムを提供する。
【解決手段】生物資源の機能を向上させるための設計を支援する計算機システムにおいて、サーバコンピュータは、設計の履歴を登録する。設計の履歴は、生物資源の性質に関係する関係要素と関係要素に対する操作とのペア情報を含む。システムは、ペア情報に基づいてデータベースを検索し、この検索の結果に基づいて、生物資源の性質に関係する情報であって、関係要素以外の追加情報を取得し、関係要素に対する追加情報の相関を演算し、演算された相関に基づいて、追加情報を評価する。
【選択図】
図5
【特許請求の範囲】
【請求項1】
生物資源の機能を向上させるための設計を支援する計算機システムであって、
前記計算機システムは、メモリに記録されたプログラムを実行するコントローラを備え、
前記コントローラは、
前記設計の履歴を登録し、当該設計の履歴は、前記生物資源の性質に関係する関係要素と当該関係要素に対する操作とのペア情報を含み、
前記ペア情報に基づいてデータベースを検索し、
この検索の結果に基づいて、前記生物資源の性質に関係する情報であって、前記関係要素以外の追加情報を取得し、
前記関係要素に対する前記追加情報の相関を演算し、そして、
当該演算された相関に基づいて、前記追加情報を評価する、
計算機システム。
【請求項2】
前記生物資源は人工微生物であり、
前記関係要素は遺伝子であり、
前記追加情報は前記人工微生物の機能を向上する候補となり得る候補遺伝子である、
請求項1記載の計算機システム。
【請求項3】
前記データベースが複数の文献を有し、
前記コントローラは、
前記ペア情報を含む関係文献を前記複数の文献から抽出し、
前記関係文献から前記候補遺伝子を抽出する、
請求項2記載の計算機システム。
【請求項4】
前記コントローラは、前記相関の演算を、前記候補遺伝子が記載されている文献数を計数することによって実行する、
請求項3記載の計算機システム。
【請求項5】
前記コントローラは、前記関係要素としての複数の遺伝子夫々に対する前記候補遺伝子との相関を演算する、
請求項3記載の計算機システム。
【請求項6】
前記コントローラは、
前記候補遺伝子の前記複数の遺伝子夫々との相関を合算し、
当該合算後の相関に基づいて複数の候補遺伝子を評価する、
請求項5記載の計算機システム。
【請求項7】
計算機によって、生物資源の機能を向上させるための設計を支援する方法であり、
前記計算機は、
前記設計の履歴を登録し、当該設計の履歴は、前記生物資源の性質に関係する関係要素と当該関係要素に対する操作とのペア情報を含み、
前記ペア情報に基づいてデータベースを検索し、
この検索の結果に基づいて、前記生物資源の性質に関係する情報であって、前記関係要素以外の追加情報を取得し、
前記関係要素に対する前記追加情報の相関を演算し、そして、
当該演算された相関に基づいて、前記追加情報を評価する、
前記方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は計算機システムに係り、特に、高生産性微生物創製など生物機能の人工的な改善・改良のための設計を支援する計算機システムに関する。
【背景技術】
【0002】
近年、遺伝子改変・ゲノム編集などバイオテクノロジーの目覚ましい進歩に伴い、遺伝子改変などの手法で、生物が持つ物質生産能力を人工的に高めた微生物を創製するといった、合成バイオ技術が注目されている。こうした高生産性微生物の開発においては、所望の生物機能を細胞内で発現させるために、元々その微生物が持たない遺伝子を新規に導入したり、細胞内の在来遺伝子の発現を強化・削除・抑制したりするなどの遺伝子改変技術が必要となる。
【0003】
従来、その一つとして、ある生物の代謝マップに基づいて、フラックスバランス解析を適用することによって代謝シミュレーションを実行し、代謝マップ中を流れる代謝フラックスを予測することにより微生物を改良することが試みられている(例えば、特開2005-58226)。
【0004】
一方、生物機能の改良に関連するバイオアイテム(遺伝子)を検索するために、バイオアイテム毎に、バイオアイテム文献セットを記憶し、各バイオアイテム文献セットにおいて、キーワードを該バイオアイテム文献セットの中から検索し、該バイオアイテム文献セットのうちキーワードを含む文献数Nhを、バイオアイテム毎に取得し、文献数Nhが1以上であるバイオアイテムを候補バイオアイテムとして選出し、候補バイオアイテム毎に、a)文献数Nh、および/または、b)キーワードを含まず且つバイオアイテム名を含む文献数、から構成される文献数テーブルを作成し、候補バイオアイテム毎に、文献数テーブルを用いた統計計算に基づいて、バイオアイテムとキーワードとの相関スコアを算出し、算出された相関スコアに基づいて、候補バイオアイテムを出力する、検索装置が提案されている(国際公開WO2007/126088)。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2005-58226号公報
【特許文献2】国際公開WO2007/126088号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
フラックスバランス解析に基づく代謝シミュレーションにおいては、代謝モデルに含まれない遺伝子は対象とならないばかりか、多次元方程式によって解を得るため、解が不定になったり、解析不能となったりすることがあり、高生産性微生物開発のための支援システムとして不十分である。
【0007】
一方、キーワード検索と、検索によってヒットした文献数に基づいて、バイオアイテムとキーワードとの相関スコアを算出して候補バイオアイテムを出力する検索装置において、高生産性微生物の開発のために、高生産性微生物の生物機能に着目すると、関係する遺伝子が多数ヒットし、有効な遺伝子を絞り込めず、一方、特定の遺伝子に着目すると、所望の生物機能に対する有効性を検索できない、という課題がある。
【0008】
したがって、高生産性微生物開発のための支援システムとして有用な計算機システムは、未だ実現されていないという他なく、現実的には、高生産性微生物の遺伝子改変は、研究者個人の知識、経験に裏付けされた試行錯誤の積み重ねから抜け切れておらず、研究者や設備などの研究資源、研究資金等の浪費を避けることができないというのが実状である。
【0009】
そこで、本願発明は、高生産性微生物等である生物資源の性質を向上するための設計支援を効率的に実行し、以って、人類に有用な生物資源を、研究資源、研究資金等の浪費を避けながら、開発するのに好適な計算機システムを提供することを目的とする。
【課題を解決するための手段】
【0010】
前記目的を達成するために、本発明は、生物資源の機能を向上させるための設計を支援する計算機システムであって、前記計算機システムは、メモリに記録されたプログラムを実行するコントローラを備え、前記コントローラは、前記設計の履歴を登録し、当該設計の履歴は、前記生物資源の性質に関係する関係要素と当該関係要素に対する操作とのペア情報を含み、前記ペア情報に基づいてデータベースを検索し、この検索の結果に基づいて、前記生物資源の性質に関係する情報であって、前記関係要素以外の追加情報を取得し、前記関係要素に対する前記追加情報の相関を演算し、そして、当該演算された相関に基づいて、前記追加情報を評価する、というものである。
【発明の効果】
【0011】
本願発明によれば、高生産性微生物等である生物資源の性質を向上するための設計支援を効率的に実行し、以って、人類に有用な生物資源を、研究資源、研究資金等の浪費を避けながら、開発するのに好適な計算機システムを提供することができる。
【図面の簡単な説明】
【0012】
【
図1】
図1は、本発明に係る計算機システムの実施形態のブロック図である。
【
図2】
図2は、
図1の計算機システムの設計履歴データベースに於ける、データ構造の一例を示す。
【
図3】
図3は、設計履歴データベースのデータ群を管理する管理テーブルの一例である。
【
図4】
図4は、計算機システムのユーザーコンピュータに於けるユーザインターフェースの一例である。
【
図5】
図5は、計算機システムのサーバコンピュータの動作を説明するフローチャートである。
【
図6】
図6は、候補遺伝子の検索の原理を説明するブロック図である。
【
図7】
図7は、候補遺伝子の管理テーブルの一例である。
【
図8】
図8は、候補遺伝子のランキングテーブルの一例である。
【
図9】
図9は、代謝マップと、対象遺伝子と、候補遺伝子との関係の一例を説明するブロック図である。
【
図10】
図10は、第2の実施形態に係る計算機システムのブロック図である。
【発明を実施するための形態】
【0013】
次に、本発明の実施形態について説明する。この実施形態は、生物資源としての高生産性微生物(人工微生物)の機能の改善を支援する計算機システムであって、詳しくは、高生産性微生物に新規遺伝子を導入したこと、在来遺伝子の機能を強化したこと、在来遺伝子を破壊したこと、そして、在来遺伝子を抑制した等を含む、遺伝子改変の履歴(過去情報)を解析して、高生産性微生物に有用な物質を生産させたり、有用物質の生産効率を向上させたり等、人工微生物の機能を向上させるうえでの候補となり得る有用遺伝子を候補遺伝子として、ユーザに提案する計算機システムを説明する。
【0014】
ユーザは、システムから提案された候補遺伝子を参考にして、人工微生物にウエットな操作を適用し、人工微生物の機能、活性、性能、性質、特性、又は、属性等の改善に効果があったか否かを検証することができる。ユーザにとっては、候補遺伝子の探索のための負荷が大幅に軽減される。
【0015】
生物資源とは、動植物細胞、微生物、細菌、ウィルス、ホルモン、酵素、組織、器官、臓器、遺伝子、染色体、DNA、RNA、人工微生物(高生産性微生物)など何らかの生物活性を有するものである。生物資源を、生物材料、又は、生物素材として言い換えてもよい。遺伝子は、生物、細胞、微生物の機能改変に関係する要素として基本的なものである。人工微生物の代謝は、代謝マップとしてモデル化されており、遺伝子の改変は、代謝マップ内の代謝経路の新設、遮断、抑制、活性化等に繋がる。遺伝子を改変することによって、代謝機能を大がかりに改変することができ、その結果、例えば、微生物発酵で生産できる有用物質を多様化し,さらにその収率を可能な限り向上させることができる。“遺伝子を改変する”とは、新規な遺伝子を導入すること、在来遺伝子を抑制すること、在来遺伝子を強化すること、そして、在来遺伝子を取り除くことを含む。
【0016】
図1は、計算機システムのブロック図の一例である。計算機システムは、ユーザーコンピュータ10と、サーバコンピュータ12と、両者を接続する通信網(インターネット、LAN等)とを備えて構成されている。ユーザーコンピュータ10、サーバコンピュータ12とはそれぞれ、通常のハードウェア資源である、コントローラ(CPU:制御手段)とメモリと入出力インターフェースを備える。通信網には複数のデータベースが接続しており、設計履歴データベース14と、文献(関連情報)データベース&検索エンジン16とがある。なお、計算機システムを、パソコンによって構成してもよい。
【0017】
設計履歴データベース14は、組織、団体、国、機関、地域、又は、期間等の項目毎に存在してよい。設計履歴データベース14は、単数、又は、複数であってよい。これらのことは、文献データベース&検索エンジン16についても同じでよい。
【0018】
設計履歴とは、生物資源の代謝設計の履歴であり、生物資源に於ける、遺伝子(関係要素)とそれに対する操作とのペア情報を複数含む。操作とは、生物資源の特性、性質、性能、機能、又は、属性を改良するために、遺伝子を改変させるための操作を含み、具体例としては、高生産性微生物に対する、新規遺伝子の導入、既存遺伝子の強化、その抑制、その削除を含む。
【0019】
図2は、設計履歴データベース14に於ける、データ構造の一例を示す。このデータ構造は、複数の改変リストがリンクによって接続された、ツリー構造として説明されている。
図2の一つのブロックが改変リストに対応する。
図2に示すように、人工微生物の構築は、所定の親株を起点として、遺伝子改変の積み重ねによって実現される。一つのブロック(改変リスト)は、改変の世代毎に、操作対象となった遺伝子名と、遺伝子に対する操作とのペア情報を備える。複数のブロックは改変の世代に従ってリンクで接続されている。
【0020】
符号200は、改変株1(strain 001)であって、Wild type(strain 000親株)から遺伝子pdcを追加した改変リストを示し、符号202は、改変株2(strain 002)であって、改変株1(strain 001)から遺伝子adhEを削除(Δ)した改変リストを示し、符号204は改変株3(strain 003)であって、改変株2(strain 002)に遺伝子ppsを追加した改変リストを示す。したがって、符号204は、親株から、adhEを削除し、pdc、ppsを追加した改変株であることを示している。
【0021】
図3は、設計履歴データベース14のデータ群を管理する管理テーブルの一例を示す。管理テーブルは微生物の株を管理するための株情報テーブルと、株の遺伝子の改変情報を管理するための遺伝子改変情報テーブルと、改変の根拠を管理するための根拠情報テーブルと、実験情報テーブルと、を備える。株情報テーブルは、株IDと、親株IDと、株詳細情報とを備える。遺伝子改変情報テーブルは、株IDと、改変IDと、対象遺伝子名と、対象遺伝子に対する操作名と、操作情報とを含み、株IDをキーにして、株情報テーブルと1:Nに対応する。
【0022】
根拠情報テーブルは、改変IDと、根拠情報IDと、根拠情報とを含み、改変IDをキーにして、根拠情報テーブルと1:Nに対応する。実験情報テーブルは、株IDと、実験詳細情報とを含み、株IDをキーにして、株情報テーブルと1:Nに対応している。
【0023】
文献データベース&検索エンジン16は、生物資源に関連するデータ群を蓄積したものであり、データの属性はテキストデータ、画像データ、音声データ等制限されず、かつ、データの種類も論文、特許、書籍、雑誌等の文献データが主たるものであるが、これに限定されるものではない。
【0024】
ユーザーコンピュータ10は、設計履歴データベース14に設計履歴としての改変リストを入力(S1)するためのインターフェースを備える。
図4は、グラフィックユーザインターフェースの一例であって、グラフィックユーザインターフェースは、設計履歴のツリー構造の画面400と、ツリー構造への入力画面402とを含む。
【0025】
入力画面の例は、ツリー構造のうちのボックス404に対する入力画面であって、対象遺伝子としてADH2が選択され、対象遺伝子に対する操作としてdisruption(削除)が選択され、対象微生物(Saccharomyces cerevisiae:酵母)について、ターゲット化合物(エタノール)の目標効果(20mMの増加)が入力されることを示している。ユーザがSubmitをクリックすることによって、入力情報がツリー構造のボックス404に登録される。
【0026】
ユーザーコンピュータ10は、サーバコンピュータ12に、遺伝子改変のための候補遺伝子の提案をリクエスト(S2)すると、サーバコンピュータ12は、このリクエストに基づいて、設計履歴データベースを参照(S3)し、改変リストをリードして(S3A)、文献データベース&検索エンジン16に検索クエリ(S4)を発行する。
【0027】
文献データベース&検索エンジン16は検索クエリに基づいてデータベースを検索し、検索結果をサーバコンピュータ12に出力する(S5)。サーバコンピュータ12は、検索結果を評価し、評価結果に基づいて、遺伝子改変の対象となる候補遺伝子に係る提案をユーザーコンピュータ10に出力する(S6)。
【0028】
次に、サーバコンピュータ12の動作をフローチャート(
図5)に従って、改めて説明する。サーバコンピュータ12のコントローラはメモリのプログラムにしたがってこのフローチャートを実行する。コントローラは、ユーザーコンピュータ10から提案リクエスト(S2)を受信すると、フローチャートをスタートさせる。
【0029】
コントローラは、設計履歴データベース14から改変リスト14Aを読み込む(S500)。コントローラはデータベースに属する全ての改変リストを読み込んでもよいし、又は、改変リストの作成日時を区切る、対象遺伝子を特定する、操作の種類を特定する等して所定範囲の改変リストを読み込んでもよい。ユーザーコンピュータ10は、ユーザの入力契機に基づいて、又は、改変リストが所定数に達した、又は、週ごと、月ごと等時限的な契機に基づいてリクエストを出力してもよい。
【0030】
コントローラは、S502において、複数の改変リストの夫々から検索情報としての、遺伝子名とそれに対する操作名とのペア情報を抽出し、ペア情報に基づく検索クエリを検索文献データベース&検索エンジン16に順番に出力する(S504)。コントローラは、文献データベース&検索エンジン16から、検索結果として、関連文献のリストを受領する(S506)。関連文献とは、ペア情報の“対象遺伝子名”と、これに対する“操作名”夫々の形態素が存在する文献である。
【0031】
コントローラは、関連文献の形態素を処理して、形態素の中から、対象遺伝子以外の遺伝子を人工微生物の機能改善のための候補遺伝子として抽出する。
図6は、候補遺伝子の検索の原理を説明するブロック図である。符号600は、高生産性微生物の代謝マップを示す。
【0032】
符号14Aは、既述のとおり、代謝マップに対する改変リストである。この改変リストは対象遺伝子が“geneA”であり、対象遺伝子に対する操作が“破壊”であることを示している。このリストは、“geneA”を破壊することによって、代謝マップ600の“X”に対応する経路が阻害されたことを示している。
【0033】
文献データベース&検索エンジン16は、複数の文献の中からペア情報(“geneA”&“破壊”)を含む関連文献を抽出する。“geneA”と“破壊”とのいずれかを含むか、又は、これらを共に含まない文献は非関連文献である。
図6において、文献Aは関連文献であり、文献Bは非関連文献である。
【0034】
コントローラは関連文献の形態素を分析して、対象遺伝子(geneA)以外の遺伝子を候補遺伝子として抽出し(S508)、候補遺伝子を管理テーブル602に登録する(S510)。
図7にこのテーブルの一例を示す。X方向の遺伝子は“候補遺伝子”であり、Y方向の遺伝子は“対象遺伝子”である。
【0035】
コントローラは、S510において、管理テーブル602に候補遺伝子の共起数を登録する。“候補遺伝子の共起数”は、対象遺伝子と候補遺伝子が共に出現している文献数である。
図7において、700によって示されるセルは、adhA(対象遺伝子)とpflB(候補遺伝子)とが共に出現する文献数が“2”であることを示している。共起数が大きいほど、文献数が多く、即ち、両者の相関度が高いことを示している。
【0036】
コントローラは、候補遺伝子がテーブルに存在しない場合は、これをテーブルに登録して、セルに共起数として“+1”を登録する。コントローラは、候補遺伝子がテーブルに存在する場合には、セルの共起数に“+1”を加算して、テーブルを更新する。管理テーブル602は、サーバコンピュータ12の記憶装置に記録されていればよい。
【0037】
コントローラはS512において、一つの関係文献の全ての候補遺伝子について、S508とS510との処理を終了させると、次のステップであるS514に移行する。コントローラはS514において、全ての関係文献について、S508-S512の処理を終了させると、次のステップであるS516に移行する。
【0038】
さらに、コントローラはS516において、設計履歴データベース14の全ての改変リストについて、S502-S514を終了させると、次のステップであるS518に移行する。
【0039】
コントローラは、S502-S516のステップを経ることによって、管理テーブル602への候補遺伝子とこれの共起数の登録を完了させる。なお、共起を頻出と言い換えてもよい。
【0040】
コントローラは、S518において、管理テーブル602に基づいて、候補遺伝子の中からどの遺伝子が生物材料の特性改変に優れているかを評価する。そこで、コントローラはテーブル602において、夫々の候補遺伝子の共起数を合算する。
【0041】
図7の符号702は、候補遺伝子(pflB)の、複数の対象遺伝子の夫々に対する共起数を合算する、ことを示している。合算値が候補遺伝子の設計履歴データベース14に対する相関性、関連性、関係性、あるいは、親和性を説明している。符号702の相関度は、“+13”である。相関度が高いほど、その候補遺伝子は設計履歴データベースとしての、過去の遺伝子改変実績に親和性、関連性等が高く、候補遺伝子として適格性が高いことを示している。
【0042】
コントローラは、管理テーブル602の全ての候補遺伝子夫々の全体相関度に基づいて、候補遺伝子のランキングテーブルを作成することによって、候補遺伝子を評価する。
図8はランキングテーブル800の一例である。ランキングテーブル800は、候補遺伝子毎に、相関度スコアのカラムと、対象遺伝子毎の共起情報のカラムと、を有する。対象遺伝子毎のカッコ内の数字は、対象遺伝子との共起数、即ち、共起している文献数である。コントローラは、カッコ内の数字に、共起している文献へのリンクを付加させてもよい。
【0043】
テーブル800は、候補遺伝子(pflB)の相関度スコアは“13”であり、そして、ランキングが候補遺伝子(ldhA)に次いで第2位であることを示している。そして、複数の対象遺伝子のうち、“pdc”の共起数が最も高く、“pdc”への相関性が他の対象遺伝子に比べて高いことを示している。ユーザは“pdc”と共起する文献を優先的に参照することができる。
【0044】
コントローラは、ランキングテーブル800を、候補遺伝子に係る提案として、ユーザーコンピュータ10に出力する(S6)。ユーザーコンピュータ10は、ランキングテーブル800をユーザに報知してもよいし、上位ランキングの候補遺伝子を選択して報知してもよい。ユーザーコンピュータ10は、所定閾値以上のスコアの遺伝子を候補遺伝子として選択して報知してもよい。
【0045】
図9は、代謝マップ900と、対象遺伝子902と、候補遺伝子904との関係の一例を説明するブロック図である。代謝マップ900は、大腸菌による、グルコースからエタノールを産生するまでの代謝経路を備える。代謝マップ900には、対象遺伝子902と対象遺伝子に対する操作が書き加えられている。
【0046】
さらに、代謝マップには、ピルビン酸からD-乳酸への代謝経路を触媒する酵素を産出するための遺伝子である“ldhA”(候補遺伝子:902)を削除又は抑制すること、ピルビン酸からアセチルCoAへの代謝経路を触媒する酵素を産出するための遺伝子である“pflB”(候補遺伝子:902)を強化することが書き加えられている。
【0047】
サーバコンピュータ12は、プレディクティブコーディングの手法にしたがって、文献データベース&検索エンジン16に属する複数の文献に重み付けを行ってもよい。研究者、又は、専門家は、所定数の文献(教師データ)に対して、予め、生物材料の改善に関係あるか否かのフラグ付けを行う。サーバコンピュータ12に搭載されているAIは、フラグに基づいて各文献の形態素の重み付けを学習する。
【0048】
AIは学習結果に基づいて、文献データベース&検索エンジン16の残りの文献についてスコア付けを行って、複数の文献のランキングを実行する。サーバコンピュータ12は、文献データベース&検索エンジン16に所定ランキング内の文献について検索を行うように指示することができる。
【0049】
コントローラは、文献に重み付けを適用することによって、関連性がある文献から候補遺伝子を抽出することができ、その結果、対象遺伝子に対して、より相関性が高い候補遺伝子を決定することができる。
【0050】
コントローラは、候補遺伝子の共起回数を決定する際、全ての対象遺伝子夫々との共起回数を合算したが、全ての対象遺伝子ではなく所定の対象遺伝子に絞ってもよい。この絞り込みは、ユーザからの選択に任せてもよいし、設計履歴データベース14の全ての改変リストに於ける、対象遺伝子の存在頻度に応じて、共起回数を算出すべき対象遺伝子を絞りこんでもよい。
【0051】
コントローラは、共起回数を文献単位で計数したが、これに限らず、例えば、関連文献の段落単位、又は、文章単位で、計数してもよい。そして、文献毎の出現率(全形態素数に対する出現数)に基づいて、候補遺伝子の共起度を算出してもよい。また、関連文献内において、対象遺伝子との間の形態素の数が少ない候補遺伝子を高く評価するようにしてもよい。
【0052】
次に、第2の実施形態について説明する。
図10は、その計算機システムのブロック図である。この実施形態が
図1の実施形態と異なる点は、サーバコンピュータ12に、遺伝子辞書1000と操作表現辞書1002とを接続させた点である。遺伝子辞書1000には、同一又は類似機能の遺伝子が同じ酵素番号としてまとめられている。
【0053】
操作表現辞書1002には、改変リストの操作名と同義語や類義語(語形は異なるが意味が同じか類似である語)の関係に当たる操作名が纏められている。類義語は同義語を含むと定義してもよい。同義語と類義語を関連データ要素として定義してもよい。例えば、「削除」、「除去」、「Delete」、「消去」等同じ意味の形態素は互いに同義語の関係になる。
【0054】
コントローラは、遺伝子辞書1000を参照して(S7)、改変リストの対象遺伝子と同じ酵素番号を持つ遺伝子リストを取得し(S8)、さらに、操作表現辞書1002を参照して(S9)、改変リストの操作名と関連する操作名のリストを取得する(S10)。コントローラは、遺伝子リスト&操作リストに基づいてデータベースを検索する。
【0055】
コントローラは遺伝子リストに含まれる少なくとも一つの遺伝子名と、操作リストに含まれる少なくとも一つの操作名とを共に含む文献を関連文献として決定する。第2の実施形態によれば、第1の実施形態に比べて、候補遺伝子を広範囲に収集することができる。
【0056】
次に、第3の実施形態について説明する。この実施形態が第2の実施形態と異なる点は、サーバコンピュータ12に、さらに化合物辞書が接続されていることと、改変リストに改変対象化合物が含まれていることである。改変対象化合物とは遺伝子の導入、抑制等によって、人工微生物によって生産量が増加されようとしている化合物である。
【0057】
化合物辞書には、改変対象化合物に関連する化合物、例えば、前駆体、誘導体、分解物、命名法が異なるが同一の化合物が含まれている。コントローラは改変リストから改変対象化合物を取得すると、化合物辞書を参照して、改変化合物に関連する関連化合物リストを取得する。
【0058】
コントローラは遺伝子リストに含まれる少なくとも一つの遺伝子名と、操作リストに含まれる少なくとも一つの操作名と、化合物リストに含まれる少なくとも一つの関連化合物と、を共に含む文献を関連文献として決定する。第3の実施形態によれば、第2の実施形態に比べて、人工微生物の改変により適した候補遺伝子を広範囲に収集することができる。
【0059】
以上説明した実施形態は、本発明の事例であって、本願発明の技術的範囲は実施形態に記載のものに限定されない。既述の実施形態において、計算機システムの機能として説明された技術事項は、手段、要素という用語によって特定できる。機能をソフトウェアだけではなく、ハードウェア、又は、ハードウェアとソフトウェアとの組み合わせによって実現してもよい。
【符号の説明】
【0060】
10 ユーザーコンピュータ
12 サーバコンピュータ
14 設計履歴データベース
16 文献(関連情報)データベース&検索エンジン