【解決手段】方法は、希少疾患、遺伝子、希少疾患に関する表現型、および生物学的経路を含有する、ヒト希少疾患に関する1組の実体を1つまたは複数の情報源から得るステップと、1組の実体からの実体の各々を使用して、最初の異種ネットワークを構築するステップと、グラフ畳込みに基づく関連性スコアリング(GCAS)を最初の異種ネットワークに適用して、推定関連性を導出するステップと、最初の異種ネットワークに推定関連性を追加することにより希少疾患のための異種関連性ネットワーク(HANRD)を作成するステップと、HANRDで受信されている入力クエリに対して、優先順位づけされた1組の遺伝子を生成するステップと、を含む。
前記1つまたは複数の情報源は、Medical Subject Headings(MeSH)、Orphanet、Human Phenotype Ontology(HPO)、HUGO Gene Nomenclature Committee、およびWiki Pathwaysを備える、請求項1に記載の方法。
前記精選された関連性は、前記1つまたは複数の情報源から得られる前記複数の対エッジの各々に割り当てられた前記重みを使用して形成された、疾患−遺伝子関連性、遺伝子−遺伝子関連性、および表現型−疾患関連性を備える、請求項1に記載の方法。
前記累積関連性スコアは、前記複数の表現型ごとの関連性スコアの合計であり、前記関連性スコアは、前記HANRD内の複数の表現型の各々の遺伝子近傍に基づく、請求項1に記載の方法。
前記精選された関連性は、前記1つまたは複数の情報源を使用して前記複数の対エッジの各々に割り当てられた前記重みを使用して形成された、疾患−遺伝子関連性、遺伝子−遺伝子関連性、および表現型−疾患関連性を備える、請求項10に記載のシステム。
【発明を実施するための形態】
【0013】
添付図面を参照して、代表的実施形態について説明する。図では、参照番号の1つまたは複数の左端の数字は、参照番号が最初に出現する図を識別する。好都合なときはいつでも、同じまたは類似する部分を指すために、図面全体を通して同じ参照番号を使用する。開示する原理の例および特徴について本明細書で説明するが、開示する実施形態の精神および範囲を逸脱することなく、修正形態、適応形態、および他の実装形態が可能である。以下の詳細な説明は、ただ単に代表的であると考えられ、真の範囲および精神は、(本明細書に含まれるとき)特許請求の範囲により示されることが意図される。
【0014】
文献で公知のように、計算深層表現型検査の主要な目的の1つは、個別化ゲノム医学のためのゲノムデータ分析の助けになることである。とりわけ、Phenomizer(たとえば、ヒト遺伝学での臨床診断)、Phenolyzer(ヒト疾患に関する候補遺伝子の、表現型に基づく優先順位づけ)、およびPCAN(phenotype consensus analysis to support disease−gene association、疾患−遺伝子関連性を支援するための表現型コンセンサス分析)を含む、ゲノムデータ分析のための既存のツールが存在する。また、ヒト疾患研究のための全エキソーム解析(Whole Exome Sequencing、WES)または全ゲノム配列決定(Whole Genome Sequencing、WGS)により識別された表現型分析と変異体分析を組み合わせる複合遺伝子および変異体優先順位づけツールが存在する。当技術分野で利用できるツールは、OMIM Explorer、VarElect、Exomiser、OVA、Phevor、Phen−Gen、eXtasy、およびIngenuity Variant Analysisでの表現型駆動型順位づけ(Phenotype−Driven Ranking、PDR)アルゴリズムを含む。研究者らは、これらのツールの多くを調査してきた。これらのツールは、(たとえば、ツールOVAの1つで開示されるような)特有の表現型と関連づけられることがすでに公知の「種遺伝子(seed gene)」として公知の1組の遺伝子を入力として必要とする場合が多い。これは、表現型と遺伝子の間の新規の関連性を取り扱うとき、大きな制限を引き起こす。1組の入力表現型を提示されたとき、表現型−遺伝子型関連性を推定することができるツールは、この制限を克服する、よりよい位置にある。
【0015】
一方、Phenomizerは、1組の入力表現型を提示されたとき、表現型の項目と潜在的候補疾患および対応する遺伝子との間の意味ネットワークに依存する。遺伝子優先順位づけおよび遺伝子機能予測のために生物学的ネットワークが統合されたGeneMANIA予測サーバ、およびGUILDなどの、ネットワークに基づく類似の取り組み方法は、(1)遺伝子などのさまざまな生物学的実体と表現型の間の公知の関連性のネットワーク、および(2)基礎をなすネットワークを使用して関連性を推定およびスコアづけするためのアルゴリズムを必要とする。関連性は、方法論的関連性、生物的相互作用、または関与する実体が何らかの状況で同時に現れる「責任による関連性」である可能性がある。関連性を推定およびスコアづけするためのアルゴリズムは、CIPHER、PRINCE、RWRH(Random walk with restart on Heterogenous network、異種ネットワーク上での再始動を伴うランダムウォーク)、Bi−Random Walk(BiRW)、およびMAXIF(MAXimum Information Flow、最大情報の流れ)を含む。CIPHERは、タンパク質相互作用ネットワークと表現型ネットワークを接続して、疾患遺伝子を試して、予測する。PRINCEは、関連性スコアリングのために、ネットワーク上でのラベル伝播を使用する。RWRHアルゴリズムは、遺伝子優先順位づけに適用されたとき、Online Mendelian Inheritance of Man(ヒトのオンラインメンデル遺伝、OMIM)カタログから得られる表現型−遺伝子関連性を使用して構築されたネットワークで、遺伝子および表現型を同時に順位づけする。BiRWは、基礎をなすネットワークで円形バイグラフ(bigraph)と呼ばれる特殊な部分グラフ構造を探求することにより、新規の表現型−遺伝子関連性を計算する。円形バイグラフは、BiRWでは、エンドポイントが表現型−遺伝子リンクにより接続される、表現型だけの経路および遺伝子だけの経路から構成されるとして規定される。これらの構造は、新しい表現型−遺伝子リンクが、理想的には、遺伝子部分経路が後に続く表現型部分経路からなる経路として現在のネットワーク内に存在するという生物学的直感を獲得する。表現型部分経路は、存在論的関係を獲得し、遺伝子部分経路は、公知の遺伝子−遺伝子関連性のシーケンスを獲得する。MAXIFは、関連性スコアリングのために、ネットワークの流れを使用する。BiRWは、PRINCE、CIPHER、およびRWRH(たとえば、BiRWを参照のこと)などの、ネットワークに基づく他のアルゴリズムよりも性能が優れていることが示されている。
【0016】
ネットワークに基づく優先順位づけの取り組み方法を使用して、1組の臨床表現型を最もよく説明する原因遺伝子を識別することは、特に希少疾患に関して困難な作業のままである。
【0017】
本開示のさまざまな実施形態は、異種ネットワーク上でのグラフ畳込みに基づく遺伝子優先順位づけのためのシステムおよび方法を提供した。換言すれば、本開示は、希少疾患に関連して異種ネットワークを使用する、表現型駆動型遺伝子優先順位づけの取り組み方法を提案する。
【0018】
本開示の実施形態は、1組の実体間の関連性を、重み付きエッジとして表現しながら、ノードとしての遺伝子、表現型、経路などの1組の実体を含む異種ネットワークの構築について記述する。エッジの重みは、実体対間の関連性のスコアを表現する。既存の関連性ネットワークは、通常は方法論的関連性を他の異種関連性のネットワークとは別個のものとして見る。本システムおよび方法は、方法論的関連性だけではなく、複数の情報源からの遺伝子、疾患、表現型、および経路を伴う精選された関連性から構成される異種ネットワークを最初に構築する。スペクトルグラフ畳込みの最近の進展が動機となり、本開示のシステムおよび方法は、グラフ畳込みに基づく技法を実装して、この最初の1組の関連性から新しい表現型−遺伝子関連性を推定する。これらの推定関連性は、最初のネットワークに含まれており、統合ネットワークHANRD(希少疾患のための異種関連性ネットワーク)と呼ばれた。最近公表された230の希少疾患臨床例は、症例表現型を入力として使用して検証された。
【0019】
図1〜
図8を参照して、示される例示に関して、異種ネットワーク上でのグラフ畳込みに基づく遺伝子優先順位づけのための、上述のシステムおよび方法の詳細な説明を示す。
【0020】
添付図面を参照して、代表的実施形態について説明する。図では、参照番号の1つまたは複数の左端の数字は、参照番号が最初に出現する図を識別する。好都合なときはいつでも、同じまたは類似する部分を指すために、図面全体を通して同じ参照番号を使用する。開示する原理の例および特徴について本明細書で説明するが、開示する実施形態の精神および範囲を逸脱することなく、修正形態、適応形態、および他の実装形態が可能である。以下の詳細な説明は、ただ単に代表的であると考えられ、真の範囲および精神は、以下の特許請求の範囲により示されることが意図される。
【0021】
次に、図面を参照すると、より詳細には、類似する参照文字が図全体を通して、対応する特徴を一貫して示す
図1〜
図8を参照すると、好ましい実施形態が示されており、これらの実施形態について、以下の代表的なシステムおよび/または方法に関連して説明する。
【0022】
図1は、本主題の一実施形態による、異種ネットワーク上でのグラフ畳込みに基づく遺伝子優先順位づけのためのシステム102を実装するネットワーク環境100を示す。一例の実施形態では、システム102は、遺伝子優先順位づけを行うことができ、詳細には、最初の存在論的および精選された関連性のネットワーク上で情報伝播を遂行し、かつネットワークの実体間の新規の2値関連性を推定する情報伝播アルゴリズムGCAS(グラフ畳込みに基づく関連性スコアリング)を開発することができる。開示する実施形態の重要な貢献は、実施形態が、HANRDを構築して、表現型駆動型希少疾患遺伝子優先順位づけの特有の問題を解決することができるようにすることであり、HANRDでは、入力は、臨床例から得られる1組の表現型であり、出力は、潜在的原因遺伝子の順序づけリストであり、HANRDは、
図2に示すようなものである。
【0023】
本明細書では、システム102は、入力クエリを、たとえば、本明細書で以後、集合的に機器104と呼ぶ複数の機器および/または機械104−1、104−2、…、104−Nを介したクエリを獲得してもよい。機器104の例は、携帯型コンピュータ、携帯情報端末、ハンドヘルド機器、機器を具体化するVRカメラ、画像/ビデオを取り込んで、記憶を装備する記憶機器などを含んでもよいが、これらに限定されない。一実施形態では、機器104は、1つまたは複数の情報源から情報を得ることができ、かつ臨床例に対応する複数の表現型を備える入力クエリを受信することができる機器を含んでもよい。機器104は、ネットワーク106を通してシステム102に通信可能に結合され、得た情報を1つまたは複数の情報源からシステム102へ伝送することができてもよい。
【0024】
一実施形態では、ネットワーク106は、無線ネットワークでも、有線ネットワークでも、それらの組合せでもよい。ネットワーク106を、イントラネット、ローカル・エリア・ネットワーク(local area network、LAN)、広域ネットワーク(wide area network、WAN)、インターネットなどのような、異なるタイプのネットワークの1つとして実装することができる。ネットワーク106は、専用ネットワークでも、共用ネットワークでもよい。共用ネットワークは、さまざまなプロトコルを、たとえば、ハイパーテキスト転送プロトコル(Hypertext Transfer Protocol、HTTP)、伝送制御プロトコル/インターネットプロトコル(Transmission Control Protocol/Internet Protocol、TCP/IP)、ワイヤレス・アプリケーション・プロトコル(Wireless Application Protocol、WAP)などを使用して互いに通信する、異なるタイプのネットワークの関連性を表す。さらに、ネットワーク106は、ルータ、ブリッジ、サーバ、コンピューティング機器、記憶装置などを含む、さまざまなネットワーク機器を含んでもよい。
【0025】
機器104は、ネットワーク106を介して希少疾患、遺伝子、表現型、および生物学的経路に関連する情報をシステム102に送信してもよい。システム102は、臨床例から得た複数の表現型を含む入力、および潜在的原因遺伝子の順位づけリストを含む出力に関して、異種ネットワーク上で希少疾患の遺伝子優先順序づけを行う。一実施形態では、システム102は、コンピューティング機器110の中に具体化されてもよい。コンピューティング機器110の例は、デスクトップ・パーソナル・コンピュータ(personal computer、PC)、ノートブック、ラップトップ、携帯型コンピュータ、スマートホン、タブレットなどを含んでもよいが、これらに限定されない。また、システム102をデータリポジトリ112と関連づけて、媒体ストリームおよび/または画像を記憶してもよい。追加でまたは代わりに、データリポジトリ112は、1つまたは複数の情報源からのデータ、および/または遺伝子優先順位づけ中に生成された情報を記憶するように構成されてもよい。リポジトリ112は、外部に構成され、システム102を具体化するコンピューティング機器110に通信可能に結合されてもよい。あるいは、データリポジトリ112は、システム102内部に構成されてもよい。
【0026】
一実施形態では、システム102は、対ごとの方法論的関連性および精選された関連性を含有する最初の異種ネットワークを含み、最初の異種ネットワークにグラフ畳込みに基づく関連性スコアリング(GCAS)を適用する。開示するシステム102は、HANRDを構築して、HANRD上で臨床例に対応する複数の表現型を含む入力クエリに対して、1組の遺伝子を優先順位づけするための推定関連性を生成することができるようにする。優先順位づけされた1組の遺伝子は、複数の表現型からの表現型の各々とHANRD内の表現型ごとの関連遺伝子との間の累積関連性スコアをソートすることにより生成される。精選された関連性、方法論的関連性、およびシステム102を使用する推定関連性を使用してHANRDを構築する一例の表現について示し、
図3を参照してさらに説明する。
【0027】
図2を参照すると、精選された関連性だけではなく、GCASと呼ばれるスペクトルグラフ畳込みアルゴリズムを適用することにより得られる推定関連性を使用して、異種ネットワーク202を構築する。次いで、構築された異種ネットワークHANRD202は、個々の臨床例から得られる入力表現型204を使用して照会され、遺伝子の優先順位づけ出力リスト206を得る。本明細書では、精選された関連性は、公共のデータベースおよびリポジトリから得られる公知の症例を使用して開発されることが理解されよう。一実施形態では、1組の実体および関連情報はまた、1つまたは複数の情報源から、すなわち、公共のデータベースおよびリポジトリから得られる。
図2から理解できるように、システム102により処理されると、構築されたネットワークは、個々の臨床例から得られる入力表現型を使用して照会され、遺伝子の優先順位づけリストが出力として得られる。本明細書では、一例の実施形態を考慮することにより、本明細書の実施形態について説明してきたことが留意されよう。
【0028】
一実施形態では、システム102は、臨床例に対応する複数の表現型に関して異種ネットワーク上で遺伝子優先順位づけを行ってもよい。
図4を参照して、異種ネットワーク上でのグラフ畳込みに基づく遺伝子優先順序づけのための方法を示す一例の流れ図について詳細に説明する。本主題は、システム102が、グラフ畳込みネットワークを適用することにより異種ネットワークを構築するように実装されることを考慮して説明されるが、システム102は、どんな特定の機械または環境にも限定されなくてもよいと理解してもよい。グラフ畳込みに基づく遺伝子優先順位づけを伴うさまざまな分野のためにシステム102を利用することができる。システム102を、ラップトップコンピュータ、デスクトップコンピュータ、ノートブック、ワークステーション、メインフレームコンピュータ、サーバ、ネットワークサーバなどのような、さまざまなコンピューティングシステムで実装してもよい。
【0029】
次に、
図4を参照して、本開示のいくつかの実施形態による、異種ネットワーク上でのグラフ畳込みに基づく遺伝子優先順位づけのための方法400の流れ図について説明する。コンピュータ実行可能命令の一般的な関連で、方法400について説明する場合がある。一般に、コンピュータ実行可能命令は、特定の機能を遂行する、または特定の抽象データ型を実装する、ルーチン、プログラム、オブジェクト、コンポーネント、データ構造、手順、モジュール、関数などを含むことができる。また、方法400を、通信ネットワークを通して連結された遠隔処理機器により機能が遂行される分散コンピューティング環境で実施してもよい。方法400について説明する順序は、制限と解釈されることを意図するものではなく、任意の数の説明する方法ブロックを、任意の順序で組み合わせて、方法400または代替方法を実装することができる。さらに、方法400を任意の適切なハードウェア、ソフトウェア、ファームウェア、またはこれらの組合せで実装することができる。一実施形態では、流れ図で描写する方法400を、システムにより、たとえば、
図1のシステム102により実行してもよい。一例の実施形態では、システム102を、代表的コンピュータシステムで、たとえば、一例のコンピュータシステム801(
図8)で具体化してもよい。
図1〜
図3を参照して、
図4の方法400について、以下で詳細に説明する。
【0030】
図4を参照すると、図示する実施形態では、方法400は、402から始まり、1つまたは複数の情報源からヒト希少疾患に関する1組の実体を得るステップを含む。1組の実体は、希少疾患、遺伝子、希少疾患に関する表現型、および生物学的経路を含む。本明細書では、1つまたは複数の情報源は、Medical Subject Headings(MeSH)、Orphanet、Human Phenotype Ontology(HPO)、HUGO Gene Nomenclature Committee、およびWiki Pathwaysを含んでもよいが、これらに限定されない。たとえば、1つまたは複数の情報源から疾患実体が得られ、そこでは、疾患実体は、希少疾患名および同義語、希少疾患の説明、表現型、関連性強度、希少疾患の遺伝子、および希少疾患に関連するMeSHマッピングを含むOrphanetレコードから導出される。一例の実施形態では、Human Phenotype Ontology(HPO)が、表現型に関する一次情報源であった。HPO名および同義語は、HPOおよびHPO−UMLSマッピングにより提供されるMeSH相互参照を通して、MeSH(Medical Subject Headings)から得られる追加の同義語を用いて増強される。さらに、Orphanetは、疾患に関する一次情報源として使用される。たとえば、各Orphanetレコードは、希少疾患名、同義語、説明、関連表現型(関連強度を含む)、関連遺伝子だけではなく、MeSHマッピングを含有する。また、Orphanetにより提供される場合はいつも、MeSHマッピングを通して追加の疾患同義語が得られる。さらに、HUGO Gene Nomenclature Committee(HGNC)から遺伝子名が導出され、Wiki(登録商標) Pathwaysから生物学的経路名が抽出される。表現型、希少疾患、遺伝子、および生物学的経路の項目を含有する1組の実体は、最初の異種ネットワーク内のノードとして表現される。主要な項目(実体)は、ノードラベルとして伝播され、一方では、他の項目(実体の同義語)は、上記で説明したような情報源から得られる同義語として表現される。
【0031】
404で、方法は、1組の実体からの実体の各々をノードとして、および複数の実体対の間の関連性を、対ごとの存在論的関連性および精選された関連性を形成する対称重み付きエッジとして使用して、最初の異種ネットワークを構築するステップをさらに含む。最初の異種ネットワークは、たとえば、
図2の機能の流れに示すように、精選された関連性および対ごとの方法論的関連性を使用して構築される。一例の実施形態では、精選された関連性は、1つまたは複数の情報源から得られる複数対のエッジの各々に割り当てられた重みを使用して形成された、疾患−遺伝子関連性、遺伝子−遺伝子関連性、表現型−疾患関連性を含む。上記のノード間の関連性は、(
図3に示すような)非負のエッジ重みを伴う無向エッジにより表現される。一例の実施形態では、表現型−疾患エッジを構築するために、Orphanetから希少疾患データを抽出する。重みは、Orphanetから得られる、規定された頻度修飾子に基づき計算され、割り当てられる。規定された頻度修飾子は、一例の実施形態では、「必須の」、「非常に頻繁な」、および「頻繁な」を含む。本明細書では、規定された頻度修飾子は、疾患に関連して表現型が出現することに基づく。さらに、Orphanetデータはまた、疾患−遺伝子対に関する情報源として使用される。前記例では、疾患−遺伝子対に関するエッジ重みは1に設定される。さらに、Lit−BM−13として当技術分野で公知の高品質な精選された相互作用データセットは、遺伝子−遺伝子関連性に関する情報源として使用される。前記例では、対応するエッジに1の重みを割り当てる。さらに、Wiki Pathwaysは、経路関連性を形成するために使用される。本明細書では、経路内のあらゆる遺伝子は、1のエッジ重みを伴い、対応する経路ノードに連結される。
図1および
図2を参照すると、
図3は、本開示の一実施形態による、HANRD内のさまざまな精選された関連性および方法論的関連性のタイプの描写を示す。
【0032】
406で、方法は、最初の異種ネットワークにグラフ畳込みに基づく関連性スコアリング(GCAS)を適用して、複数の実体対に関する推定関連性を導出するステップを含む。
図3を参照すると、HANRD内のさまざまな精選された関連性、方法論的関連性、および推定関連性が示されている。HANRDエッジは、表現型、疾患、遺伝子、および生物学的経路の間をつないでもよい。
図3に示すように、一例の実施形態では、エッジは、無向性であり、重み付きであり、本明細書では、点線は、各エッジタイプと共に、推定エッジを示す。
図3にはまた、精選された情報と共に、実体ノード間の重み割り当ての枠組みおよび情報源が示されている。
【0033】
また、前述の関連性重みを除いて、方法論的関連性に関して標準的Lin類似度スコアを使用して、HPOから構築された表現型−表現型エッジを計算する。たとえば、2つの表現型、すなわち、p
1およびp
2の間のLin類似度スコアs(p
1,p
2)は、2IC(p’)/(IC(p
1)+IC(p
2))により得られ、式中、p’は、存在論的階層内のp
1およびp
2の最も特有の共通祖先(most specific common ancestor)であり、一方では、IC(p)は、表現型pの情報内容であり、式中、
【0035】
が使用され、f(p)は、コーパス内のpおよびpの子孫の頻度であり、Nは総頻度である。
【0036】
最初の異種ネットワーク内の実体の各々に関連するグラフ畳込みでの畳込みパラメータに基づき、対ごとの関連性スコア行列を決定することにより、推定関連性を導出する。推定関連性を決定する方法は、グラフ畳込みを適用して、精選された関連性を使用して、かつ畳込み動作(C)、減衰係数(θ)、および畳込み深さ(K)を備える畳込みパラメータに基づき、最初の異種ネットワーク内の複数の実体対の各々の近傍ノード間で伝播される情報を決定するステップをさらに含む。さらに、直接リンクのない複数の実体対ごとに、伝播される情報に基づき関連性スコアを決定して、対ごとの関連性スコア行列を得る。その後、対ごとの関連性スコア行列に基づき、複数の実体の各々の間の関連性を推定して、推定関連性を得る。
【0037】
本明細書では、本実施形態のGCASは、グラフ畳込みを使用して、ネットワーク内の実体対間で情報を伝播し、伝播される情報(情報伝播モデル)を使用して、直接リンクのない複数の実体対の間の関連性スコアを決定する。GCASについては、最初の精選されたネットワークは、静的であると仮定され、入力として与えられる。本明細書では、伝播情報は、畳込みパラメータ、すなわち、畳込み動作(C)、減衰係数(θ)、および畳込み深さ(K)に基づき、ネットワーク内の2つのノード間でどれだけの情報が流れることを許可または制限することができるかを指す。以下に示す一例の表現によって、GCASの数学的説明を提供する。
【0038】
たとえば、nのノードから構成される所与のネットワークG上の信号
【0040】
の伝播を、ネットワークG上でのxとフィルタgの畳込みとして見てもよい。A
n×nをGの隣接行列とし、Lを以下のような式により与えられるGの正規化グラフラプラシアンとし、
【0042】
ここで、g
θU
Txは、gおよびxのフーリエ変換の点ごとの乗算を与える。さらに、g
θ*xでのUとg
θU
Txの乗算は、文献で公知の技法の1つから導出されるように、グラフフーリエ変換のフーリエ逆変換を与える。本明細書では、本実施形態の主眼は、G上での所望の信号伝播を達成するフィルタg
θを設計することである。
【0043】
一例の実施形態によれば、計算のオーバヘッドおよび数値的不安定を取り扱うために、当技術分野で利用可能な公知の技法の1つに基づき、g
θのチェビシェフの多項式近似に基づくg
θ*xの一次近似を使用する。次に、この近似に基づき、以下の表現が得られる。
【0045】
前記一例の実施形態では、関連性を推定するために、畳込み動作の近似を使用し、この畳込み操動作をt回連続して遂行することにより、ネットワークノードのt次近傍に伝播する情報を計算する。畳込み動作では、これらのノードを接続する経路がより強固である(すなわち、経路がより広い)場合、より多くの情報が伝播されてもよい。t回連続して畳込みを行った後、ネットワークノードで得られる値は、次式のようなベクトルにより与えられる。
【0047】
θ
iは、i回目の畳込みのためのパラメータである。上記で説明した情報伝播モデルを使用して、すべてのi>2に関してθ
i=θと固定し、ここで、θは、パラメータであり、畳込み深さを制限する別のパラメータKを使用して、以下で描写するように一例の表現
【0049】
によって対ごとの最終的関連性スコア行列Sを計算し、式中、t≧2に関して
【0053】
である。本開示は、行列Sの非対角成分だけを考慮する。したがって、本明細書では、この技法の重要なパラメータは、Kおよびθである。パラメータKは、最初の異種ネットワーク内で最大限でもKリンク離れた実体対に推定関連性を限定する。パラメータθ∈[0,1]は、より長い経路に沿った情報の流れを減衰させる減衰係数またはペナルティ係数として理解することができる。減衰は、経路内にリンクを追加するたびにθを乗算することにより増大する。C
t(I
n)内のパラメータとしてθ
t-2を選ぶことにより、3つ以上のリンクを有する経路に沿った情報の流れに関してだけ、減衰を適用する。グラフ畳込みを使用して推定関連性に到達する方法は、GCAS(グラフ畳込みに基づく関連性スコアリング)と呼ばれる。
【0054】
一例の実施形態では、Kおよびθの値の範囲にわたりグリッド検索を遂行することにより、パラメータKおよびθの値を選択した。Kおよびθの値の組合せごとに、元のネットワークの複数のランダムな部分ネットワーク上でGCASを走らせ/実行し、部分ネットワーク内で検出できない関連性を推定するGCASの性能を分析する。前記一例の実施形態では、実験で決定された最終パラメータ値K=9およびθ=0.25が選ばれ、本明細書では、K回の決められたステップの後、すなわち、経路長9を達成した後、情報伝播を停止する。さらに、本明細書で減衰係数と呼ばれる畳込みパラメータθは、より長い経路を有する(または距離を置いた)ノード間で、情報をほとんど伝播させないためにある。上述のような畳込みパラメータに基づき、これらのパラメータを用いて最初の異種ネットワーク上でGCASを走らせることにより、推定関連性を得る。
【0055】
すでに説明したように、本実施形態の情報伝播モデルでは、スペクトル畳込みの一次近似を使用する。従来の研究では、グラフでの部分的に管理されたノード分類のために、スペクトルグラフ畳込みに基づく畳込みニューラルネットワークであるGCN(Graph Convolutional Network、グラフ畳込みネットワーク)が提案された。GCNニューラルネットワークの各層は、点ごとの非線形性に加えて、スペクトルグラフ畳込みの同じ一次近似に基づく。従来の研究では、引用および知識のネットワークでノード分類作業を行うために、2層GCNが使用された。GCASは、GCASとGCNの両方の取り組み方法がスペクトルグラフ畳込みに基づくという意味で、GCNと類似点を共有する。しかしながら、GCNの交差エントロピに基づく誤差モデルにより、GCASは、個々の対ごとの関連性を推定するのではなくむしろ、グラフ内の十分広範な1組の関連ノードの、残りのノードに対する累積関連性を推定するのに、より適するようになる。さらに、K次近傍との畳込みは、GCNでより深いネットワークを必要とし、それによりパラメータの数が増大することになり、過剰適合につながる場合があることが観察された。一方では、GCASは、選んだフィルタパラメータを用いて(一次近似を使用して)連続して直接スペクトル畳込みを遂行して、ノードのK次近傍に信号を効率的に伝播する。これにより、より大きなKの値に関して各単一ノードからそのK次近傍への長距離関連性を効率的に見積もることができるようになる。
【0056】
408で、方法は、最初の異種ネットワークに推定関連性を追加することにより、希少疾患のための異種関連性ネットワーク(HANRD)を作成するステップを含む。次いで、精選された関連性の最初の異種ネットワークは、構築されているこの最初の異種ネットワーク上でGCASを遂行することにより得られる推定関連性を用いて増強される。これらの推定関連性は、存在論的関連性および精選された関連性と共に異種ネットワークHANRDを形成する(
図2を参照のこと)。構築されたHANRDは、遺伝子優先順位づけステップのために使用される。
【0057】
410で、方法は、HANRDで受信されている入力クエリに対して、優先順位づけされた1組の遺伝子を生成するステップを含む。入力疾患クエリは、臨床例に対応する複数の表現型を含む。優先順位づけされた1組の遺伝子は、複数の表現型からの表現型の各々とHANRD内の表現型ごとの関連遺伝子との間の累積関連性スコアをソートすることにより生成される。複数の表現型を含有する1組の入力については、HANRDでの複数の表現型の遺伝子近傍は、入力表現型に関する複数の表現型の累積関連性スコアに基づき順位づけされ、累積スコアは、個々の表現型を伴う関連性スコアの合計により得られる。
【0058】
遺伝子優先順位づけに関して、たとえば臨床例に関して、従来の方法と開示するHANRDを比較して性能を評価する実験結果の一例について、
図5〜
図7を参照して以下で論じる。
検証および結果:
【0059】
本開示およびそれに関連する実施形態は、HANRDを構築して、表現型駆動型希少疾患遺伝子優先順位づけの特有の作業を解決するための方法を提供し、HANRDでは、入力は、臨床例から得られる1組の表現型であり、出力は、潜在的原因遺伝子の順位づけリストである。最近の出版物で報告された、解決された希少疾患臨床例のデータセットを使用する特有の作業に関して、HANRDの適用性を検証した。解決された希少疾患のデータセットは、診断された1つまたは複数の疾患および対応する1つまたは複数の原因遺伝子と共に、症例ごとの臨床表現型の項目のリストを含む。公知の文献から得られる臨床例を使用し、PhenoTipsツールを使用して臨床例の表現型の項目を強制的にHPO符号化した。HPO符号にアクセスできない症例については、HPOブラウザインタフェースを介して逐語的な検索を使用して、臨床表現型の項目ごとに符号を手作業で割り当てた。症例については、PhenoTipsツールにより割り当てられた症例を除いて、各表現型の項目にHPO符号を手作業で割り当てた。さらに、表現型の説明でHPO符号なしと言及された任意の他の疾患の項目を無視した。症例の臨床表現型を表すこれらのHPO IDは、HANRDへの入力クエリの役割を果たした。HPO IDごとにHANRDを照会し、その結果、遺伝子の順位づけリストを得た。すべての入力HPOにわたり反復した後、順位づけられた遺伝子の単一リストを得た。公知の遺伝子がこのリストの中に存在するかを捜して、公知の原因遺伝子の順位を調べた。
【0060】
本実験では、230の解決された症例に関して、HANRDを使用する性能とOrphamizerの性能を比較した。HANRDは、Orphanetデータを使用するので、Phenomizerの代わりにOrphamizerを選んだ。本明細書では、各症例は、臨床例に対応する複数の表現型から構成され、複数の表現型の項目は、HPO IDにより表現され、一方では、対応する出力は、複数の表現型の各々に対する関連遺伝子の順位づけリストであった。さらに、いくつかの入力表現型−表現型対の数の累積頻度分布を、異なる上位kの値に関して考察した。異なる上位kの値について、表現型に関する遺伝子の順位づけリストの上位k以内に原因遺伝子が出現する表現型−遺伝子対のパーセンテージを測定した。
【0061】
本例で比較のために使用した従来の方法は、BiRWアルゴリズムであった。BiRWアルゴリズムは、他の最新のネットワーク推定アルゴリズムよりも性能が優れていることがすでに示されている。新規の関連性を推定するために、本開示およびその実施形態により実験を行って、BiRWおよびGCASの性能を比較した。従来のBiRW実装では、ノードは、遺伝子および疾患表現型を表現し、一方では、エッジは、OMIM(Online Mendelian Inheritance in Man)およびNational Center for Biotechnology Information、National Library of Medicine、タンパク質−タンパク質相互作用(protein−protein interaction、PPI)、および表現型−表現型関連性から得られる表現型−遺伝子関連性である。実験を遂行するために、提案するシステムおよび方法は、表現型および遺伝子ノードだけ、およびそれらを包含する精選された関連性だけから構成される、本明細書ではHANRD
truncと呼ばれるHANRDのインスタンスを構築した。これは、すべての1つまたは複数の中間疾患、およびHANRD内の経路ノードを取り除いて、遺伝子ノードと表現型ノードの間に直接接続を導入することにより行われた。BiRWに関するパラメータに、元の従来の実装と同じ最適値を割り当てた。BiRWは、対応するOMIM IDを使用して、OMIM疾患表現型を入力として必要とする。一方では、GCASは、HPO表現型(HPO ID)を入力として取り上げるように設計された。したがって、BiRW実装を修正して、HPO IDを入力として取り扱った。修正された実装をBiRW
modと呼ぶ。
【0062】
比較のために、本開示のシステムおよび方法は、HANRD
trunc上でGCASとBiRW
modの両方を走らせることにより、10回の交差検証を遂行した。各回で、10%(670)の表現型−遺伝子リンクをHANRD
truncからランダムに取り除いた。HANRDの残っているネットワーク上でGCASとBiRW
modの両方の方法を走らせて、推定関連性を用いてHANRDを増強した。HANRD
truncから取り除かれた表現型−遺伝子関連性を試験データとして使用した。試験表現型ごとに、ROC(Receiver Operating Characteristic、受信者動作特性)曲線のAUC
N(Area Under the Curve、曲線下面積)値を別個に計算した。ネットワーク内のすべての表現型遺伝子近傍の間で、表現型に関連する目的遺伝子の順位に基づきROCスコアを導出した。AUC
Nについては、偽陽性の数は、最大限でもNに制限される。1回の中で、平均AUC
N値を計算した。いくつかの既存のネットワークエッジを取り除くことにより、全体性能に影響を及ぼす可能性があり、それにより、より低いAUC値がもたらされるが、それにもかかわらず、これらの値を、2つのアルゴリズム/技法を比較するために使用することができる。
【0063】
本開示はまた、これらの230の現実の症例からなる特有の状況で、GCASとBiRWを比較した。GCASも修正されたBiRW(BiRW
mod)も、230の症例に関してHANRD
trunc上で走らせた。230の症例ごとに、各表現型および1つまたは複数の遺伝子に関する関連性対を構築した。BiRW
modは、入力表現型リストの表現型の項目ごとに遺伝子の別個の順位づけリストを作り出すので、各入力表現型を別個に分析した。前述の比較実験結果を、
図5〜
図7に示すようなグラフの形で示す。
【0064】
図5は、本開示の一実施形態による、上述の10回の交差検証に基づく、GCAS(本開示により提案する方法)とBiRW
modの比較を描写する。より具体的には、
図5は、N=50、100、300、500、1000を用いた平均AUC
N、ならびにGCASおよびBiRW
modの10回の交差検証に関する完全なAUC値を描写する。AUC
N値、およびすべての回にわたり平均した完全なAUC値を、BiRW
modおよびGCASに関して
図5に示す。
図5で観察されるように、プロットは、より大きな上位kに関してGCASがBiRW
modよりも性能がわずかに改善されることを示す。技法BiRWは、遺伝子および表現型だけを伴うネットワーク内のドメイン特有の短距離接続を探求する。一方では、GCASは、ドメイン独立に、長距離接続も短距離接続も探求する。本実施形態によれば、本システムおよびそれに関連する方法では、AUC値は、2つのアルゴリズム(従来公知の方法および本方法)の性能を比較していることを単に示し、任意の1つのアルゴリズムの性能を分離して定量化していることを単に示しているわけではないことがさらに観察される。
【0065】
図6は、GCAS、Phenomizer(Orphanet)、およびGCNの比較を示す。異なる上位kの値について、1組の入力表現型に関する遺伝子の順位づけリストの上位k以内に1つまたは複数の原因遺伝子が出現する症例のパーセンテージをプロットした。疾患ごとにOrphamizer出力を順位づけし、そこでは、遺伝子は、疾患に関連する2つ以上の入力表現型に関するリストの中に出現する可能性がある。そのような症例では、原因遺伝子に最も高い順位を割り当てた。
図6で観察されるように、それぞれ19%および32%を得るOrphamizerと、それぞれほぼ4%および8%を得るGNCを比較したとき、GCASは、上位50の中で症例の31%を超えて、および上位200の中で症例の56%を超えて、1つまたは複数の原因遺伝子を獲得した。
【0066】
図1〜
図4を参照すると、
図7は、本開示の一実施形態による、臨床例から導出した表現型−遺伝子対すべてに関する、GCASとBiRW
modの比較を描写する。より具体的には、
図7は、遺伝子が、その表現型の順位づけリストの上位kの中に出現する表現型−遺伝子対の数の累積分布を描写する。換言すれば、
図7は、順位づけ遺伝子リストの上位k以内に出現した230の臨床例から得られるすべての表現型−遺伝子関連性の累積パーセンテージを描写する。候補の方法は、GCASおよびBiRW
modである。
図1〜
図4を参照すると、
図7は、本開示の一実施形態による、HANRD
truncで非ゼロの関連性スコアとすでに連結された表現型−遺伝子対を上位kの計算から排除した後の分布を描写する。
【0067】
本開示の実施形態は、異種ネットワークHANRDから構成される希少疾患遺伝子優先順位づけのための表現型駆動型取り組み方法だけではなく、対ごとの関連性を推定するためのスペクトルグラフ畳込みアルゴリズムGCASも提供する。上記の本開示で言及したように、推定関連性により補われた存在論的関連性および精選された関連性を使用して、HANRDを構築した。希少疾患臨床例に関する検証結果は、他の最新のツールと比較したとき、性能が改善されたことを示している。
図5〜
図7で観察されるように、希少疾患臨床例に関連する表現型を入力として提示したとき、31%を超える症例に関して上位50以内で、56%を超える症例に関して上位200以内で、原因遺伝子を獲得した。
【0068】
また、
図5〜
図7で観察されるように、GCASは、臨床例に関してより大きな上位kにわたりBiRWよりもよい再現率を示す。GCASおよびBiRWの再現率性能は、小さな上位k(上位50)では類似する。BiRWは、固定したネットワーク構造に依存し、実体間で短距離接続を探求する。その結果、BiRWは、臨床例の小さなサブセットに関して同等の精度(より小さな上位k)を示す。一方では、短距離接続を伴う固定構造だけを探求することにより、大部分の他の症例に関してBiRWではより低い再現率となる。GCASは、短距離接続も長距離接続も探求するので、精度と再現率のよりよい均衡を達成することができる。kを増大させるために、近傍がかなり拡張するので、長距離関連性を計算することにより雑音を受ける。その結果、原因遺伝子は、より大きな上位kの範囲でだけ出現する場合がある。それにもかかわらず、特に、たとえば遺伝子型判定(WESまたはWGS)実験から生じる他の類似のリストと順位づけ遺伝子リスト出力を組み合わせるとき、かなり大きな上位kで良好な再現率が伴うことは、希少疾患臨床例で原因遺伝子を特定するのに依然としてかなり役立つ可能性がある。候補遺伝子は、分離したリスト内でより低い順位を有する可能性があるが、すべての順位づけリストから得られる裏付けと分離したリストを組み合わせることにより、個々のリストのいずれよりもかなり高い品質のリストを作り出すことができ、それにより、1つまたは複数の原因遺伝子を効率的に識別するのに役立つ。
【0069】
さらに、BiRWの取り組み方法は、新規の関連性を推定するために、ネットワーク内の、ドメイン特有の固定した部分構造を、すなわち、遺伝子および表現型だけから構成される円形バイグラフを探索する。一方では、GCASは、本実施形態で説明したように、ドメインに依存しない取り組み方法を使用し、先行する段落で説明したように、短距離接続と長距離接続の両方を探索して、新規の関連性(すなわち、推定関連性)を推定する。その結果、GCASは、他のドメインに適合させるのに、より適している。さらに、既存の取り組み方法は、通常は存在論的関連性を対ごとの存在論的関連性とは別個のものとして見る。しかしながら、HANRDは、同じ異種ネットワークの中に両方のタイプの関連性を含み、その一方で、優れた性能を達成する。
【0070】
本実施形態により、本開示は、対ごとの存在論的関連性と精選された関連性を組み合わせて、単一の異種関連性ネットワークにすることが可能になる。本開示のシステムおよび方法は、最初の存在論的および精選された関連性のネットワーク上で情報伝播を遂行するための情報伝播アルゴリズムGCAS(グラフ畳込みに基づく関連性スコアリング)の開発について説明し、ネットワークの実体間の新規の2値関連性を推定する。これらの推定関連性は、上述の最初のネットワークに追加され、その結果得られる存在論的な精選された推定関連性のネットワークを、希少疾患のための異種関連性ネットワークの代わりにHANRDと呼ぶ。本開示は、HANRDを構築して、表現型駆動型希少疾患遺伝子優先順位づけの特有の問題を解決することができるようにし、HANRDでは、入力は、臨床例から得られる1組の表現型であり、出力は、潜在的原因遺伝子の順位づけリストである。さらに、上述の結果および検証を観察すると、本実施形態が希少疾患での原因遺伝子識別を改善することが推定される。さらに、推定アルゴリズムGCASにより性能が改善されることが示されることにより、本実施形態の場合のように、生物医学的ネットワーク分析のための改善された取り組み方法の1つとして、スペクトルグラフ畳込み、または一般にグラフ信号処理が示唆される。
【0071】
図8は、本開示と矛盾しない実施形態を実装するための代表的コンピュータシステム801の構成図である。コンピュータシステム801を、単体で、またはシステム102の構成要素を組み合わせて実装してもよい(
図1)。本開示に含まれる機器を実装するために、コンピュータシステム801の変形形態を使用してもよい。コンピュータシステム801は、中央処理装置(「CPU」または「ハードウェアプロセッサ」)802を備えてもよい。ハードウェアプロセッサ802は、ユーザまたはシステムが生成したリクエストを実行するためのプログラムコンポーネントを実行するための、少なくとも1つのデータプロセッサを備えてもよい。プロセッサは、統合システム(バス)コントローラ、メモリ管理制御ユニット、浮動小数点ユニット、グラフィックス処理ユニット、デジタル信号処理ユニットなどのような専用処理ユニットを含んでもよい。プロセッサは、AMD社のAthlon(登録商標)、Duron(登録商標)、もしくはOpteron(登録商標)、ARM社のアプリケーションプロセッサ、組込プロセス、もしくはセキュアプロセッサ、IBM社のPowerPC(登録商標)、Intel社のCore、Itanium(登録商標)、Xeon(登録商標)、Celeron(登録商標)、または他の系列のプロセッサなどのようなマイクロプロセッサを含んでもよい。メインフレーム、分散プロセッサ、マルチコア、並列、グリッド、または他のアーキテクチャを使用して、プロセッサ802を実装してもよい。いくつかの実施形態は、特定用途向け集積回路(application−specific integrated circuit、ASIC)、デジタル・シグナル・プロセッサ(digital signal processor、DSP)、フィールド・プログラマブル・ゲート・アレイ(Field Programmable Gate Array、FPGA)などのような組込技術を利用してもよい。
【0072】
プロセッサ802を、入出力(input/output、I/O)インタフェース803を介して1つまたは複数のI/O機器と通信状態で配置してもよい。I/Oインタフェース803は、限定することなく、オーディオ、アナログ、デジタル、モノラル、RCA、ステレオ、IEEE−1394、シリアルバス、ユニバーサル・シリアル・バス(universal serial bus、USB)、赤外線、PS/2、BNC、同軸、コンポーネント、コンポジット、デジタル・ビジュアル・インタフェース(digital visual interface、DVI)、高精度マルチメディアインタフェース(high−definition multimedia interface、HDMI)、RFアンテナ、Sビデオ、VGA、IEEE 802.11 a/b/g/n/x、Bluetooth、セルラ(たとえば、符号分割多重アクセス(code−division multiple access、CDMA)、高速パケットアクセス(high−speed packet access、HSPA+)、GSM(global system for mobile communications)、LTE(long−term evolution)、WiMaxなど)などのような通信プロトコル/通信方法を採用してもよい。
【0073】
コンピュータシステム801は、I/Oインタフェース803を使用して1つまたは複数のI/O機器と通信してもよい。たとえば、入力機器804は、アンテナ、キーボード、マウス、ジョイスティック、(赤外線)遠隔制御、カメラ、カードリーダ、ファックス装置、ドングル、生体測定リーダ、マイクロホン、タッチ画面、タッチパッド、トラックボール、センサ(たとえば、加速度計、光センサ、GPS、ジャイロスコープ、近接センサなど)、スタイラス、スキャナ、記憶装置、トランシーバ、映像機器/映像源、バイザなどであってもよい。
【0074】
出力機器805は、プリンタ、ファックス装置、映像表示装置(たとえば、陰極線管(cathode ray tube、CRT)、液晶表示装置(liquid crystal display、LCD)、発光ダイオード(light−emitting diode、LED)、プラズマなど)、オーディオスピーカ、などであってもよい。いくつかの実施形態では、トランシーバ(Tx/Rx)806を、プロセッサ802と接続して配置してもよい。トランシーバは、さまざまなタイプの無線の伝送または受信を容易にしてもよい。たとえば、トランシーバは、IEEE 802.11 a/b/g/n、Bluetooth、FM、全地球測位システム(global positioning system、GPS)、2G/3G HSDPA/HSUPA通信などを提供するトランシーバチップ(たとえば、Texas Instruments社のWiLink WL1283、Broadcom社のBCM4750IUB8、Infineon Technologies社のX−Gold 618−PMB9800など)に動作可能に接続されたアンテナを含んでもよい。
【0075】
いくつかの実施形態では、プロセッサ802を、ネットワークインタフェース807を介して通信ネットワーク808と通信状態で配置してもよい。ネットワークインタフェース807は、通信ネットワーク808と通信してもよい。ネットワークインタフェースは、限定することなく、直結、イーサネット(たとえば、より対線10/100/1000 Base T)、伝送制御プロトコル/インターネットプロトコル(TCP/IP)、トークンリング、IEEE 802.11 a/b/g/n/xなどを含む接続プロトコルを採用してもよい。通信ネットワーク808は、限定することなく、直接相互接続、ローカル・エリア・ネットワーク(LAN)、広域ネットワーク(WAN)、(たとえば、ワイヤレス・アプリケーション・プロトコルを使用する)無線ネットワーク、インターネットなどを含んでもよい。ネットワークインタフェース807および通信ネットワーク808を使用して、コンピュータシステム801は、機器809および810と通信してもよい。これらの機器は、限定することなく、1つまたは複数のパーソナルコンピュータ、1つまたは複数のサーバ、ファックス装置、プリンタ、スキャナ、携帯電話、スマートホン(たとえば、Apple社のiPhone、Blackberry、Androidに基づく電話機など)などのさまざまな移動体機器、タブレットコンピュータ、電子書籍リーダ(Amazon社のKindle、Nookなど)、ラップトップコンピュータ、ノートブック、ゲーム機(Microsoft社のXbox、任天堂社のDS、ソニー社のプレイステーションなど)などを含んでもよい。いくつかの実施形態では、コンピュータシステム801自体が、これらの機器の1つまたは複数を具体化してもよい。
【0076】
いくつかの実施形態では、プロセッサ802を、記憶インタフェース812を介して1つまたは複数の記憶装置(たとえば、RAM813、ROM814など)と通信状態で配置してもよい。記憶インタフェースは、限定することなく、シリアルATA(serial advanced technology attachment、SATA)、IDE(integrated drive electronics)、IEEE−1394、ユニバーサル・シリアル・バス(USB)、ファイバチャネル、SCSI(small computer systems interface)などのような接続プロトコルを採用する、メモリドライブ、取外し可能ディスクドライブなどを含む記憶装置に接続してもよい。メモリドライブは、ドラム、磁気ディスクドライブ、光磁気ドライブ、光学ドライブ、RAID(redundant array of independent discs)、個体記憶装置、個体ドライブなどをさらに含んでもよい。たとえば、本開示で利用する任意のデータベースを実装するために、記憶装置の変形形態を使用してもよい。
【0077】
記憶装置は、限定することなく、オペレーティングシステム816、ユーザインタフェース817、ユーザ/アプリケーションデータ818(たとえば、本開示で論じた任意のデータ変数またはデータレコード)などを含むプログラムまたはデータベースコンポーネントの集合を記憶してもよい。オペレーティングシステム816は、コンピュータシステム801の資源管理および動作を容易にしてもよい。オペレーティングシステムの例は、限定することなく、Apple社のMacintosh OS X、Unix、Unixに似たシステム配布(たとえば、BSD(Berkeley Software Distribution)、FreeBSD、NetBSD、OpenBSDなど)、Linux配布(たとえば、Red Hat、Ubuntu、Kubuntuなど)、IBM社のOS/2、Microsoft社のWindows(XP、Vista/7/8など)、Apple社のiOS、Google社のAndroid、Blackberry OSなどを含む。ユーザインタフェース817は、テキスト設備またはグラフィカル設備を通して、プログラムコンポーネントの表示、実行、対話、操作、または動作を容易にしてもよい。たとえば、ユーザインタフェースは、コンピュータシステム801に動作可能に接続された表示システム上にカーソル、アイコン、チェックボックス、メニュー、スクローラ、ウィンドウ、ウイジットなどのようなコンピュータ対話インタフェース要素を提供してもよい。限定することなく、Apple社のMacintoshオペレーティングシステムのAqua、IBM社のOS/2、Microsoft社のWindows(たとえば、Aero、Metroなど)、UnixのX−Windows、ウェブ・インタフェース・ライブラリ(たとえば、ActiveX、Java、JavaScript、AJAX、HTML、Adobe社のFlashなど)などを含むグラフィカル・ユーザ・インタフェース(graphical user interface、GUI)を採用してもよい。
【0078】
いくつかの実施形態では、コンピュータシステム801は、本開示で説明するようなデータ、変数、レコードなどのようなユーザ/アプリケーションデータ818を記憶してもよい。そのようなデータベースを、OracleまたはSybaseなどのスケーラブルでセキュアなフォールトトレラント関係データベースとして実装してもよい。あるいは、そのようなデータベースを、アレイ、ハッシュ、連結リスト、構造化テキストファイル(たとえば、XML)、テーブルなどの標準化データ構造を使用して、または(たとえば、ObjectStore、Poet、Zopeなどを使用する)オブジェクト指向データベースとして実装してもよい。そのようなデータベースを、場合によっては、本開示で、上記で論じたさまざまなコンピュータシステムの間で統合しても、分散させてもよい。任意のコンピュータまたはデータベースコンポーネントの構造および動作を、任意の動作の組合せで組み合わせても、統合しても、分散させてもよいことが理解されよう。
【0079】
その上、いくつかの実施形態では、サーバ、メッセージング、および伝送または受信される命令は、クラウド実装で常駐するオペレーティングシステムおよびプログラムコード(すなわち、アプリケーションコード)を含むハードウェアから生じてもよい。さらに、本明細書で提供するシステムおよび方法の1つまたは複数は、クラウドに基づく実装に適している場合があることに留意されたい。たとえば、いくつかの実施形態では、開示する方法で使用するデータの一部またはすべては、任意のクラウド・コンピューティング・プラットフォームから供給されても、そこに記憶されてもよい。
【0080】
記載した説明は、任意の当業者が実施形態を作成し、使用することができるようにする、本明細書の主題について説明している。主題の実施形態の範囲は、特許請求の範囲により規定され、当業者が思いつく他の修正形態を含んでもよい。そのような他の修正形態は、特許請求の範囲の文言と異ならない類似の要素を有する場合、または特許請求の範囲の文言とわずかな差を有する均等の要素を含む場合、特許請求の範囲に入ることが意図される。
【0081】
保護の範囲は、そのようなプログラムに、さらには中にメッセージを有するコンピュータ可読手段に拡張され、そのようなコンピュータ可読記憶手段は、プログラムがサーバもしくは移動体機器、または任意の適切なプログラム可能機器上で走るとき、方法の1つまたは複数のステップを実装するためのプログラムコード手段を含有することを理解されたい。ハードウェア機器は、たとえば、サーバもしくはパーソナルコンピュータなど、またはそれらの任意の組合せのような任意の種類のコンピュータを含む、プログラムすることができる任意の種類の機器とすることができる。機器はまた、たとえば、特定用途向け集積回路(ASIC)、フィールド・プログラマブル・ゲート・アレイ(FPGA)などのようなハードウェア手段、またはASICおよびFPGA、もしくは少なくとも1つのマイクロプロセッサおよび中にソフトウェアモジュールが配置された少なくとも1つのメモリなどのハードウェアとソフトウェアの組合せとすることができる手段を含んでもよい。したがって、手段は、ハードウェア手段とソフトウェア手段の両方を含むことができる。本明細書で説明する方法の実施形態を、ハードウェアおよびソフトウェアの形で実装することができる。機器はまた、ソフトウェア手段を含んでもよい。あるいは、たとえば複数のCPUを使用して、異なるハードウェア機器上に実施形態を実装してもよい。
【0082】
本明細書の実施形態は、ハードウェア要素およびソフトウェア要素を備えることができる。ソフトウェアの形で実装された実施形態は、ファームウェア、常駐ソフトウェア、マイクロコードなどを含むが、それらに限定されない。本明細書で説明するさまざまなモジュールが遂行する機能を、他のモジュールで、または他のモジュールを組み合わせて実装してもよい。本明細書が意図するところでは、コンピュータ使用可能媒体またはコンピュータ可読媒体は、命令実行システム、装置、もしくは機器により使用する、またはそれらと共に使用するためのプログラムを備える、記憶する、伝達する、伝播する、または移送することができる任意の装置とすることができる。
【0083】
例示するステップは、示されている代表的実施形態を説明するために提示され、継続的技術開発により、特定の機能を遂行する手法が変わることを認識されたい。これらの例は、例示のために本明細書に提示され、限定するために提示されているわけではない。さらに、説明の便宜上、機能構成要素の境界について、本明細書で任意に規定してきた。指定された機能およびそれらの関係が適切に遂行される限り、代わりの境界を規定することができる。代替形態(本明細書で説明する実施形態の均等形態、拡張形態、変形形態、偏向形態などを含む)は、本明細書に包含される教示に基づき、1つまたは複数の関連技術分野の当業者に明らかであろう。そのような代替形態は、開示する実施形態の範囲および精神に入る。また、用語「comprising(備える)」、「having(有する)」、「containing(含有する)」、および「including(含む)」、ならびに他の類似の形態は、意味が同等であることが意図され、これらの用語の任意の1つに続く1つまたは複数の項目が、そのような1つまたは複数の項目の網羅的な列挙であることを意味することも、列挙した1つまたは複数の項目だけに限定されることを意味することもないという点で、オープンエンド形式であることが意図される。また、本明細書および添付の特許請求の範囲で使用するとき(本明細書に含まれるとき)、単数形「a」、「an」、および「the」は、前後関係が他の方法で明確に規定しない限り、複数の参照を含むことに留意しなければならない。
【0084】
さらに、本開示と矛盾しない実施形態を実装する際、1つまたは複数のコンピュータ可読記憶媒体を利用してもよい。コンピュータ可読記憶媒体は、プロセッサにより可読の情報またはデータを記憶してもよい、任意のタイプの物理メモリを指す。したがって、コンピュータ可読記憶媒体は、本明細書で説明する実施形態と矛盾しないステップまたはステージを1つまたは複数のプロセッサに遂行させるための命令を含む、1つまたは複数のプロセッサにより実行するための命令を記憶してもよい。用語「コンピュータ可読媒体」は、有形の項目を含み、かつ搬送波および過渡信号を除外する、すなわち、非一時的であることを理解されたい。例には、ランダム・アクセス・メモリ(random access memory、RAM)、読出し専用メモリ(read−only memory、ROM)、揮発性メモリ、不揮発性メモリ、ハードドライブ、CD ROM、DVD、フラッシュドライブ、ディスク、および任意の他の公知の物理的記憶媒体が含まれる。
【0085】
本開示および本例はただ単に代表的であると考えられ、かつ開示する実施形態の真の範囲および精神を伴うことが意図される。