特許第6133789号(P6133789)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ カーネギー メロン ユニバーシティの特許一覧

特許6133789対象物に対する化合物の効果を予測するための機械学習に基づく方法、機械可読媒体及び電子システム
<>
  • 特許6133789-対象物に対する化合物の効果を予測するための機械学習に基づく方法、機械可読媒体及び電子システム 図000010
  • 特許6133789-対象物に対する化合物の効果を予測するための機械学習に基づく方法、機械可読媒体及び電子システム 図000011
  • 特許6133789-対象物に対する化合物の効果を予測するための機械学習に基づく方法、機械可読媒体及び電子システム 図000012
  • 特許6133789-対象物に対する化合物の効果を予測するための機械学習に基づく方法、機械可読媒体及び電子システム 図000013
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6133789
(24)【登録日】2017年4月28日
(45)【発行日】2017年5月24日
(54)【発明の名称】対象物に対する化合物の効果を予測するための機械学習に基づく方法、機械可読媒体及び電子システム
(51)【国際特許分類】
   C40B 30/02 20060101AFI20170515BHJP
【FI】
   C40B30/02
【請求項の数】33
【全頁数】27
(21)【出願番号】特願2013-553655(P2013-553655)
(86)(22)【出願日】2012年2月14日
(65)【公表番号】特表2014-511148(P2014-511148A)
(43)【公表日】2014年5月12日
(86)【国際出願番号】US2012025029
(87)【国際公開番号】WO2012112534
(87)【国際公開日】20120823
【審査請求日】2015年1月19日
(31)【優先権主張番号】61/463,206
(32)【優先日】2011年2月14日
(33)【優先権主張国】US
(31)【優先権主張番号】61/463,589
(32)【優先日】2011年2月18日
(33)【優先権主張国】US
(31)【優先権主張番号】61/463,593
(32)【優先日】2011年2月18日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】504337958
【氏名又は名称】カーネギー メロン ユニバーシティ
(74)【代理人】
【識別番号】100105957
【弁理士】
【氏名又は名称】恩田 誠
(74)【代理人】
【識別番号】100068755
【弁理士】
【氏名又は名称】恩田 博宣
(74)【代理人】
【識別番号】100142907
【弁理士】
【氏名又は名称】本田 淳
(72)【発明者】
【氏名】ナイク、アーマガン ダブリュ.
(72)【発明者】
【氏名】カンガス、ジョシュア ディ.
(72)【発明者】
【氏名】ラングミード、クリストファー ジェイ.
(72)【発明者】
【氏名】マーフィー、ロバート エフ.
【審査官】 関 博文
(56)【参考文献】
【文献】 特表平10−505832(JP,A)
【文献】 米国特許出願公開第2003/0059837(US,A1)
【文献】 特表2005−522765(JP,A)
【文献】 国際公開第2003/087957(WO,A2)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 19/00−19/28
C40B 30/02
G06Q 10/00−99/00
(57)【特許請求の範囲】
【請求項1】
データリポジトリと通信可能なコンピューティングデバイスが有する1つ又は複数の処理デバイスによって実行される方法であって、前記コンピューティングデバイスは、前記1つ又は複数の処理デバイスによって実行可能なデータエンジンを格納したメモリを更に備え、前記1つ又は複数の処理デバイスが、前記データエンジンを実行することにより以下の工程:
前記データリポジトリから、対象物と化合物との組合せと関連付けられた複数の実験を示す情報を、前記1つ又は複数の処理デバイスが得る工程であって、1つの実験が1つの対象物と1つの化合物との組合せを含み、前記1つの実験に関する1つの対象物が複数の対象物から選択され、かつ前記1つの実験に関する1つの化合物が複数の化合物から選択される、工程と、
前記複数の実験のうちの少なくとも1つの実験の結果を用いて前記情報を初期化する工程と、
前記複数の実験のうちの少なくとも1つの実験の結果に基づき、前記複数の実験の、少なくとも1つのクラスタを生成する工程であって、前記少なくとも1つのクラスタが、そのクラスタの実験に関連付けられている対象物と化合物との組合せの間の関連性を表す、工程と、
前記少なくとも1つのクラスタに基づいて、前記対象物に対する前記化合物の効果を予測するためのモデルを生成する工程と、
前記1つ又は複数の処理デバイスが、オペレーションを実行することにより機械学習を繰り返して前記モデルを調整する工程と
を行うことを含み、前記オペレーションは、前記1つ又は複数の処理デバイスが前記データエンジンを実行することにより、化合物のうちの特定の1つ及び対象物のうちの特定の1つを含む未実行の1つ又は複数の追加の実験の各々について、
得られた前記モデル及び前記複数の実験に基づいて、前記追加の実験に含まれる化合物のうちの前記特定の1つが、その追加の実験に含まれる対象物のうちの前記特定の1つに与える効果の大きさの予測値、又はその追加の実験の1つ又は複数の結果によって前記モデルを更新することによる前記モデルの精度に対する効果の予測値を生成する工程と、
1つ又は複数の予測値に基づいて、実用の別の1つ又は複数の追加の実験を選択する工程と、
前記別の1つ又は複数の追加の実験を実行する工程と、
前記別の1つ又は複数の追加の実験の実行の1つ又は複数の結果を用いて前記モデルを更新する工程と
行うことを含む、方法。
【請求項2】
予測値は、化合物が対象物に対する効果を有すると予測されるか否かを示す値を含む、請求項1に記載の方法。
【請求項3】
前記効果は、活性効果又は不活性効果を含む、請求項2に記載の方法。
【請求項4】
前記選択する工程は、
前記追加の実験のうちの他の実験の他の効果の他の予測値と比較して上昇した効果の予測値と関連付けられた実験を、前記追加の実験から選択する工程
を含む、請求項3に記載の方法。
【請求項5】
前記1つ又は複数の処理デバイスが、前記データエンジンを実行することにより、事前に定義された状態が検出されるまで、前記予測値を生成する工程、前記選択する工程、前記実行する工程及び前記更新する工程の動作を繰り返すことを更に含む、請求項1に記載の方法。
【請求項6】
前記1つ又は複数の処理デバイスが、前記データエンジンを実行することにより、前記データリポジトリから前記対象物及び前記化合物を示す情報を検索する工程を行うことを更に含み、
前記得る工程は、得られた前記情報から前記1つ又は複数の処理デバイスが実験空間を生成、前記実験空間、前記対象物と前記化合物との前記組合せと関連付けられた前記複数の実験を示す前記情報と共にディスプレイデバイスに表示させる工程を含み
前記更新する工程は、前記実験空間を更新する工程を含む、請求項1に記載の方法。
【請求項7】
前記1つ又は複数の処理デバイスが、前記データエンジンを実行することにより、前記データリポジトリから前記化合物及び前記対象物のうちの1つ又は複数の化合物及び対象物の特徴を示す情報を検索する工程を行うことを更に含み、
前記モデルを生成する工程は、前記特徴に基づいて前記モデルを生成する工程を含む、請求項1に記載の方法。
【請求項8】
前記特徴は、分子量特徴、理論上の等電点特徴、アミノ酸組成特徴、原子組成特徴、吸光係数特徴、不安定指標特徴、脂肪族指数特徴及び疎水性親水性指標(grand average of hydropathicity)特徴のうちの少なくとも1つを含む、請求項7に記載の方法。
【請求項9】
前記モデルを生成する工程は、
前記化合物及び前記対象物の特徴に依存せずに前記モデルを生成する工程
を含む、請求項1に記載の方法。
【請求項10】
化合物は、薬剤、薬剤の組合せ、核酸及び重合体のうちの1つ又は複数を含み、
対象物は、タンパク質、酵素及び核酸のうちの1つ又は複数を含む、
請求項1に記載の方法。
【請求項11】
データリポジトリと通信可能なコンピューティングデバイスが有する1つ又は複数の処理デバイスによって実行される方法であって、前記コンピューティングデバイスは、前記1つ又は複数の処理デバイスによって実行可能なデータエンジンを格納したメモリを更に備え、前記1つ又は複数の処理デバイスが、前記データエンジンを実行することにより以下の工程:
前記データリポジトリから、対象物と化合物との組合せと関連付けられた複数の実験を示す情報を、前記1つ又は複数の処理デバイスが得る工程であって、1つの実験が1つの対象物と1つの化合物との組合せを含み、前記1つの実験に関する1つの対象物が複数の対象物から選択され、かつ前記1つの実験に関する1つの化合物が複数の化合物から選択される、工程と、
前記複数の実験のうちの少なくとも1つの実験の結果を用いて前記情報を初期化する工程と、
初期化する工程に基づいて、前記対象物の特徴を用いて前記対象物に対する特定の1つの化合物の効果を予測するための化合物モデルを生成する工程と、
初期化する工程に基づいて、特定の1つの対象物を用いた実験に含まれる化合物の特徴を用いて前記特定の1つの対象物に対する前記化合物の効果を予測するための対象物モデルを生成する工程と、
前記1つ又は複数の処理デバイスが、オペレーションを実行することにより機械学習を繰り返して前記対象物モデル及び前記化合物モデルを調整する工程と
を行うことを含み、前記オペレーションは、前記1つ又は複数の処理デバイスが前記データエンジンを実行することにより、
a)前記対象物及び前記化合物のうちの1つ又は複数の対象物及び化合物の前記特徴に基づいて、かつb)得られた前記複数の実験から、実行用の1つ又は複数の追加の実験を選択する工程と、
記1つ又は複数の追加の実験を実行する工程と、
前記1つ又は複数の追加の実験の実行の1つ又は複数の結果を用いて前記対象物モデル及び前記化合物モデルを更新する工程と
行うことを含む、方法。
【請求項12】
データリポジトリと通信可能なコンピューティングデバイスが有する1つ又は複数の処理デバイスによって実行可能な命令を格納した1つ又は複数の機械可読媒体であって、前記命令は、前記1つ又は複数の処理デバイスに以下の工程:
前記データリポジトリから、対象物と化合物との組合せと関連付けられた複数の実験を示す情報を得る工程であって、1つの実験が1つの対象物と1つの化合物との組合せを含み、前記1つの実験に関する1つの対象物が複数の対象物から選択され、かつ前記1つの実験に関する1つの化合物が複数の化合物から選択される、工程と、
前記複数の実験のうちの少なくとも1つの実験の結果を用いて前記情報を初期化する工程と、
前記複数の実験のうちの少なくとも1つの実験の結果に基づき、前記複数の実験の、少なくとも1つのクラスタを生成する工程であって、前記少なくとも1つのクラスタが、そのクラスタの実験に関連付けられている対象物と化合物との組合せの間の関連性を表す、工程と、
前記少なくとも1つのクラスタに基づいて、前記対象物に対する前記化合物の効果を予測するためのモデルを生成する工程と、
前記1つ又は複数の処理デバイスが、オペレーションを実行することにより機械学習を繰り返して前記モデルを調整する工程であって、前記オペレーションは、前記1つ又は複数の処理デバイスが、化合物のうちの特定の1つ及び対象物のうちの特定の1つを含む未実行の1つ又は複数の追加の実験の各々について、
得られた前記モデル及び前記複数の実験に基づいて、前記追加の実験に含まれる化合物のうちの前記特定の1つが、その追加の実験に含まれる対象物のうちの前記特定の1つに与える効果の大きさの予測値、又はその追加の実験の1つ又は複数の結果によって前記モデルを更新することによる前記モデルの精度に対する効果の予測値を生成する工程と、
1つ又は複数の予測値に基づいて、実用の別の1つ又は複数の追加の実験を選択する工程と、
前記別の1つ又は複数の追加の実験を実行する工程と、
前記別の1つ又は複数の追加の実験の実行の1つ又は複数の結果を用いて前記モデルを更新する工程と
を含む、前記モデルを調整する工程とを実行させるものである、1つ又は複数の機械可読媒体。
【請求項13】
予測値は、化合物が対象物に対する効果を有すると予測されるか否かを示す値を含む、請求項12に記載の1つ又は複数の機械可読媒体。
【請求項14】
前記効果は、活性効果又は不活性効果を含む、請求項13に記載の1つ又は複数の機械可読媒体。
【請求項15】
前記選択する工程は、
前記追加の実験のうちの他の実験の他の効果の他の予測値と比較して上昇した効果の予測値と関連付けられた実験を、前記追加の実験から選択する工程
を含む、請求項14に記載の1つ又は複数の機械可読媒体。
【請求項16】
前記命令は、前記1つ又は複数の処理デバイスに、
事前に定義された状態が検出されるまで、前記予測値を生成する工程、前記選択する工程、前記実行する工程及び前記更新する工程の動作を繰り返させることを更に含む、請求項12に記載の1つ又は複数の機械可読媒体。
【請求項17】
前記命令は、前記1つ又は複数の処理デバイスに、
前記データリポジトリから前記対象物及び前記化合物を示す情報を検索する工程を実行させることを更に含み、
前記得る工程は、得られた前記情報から前記1つ又は複数の処理デバイスが実験空間を生成、前記実験空間、前記対象物と前記化合物との前記組合せと関連付けられた前記複数の実験を示す前記情報と共にディスプレイデバイスに表示させる工程を含み
前記更新する工程は、前記実験空間を更新する工程を含む、請求項12に記載の1つ又は複数の機械可読媒体。
【請求項18】
前記命令は、前記1つ又は複数の処理デバイスに、
前記データリポジトリから前記化合物及び前記対象物のうちの1つ又は複数の化合物及び対象物の特徴を示す情報を検索する工程を実行させることを更に含み、
前記モデルを生成する工程は、前記特徴に基づいて前記モデルを生成する工程を含む、請求項12に記載の1つ又は複数の機械可読媒体。
【請求項19】
前記特徴は、分子量特徴、理論上の等電点特徴、アミノ酸組成特徴、原子組成特徴、吸光係数特徴、不安定指標特徴、脂肪族指数特徴及び疎水性親水性指標特徴のうちの少なくとも1つを含む、請求項18に記載の1つ又は複数の機械可読媒体。
【請求項20】
前記モデルを生成する工程は、
前記化合物及び前記対象物の特徴に依存せずに前記モデルを生成する工程
を含む、請求項12に記載の1つ又は複数の機械可読媒体。
【請求項21】
化合物は、薬剤、薬剤の組合せ、核酸及び重合体のうちの1つ又は複数を含み、
対象物は、タンパク質、酵素及び核酸のうちの1つ又は複数を含む、
請求項12に記載の1つ又は複数の機械可読媒体。
【請求項22】
データリポジトリと通信可能なコンピューティングデバイスが有する1つ又は複数の処理デバイスによって実行可能な命令を格納した1つ又は複数の機械可読媒体であって、前記命令は、前記1つ又は複数の処理デバイスに以下の工程:
前記データリポジトリから、対象物と化合物との組合せと関連付けられた複数の実験を示す情報を得る工程であって、1つの実験が1つの対象物と1つの化合物との組合せを含み、前記1つの実験に関する1つの対象物が複数の対象物から選択され、かつ前記1つの実験に関する1つの化合物が複数の化合物から選択される、工程と、
前記複数の実験のうちの少なくとも1つの実験の結果を用いて前記情報を初期化する工程と、
初期化する工程に基づいて、前記対象物の特徴を用いて前記対象物に対する特定の1つの化合物の効果を予測するための化合物モデルを生成する工程と、
初期化する工程に基づいて、特定の1つの対象物を用いた実験に含まれる化合物の特徴を用いて前記特定の1つの対象物に対する前記化合物の効果を予測するための対象物モデルを生成する工程と、
前記1つ又は複数の処理デバイスが、オペレーションを実行することにより機械学習を繰り返して前記対象物モデル及び前記化合物モデルを調整する工程であって、前記オペレーションは、前記1つ又は複数の処理デバイスが
a)前記対象物及び前記化合物のうちの1つ又は複数の対象物及び化合物の前記特徴に基づいて、かつb)得られた前記複数の実験から、実行用の1つ又は複数の追加の実験を選択する工程と、
記1つ又は複数の追加の実験を実行する工程と、
前記1つ又は複数の追加の実験の実行の1つ又は複数の結果を用いて前記対象物モデル及び前記化合物モデルを更新する工程と
を含む、前記対象物モデル及び前記化合物モデルを調整する工程とを実行させるものである、1つ又は複数の機械可読媒体。
【請求項23】
データリポジトリと、
前記データリポジトリと通信可能なコンピューティングデバイスであって、1つ又は複数の処理デバイス及び前記1つ又は複数の処理デバイスによって実行可能な命令を格納した1つ又は複数の機械可読媒体を備えるコンピューティングデバイスと
を含む電子システムであって前記命令は、前記1つ又は複数の処理デバイスに以下の工程:
前記データリポジトリから、対象物と化合物との組合せと関連付けられた複数の実験を示す情報を得る工程であって、1つの実験が1つの対象物と1つの化合物との組合せを含み、前記1つの実験に関する1つの対象物が複数の対象物から選択され、かつ前記1つの実験に関する1つの化合物が複数の化合物から選択される、工程と、
前記複数の実験のうちの少なくとも1つの実験の結果を用いて前記情報を初期化する工程と、
前記複数の実験のうちの少なくとも1つの実験の結果に基づき、前記複数の実験の、少なくとも1つのクラスタを生成する工程であって、前記少なくとも1つのクラスタが、そのクラスタの実験に関連付けられている対象物と化合物との組合せの間の関連性を表す、工程と、
前記少なくとも1つのクラスタに基づいて、前記対象物に対する前記化合物の効果を予測するためのモデルを生成する工程と、
前記1つ又は複数の処理デバイスが、オペレーションを実行することにより機械学習を繰り返して前記モデルを調整する工程であって、前記オペレーションは、前記1つ又は複数の処理デバイスが化合物のうちの特定の1つ及び対象物のうちの特定の1つを含む未実行の1つ又は複数の追加の実験の各々について、
得られた前記モデル及び前記複数の実験に基づいて、前記追加の実験に含まれる化合物のうちの前記特定の1つが、その追加の実験に含まれる対象物のうちの前記特定の1つに与える効果の大きさの予測値、又はその追加の実験の1つ又は複数の結果によってモデルを更新することによるモデルの精度に対する効果の予測値を生成する工程と、
1つ又は複数の予測値に基づいて、実用の別の1つ又は複数の追加の実験を選択する工程と、
前記別の1つ又は複数の追加の実験を実行する工程と、
前記別の1つ又は複数の追加の実験の実行の1つ又は複数の結果を用いて前記モデルを更新する工程と
を含む、前記モデルを調整する工程とを実行させるものである、電子システム。
【請求項24】
予測値は、化合物が対象物に対する効果を有すると予測されるか否かを示す値を含む、請求項23に記載の電子システム。
【請求項25】
前記効果は、活性効果又は不活性効果を含む、請求項24に記載の電子システム。
【請求項26】
前記選択する工程は、
前記追加の実験のうちの他の実験の他の効果の他の予測値と比較して上昇した効果の予測値と関連付けられた実験を、前記追加の実験から選択する工程
を含む、請求項25に記載の電子システム。
【請求項27】
前記命令は、前記1つ又は複数の処理デバイスに、
事前に定義された状態が検出されるまで、前記予測値を生成する工程、前記選択する工程、前記実行する工程及び前記更新する工程の動作を繰り返させることを更に含む、請求項23に記載の電子システム。
【請求項28】
前記命令は、前記1つ又は複数の処理デバイスに、
前記データリポジトリから前記対象物及び前記化合物を示す情報を検索する工程を実行させることを更に含み、
前記得る工程は、得られた前記情報から前記1つ又は複数の処理デバイスが実験空間を生成、前記実験空間、前記対象物と前記化合物との前記組合せと関連付けられた前記複数の実験を示す前記情報と共にディスプレイデバイスに表示させる工程を含み
前記更新する工程は、前記実験空間を更新する工程を含む、請求項23に記載の電子システム。
【請求項29】
前記命令は、前記1つ又は複数の処理デバイスに、
前記データリポジトリから前記化合物及び前記対象物のうちの1つ又は複数の化合物及び対象物の特徴を示す情報を検索する工程を実行させることを更に含み、
前記モデルを生成する工程は、前記特徴に基づいて前記モデルを生成する工程を含む、請求項23に記載の電子システム。
【請求項30】
前記特徴は、分子量特徴、理論上の等電点特徴、アミノ酸組成特徴、原子組成特徴、吸光係数特徴、不安定指標特徴、脂肪族指数特徴及び疎水性親水性指標特徴のうちの少なくとも1つを含む、請求項29に記載の電子システム。
【請求項31】
前記モデルを生成する工程は、
前記化合物及び前記対象物の特徴に依存せずに前記モデルを生成する工程
を含む、請求項23に記載の電子システム。
【請求項32】
化合物は、薬剤、薬剤の組合せ、核酸及び重合体のうちの1つ又は複数を含み、
対象物は、タンパク質、酵素及び核酸のうちの1つ又は複数を含む、
請求項23に記載の電子システム。
【請求項33】
データリポジトリと、
前記データリポジトリと通信可能なコンピューティングデバイスであって、1つ又は複数の処理デバイス及び前記1つ又は複数の処理デバイスによって実行可能な命令を格納した1つ又は複数の機械可読媒体を備えるコンピューティングデバイスと
を含む電子システムであって前記命令は、前記1つ又は複数の処理デバイスに以下の工程:
前記データリポジトリから、対象物と化合物との組合せと関連付けられた複数の実験を示す情報を得る工程であって、1つの実験が1つの対象物と1つの化合物との組合せを含み、前記1つの実験に関する1つの対象物が複数の対象物から選択され、かつ前記1つの実験に関する1つの化合物が複数の化合物から選択される、工程と、
前記実験のうちの少なくとも1つの実験の結果を用いて前記情報を初期化する工程と、
初期化する工程に基づいて、前記対象物の特徴を用いて前記対象物に対する特定の1つの化合物の効果を予測するための化合物モデルを生成する工程と、
初期化する工程に基づいて、特定の1つの対象物を用いた実験に含まれる化合物の特徴を用いて前記特定の1つの対象物に対する前記化合物の効果を予測するための対象物モデルを生成する工程と、
前記1つ又は複数の処理デバイスが、オペレーションを実行することにより機械学習を繰り返して前記対象物モデル及び前記化合物モデルを調整する工程であって、前記オペレーションは、前記1つ又は複数の処理デバイスが
a)前記対象物及び前記化合物のうちの1つ又は複数の対象物及び化合物の前記特徴に基づいて、かつb)得られた前記実験から、実行用の1つ又は複数の追加の実験を選択する工程と、
記1つ又は複数の追加の実験を実行する工程と、
前記1つ又は複数の追加の実験の実行の1つ又は複数の結果を用いて前記対象物モデル及び前記化合物モデルを更新する工程と
を含む、前記対象物モデル及び前記化合物モデルを調整する工程とを実行させるものである、電子システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、対象物に対する化合物の効果を予測するための学習に関する。
政府の権利
本明細書に開示される技術は、政府の援助により、国立衛生研究所(National Institutes of Health)の認可番号3R01GM075205−03S2の下で実施されている。政府は本明細書に開示の技術について一定の権利を有し得る。
【背景技術】
【0002】
薬剤開発は、疾患に関与するタンパク質の同定から始まり、臨床試験でテストした後に終わる、長期にわたるプロセスである。タンパク質に対し、薬剤は、疾患と結び付けられるタンパク質の活性の上昇又は低下のいずれかにおいて識別される。
【0003】
一例では、ハイスループットスクリーニング(HTS)は、タンパク質に対する多くの薬剤の効果をテストする一般的な方法である。HTSでは、アッセイを使用して、タンパク質に対する薬剤の効果を検出する。一般に、アッセイは、ある物質の特性を決定する際に使用される別の物質を含む。
【発明の概要】
【0004】
本開示の一態様では、1つ又は複数の処理デバイスによって実行される方法は、対象物と化合物との組合せと関連付けられた実験を示す情報を得る工程と、実験のうちの少なくとも1つの実験の結果を用いて情報を初期化する工程と、初期化する工程に基づいて、対象物に対する化合物の効果を予測するためのモデルを生成する工程と、得られたモデル及び実験に基づいて、実行すべき実験に対する予測値を生成する工程と、予測値に基づいて、実行すべき実験から1つ又は複数の実験を選択する工程と、1つ又は複数の実験を実行する工程と、1つ又は複数の実験の実行の1つ又は複数の結果を用いてモデルを更新する工程とを含む。
【0005】
本開示の実施形態は、以下の特徴のうちの1つ又は複数を含み得る。いくつかの実施形態では、予測値は、化合物が対象物に対する効果を有すると予測されるか否かを示す値を含む。他の実施形態では、効果は、活性効果又は不活性効果を含む。更に、他の実施形態では、選択する工程は、実行すべき実験のうちの他の実験の他の効果の他の予測値と比較して上昇した効果の予測値と関連付けられた実験を、実行すべき実験から選択する工程を含む。
【0006】
いくつかの実施形態では、本方法は、事前に定義された状態が検出されるまで、予測値を生成する工程、選択する工程、実行する工程及び更新する工程の動作を繰り返す工程を含む。他の実施形態では、本方法は、対象物及び化合物を示す情報を検索する工程を含み、得る工程は、得られた情報から実験空間を生成する工程を含み、実験空間は、対象物と化合物との組合せと関連付けられた実験を示す情報の視覚表示を備え、更新する工程は、実験空間を更新する工程を含む。
【0007】
いくつかの実施形態では、本方法は、化合物及び対象物のうちの1つ又は複数の化合物及び対象物の特徴を示す情報を検索する工程を含み、モデルを生成する工程は、特徴に基づいてモデルを生成する工程を含む。他の実施形態では、特徴は、分子量特徴、理論上の等電点特徴、アミノ酸組成特徴、原子組成特徴、吸光係数特徴、不安定指標特徴、脂肪族指数特徴及び疎水性親水性指標(grand average of hydropathicity)特徴のうちの少なくとも1つを含む。
【0008】
いくつかの実施形態では、モデルは、化合物及び対象物の特徴に依存せずにモデルを生成する工程を含む。他の実施形態では、化合物は、薬剤、薬剤の組合せ、核酸及び重合体のうちの1つ又は複数を含み、対象物は、タンパク質、酵素及び核酸のうちの1つ又は複数を含む。
【0009】
本開示の更に別の態様では、1つ又は複数の処理デバイスによって実行される方法は、対象物と化合物との組合せと関連付けられた実験を示す情報を得る工程と、実験のうちの少なくとも1つの実験の結果を用いて情報を初期化する工程と、初期化する工程に基づいて、対象物に対する化合物の効果を予測するためのモデルを生成する工程と、対象物及び化合物のうちの1つ又は複数の対象物及び化合物の特徴に基づいて、得られた実験から、実行用の1つ又は複数の実験を選択する工程と、選択された1つ又は複数の実験を実行する工程と、1つ又は複数の実験の実行の1つ又は複数の結果を用いてモデルを更新する工程とを含む。
【0010】
本開示の更に別の態様では、1つ又は複数の機械可読媒体は、前述の特徴のうちの1つ又は複数を実行するために、1つ又は複数の処理デバイスによって実行可能な命令を格納するように構成される。
【0011】
本開示の更に別の態様では、電子システムは、1つ又は複数の処理デバイスと、前述の特徴のうちの1つ又は複数を実行するために、1つ又は複数の処理デバイスによって実行可能な命令を格納するように構成された1つ又は複数の機械可読媒体とを含む。
【0012】
前述のすべて又は一部は、1つ又は複数の非一時的な機械可読記憶媒体上に格納され、1つ又は複数の処理デバイス上で実行可能な命令を含むコンピュータプログラム製品として実施することができる。前述のすべて又は一部は、1つ又は複数の処理デバイスと、記述の機能を実施するために実行可能な命令を格納するためのメモリとを含み得る装置、方法又は電子システムとして実施することができる。
【0013】
1つ又は複数の実施形態の詳細については、添付の図面や以下の説明に記載される。他の特徴、目的及び利点は、説明及び図面から、そして、特許請求の範囲から明らかになるであろう。
【図面の簡単な説明】
【0014】
図1】対象物に対する化合物の効果の予測値を生成するためのネットワーク環境の例の図である。
図2】対象物に対する化合物の効果の予測値を生成するためのネットワーク環境のコンポーネントの例を示すブロック図である。
図3】対象物に対する化合物の効果の予測値を生成するための例示的なプロセスを示すフローチャートである。
図4】本明細書に記載される技法の実施に使用することができるコンピュータデバイス及びモバイルコンピュータデバイスの例を示す。
【発明を実施するための形態】
【0015】
様々な図面における同様の参照記号及び記号表示は、同様の要素を示す。
本開示と整合するシステムは、対象物に対する化合物の効果の測定及び/又は予測値の生成を行う。一般に、対象物は、効果を測定することができる物を含む。対象物の種類は、タンパク質、酵素、核酸などを含む。一般に、化合物は、物質を含む。化合物の種類は、薬剤、薬剤の組合せ(例えば、混合薬)、化学物質、重合体、核酸などを含む。
【0016】
一例では、システムは、何千もの対象物及び何百万もの化合物を含む。アクティブな学習技法を使用することで、システムは、すべての対象物に対するすべての化合物の効果の測定値又は予測値を生成するように構成される。
【0017】
図1は、対象物に対する化合物の効果の予測値を生成するためのネットワーク環境100の例の図である。ネットワーク環境100は、ネットワーク102と、データリポジトリ105と、サーバ110とを含む。
【0018】
データリポジトリ105は、ネットワーク102上でサーバ110と通信することができる。ネットワーク環境100は、何千ものデータリポジトリ及びサーバを含み得、それらは図示されていない。サーバ110は、例えば、データエンジン111を含む様々なデータエンジンを含み得る。データエンジン111は単一のコンポーネントとして図1に示されているが、データエンジン111は、1つ又は複数のコンポーネントで存在し得、1つ又は複数のコンポーネントは、分散させて、ネットワーク102によって結合することができる。
【0019】
図1の例では、データエンジン111は、対象物124a〜124n及び化合物122a〜122nを示す情報をデータリポジトリ105から検索する。この例では、データエンジン111は、実験を実行して、対象物124a〜124nのうちの1つ又は複数に対する化合物122a〜122nのうちの1つ又は複数の効果を予測するように構成される。対象物124a〜124n及び化合物122a〜122nを使用することで、データエンジン111は、実験空間118を生成する。一般に、実験空間118は、対象物124a〜124n及び化合物122a〜122nにわたる実験126の集合の視覚表示を含む。この例では、実験126は、黒い境界線を有する白丸として視覚的に表示される。
【0020】
一例では、実験126は、実行済みの実験と、未実行の実験とを含む。一般に、実行済みの実験は、データエンジン111によって実行された実験を含む。未実行の実験は、データエンジン111によって未だ実行されていない実験を含む。
【0021】
実験126が実行されると、データエンジン111は、実験を測定値と関連付けることができる。一般に、測定値は、対象物に対する化合物の効果を示す情報を含む。例えば、測定値は、化合物が対象物の活性を上昇させるか又は低下させるかを示す情報を含み得る。
【0022】
実験からの測定値に基づいて、データエンジン111は、実験に注釈を付けることができる。以下で更に詳細に説明されるように、実験は、丸の色を黒に変えることによって、及び/又は、境界線を点線に変えることによって、注釈を付けることができる。
【0023】
一例では、データエンジン111は、データリポジトリ105から実験結果104を検索する。この例では、実験結果104は、実体によって以前に実行された実験の結果を示す情報などを含む。例えば、実験結果104は、対象物に対するアッセイでテストされた化合物についての情報を含むPubChemアッセイデータを含み得る。
【0024】
この例では、実験結果104は、対象物124dに対する化合物122bの結果、対象物124a〜124bに対する化合物122dの結果、対象物124cに対する化合物122eの結果、対象物124dに対する化合物122gの結果を示す情報を含む。結果は、活性結果、不活性結果などを含む。一般に、活性結果は、対象物の活性を上昇させる化合物を示す。一般に、不活性結果は、対象物の活性を低下させる化合物を示す。
【0025】
この例では、データエンジン111は、実験空間118を初期化する際に実験結果104を使用する。データエンジン111は、例えば、活性結果を示す情報及び/又は不活性結果を示す情報などの測定値を用いて実験126のうちの1つ又は複数に注釈を付けることによって、実験空間118を初期化する。この例では、実験は、活性結果に対しては、黒丸で注釈が付けられる。この例では、実験は、不活性結果に対しては、点線で注釈が付けられる。
【0026】
この例では、化合物122dは、例えば、化合物122d及び対象物124aと関連付けられた実験に対して点線で示されるように、対象物124aに対して不活性結果を有する。図1に示されるように、化合物122bは、対象物124dに対して活性結果を有する。化合物122dは、対象物124bに対して活性結果を有する。化合物122eは、対象物124cに対して活性結果を有する。化合物122gは、対象物124dに対して活性結果を有する。
【0027】
別の例では、データエンジン111は、実験結果104を生成することができる。この例では、データエンジン111は、対象物124a〜124nの部分集合及び化合物122a〜122nの部分集合を無作為に選択することによって、実験結果104を生成する。データエンジン111は、部分集合から生成することができる対象物と化合物との各組合せに対して、実験を実行する。この例では、データエンジン111は、マイクロタイタープレートにおいて化合物を対象物に加え、結果を測定する(例えば、対象物の活性を反映するものとして、吸光度、蛍光強度又は発光強度を測定することを含む)ことによって、実験を実行する。測定値(例えば、実験の結果)を使用することで、データエンジン111は、結果を示すデータ(例えば、点線及び/又は黒丸を含む)を用いて実験126のうちの1つ又は複数に注釈を付ける。
【0028】
実験空間118の初期化に続いて、データエンジン111は、実験空間1118で利用可能なデータを表すためのモデルを生成する。モデルを使用することで、データエンジン111は、追加の実験(例えば、追加の化合物と対象物との組)を選択して、例えば、追加の実験の実行前のモデルの精度と比較して、モデルの精度を向上させる。データエンジン111は、追加の実験を実行する。
【0029】
データエンジン111は、追加の実験から生じるデータを収集する。収集されたデータを使用することで、データエンジン111は、実験の測定された結果を示すデータを用いて実験空間118を更新する。以前に説明されたように、データエンジン111は、化合物が対象物の活性を上昇させるか又は低下させるかに基づいて、実験126のうちの1つ又は複数に注釈を付ける。
【0030】
一例では、データエンジン111は、例えばモデルが所望の精度レベルを達成するまで、指定された割当量を使い尽くすまで、またはすべての実験126に注釈が付けられるまで、上記で説明される動作を続行する。一般に、割当量は、例えば、演算能力、帯域幅、時間などを含むリソースの量を指す。
【0031】
一例では、データエンジン111によって生成されたモデルは、アクティブな学習モデルを含む。一般に、アクティブな学習モデルは、新しいデータポイントで所望の出力を得るために、情報源へのクエリを対話形式で行う機械学習モデルを含む。
【0032】
この例では、データエンジン111は、例えば、化合物122a〜122n及び対象物124a〜124nの特徴に依存しないモデル、化合物122a〜122n及び対象物124a〜124nの特徴に依存するモデルなど、様々なタイプのモデルを生成するように構成される。一般に、特徴は、対象物及び/又は化合物の特性を含む、物の特性を含む。
[対象物及び化合物の特徴に依存しないモデル]
一例では、データエンジン111は、実験空間118が初期化されると実験空間118を使用してモデルを生成し、実験空間118の初期化に続いて実行される追加の実験の結果を生成するように構成される。この例では、モデルは、対象物に対する化合物の効果の予測値を生成する予測モデルを含む。モデルの予測値を使用することで、データエンジン111は、例えば、1回分の実験(すなわち実験のバッチ)の実行前のモデルの精度と比較してモデルの精度を更に向上させるために、実験のバッチを選択するよう更に構成される。
[特徴に依存しないモデルの生成]
一例では、データエンジン111は、対象物124a〜124nに対する化合物122a〜122nの効果を予測するためのモデルを生成するように構成される。この例では、モデルは、化合物122a〜122nと対象物124a〜124nとの関係を定義する情報を含む。この例では、データエンジン111は、化合物122a〜122n及び対象物124a〜124nのクラスタを生成することによって、モデルを生成する。
【0033】
データエンジン111は、クラスタリング技法を実行して、化合物122a〜122nと対象物124a〜124nとを一緒に1つ又は複数のクラスタにグループ分けする。この例では、データエンジン111は、実験空間118の初期化の結果に基づいて、クラスタを生成する。例えば、不活性結果と関連付けられた化合物と対象物との組は、1つのクラスタにグループ分けすることができる。活性結果と関連付けられた化合物と対象物との組は、別のクラスタにグループ分けすることができる。クラスタから、データエンジン111は、様々なクラスタにおける化合物と対象物との関連性を学習することによって、モデルを生成する。
【0034】
一例では、データエンジン111は、調査段階を実施し、調査段階では、データエンジン111は、化合物122a〜122n及び対象物124a〜124nの各々についての情報を獲得する。この例では、データエンジン111は、情報が知られていない化合物122a〜122n及び/又は対象物124a〜124nを含む実験を実施することができる。例えば、獲得される情報は、表現型を含み得る。一般に、表現型は、有機体の測定可能な物理的及び/又は生化学的特性を含む。この例では、データエンジン111は、例えば、化合物122a〜122n及び対象物124a〜124nの表現型に基づいて、化合物122a〜122n及び対象物124a〜124nのクラスタを生成する。
【0035】
一例では、データエンジン111は、どのように特定の化合物(例えば、化合物122a)が様々な対象物124a〜124nに摂動を与えるかを決定することができる。同じ態様で摂動を受ける対象物124a〜124nは、関連している可能性がある。摂動の結果に基づいて、データエンジン111は、対象物124a〜124nに対する表現型を識別する。この例では、表現型は、化合物122aがもたらす摂動への対象物124a〜124nによる反応を示す情報を含む。対象物124a〜124nに対する表現型を使用することで、データエンジン111は、同様の表現型を有する対象物124a〜124nのクラスタを生成する。
【0036】
クラスタを使用することで、データエンジン111は、予測モデルを生成する。例えば、予測モデルは、線形回帰モデルを含み得る。線形回帰モデルは、以下の表1に示される方程式に従って調整することができる。
【0037】
【表1】
上記の表1に示されるように、Yobs(*,p)及びXobs(*,p)は、対象物pを用いて実行されたすべての実験からのそれぞれの測定された活性レベルと表現型の行列を含む。Yobs(d,*)及びXobs(d,*)は、化合物dを用いて実行されたすべての実験からのそれぞれの活性スコア又は表現型の行列を含む。
【0038】
データエンジン111は、|β|<sの場合に適合する表現型の集合を選択する。ペナルティsは、線形回帰モデルの交差検定を使用して選択される。モデルが調整された時点で、データエンジン111は、以下の表2に示される方程式を使用して、実験に対する予測値を生成する。
【0039】
【表2】
一例では、データエンジン111は、上記の表2に示される予測値の平均を求めることによって、Y(d,p)に対する予測値を生成する。予測値の平均を生成するための公式は、以下の表3に示される。
【0040】
【表3】
上記の表3に示されるように、Y(d,p)Pは、対象物に対する化合物の効果の予測値を含む。一例では、予測値は、活性スコアを含む。一般に、活性スコアは、対象物に対する化合物の効果の大きさを示す情報を含む。この例では、活性スコアは、−100〜100の値の範囲に及ぶ。−100の値は、生息効果(inhabitation effect)を示す。この例では、阻害効果は、不活性効果の一種を含む。100の値は、活性化効果、例えば、対象物の活性レベルを上昇させる化合物を示す。ゼロの値は、対象物に対する化合物の中立的効果を示す。
【0041】
この例では、実験結果104は、活性スコアを含む。この例では、実験空間118は、実験結果104に含まれる活性スコアを用いて、例えば、実験126のうちの1つ又は複数に活性スコアを入力することによって、初期化される。例えば、実験結果104は、対象物124aに対する化合物122dの活性スコアを示す情報を含む。この例では、データエンジン111は、モデルを実行して、実験結果104に含まれる結果と関連付けされなかった化合物と対象物との組に対する活性スコアを生成する。
[特徴に依存しないモデルに関するバッチ選択]
モデルを使用することで、データエンジン111は、実行用の追加の実験(例えば、測定された結果がない化合物と対象物との組)を選択する。データエンジン111は、化合物と対象物との組を選択する際に様々な技法を実施する。
【0042】
一例では、データエンジン111は、実験のバッチを選択する際にモデルによって生成された予測値(例えば、活性スコア又は表現型ベクトル)を使用する。この例では、データエンジン111は、モデルの実行において測定値に対して最も大きな予測効果(例えば、阻害又は活性化)を有する未実行の実験を選択する貪欲アルゴリズムを実行する。一般に、貪欲アルゴリズムは、アルゴリズムの実行の様々な段階で局所的に最適な選択を行う発見的問題解決に従うアルゴリズムを含む。
【0043】
別の例では、データエンジン111は、実験を選択する際にクラスタ化アルゴリズムを実施する。この例では、データエンジン111は、例えば、実験と関連付けられた予測値に基づいて、実験のクラスタを選択する。クラスタに対し、データエンジン111は、クラスタの中心に更に近接して位置する(例えば、クラスタ内の他の実験の近接性と比較して)事前に定義された数の実験を選択するように構成することができる。
[対象物及び化合物の特徴に依存するモデル]
別の例では、データエンジン111は、例えば、アミノ酸配列を含む対象物124a〜124nの構造を示す情報をデータリポジトリ105から検索する。構造を使用することで、データエンジン111は、例えば、分子量、理論上の等電点、アミノ酸組成、原子組成、吸光係数、不安定指標、脂肪族指数、疎水性親水性指標などを含む、対象物124a〜124nの特徴を計算する。
【0044】
別の例では、データエンジン111は、データリポジトリ105から及び/又は別のシステム(例えば、タンパク質再構成(Protein Recon)ソフトウェアを実行するように構成されたシステム)から対象物124a〜124nの追加の特徴を検索する。これらの特徴は、フラグメントの事前に演算されたライブラリから生成される対象物124a〜124nの密度ベースの電子物性の推定値を含む。更に別の例では、データエンジン111は、データリポジトリ105から、対象物124a〜124におけるモチーフの有無を示す特徴を検索する。更に別の例では、データエンジン111は、例えば、フィンガープリントを含む化合物122a〜122nの特徴を計算する。一般に、フィンガープリントは、特定の構造パターンの有無を示す情報を含む。
【0045】
一例では、特徴の効果は本質的に付加的なものである。この例では、データエンジン111は、例えば実験空間118に基づいて、線形回帰モデルを生成するように構成される。一例では、化合物と対象物との各組は、特徴の特有な集合と関連付けられている。この例では、化合物と対象物との組に対する予測値を生成するため、データエンジン111は、化合物と対象物に対して別々のモデル(例えば、線形回帰モデル)を調整することによって、2つの独立した予測値を生成する。対象物のモデルは、その対象物で測定されたすべての化合物に対する特徴及び活性スコアを使用して調整される。化合物のモデルは、対象物の特徴を使用して、化合物がどの対象物に影響を及ぼすかを予測するために調整される。
【0046】
この例では、データエンジン111は、上記の表1〜3に示される公式に従ってモデルを生成し、調整する。この例では、Yobs(*,p)P及びXobs(*,p)は、対象物pを用いて実行されたすべての実験からのそれぞれの活性スコアと化合物の特徴の行列を含む。更に、Yobs(d,*)D及びXobs(d,*)は、化合物dを用いて実行されたすべての実験からのそれぞれの活性スコアと対象物の特徴の行列を含む。
[特徴に依存するモデルのバッチ選択]
以前に説明されたように、データエンジン111は、例えばモデルの別の実施形態において、実行用の実験を選択する際に予測値を使用する。データエンジン111は、実験を選択する際に多数の技法を使用するように構成され、多数の技法は、例えば、貪欲アルゴリズム、密度ベースのアルゴリズム、不確実性抽出法選択アルゴリズム、多様性選択アルゴリズム、ハイブリッド選択アルゴリズムなどを含み、その各々は、以下で更に詳細に説明される。
【0047】
一例では、データエンジン111は、実験を選択する際に貪欲アルゴリズムを実施する。この例では、データエンジン111は、予測された活性スコアの最大絶対値を有する実験を選択する。いくつかの例では、いかなる情報も、実験の予測には利用可能ではない。実験に対して利用可能なデータから予測が行われない場合は、実験は、ゼロの活性スコアを有すると予測される。この例では、同等の活性スコアを有するすべての実験が順不同に処理される。
【0048】
別の例では、データエンジン111は、密度ベースの選択アルゴリズムを実施する。この例では、実験は、その実験に対する対象物の特徴及び化合物の特徴を結び付けることによって形成される単一のベクトルで表される。一例では、演算効率を高めるため、最大2000個の実行済みの実験及び2000個の未実行の実験が使用された。2000個の未実行の実験の中では、データエンジン111は、密度ベースの抽出方法を使用して選択を行う。
【0049】
更に別の例では、データエンジン111は、不確実性抽出法選択アルゴリズムを実施する。未実行の実験に対し、データエンジン111は、各モデルに対して5分割交差検定を使用して予測値を生成する。この例では、データエンジン111は、例えば、各化合物予測値を用いて各化合物予測値の平均を計算することによって、各実験に対して25個の予測値を計算する。例えば、共通の測定値の不足のため、モデルの計算が不可能な場合は、5つの予測値が使用される。実験は、予測値の最大標準偏差を有するように選択される。
【0050】
更に別の例では、データエンジン111は、多様性選択アルゴリズムを実施する。この例では、実験は、その実験に対する対象物の特徴及び化合物の特徴を結び付けることによって形成される単一のベクトルで表される。実験のランダム集合(例えば、4000個の実験)は、k平均アルゴリズム(kは所望のバッチのサイズである)を使用してクラスタリングされる。クラスタの重心に最も近い実験が実行用に選択される。
【0051】
更に別の例では、データエンジン111は、ハイブリッド選択アルゴリズムを実施する。ハイブリッド選択アルゴリズムでは、データエンジン111は、上記で説明される方法の各々を使用して、実験のうちの特定の部分を選択する。
[ヒットの検出]
別の例では、データエンジン111は、実験空間118でヒットを検出するように構成される。一般に、ヒットは、事前に定義された事象の発生を含む。この例では、化合物122a〜122n及び対象物124a〜124nの各々は、特徴のベクトルと関連付けられる。この例では、ヒットは、特定の特徴と関連付けられ、特定の対象物に対する特定の効果(例えば、活性スコアで示されるような)を有する化合物を含み得る。この例では、データエンジン111は、モデルを使用して、対象物に対する化合物の効果の予測値を生成するように構成することができる。次いで、データエンジン111は、予測値を適切な化合物及び対象物に対する特徴のベクトルと相関させることができる。データエンジン111は、相関させた予測値及び特徴を、事前に定義された様々な事象と比較することができる。比較に基づいて、データエンジン111は、例えば、相関させた予測値及び特徴が事前に定義された事象のうちの1つと一致する際に、ヒットを検出することができる。
[モデルに依存しないバッチ選択]
別の例では、データエンジン111は、モデルの動的生成に依存しない実験を選択するように構成される。この例では、データエンジン111は、化合物122a〜122n及び対象物124a〜124nの特徴に基づいて実験を選択する。
【0052】
この例では、データエンジン111は、実験の様々なバッチに対する基準を示す情報を検索する。基準は、例えば、ネットワーク環境100の管理者が、データエンジン111にアップロードすることができる。別の例では、データエンジン111は、例えば、ネットワーク環境100の外部のシステムなどの別のシステムの基準にアクセスすることができる。
【0053】
基準は、バッチが、異なる種類の化合物の等しい抽出法を含むように指定することができる。一例では、データエンジン111は、化合物122a〜122nの特徴を使用して、同様の特徴を有する化合物122a〜122nを一緒にグループ分けする。この例では、一緒にグループ分けされた化合物122a〜122nの一部は、特定の種類のものと決定される。この例では、基準は、実験の各バッチが、化合物の各種類に対して事前に定義された数の実験を含むように指定することができる。例えば、5つの異なる種類の化合物がある場合。基準は、各バッチが、化合物の各種類に対して2つの実験を含むように指定することができる。この例では、実験のバッチは、10個の実験を含む。
【0054】
別の例では、データエンジン111は、抽出技法の実行に基づいて実験を選択する。この例では、抽出技法は、ハイパーグラフへの近似に基づく。一般に、ハイパーグラフは、グラフの一般化を含み、エッジは、任意の数の頂点を連結することができる。一例では、ハイパーグラフHは、一対のH=(X,E)を含み、ここで、Xはノード又は頂点と呼ばれる要素の集合であり、Eは、ハイパーエッジ又はリンクと呼ばれるXの空でない部分集合の集合である。この例では、Eは、
【0055】
【数1】
の部分集合を含み、P(X)は、Xの冪集合である。
【0056】
更に別の例では、抽出技法は、上記で説明されるアクティブな学習技法のインフィマムを含む。一般に、インフィマムは、半順序集合T(部分集合Sの)を含み、Tの最大要素は、Sのすべての要素以下である。この例では、抽出技法は、実験を発見する際に消費されるリソースの量を減少しながら、実験の発見を増加する。
【0057】
一例では、抽出技法は、例えば、停止規則を含む、統計的仮説検定保証を使用する。一般に、停止規則は、現在の位置及び過去の事象に基づいて、プロセスを続行するか又は停止するかを決定するためのメカニズムを含む。
【0058】
一例では、抽出技法は、実験が効果(例えば、活性効果及び/又は不活性効果)を生成する確率の分布(例えば、離散型の確率分布)を決定する。分布から、データエンジン111は、対象物に対する効果を有する確率が、例えば他の実験の他の確率と比較して高いことと関連付けられた、事前に定義された数の実験を選択する。
【0059】
この例では、分布は、ポアソン分布(Poisson distribution)を含む。一般に、ポアソン分布は、固定間隔の時間及び/又は空間で所定の数の事象が、既知の平均レートで、最後の事象からの経過時間とは無関係に起こる場合に、これらの事象が起こる確率を表す分布を含む。
【0060】
別の例では、データエンジン111は、例えば、化合物122a〜122n及び対象物124a〜124nの特徴に基づいて、実験の分布を生成する。この例では、データエンジン111は、分布から実験を選択して、様々なタイプの実験のバランスの取れた分布を促進する。この例では、分布は、様々な実験の群を含み、例えば、複数の実験は、化合物122a〜122n及び対象物124a〜124nの特徴に基づいて一緒にグループ分けされる。この例では、データエンジン111は、事前に定義された数の実験を各群から選択するように構成される。
【0061】
更に別の例では、データエンジン111は、以下の技法を使用して、実験を選択する。一例では、データエンジン111は、複数の化合物C及び複数の対象物Tの集合に対する実験を選択する。この例では、実験空間118は、組合せの測定値(t,c)∈T×Cを含む。実験空間118上のサンプル経路の集合は、置換群S|T×C|である。効果的な抽出法戦略は、以下の表4の方程式に従って、一様収束する関数列f→fのような計算可能関数fを含む。
【0062】
【表4】
一例では、bは、実験のバッチを示す。可能な処理の最大数(K≪|T×C|)を仮定すると、データエンジン111は、データから構築された合理的な予測因子の質を高めるため、実験空間118から抽出するように構成される。
【0063】
一例では、実験空間118は、C、Tにわたって誘導される特徴空間の自然幾何学を含む。一例では、上記で説明される特徴のうちの1つ又は複数を使用して、Cの変化について説明する。この例では、Tは、上記で説明される特徴のうちの1つ又は複数を含む。
【0064】
一例では、データエンジン111は、例えば、ビンFi,jを生成するフリードマン・ダイアコニスの選択(Freedman−Diaconis’choice)などの何らかの統一的手段によって、C(T)に対する各特徴Fを離散化するように構成される。データエンジン111は、各ビンFi,jに対して、c(t)をビンのF番目の特徴と関連付けるよう更に構成される。この離散化は、c又はtを通じた射影の下、各ビンFi,jに対して、V=C×T及びS⊆V∈Sの有限(ハイパーグラフ)集合システム(V,S)を生成する。有限集合システムによれば、各k≦Kに対し、集合A(|A|=k)は、以下の表5に示される公式に従う、S∈Sの(V,S)に対するε−近似である。
【0065】
【表5】
最小εに対し、ε−近似Aは、以下の表6に示される公式に従う、比例抽出法という意味で、各Sに対して同数のサンプルを含む。
【0066】
【表6】
定数係数までは、いかなるレベルの積集合のサイズも推定することができる。更に、各εに対し、サイズO(ε−2log|s|)[4]のε−近似Aがある。ランクレベル集合の統計(例えば、ポアソン分布に関する仮定を用いると、これは、デルタ法による仮説検定を生成する。
【0067】
一例では、データエンジン111は、上記で説明される技法を使用して(V,S)を構築する。|V|を割り切るための固定バッチサイズBを用いて、データエンジン111は、以下の表7に示されるように、n∈{0‥K}(例えば、K=|V|/B)に対し、以下のε−近似Aを構築する。
【0068】
【表7】
上記の表7に示されるように、数列(A∈Σは、(i)すべてのΣにわたる予測値から離れた潜在的なランクレベル集合の有界変動であり、かつ(ii)データ依存性であるサンプル経路を説明する。更に、スムーズなFi,j共通集合及び回帰関数を用いて、同時に選択されたサンプル経路は、抽出過程で見られるランク上で関数を演算する必要もなく、密度及び不確実性抽出法戦略を実施する。
【0069】
図2は、対象物124a〜124nに対する化合物122a〜122nの効果の予測値を生成するためのネットワーク環境100のコンポーネントの例を示すブロック図である。図2の例では、実験空間118は図示されていない。
【0070】
ネットワーク102は、例えば、ローカルエリアネットワーク(LAN)、広域ネットワーク(WAN)、インターネット、セルラーネットワークを含むか、又は、多数のモバイルコンピューティングデバイス、固定コンピューティングデバイス及びサーバシステムと接続したそれらの組合せを含む、大規模なコンピュータネットワークを含み得る。ネットワークは、数ある中でも、例えば、伝送制御プロトコル/インターネットプロトコル(TCP/IP)、モバイル通信用グローバルシステム(GSM音声通話、ショートメッセージサービス(SMS)、拡張メッセージングサービス(EMS)又はマルチメディアメッセージングサービス(MMS)メッセージング、符号分割多元接続(CDMA)、時分割多元接続(TDMA)、パーソナルデジタルセルラー(PDC)、広帯域符号分割多元接続(WCDMA)、CDMA2000又は汎用パケット無線システム(GPRS)を含む、様々なモード又はプロトコルの下での通信を提供することができる。通信は、無線周波数トランシーバを通じて起こり得る。更に、狭域通信は、例えば、ブルートゥース(BLUETOOTH(登録商標))、ワイファイ(WiFi(登録商標))又は他のそのようなトランシーバを使用することを含めて起こり得る。
【0071】
サーバ110は、データを受信し、1つ又は複数のサービスを実行することが可能な様々なコンピューティングデバイスであってもよく、データリポジトリ105によってアクセスすることができる。一例では、サーバ110は、サーバ、分散型コンピューティングシステム、デスクトップコンピュータ、ラップトップ、携帯電話、ラックマウント式のサーバなどを含み得る。サーバ110は、単一のサーバでも、同じ場所又は異なる場所にあるサーバ群でもよい。データリポジトリ105及びサーバ110は、互いにクライアント/サーバ関係を有するプログラムを実行することができる。図面では、異なるモジュールが示されているが、いくつかの例では、クライアント及びサーバプログラムは、同じデバイス上で実行することができる。
【0072】
サーバ110は、入力/出力(I/O)インタフェース200を通じて、データリポジトリ105からデータを受信することができる。I/Oインタフェース200は、例えば、イーサネット(Ethernet(登録商標))インタフェース、無線ネットワークインタフェース、光ファイバネットワークインタフェース、モデムなどを含む、ネットワーク上でのデータの受信が可能なタイプのインタフェースであり得る。また、サーバ110は、処理デバイス202とメモリ204とを含む。例えば、データバス及びマザーボードを含むバスシステム206を使用して、サーバ110のコンポーネント間でのデータ通信を確立したり、制御したりすることができる。
【0073】
処理デバイス202は、1つ又は複数のマイクロプロセッサを含み得る。一般に、処理デバイス202は、データの受信及び格納並びにネットワーク上での通信が可能な適切なプロセッサ及び/又は論理を含み得る(図示せず)。メモリ204は、ハードドライブ及びランダムアクセスメモリ記憶デバイスを含み得、例えば、ダイナミックランダムアクセスメモリ又は他のタイプの非一時的な機械可読記憶デバイスを含む。図2に示されるように、メモリ204は、処理デバイス202によって実行可能なコンピュータプログラムを格納する。これらのコンピュータプログラムは、データエンジン111を含む。データエンジン111は、コンピュータデバイス(例えば、サーバ110)上で実行中のソフトウェア、ハードウェア又はソフトウェアとハードウェアとの組合せにおいて実施することができる。
【0074】
図3は、対象物124a〜124nに対する化合物122a〜122nの効果の予測値を生成するための例示的なプロセス300を示すフローチャートである。図3では、プロセス300は、サーバ110上で(及び/又はサーバ110上のデータエンジン111によって)実行される。
【0075】
動作中、データエンジン111は、実験空間118を初期化する(310)。一例では、データエンジン111は、実験結果104を使用して実験空間118を初期化する。この例では、データエンジン111は、実験結果104が測定値を含む実験126の部分集合を決定することによって、実験空間118を初期化する。決定された部分集合に対し、データエンジン111は、例えば、化合物が対象物に対して活性効果を有するか又は不活性効果を有するかを特定する情報などの測定値を用いて実験に注釈を付ける。上記で説明されるように、不活性効果に対し、データエンジン111は、点線で実験に注釈を付ける。活性効果に対し、データエンジン111は、黒丸で実験に注釈を付ける。
【0076】
別の例では、データエンジン111は、実験126のうちの1つ又は複数に活性スコアを入力することによって、実験空間118を初期化する(図1では図示せず)。この例では、実験結果104は、例えば、化合物122b及び対象物124dを含む組を含む、様々な化合物と対象物との組について実行された実験に対する活性スコアを含む。
【0077】
更に別の例では、データエンジン111は、実験126のうちの1つ又は複数に注釈を付けることによって、また更に、実験126のうちの1つ又は複数に、実験結果104に含まれる活性スコアを入力することによって、実験空間118を初期化する。この例では、データエンジン111は、活性スコアの閾値にアクセスする。例えば、閾値はゼロであり得る。この例では、閾値を超える活性スコアは、活性効果を示す。閾値未満の活性スコアは、不活性効果を示す。
【0078】
図3の例では、データエンジン111は、対象物に対する化合物の効果を予測するためにモデルを生成する(312)。この例では、モデルは、例えば、実験が実行されていない化合物と対象物との組を含む未実行の実験に対する予測値を生成する。例えば、モデルは、未実行の実験に対する予測活性スコアを生成することができる。
【0079】
上記で説明されるように、データエンジン111は、例えば、上記の表2に示されるように、化合物122a〜122n及び/又は対象物124a〜124nの特徴に依存しないモデルを生成するように構成することができる。別の例では、データエンジン111は、化合物122a〜122n及び/又は対象物124a〜124nの特徴に基づくモデルを生成するように構成することができる。
【0080】
データエンジン111は、例えばモデルに基づいて、実行用の1つ又は複数の未実行の実験を選択する(314)。例えば、データエンジン111は、例えば貪欲アルゴリズム又は他の上記で説明される技法のうちの1つの適用に基づいて、実験を選択する際にモデルによって生成された予測活性スコアを使用するように構成することができる。例えば、データエンジン111は、下記の化合物と対象物との組に対する実験を選択する際にモデルを使用することができる:化合物122bと対象物124b、化合物122dと対象物124f、化合物122iと対象物124e等。
【0081】
データエンジン111は、選択された実験を実行する(316)。選択された実験の実行の間、データエンジン111は、対象物、例えば、実験に含まれる化合物及び対象物に対する化合物の効果を測定する。この例では、データエンジン111は、実験を実行することによって、化合物と対象物との組に対する活性スコアを測定する。実験の結果は、例えば、測定量を対照状態の割合に変換することによって、活性に変換される。別の例では、実験の結果は、画像に存在している複数のパターン又はコンポーネントの各々の部分を含む表現型ベクトルに変換することができる。
【0082】
データエンジン111は、実験の実行の結果(例えば、活性スコア又は表現型ベクトル)を用いて、実験空間118を更新する(318)。一例では、データエンジン111は、実験126のうちの1つ又は複数に、実験中に測定された結果を入力することによって、実験空間118を更新する。この例では、実験空間118への更新は、例えば実験の実行の結果に従ってモデルを更新することによって、モデルの精度を改良するために使用される。
【0083】
データエンジン111は、停止条件が満たされたか否かを検出する(320)。一般に、停止条件は、アクティブな学習が停止される状況を示す情報を含む。以前に説明されたように、データエンジン111は、多数の停止条件の発生を検出するように構成することができ、停止条件は、例えば、モデルが所望の精度レベルを達成したことを示す状態、指定された割当量が使い尽くされたことを示す状態、実験空間118が未実行の実験をそれ以上含まない(例えば、実験空間118のすべての実験が実行された)ことを示す状態などを含む。
【0084】
一例では、データエンジン111は、停止条件の欠如を検出する。この例では、データエンジン111は、例えば、データエンジン111が停止条件の存在を検出するまで、動作312、314、316、318を定期的に繰り返す。この例では、アクティブな学習技法は、動作312、314、316、318の組合せを含む。別の例では、データエンジン111は、停止条件の存在を検出する。この例では、データエンジン111は、アクティブな学習技法の実施を停止する(322)ように構成される。
【0085】
図3の変形形態では、データエンジン111は、モデルに依存しないバッチ選択のために、上記で説明される技法を実施する。この例では、未実行の実験に対する予測値に基づいて実験を選択するのではなく、データエンジン111は、化合物122a〜122n及び対象物124a〜124nの特徴に基づいて実験を選択する。この例では、実験は、モデルの生成前に選択することができる。
【0086】
本明細書に記載される技法を使用することで、システムは、対象物に対する化合物の効果の予測値を生成する。システムは、予測値に対するモデルを生成する。システムは、モデルを生成する際に多数の技法を実施し、技法は、例えば、化合物122a〜122n及び対象物124a〜124nの特徴に依存しないモデルを生成する技法、化合物122a〜122n及び対象物124a〜124nの特徴に基づいてモデルを生成する技法などを含む。それに加えて、システムは、モデルによって生成された予測値に基づいて、モデルの精度を向上させるように実験を選択する。
【0087】
図4は、コンピュータデバイス400及びモバイルコンピュータデバイス450の例を示し、ここに記載される技法を用いて使用することができる。コンピューティングデバイス400は、ラップトップ、デスクトップ、ワークステーション、携帯情報端末、サーバ、ブレードサーバ、メインフレーム及び他の適切なコンピュータなど、デジタルコンピュータの様々な形式を表すことを意図する。コンピューティングデバイス450は、携帯情報端末、携帯電話、スマートフォン及び他の同様のコンピューティングデバイスなど、モバイルデバイスの様々な形式を表すことを意図する。ここに示されるコンポーネント、それらの接続及び関係、並びにそれらの機能は、単なる例示であることを意図し、この文書で説明される及び/又は特許請求される技法の実施形態を限定することは意図しない。
【0088】
コンピューティングデバイス400は、プロセッサ402と、メモリ404と、記憶デバイス406と、メモリ404に接続された高速インタフェース408と、高速拡張ポート410と、低速バス414及び記憶デバイス406に接続された低速インタフェース412とを含む。コンポーネント402、404、406、408、410及び412の各々は、様々なバスを使用して相互接続され、共通のマザーボード上に又は必要に応じて他の方法で実装することができる。プロセッサ402は、コンピューティングデバイス400内の実行用の命令を処理することができ、命令は、高速インタフェース408と結合されたディスプレイ416などの外部の入力/出力デバイス上にGUI用のグラフィカルなデータを表示するために、メモリ404に又は記憶デバイス406上に格納された命令を含む。他の実施形態では、複数のプロセッサ及び/又は複数のバスは、必要に応じて、複数のメモリ及び複数のメモリタイプとともに使用することができる。また、複数のコンピューティングデバイス400は、各デバイスが必要なオペレーションの部分を提供する状態で(例えば、サーババンク、ブレードサーバ群又はマルチプロセッサシステムとして)接続することができる。
【0089】
メモリ404は、コンピューティングデバイス400内のデータを格納する。一実施形態では、メモリ404は、1つ又は複数の揮発性メモリユニットである。別の実施形態では、メモリ404は、1つ又は複数の不揮発性メモリユニットである。また、メモリ404は、磁気又は光ディスクなどのコンピュータ可読媒体の別の形式でもあり得る。
【0090】
記憶デバイス406は、コンピューティングデバイス400に対する大容量記憶の提供が可能である。一実施形態では、記憶デバイス406は、コンピュータ可読媒体であることも、コンピュータ可読媒体を含むことも可能であり、コンピュータ可読媒体は、フロッピーディスクデバイス、ハードディスクデバイス、光ディスクデバイス、テープデバイス、フラッシュメモリ、他の同様なソリッドステートメモリデバイス、又は、デバイスのアレイなどのストレージエリアネットワーク又は他の構成のデバイスを含む。コンピュータプログラム製品は、データキャリアにおいて実体的に具体化することができる。また、コンピュータプログラム製品は、実行の際、上記で説明されるものなどの1つ又は複数の方法を実行する命令を含み得る。データキャリアは、メモリ404、記憶デバイス406、プロセッサ402上のメモリなどのコンピュータ又は機械可読媒体である。
【0091】
高速コントローラ408は、コンピューティングデバイス400に対する帯域幅集約型のオペレーションを管理し、低速コントローラ412は、それよりも低い帯域幅集約型のオペレーションを管理する。このような機能の割り当ては、単なる例示である。一実施形態では、高速コントローラ408は、メモリ404、ディスプレイ416(例えば、グラフィックプロセッサ又はアクセラレータを通じて)及び高速拡張ポート410(様々な拡張カードを受け入れることができる(図示せず))と結合される。その実施形態では、低速コントローラ412は、記憶デバイス406及び低速拡張ポート414と結合される。低速拡張ポートは、様々な通信ポート(例えば、USB、ブルートゥース(Bluetooth(登録商標))、イーサネット(Ethernet(登録商標))、無線イーサネット(Ethernet(登録商標)))を含み得、キーボード、ポインティングデバイス、スキャナ又はネットワークデバイス(スイッチ又はルータなど。例えば、ネットワークアダプタを通じて)などの1つ又は複数の入力/出力デバイスと結合することができる。
【0092】
コンピューティングデバイス400は、図に示されるように、多くの異なる形式で実施することができる。例えば、コンピューティングデバイス400は、標準サーバ420として、又は、そのようなサーバ群で複数回、実施することができる。また、コンピューティングデバイス400は、ラックサーバシステム424の一部として実施することもできる。それに加えて又はその代替として、コンピューティングデバイス400は、ラップトップコンピュータ422などのパーソナルコンピュータにおいて実施することができる。いくつかの例では、コンピューティングデバイス400からのコンポーネントは、デバイス450などのモバイルデバイスにおいて他のコンポーネントと組み合わせることができる(図示せず)。そのようなデバイスの各々は、コンピューティングデバイス400、450のうちの1つ又は複数を含み得、全システムは、互いに通信する複数のコンピューティングデバイス400、450で構成することができる。
【0093】
コンピューティングデバイス450は、数あるコンポーネントの中でも、プロセッサ452と、メモリ464と、ディスプレイ454などの入力/出力デバイスと、通信インタフェース466と、トランシーバ468とを含む。また、デバイス450には、マイクロドライブ又は他のデバイスなどの記憶デバイスを提供して、追加のストレージを提供することができる。コンポーネント450、452、464、454、466及び468の各々は、様々なバスを使用して相互接続され、コンポーネントのいくつかは、共通のマザーボード上に又は必要に応じて他の方法で実装することができる。
【0094】
プロセッサ452は、コンピューティングデバイス450内の命令を実行することができ、命令は、メモリ464に格納された命令を含む。プロセッサは、別々の複数のアナログ及びデジタルプロセッサを含むチップのチップセットとして実施することができる。プロセッサは、例えば、ユーザインタフェース、デバイス450によって実行されるアプリケーション及びデバイス450による無線通信の制御など、デバイス450の他のコンポーネントの調整を実現することができる。
【0095】
プロセッサ452は、ディスプレイ454と結合された制御インタフェース458及びディスプレイインタフェース456を通じてユーザと通信することができる。ディスプレイ454は、例えば、TFT LCD(薄膜トランジスタ液晶ディスプレイ)でも、OLED(有機発光ダイオード)ディスプレイでも、他の適切なディスプレイ技術でもあり得る。ディスプレイインタフェース456は、ディスプレイ454を駆動してグラフィカルな他のデータをユーザに提示するための適切な回路を備え得る。制御インタフェース458は、ユーザからコマンドを受信し、プロセッサ452への提示用にそれらを変換することができる。更に、外部のインタフェース462は、デバイス450と他のデバイスとの近域通信を可能にするため、プロセッサ442と通信することができる。外部のインタフェース462は、例えば、いくつかの実施形態では有線通信を、又は、他の実施形態では無線通信を実現することができ、複数のインタフェースを使用することもできる。
【0096】
メモリ464は、コンピューティングデバイス450内のデータを格納する。メモリ464は、1つ若しくは複数のコンピュータ可読媒体、1つ若しくは複数の揮発性メモリユニット、又は、1つ若しくは複数の不揮発性メモリユニットとして実施することができる。また、拡張メモリ474も提供することができ、例えば、SIMM(シングルインラインメモリモジュール)カードインタフェースを含み得る拡張インタフェース472を通じて、デバイス450に接続することができる。そのような拡張メモリ474は、デバイス450に対して追加の格納スペースを提供することも、デバイス450用のアプリケーション又は他のデータを格納することもできる。具体的には、拡張メモリ474は、上記で説明されるプロセスを行うか又は補うための命令を含み得、安全なデータも含み得る。したがって、例えば、拡張メモリ474は、デバイス450用のセキュリティモジュールとして提供することができ、デバイス450の安全な使用を許可する命令を用いてプログラムすることができる。更に、安全なアプリケーションは、ハッキング不可能な方法でSIMMカードに識別データを置くなど、追加のデータ付きのSIMMカードを介して提供され得る。
【0097】
メモリは、例えば、以下で論じられるように、フラッシュメモリ及び/又はNVRAMメモリを含み得る。一実施形態では、コンピュータプログラム製品は、データキャリアにおいて実体的に具体化される。コンピュータプログラム製品は、実行の際、上記で説明されるものなどの1つ又は複数の方法を実行する命令を含む。データキャリアは、例えば、トランシーバ468又は外部のインタフェース462上で受信することができる、メモリ464、拡張メモリ474及び/又はプロセッサ452上のメモリなどのコンピュータ又は機械可読媒体である。
【0098】
デバイス450は、通信インタフェース466を通じて無線で通信することができ、必要ならば、デジタル信号処理回路を含み得る。通信インタフェース466は、数ある中でも、GSM音声通話、SMS、EMS又はMMSメッセージング、CDMA、TDMA、PDC、WCDMA、CDMA2000又はGPRSなどの様々なモード又はプロトコルの下での通信を実現することができる。そのような通信は、例えば、無線周波数トランシーバ468を通じて起こり得る。それに加えて、狭域通信は、ブルートゥース(Bluetooth)(登録商標)、ワイファイ(WiFi(登録商標))又は他のそのようなトランシーバ(図示せず)などを使用して起こり得る。それに加えて、GPS(全地球測位システム)受信機モジュール470は、追加のナビゲーション及び場所関連の無線データをデバイス450に提供することができ、無線データは、デバイス450上で実行中のアプリケーションで必要に応じて使用することができる。
【0099】
また、デバイス450は、音声コーデック460を使用して可聴音声を通信することもでき、ユーザから音声データを受信し、使用可能なデジタルデータにそれを変換することができる。音声コーデック460は同様に、例えば、デバイス450のハンドセットにおいて、スピーカを通じてなど、ユーザのために可聴音を生成することができる。そのような音は、音声通話からの音を含み得、録音された音(例えば、音声メッセージ、音楽ファイル及び同様のもの)を含み得、デバイス450上で動作中のアプリケーションで生成された音も含み得る。
【0100】
コンピューティングデバイス450は、図に示されるように、多くの異なる形式で実施することができる。例えば、コンピューティングデバイス450は、携帯電話480として実施することができる。また、コンピューティングデバイス450は、スマートフォン482、携帯情報端末又は他の同様のモバイルデバイスの一部として実施することもできる。
【0101】
ここに記載されるシステム及び技法の様々な実施形態は、デジタル電子回路、集積回路、特別に設計されたASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア及び/又はそれらの組合せにおいて実現することができる。これらの様々な実施形態は、格納システム、少なくとも1つの入力デバイス及び少なくとも1つの出力デバイスとのデータ及び命令の送受信を行うように結合された、専用又は汎用であり得る少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステム上で実行可能な及び/又は解釈可能な1つ又は複数のコンピュータプログラムにおける実施形態を含み得る。
【0102】
これらのコンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション又はコードとしても知られる)は、プログラマブルプロセッサ用の機械語命令を含み、高レベルの手続き型の及び/若しくはオブジェクト指向のプログラミング言語で、並びに/又は、アセンブリ/機械語で実施することができる。本明細書で使用される場合、機械可読媒体及びコンピュータ可読媒体という用語は、機械語命令を受信する機械可読媒体を含む、プログラマブルプロセッサに機械語命令及び/又はデータを提供するために使用される、あらゆるコンピュータプログラム製品、装置及び/又はデバイス(例えば、磁気ディスク、光ディスク、メモリ、プログラマブル論理デバイス(PLD))を指す。
【0103】
ユーザとの相互作用を提供するため、ここに記載されるシステム及び技法は、ユーザにデータを表示するためのディスプレイデバイス(例えば、CRT(ブラウン管)又はLCD(液晶ディスプレイ)モニタ)や、それによりユーザがコンピュータに入力を提供することができるキーボード及びポインティングデバイス(例えば、マウス又はトラックボール)を有するコンピュータ上で実施することができる。同様に、他の種のデバイスを使用して、ユーザとの相互作用を提供することもでき、例えば、ユーザに提供されるフィードバックは、いかなる形式の感覚フィードバック(例えば、視覚フィードバック、聴覚フィードバック又は触覚フィードバック)でもよく、ユーザからの入力は、音響、音声又は触覚入力を含む、いかなる形式でも受信することができる。
【0104】
ここに記載されるシステム及び技法は、バックエンドコンポーネント(例えば、データサーバとして)を含むか、ミドルウェアコンポーネント(例えば、アプリケーションサーバ)を含むか、フロントエンドコンポーネント(例えば、それを通じてユーザはここに記載されるシステム及び技法の実施形態と相互作用することができるユーザインタフェース若しくはウェブブラウザを有するクライアントコンピュータ)を含むか、又は、そのようなバックエンド、ミドルウェア若しくはフロントエンドコンポーネントのいかなる組合せも含むコンピューティングシステムにおいて実施することができる。システムのコンポーネントは、デジタルデータ通信のいかなる形式又は媒体(例えば、通信ネットワーク)によっても相互接続することができる。通信ネットワークの例は、ローカルエリアネットワーク(LAN)、広域ネットワーク(WAN)及びインターネットを含む。
【0105】
コンピューティングシステムは、クライアントと、サーバとを含み得る。クライアント及びサーバは、一般に、互いにリモート接続され、通常、通信ネットワークを通じて相互作用する。クライアントとサーバとの関係は、それぞれのコンピュータ上で実行し、互いにクライアント/サーバ関係を有するコンピュータプログラムに基づいて生じる。
【0106】
いくつかの実施形態では、本明細書に記載されるエンジンは、分離することも、組み合わせることも、単一又は組み合わされたエンジンに組み込むこともできる。図に描写されるエンジンは、ここに記載されるシステムを、図に示されるソフトウェアアーキテクチャに限定することは意図しない。
【0107】
多くの実施形態について説明してきた。それにもかかわらず、本明細書に記載されるプロセス及び技法の趣旨及び範囲から逸脱することなく、様々な変更を行うことができることが理解されよう。それに加えて、図に描写される論理の流れは、所望の結果を達成するために、示される特定の順序も連続的順序も必要としない。それに加えて、他の工程を提供することも、説明される流れから工程を排除することもでき、説明されるシステムに他のコンポーネントを追加することも、説明されるシステムから他のコンポーネントを除去することもできる。それに従って、他の実施形態は、特許請求の範囲内にある。
図1
図2
図3
図4