(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-11-19
(54)【発明の名称】サイトメトリ分析方法
(51)【国際特許分類】
G16B 45/00 20190101AFI20241112BHJP
【FI】
G16B45/00
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024531549
(86)(22)【出願日】2022-11-25
(85)【翻訳文提出日】2024-07-22
(86)【国際出願番号】 EP2022083349
(87)【国際公開番号】W WO2023094625
(87)【国際公開日】2023-06-01
(32)【優先日】2021-11-25
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
(71)【出願人】
【識別番号】524197873
【氏名又は名称】メタフォーラ バイオシステムス
(71)【出願人】
【識別番号】524197884
【氏名又は名称】インリア‐インスティチュート ナショナル デ レケルシュ アン インフォマティック エ アン オートマティック
(71)【出願人】
【識別番号】521404048
【氏名又は名称】ユニベルシテ パリ-サクレー
(74)【代理人】
【識別番号】100114775
【氏名又は名称】高岡 亮一
(74)【代理人】
【識別番号】100121511
【氏名又は名称】小田 直
(74)【代理人】
【識別番号】100202751
【氏名又は名称】岩堀 明代
(74)【代理人】
【識別番号】100208580
【氏名又は名称】三好 玲奈
(74)【代理人】
【識別番号】100191086
【氏名又は名称】高橋 香元
(72)【発明者】
【氏名】グリース,マーク
(72)【発明者】
【氏名】プジョル,ルイ
(72)【発明者】
【氏名】ラバルト,バティスト
(72)【発明者】
【氏名】テールハデス,ロマン
(72)【発明者】
【氏名】チェチョースカ‐クシオ,カミラ
(72)【発明者】
【氏名】ブランチャード,ドミニク
(72)【発明者】
【氏名】プチ,ヴィンセント
(72)【発明者】
【氏名】レンノウ,メラニー
(57)【要約】
本発明は、細胞、細胞由来小胞、無細胞微生物、および/または生体機能化材料から選択される複数の生物学的対象に関連するデータセットを分析するためのデバイスおよびコンピュータ実装方法に関し、前記データセットは各々が生物学的対象に関連するN個のサイトメトリイベントを含み、各サイトメトリイベントは、対応する生物学的対象について測定された少なくとも2つのサイトメトリパラメータによって定義され、その結果、データセットはD次元空間内のN個の点の点群によって表され、前記デバイスおよび方法は、生物学的対象の異なるクラスおよびそれらの相互関係を表す少なくとも階層構造を出力するように構成される。
【選択図】
図1
【特許請求の範囲】
【請求項1】
細胞、細胞起源小胞、無細胞微生物、および/または生体機能化材料から選択される複数の生物学的対象に関連するデータセットを分析するためのコンピュータ実装方法であって、前記データセットが、各々が生物学的対象に関連するN個のサイトメトリイベントを含み、各サイトメトリイベントが前記対応する生物学的対象について測定された少なくとも2つのサイトメトリパラメータによって定義され、その結果、前記データセットがD次元空間内のN個の点の点群によって表され、前記方法が、
-前記点群の各点について、前記点と、前記考慮される点に最も近い前記点群のp個の点からなる隣接点のセットとの間の距離をD乗したものの和に反比例する密度を決定するステップと、
-前記点群をモーダルセグメントにセグメント化するステップであって、各モーダルセグメントが極大密度を局所的に提示するモーダル点を含み、前記点群の前記点が前記モーダル点の前記ベイスンに属し、前記ベイスンの前記点が前記点のq個の最近傍隣接点の密度に対する前記点の密度に基づいて再帰的に識別される、ステップと、
-各モーダルセグメントについて、パーシステンスを決定するステップであって、前記パーシステンスが、
・前記モーダルセグメントに隣接するモーダルセグメントが、前記モーダルセグメントのモーダル点の密度よりも大きい密度を有する点を有さず;2つ以上のモーダルセグメントが0より大きい同じ密度鞍点を共有する場合に隣接するならば、無限値であり、そうでない場合、
・前記モーダルセグメントと前記少なくとも1つの隣接するモーダルセグメントとの間の密度鞍点の深さを表す、
ステップと、
-モーダルセグメントから開始して、
a)前記考慮されるモーダルセグメントとその隣接するモーダルセグメントとの間の階層リンクを識別するために、前記考慮されるモーダルセグメントおよびその隣接するモーダルセグメントのうち、どれが最も高いベイスンに対応するかを決定し、
b)前記考慮されるモーダルセグメントと、前記考慮されるモーダルセグメントとのパーシステンスが所定のパーシステンス閾値以下である前記モーダルセグメントとを融合して、より高いベイスンを有し、前記融合されたモーダルセグメントの前記点の中で極大密度を提示する前記点をモーダル点として有する親モーダルセグメントを定義し、
c)前記親モーダルセグメントからの各新しい反復から開始して動作a)およびb)を反復的に繰り返し、
パーシステンスに基づいて定義された階層構造を決定するステップであって、前記階層構造が複数のレベルを含み、各レベルが複数のクラスへの前記点群のセグメント化を定義し、各クラスが1つ以上のモーダルセグメントのすべての点を含み、複数の生物学的対象のグループを表す、ステップと、
-生物学的対象の異なるクラスおよび前記クラスの相互関係を表す少なくとも前記階層構造を出力するステップと
を含む、方法。
【請求項2】
前記点群をモーダルセグメントにセグメント化する前記ステップが、各点について、最も高い密度を有する点から最も低い密度を有する点に進みながら、
-前記点の前記密度を前記点のq個の最近傍隣接点の密度と比較し、
-前記対応する点の前記密度が前記点のq個の最近傍隣接点のすべての前記密度より大きい場合、前記考慮される点を含むモーダルセグメントを定義し、そうでない場合、
-前記点のq個の最近傍隣接点の中で最も高い密度を有する点を含むモーダルセグメント内に、前記考慮される点を含める
ステップをさらに含む、請求項1に記載の方法。
【請求項3】
前記モーダルセグメントに隣接する1つ以上のモーダルセグメントの存在下で、前記パーシステンスを、前記モーダル点の前記密度と、前記モーダルセグメントと前記少なくとも1つの隣接するモーダルセグメントとの間の前記密度鞍点内の、前記点群内の前記点の前記密度のうちの前記最も高い密度との差として決定する、請求項1に記載の方法。
【請求項4】
少なくとも前記階層構造を出力として提供する前記ステップが、
-少なくとも1つの選択グラフであって、前記選択グラフが前記階層構造内の前記クラスおよび前記クラスのそれぞれの関係のグラフィカル表現であり、前記選択グラフが、少なくとも1つのクラスを、前記グラフィカル表現上で前記対応するクラスを指定することによって選択するように適合される、少なくとも1つの選択グラフ、
-各軸がそれぞれのサイトメトリパラメータに関連する少なくとも1つの二次元または三次元の提示グラフであって、前記少なくとも1つの提示グラフが前記選択グラフを使用して前記少なくとも1つの選択されたクラスに属する前記点群の前記点を表示するように構成される、少なくとも1つの二次元または三次元提示グラフ
を表示するステップをさらに含む、請求項1に記載の方法。
【請求項5】
前記グラフィカル表現が、
-各ノードがクラスを表し、前記ノードが、各々が階層の前記ノードによって表される前記クラスのメンバーシップのレベルをそれぞれ表す前記階層内に整列され、ブランチが異なるレベルのクラス間の階層リンクを表す、デンドログラム、または
-各々がレベル(L
k)を表す同心リングを含み、リングが、前記リングが表す前記階層レベルが低いほど大きい直径を有し、あるレベルの前記クラスが前記レベルにおける前記対応するリングの画分である、サンバーストチャート
の形式で提示される、請求項4に記載の方法。
【請求項6】
前記選択グラフが、前記グラフィカル表現上の前記少なくとも1つの選択されたクラスを強調表示するように構成された視覚化手段をさらに含む、請求項4に記載の方法。
【請求項7】
前記グラフィカル表現が、2つ以上の選択されたクラスに属する前記点を区別するように構成された視覚化手段を備える散布図グラフである、請求項4に記載の方法。
【請求項8】
前記少なくとも1つの選択グラフが、前記階層構造における前記クラスおよび前記クラスの配置の動的グラフィカル表現であり、前記動的グラフィカル表現が、下位階層のクラスをグループ化する前記クラスが選択されたときに、前記下位階層のクラスを表示するように構成される、請求項4に記載の方法。
【請求項9】
前記生物学的対象が、
-動物、植物、真菌、原生生物、細菌または古細菌細胞、
-エキソソーム、エクトソーム、微小小胞体、微粒子、プロスタソーム、オンコソーム、マトリックス/石灰化小胞、もしくはアポトーシス小体から選択される細胞起源小胞、
-ウイルス、ウイロイドおよびプリオンから選択される無細胞微生物、ならびに/または
-ナノ粒子(例えば、ナノビーズ、ナノスフェア、またはナノカプセル)、微粒子(例えば、マイクロビーズ、マイクロスフェア、またはマイクロカプセル)、脂質小胞(例えば、単層ベシクル、多層ベシクル、リポプレックス、ポリプレックス、リポポリプレックス、リポソーム、ニオソーム、コクリエート、ビロソーム、免疫刺激複合体(ISCOM(登録商標)))から選択される合成もしくは生物学的材料を含む生体機能化材料であって、前記合成もしくは生物学的材料が、1つ以上のペプチド、タンパク質、抗体、抗体断片、受容体、サイトカイン、ケモカイン、毒素、オリゴヌクレオチド、有色もしくは蛍光分子、アミン、カルボキシル、もしくはヒドロキシル基、生物活性分子(例えば、免疫調節分子、化学的小分子、ペプチド模倣薬、薬物)、ビオチン、アビジン、もしくはストレプトアビジン分子、もしくはそれらの組み合わせにカップリングされているか、もしくはそれらでコーティングされている、生体機能化材料
である、請求項1に記載の方法。
【請求項10】
前記サイトメトリパラメータが、前記生物学的対象のサイズ、前記生物学的対象の密度、粒度、形態、形状、屈折率、膜組成、分子内容物、分子の含有量、および/または分子の発現レベルから選択される、請求項1に記載の方法。
【請求項11】
前記測定されたサイトメトリパラメータの1つが、1つ以上のタンパク質、受容体、マーカーの発現レベル、および/またはDNAもしくはRNAなどの1つ以上の核酸の発現レベルである、請求項10に記載の方法。
【請求項12】
前記サイトメトリデータ21が、フローサイトメトリ(または「蛍光活性化細胞選別(fluorescence activated cell sorting)」を縮めてFACS)、PCR活性化細胞選別(またはPACS)、マイクロスフェア親和性プロテオミクス(MAP)、質量分析、クロマトグラフィー、CYTOF、スペクトルサイトメトリ、質量サイトメトリ、イメージングサイトメトリ、チップ(マイクロアレイ)上での遺伝子発現プロファイリング、配列決定(例えば、scDNA-seqまたはscRNA-seq)、in situハイブリダイゼーションおよび/または顕微鏡法によって得られる、請求項1から11のいずれか一項に記載の方法。
【請求項13】
コンピュータプログラム製品であって、前記プログラムがコンピュータによって実行されると、前記プログラムに請求項1から12のいずれか一項に記載の方法を実装させる命令を含むコンピュータプログラム製品。
【請求項14】
請求項1から12のいずれか一項に記載の方法を実装するための手段を備えるデータ処理デバイス。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、サイトメトリデータ分析の一般的な分野に関する。
【背景技術】
【0002】
タンパク質配列決定、その後のDNA配列決定、および自動シーケンサーの出現は、生物学に革命をもたらした。古典的な記述的および還元論的アプローチ(1つの遺伝子、1つのメッセンジャーRNA、1つのタンパク質)は、生物学的要素(「-オムス(-omes)」)のセットの分析に基づく生物系のより包括的な理解によって成功している。「オミクス」アプローチに関連する基本的な考え方は、その記述範囲において可能な限り制限されない方法論を使用して、生物全体の複雑さを把握することである。
【0003】
そのようなアプローチは、主に、ゲノミクス(遺伝子の研究)、トランスクリプトミクス(遺伝子発現およびその調節の分析)、プロテオミクス(タンパク質の研究)、メタボロミクス(代謝産物の分析)、およびメタボノミクス(in vivo代謝プロファイルの研究)を含む。
【0004】
ゲノミクスは、全ゲノム配列決定に焦点を当てた構造ゲノミクスと、配列決定された遺伝子の機能および発現を決定することを目的とした機能ゲノミクスとの2つの部門に分けられる。機能ゲノミクスでは、多数の遺伝子に並行に技術が適用され、例えば、突然変異体の表現型は、遺伝子ファミリー全体について、または生物全体におけるすべての遺伝子の発現について分析することができる。
【0005】
トランスクリプトミクスは、ゲノムの転写プロセス中に産生されるすべてのメッセンジャーRNAの研究である。トランスクリプトミクスは、これらのすべてのメッセンジャーRNAの定量化に依存しており、所与の条件下での異なる遺伝子の転写速度の相対的な指標を提供する。
【0006】
プロテオミクスは、所与の条件下での細胞小器官、細胞、組織、器官または生物におけるすべてのタンパク質の分析である。プロテオミクスは、細胞培養物、組織または生物学的流体から抽出されたタンパク質、細胞区画におけるタンパク質の局在化、タンパク質の可能な翻訳後修飾、ならびにタンパク質の量を全体的に同定することを目的とする。プロテオミクスは、例えば、時間、環境、発達段階、生理学的および病理学的状態、種の起源などに応じて、それらの発現レベルの変動を定量化することを可能にする。プロテオミクスはまた、タンパク質と他のタンパク質、DNAもしくはRNA、または他の物質との相互作用を研究する。
【0007】
メタボロミクスは、細胞、器官または生物に存在する代謝基質、中間体、生成物、ならびにホルモン、他のシグナル伝達分子、および二次代謝産物などのすべての代謝産物(糖、アミノ酸、脂肪酸など)を研究する。
【0008】
メタボノミクスは、in vivo代謝プロファイルをモニタリングし、薬物の毒性、病理学的プロセス、および遺伝子機能に関する情報を提供することを含む。
【0009】
サイトミクスはサイトーム(cytome)の分析に対応し、サイトームは、所与の時間における細胞の状態および機能を定義またはモデル化することを可能にする形態学的、抗原性および機能的特性を含む細胞成分の集合体である。サイトーム分析は、生物における様々な細胞の構造的および機能的不均一性を記述することを可能にする。
【0010】
前述のアプローチは、in vitroまたはin vivo曝露に対する細胞および/または組織の応答に関する豊富な情報を提供する。前述のアプローチは、新しいバイオマーカー(診断、感受性、予後、曝露、効果について)の同定および特徴付け、新しい機構的知識(作用様式)の生成、または新しい治療標的もしくは候補薬物もしくはワクチンの同定を支援するための予測的有効性もしくは毒性学のための新しいツールの開発に特に有用であり得る。
【0011】
配列決定技術の自動化およびハイスループット技術の開発は、特に特殊な技術プラットフォームの出現によって可能になり、データ生成の工業化および多数の変数の同時分析を可能にした。
【0012】
これは、研究中の生物学的プロセスまたはシステムに関する情報を最大限抽出するために可能な最も有益な方法で処理、分析、視覚化、および解釈されるべき膨大な量のデータをもたらす。
【0013】
生物統計学的観点から、「オミクス」アプローチによって得られたデータは、一緒に分析する必要がある多数の変数に関する。例えば、トランスクリプトーム分析は、数千の遺伝子の発現を同時に研究することを可能にする。
【0014】
したがって、「オミクス」アプローチによって生成された大量のデータを処理、分析、および解釈するための強力な生物統計学ツールおよび生物情報学ツールを有することが望ましい。
【0015】
「オミクス」データを獲得するための多数の技術、例えば、質量分析技術、クロマトグラフィー、配列決定、スペクトルサイトメトリ、質量サイトメトリ、フローサイトメトリ、イメージサイトメトリなどがある。
【0016】
サイトメトリは、懸濁液中の細胞、小胞、または粒子などの「生物学的要素」のセットを含む生物学的試料を分析するための技術のセットを指す。
【0017】
サイトメトリ技術は、細胞、小胞、または粒子の集団の同定および特徴付けのための必須の分析技術である。さらに、サイトミクスが多細胞生物の組織、または単細胞細菌、酵母、藻類などの場合には群集などのより複雑な細胞集塊の単一細胞ビューを提供するので、サイトミクスは、細胞内または細胞外プロセスおよび細胞間相互作用の問題に対処することができる。
【0018】
結果の信頼性および再現性が最も重要であるが、サイトメトリの変動の主な原因はデータ分析にある。
【0019】
従来のサイトメトリデータ分析は、典型的には、各軸上の1つのパラメータを表す、通常は二次元散布図プロットまたは等高線プロットでの関心領域の連続的な手動選択(または「ゲーティング」)を含む。これは、例えば、フローサイトメトリデータを分析する場合に当てはまる。分析は3色または4色の免疫蛍光データでは簡単であるが、検査する細胞マーカーの数が増加するとはるかに複雑になり、人間のオペレータに関連する変動性および再現性の問題が増加する。
【0020】
現在の最先端のサイトメトリ技術は、数十、数百、またはさらには数千のパラメータを測定することができ、したがって、手動分析に時間がかかる複雑な多次元データセットを生成する。したがって、手動セグメント化は、主観的で、面倒で、信頼性がなく、費用がかかる。
【0021】
セグメント化は、ソフトウェアを使用してセグメントを定義して、オペレータの監督なしに自動化することができる。それは人工知能を含むことができるが、サイトメトリイベントをグループ化するための基準はオペレータによってもはや理解できないものになる。代替的に、分析アルゴリズムに依存してもよい。
【0022】
いくつかの比較研究では、手動選択(またはセグメント化もしくは「ゲーティング」)を再現し、珍しい細胞集団を検出する能力、およびそれらの実行時間に基づいて、教師なしクラスタリング方法が評価されている。いくつかの方法は特定の用途に有効であり得るが、いずれもユーザによって日常的に信頼して使用されるすべての要件を満たしていない。
【0023】
さらに、自動化された技術は、手動の変動性、主観性、およびセグメント化バイアスのないサイトメトリ分析を可能にし、したがって、この分野では過去10年間にわたって新しい方法が開発されてきた。しかしながら、多くの自動化された技術は、依然としてオペレータの介入を必要とするアルゴリズムのパラメータ化を必要とし、かなりの量の人間の主観を導入し、したがって再現性がない結果となる。
【0024】
その結果、大学、バイオテクノロジー、製薬業界、または臨床研究の研究者の間での自動分析の採用は遅く、手動のセグメント化はデフォルトの方法および標準のままである。
【0025】
臨床センターが自動分析を使用しない主な理由は、最近、使用されるアルゴリズムの信頼または理解の欠如、およびリソースの欠如として特定されている。
【0026】
手動セグメント化に代わる自動分析技術では、細胞集団の同定結果が専門家の手動分析の同定結果に対応する必要があるだけでなく、アルゴリズムから得られる結果もロバストでなければならず、ロバストであるとは完全に再現可能であることを意味する。
【0027】
フローサイトメトリの具体例では、分析対象の細胞、小胞または粒子を含む生物学的流体が検出器を連続的に通過する。検出器の前を通過する各細胞、小胞または粒子について、サイトメトリパラメータの値を測定することが可能である。
【0028】
一般に、「サイトメトリイベント」は、その粒子のサイトメトリパラメータの測定値を規則的に収集する粒子に関連するベクトルである。
【0029】
従来、サイトメトリイベントは、各粒子について、10を超えるサイトメトリパラメータの値を収集する。粒子についてのサイトメトリパラメータの各値は、「サイトメトリ測定値」と呼ばれる。
【0030】
すべてのサイトメトリ測定値を分析するために、各サイトメトリイベントを表す点を、「提示グラフ」上の一次元、二次元、または三次元の空間に提示することができる。各次元はサイトメトリパラメータに対応する。したがって、サイトメトリイベントを表すグラフは、各サイトメトリイベントについて1つ、2つ、または3つのサイトメトリ測定値を視覚化することを可能にする「射影」である。
【0031】
分析を容易にするために、点群を「セグメント化する」、すなわち、いくつかのサイトメトリパラメータについて同様の値を有するサイトメトリイベントをまとめてグループ化する、または「セグメント」を作成する必要がある。このようにして得られたセグメントの分析、例えば、セグメントのそれぞれの重量の分析は、例えば、生物学的異常または病理学的リスクを検出するために生物学的流体を特徴付けることを可能にする。
【0032】
セグメント化が手動で行われるとき、オペレータは、提示グラフ上にセグメントの輪郭を定義する。
【0033】
手動のセグメント化を教師なしの自動セグメント化に置き換えることは、サイトメトリの分野において依然として大きな問題である。自動セグメント化方法の品質を評価するために、以下の4つの基準が一般的に研究されている。
【0034】
a)手動セグメント化との相関:
【0035】
第1の基準は、性能基準、すなわち、周知のデータセットに関する専門家のコンセンサスから生じる手動セグメント化との強い相関である。専門家は、アルゴリズムによって実施される自動セグメント化において、関心対象の主要な集団を容易に見つけることができなければならない。
【0036】
b)すべての次元の同時考慮:
【0037】
第2の基準は、データのすべての次元、またはそれらの中の次元のセットの同時考慮に関する。実際、手動セグメント化では、セグメントは、せいぜいトリプレット上で、マーカー対上に射影されたデータ上に作成される。この種類の表現に限定することにより、データおよびデータを構成する構造の豊富さおよび複雑さの一部は考慮されない。複数の次元またはすべての次元を同時に考慮することにより、データのすべての複雑さを考慮し、例えば、手動セグメント化によって識別されない集団を発見することが可能になる。
【0038】
c)セグメント化階層:
【0039】
専門家がサイトメトリファイルを手動でセグメント化する場合、専門家は、集団の粒度を上げながら識別することによって再帰的に進行する。生物学自体が細胞を階層的アプローチに従って分類するので、この階層的アプローチは特に興味深い。階層的セグメント化は、専門家のニーズに応じて粒度のレベルを適合させることを可能にする。
【0040】
d)アルゴリズムの説明性およびロバスト性:
【0041】
アルゴリズムの説明可能性は、人工知能の主要なポイントであり、強力な理論的保証を必要とする医療または研究用途ではさらに主要なポイントである。さらに、2つの同一のデータセットに関する結果のロバスト性および再現性もまた、医療および診断用途における大きな課題である。
【0042】
サイトメトリデータを自動的かつ教師なしにセグメント化するための多くの方法が存在する。しかしながら、それらのいずれも、上に概説した4つの基準を完全には満たしておらず、規制された市場での販売が許可された解決策では実装されていない。
【0043】
手動セグメント化(a)との相関に関して、ほとんどの方法は専門家によるセグメント化とある程度のレベルの相関を有するが、データセットの既存の多様性に応じて安定したレベルの性能および一貫性を達成する方法はほとんどない。最良の結果を提供する方法は、一般に、説明可能性要件に適合しない。
【0044】
すべての次元の同時考慮(b)に関して、ほとんどのアルゴリズムはすべての次元を同時に使用する。しかしながら、いくつかの方法はすべての次元を同時に使用せず、例えば、単にデータを所定のマーカー対上に射影する。これらの方法は、専門家が行うことに厳密に一致するという利点を有するが、より関連性の高い集団を発見する際に付加価値をほとんどもたらさない。
【0045】
階層的セグメント化(c)に関して、最新技術におけるアルゴリズムが階層的セグメント化を自然に生成することはほとんどない。実際、一般に統計的学習では、セグメント化方法(クラスタリング)はほとんど階層的ではない。このバイアスは、統計的学習から導出されるサイトメトリセグメント化方法に直接影響する。
【0046】
この問題を克服するために、階層的セグメント化は、一般に、初期セグメント化の後に生成される。このアプローチは、最初に多数のクラスタのためのアルゴリズム(すなわち、グループ化)を依頼し、次いでクラスタに直接階層的セグメント化方法を適用し、もはや点には適用しないことからなる。このアプローチは階層的セグメント化を生成するが、アーチファクト効果を生じさせる傾向がある2つの別個の時間に手順を分離するという欠点を有する。さらに、本方法によって最初に要求されるグループの数に応じた階層構造の安定性が問題となる。
【0047】
最後に、アルゴリズムの説明可能性およびロバスト性(d)に関して、やはり基準を満たす方法はほとんどない。一方では、多くのアルゴリズムは、ランダムな初期化および/またはパラメータに依存する。したがって、通常、結果を確実にするためにこれらのアルゴリズムを数回再実行する必要がある。他方では、アルゴリズムの説明可能性は依然として大きな問題であり、一般に、最も説明可能なアルゴリズムは最も単純であり、多くの場合最も性能が低い。
【0048】
さらに、セグメント化方法にかかわらず、ある射影の分析から生じるセグメントは、他の射影の分析から生じるセグメントと同等でなければならない。例えば、第1の射影において、第1および第2のサイトメトリパラメータの所定の範囲内の値を提示するサイトメトリイベントを単離し、したがって関心セグメントを作成した後、第2の射影において、この関心セグメントのサイトメトリイベントを具体的に表すことが有用である場合がある。
【0049】
分析の効率は、そのような比較を行うオペレータの能力に密接に関連している。
【発明の概要】
【発明が解決しようとする課題】
【0050】
その結果、信頼性が高く再現性のある結果を提供し、実装が容易でロバストであり、操作が人間に理解可能である(必要に応じて人間の介入またはユーザによる検証を可能にし得る)、自動セグメント化を実装するサイトメトリ測定を分析するための方法が必要とされている。
【0051】
本発明は、少なくとも部分的に、この必要性に対処することを目的とする。
【0052】
本発明はまた、「要望に応じて(on demand)」、ユーザがデータ構造の特定の領域におけるセグメント化精度のレベルを取得することを可能にする。
【課題を解決するための手段】
【0053】
したがって、本発明は、細胞、細胞起源小胞、無細胞微生物、および/または生体機能化材料から選択される複数の生物学的対象に関連するデータセットを分析するためのコンピュータ実装方法に関し、データセットは、各々が生物学的対象に関連するN個のサイトメトリイベントを含み、各サイトメトリイベントは対応する生物学的対象について測定された少なくとも2つのサイトメトリパラメータによって定義され、その結果、データセットはD次元空間内のN個の点の点群(X)によって表される。
【0054】
本方法は、
-点群(X)の各点(xi)について、点(xi)と、考慮される点(xi)に最も近い点群(X)のp個の点からなる隣接点のセット(Vp(xi))との間の距離をD乗したものの和に反比例する密度(w(xi))を決定するステップと、
-点群(X)をモーダルセグメント(Mj)にセグメント化するステップであって、各モーダルセグメント(Mj)が極大密度を局所的に提示するモーダル点(mj)を含み、点群の点がモーダル点(mj)のベイスンに属し、ベイスンの点がそれらのq個の最近傍隣接点の密度に対するそれらの密度(w(xi))に基づいて再帰的に識別される、ステップと、
-各モーダルセグメント(Mj)について、パーシステンス(β)を決定するステップであって、パーシステンス(β)が、
・モーダルセグメント(Mj)に隣接するモーダルセグメント(Mt)が、そのモーダル点(mj)の密度よりも大きい密度を有する点を有さず;2つ以上のモーダルセグメントが0より大きい同じ密度鞍点を共有する場合に隣接するならば、無限値であり、そうでない場合、
・モーダルセグメント(Mj)と少なくとも1つの隣接するモーダルセグメント(Mt)との間の密度鞍点の深さを表す、
ステップと、
-モーダルセグメント(Md)から開始して、
・考慮されるモーダルセグメント(Mj)とその隣接するモーダルセグメント(Mt)との間の階層リンクを識別するために、考慮されるモーダルセグメント(Mj)およびその隣接するモーダルセグメント(Mt)のうち、どれが最も高いベイスンに対応するかを決定し、
・考慮されるモーダルセグメント(Mj)と、考慮されるモーダルセグメント(Mj)とのパーシステンスが所定のパーシステンス閾値以下であるモーダルセグメントとを融合して、より高いベイスンを有し、融合されたモーダルセグメントの点の中で極大密度を提示する点をモーダル点(mj)として有する親モーダルセグメントを定義し、
・親モーダルセグメントから新しい反復を開始して動作a)およびb)を反復的に繰り返し、
パーシステンスに基づいて定義された階層構造を決定するステップであって、階層構造(Lk)が複数のレベルを含み、各レベル(Lk)が複数のクラス(Ckj)への点群のセグメント化を定義し、各クラスが1つ以上のモーダルセグメント(Mj)のすべての点を含み、複数の生物学的対象のグループを表す、ステップと、
-生物学的対象の異なるクラスおよびそれらの相互関係を表す少なくとも階層構造を出力するステップと
を含む。
【0055】
以下の説明においてより詳細に分かるように、本方法は、有利には決定論的アプローチを使用する。実際、本方法は、研究中のデータセット全体を表す点群の点間の距離に基づく密度計算を利用する。したがって、点群の所与の点に対して計算された密度は、点の周りの隣接点の濃度を表す。したがって、本明細書に記載の方法は、ランダムメトリックを使用する他の方法とは異なる。したがって、同一またはほぼ同一の点群について、実質的に同一の結果が得られる。したがって、結果の再現性および厳密性が保証される。
【0056】
さらに、「ブラックボックス」としても知られる人工知能モデル、およびランダムな性質の、またはランダムメトリックを使用するステップ(ランダム点選択ステップなど)を有する他の方法とは異なり、本発明の方法で実装されるアルゴリズムは、サイトメトリデータ密度の分析に基づいており、提案された結果の説明可能性およびトレーサビリティを可能にする(すなわち、階層構造内のモーダルセグメント)。これは、透明性の原理が基本的な前提条件である臨床分析に特に適している。
【0057】
最後に、試験は、提案された方法のセグメント化基準がサイトメトリ分析に特に関連することを示した。
【0058】
さらに、本発明の方法は、データに存在するすべての次元(すなわち、複数の生物学的対象に関連するサイトメトリデータのセット)を考慮してセグメント化を実施することを可能にする。有利には、本方法によって出力として提供される階層構造は、生物学的試料における極端な変動性の表現を可能にする。
【0059】
さらに、本方法のステップは、位相解析を使用してデータの階層的およびマルチスケールの態様を複製するように設計されており、これにより、例えば単純な近傍グラフとは異なる表現である、サイトメトリ由来データのネイティブ階層構造の詳細な表現を有利に取得することが可能になる。そのような近傍グラフは、点群の全体的なトポロジを複製することを目的としており、クラスタ間の近接性の概念を組み込んでいるが、階層の概念を組み込んでいない。
【0060】
より具体的には、本明細書に記載の方法は、階層的かつマルチスケールの態様を再現するために計算された密度値を利用する。したがって、最高から最低までランク付けされた複数のレベルを有する階層構造では、高密度点は、例えば、より高いレベルで表され、低密度点は、階層構造内のより低いレベルで表される。点の密度値は、階層構造内、場合によってはこの階層構造の表現内に点を配置するために使用および活用される。したがって、本明細書に記載の方法では、非常に異なる密度を有する2つの点は同じレベルに配置されない。典型的には、珍しい細胞、すなわち低密度の細胞は、階層の低いレベルに位置する。言い換えれば、本方法の出力として提供される階層構造は、クラスからなる異なるレベル間の親子関係を変換する。これにより、これらの異なるレベルおよび各レベルを構成するクラスを探索することが可能になる。
【0061】
本明細書に記載の方法は、点群内の点間の相対密度差を無視することを意図するものではない。反対に、本方法は、これらの相対的な違いを利用して、異なるレベル間の階層的な(すなわち、親子)関係を変換する。したがって、本方法は、点群のグローバルトポロジを再現することを目的とし、例えば、類似性を示す点のクラスタを識別するが、同時に、例えば、密度適応サンプリングによって、点群の点間の相対密度差を消去する他の方法とは区別され、他の方法とは互換性がない。本明細書に記載の方法では、実施される密度計算は階層構造を取得するために使用されるが、サンプリング目的では使用されない。
【0062】
例示として、空間が二次元である場合、点は平面内にある。平面に直交する第3の次元上の密度を表す場合、各モーダルセグメントは山に対応し、そのピークはモーダル点に関連する極大密度であり、2つの隣接する山の間の谷は密度鞍点を含む。鞍点は、同じリッジに属する2つの山の間の最下点の集合である。山のパーシステンスは、0より大きい密度を有する鞍点の底部とこの山のピークとの間の高度の差を測定する。モーダルセグメントのパーシステンスが低い場合、それは一般に、隣接する山から、例えばこの隣接する山の側面にわずかに突出する膨らみによって表すことができる。融合ステップは、例えば、そのような膨らみと、隣接するこの山との融合を可能にする。その結果、本発明の方法は、ノイズによって引き起こされる密度関数の外乱を重要視することを有利に回避する。ノイズは、低いパーシステンス値に関連付けられ、したがって、パーシステンス閾値の合理的な選択のために隣接するモーダルセグメントと融合される。
【0063】
一実施形態では、2つのパラメータpおよびqは、多数のデータに対するヒューリスティック研究によって予め決定される。したがって、有利には、これらのパラメータの選択はオペレータに依存せず、オペレータとは独立した分析のロバスト性を有する方法を保証する。
【0064】
レベルに関連する閾値パーシステンス(すなわち、パーシステンス閾値)は、そのレベルにおけるクラスの数、すなわち表現の粒度を決定する。閾値パーシステンスの値は、階層構造の各レベルに関連するクラスの数を選択することを可能にする。言い換えれば、閾値パーシステンス値の選択は、例えば、一方では研究されたすべての生物学的対象によって形成された一般集団を表し、他方では一般集団内の亜集団を表す、階層構造の異なるレベルを同時に研究または分析することを可能にする。記載された方法は、階層構造の異なる領域に対して異なる粒度を定義することによって、取得された階層構造を探索することを可能にする。この態様では、本明細書に記載の方法は、1つの表現粒度、すなわち均一な粒度のみを選択することができる他の方法とは異なる。したがって、本明細書に記載の方法は、複数の同種の主要なグループを決定することだけを目的とするのではなく、マルチスケールデータ、すなわち同じ表現上で異なるスケールで表されたデータのサブセットを含むデータにアクセスすることを目的とする。マルチスケールデータへのアクセスは、本明細書に記載の方法のように、情報を失うことなくいつでもすべてのデータにアクセスすることを可能にする。これにより、ユーザはいつでも、自身で選択し、潜在的により関心が高く、ユーザに関連する亜集団に対応するデータにアクセスすることができる。
【0065】
一実施形態では、モーダルセグメント(Mj)への点群(X)のセグメント化ステップは、各点(xi)について、最も高い密度を有する点から最も低い密度を有する点に進みながら、
-点(xi)の密度をそのq個の最近傍隣接点(Vq(xi))の密度と比較し、
-考慮される点(xi)の密度がそのq個の最近傍隣接点(Vq(xi))のすべての密度より大きい場合、考慮される点(xi)を含むようにモーダルセグメント(Mj)を定義し、そうでない場合、
-考慮される点(xi)を、そのq個の最近傍隣接点(Vq(xi))の中で最も高い密度を有する点を含むモーダルセグメントに含める
ステップを含む。
【0066】
一実施形態では、モーダルセグメント(Mj)に隣接する1つ以上のモーダルセグメント(Mt)の場合、パーシステンス(β)は、モーダル点(mj)の密度と、モーダルセグメント(Mj)と少なくとも1つの隣接するモーダルセグメント(Mt)との間の密度鞍点内の点の密度のうちの最も高い密度との差として決定される。
【0067】
一実施形態では、本方法は、複数の生物学的対象に関連するデータセットを受信する予備ステップを含む。
【0068】
一実施形態では、生物学的対象は、
-動物、植物、真菌、原生生物、細菌もしくは古細菌起源の細胞、
-エキソソーム、エクトソーム、微小小胞体、微粒子、プロスタソーム、オンコソーム、マトリックス/石灰化小胞、もしくはアポトーシス小体から選択される細胞起源小胞
-ウイルス、ウイロイドおよびプリオンから選択される無細胞微生物、ならびに/または
-ナノ粒子(例えば、ナノビーズ、ナノスフェア、またはナノカプセル)、微粒子(例えば、マイクロビーズ、マイクロスフェア、またはマイクロカプセル)、脂質小胞(例えば、単層ベシクル、多層ベシクル、リポプレックス、ポリプレックス、リポポリプレックス、リポソーム、ニオソーム、コクリエート(cochleate)、ビロソーム(virosome)、免疫刺激複合体(ISCOM(登録商標)))から選択される合成もしくは生物学的材料を含む生体機能化材料であって、合成もしくは生物学的材料が、1つ以上のペプチド、タンパク質、抗体、抗体断片、受容体、サイトカイン、ケモカイン、毒素、オリゴヌクレオチド、有色もしくは蛍光分子、アミン、カルボキシルもしくはヒドロキシル基、生物活性分子(例えば、免疫調節分子、小分子薬物、ペプチド模倣薬、薬物)、ビオチン、アビジンもしくはストレプトアビジン分子、もしくはそれらの組み合わせにカップリングされているか、もしくはそれらでコーティングされている、生体機能化材料
である。
【0069】
一実施形態では、サイトメトリパラメータは、生物学的対象のサイズ、それらの密度、粒度、形態、形状、屈折率、膜組成、分子内容物、分子の含有量、および/または分子の発現レベルから選択される。
【0070】
一実施形態では、測定されたサイトメトリパラメータの1つは、1つ以上のタンパク質、受容体、マーカーの発現レベル、および/またはDNAもしくはRNAなどの1つ以上の核酸の発現レベルである。
【0071】
一実施形態では、サイトメトリデータは、フローサイトメトリ(または「蛍光活性化細胞選別(fluorescence activated cell sorting)」を縮めてFACS)、PCR活性化細胞選別(またはPACS)、マイクロスフェア親和性プロテオミクス(MAP)、質量分析、クロマトグラフィー、CYTOF、スペクトルサイトメトリ、質量サイトメトリ、イメージングサイトメトリ、遺伝子発現マイクロアレイ、例えばDNA(DNA-seqまたは単一細胞(sc)DNA-seq)もしくはRNA(RNA-seqまたは単一細胞(sc)RNA-seq)の配列決定、in situハイブリダイゼーション、および/または顕微鏡法によって得られる。
【0072】
一実施形態では、少なくとも階層構造を出力として提供するステップは、表示ステップをさらに含む。実際、以下の説明でより詳細に分かるように、本方法によって得られる階層構造は、サイトメトリ測定からのデータを視覚化および解釈するための特に有利な柔軟性を提供する。
【0073】
一実施形態では、階層構造の表示ステップは、階層構造の少なくとも1つ以上のレベルに関連する所定のパーシステンス閾値の1つ以上の値をオペレータが選択することを可能にするように構成される。これにより、オペレータは、サイトメトリデータをどの程度の粒度で表示したいかを選択することができる。階層構造の表示ステップは、メンバーシップレベルとは無関係に、オペレータが表示するクラスを直接選択することができるようにさらに構成することができる。
【0074】
一実施形態では、表示ステップは、
-少なくとも1つの選択グラフであって、選択グラフが階層構造内のクラスおよびクラスのそれぞれの関係のグラフィカル表現であり、選択グラフがグラフィカル表現上で対応するクラスを指定することによって少なくとも1つのクラスを選択するように適合される、少なくとも1つの選択グラフ、
-各軸がそれぞれのサイトメトリパラメータに関連する少なくとも1つの二次元または三次元の提示グラフであって、少なくとも1つの提示グラフが選択グラフを使用して少なくとも1つの選択されたクラスに属する点群の点を表示するように構成される、少なくとも1つの二次元または三次元提示グラフ
を表示するステップを含む。
【0075】
有利には、この実施形態は、異なるレベルに位置するすべてのクラスにわたって階層構造をナビゲートすることを特に容易にする。それは、以前の技術では識別するのが非常に困難であった関連クラスを識別することを可能にする。さらに、選択グラフにより、レベルの異なるクラスを選択することができ、提示グラフにより点を同時に可視化することができる。言い換えれば、本発明の方法は、1つのレベルのクラスの「粒度」を視覚化することを可能にするが、1つ以上の選択されたクラスの「ズームイン」またはより高い階層レベルのクラスを選択することによる「ズームアウト」も可能にする。
【0076】
さらに、一実施形態では、選択グラフは、グラフィカル表現上の少なくとも1つの選択されたクラスを強調表示するように適合された視覚化手段をさらに含む。
【0077】
さらに、階層構造(すなわち、選択グラフ)および提示グラフの両方のそのような同時表示は、有利には、密接な階層リンクを有する、1つ以上のクラスに対する生物学的対象の1つ以上のグループのメンバーシップに関する全体的な情報、および2つまたは3つのサイトメトリパラメータに関連するグループの対象の分布に関する特定の情報を含むフォーマットでデータセットをオペレータに提示する。この形態の表示は、観察者が直感的に、特に魅力的、明瞭、または論理的に見つけることができるように情報を伝達するという単純な利点を有するだけではない。全体的な(すなわち、選択グラフ)情報および特定の(すなわち、提示グラフ)情報の同時表示は、データ分析の精度を高めるコンテキスト情報をオペレータに提供する。異なるスケールの情報のこの組み合わせは、生物学的対象の集団間のコミュニティ関係を含むサイトメトリデータに関する豊富な情報をオペレータに与える。この表示は、分析中の生物学的対象のセット全体のより容易かつ迅速な解釈を可能にするだけでなく、さらに、生物学的対象のサブタイプ間の残りのリンク(すなわち、選択グラフ)およびそれらの細胞学的パラメータ値(すなわち、提示グラフ)の表示に関する追加情報のおかげで、オペレータは、例えば、臨床診断、患者が疾患を発症する確率の予測、治療に対する患者の応答の評価、または治療中の患者のモニタリングおよび潜在的な治療の適応などに関する結論を直接引き出すことができる。一般に、特に患者に関するサイトメトリデータの場合、オペレータに提示される情報の認知内容は患者の健康状態に関する。したがって、オペレータは、この認知内容を使用して、患者の健康状態を評価し、診断を行い、治療を提案し、または患者の健康を改善するための任意の他のアクションを行うことができる。サイトメトリデータが生体機能化材料に関する別の例では、オペレータは、in vitroモデルにおいて候補薬物の有効性を設計または試験するプロセス中に本発明の表示の認知内容を使用することができる。
【0078】
有利には、オペレータが階層構造の少なくとも1つ以上のレベルに関連する閾値を選択することによって、およびオペレータが表示するクラスを選択することによって、階層構造の異なる表示間をナビゲートするようにグラフィカル表現を動的に変更することが可能である。例えば、ある時点に、オペレータは、生物学的対象の第1の亜集団を視覚化することができる。その後、後の時点で、オペレータは、第1の亜集団とは異なる生物学的対象の第2の亜集団を視覚化することができる。その後、オペレータは、第1の亜集団の視覚化に戻ることができる。
【0079】
一実施形態では、選択グラフは、各ノードがクラスを表すデンドログラムの形態で提示され、ノードは階層に整列され、各ノードは階層のノードによって表されるクラスのメンバーシップのレベルを表し、ブランチは異なるレベルのクラス間の階層リンクを表す。
【0080】
代替的な実施形態では、選択グラフは、各々がレベルを表す同心リングを含むサンバーストチャートの形態で提示され、リングはリングが表す階層レベルが低いほど大きい直径を有し、リングレベルのクラスは対応するリングの画分である。サンバーストチャート選択グラフの特定の形状は、階層構造に存在する異なるクラスおよびレベル間を表現およびナビゲートするのに特に有利である。
【0081】
一実施形態では、画分の長さは、対応するクラスの点の数に比例する。
【0082】
一実施形態では、直接階層リンク(すなわち、同じ拡張されたベイスンに属するクラス)を有するクラスを表す画分は、サンバーストチャートの同じ角度セクタに配置される。
【0083】
一実施形態では、グラフィカル表現は、2つ以上の選択されたクラスに属する点を区別するように構成された視覚化手段を備える散布図グラフである。
【0084】
一実施形態では、少なくとも1つの選択グラフは、階層構造におけるクラスおよびそれらの配置の動的グラフィカル表現であり、動的グラフィカル表現は、グループ化クラスが選択されたときに下位階層のクラスを表示するように構成される。
【0085】
本発明による方法は、さらに好ましくは、以下の実施形態のうちの1つ以上を含む:
-pおよび/またはqが、20より大きい、好ましくは30より大きい、好ましくは40より大きい、および/または80未満、好ましくは70未満、好ましくは60未満、好ましくは50に等しい、
-ステップa)において、距離が、第1の点と隣接点との間の数学的距離、特に平均距離を表し、数学的距離が、好ましくは、ユークリッド距離、ミンコフスキー距離、マンハッタン距離、またはマハラノビス距離から選択される、
-ステップa)の終わりに、密度が、対数変換などの増加関数であるような所定の変換を受ける。
【0086】
一実施形態では、本方法は、選択グラフを使用してオペレータから1つ以上のクラスの選択を受信するステップをさらに含む。
【0087】
別の実施形態では、本方法は、出力として医学的または研究報告を提供するステップ、および/またはサイトメトリイベントに関連する人、特にサイトメトリ測定が実施された生物学的流体の提供元の人に、例えば、手紙もしくは電子メールを送ることによって接触するステップ、および/または分析に基づいてデバイスを製造するステップをさらに含む。
【0088】
本発明はさらに、上述の実施形態のいずれか1つによる方法を実装するための手段を備えるデータ処理デバイスに関する。
【0089】
より詳細には、データ処理デバイスは、細胞、細胞起源小胞、無細胞微生物、および/または生体機能化材料から選択される複数の生物学的対象に関連するデータセットの分析のために構成され、データセットは、各々が生物学的対象に関連するN個のサイトメトリイベントを含み、各サイトメトリイベントは対応する生物学的対象について測定された少なくとも2つのサイトメトリパラメータによって定義され、その結果、データセットはD次元空間内のN個の点の点群(X)によって表され、デバイスは、
-複数の生物学的対象に関連するデータセットを受信するように構成された少なくとも1つの入力部と、
-少なくとも1つのプロセッサであって、
-点群(X)の各点(xi)について、点(xi)と、考慮される点(xi)に最も近い点群(X)のp個の点からなる隣接点のセット(Vp(xi))との間の距離をD乗したものの和に反比例する密度(w(xi))を決定し、
-点群(X)をモーダルセグメント(Mj)にセグメント化し、各モーダルセグメント(Mj)は極大密度を局所的に提示するモーダル点(mj)を含み、点群の点はモーダル点(mj)のベイスンに属し、ベイスンの点はそれらのq個の最近傍の密度に対するそれらの密度(w(xi))に基づいて再帰的に識別され、
-各モーダルセグメント(Mj)について、パーシステンス(β)を決定し、パーシステンス(β)は、
・モーダルセグメント(Mj)に隣接するモーダルセグメント(Mt)が、そのモーダル点(mj)の密度よりも大きい密度を有する点を有さず、隣接する2つ以上のモーダルセグメントが0より大きい同じ密度鞍点を共有する場合、無限値であり、そうでない場合、
・モーダルセグメント(Mj)と少なくとも1つの隣接するモーダルセグメント(Mt)との間の密度鞍点の深さを表し、
-モーダルセグメント(Md)から開始して、
a)考慮されるモーダルセグメント(Mj)とその隣接するモーダルセグメント(Mt)との間の階層リンクを識別するために、考慮されるモーダルセグメント(Mj)およびその隣接するモーダルセグメント(Mt)のうち、どれが最も高いベイスンに対応するかを決定し、
b)考慮されるモーダルセグメント(Mj)と、考慮されるモーダルセグメント(Mj)とのパーシステンスが所定のパーシステンス閾値以下であるモーダルセグメントとを融合して、より高いベイスンを有し、融合されたモーダルセグメントの点の中で極大密度を示す点をモーダル点(mj)として有する親モーダルセグメントを定義し、
c)親モーダルセグメントから新しい反復を開始して動作a)およびb)を反復的に繰り返し、
パーシステンスに基づいて定義された階層構造を決定し、階層構造(Lk)は複数のレベルを含み、各レベル(Lk)が複数のクラス(Ckj)への点群のセグメント化を定義し、各クラスは1つ以上のモーダルセグメント(Mj)のすべての点を含み、複数の生物学的対象のグループを表す
ように構成された少なくとも1つのプロセッサと、
-生物学的対象の異なるクラスおよびそれらの相互関係を表す少なくとも階層構造を提供するように構成された少なくとも1つの出力部と
を備える。
【0090】
本発明はさらに、プログラムがコンピュータによって実行されると、上記の実施形態のいずれか1つによる方法をコンピュータに実装させる命令を含むコンピュータプログラム製品に関する。
【0091】
本発明はさらに、コンピュータによって実行されると、上述の実施形態のいずれか1つによる方法をコンピュータに実装させる命令を含むコンピュータ可読記録媒体に関する。
【0092】
定義
本発明において、以下の用語は以下のように定義される。
【0093】
「プロセッサ」という用語は、ソフトウェアを実行することができるハードウェアに限定されるものとして解釈されるべきではなく、一般に、例えば、コンピュータ、マイクロプロセッサ、集積回路、またはプログラマブルロジックデバイス(PLD)を含み得る処理デバイスを指す。プロセッサはまた、グラフィックスおよび画像処理または他の機能に利用されるかどうかにかかわらず、1つ以上のグラフィックスプロセッサ(GPU)を含むことができる。さらに、関連する機能および/または結果として得られる機能を実行するための命令および/またはデータは、例えば、集積回路、ハードドライブ、CD(コンパクトディスク)、DVD(デジタル多用途ディスク)などの光ディスク、RAM(ランダムアクセスメモリ)、またはROM(読み出し専用メモリ)などの任意のプロセッサ可読媒体に記憶することができる。命令は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組み合わせに記憶することができる。
【0094】
「サイトメトリ」は、一般に、細胞特性、生物の基本的な構造、機能および生物学的単位の検出および/または測定を指す。さらに、サイトメトリはまた、細胞起源小胞(細胞外小胞または細胞内小胞など)、または無細胞微生物(例えば、ウイルス)などのナノサイズもしくはマイクロメートルサイズの粒子、または生体機能化材料(例えば、タンパク質もしくは核酸などの生物学的分子でコーティングされたマイクロスフェア、または免疫調節分子もしくは薬物などの生物活性分子でコーティングされたマイクロスフェア)の特性の検出および/または測定を指す。
【0095】
「細胞」は、単細胞または多細胞生物、原核または真核生物起源、動物、植物、真菌、原生生物、細菌または古細菌起源のものであり得る。細胞は、生きていても、死んでいても、固定されていてもよい。細胞は、例えば、固体もしくは液体組織(例えば、骨髄、血液またはリンパなど)または体液(例えば、脳脊髄液、尿、気管支肺胞液など)に由来し得る。
【0096】
サイトメトリデータを獲得するプロセス中、細胞、小胞、または粒子は、懸濁液(水性または非水性、生物学的または合成)中にあるか、または固体支持体(例えば、バイアル、1つ以上のウェルを有する細胞培養皿、プレートまたはマイクロプレート、ガラススライド、チップなど)上に固定化され得る。細胞、小胞、または粒子は、1つ以上の生物学的または化学的薬剤による事前処理を受けていてもよい。
【0097】
分析される細胞、小胞、または粒子は、1つ以上の集団内に存在し得る。
【0098】
「集団」は、同一または類似の特性を示す細胞、小胞、または粒子のセットである。集団は、互いに対して異なる二次特性を示す異なる亜集団に細分することができる。
【0099】
「細胞起源小胞」は、細胞起源の膜から構成される小胞である。細胞起源小胞は、細胞内小胞または細胞外小胞であり得る。細胞外小胞は、典型的には、細胞によって分泌または排出される。「細胞起源小胞」には、例えば、エキソソーム、エクトソーム、微小小胞体、微粒子、プロスタソーム、オンコソーム、マトリックス/石灰化小胞、アポトーシス小体、および細胞小胞の他のサブセットが含まれる。
【0100】
「無細胞微生物」は、その構造が細胞性ではない微視的生物を指す。「無細胞微生物」には、例えば、ウイルス、ウイロイドおよびプリオンが含まれる。
【0101】
「生体機能化材料」または「機能化生体材料」または「生体機能化デバイス」または「生体機能化システム」は、その表面にコーティングされた、生物学的起源の1つ以上の分子または官能基にカップリングまたは結合した、合成または生物学的起源の材料を含む任意の種類の物体を指す。
【0102】
非限定的な例には、ナノ粒子(例えば、ナノビーズ、ナノスフェア、またはナノカプセル)、微粒子(例えば、マイクロビーズ、マイクロスフェア、またはマイクロカプセル)、単層ベシクル、多層ベシクル、リポプレックス、ポリプレックス、リポポリプレックス、リポソーム、ニオソーム、コクリエート、ビロソーム、免疫刺激複合体(ISCOM(登録商標))などの脂質小胞などの合成または生物由来材料が含まれる。
【0103】
ビーズ、球体、またはカプセルなどのナノ粒子および微粒子は、有機、無機、磁性、または放射性であり得る。例えば、ナノ粒子または微粒子は、金属、シリカ、アルミナ、チタン、ガラス、セラミック、ポリスチレン、ポリメチルメタクリレート、メラミン、ポリラクチド、ラテックス、デキストラン、酸化物、グラフェン、磁性材料、放射性材料、またはそれらの組み合わせで作製され得る。
【0104】
生体機能化されるものの非限定的な例として、材料は、1つ以上のペプチド、タンパク質、抗体、抗体断片、受容体、サイトカイン、ケモカイン、毒素、オリゴヌクレオチド、有色もしくは蛍光分子、アミン、カルボキシルもしくはヒドロキシル基、生物活性分子(例えば、免疫調節分子、化学的小分子、ペプチド模倣薬、薬物)、ビオチン、アビジンもしくはストレプトアビジン分子、またはそれらの組み合わせとコンジュゲートまたはコーティングされてもよい。
【0105】
本発明の文脈において、「サイトメトリ」という用語は、データ、パラメータ、測定値、またはイベントを修飾する場合、細胞、細胞起源小胞、または無細胞微生物もしくは生体機能化材料などの粒子を指し得る。
【図面の簡単な説明】
【0106】
【
図1】本発明による分析方法の一例を示すブロック図である。
【0107】
【
図2】
図1の方法に従って得られた点密度表現の例を示す図である。
【
図3】
図1の方法に従って得られた点密度表現の例を示す図である。
【0108】
【
図4】第1の実施形態による選択グラフの一例を示す図である。
【0109】
【
図5】第2の実施形態による選択グラフの変形例を示す図である。
【
図6】第2の実施形態による選択グラフの変形例を示す図である。
【0110】
【
図7】一実施形態による提示グラフを示す図である。
【0111】
【
図8】本発明による選択グラフおよび提示グラフを含む例示的な表示を描写する図である。
【0112】
【
図9】本発明による提示グラフ上の表示を変更するために選択グラフを使用する例を表す図である。
【0113】
【
図10】
図1の方法の連続するステップを実行するように構成された、複数の生物学的対象に関連するデータセットを分析するためのデバイスの特定の態様を概略的に表す機能図である。
【0114】
【
図11】
図10の分析デバイスの機能を組み込んだデバイスの概略図である。
【発明を実施するための形態】
【0115】
本明細書は、本開示の原理を例示する。したがって、当業者は、本明細書に明示的に記載または図示されていないが、本開示の原理を具体化し、その範囲内に含まれる様々な構成を考案することができることが理解されよう。
【0116】
本明細書で引用されるすべての例および条件付き言語は、最新技術を進歩させるために本開示の原理および本発明者によって提供される概念を読者が理解するのを助けるための教育目的のためのものであり、具体的に引用された例および条件に限定されないと解釈されるべきである。
【0117】
さらに、本開示の原理、態様、および実施形態のすべての記述、ならびにそれらの具体例は、それらの構造的および機能的等価物を包含することが意図されている。さらに、これらの均等物は、現在知られている均等物および将来開発される均等物の両方を含むことが予想され、これは、それらの構造にかかわらず、同じ機能を実施する開発されたすべての要素を意味する。
【0118】
したがって、例えば、本明細書に提示される概略図は、本開示の原理を実装する例示的な回路の概念図を表すことができることを当業者は理解するであろう。同様に、すべてのフローチャート、流れ図などは、明示的に表されているかどうかにかかわらず、コンピュータ可読媒体上で本質的に表され、したがってコンピュータまたはプロセッサによって実行され得る様々なプロセスを表すことが理解されよう。
【0119】
図に示されている様々な要素の機能は、専用のハードウェア、および適切なソフトウェアと組み合わせてソフトウェアを実行することができるハードウェアの使用によって提供され得る。プロセッサによって提供される場合、機能は、単一の専用プロセッサ、単一の共有プロセッサ、またはそのうちのいくつかが共有され得る複数の個々のプロセッサによって提供されてもよい。
【0120】
図に示されている要素は、ハードウェア、ソフトウェア、またはそれらの組み合わせの様々な形態で実装され得ることが理解される。好ましくは、これらの要素は、ハードウェアと、プロセッサ、メモリ、および入力/出力インターフェースを含み得る1つ以上の適切にプログラムされた汎用デバイス上のソフトウェアとの組み合わせで実装される。
【0121】
図1は、本発明によるコンピュータ分析方法を実装する例を示す。
【0122】
本方法は、D次元空間内のN個の点xiの点群Xとして表現可能な複数の生物学的対象21(またはサイトメトリデータ21)に関連するデータセットの分析を実施するように構成され、各点xiはサイトメトリイベントを表し、各次元はサイトメトリパラメータを表す。
【0123】
本方法は、入力データセットに表された生物学的対象の異なるクラスおよびそれらの相互関係を表す階層構造31を出力するように構成される。
【0124】
階層構造31は、マルチレベル構造Lkであり、各レベルLkは、点群および/または点群の点に関連するデータのそれぞれの提示、すなわち、空間内の点の位置および点の密度を定義する。構造内のレベルが高いほど、そのレベルのクラスの数は少なくなる。構造は、所与のレベルLkにおけるクラスCkjの点が、
-すぐ上の階層レベルLk+1のただ1つのクラスC(k+1)jにも含まれ(考慮されるレベルLkの上にそのようなレベルが存在する場合)、したがって、考慮されるクラスCkjは、すぐ上のレベルの前記クラスC(k+1)jの娘であり、それ自体が考慮されるクラスの母であり、かつ
-すぐ下のレベルL(k-1)の1つ以上のクラスC(k-1)jにも含まれる(そのようなレベルが考慮されるレベルLkの下に存在する場合)
という点で、階層的である。
【0125】
このプロセスは、複数の生物学的対象に関連するサイトメトリデータセット21の受信ステップ41を含むことができる。
【0126】
生物学的対象は、
-動物、植物、真菌、原生生物、細菌または古細菌起源の細胞、
-エキソソーム、エクトソーム、微小小胞体、微粒子、プロスタソーム、オンコソーム、マトリックス/石灰化小胞、もしくはアポトーシス小体から選択される細胞起源小胞、
-ウイルス、ウイロイドおよびプリオンから選択される無細胞微生物、ならびに/または
-ナノ粒子(例えば、ナノビーズ、ナノスフェア、またはナノカプセル)、微粒子(例えば、マイクロビーズ、マイクロスフェア、またはマイクロカプセル)、脂質小胞(例えば、単層ベシクル、多層ベシクル、リポプレックス、ポリプレックス、リポポリプレックス、リポソーム、ニオソーム、コクリエート、ビロソーム、免疫刺激複合体(ISCOM(登録商標)))から選択される合成または生物学的材料を含む生体機能化材料であって、前記合成もしくは生物学的材料が、1つ以上のペプチド、タンパク質、抗体断片、受容体、サイトカイン、ケモカイン、毒素、オリゴヌクレオチド、有色もしくは蛍光分子、アミン、カルボキシル、もしくはヒドロキシル基、生物活性分子(例えば、免疫調節分子、化学的小分子、ペプチド模倣薬、薬物)、ビオチン、アビジン、またはストレプトアビジンの分子、もしくはそれらの組み合わせにカップリングされているか、もしくはそれらでコーティングされている、生体機能化材料
を含み得る。
【0127】
サイトメトリデータ21は、細胞、小胞、または粒子の特性を分析、決定、または測定することができる任意の方法によって取得することができる。分析は、複数の細胞、小胞、および/または粒子を含む試料に焦点を合わせることができる。例えば、サイトメトリデータ21は、個体由来の1つ以上の器官、組織、細胞または細胞断片などの個体由来の生物学的試料から取得することができる。
【0128】
場合によっては、サイトメトリデータ21を獲得するプロセスの前に、例えば、細胞、小胞、および/もしくは粒子を単離するステップ、または前記細胞の成分の事前単離を含む試料調製プロセスが行われてもよい。
【0129】
サイトメトリデータ21に関連する生物学的対象を含む試料調製プロセスは、非限定的な例として、磁気活性化細胞選別(MACS)、レーザー捕捉顕微解剖(LCM)、手動細胞採取もしくは顕微操作、微少流体技術、限界希釈、光ピンセットによる分離、電気泳動、ビーズ分離、免疫沈降、免疫パニング、標識、免疫染色、免疫蛍光、多重化、および/またはバイオチップの使用の1つ以上のステップを含み得る。
【0130】
サイトメトリデータ21は、ゲノミクス、エピゲノミクス、トランスクリプトミクス、プロテオミクス、メタボロミクス、リピドミクスなどのオミクスまたはメタオミクス技術データであり得る。したがって、サイトメトリデータ21は、例えば、細胞、小胞、もしくは粒子、または細胞、小胞、もしくは粒子に含まれる任意の他の分子の中または表面上に存在するDNA(例えば、遺伝子)、RNA、タンパク質(例えば、サイトカイン、受容体…)、糖、アミノ酸、および/または脂肪酸の検出および/または定量化に関することができる。サイトメトリデータ21はまた、細胞、小胞、もしくは粒子の中もしくは表面上の特定の分子もしくは集合体の有無の検出、または細胞、小胞、もしくは粒子の中もしくは表面上に存在する分子間の相互作用の検出、または細胞および/もしくは小胞、微生物、もしくは生体機能化材料などの物体間の相互作用の検出に関連し得る。
【0131】
非限定的かつ純粋に例示的な例として、サイトメトリデータ21が本質的にプロテオミクスである場合、測定または分析されたサイトメトリパラメータは、1つ以上の細胞内もしくは細胞外タンパク質の発現レベル、または細胞、小胞もしくは粒子の表面上の1つ以上の受容体もしくはマーカーの発現レベルであり得る。
【0132】
サイトメトリパラメータの他の例には、細胞、小胞、または粒子のサイズ、それらの密度、粒度、形態/形状、屈折率、膜組成、分子内容物(細胞内分子または表面分子の有無など)またはそれらの含有量(例えば、イオン、DNA、RNA、…の細胞内含有量または含有量)、および細胞の酸化還元状態、細胞周期における細胞の状態、細胞のアポトーシス状態、または細胞のリン酸化レベル…が含まれる。
【0133】
サイトメトリデータ21は、単一細胞分析技術によって取得することができる。
【0134】
非限定的な例として、サイトメトリデータ21は、フローサイトメトリ(または「蛍光活性化細胞選別(fluorescence activated cell sorting)」を縮めてFACS)、PCR活性化細胞選別(PACS)、マイクロスフェア親和性プロテオミクス(MAP)、質量分析、クロマトグラフィー、CYTOF、スペクトルサイトメトリ、質量サイトメトリ、イメージングサイトメトリ、チップ(マイクロアレイ)上での遺伝子発現プロファイリング、配列決定、例えばDNA配列決定(DNA-seqまたは単一細胞(sc)DNA-seq)もしくはRNA配列決定(RNA-seqまたは単一細胞(sc)RNA-seq)、in situハイブリダイゼーション、および/または顕微鏡法によって取得することができる。「顕微鏡法」という用語は、原子間力顕微鏡法(AFM)、電気化学検出法(EC)、走査型電子顕微鏡法(SEM)、透過型電子顕微鏡法(TEM)、表面プラズモン共鳴画像法(SPRi)、ラマン顕微分光法…を含む。
【0135】
サイトメトリデータ21はまた、これらの技術のいくつかを組み合わせることによって取得することができる。純粋に例示的な例として、単一細胞レベルでのRNAおよびタンパク質発現の多重プロファイリングは、フローまたは質量サイトメトリによって多数のRNAの発現レベルを測定するPLAYR技術(RNAの近接ライゲーションアッセイ)を、抗体で表面または内部に標識されたタンパク質を検出するための技術と組み合わせることによって同時に取得することができる。
【0136】
サイトメトリデータ21を取得するための技術の別の純粋に例示的な例は、例えば多重化RT-PCRによるハイスループットRNAサイトメトリによって、薄い半透膜(マイクロカプセル)に包まれた液滴中で単離された個々の細胞をプロファイリングすることである。
【0137】
サイトメトリデータ21は、複数のベクトルを含み、複数のベクトルの各々は、生物学的対象に関連するサイトメトリイベントについて測定されたD個のサイトメトリパラメータを含む。各ベクトルは、D次元空間内の点の座標として解釈することができる。したがって、サイトメトリデータ21は、D次元空間におけるN個の点の点群Xによって表すことができる。
【0138】
サイトメトリ測定の対象となるサイトメトリパラメータは、以下のサイトメトリパラメータ:サイトメトリ測定が行われた生物学的流体中の粒子のサイズ、前記粒子の構造、前記粒子の機能、ならびに関心対象のマーカーの特性および/または機能(定性的および定量的)を直接的または間接的に反映する任意の測定されたパラメータのうちの1つまたは組み合わせを含むことが好ましく、関心対象のマーカーは、単独または複合体中のタンパク質、核酸、および分子、ならびにそれらの相互作用を含み得る。
【0139】
次元Dの数、すなわち、各サイトメトリイベントに関連するサイトメトリパラメータの数は、1より大きく、好ましくは10より大きく、好ましくは20より大きく、好ましくは30より大きく、さらに好ましくは40より大きく、および/または200未満であってもよい。
【0140】
点の数N、すなわち、サイトメトリ測定に供される生物学的流体に含まれる生物学的対象の数は、好ましくは10,000を超え、かつ/または109未満である。
【0141】
本方法は、特にその後の分析を容易にするために、サイトメトリデータ21の前処理ステップ(ステップ42)を含み得る。前処理は、サイトメトリデータ21を補償すること、サイトメトリデータ21を視覚化および/もしくは分析に適したスケールに変換すること、ならびに/またはサイトメトリデータ21を正規化することを含み得る。
【0142】
例えば、補償は、点群内の点を表す各ベクトルにサイズD×Dの補償行列の逆行列を乗算することによって達成することができる。補償行列は、当業者に知られている任意の方法によって取得することができる。したがって、補償された点群の点を表すベクトルの集合を取得することができる。
【0143】
データ変換は、点群の点に関連する初期ベクトルまたは補償されたベクトルへの数学関数の適用に対応することができ、前記数学関数は、線形、対数、双指数関数、または双曲線逆正弦「arcsinh」関数を含むことができる。図示の実施形態では、「arcsinh」関数が補償された点群に適用される。
【0144】
最後に、データ正規化は既知の方法で実施することができ、特に「最小-最大」タイプのものとすることができる。
【0145】
ステップ42の終わりに、補償され、変換され、および/または正規化された点群Xが取得される(すなわち、点群の点に関連するベクトルは、補償され、変換され、および/または正規化される)。
【0146】
本発明の方法は、点群の密度関数のマルチレベル集合のトポロジの発展を研究する位相パーシステンスに基づいて点群のセグメント化を取得することを目的とする。
【0147】
本方法は、点群内の各点に関連する極値の密度を決定するステップ43を含む。このステップでは、前記点群Xの各点xiについて、前記考慮される点xiと、前記考慮される点に最も近い前記点群内のp個の点からなる集合Vp(xi)との間の距離をD乗したものの和に反比例する密度w(xi)が決定される。
【0148】
本開示では、ある点は、それが考慮される点に最も近い点群内のp個の点のうちの1つである場合、考慮される点の近くにある、または隣接していると見なされる。2点間の近接度は、点群のD次元空間におけるこれらの2点間の距離によって定義される。点は、パラメータpの選択および選択された距離の定義に応じて、考慮される点の隣接点であってもなくてもよい。2点間の近接度は、ユークリッド距離、ミンコフスキー距離、またはマンハッタン距離を用いて計算することができる。他の距離が使用されても、本発明の範囲を超えることはない。
【0149】
密度計算のために、分母は、好ましくは、考慮される点xiと、考慮される点に対して前記点群のp個の最も近い点からなる集合Vp(xi)との間のユークリッド距離(D=2)の合計に対応する。距離は、好ましくは、考慮される点とp個の隣接点との間の平均ユークリッド距離である。しかしながら、ミンコフスキー距離、マンハッタン距離、または同様の距離など、他の種類の距離を使用することができる。
【0150】
図示の例では、pは50に設定されているが、特に点群のサイズ、サイトメトリデータ21の性質、または方法の意図する用途に応じて、他のpの値を選択することができる。
【0151】
好ましい図示の例では、点群X内の点x
iについて、密度w(x
i)は、以下の式に従って一定の係数まで計算される。
【数1】
【0152】
式中、
【数2】
は、R
D上のユークリッドノルムであり、V
(j)(x
i)は、前記ユークリッドノルムによる点群Xのp個の最近傍隣接点の中のx
iのj番目の最近傍を表す。
【0153】
ステップ43の終わりに、点群内の点の密度w(xi)は、好ましくは対数変換され、これにより、相対密度差が有利に減衰される。
【0154】
ステップ43で得られた点密度の表現の例を
図2に示す。図示の例では、空間は二次元であり、点群の点は平面内にあり、前記点の密度の値は、平面に直交する第3の次元上に表される。
【0155】
次いで、本方法は、点xiのグループ化(より一般的には「クラスタ」と呼ばれる)を定義するために、点群XをモーダルセグメントMjにセグメント化するステップを含む。モーダルセグメントMjは、点群からの点のグループを含む空間領域を画定する。この点の集合は、モーダルセグメント内の他の点の密度よりも大きい密度を有するモーダル点と、空間内で、モーダル点に隣接し、モーダル点の密度よりも低い密度を有する他の点とを含む。したがって、モーダル点mjは、モーダル密度と呼ばれる密度に関連し、これは密度の極大値であり、これは、モーダルセグメントMjの他の点に関連する密度よりも高いことを意味する。
【0156】
モーダルセグメントMjは、密度関数の近似のピークのベイスンで自然に識別することができる。直感的に、密度関数をランドスケープとして考慮すると、モーダルセグメントMjは、密度関数の勾配のベクトル場によって定義される流れに沿って同じ極大値(またはピーク)に向かって流れるすべての点xiの集合である。密度ベイスンを識別することにより、点群を1つ以上のモーダルセグメントMjにセグメント化することが可能になり、各モーダルセグメントMjは、密度w(xi)の極大値に関連するモーダル点mjを含み、点群内のすべての点は、そのベイスンに属する。したがって、ベイスン内の点は、それらのq個の最近傍隣接点の密度に対するそれらの密度w(xi)に基づいて再帰的に識別される。
【0157】
別のモーダルセグメントに隣接する(または接続された)モーダルセグメントは、同じ密度鞍点を有するモーダルセグメントであり、前記密度鞍点は0より大きい。その結果、逆に、共通の境界でヌルの密度値を有する2つのセグメントは、開示された方法の文脈において、空間のこの領域に点が見つからないため、隣接するモーダルセグメントとは見なされない。局所的に、2つの隣接するモーダルセグメントを分離する境界の両側で、これらのモーダルセグメントの各々の点は、前記境界から離れるにつれて密度が増加することに関連付けられる。言い換えれば、境界は、密度鞍点の底部を定義する。
【0158】
言い換えれば、その近傍に両方のモーダルセグメントに属する少なくとも1つの点を含む点群内の点が存在する場合、2つのセグメントは隣接している。密度鞍点(または境界)は、2つの隣接するモーダルセグメント内の隣接点を含む点の中で最も低い密度の点である。
【0159】
一実施形態では、以下の動作を実施することができる:前記点群内の各点xiについて、密度の高い順に、すなわち、最も高い密度を有する点から最も低い密度を有する点まで進行して、前記考慮される点の密度がそのq個の最近傍隣接点Vq(xi)の密度の各々よりも高い場合、前記考慮される点xiを含むモーダルセグメントが形成され、そうでない場合、前記考慮される点xiは、そのq個の最近傍隣接点Vq(xi)の中で最も高い密度を有する点を含むモーダルセグメントに含まれる。この動作は、点群内の点の対の距離および点群内の各点に対応する密度値の知識に基づく。有利には、開示された方法は、サイトメトリックデータ点21の対の間の(おおよその)距離、およびこれらの点における密度のおおよその推定値の知識のみを必要とする。したがって、これは、点群を表すために選択された任意のメトリック空間に実質的に適用可能である。さらに、本方法の複雑さは妥当なままであり、入力距離行列のサイズは点群内の点の数Nに関して二次式であり得るが、本方法はNの線形量のメインメモリのみを使用する。
【0160】
パラメータpおよび/またはqは、20より大きく、好ましくは30より大きく、好ましくは40より大きく、および/または80未満、好ましくは70未満、好ましくは60未満、好ましくは50に等しいことができる。パラメータpおよびqは、同一であっても異なっていてもよい。図示の例では、数qは50に等しい。
【0161】
図2に示す例では、6つのモーダルセグメントM1~6が識別されている。図示のように、各モーダルセグメントは、そのピークが密度の極大値である山に似ていることができる。
【0162】
次いで、本方法は、各モーダルセグメントMjのパーシステンスを推定するステップ45を含む。
【0163】
モーダルセグメントMjのパーシステンスβは、以下のように定義される:
-そのモーダル点mjの密度よりも大きい密度に関連する点を有する少なくとも1つの隣接するモーダルセグメントMtが存在しない場合、無限値を有し、または
-そうでない場合、モーダルセグメントMjと前記少なくとも1つの隣接するモーダルセグメントMtとの間の密度鞍点の深さを表す。
【0164】
少なくとも1つの隣接するモーダルセグメントを有するモーダルセグメントMjのパーシステンスβは、モーダル点mjの密度(すなわち、モーダルセグメントMjに属する点よりも高い密度値)と、モーダルセグメントMjと前記少なくとも1つの隣接するモーダルセグメントMtとの間の密度鞍点内に位置する点群の点に関連する密度値の中で最も高い密度値との差として計算することができる。
【0165】
点群の点が単一のサイトメトリパラメータに関連し、密度w(x)が縦軸上の値に対応する簡略化された表現について、パーシステンス決定の例が
図3に示されている。図示の例では、モーダルセグメントM
1、すなわち、最大値を有する極大密度を提示するモーダルセグメントのパーシステンスβ
1は、無限大である。
【0166】
モーダルセグメントM
3は、モーダルセグメントM
2のみに隣接している。したがって、モーダルセグメントM
3のパーシステンスβ
3は、そのモーダル密度、すなわち、モーダルセグメントM
3のベイスンの密度w(m
3)の極大値の値と、モーダルセグメントM
3およびM
2間の極小密度の値との差に対応する。このパーシステンスβ
3は、
図3の2つの線Δ’
1およびΔ’
2を分離する縦軸に沿った距離に対応し、考慮される例では約0.032に等しい。
【0167】
図3に示す例では、モーダルセグメントM
2は、モーダルセグメントM
2の密度値よりも高い密度値を有する2つの隣接するモーダルセグメントM
1およびM
3を有する。モーダルセグメントM
2のパーシステンスβ
2は、そのモーダル密度w(m
2)と、隣接するモーダルセグメント間の2つの密度極小値の中の最も高い密度値との差、すなわち、モーダルセグメントM
2のピークと、モーダルセグメントM
2およびM
1間の最も高い鞍点との差に対応する。図示の場合、パーシステンスβ
2は、
図3の2つの線Δ
1およびΔ
2を分離する縦軸に沿った距離に対応し、考慮される例では約0.013に等しい。
【0168】
プロセスの次のステップであるステップ46は、階層構造を構築するために、前のステップで計算されたパーシステンス値に基づいて、モーダルセグメントMj、およびモーダルセグメントに含まれる点をグループ化するように構成される。
【0169】
このステップ46によって定義された階層構造31は、l個のレベルLkを含み、kは2~lの範囲である。レベルの数lは、好ましくは2より大きく、好ましくは3より大きく、好ましくは4より大きく、および/または100未満、好ましくは50未満、さらに好ましくは30未満である。
【0170】
各レベルLkは、H個のクラスCkhへの点群Xのセグメント化を定義する。各クラスCkhは、ステップ44で定義された1つまたはいくつかのモーダルセグメントMjからの点をグループ化する。すべてのモーダルセグメントMjはあるレベルのクラスに関連付けられ、1つを超えるクラスに属するモーダルセグメントは存在しない(すなわち、複数のクラス間で共有されるモーダルセグメントはない)。
【0171】
階層構造31のレベルが低いほど、そのレベルのクラス数は多くなる。ベースレベルL1は、単一の共通のベイスンにグループ化することができるすべての隣接するモーダルセグメントをグループ化すること(すなわち、より粗いセグメント化)から生じる。最終レベルLlは、最も細かいセグメント化を表す。
【0172】
レベルL
kのクラスC
khを定義するために、モーダルセグメントM
jは、モーダルセグメントのそれぞれのパーシステンスβと、グローバル(すなわち、すべてのレベルで同じ値を有する)であっても、またはレベルL
kごとに異なるように定義されてもよい所定のパーシステンス閾値
【数3】
(22)との差に基づいてグループ化される。
【0173】
ステップ46は、1つ以上の隣接するモーダルセグメントMtを有する開始モーダルセグメントMjを任意に選択するように構成される。代替的な実施形態では、開始モーダルセグメントMjは、そのモーダル点mjの密度値に基づいて選択される。開始モーダルセグメントMjは、最も高い密度値を有するモーダル点mjを有するモーダルセグメントとすることができる。本発明の方法によれば、モーダルセグメントMjと2つ以上の隣接するモーダルセグメント(Mt1、Mt2など)との間の密度鞍点の最大深さが等しい場合、モーダルセグメントMjは複数の隣接するモーダルセグメント(Mt1、Mt2など)を有する。
【0174】
前記開始モーダルセグメントMjについて、ステップ42は、モーダルセグメントMjおよびその隣接モーダルセグメントMtのうち、どれが最も高いベイスンを有する(すなわち、最も高い密度値を有するモーダル点mjを有する)かを最初に決定するように構成される。より低いベイスンを有するモーダルセグメントは、より高いベイスンを有するモーダルセグメント内にあると見なされ、考慮されるモーダルセグメント(Mj、Mt)間の階層リンクを識別するための情報を提供する。ベイスンの「高さ」という用語は、前記ベイスンに関連するモーダルセグメント(すなわち、密度の極大値)のモーダル点の密度値を指す。
【0175】
次に、モーダルセグメントM
jのパーシステンスが、対応するレベルL
kに対する所定のパーシステンス閾値
【数4】
(すなわち、最初の反復では
【数5】
)と比較される。M
jのパーシステンスが所定のパーシステンス閾値
【数6】
以下である場合、モーダルセグメントM
jは、その隣接するモーダルセグメントM
tと融合される。この融合は、より高いベイスンを有し、そのモーダル点が融合モーダルセグメントの点の中で極大密度を提示する新しい親モーダルセグメントを定義する。言い換えれば、モーダル点m
jによって引き付けられる点群Xの点は、所定のパーシステンス閾値
【数7】
より低いパーシステンスを有する任意の他のピークのセグメント(すなわち、ベイスン)に融合される前に、モーダルセグメントM
jにおけるパーシステンスによって最終的に融合される上昇領域(すなわち、濃度値が減少する)に属する点である。
【0176】
一例では、パーシステンス閾値22は、ステップ44で取得された各モーダルセグメントMj、したがってそのすべての点が階層構造内のレベルLlのクラスCklに関連付けられるように選択することができる。レベルLlは、階層構造(すなわち、最も高い粒度を有するレベル)において最も低い階層のレベルを指す。取得された親モーダルセグメントは、すぐ上の階層レベルLlに属するクラスCk(l-1)に関連付けられる。したがって、クラスCk(l-1)は、融合された開始セグメントMjおよびその隣接するモーダルセグメントMtに対応するクラスCklとの直接階層リンクを有する。特に、クラスCk(l-1)は、下位階層レベルLlのこれら2つ以上のクラスの母クラスと考えることができる。
【0177】
最後に、これらの決定および融合ステップは、新たに定義された親モーダルセグメントを開始モーダルセグメントとして使用して反復的に繰り返される。後続の反復で作成された親モーダルセグメントに対して、上述した同じ種類の階層関係が定義される。その結果、融合は、パーシステンスの低い順に行われる。
【0178】
これらのステップを反復することにより、パーシステンスに基づいて階層構造31を決定することが可能になり、それによりサイトメトリデータ21内に含まれる生物学的対象のグループの表現が提供される。
【0179】
レベルL
k内のクラスの数は、そのレベルに関連する閾値パーシステンス
【数8】
に依存する。予備パラメータ化ステップは、各レベルのクラスの所望の数に基づいて閾値パーシステンス
【数9】
を決定するために使用される。この予備パラメータ化ステップは、点群に存在するすべてのモーダルセグメントの識別(すなわち、融合は実施されない)を可能にする単一の閾値パーシステンス値(例えば、0に等しい閾値)に対して本発明による方法のステップを実行することを含む。したがって、各レベルL
kの閾値パーシステンス
【数10】
の値は、これらのモーダルセグメントの分析および検査中の生物学的対象の種類に基づいて選択される。したがって、これらの閾値パーシステンス値
【数11】
は予め決定され、オペレータから独立しており、異なるオペレータ間でのプロセス結果の再現性を可能にする。したがって、パーシステンス閾値の選択は、表示ステップ中のオペレータのニーズを満たすために、クラスの粒度、すなわち検査中の生物学的対象の種類に応じたデータの観測スケールを適合させることを可能にする。
【0180】
一実施形態では、少なくとも階層構造31を出力するステップは、オペレータがアクセス可能なインターフェースを介したその少なくとも部分的な表現をさらに含む。好ましくは、階層構造31は画面上に表示される。階層構造31は、提示される前に、コンピュータメモリに記憶することができる。
【0181】
階層構造31を提示する目的は、オペレータが関心対象のクラスを選択し、オペレータが分析したい点のみをグループ化することを可能にすることである。
【0182】
表示ステップは、少なくとも1つの選択グラフ20および少なくとも1つの提示グラフ40の同時表示を含む。
【0183】
少なくとも1つの選択グラフ20は、階層構造31内のクラスおよびクラスのそれぞれの関係のグラフィカル表現であり、オペレータが前記グラフィカル表現上の対応するクラスを指定することによって少なくとも1つのクラスCkhを選択することを可能にするように適合される。
【0184】
同じ表示において、本方法は、各軸がそれぞれのサイトメトリパラメータに関連する少なくとも一次元または三次元提示グラフ40をさらに表す。サイトメトリデータ分析21の分野では、オペレータが、異なる軸の対を有する複数の提示グラフを同時に表示することが特に有利である。オペレータは、グラフィカルインターフェースを介して提示グラフ40の軸を選択することができる。提示グラフ40は、選択グラフ20を使用して、選択されたクラスC
khに属する点群X内の各点を表示するように構成されている。同時表示の一例が
図4に示されており、左側の列は提示グラフ40を含み、右側の列は対応する選択グラフ20を含む。
【0185】
好ましくは、選択グラフ20は、レベルに応じてクラスをグループ化することによってクラスを視覚的に表す。例えば、クラスは、ベースレベルからさらに離れたレベルに属する場合、選択グラフ上の基準点22から視覚的に遠くなり得る。基準点は、例えば、
図4に示すように各レベルがピラミッドの層に対応するピラミッドの頂点、または
図5に描写するように各レベルがこの核を中心とするリングに対応する円の中心とすることができる。
【0186】
実際には、オペレータは、グラフィカルインターフェースを介して、動的カーソル(すなわち、マウス)を使用してクリックし、したがって選択グラフ20のグラフィカル表現上に表されるクラスのうちの1つを選択することができる。
【0187】
一実施形態では、選択グラフ20のグラフィカル表現は、階層クラスタリングによって生成されたグループの配置を示すために一般的に使用されるツリーを表す図であるデンドログラムの形態で提示される。このデンドログラムにおいて、各ノード12はクラスCkhを表し、ブランチ14はクラスCkh間の階層リンクを表す。同じレベルLkに属するノード12は、階層的に整列させることができる。
【0188】
図4に示す例では、選択グラフ20はデンドログラムの形態をとり、レベルL
1~5は異なるブランチレベルを表す。各ノード12はクラスC
khを表し、各ブランチ14は、母クラスC
khと娘クラスC
(k+1)hとの間の階層リンクを表す。
【0189】
一実施形態では、選択グラフ20は、サンバーストチャートの形態で提示される。このチャートは、複数のセクタまたは「象限」に分割されたディスクとして描写されており、各セクタは、最高のベースレベルからのそれぞれのクラスのすべての点(および/または関連データ)を表し、かつそれらのみを表す。好ましくは、セクタの角度は、それが表す基底レベルからのクラス内の点の数に比例する。サンバーストチャートは同心リングを含み、各リングは階層構造31のレベルを表す。特に、レベルL1に関連し、l-1個の同心リング24を有するコアがあり、同心リングの各々はレベルL1よりも低い階層を有する他のレベルLk(kは2~l-1の範囲)を表す。このサンバーストチャートにおいて、リングは、より低い階層レベルを表すにつれて増加する直径を有する。
【0190】
同じレベルLkのクラスCkhは、対応するリングの画分として表すことができ、各画分は、直接または間接階層リンクの前の上位階層からのクラスを含むセクタ内に延びる。2つのクラスは、1つのブランチのみがそれらを接続する場合、直接階層リンクを有し、2つのクラスが少なくとも2つのブランチによって接続される場合、間接階層リンクを有する。
【0191】
好ましくは、クラスを表す画分は、その開き角が画分によって表されるクラス内の点の数に比例する円弧として、ディスクの中心の周りに延びる。
【0192】
図5は、サンバーストチャートの一例を示し、レベルは同心リング24であり、表すクラスが集約されているほど同心リングの中心に近く、レベルL
kのクラスC
khはそのレベルL
kの対応するリング24の画分である。
【0193】
この好ましい実施形態では、リング24の直径は、ベースレベルL1からさらに離れたレベルL2~5を表すほど大きい。
【0194】
好ましくは、すべてのレベルについて、母クラスCkhの娘クラスC(k+1)hを表す下位階層レベル(すなわち、娘)からのリングの画分は、上位階層レベル(すなわち、母)に関連するリング内の前記母クラスCkhを表す画分と同じ角度セクタ内に描写されている。このようにして、娘クラスC(k+1)hの画分は、母クラスCkhに関連する画分と外部的に重複する。
【0195】
例示的かつ非限定的な例として、分析された対象が細胞である場合、母クラスはリンパ球の細胞集団に対応し得る。このリンパ球集団(母クラス)は、例えば、Tリンパ球亜集団およびBリンパ球亜集団などの異なる細胞亜集団(母クラスの娘クラスに対応する)に細分することができ、これら2つの種類の亜集団は異なる二次サイトメトリパラメータを提示する。サンバースト選択グラフ20では、異なる細胞亜集団が「母」リングを囲む「娘」リングによって表されている。
【0196】
さらに、これらのTおよびBリンパ球亜集団は、さらに別の亜集団に細分することができる。例えば、Tリンパ球亜集団内で、サイトメトリパラメータの分析は、CD4+Tリンパ球亜集団(その表面にCD4タンパク質を発現するTリンパ球)およびCD8+Tリンパ球亜集団(その表面にCD8タンパク質を発現するTリンパ球)を区別することができる。選択グラフ20は、階層構造31全体、または好ましくは階層構造31の一部のみを提示することができる。
【0197】
選択グラフ20は、選択されたクラスをグラフィカル表現上で強調表示するように適合された視覚化ツールをさらに含むことができる。視覚化ツールは、例えば、選択グラフ20上のクラス表現(すなわち、ノード12または画分)の色、形状、またはサイズを変更するように構成することができる。
【0198】
一実施形態では、選択グラフ20は、階層構造内のクラスおよびそれらの配置の動的グラフィカル表現を提供するようにさらに構成される。この動的グラフィカル表現は、下位階層クラスをグループ化するクラスが選択グラフ20上で選択されると、下位階層クラスを表示するように構成することができる。
【0199】
この実施形態では、選択グラフ20は、デフォルトでベースレベルのクラスを表示する。このようにして、オペレータがベースレベルから「母」クラスの表現をクリックすると、インターフェースはその母クラスの娘クラスの表現を提示する。より一般的には、オペレータが画面に表示された任意のレベルLkから「母」クラスCkhの表現をクリックすると、コンピュータはその母クラスCkhの娘クラスC(k+1)hを提示する。
【0200】
この実施形態のおかげで、オペレータは、選択グラフ20によって提示され、階層の最後のレベルに属さない任意のクラスC
khを「拡大」することができる。クラスを「拡大」するとは、そのクラスの娘クラスを提示することを意味する。したがって、オペレータは、それらに関心のあるサイトメトリイベントに焦点を合わせることができ(
図6を参照)、これは分析に特に有利である。
【0201】
好ましくは、選択グラフ20は、ベースレベルのクラス、および前記ベースレベルのクラスから発展したクラスのみを提示する。
【0202】
逆に、この実施形態のおかげで、オペレータは、選択グラフによって提示される母クラスのすべての娘クラスを折り畳むことができる。娘クラスの集合を折り畳むことによって、画面から前記娘クラスの表現を消去することを意味する。したがって、オペレータは、娘クラスのサイトメトリイベントのより巨視的な表示に戻ることができる(
図6参照)。
【0203】
図6は、左から右へ、クラス拡大の例を示し、右から左へ、本発明によるクラス折り畳みの例を示す。この例では、レベルL
2およびL
4からそれぞれクラスC
2,jおよびC
4,kを選択することにより、レベルL
3およびL
5からそれぞれの娘クラス、すなわちC
3,j1、C
3,j2、C
5,k1およびC
5,k2へのアクセスが可能になる。
【0204】
同様に、クラスC3,j2およびC5,k1を拡大すると、それらの娘クラスC4,j3、C4,j4、C6,k3およびC6,k4が表示される。
【0205】
同様に、クラスC4,j3およびC6,k3を選択することによって、これにより、オペレータは、それぞれの娘クラスC5,j5、C4,j6、C7,k5およびC6,k6にアクセスすることができる。
【0206】
有利には、オペレータは、階層構造の異なるレベルにわたって関心対象のクラスを容易に選択することができる。
【0207】
レベルごとではなく、拡大可能なクラスごとの選択グラフ20は、有利には、
図6に示すように、ユースケースに関連するサイトメトリイベントを含まない他のクラスに同じ粒度を表示する必要なく、異なるレベルから選択された関心対象のクラスのみからなる階層構造の一部、または関心対象のサブ階層構造を識別する。
【0208】
したがって、選択グラフ20の階層構造31におけるクラスのグラフィカル表現およびクラスのそれぞれの関係は、オペレータが提示グラフ40に視覚化したいクラスのみの点を選択するために使用される。選択グラフ20上でクラスが選択されると、各提示グラフ40上には、そのすべての点が示される。
【0209】
提示グラフ40は、散布図の形態で表すことができる。二次元または三次元の散布図は、単に、平面または3D空間に関して2つまたは3つの選択された細胞学的パラメータにそれぞれ関連する平面または3D空間上への点群の選択された点の射影である。
【0210】
提示グラフの数は、好ましくは、1、2、3より多く、および/または200、100、50、30、もしくは10未満である。
【0211】
同じクラスの点はすべて同じ方法で表すことができる。したがって、これらの提示グラフ40は、好ましくは、2つ以上の選択されたクラスに属する点を区別するように構成された視覚化手段を含む(
図7)。これらの視覚化手段は、同じクラスの点が異なる提示グラフ上に同一に、かつ前記クラスに固有であるように提示されることを可能にし、オペレータがそれらを直接識別することを可能にする。例えば、同じクラスの点は、そのクラスに固有の形状、寸法、および/または色を有する。
【0212】
点群の点が、例えばクラスに対して特定の色を有するなど、クラスのメンバーシップに応じて異なって表される場合、レベルに関連する表現は、異なる色の点のグループとしてクラスを示す。粒度は、階層構造31において表されるレベルが高いほど粗い。逆に、階層構造31の最下部に位置するレベルに属するクラスは、サイトメトリデータ21に存在する集団および亜集団のより細かい粒度の表現を提供する。したがって、レベルを選択することにより、オペレータは、サイトメトリイベントを視覚化したいスケールを選択することができる。
【0213】
図7に示す例では、同じクラスの点は、そのクラスに固有の同じ色を有する。
【0214】
図8は、選択グラフ20がサンバーストグラフであり、散布図タイプの4つの表現グラフ40がオペレータインターフェースの同じ画面に示されている、本発明による表示の一例を示す。
【0215】
オペレータがその娘クラスを明らかにするために母クラスをズームイン」したい場合、点は、それらが属する娘クラスに固有の外観で表されなければならない。したがって、視覚化手段は、オペレータが選択グラフ20上で娘クラスを選択すると、その娘クラスのうちの1つに属する点の各グループが前記クラスの同じ特徴的な外観(すなわち、他の娘クラスとは異なる)を有するように、母クラスの点の外観を変更するように構成される。
【0216】
図9は、オペレータと選択グラフ40との対話後の表示の変更の例を示す。この図の左列は、選択グラフのリング41の画分に関連するクラスがオペレータによって選択された表示の第1の構成を示し、したがって、2つの提示グラフ20は、選択されたクラスに含まれる生物学的対象に関連する点を示す。この例では、点はリング41の画分と同じ色で表示される。右列は、リング42および43の2つの画分によって表される2つの娘クラスを視覚化するために、オペレータがリング41の画分に関連する母クラスを「ズームイン」することを選択したことによって、表示がどのように変更されたかを示している。リング42および43の2つの画分を選択することによってズームインするこの動作はまた、娘クラスの選択と同時にまたはほぼ同時に、2つの娘クラスに関連する点の表示を変更することを可能にする。提示グラフ20上の点の表示は、2つのクラスに属する点を区別することができるように変更される。この例では、点の色が変更されている(右列の提示グラフ20上の黒とグレー)。この表示のおかげで、オペレータは、生物学的対象の選択されたサブタイプ間のコミュニティ関係に関する情報(すなわち、母クラスと娘クラスとの間の階層リンク)およびそれらのサイトメトリパラメータに関する特定の情報を同時に取得する。
【0217】
有利には、本発明の方法は、オペレータが、少なくとも1つの提示グラフにおいて、選択グラフとの対話によって点を視覚化したいまたは視覚化したくない関心対象のクラスを選択することを可能にする。したがって、有利には、無関係であると考えられる点、例えば、細胞破片、マトリックス、または結晶で構成されるノイズを表示しないことが特に可能である。結論として、本発明の方法によって実装される提示モードは、オペレータが、サイトメトリデータ21が由来するシステムの状態(すなわち、患者の健康状態)を評価する技術的タスクを、人間と機械との対話プロセスによって実施するのに役立つ。
【0218】
本発明は、とりわけ、上述の方法のステップ(
図10)を実装するように構成されたデータ処理デバイス1に関する。
【0219】
ここで説明するデバイス1は汎用性があり、交互に、または任意の累積的な方法で実行することができるいくつかの機能を備えているが、本開示の範囲内の他の実装形態は、本明細書に記載の機能の一部のみを有するデバイスを含む。
【0220】
デバイス1は、前述の機能を実行し、前述の効果または結果を生成するように設計、構成、および/または適合された装置、または装置の物理的部分であることが有利である。代替の実装形態では、デバイス1は、同じ機械にグループ化されているか、場合によっては遠隔の異なる機械にグループ化されているかにかかわらず、装置のセットまたは装置の物理的部分の形態で実現される。デバイス1は、例えば、クラウドインフラストラクチャ上に分散され、クラウドベースのサービスとしてユーザに利用可能な機能を有するか、またはAPIを介してアクセス可能なリモート機能を有することができる。
【0221】
以下の開示において、モジュールは、物理的に別個の構成要素ではなく機能的実体として理解されるべきである。したがって、モジュールは、同じ有形の具体的な構成要素に一緒にグループ化されるか、またはこれらの構成要素のいくつかにわたって分散されるかのいずれかとして具現化することができる。同様に、これらのモジュールの各々は、それ自体が少なくとも2つの物理的構成要素間で共有されてもよい。さらに、モジュールは、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の混合形態の形態で実装される。
【0222】
デバイス1は、サイトメトリデータ21、および1つ以上のローカルまたはリモートデータベース10に記憶された方法22のための所定のハイパーパラメータ(すなわち、p、q、および/または事前定義されたパーシステンス閾値)を受信するためのモジュール11を含む。後者は、特に、場合によってはSSD(ソリッドステートディスク)内のフラッシュメモリなどのRAMまたはEEPROM(電気的消去可能プログラマブル読み出し専用メモリ)を含み得る任意の種類の適切な記憶手段から利用可能な記憶リソースの形態をとることができる。代替的に、ハイパーパラメータ22は、通信ネットワークを介して受信される。
【0223】
デバイス1は、任意選択的に、本方法のステップ42に関連する動作のうちの1つ以上を実施するように構成された、サイトメトリデータ21を前処理するためのモジュール12を含む。
【0224】
さらに、デバイス1は、本方法のステップ43、44、45、および46に関連する動作のうちの1つ以上を実施するように構成された、階層構造31を計算するためのモジュール13を含む。
【0225】
デバイス1は、オペレータインターフェース14と対話し、それを介してユーザが情報を入力および検索することができる。オペレータインターフェース14は、当業者に周知の以下の手段、すなわち、画面、キーボード、トラックボール、タッチパッド、タッチスクリーン、スピーカ、音声認識システムのうちの1つ以上を含み得る、視覚、触覚、および/または聴覚機能を含む、データ、情報、または命令を入力または検索するための任意の適切な手段を含む。
【0226】
デバイス1はまた、オペレータインターフェース14を使用して表示ステップを実施するように構成された表示モジュール15を含むことができる。
【0227】
図11に見える特定のデバイス9は、上述のデバイス1を実装する。デバイス9は、例えば、ワークステーション、ラップトップコンピュータ、タブレット、スマートフォン、またはヘッドマウントディスプレイ(HMD)に対応することができる。
【0228】
このデバイス9は、複数の生物学的対象に関連するデータセットを分析するのに適している。デバイス9は、同様にクロック信号を搬送するアドレスおよびデータバス95によって相互接続された以下の要素を含む:
-マイクロプロセッサ91(またはCPU)、
-複数のグラフィックス処理デバイス(またはGPU)920とグラフィックスランダムアクセスメモリ(GRAM)921とを含むグラフィックスカード92、
-ROM型不揮発性メモリ96、
-ランダムアクセスメモリ(RAM)97、
-キーボード、マウス、トラックボール、ウェブカメラなどの1つ以上の入力/出力(I/O)デバイス94(音声認識などの他のコマンド入力方法も可能)、
-電源98、および
-高周波ユニット99。
【0229】
変形例では、電源98はデバイス9の外部にある。
【0230】
デバイス9はまた、グラフィックスカード92に直接接続され、グラフィックスカード内で計算されて合成された合成画像を表示する直接表示画面タイプの表示デバイス93を含む。表示デバイス93をグラフィックスカード92に接続するために専用バスを使用することは、はるかに高いデータ伝送速度を有し、したがってグラフィックスカードによって構成された画像を表示するためのレイテンシを低減するという利点を提供する。
【0231】
変形形態では、表示デバイスは、デバイス9の外部にあり、表示信号を送信するためにケーブルまたは無線でデバイス9に接続される。デバイス9は、例えばグラフィックスカード92を介して、例えばLCDまたはプラズマスクリーンまたはプロジェクタなどの外部表示手段に表示信号を送信するように適合された送信または接続インターフェースを含む。これに関して、高周波ユニット99は、無線送信に使用することができる。
【0232】
メモリ97および921の説明において以下で使用される「レジスタ」という用語は、前述のメモリの各々において、低容量のメモリ領域(少数のバイナリデータ)および大容量のメモリ領域(プログラム全体を記憶すること、またはデータを表すデータのすべてもしくは一部を計算もしくは表示することを可能にする)を指定することができることに留意されたい。同様に、RAM97およびGRAM921について表されるレジスタは、任意の方法で配置および構成することができ、それらの各々は、必ずしも隣接するメモリ位置に対応せず、異なって分散させることができる(特に、レジスタがいくつかのより小さいレジスタを含む場合をカバーする)。
【0233】
マイクロプロセッサ91は、電源投入時に、RAM97に含まれるプログラムの命令をロードして実行する。
【0234】
当業者には理解されるように、グラフィックスカード92の存在は必須ではなく、中央ユニットによる完全な処理および/またはより単純な視覚化実装に置き換えることができる。
【0235】
さらに、デバイス1は、スタンドアロンソフトウェアとは異なるように実装することができ、デバイス9の一部のみを含むデバイスまたはデバイスのセットは、API呼び出しまたはクラウドインターフェースを介して操作することができる。
【実施例】
【0236】
多くのアルゴリズムが、Weber,L.M.and Robinson,M.D.(2016),Comparison of clustering methods for high-dimensional single-cell flow and mass cytometry data.Cytometry 2016,89(12):1084-1096(doi:10.1002/cyto.a.23030)において試験されている。
【0237】
しかしながら、本発明による方法は、これらのアルゴリズムよりも信頼性と受容性との間のより良い妥協点を提供する。
【0238】
特に、本発明者らは、異なるデータセット(Levine32、Levine13、Samusik01、SamusikAll)について、Weberによって試験された異なるアルゴリズムで得られた信頼性と、本発明による方法で得られた信頼性とを比較した。
【0239】
信頼性は、アルゴリズムの結果と「グランドトゥルース」との間の一致の古典的な尺度であるFスコアによって測定された。
【0240】
以下の表1は、得られたFスコアをまとめたものである。
【表1】
【0241】
この表は、本発明による方法が、従来技術からの最良のアルゴリズムに匹敵する信頼性を提供することを示している。
【0242】
しかしながら、本発明による方法は信頼性の高いセグメント化を提供するだけでなく、特に以下の理由から、任意のサイトメトリ分析の専門家にとって受容可能な結果も提供する:
-これらの結果は特にロバストであり、ロバストとは再現性があることを意味する、
-これらの結果は、その結論を説明するのが困難である人工知能ベースのアルゴリズムの実装に由来するものではなく、密度に基づいており、クラス内のサイトメトリイベントグループの客観的な説明を可能にする、
-これらの結果は、プロセスの主観的な初期パラメータ化を必要としない、
-これらの結果は、サイトメトリによく適合した方法で、すなわち階層的な形態で編成することができ、細胞自体は伝統的に階層的に分類される。
【0243】
したがって、本発明による方法は、サイトメトリ分析の専門家にとっての信頼性と受容性(特に優れた解釈性から生じる)との間の最良の妥協点を提示すると考えられる。
【0244】
明らかなように、本発明は、
-関連性のあるセグメント化を提供し、
-容易に解釈可能であり、検証可能であり、任意のサイトメトリ分析の専門家にとって受容可能であり、
-サイトメトリイベント間の非常に柔軟なナビゲーションを可能にし、
-サイトメトリイベントの表現の迅速な選択を可能にする、
サイトメトリデータを分析するための解決策を提供する。
【0245】
したがって、生物学的流体の分析は、信頼性、効率、および受容性の間の改善された妥協点を提供する。
【国際調査報告】