特許第6630275号(P6630275)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ イマビオテクの特許一覧

特許6630275分子イメージングデータを処理する方法及び対応するデータサーバ
<>
  • 特許6630275-分子イメージングデータを処理する方法及び対応するデータサーバ 図000002
  • 特許6630275-分子イメージングデータを処理する方法及び対応するデータサーバ 図000003
  • 特許6630275-分子イメージングデータを処理する方法及び対応するデータサーバ 図000004
  • 特許6630275-分子イメージングデータを処理する方法及び対応するデータサーバ 図000005
  • 特許6630275-分子イメージングデータを処理する方法及び対応するデータサーバ 図000006
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6630275
(24)【登録日】2019年12月13日
(45)【発行日】2020年1月15日
(54)【発明の名称】分子イメージングデータを処理する方法及び対応するデータサーバ
(51)【国際特許分類】
   G16B 40/10 20190101AFI20200106BHJP
   G16B 50/00 20190101ALI20200106BHJP
   G01N 27/62 20060101ALI20200106BHJP
   A61B 5/055 20060101ALI20200106BHJP
【FI】
   G16B40/10
   G16B50/00
   G01N27/62 D
   A61B5/055 380
【請求項の数】14
【全頁数】13
(21)【出願番号】特願2016-545874(P2016-545874)
(86)(22)【出願日】2015年1月9日
(65)【公表番号】特表2017-509945(P2017-509945A)
(43)【公表日】2017年4月6日
(86)【国際出願番号】FR2015050051
(87)【国際公開番号】WO2015104512
(87)【国際公開日】20150716
【審査請求日】2017年12月15日
(31)【優先権主張番号】1450176
(32)【優先日】2014年1月10日
(33)【優先権主張国】FR
(73)【特許権者】
【識別番号】513237803
【氏名又は名称】イマビオテク
【氏名又は名称原語表記】IMABIOTECH
(74)【代理人】
【識別番号】110001508
【氏名又は名称】特許業務法人 津国
(72)【発明者】
【氏名】パムラール,ファビアン
(72)【発明者】
【氏名】スタウバー,ジョナサン・エム
【審査官】 松野 広一
(56)【参考文献】
【文献】 特表2009−540319(JP,A)
【文献】 特開2012−247198(JP,A)
【文献】 特開平07−128450(JP,A)
【文献】 特表2004−526958(JP,A)
【文献】 特開2011−191222(JP,A)
【文献】 特表2009−500617(JP,A)
【文献】 国際公開第2013/080170(WO,A1)
【文献】 国際公開第09/156897(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G16B 5/00−99/00
A61B 5/055
G01N 27/62
G16H 30/00−30/40
(57)【特許請求の範囲】
【請求項1】
特に分子イメージング方法によって利用される、複数のスペクトルデータセット(J1〜Jn)を処理し、コンピュータによって実行される方法であり、それぞれのデータセット(J1〜Jn)が、1セットの分子情報(S(Xi,Yj))を包含する少なくとも2つの次元の分子スペクトルがそれぞれ関連する1セットの空間位置(Xi,Yj)によって定められる方法であって、
−データセット(J1〜Jn)ごとに、それぞれの位置(Xi,Yj)と関連した分子スペクトルを、それぞれが前記スペクトルの分子情報の一部を包含する、スペクトルのいくつかの区間(T1〜Tm)へ分割する工程と、
−スペクトルの1セットの指標付き区間(T1〜Tm)がそれぞれのデータセット(J1〜Jn)のそれぞれの位置(Xi,Yj)と関連するように、それぞれのデータセット(J1〜Jn)の位置(Xi,Yj)ごとに得られた区間(T1〜Tm)をデータベース(BDD)に書き込む工程と、
−目的分子情報に関する要求の後に、データベース(BDD)において、目的分子情報を包含する区間(単数又は複数)(T1〜Tm)を選択する工程と、
−それぞれの区間(T1〜Tm)内で前記目的分子情報を選択する工程と、
−少なくとも1つの所定のピッチ(P’)によってすべての分子スペクトル(S(Xi,Yj))をスペクトルの区間(T1〜Tm)に分割する工程と、
−いろいろな区間(T1〜Tm)のポイント指標と、対応する分子情報との間の対応関係を設定する基準軸(Aref)を書き込む工程と、
−基準軸(Aref)及び所定のピッチ(P’)に応じて、目的分子情報を包含するスペクトル区間(T1〜Tm)を選択する工程と、
を含むことを特徴とする方法。
【請求項2】
分子イメージング方法の間に、複数のスペクトルデータセット(J1〜Jn)を記録する方法であり、それぞれのデータセットが、1セットの分子情報(S(Xi,Yj))を包含する少なくとも2つの次元の分子スペクトルがそれぞれ関連する1セットの空間位置(Xi,Yj)によって定められ、コンピュータによって実行される方法であって、
−スペクトルデータの取得の間に、スペクトルデータセット(J1〜Jn)ごとに、それぞれの位置(Xi,Yj)と関連した分子スペクトルを、それぞれが前記スペクトルの分子情報の一部を包含する、スペクトルのいくつかの区間(T1〜Tm)へ分割する工程と、
−スペクトルの1セットの指標付き区間(T1〜Tm)がそれぞれのデータセット(J1〜Jn)のそれぞれの位置(Xi,Yj)と関連するように、それぞれのデータセット(J1〜Jn)の位置(Xi,Yj)ごとに得られた区間(T1〜Tm)をデータベース(BDD)に書き込む工程と、任意に、
−目的分子情報に関する要求の後に、データベース(BDD)において、目的分子情報を包含する区間(単数又は複数)を選択する工程と、
−それぞれの区間(T1〜Tm)内で前記目的分子情報を選択する工程と、
−少なくとも1つの所定のピッチ(P’)によってすべての分子スペクトル(S(Xi,Yj))をスペクトルの区間(T1〜Tm)に分割する工程と、
−いろいろな区間(T1〜Tm)のポイント指標と、対応する分子情報との間の対応関係を設定する基準軸(Aref)を書き込む工程と、
−基準軸(Aref)及び所定のピッチ(P’)に応じて、目的分子情報を包含するスペクトル区間(T1〜Tm)を選択する工程と、
を含むことを特徴とする方法。
【請求項3】
それぞれがデータセット(J1〜Jn)に対応する、1セットのデータマップ(C1〜Cn)の形で目的分子情報を視認する工程を含むことを特徴とする、請求項1又は2に記載の方法。
【請求項4】
データベース(BDD)への区間(T1〜Tm)の書き込みの前又は後に、前記方法が、スペクトル配列、及び/又はバックグラウンドノイズの減算、及び/又はイントラデータセット標準化(J1〜Jn)からなる少なくとも1つの前処理工程を含むことを特徴とする、請求項1〜3のうちのいずれか1項に記載の方法。
【請求項5】
最も微細な空間サイズを有するデータセット(J1〜Jn)上に配列されるようにいろいろな空間サイズを有するデータセット(J1〜Jn)の空間位置(Xi,Yj)をサイズ変更する工程を含むことを特徴とする、請求項1〜のうちのいずれか1項に記載の方法。
【請求項6】
最大強度(Pk1〜Pkl)、平均強度、ピーク下の面積、すべての分子情報のそれぞれの目的ピークのノイズ対信号比などの、データセットを抽出する工程を更に含むことを特徴とする、請求項1〜5のうちのいずれか1項に記載の方法。
【請求項7】
抽出が、ノイズ対信号比及び/又はスペクトル分解能の品質基準によって定められるピーク選択基準に応じて、実行されることを特徴とする、請求項6に記載の方法。
【請求項8】
次いでいろいろなデータセット(J1〜Jn)を互いに比較するために複数のデータセット(J1〜Jn)の分子スペクトルを互いに標準化する工程を含むことを特徴とする、請求項1〜7のうちのいずれか1項に記載の方法。
【請求項9】
標準化工程を実行するために、
−データセット(J1〜Jn)のすべてに共通な1つの分子又はいくつかの内因性若しくは外因性基準分子(Mref)を選択する工程と、
−データセット(J1〜Jn)ごとに、これらの基準分子(単数又は複数)(Mref)の関数としての標準化要因(Fnor)を計算する工程と、
−1セットの標準化されたデータセット(J1〜Jn)を得るためにこの標準化要因によって目的分子情報を補正する工程と、を含むことを特徴とする、請求項8に記載の方法。
【請求項10】
標準化要因(Fnor)が、データセット(J1〜Jn)に対応する1セットのサンプルに、又はデータセット(J1〜Jn)に対応するサンプルの特定の基準ゾーン(Z)に存在する少なくとも1つの基準分子(Mref)から定められることを特徴とする、請求項9に記載の方法。
【請求項11】
標準化されたデータセット(J1〜Jn)からそれぞれ生じる複数のデータマップ(C1’〜Cn)の形で、マップのすべてに共通のカラースケールによって目的分子情報を視認、比較、及び分析する工程を含むことを特徴とする、請求項8〜10のうちのいずれか1項に記載の方法。
【請求項12】
共通のカラースケールが、目的分子のためのすべてのデータセット(J1〜Jn)の最小及び最大の強度に基づくことを特徴とする、請求項11に記載の方法。
【請求項13】
前記データセット(J1〜Jn)が、質量分析方法によって得られることを特徴とする、請求項1〜12のうちのいずれか1項に記載の方法。
【請求項14】
前記データセット(J1〜Jn)が、Positron Emission Tomography(PET)又はMagnetic Resonance Imaging(MRI)タイプのイメージング方法によって得られることを特徴とする、請求項1〜12のうちのいずれか1項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
分野
本発明は、大容量データベース構造の使用、及び対応するデータのサーバをベースとした、分子イメージングデータを処理する方法に関する。分子イメージングは、可能な限り最小な侵襲手段、又は観察される生物学的若しくは生物物理学的システムを可能な限り崩壊させない手段によって、生体外又は生体内で器官及び/又は生物の分子機能を主に観察するすべてのイメージング技術を一般に包含する。
【0002】
背景
分子イメージングは、数多くの技法の進化において、特に質量分析イメージング(MSI)、磁気共鳴イメージング(MRI)、又はラマン分光分析において、かなりの成長を続けている。これらの技法は、生物学的システムにおける役割を研究する、農薬、薬物、タンパク質又は脂質などの、標的内因性又は外因性化合物の生体内分布の研究を実行するために使用される。ソフトウェアの助力を得たこれらの技法の適用は、監視をせずに潜在的なバイオマーカを探索することを可能にする。
【0003】
しかしながら、分子イメージングにおいて分析及び解釈されるデータの増加は、画像とそれぞれ関連したいくつかのデータセットに関する総合的な分析を制限する。データは、総合的な表現のために利用すること又は統計学的に分析することが困難になってきている。
【0004】
実際に、データセットの多量の情報は、多くの場合、(スーパーコンピュータとは対照的に)従来のコンピュータのランダムアクセスメモリのサイズよりも大きい。例えば質量分析イメージングでは、50,000の位置の画像によって、すべての生情報がメモリに記憶できなくなり、したがってメモリへの影響を低減させこれらの画像の利用を可能にするために計算の実行が必要となる。計算によって、データが低減し、その結果、すべての利用可能な情報を考慮しないために、偏りが生じる。また、現在の分析ツールは、互いに関連したいくつかのデータセットを標準化する手段を有していない。
【0005】
主にデータセットの取得ロボットの製造者に結びつけられる多くの記憶フォーマットが存在する。しかしながら、これらのフォーマットはいずれも、微細かつ迅速に問い合わせられるように適合及び最適化されない。分子イメージングの一部の分野は、MRI(磁気共鳴イメージング)及び質量分析イメージングにおいて見いだされるAnalyze7.5などの記憶フォーマットを開発している。質量分析イメージングはまたフォーマットiMZMLを包むが、しかしながら、このフォーマットは、イメージングデータを扱う記憶システムを構成しない。
【0006】
データの階層的な組織化に基づくタイプHDF5(“Hierarchical Data Format 5”)のフォーマットが、近年質量分析イメージングにおける大容量データの記憶に使用されている。これらのフォーマットは、インターネットブラウザを介した遠隔問い合わせインタフェースを構築する。それらは、非階層化されたファイルの場合よりも速い統計学的な計算を可能にする。しかしながら、これらのフォーマットは、いくつかのデータセットの研究において同時に比較及び検索可能な全体的なデータの分析をもたらさない。
【0007】
したがって、分析の偏りがもたらされることを回避するために情報損失なく互いに関連したいくつかのデータセットを分析、比較、及び問い合わせる方法の必要性が存在する。
【0008】
概要
本発明の目的は、特に分子イメージング方法によって利用される、複数のスペクトルデータセットを処理する方法であって、それぞれのデータセットが、1セットの分子情報を包含する少なくとも2つの次元の分子スペクトルがそれぞれ関連する1セットの空間位置によって定められる方法、を提案することであり、この必要性に効果的に応えることであるこの方法は、特に、
−データセットごとに、それぞれの位置と関連した分子スペクトルを、それぞれが低減された1セットの分子情報を包含する、分子情報のいくつかの区間へ、又はスペクトルの区間へ分割する工程と、
−スペクトルの1セットの指標付き区間がそれぞれのデータセットのそれぞれの位置と関連するように、それぞれのデータセットの位置ごとに得られた区間をデータベースに書き込む工程と、
−目的分子情報に関する要求の後に、データベースにおいて、目的分子情報を包含する区間(単数又は複数)を選択する工程と、
−それぞれの区間内で前記目的分子情報を選択する工程と、を含むことを特徴とする。
【0009】
本発明はまた、分子イメージング方法の間に、複数のスペクトルデータセットを記録する方法であって、それぞれのデータセットが、1セットの分子情報を包含する少なくとも2つの次元を有する分子スペクトルがそれぞれ関連する1セットの空間位置によって定められる方法に関する。この方法は、
−スペクトルデータの取得の間に、スペクトルデータセットごとに、それぞれの位置と関連した分子スペクトルを、それぞれが前記スペクトルの分子情報の一部を包含する、スペクトルのいくつかの区間へ分割する工程と、
−スペクトルの1セットの指標付き区間がそれぞれのデータセットのそれぞれの位置と関連するように、それぞれのデータセットの位置ごとに得られた区間をデータベースに書き込む工程と、
任意に、
−目的分子情報に関する要求の後に、データベースにおいて、目的分子情報を包含する区間(単数又は複数)を選択する工程と、
−それぞれの区間内で前記目的分子情報を選択する工程と、を含むことを特徴とする。
【0010】
より一般には、本発明は、前記データセットを構成する空間位置のセットの空間位置のそれぞれと関連した分子スペクトルを区間に分割することによって有利には自動的に取得される、データセットの処理を提案する。それぞれのスペクトルは、すべてが関連したスペクトルの分子情報のすべてを含む、スペクトルの区間の連続に対応する。本発明によれば、区間への分割工程は、スペクトルデータの取得の間に又はスペクトルデータの分析の間に、有利には自動的に行われ得る。
【0011】
第1の実施形態では、関連スペクトルからの分子情報が損失されないか又は冗長でないように、連続する区間は重複せずに、単純に隣接する。別の実施形態では、一部の分子情報が同一のスペクトルの2つの連続するスペクトルの区間に存在することができるように、関連スペクトルの区間の一部が部分的に重複し得る。
【0012】
本発明は、区間の選択によって、データベースの有用な情報を回復することができる程度で、分析されるデータの読み込み時間を実質的に低減させる。データの取得の間、データが記録されると同時に、スペクトルデータを分割することも可能であり、その結果、スペクトルデータの区間が、分子イメージング方法によるサンプルの分析の間に直接統合される。
【0013】
スペクトルの低減なしで、信号の区間への分割により、本発明はまた、選別法(いくつかの薬物候補の分布比較)、定量化の方法、レセプタ占有率又は組織選別の研究、代謝若しくは3D再構成の研究の方法などの、完全に生理学的な事象を観察するための同一分析における薬物動態学的、薬力学的、及び内因性又は外因性分子の定量化の複合研究についての情報を低減させずに作用する。本発明はまた、統計学的処理に必要なメモリの使用及びいくつかのデータセット上の分子データイメージングの表現を最適化する。
【0014】
一実施形態によれば、本発明のデータ処理又は記録の方法は、それぞれがデータセットに対応する、1セットのデータマップの形で目的分子情報を視認する工程を含む。
【0015】
有利には、分子スペクトルは、同一か又はスペクトルごとで異なる可能性がある決定されたピッチによって、切り分けられる。
【0016】
一実施形態によれば、本発明のデータ処理又は記録の方法は、
−少なくとも1つの所定のピッチによってすべての分子情報をスペクトルの区間に分割する工程と、
−スペクトルのいろいろな区間のポイント指標と、対応する分子情報との間の対応関係を設定する基準軸を書き込む工程と、
−基準軸及び所定のピッチに応じて、目的分子情報を包含するスペクトル区間を選択する工程と、を含む。
【0017】
一実施形態によれば、データベースの区間の書き込みの前又は後に、前記方法は、スペクトル配列、及び/又はバックグラウンドノイズの減算、及び/又はイントラデータセット標準化からなる少なくとも1つの前処理工程を含む。
【0018】
一実施形態によれば、本発明のデータ処理又は記録の方法は、最も微細な空間サイズを有するデータセット上に配列されるようにいろいろな空間サイズを有するデータセットの空間位置をサイズ変更する工程を含む。
【0019】
一実施形態によれば、本発明のデータ処理又は記録の方法は、最大強度、平均強度、ピーク下の面積、すべての分子情報のそれぞれの目的ピークのノイズ対信号比などの、データセットを抽出する工程を更に含む。
【0020】
一実施形態によれば、抽出は、ノイズ対信号比及び/又はスペクトル分解能の品質基準によって定められるピーク選択基準に応じて、達成される。
【0021】
一実施形態によれば、本発明のデータ処理又は記録の方法は、次いでいろいろなデータセットを互いに比較するために複数のデータセットの分子情報のセットを互いに標準化する工程を含む。
【0022】
一実施形態によれば、標準化工程に着手するために、前記方法は、
−データセットのすべてに共通な1つの基準分子又はいくつかの内因性若しくは外因性基準分子を選択する工程と、
−データセットごとに、これらの基準分子(単数又は複数)の関数としての標準化要因を計算する工程と、
−1セットの標準化されたデータセットを得るためにこの標準化要因によって目的分子情報を補正する工程と、を含むことができる。
【0023】
一実施形態によれば、標準化要因は、データセットに対応する1セットのサンプルに、又はデータセットに対応するサンプルの特定の基準ゾーンに存在する少なくとも1つの基準分子から定められる。
【0024】
一実施形態によれば、本発明のデータ処理又は記録の方法は、標準化されたデータセットからそれぞれ生じる複数のデータマップの形で、マップのすべてに共通のカラースケールによって目的分子情報を視認、比較、及び分析する工程を含む。
【0025】
一実施形態によれば、共通のカラースケールは、目的分子のためのすべてのデータセットの最小及び最大の強度に基づく。
【0026】
一実施形態によれば、前記データセットは、質量分析方法によって得られる。
【0027】
一実施形態によれば、前記データセットは、Positron Emission Tomography(PET)又はMagnetic Resonance Imaging(MRI)タイプのイメージング方法によって得られる。
【0028】
有利には、本発明による記録及び/又は処理方法の工程のすべて又は一部は、自動化される。
【0029】
本発明の別の目的は、本発明による複数のデータセットを処理する方法の少なくとも一部の工程を実行するメモリ記憶ソフトウェア命令を含むデータサーバである。
【0030】
本発明の別の目的は、コンピュータによって実行可能でかつ本発明によるスペクトルデータを処理又は記録する方法の少なくとも1つの工程をコンピュータシステムが実行することができるように適合された命令を含む、コンピュータによって読み込み可能なデータ媒体である。
【0031】
したがって、本発明は、プログラムがコンピュータ上で動作するときに上で説明された工程のすべて又は一部を実行するためのプログラムコード命令を含むコンピュータプログラムを提案する。
【0032】
有利には、コンピュータプログラムは、少なくとも分子スペクトルをスペクトルの区間に分割する工程の実行のためのプログラムコード命令を含む。
【0033】
本発明は、例示として与えられるが本発明を限定しない添付図面の以下の説明及び審査からより明確に理解されるであろう。
【図面の簡単な説明】
【0034】
図1】本発明による方法によって利用されるデータセットを得るための質量分析方法のいろいろな工程を概略的に示す。
図2】本発明によるデータを処理する方法の実施のための統合データベース管理システムの概観図である。
図3】データセットのそれぞれ位置と関連したスペクトル区間を得る工程の概略図である。
図4】分子情報と対応するスペクトル区間との間の対応関係を設定する工程を示す。
図5】いくつかの画像を正確に比較するためのインター画像標準化工程を概略的に示す。
【0035】
同一、類似、又は同様の要素は、一方の図から他方の図まで同一の参照番号を維持する。
【0036】
発明の詳細な説明
本発明による方法の実行の以下の例は、MALDIタイプの質量分析法のために説明される。当然、例えば、SIMS、DESI、LAESI、DIOS、ICP、Microscope MALDI、SNOM、SMALDI、LA-ICP、ESI(組織上での液体抽出)、MILDI、JEDI、ELDI、などのソースといった、MALDI以外のイメージング装置が、実質的に同一に使用され得る。本発明による方法はまた、例えばPET(“Positron Emission Tomography”)又はMRI(Magnetic Resonance Imaging)などの、分子イメージング法によって利用可能なデータを生成する任意の他の方法に適用可能である。
【0037】
図1は、MALDI質量分析法によって実行されるいろいろな工程を概略的に示す。第1の工程E1は、次いでスライド2上に配置される一片の組織1を、一般に低温切開によって、切り抜くことからなる。工程E2において、イオン化マトリックス3の微細均一層が、次いで、一片の組織1上に配置される。取得工程E3は、マトリックス3の分子をイオン化するために、所定のサイズを有した、例えば、取得ゾーン当たり約100マイクロメートルの、自動レーザパルス4を生成することからなる。このようにしてイオン化された分子は、質量分析計によってそれ自体公知のように分析される。方法の実行に関するより詳細については文献FR2973112を参照することができる。
【0038】
1セットの分子情報のそれぞれと関連した1セットの空間位置(i,Yj)によって定められるデータセットJkがもたらされる。空間位置は、軸X及びYの基準座標系の関数として定められる。すべての分子情報は、この場合は特に分子量の関数としての強度を示す2つの次元を有したスペクトルSによって形成される。例えば、得られるデータセットJkは、20,000の空間位置Xi,Yj上にスペクトル当たり、50,000の強度(又は50,000ポイント)を有する。本発明による方法は、複数のデータセットJ1〜Jnの処理に基づく。
【0039】
図3に示されるように、画像の形式で示される可能性のあるそれぞれのデータセットJkのために、それぞれの位置(i,Yj)と関連した分子スペクトルS(i,Yj)は、スペクトルのいくつかの区間T1〜Tmに分割される。区間T1〜Tmは、所定のピッチP’によって切り分けられる。例えば、空間位置につき50,000ポイントのそれぞれのスペクトルのために、それぞれのスペクトルは、10,000ポイントのピッチP’によって切り分けられ得る。すなわち、スペクトルS(i,Yj)は、それぞれ10,000ポイントの5つの区間T1〜T5に分割される。変数として、使用されるピッチP’を変化させることができる。
【0040】
異なる区間T1〜Tmのポイント指標と対応する分子量との間の対応関係を設定する基準軸Arefがまた、図4に示されるように、定められる。
【0041】
データベースBDDへの書き込みの前に、方法は、好ましくは、モジュール100を介してスペクトルS(i,Yj)の少なくとも1つの前処理工程を実行する。この前処理工程は、スペクトル配列からなることができる。この目的のために、基準ピークが考慮され、スペクトルは対応するピークの値をこれらの基準ピーク上に位置づけるようにオフセットされる。スペクトルの最小値とスペクトルの最小値が一致しなければならない基準値との間の距離に応じてスペクトルを再調整することによって、バックグラウンドノイズの減算を実行することも可能となる。
【0042】
更に、いろいろなタイプの信号標準化(内部標準化)が、(内部標準によって、強度の総量を使用することによって)実行され得る。換言すれば、イントラデータセット標準化、すなわち、当業者にそれ自体公知の工程に対応する他のデータセットとは独立したデータセットごとの標準化が、ここで実行される。このイントラデータセット標準化は、データセットJ1〜Jnを互いに正確かつ確実に比較する以下に詳述するデータセットJ1〜Jn間の次の標準化工程(インターデータセット標準化)に対する補完として、実行される。
【0043】
また、方法は、スペクトルS(i,Yj)のそれぞれの目的ピークの、最大強度Pk1〜Pkl、平均強度、ピーク下の面積、ノイズ対信号比などの、データセットを抽出する工程を含む。「PeakPicking」と呼ばれる方法によってスペクトルS(i,Yj)のそれぞれのピークPk1〜Pklの最大強度を抽出することが可能である。抽出は、ノイズ対信号比及び/又はスペクトル分解能の品質基準によって定められるピーク選択基準に応じて行われる。
【0044】
それぞれのデータセットJ1〜Jnの位置(i,Yj)ごとに得られる区間T1〜Tm、並びに基準軸Aref及び予め抽出されたピークPk1〜PKlは、図2に示されるように、データベースBDDに書き込まれる。このようにして、1セットの指標付き区間T1〜TM並びに1セットのピークPk1〜PKl及び上述した補完的なデータ(平均強度、それぞれのピークの面積)は、それぞれのデータセットJ1〜Jnのそれぞれの位置(i,Yj)と関連付けられる。
【0045】
データベースBDDは、書き込まれたデータの視認、管理、解釈、及び統計学的分析を可能にするNoSQL(“Not only Structured Query Language”)又はSQLタイプの大容量データベースである。例えばデータベース管理システムは、以下の包括的ではないシステム、Hypertable、Haddoop、Cassandra、MongoDB、PolyBase、Azure上のHadoop、Hive、Pigから選択され得る。データベースシステムは、データのコヒーレンス、信頼性、及び適切さを確保する。複製及び保存の技術により、情報の信頼性を確保することができる。
【0046】
データベースBDDの適切な情報の選択工程が以下に説明される。目的分子情報と関連した要求の後、要求された分子情報を包含するデータセットJ1〜Jnのセットの位置の区間(単数又は複数)が選択される。この目的のために、それぞれのデータセットJ1〜Jnの位置Xi、Yjごとに、要求された分子情報を包含する区間Tpが、基準軸Aref及び要求された分子情報の関数として選択される。
【0047】
したがって、図4は、この工程のより簡単な理解のために、5ポイントのピッチP’による区間へのスペクトルの分割を示す。質量分析法によるスペクトルの場合によくあることだが、分子量のスケールは線形ではない。ユーザが例えば3m/zの値の分子量を有する分子と関連した情報を必要とする場合には、基準軸Arefは分子量のこの値に対応するポイントの指標が9であると規定し、その結果、ピッチP’によって、目的分子量の強度を包含する区間Tpが第2の区間T2であることが導出され得る。
【0048】
あるいは、分子量の最小及び最大端並びにそれぞれの対応する区間T1〜Tmのポイントの指標化を記憶する表が使用され得る。この場合、要求された分子情報のために、区間T1〜Tmの識別子が、これらの最小及び最大端に応じて選択される。
【0049】
すべてのデータセットJ1〜Jnのポイントのそれぞれのために選択されたそれぞれの区間T1〜Tm内で、要求された分子量の対応する強度が、次いで選択される。次いで、データセットJ1〜Jnにそれぞれ対応する1セットのデータマップC1〜CNの形で、いろいろなマップC1〜CN上に目的分子の存在の強度の分布を視認することができるようになる。色は、カラースケール上の分子情報の強度に左右される。代替的に、又は補完として、ピークPk1〜PKlの抽出が、目的分子の強度の分布の初期分析を提供する画像を迅速に生成する。
【0050】
方法は、好ましくは、次いでいくつかのデータセットを互いに比較するためにデータセットJ1〜Jnの分子情報を標準化する工程を含む(モジュール101参照)。この目的のために、すべてのデータセットJ1〜Jnに共通の基準分子Mrefが選択される。代替的に、データセットJ1〜Jnのすべてに共通のいくつかの内因性又は外因性分子が選択される。完全なサンプル中の、又はより詳細に対応するサンプルの基準ゾーンの、基準分子Mref(単数又は複数)の存在を考慮することが可能である。
【0051】
より正確には、データセットJ1〜Jnごとに、標準化要因Fnorが、これらの基準分子Mref(単数又は複数)の関数として計算される。目的分子情報は、次いで、標準化されたセットJ1〜Jnのデータセットを生成するために、この標準化要因Fnorによって補正される。
【0052】
例えば、図5に示されるマップC1〜C3に対応する3つのデータセットのために、基準分子Mref=500m/zが、標準化分子(標準化標準)として選択される。この分子Mrefは、マップC1〜C3のゾーンZに5、10、及び15の値をそれぞれ有する。マップC1〜C3ごとに、標準化要因Fnorが、Mrefのこれらの値のそれぞれに基づいて計算される。Fnor=C1〜C3のMrefの値の平均/該マップのMrefの値。図5に示される例では、マップC1、C2、及びC3のために2、1、及び10/15の標準化要因Fnorが、それぞれ得られる。この係数は、次いで、すべてのデータセットJ1〜Jnのいろいろな位置と関連したスペクトルの強度値、特に位置Xi;Yjの目的分子Mi=300m/zの強度の値、のすべてに適用される。標準化されたマップC1’〜C3’が得られ、互いに直接比較することが可能となる。
【0053】
標準化は、サンプルの調製及びその分析のための試験条件の変化と結びつけられた強度を補正する。実際に、前の例では。マップC3に対応するサンプルの目的分子Mi=300m/zの強力な存在の誤った結論に達する可能性があることが明白であるが、標準化要因Fnorの適用後に、研究は、位置Xi;Yjで200の強度を有する3つのサンプルの目的分子Miの均一な存在を明らかにする。
【0054】
この標準化の後、標準化されたデータマップC1’〜C3’の形で、マップC1’〜C3’のすべてに共通のカラースケールで、分子情報を視認、比較、及び分析することが可能である(モジュール102参照)。得られるスケールは、目的分子Miのためのすべてのデータセットにわたって決定される最低及び最高強度に基づく。
【0055】
当然、メモリにすべてを読み込むことなく、横断していくつかのデータセットJ1〜Jnを統計学的に組み合わせることによって分析するために、3つ以上のデータセット及び対応するマップを生成することが可能である。イメージングデータは、次いで、潜在的なマーカを明らかにするために比較され得る。データを新たに解釈できるように共通の挙動を有する位置を組み合わせることも可能である。
【0056】
換言すれば、本発明は、単一のツールで、定量化可能な品質の標準化された適切な情報を得るために、データを比較及び問い合わせる。いくつかのデータセットは、データを標準化するために画像のそれぞれに書き込まれた品質制御を読み込むことができる。
【0057】
更に、方法は、必要に応じて、最も微細な空間サイズを有するデータセットに配列されるように、いろいろな空間サイズを有する同じ生物学的サンプルのデータセットJ1及びJ2の位置をサイズ変更することができる。PET(Positron Emission Tomography)又はMRI(Magnetic Resonance Imaging)タイプのシステムからのマップの処理と、質量分析計(イメージングMALDI)からのマップの処理を組み合わせることが可能である。
【0058】
単一の画像に共分布のいくつかのデータセットJ1〜Jnを表現することも可能である。「現況マップのフィールドz及びaのための(同じ空間サイズの)すべての位置x及びyのすべての値v、wを選択する」タイプの要求を実現することが可能である。フィールドz及びaは、2つの異なるイメージング技法の値を表現する。
【0059】
データベースBDDへの書き込み要求によって加えられ得る一時的な統計学的処理を実行することも可能である。このようにして、本発明による方法は、多くの場合、分析方法の任意の時点で画像のそれぞれの位置に関する情報を加えることが可能な程度で、大きな柔軟性を提供する。
【0060】
方法は、クライアント/サーバアーキテクチャに基づく。データベースBDDは、単一のインタフェースによって問い合わせられ得る。データは、シングルユーザアーキテクチャ、又はローカルに若しくは(内部若しくは外部)ネットワークを介してアクセス可能なサーバのクラスタに、記憶及び問い合わせられる。クライアントインタフェースソフトウェアは、ワークステーションで又はウェブインタフェースバージョンでインストールされ得る。本発明の別の目的は、複数のデータセットJ1〜Jnを処理する方法の少なくとも一部の工程を実行するメモリ記憶ソフトウェア命令を含むデータサーバ10である。
【0061】
また、データの処理数は容易に増大し、分析されるデータの量は分析に対する制限ではない。データの書き込みは、データベースBDDのサイズに関係なく有効である。
【0062】
当然、上記の説明は一例として与えられ、本発明の分野を限定せず、実施の詳細をすべての他の等価物と置き換えることはその範囲を越えるものではない。
図1
図2
図3
図4
図5