(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-08-16
(45)【発行日】2022-08-24
(54)【発明の名称】データ処理装置及びデータ処理プログラム
(51)【国際特許分類】
G01N 27/447 20060101AFI20220817BHJP
【FI】
G01N27/447 325B
G01N27/447 325E
(21)【出願番号】P 2018209234
(22)【出願日】2018-11-06
【審査請求日】2021-03-12
(73)【特許権者】
【識別番号】000001993
【氏名又は名称】株式会社島津製作所
(74)【代理人】
【識別番号】100179969
【氏名又は名称】駒井 慎二
(74)【代理人】
【識別番号】100176692
【氏名又は名称】岡崎 ▲廣▼志
(72)【発明者】
【氏名】原田 亨
(72)【発明者】
【氏名】熊谷 英郷
(72)【発明者】
【氏名】荻野 康太
【審査官】大瀧 真理
(56)【参考文献】
【文献】特開2006-330852(JP,A)
【文献】国際公開第2014/142229(WO,A1)
【文献】特開2018-025536(JP,A)
【文献】特開平02-269951(JP,A)
【文献】米国特許出願公開第2012/0116689(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G01N 27/447
(57)【特許請求の範囲】
【請求項1】
電気泳動で測定された複数の解析対象データの分類を行うデータ処理装置であって、
前記複数の解析対象データについて所定の比較基準で相互に比較を行う比較部と、
前記比較部による前記比較の結果に基づいて、所定の分類基準で前記複数の解析対象データの分類を行ってグループに分ける分類部と、
を備え、
前記比較基準は、一方の前記解析対象データが有する複数のピークの各々が、他方の前記比較対象データが有する複数のピークの各々とサイズが一致すると許容される範囲内にあるか否かであり、
前記分類基準は、前記解析対象データが有する複数のピークの各々のサイズが一致する割合である、
ことを特徴とするデータ処理装置。
【請求項2】
前記比較部は、前記複数の解析対象データを順々に基準データとして、該基準データと、該基準データと前記比較が行われていない全ての前記解析対象データ各々との前記比較を行うことを特徴とする請求項1に記載のデータ処理装置。
【請求項3】
前記比較部は、前記複数の解析対象データを順々に基準データとして、該基準データと、該基準データと前記比較が行われていない前記解析対象データのうちピーク数が一致するグループの解析対象データ、あるいはピーク数が近いグループの解析対象データとの前記比較を行うことを特徴とする請求項1に記載のデータ処理装置。
【請求項4】
前記比較部は、前記複数の解析対象データをピーク数が多い順にソートし、前記複数の解析対象データを順々に基準データとして、該基準データと、該基準データと前記比較が行われていない前記解析対象データの各々とをについて前記所定の比較基準で相互に比較を行うことを特徴とする請求項1~3のいずれか1項に記載のデータ処理装置。
【請求項5】
前記比較基準は、一方の前記解析対象データと、時間軸の方向にシフト及び伸縮させた他方の前記解析対象データとの相関であり、
前記分類基準は、相互の前記解析対象データの相関の値が閾値を超えているか否かであることを特徴とする請求項1~3のいずれか1項に記載のデータ処理装置。
【請求項6】
前記比較基準は、一方の前記解析対象データと、時間軸の方向にシフトさせた他方の前記解析対象データとの相関であり、
前記分類基準は、相互の前記解析対象データの相関の値が閾値を超えているか否かであることを特徴とする請求項1~3のいずれか1項に記載のデータ処理装置。
【請求項7】
前記分類部による前記分類の結果に基づいて、前記複数の解析対象データの各々と、前記グループを示す符号及び色と、あるいは該符号のみと、あるいは該色のみと、を互いに紐付けて、表示部に表示する表示制御部を備えていることを特徴とする請求項1~6のいずれかに記載のデータ処理装置。
【請求項8】
前記複数の解析対象データについて相互に前記比較を行う比較ステップと、
前記比較ステップによる前記比較の結果に基づいて、前記複数の解析対象データの前記分類を行う分類ステップとを請求項1~7のいずれかのデータ処理装置に実行させることを特徴とするデータ処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、電気泳動で測定されたデータを分類するデータ処理装置及びデータ処理プログラムに関する。
【背景技術】
【0002】
従来、電気泳動で測定されたデータを解析・表示するソフトウエアでは、測定されたデータをエレクトロフェログラムやゲルイメージ等の形態で表示すると共に、ピークの検出を行い、検出したピークに関する時間、サイズ、面積、濃度、モル濃度等を出力する(例えば、特許文献1参照)。また、このようなソフトウエアには、ピークの検出結果を利用する任意の条件式を作成し、その条件式を用いてデータの分類を行うものが存在する。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、データの分類を行う場合、条件式の基準値として絶対値を入力する必要があったり、分類を行うパターン毎に条件を設定する必要があったりする。また、複数のピークが検出されるデータの分類を行う場合には、そのピークの数に応じた多数の条件式を作成する必要がある。このように、データの分類を行う場合、非常に煩雑な操作を事前に行う必要があった。
【0005】
本発明は、上記課題を鑑みてなされたものであり、煩雑な操作を事前に行うことなくデータの分類を行えるデータ処理装置及びデータ処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
上記目的を達成するために、この発明に係るデータ処理装置は、電気泳動で測定された複数の解析対象データの分類を行うデータ処理装置であって、複数の解析対象データについて所定の比較基準で相互に比較を行う比較部と、比較部による比較の結果に基づいて、所定の分類基準で複数の解析対象データの分類を行ってグループに分ける分類部と、を備えている。
【0007】
この発明に係るデータ処理装置では、上記のような比較部及び分類部を備えていることにより、簡単な設定を行うだけで、目視では不可能な分類が可能になり、データ処理に要する負担を減らすことができる。
【0008】
上記データ処理装置において、好ましくは、比較部は、複数の解析対象データを順々に基準データとして、当該基準データと、当該基準データと比較が行われていない全ての解析対象データの各々との比較を行う。好ましくは、比較部は、複数の解析対象データを順々に基準データとして、当該基準データと、当該基準データと比較が行われていない解析対象データのうちピーク数が一致するグループの解析対象データ、あるいはピーク数が近いグループの解析対象データとの比較を行う。また、好ましくは、比較基準は、一方の解析対象データが有する複数のピークの各々が、他方の比較対象データが有する複数のピークの各々とサイズが一致すると許容される範囲内にあるか否かであり、分類基準は、解析対象データが有する複数のピークの各々のサイズが一致する割合である。また、好ましくは、比較基準は、一方の解析対象データと、時間軸の方向にシフト及び伸縮させた他方の解析対象データとの相関であり、分類基準は、相互の解析対象データの相関の値が閾値を超えているか否かである。また、好ましくは、比較基準は、一方の解析対象データと、時間軸の方向にシフトさせた他方の解析対象データとの相関であり、分類基準は、相互の解析対象データの相関の値が閾値を超えているか否かである。さらに、好ましくは、分類部による分類の結果に基づいて、複数の解析対象データの各々と、グループを示す符号及び色と、あるいは該符号のみと、あるいは該色のみと、を互いに紐付けて表示部に表示する表示制御部を備えている。
【0009】
この発明に係るデータ処理プログラムは、複数の解析対象データについて相互に比較を行う比較ステップと、比較ステップによる比較の結果に基づいて、複数の解析対象データの分類を行う分類ステップと、を上記データ処理装置に実行させる。
【発明の効果】
【0010】
本発明によれば、上記のように、煩雑な操作を事前に行うことなくデータの分類を行えるデータ処理装置及びプログラムを提供することができる。
【図面の簡単な説明】
【0011】
【
図1】本発明の第1実施形態に係るデータ処理装置の機能構成を示すブロック図である。
【
図2】分類部によってグループに分けられた複数の解析対象データを示すイメージ図である。
【
図3】表示部における第1の表示態様を示す画像図である。
【
図4】表示部における第2の表示態様を示す画像図である。
【
図5】データ処理装置におけるデータの処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0012】
以下、本発明を具体化した実施形態を図面に基づいて説明する。
【0013】
[第1実施形態]
図1~
図4を参照して、本発明の第1実施形態に係るデータ処理装置1について説明する。
【0014】
まず、
図1~
図4を参照して、本発明の実施形態に係るデータ処理装置1の構成について説明する。
図1は、データ処理装置1の機能構成を示すブロック図である。
図2は、分類部9によってグループに分けられた複数の解析対象データを示すイメージ図である。
図3は、表示部7における第1の表示態様を示す画像図である。
図4は、表示部7における第2の表示態様を示す画像図である。
【0015】
図1に示すデータ処理装置1は、電気泳動で測定された複数の解析対象データの分類を行う装置であり、いわゆる「サイズ許容率(%)」を用いたグルーピングを行う。このデータ処理装置1は、一般的なパーソナルコンピュータに専用のソフトウエア(データ処理プログラム)をインストールすることで実現される。具体的に、データ処理装置1は、CPU2、RAM3、ROM4、不揮発性メモリ5、入力部6、表示部7等を備えている。
【0016】
CPU(Central Processing Unit)2は、各種プログラムを実行することによって、比較部8、分類部9、表示制御部10等の各種機能を実現して、データ処理装置1を統括的に制御する。RAM(Random Access Memory)3は、CPU2の作業領域として使用される。ROM(Read Only Memory)4は、CPU2で実行される基本OSや各種プログラムを記憶している。
【0017】
不揮発性メモリ5は、解析対象データ、所定の比較基準となるデータ、所定の分類基準となるデータ、グループを示すデータ等の各種データを記録している。入力部6は、キーボードやマウス等であり、ユーザによる入力を受け付ける。表示部7は、表示制御部10によって制御されることで各種画像を表示する。
【0018】
比較部8は、複数の解析対象データについて所定の比較基準で相互に比較を行い、その比較の結果を分類部9に出力する。具体的には、比較部8はピークの数が多い順に複数の解析対象データをソートしてから、複数の解析対象データを順々に基準データとして、当該基準データと、当該基準データと比較が行われていない全ての解析対象データの各々との比較を行う。
【0019】
ここでの比較基準は、一方の解析対象データが有する複数のピークの各々が、他方の比較対象データが有する複数のピークの各々とサイズが一致すると許容される範囲(「サイズ許容率(%)」の範囲)内のものであるか否かである。
【0020】
より具体的には、比較部8は一つ目の解析対象データを基準データとした上で、当該基準データが有する複数のピークのサイズと、二つ目以降の解析対象データが有する複数のピークのサイズとの比較を行う。その比較は、基準データのピークに対して、比較の相手となる解析対象データのピークが「サイズ許容率(%)」の範囲内に存在するか否かで行う。
【0021】
例えば、基準データのピークのサイズが561で、サイズ許容率が5%の場合、比較の相手となる解析対象データのピークが534(≒561÷1.05)を超えるサイズで、且つ589(≒561×1.05)以下のサイズであれば、サイズが一致すると許容される範囲内のピークが存在することになる。
【0022】
なお、基準データの二つのピークのサイズが近く範囲が重なる場合は、相乗平均を境界値とする。例えば、基準データのピークのサイズが561と595の場合、577.7が境界値になる。
【0023】
その後、比較部8は、二つ目の解析対象データを基準データとした上で、当該基準データが有する複数のピークのサイズと、三つ目以降の解析対象データが有する複数のピークのサイズとの比較を行う。以後同様に、比較部8は、三つ目以降の解析対象データについても基準データとした上で、当該基準データが有する複数のピークのサイズと、それ以降の解析対象データが有する複数のピークのサイズとの比較を行う。結果として、比較部8は、全ての解析対象データについて総当たりで相互に比較を行うことになる。なお、比較部8における比較対象を、サイズ、フィッティング、アライメント等、何れの場合も、例えばピーク数が一致するグループの解析対象データ、あるいはピーク数が近いグループの解析対象データに制限してもよい。
【0024】
分類部9は、比較部8による比較の結果に基づいて、所定の分類基準で複数の解析対象データの分類を行ってグループに分け、その分類の結果を表示制御部10に出力する。分類基準は、解析対象データが有する全てのピークの各々のサイズが一致する(と許容される範囲内である)かである。すなわち、分類基準は、解析対象データが有する複数のピークの各々のサイズが一致する(と許容される範囲内の)割合が100%となるかである。
【0025】
図2に示すように、複数の解析対象データは、分類部9によってグループに分けられる。
図2の下方に示す符号A~Eは、説明の便宜上のものであり、同一の符号が付された解析対象データは、互いに同じグループに分けられたものである。
【0026】
図1に戻って説明する。表示制御部10は、分類部9による分類の結果に基づいて、複数の解析対象データの各々と、グループを示す符号及び色とを互いに紐付けて表示部7に表示する。なお、符号のみ、あるいは色のみによって紐付けてもよい。
【0027】
図3に示すように、ゲルイメージに対しグループIDとその色を付すことで、グルーピング結果を表示する。この場合、グループID「1」とその色(例えば赤色)が付された解析対象データは、互いに同じグループに分けられたものである。
【0028】
同様に、グループID「2」とその色(例えば青色)が付された解析対象データは、互いに同じグループに分けられたものである。また、グループID「3」とその色(例えば緑色)が付された解析対象データは、互いに同じグループに分けられたものである。
【0029】
あるいは、
図4に示すように、測定された試料が配置されていた位置を示すウェル表示に
図3の場合と同様にグルーピング結果を表示する。
【0030】
なお、複数のグループに該当し得る解析対象データが存在する場合には、当該解析対象データを、全体的に差が小さいグループに分類したり、表示部7に警告表示したりする等の処理を行う。
【0031】
(データの処理)
次に、
図5を参照して、データ処理装置1によるデータの処理について説明する。
図5は、データ処理装置1におけるデータの処理の流れを示すフローチャートである。
【0032】
図5に示すように、データ処理装置1は、入力ステップS1と、比較ステップS2と、分類ステップS3と、表示ステップS4とをその順番に実行する。
【0033】
入力ステップS1は、入力部6等によって解析対象データやパラメータが入力される工程である。入力が必須のパラメータには、サイズ許容率(%)がある。入力が任意のパラメータには、解析対象データ内で解析対象とする範囲(時間、サイズや内部標準マーカによる正規化時間等で指定する)がある。過去に入力されたパラメータから変更が無い場合には、その入力を省略するものとしてもよい。
【0034】
比較ステップS2は、比較部8によって複数の解析対象データについて相互に比較を行う工程である。
【0035】
分類ステップS3は、比較ステップS2による比較の結果に基づいて、分類部9によって複数の解析対象データの分類を行う工程である。
【0036】
表示ステップS4は、分類ステップS3による分類の結果に基づいて、表示制御部10によって表示部7に、複数の解析対象データの各々と、グループを示す符号及び色とを互いに紐付けて表示させる工程である。ここでは、符号のみと、あるいは色のみと紐付けて表示してもよい。
【0037】
(実施形態の効果)
本発明の第1実施形態では、以下のような効果を得ることができる。
【0038】
第1実施形態では、上記のように、データ処理装置1は、電気泳動で測定された複数の解析対象データの分類を行うデータ処理装置であって、複数の解析対象データについて所定の比較基準で相互に比較を行う比較部8と、比較部8による比較の結果に基づいて、所定の分類基準で複数の解析対象データの分類を行ってグループに分ける分類部9とを備えている。これにより、簡単な設定を行うだけで、目視では不可能な分類が可能になり、データ処理に要する負担を減らすことができる。すなわち、煩雑な操作を事前に行うことなくデータの分類を行うことができる。
【0039】
また、本実施形態では、比較部8は、複数の解析対象データを順々に基準データとして、当該基準データと、当該基準データと比較が行われていない全ての解析対象データの各々との比較を行う。ここでの比較対象を、ピーク数が一致するグループの解析対象データ、あるいはピーク数が近いグループの解析対象データに制限してもよい。
【0040】
また、本実施形態では、比較基準は、一方の解析対象データが有する複数のピークの各々が、他方の比較対象データが有する複数のピークの各々とサイズが一致すると許容される範囲内のものであるか否かであり、分類基準は、解析対象データが有する複数のピークの各々のサイズが一致する割合である。
【0041】
また、本実施形態では、複数の解析対象データの各々と、グループを示す符号又は色と、を互いに紐付けて、表示部7に表示する表示制御部10を備えている。なお、符号のみと、あるいは色のみと紐付けて表示してもよい。
【0042】
また、本実施形態では、データ処理プログラムは、複数の解析対象データについて相互に比較を行う比較ステップS2と、比較ステップS2による比較の結果に基づいて、複数の解析対象データの分類を行う分類ステップS3とをデータ処理装置1に実行させる。
【0043】
[第2実施形態]
次に、
図1を参照して、本発明の第2実施形態に係るデータ処理装置1について説明する。いわゆる「サイズ許容率(%)」を用いたグルーピングを行う第1実施形態とは異なり、第2実施形態では、いわゆる「フィッティング(波形フィッティング)」を用いたグルーピングを行うように構成されている。なお、第2実施形態に係るデータ処理装置1は、上記第1実施形態と同様の構成を有しており、同様の構成についてはその説明を適宜省略する。
【0044】
比較部8は、複数の解析対象データについて所定の比較基準で相互に比較を行い、その比較の結果を分類部9に出力する。具体的には、比較部8は複数の解析対象データを順々に基準データとして、当該基準データと、当該基準データと比較が行われていない全ての解析対象データの各々との比較を行う。比較基準は、一方の解析対象データと、時間軸の方向にシフト及び伸縮させた他方の解析対象データとの相関である。
【0045】
より具体的には、比較部8は一つ目の解析対象データを基準データとした上で、当該基準データに対して、二つ目以降の解析対象データのフィッティング(時間軸の方向にシフト及び伸縮させること)を行い、基準データに対する相関の値を取得する。その後、比較部8は、二つ目の解析対象データを基準データとした上で、当該基準データに対して、三つ目以降の解析対象データのフィッティングを行い、基準データに対する相関の値を取得する。
【0046】
以後同様に、比較部8は、三つ目以降の解析対象データについても基準データとした上で、当該基準データに対して、それ以降の解析対象データのフィッティングを行い、基準データに対する相関の値を取得する。結果として、比較部8は、全ての解析対象データについて総当たりで相互に比較を行うことになる。
【0047】
分類部9は、比較部8による比較の結果に基づいて、所定の分類基準で複数の解析対象データの分類を行ってグループに分け、その分類の結果を表示制御部10に出力する。分類基準は、相互の解析対象データの相関の値が閾値を超えているか否かである。すなわち、分類部9は、解析対象データ同士の相関の値が閾値より高い場合に、同じグループとして分類する。「フィッティング」についての詳細は、本願出願と同一出願人による、例えば、特開2018-025536号公報を参照されたい。
【0048】
なお、複数のグループに該当し得る解析対象データが存在する場合には、当該解析対象データを、相関の値が高いグループに分類したり、表示部7に警告表示したりする等の処理を行う。
【0049】
入力部6等によって入力される必須のパラメータには、フィッティングを行うときの「シフト許容値」や「伸縮許容値」がある。入力部6等によって入力される任意のパラメータには、同一のグループと判断するための閾値や、解析対象データ内で解析対象とする範囲(時間、サイズ、内部標準マーカによる正規化時間等で指定する)がある。
【0050】
[第3実施形態]
次に、
図1を参照して、本発明の第3実施形態に係るデータ処理装置1について説明する。いわゆる「サイズ許容率(%)」を用いたグルーピングを行う第1実施形態や、いわゆる「フィッティング」を用いたグルーピングを行う第2実施形態とは異なり、第3実施形態では、いわゆる「アライメント(波形アライメント)」を用いたグルーピングを行うように構成されている。
【0051】
なお、第3実施形態に係るデータ処理装置1は、上記第1実施形態や上記第2実施形態と同様の構成を有しており、同様の構成についてはその説明を適宜省略する。
【0052】
比較部8は、複数の解析対象データについて所定の比較基準で相互に比較を行い、その比較の結果を分類部9に出力する。具体的に、比較部8は、複数の解析対象データを順々に基準データとして、当該基準データと、当該基準データと比較が行われていない全ての解析対象データの各々との比較を行う。比較基準は、一方の解析対象データと、時間軸の方向にシフトさせた他方の解析対象データとの相関である。
【0053】
より具体的には、比較部8は一つ目の解析対象データを基準データとした上で、当該基準データに対して、二つ目以降の解析対象データのアライメント(時間軸の方向にシフトさせること)を行い、基準データに対する相関の値を取得する。その後、比較部8は、二つ目の解析対象データを基準データとした上で、当該基準データに対して、三つ目以降の解析対象データのアライメントを行い、基準データに対する相関の値を取得する。
【0054】
以降同様に、比較部8は、三つ目以降の解析対象データについても基準データとした上で、当該基準データに対して、それ以降の解析対象データのアライメントを行い、基準データに対する相関の値を取得する。結果として、比較部8は、全ての解析対象データについて総当たりで相互に比較を行うことになる。
【0055】
分類部9は、比較部8による比較の結果に基づいて、所定の分類基準で複数の解析対象データの分類を行ってグループに分け、その分類の結果を表示制御部10に出力する。分類基準は、相互の解析対象データの相関の値が閾値を超えているか否かである。すなわち、分類部9は、解析対象データ同士の相関の値が閾値より高い場合に、同じグループとして分類する。
【0056】
なお、複数のグループに該当し得る解析対象データが存在する場合には、当該解析対象データを、相関の値が高いグループに分類したり、表示部7に警告表示したりする等の処理を行う。
【0057】
入力部6等によって入力される必須のパラメータには、アライメントを行うときの「シフト許容値」がある。入力部6等によって入力される任意のパラメータには、同一のグループと判断するための閾値や、解析対象データ内で解析対象とする範囲(例えば、時間、サイズ、内部標準マーカによる正規化時間等で指定する)がある。
【0058】
(変形例)
なお、上述した実施形態は、いずれも全ての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記した実施形態の説明ではなく請求の範囲によって示され、さらに請求の範囲と均等の意味及び範囲内での全ての変更(変形例)が含まれる。
【0059】
例えば、上記第1実施形態において、分類部9による分類基準は、解析対象データが有する全てのピークの各々のサイズが一致する(と許容される範囲内である)かであるが、本発明はこれに限定されるものではない。すなわち、本発明において、分類部9による分類基準は、解析対象データが有する複数のピークの各々のサイズが一致する(と許容される範囲内の)割合であり、その割合が100%である必要はない。
【符号の説明】
【0060】
1 データ処理装置
2 CPU
3 RAM
4 ROM
5 不揮発性メモリ
6 入力部
7 表示部
8 比較部
9 分類部
10 表示制御部
S1 入力ステップ
S2 比較ステップ
S3 分類ステップ
S4 表示ステップ