(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-07-07
(45)【発行日】2023-07-18
(54)【発明の名称】細孔電気抵抗法による測定対象粒子の細孔通過にともなうイオン電流の過渡変化を計測し、そのパルス波形を解析するための機械学習プログラム、方法、および装置
(51)【国際特許分類】
G01N 27/00 20060101AFI20230710BHJP
【FI】
G01N27/00 Z
(21)【出願番号】P 2021511812
(86)(22)【出願日】2019-04-01
(86)【国際出願番号】 JP2019014544
(87)【国際公開番号】W WO2020202446
(87)【国際公開日】2020-10-08
【審査請求日】2022-02-25
(73)【特許権者】
【識別番号】518437671
【氏名又は名称】アイポア株式会社
(74)【代理人】
【識別番号】110000523
【氏名又は名称】アクシス国際弁理士法人
(72)【発明者】
【氏名】直野 典彦
【審査官】吉田 将志
(56)【参考文献】
【文献】特開2017-120257(JP,A)
【文献】国際公開第2017/217185(WO,A1)
【文献】特表2014-521962(JP,A)
【文献】国際公開第2018/207524(WO,A1)
【文献】特開2006-105943(JP,A)
【文献】特開2018-180993(JP,A)
【文献】特開2018-205948(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G01N 27/00
JSTPlus/JMEDPlus/JST7580(JDreamIII)
(57)【特許請求の範囲】
【請求項1】
粒子を含む電解液で充填される2つのチャンバの間で、粒子が通過可能な細孔で接続された構造を有し、前記2つのチャンバが各々電解液と接触する電極をもつ構造を有するセンサを利用し、
前記センサの電極間に電圧を印加し、粒子が細孔を通過する際の電極間を流れるイオン電流の過渡変化を表すパルス波形より抽出された特徴量を教師データおよび分析対象データとして機械学習を行う装置であって、
前記装置は記憶手段を含み、
前記記憶手段は、
機械学習プログラムと、
検索器と、
粒子の宿主属性情報を、粒子の宿主を特定する宿主IDと関連付けて記憶する宿主属性テーブルと、
前記センサの出力するパルス波形より抽出された特徴量群と粒子の種類を示す粒種情報を、宿主IDと関連付けて記憶する特徴量テーブルと
を有し、
前記検索器が、第1の宿主属性情報を検索キーとして前記宿主属性テーブルを検索し、前記第1の宿主属性情報に関連付けられた第1の宿主IDと第2の宿主IDを抽出するように構成され、
前記検索器が、前記第1の宿主IDを検索キーとして前記特徴量テーブルを検索して第1の種類に属する第1の既知粒子より得られた第1の教師特徴量群を抽出し、また前記第2の宿主IDを検索キーとして前記特徴量テーブルを検索して前記第1の種類に属する第2の既知粒子より得られた第2の教師特徴量群を抽出するように構成され、
前記機械学習プログラムが、前記第1の教師特徴量群と前記第2の教師特徴量群をあわせて教師データとして、かつ前記第1の種類を表す第1の粒種情報を教師ラベルとして学習することで機械学習最適化パラメタを計算するように構成され、
前記機械学習プログラムが前記第1の宿主属性情報を有する未知粒子より得られた分析対象特徴量群を入力値として前記機械学習最適化パラメタを用いて、前記未知粒子が前記第1の種類に属するか否かを判別するように構成される
ことを特徴とする装置。
【請求項2】
前記センサとネットワークを介して接続可能なサーバである、請求項1に記載の装置。
【請求項3】
既知粒子を含む電解液で充填される2つのチャンバの間で、既知粒子が通過可能な細孔で接続された構造を有し、前記2つのチャンバが各々電解液と接触する電極をもつ構造を有するセンサに接続し、
前記センサの電極間に電圧を印加し、既知粒子が細孔を通過する際の電極間を流れるイオン電流の過渡変化を教師波形として取得し、教師波形より教師特徴量を抽出し、教師特徴量を学習データ、既知粒子の種類を教師データとして学習することで機械学習最適化パラメタを計算し、
前記センサの電極間に電圧を印加し、未知粒子が細孔を通過する際の電極間のイオン電流の過渡変化を分析対象波形として取得し、分析対象波形より抽出した分析対象特徴量と機械学習最適化パラメタを用いて、前記未知粒子の種類を特定する機械学習プログラムであって、
第1の宿主より生じかつ第1の種類に属する第1の既知粒子から得られた第1の教師特徴量、および第2の宿主から生じかつ前記第1の種類に属する第2の既知粒子から得られた第2の教師特徴量を学習データとし、前記第1の教師特徴量および前記第2の教師特徴量をあわせて教師データとして学習することで機械学習最適化パラメタを計算し、
第3の宿主より生じた第1の未知粒子から得られた第1の分析対象特徴量を入力値として、前記機械学習最適化パラメタを用いて前記第1の未知粒子が前記第1の種類に属することを判別する機械学習プログラム。
【請求項4】
既知粒子を含む電解液で充填される2つのチャンバの間で、既知粒子が通過可能な細孔で接続された構造を有し、前記2つのチャンバが各々電解液と接触する電極をもつ構造を有するセンサに接続し、
前記センサの電極間に電圧を印加し、既知粒子が細孔を通過する際の電極間を流れるイオン電流の過渡変化を教師波形として取得し、教師波形より教師特徴量を抽出し、教師特徴量を学習データ、既知粒子の種類を教師データとして学習することで機械学習最適化パラメタを計算し、
前記センサの電極間に電圧を印加し、未知粒子が細孔を通過する際の電極間のイオン電流の過渡変化を分析対象波形として取得し、分析対象波形より抽出した分析対象特徴量と機械学習最適化パラメタを用いて、前記未知粒子の種類を特定する機械学習プログラムであって、
第1の宿主属性を有する第1の宿主より生じかつ第1の種類に属する第1の既知粒子から得られた第1の教師特徴量群および前記第1の宿主属性を表す第1の宿主属性情報と、第2の宿主属性を有する第2の宿主より生じかつ前記第1の種類に属する第2の既知粒子から得られた第2の教師特徴量群および前記第2の宿主属性を表す第2の宿主属性情報と、をあわせて教師データとして、かつ前記第1の種類を表す第1の粒種情報を教師ラベルとして、学習することで、機械学習最適化パラメタを計算し、
第3の宿主属性を有する第3の宿主より生じた未知粒子から得られた第1の分析対象特徴量群と前記第3の宿主を表す第3の宿主属性情報を入力値として、前記機械学習最適化パラメタを用いて、前記未知粒子が前記第1の種類に属するか否かを判別することを特徴とする機械学習プログラム。
【請求項5】
前記既知粒子および前記未知粒子がウイルスであることを特徴とする請求項3乃至請求項4記載の機械学習プログラム。
【請求項6】
前記既知粒子および前記未知粒子が細菌であることを特徴とする請求項3乃至請求項4記載の機械学習プログラム。
【請求項7】
前記機械学習プログラムがさらに、
前記第1の教師特徴量、前記第2の教師特徴量、および前記第1の分析対象特徴量を、前記センサより前記教師波形および前記分析対象波形を受け取った情報端末が生成し、
前記第1の教師特徴量、前記第2の教師特徴量、および前記第1の分析対象特徴量を、前記情報端末からネットワークを経由してサーバに送り、
前記サーバが学習および判別を実行することを特徴とする請求項3に記載の機械学習プログラム。
【請求項8】
前記機械学習プログラムがさらに、
前記第1の教師特徴量群、前記第2の教師特徴量群、および前記第1の分析対象特徴量群を、前記センサより前記教師波形および前記分析対象波形を受け取った情報端末が生成し、
前記第1の教師特徴量群、前記第2の教師特徴量群、および前記第1の分析対象特徴量群を、前記情報端末からネットワークを経由してサーバに送り、
前記サーバが学習および判別を実行することを特徴とする請求項4に記載の機械学習プログラム。
【請求項9】
前記教師データが、第1の宿主属性を有する第1の宿主より生じかつ第1の種類に属する第1の既知粒子から得られた第1の教師特徴量群、第1の生体を特定する第1の宿主IDおよび前記第1の宿主属性を表す第1の宿主属性情報と、第2の宿主属性を有する第2の宿主より生じかつ前記第1の種類に属する第2の既知粒子から得られた第2の教師特徴量群、第2の生体を特定する第2の宿主IDおよび前記第2の宿主属性を表す第2の宿主属性情報と、をあわせたものであり、
前記入力値が、第3の宿主属性を有する第3の宿主より生じた未知粒子から得られた第1の分析対象特徴量群、第3の生体を特定する第3の宿主IDおよび前記第3の宿主を表す第3の宿主属性情報であることを特徴とする請求項4に記載の機械学習プログラム。
【請求項10】
前記既知粒子および前記未知粒子がウイルスであることを特徴とする請求項9に記載の機械学習プログラム。
【請求項11】
前記既知粒子および前記未知粒子が細菌であることを特徴とする請求項9に記載の機械学習プログラム。
【請求項12】
前記機械学習プログラムがさらに、
前記第1の教師特徴量群、前記第2の教師特徴量群、および前記第1の分析対象特徴量群を、前記センサより前記教師波形および前記分析対象波形を受け取った情報端末が生成し、
前記第1の教師特徴量群、前記第2の教師特徴量群、および前記第1の分析対象特徴量群を、前記情報端末からネットワークを経由してサーバに送り、
前記サーバが学習および判別を実行することを特徴とする請求項9に記載の機械学習プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、細孔電気抵抗法による測定対象粒子の細孔通過にともなうイオン電流の過渡変化を計測し、そのパルス波形を解析するための機械学習プログラム、方法、および装置に関する。
【背景技術】
【0002】
ウイルス、細菌等のミクロンからサブミクロンサイズの粒子の電荷を計測する手段として、電解液中の測定対象粒子が細孔を通過する際のイオン電流の過渡変化を測定する提案がなされている(特許文献1)。以下ではこのように粒子の細孔通過にともなうイオン電流の過渡変化を測定する方法を、細孔電気抵抗法という。近年は、シリコン薄膜を使った細孔を形成し細孔の厚さを50nm程度と薄くすることで、測定対象粒子の体積のみでなく微細な構造や表面電荷などの情報を計測することができるようになった(特許文献2)。また、このイオン電流の過渡変化と機械学習による情報処理を組み合わせて、測定対象粒子の種類が何であるかを高精度で識別する技術が提案されている(特許文献3)。
【0003】
これらの特許文献に記載される従来の細孔電気抵抗法では、2つのチャンバが細孔で接続された構造のセンサーを利用する。2つのチャンバおよび細孔を、粒子を含む電解液で充填した上、各々のチャンバで電解液と接触する2つの電極の間に電圧を印加すると、イオン電流が流れる。電荷をもった粒子は、電気泳動等によって移動し、細孔を通過する。この通過の際、前記2つの電極の間の電気抵抗が過渡的に変化する。この過渡的電流変化をパルス波形として取り出し、その波形情報を機械学習プログラムによって解析をすることで、細孔を通過した粒子の種類を識別する。
【0004】
このような機械学習には教師あり学習が用いられ、第1に学習、第2に識別の二つのステップによっておこなわれる。
【0005】
第1のステップである学習は、たとえば次のように行われる。まず種類が既知の粒子検体を電解液に導入して、これらの粒子の中の1つが細孔を通過するごとに1つの波形を得る。ウイルスや細菌などの粒子測定では、電解液中には多数の粒子が含まれるため、通常1度の測定で多数の波形を得る。したがって、細孔電気抵抗法における機械学習プログラムには、このようにして得られた多数の波形情報から抽出した教師特徴量を教師データとし、またこれらすべての波形情報の正解ラベルとしてこの検体の種類を与えた上で、誤差関数が最小となるように、機械学習モデルの最適化パラメタを算出する。
【0006】
第2のステップである識別はたとえば次のように行われる。未知の粒子を含む検体を電解液に導入し未知粒子のパルスを得る。これら未知の粒子の中の1つが細孔を通過するごとに1つの波形を得る。機械学習プログラムは、ここで得られた各々の波形から抽出した分析対象特徴量を、ステップ1で算出した最適化パラメタを有する機械学習モデルに与えることで、細孔を通過した各々の粒子が、学習の際教師ラベルとして粒子と同じ種類である確率を算出する。細孔電気抵抗法と機械学習との組み合わせによれば、このように分析対象粒子の1つ1つの種類を識別することができる。
【0007】
これまで開示されている技術によれば(非特許文献1)、以下のような交差検定によって識別の正確性が評価されてきた。
【0008】
たとえば種類がX型とわかっているウイルス株を培養によって増殖させた上で、このX型ウイルス粒子群を電解液に導入し、細孔電気抵抗法によってX型粒子の細孔通過に起因するパルス群を取得する。同様に、たとえば種類がY型とわかっているウイルス株を培養によって増殖させた上で、このY型ウイルス粒子群を電解液に導入し、細孔電気抵抗法によってY型粒子の細孔通過に起因するパルス群を取得する。
【0009】
次にX型粒子パルス群の一部とY型粒子パルス群の一部を教師データ、残りを検定用データに分ける。まず教師データとして分けたX型粒子のパルス群に教師ラベル「X」を、また教師データとして分けたY型粒子のパルス群に教師ラベル「Y」を各々付けて、機械学習モデルに入力し、機械学習最適化パラメタを計算する。
【0010】
次に、残る検定用データとして分けたパルスの1つ1つを上記教師データで最適化したパラメタを有する機械学習モデルに入力して検定を行う。取得したパルス群の、教師データおよび検定用データの切り分けを変えながら、複数回検定を行いその正解率の平均をとることで、多くの測定データを用いずに、この機械学習モデルの真の正解率に近い正解率を導くことができる。
【先行技術文献】
【特許文献】
【0011】
【文献】特表2014-521962号公報
【文献】特許第5866652号公報
【文献】特開2017-120257号公報
【非特許文献】
【0012】
【文献】ARIMA et al、SCIETNIFIC REPORTS (2018)8:16305
【発明の概要】
【発明が解決しようとする課題】
【0013】
しかし、このようなこれまでの方法によって良好な正解率を得たとしても、以下2つの理由によってその学習モデルが実用的価値を持つ保証にはならなかった。
【0014】
第1の理由は、学習に用いるパルスと検定に用いるパルスが一度の測定によって取得されたパルス点である。現実のウイルス、細菌をはじめとするミクロンからナノサイズの粒子の識別においては、学習と識別をひとつの測定によって得られたパルス群で行うことはあり得ない。識別のための測定では、その正解である粒子の種類がわからないから測定するのであって、学習が可能な正解ラベルの付いた粒子の測定であるなら、識別をする必要がもとよりない。実用的には、学習のためのパルス測定と、識別のためのパルス測定は異なるものでなければならない。
【0015】
第2の理由は、学習におけるパルスと検定に用いるパルスが同じ環境で発生した点である。現実の粒子識別ではこれも起こりえない。たとえば、同じ型のウイルスであっても、発育鶏卵を用いた培養によるウイルスと、人体より採取したウイルスでは、その形状や表面電荷の状態が異なる。また、同じ型のウイルスであっても、宿主によって、ウイルスが異なる性質を有している可能性が高い。このように実用的には、異なる環境で発生した同種ウイルスを同種と識別できなければ、また異なる宿主を持つ同種ウイルスを同種と識別できなければならない。
【0016】
これまで提案されている技術では、このような実用的識別を可能とする方法が実現できていない。
【課題を解決するための手段】
【0017】
本発明は、このような状況に鑑みてなされたものであり、本発明の実施形態では細孔電気抵抗法によるパルスを用いて、臨床検査に利用可能な以下の態様を提供できる。
【0018】
粒子を含む電解液で充填される2つのチャンバの間で、粒子が通過可能な細孔で接続された構造を有し、前記2つのチャンバが各々電解液と接触する電極をもつ構造を有するセンサを利用し、
前記センサの電極間に電圧を印加し、粒子が細孔を通過する際の電極間を流れるイオン電流の過渡変化を表すパルス波形より抽出された特徴量を教師データおよび分析対象データとして機械学習を行う装置であって、
前記装置は記憶手段を含み、
前記記憶手段は、
機械学習プログラムと、
検索器と、
粒子の宿主属性情報を、粒子の宿主を特定する宿主IDと関連付けて記憶する宿主属性テーブルと、
前記センサの出力するパルス波形より抽出された特徴量群と粒子の種類を示す粒種情報を、宿主IDと関連付けて記憶する特徴量テーブルと
を有し、
前記検索器が、第1の宿主属性情報を検索キーとして前記宿主属性テーブルを検索し、前記第1の宿主属性情報に関連付けられた第1の宿主IDと第2の宿主IDを抽出するように構成され、
前記検索器が、前記第1の宿主IDを検索キーとして前記特徴量テーブルを検索して第1の種類に属する第1の既知粒子より得られた第1の教師特徴量群を抽出し、また前記第2の宿主IDを検索キーとして前記特徴量テーブルを検索して前記第1の種類に属する第2の既知粒子より得られた第2の教師特徴量群を抽出するように構成され、
前記機械学習プログラムが、前記第1の教師特徴量群と前記第2の教師特徴量群をあわせて教師データとして、かつ前記第1の種類を表す第1の粒種情報を教師ラベルとして学習することで機械学習最適化パラメタを計算するように構成され、
前記機械学習プログラムが前記第1の宿主属性情報を有する未知粒子より得られた分析対象特徴量群を入力値として前記機械学習最適化パラメタを用いて、前記未知粒子が前記第1の種類に属するか否かを判別するように構成される
ことを特徴とする装置。
【0019】
既知粒子を含む電解液で充填される2つのチャンバの間で、既知粒子が通過可能な細孔で接続された構造を有し、前記2つのチャンバが各々電解液と接触する電極をもつ構造を有するセンサに接続し、
前記センサの電極間に電圧を印加し、既知粒子が細孔を通過する際の電極間を流れるイオン電流の過渡変化を教師波形として取得し、教師波形より教師特徴量を抽出し、教師特徴量を学習データ、既知粒子の種類を教師データとして学習することで機械学習最適化パラメタを計算し、
前記センサの電極間に電圧を印加し、未知粒子が細孔を通過する際の電極間のイオン電流の過渡変化を分析対象波形として取得し、分析対象波形より抽出した分析対象特徴量と機械学習最適化パラメタを用いて、前記未知粒子の種類を特定する機械学習プログラムであって、
第1の宿主より生じかつ第1の種類に属する第1の既知粒子から得られた第1の教師特徴量、および第2の宿主から生じかつ前記第1の種類に属する第2の既知粒子から得られた第2の教師特徴量を学習データとし、前記第1の教師特徴量および前記第2の教師特徴量をあわせて教師データとして学習することで機械学習最適化パラメタを計算し、
第3の宿主より生じた第1の未知粒子から得られた第1の分析対象特徴量を入力値として、前記機械学習最適化パラメタを用いて前記第1の未知粒子が前記第1の種類に属することを判別する機械学習プログラム。
【0020】
既知粒子を含む電解液で充填される2つのチャンバの間で、既知粒子が通過可能な細孔で接続された構造を有し、前記2つのチャンバが各々電解液と接触する電極をもつ構造を有するセンサに接続し、
前記センサの電極間に電圧を印加し、既知粒子が細孔を通過する際の電極間を流れるイオン電流の過渡変化を教師波形として取得し、教師波形より教師特徴量を抽出し、教師特徴量を学習データ、既知粒子の種類を教師データとして学習することで機械学習最適化パラメタを計算し、
前記センサの電極間に電圧を印加し、未知粒子が細孔を通過する際の電極間のイオン電流の過渡変化を分析対象波形として取得し、分析対象波形より抽出した分析対象特徴量と機械学習最適化パラメタを用いて、前記未知粒子の種類を特定する機械学習プログラムであって、
第1の宿主属性を有する第1の宿主より生じかつ第1の種類に属する第1の既知粒子から得られた第1の教師特徴量群および前記第1の宿主属性を表す第1の宿主属性情報と、第2の宿主属性を有する第2の宿主より生じかつ前記第1の種類に属する第2の既知粒子から得られた第2の教師特徴量群および前記第2の宿主属性を表す第2の宿主属性情報と、をあわせて教師データとして、かつ前記第1の種類を表す第1の粒種情報を教師ラベルとして、学習することで、機械学習最適化パラメタを計算し、
第3の宿主属性を有する第3の宿主より生じた未知粒子から得られた第1の分析対象特徴量群と前記第3の宿主を表す第3の宿主属性情報を入力値として、前記機械学習最適化パラメタを用いて、前記未知粒子が前記第1の種類に属するか否かを判別することを特徴とする機械学習プログラム。
【発明の効果】
【0021】
本発明の実施形態によれば、細孔電気抵抗法によるパルス信号を用いて、臨床検査等に利用可能な、粒子の実用的な識別を行うことができる。
【図面の簡単な説明】
【0022】
【
図1】細孔電気抵抗法によるセンサモジュールの構造の一例の模式図である。
【
図2】センサモジュールによって検知するパルス波形の模式的な一例を示す。
【
図3】本発明の或る実施形態に係る機械学習システムまたは装置の一例を示す。
【
図5】
図3の機械学習システムに含まれるサーバの構成の一例を示す。
【
図6】本発明の或る実施形態で行うことができる学習の情報処理のフロー図を示す。
【
図9】
図6の情報処理に後続する、識別に関する情報処理の一例を示す。
【
図10】同じ宿主属性情報を有する宿主由来の既知粒子のみから得られたパルス波形から特徴量セット群を抽出し、その特徴量セット群のみを使って機械学習最適化パラメタを計算する処理の一例を示すフロー図である。
【発明を実施するための形態】
【0023】
(構成)
図1に、細孔電気抵抗法によるセンサモジュールの構造の一例を模式的に示す。センサモジュール101乃至103はそれぞれ、電解液導入口111および121、チャンバ110および120、シリコンウェハ141およびその上に成膜された薄膜(メンブレン)142を加工して成形される細孔140、2つのチャンバを隔てる隔壁130、チャンバ110および120内に各々ある電極112および122、これらの電極に電位差を与える電源152およびこれらの電極間を流れるイオン電流を測定する電流計151、信号を増幅するアンプ150より成る。当該チャンバは、マイクロチャンバであってもよい。
図1に示す各区の番号は、同じ構造を有するセンサの構成要素を意味する番号であり、特定のセンサモジュールの一部だけを指し示すものではない。
【0024】
識別対象粒子の種類を識別(判別)するためには、まず識別対象粒子190を含む電解液が導入口111または121より導入され、チャンバ110、120および細孔140内に充填される。識別対象粒子はチャンバ110、120の両方にあってもよく、また片方のみにあってもよい。次に電源152が電極112および122間に電圧を印加する。帯電したチャンバ内の測定対象粒子190が、たとえば前記電圧によりチャンバ110より細孔140を経由してチャンバ120に移動する。この際、細孔140内にある電解液を排斥することで電極112および122間のイオン電流が減少する。このイオン電流の過渡的時間変化をアンプ150で増幅の後、電流計151が観測する。なお
図1は本発明の実施形態で利用できるセンサ構造の一例を示すものに過ぎず、細孔電気抵抗法による電流の過渡的時間変化を用いて機械学習で粒子識別をおこなうことのできるセンサであればどのようなものでも利用できる。
【0025】
図2に、センサモジュール101乃至103によって検知したパルス波形の模式的な一例を示す。
図2の例では、横軸は時間(time)、縦軸が電極112と電極122の間を流れるイオン電流(ion current)を表す。電流値201は識別対象粒子がチャンバ110内で細孔140から離れている状態、電流値202は細孔140の通過時で細孔140内のイオンが粒子によって排斥されることで電流値が低下した状態、電流値203は細孔140の通過後に粒子がチャンバ120内で細孔140から離れた状態に、それぞれ対応する。一般に、チャンバ110には多数の識別対象粒子が存在するため、一度の測定で
図2に例示するようなパルス波形が多数観測されることになる。
【0026】
図3に、本発明の実施形態に係る機械学習システム(または装置)の一例を示す。ここで言う「装置」は、システムに含まれる複数のハードウェアをまとめて総称する(まとめて含む)ものと考えてもよいし、あるいはいずれかのハードウェアのみを指す語であってもよい。センサモジュール101乃至103で発生したイオン電流の過渡変化によるパルス波形は、増幅および電流値の計測およびデジタイズを担う測定器320に送られる。
図1におけるアンプ150、電流計151、および電源152を、この測定器320が提供してもよい。デジタル信号に変換されたパルス波形は情報端末340に送られる。
図3の一例では、情報端末340はネットワーク399を経由してサーバ360と接続される(すなわち、情報端末340はクライアント端末であってよい)。ネットワーク399は無線ネットワークであってもよいし有線ネットワークでもよい。ある態様では、情報端末340が、無線ネットワークに接続できるモバイル端末であってもよい。後述する本発明の実施形態に係る機械学習プログラムは、情報端末340に実装されていても、サーバ260に実装されていてもよい。また本機械学習プログラムが利用する、パルス波形を取得するシステム構成は
図3に示したものに限定されず、どのような構成でもよい。以下の説明のために示す
図3に示す点線は、センサモジュール101乃至103を適宜接続し直して利用することを表しており、センサモジュール101乃至103を同時に測定器320に接続して利用しなくてもよいことを意味する。しかしながら別の実施形態では、複数のセンサモジュールを同時に接続して利用可能な測定器を用いていてもよい。
【0027】
図4に、
図3に示した情報端末340の構成の一例を示す。この実施形態では、情報端末340が特徴量の抽出を行い、学習・判別は別の装置が行う例を示す。別の実施形態では、特徴量の抽出や学習・判別は情報端末340以外の装置が行ってもよいし、あるいは情報端末340が特徴量の抽出と学習・判別の双方を行ってもよい。情報端末340は、プロセッサ410、メモリ430、ストレージ420、ディスプレイ440、I/O(入出力手段)450、ネットワークI/O460を有してよい。プロセッサ410は、シングルコアでもマルチコアでもよく、また物理的に複数のプロセッサを含んでいてもよい。I/O450は、測定器320より(キーボード551や光学センサ552などを介して)受け取った、デジタル化されたパルス波形情報を受信し、ストレージ420に記憶する。プロセッサ410は、ストレージ420もしくはメモリ430またはその他の記憶手段から、ソフトウェアとしての特徴量抽出器(特徴量抽出プログラム)411、学習器412、および検索器413のいずれかまたはその全てを読み出して使用できる。
図4に示した例では、プロセッサ410は特徴量抽出器411を読み込むものとしており、点線で囲まれた学習器412および検索器413は読み込まなくてもよいものとしている。プロセッサ410内に読み込まれた特徴量抽出器411が、パルス波形情報より特徴量(feature value)を抽出する。ここで言う特徴量とは、パルス波形から抽出され、機械学習の教師データまたは識別データとして利用する、パルス波形の特徴を表現する値の集合である。以下では1パルス波形から生成される特徴量の集合を特徴量セット(特徴量群)という。一般に、1度の測定で複数のパルス波形情報が観測されるので、特徴量抽出器411は、観測されたパルス数分の、多数の特徴量セット(「特徴量セット群」とも称する)を生成することが多い。
【0028】
図4の例では、ストレージ420は、テーブルを保持しなくてもよい場合を示している。別の実施形態では、点線で囲まれた特徴量テーブル421もしくは宿主属性テーブル422またはその双方を、ストレージ420が保持してもよい。
【0029】
以下では、既知粒子の細孔通過にともなうパルス波形より抽出された特徴量(群)を教師特徴量(群)、未知粒子の細孔通過により抽出された特徴量(群)を分析対象特徴量(群)と呼ぶ。
【0030】
図5に、
図3の機械学習システムに含まれるサーバ360の構成の一例を示す。サーバ360は、プロセッサ510、メモリ520、ストレージ530、ディスプレイ540、ネットワークI/O550を有してよい。プロセッサ510は、シングルコアでもマルチコアでもよく、また物理的に複数のプロセッサを含んでいてもよい。ネットワークI/O550は、情報端末340より宿主ID、既知粒子の種類を表す教師ラベル、および教師特徴量セットを受信して、ストレージ530に記憶する。プロセッサ510は、ストレージ530もしくはメモリ520またはその他の記憶手段から、ソフトウェアとしての学習器511、特徴量抽出器512、および検索器513のいずれかまたは全部を読み込んで利用できる。
図5に示す例では、プロセッサ510は学習器511および検索器513を読み込んでいる。プロセッサ510内の学習器511が、教師ラベルおよび教師特徴量セットを利用して機械学習最適化パラメタを計算する。機械学習最適化パラメタとは、機械学習アルゴリズムに、教師特徴量セットを入力して得られた出力が、真値である教師ラベルと一致する確率を最大化するように最適化されたパラメタ群の総称である。本発明に用いる機械学習アルゴリズムは、たとえば深層学習モデル、決定木などによるアンサンブル学習、k最近傍法、サポートベクターマシン、またはこれらの一部のアンサンブル学習などであってよく、またはこれらに限定されず任意の数理モデルであってよい。
【0031】
ストレージ530は、特徴量テーブル531、宿主属性テーブル532、および最適化パラメタテーブル533を保持できる。これらのテーブルの役割については後に詳述する。
【0032】
ここで、宿主IDとは、教師となる既知粒子および分析対象となる未知粒子の生成された場所、環境、生成過程、生成条件等を特定するためのIDである。たとえば、粒子がウイルスである場合、そのウイルスが生成された生体を特定するIDであってよい。たとえば、本発明の実施形態を臨床におけるウイルス識別に応用する場合、患者Aより採取したウイルス粒子と、患者Bより採取したウイルス粒子を区別するために、各々に宿主IDが付与される。宿主IDの用途は、粒子の由来となる個体の区別に限らず、粒子の生成された場所、環境、生成方法、生成過程などに関する情報の一部または全部を区別するために用いられてよい。
【0033】
サーバ360は、機械学習最適化パラメタを計算した後、ネットワークI/O550より未知粒子の宿主IDおよび分析対象特徴量セットを受信して、ストレージ530に記憶する。そして、機械学習最適化パラメタを有する機械学習アルゴリズムに、受信した分析対象特徴量セットを入力して、分析対象特徴量セットの由来である粒子が、上記教師ラベルと同じ種類の粒子である確率を計算する。これにより、未知粒子の種類が推定できる。
【0034】
1個の粒子の細孔通過によって生成されるパルス波形ごとに1つの分析対象特徴量セットが生成される。したがって、この方法によれば細孔を通過する粒子1個ごとに、その粒子が何であるかを推定することができる。
【0035】
次に、本発明の実施形態によって行われる情報処理について、
図6および
図9に示すフロー図を参照して説明する。以下の説明では理解しやすいように、粒子をウイルスとし、また宿主IDをウイルスが採取された生体を特定するためのIDであるとして説明するが、これらは一例にすぎず、粒子は細孔電気抵抗法で測定可能な粒子であれば何でもよく、また宿主IDも粒子の生成された場所、環境、生成方法、生成過程、生成条件等を特定できる情報であれば何でもよい。
【0036】
(学習)
図6に本発明の実施形態で行うことができる学習の情報処理のフロー図を示す。以下の説明ではわかりやすさのため例示として、
図1、
図3、
図4、
図5に示したコンポーネントを引用して説明する。別の実施形態では、別のコンポーネントを使ってもかまわないのは当然である。
【0037】
まず、第1の生体より採取された第1の既知粒子の第1の検体から、ウイルス粒子を含む電解液を生成し、これをセンサモジュール101に導入する。センサモジュール101の電極に電圧を印加すると、ウイルス粒子が細孔を通過する毎に、イオン電流の過渡変化が生じこれが測定器320によって増幅およびデジタイズされ、第1のパルス波形として情報端末340に送られる(ステップS601)。I/O450がこれを受信すると、ストレージ420に送る。また情報端末340は、第1の既知粒子の種類を表す情報、および第1の生体を特定する第1の宿主IDおよび第1の宿主の属性を表す第1の宿主属性情報をキーボード551、光学センサ552などより取得し、I/O450を経由してストレージ420でこれらを記憶する(ステップS602)。
図6の一例では、情報端末340はこれらの情報をキーボードや光学センサより取得したが、ネットワークを経由してネットワークI/O450経由で取得してもよい。既知粒子の種類を表す情報は、以下で教師ラベルと呼ぶ。通常、検体には多数の粒子が含まれていることから、1度の測定から多数のパルス波形が取得される。したがって、ステップS601では複数のパルス波形が記憶される。これを以下では第1のパルス波形群と呼ぶ。次にプロセッサ410は、特徴量抽出器411に第1のパルス波形群を入力し、第1のパルス波形群の各々より第1の特徴量セットを生成する。第1のパルス波形の数と同数の特徴量セットが生成される(ステップS603)。これらの集合を以下では第1の特徴量セット群という。
【0038】
次に、ネットワークI/O460が第1の教師特徴量セット群、第1の教師ラベル、第1の宿主IDおよび第1の宿主属性情報をネットワーク399を経由してサーバ360に送る。サーバ360は、ネットワークI/O550が受信したこれらの情報を、プロセッサ510によりストレージ530の特徴量テーブル531と宿主属性テーブル532に記憶する(ステップS604)。
【0039】
ここで一旦
図7を参照して、上述した特徴量テーブルの一例を示す。
図7の一例では、宿主を特定する宿主IDに関連付けて、教師ラベル700、各特徴量711乃至713等が記憶されている(見出し行710に列毎に説明を付した)。
図7の一例では、ナノアンペア単位のパルス深さ711、マイクロ秒単位のパルス幅712、パーセンテージで示すパルス偏度713などが特徴量として使われており、これらの集合が各々の宿主IDおよび教師ラベルと関連付けて記憶されている。
図7の一例におけるパルス深さ711とは、たとえば
図2のパルスにおけるベースラインから最深部までの深さ、パルス偏度713とはたとえば
図2のパルスの非対称性の程度である。本発明の実施形態において利用できる特徴量の種類は、
図7の例示に限定されず、教師パルス波形および分析対象パルス波形の特徴を表す量であれば、どのようなものでもよい。
【0040】
図7の一例では、たとえばパルス波形1つの教師特徴量セットが、行722に記憶された値の集合となる。
図7ではたとえば、第1の生体の宿主ID720で表される生体より取得された、その教師ラベル721である粒子を含むことが分かっている検体からは、複数のパルス波形が取得されていることがわかる。そしてこの宿主ID720および教師ラベル721と関連付けて各々のパルス波形より取得された教師特徴量セット722、723、724、・・・が記憶されている。
【0041】
この実施形態では、加えてサーバ360が、宿主毎の属性情報を情報端末340より受信し、これを宿主属性テーブル532に宿主IDと関連付けて記憶できる。
図8に、そのような宿主属性テーブルの一例を示す。
図8の一例では、宿主IDに関連付けて宿主であった生体に関する性別851、年齢852、地域853などが各列に記憶されている(見出し行810参照)。本発明の実施形態において利用できる宿主属性情報は、
図8の例示に限定されず、宿主の属性を表現する情報であれば、どのようなものでもよい。別の実施形態では、情報端末とサーバが編集管理するテーブルの種類が、上記の例とは異なっていてもよいし、記憶手段は同一であってもよいし分散していてもよく、また物理的に別々であってもかまわない。
【0042】
ふたたび
図6を参照すると、次に、センサが第2の生体より採取された第2の既知粒子の、第2の検体についても処理する。すなわち、第2の生体より採取された第2の既知粒子の、第2の検体からウイルス粒子を含む電解液を生成し、これをセンサモジュール102に導入する。センサモジュール102の電極に電圧を印加すると、ウイルス粒子が細孔を通過する毎に、イオン電流の過渡変化が生じこれが測定器320によって増幅およびデジタイズされて、第2のパルス波形として情報端末340に送られる(ステップS601)。例えば、
図3に示す一例にて、第1の既知粒子を含む検体をセンサモジュール101に、また第2の既知粒子を含む検体をセンサモジュール102に各々導入してパルス波形および特徴量を抽出するようにできる。
図3の一例における点線は、これらセンサモジュールが同時に測定器320に接続されるとは限らないことを表している。別の実施形態では、これら複数のセンサモジュールが同時に測定器320に接続されていてもよい。
【0043】
以下第2の既知粒子についても、第1の既知粒子と同様にステップS601乃至S604を実行する。このような処理の結果、特徴量テーブル531が第2の宿主IDと関連付けて第2の教師特徴量セット群を、宿主属性テーブル532が第2の宿主IDと関連付けて第2の宿主属性情報を記憶する。
図7の一例では、第1の宿主IDが720、第2の宿主IDが730、第1の教師ラベルが721、第2の教師ラベルが731である。このようにステップS601乃至S604を繰り返すことで、3種以上の既知粒子より取得した教師特徴量セットおよび宿主属性情報を記憶してもよい。
【0044】
次にプロセッサ510が、特徴量テーブル531に記憶された教師ラベルと記憶された教師特徴量セットをあわせて教師データとして、学習器511に入力する。学習器511は、誤差関数を最小化するように、学習器511自身のもつ多数の機械学習パラメタを最適化する。ここで最適化された機械学習パラメタを、機械学習最適化パラメタという。プロセッサ510は、計算された機械学習最適化パラメタを最適化パラメタテーブル533に記憶する(ステップS605)。
【0045】
(識別)
続いて
図9に、
図6の情報処理に後続する、識別に関する情報処理の一例を示す。この実施形態では、
図6の処理には用いられなかった第3の生体より採取された未知粒子の、第3の検体からウイルス粒子を含む電解液を生成し、これをセンサモジュール103に導入する。センサモジュール103の電極に電圧を印加すると、未知粒子が細孔を通過する毎に、イオン電流の過渡変化が生じ、これが測定器320によって増幅およびデジタイズされて、第3のパルス波形群として情報端末340に送られる(ステップS901)。なお、
図3に示す一例では、第1の既知粒子を含む第1の検体をセンサモジュール101に、第2の既知粒子を含む第2の検体をセンサモジュール102に、そして未知粒子を含む第3の検体をセンサモジュール103に各々導入して、各々よりパルス波形を測定できる。
図3の一例における点線は、これらセンサモジュールが同時に測定器320に接続されるとは限らないことを表している。一方、別の実施形態では、これら複数のセンサモジュールが同時に測定器320に接続されていてもよい。
【0046】
I/O450が第3のパルス波形群を受信すると、ストレージ420に送る。また情報端末340は、第3の生体を特定する第3の宿主IDおよび第3の宿主の属性を表す第3の宿主属性情報をキーボード551、光学センサ552などより取得し、I/O450を経由してストレージ240でこれらを記憶する(ステップS902)。通常、検体には多数の粒子が含まれていることから、1度の測定から多数のパルス波形が取得される。したがって、複数のパルス波形が記憶される。以下、これらを第3のパルス波形群という。次にプロセッサ410は、特徴量抽出器411に第3のパルス波形群を入力し、第3のパルス波形群の各々より分析対象特徴量セットを生成する。第3のパルス波形群より、パルス数と同数の特徴量セットが生成される(ステップS903)。複数の特徴セットがあることから以下ではこれらを第3の特徴量セット群とよぶ。ここで、第3の検体から抽出された特徴量は、分析対象たる未知粒子から生成された特徴という意味で、分析対象特徴量と呼ぶ。
【0047】
次に、ネットワークI/O460が分析対象特徴量セット群、第3の宿主ID、第3の宿主属性情報をネットワーク399を経由してサーバ360に送る。サーバ360は、ネットワークI/O550が受信したこれらの情報を、プロセッサ510によりストレージ530の特徴量テーブル531と宿主属性テーブル532に記憶する(ステップS904)。
図7の一例では、宿主ID740が、未知粒子が生成された第3の宿主の宿主IDである。未知粒子であるので、教師ラベルはない(対応する741で示されるセルは空白になっている)。また、特徴量セット群742乃至744が第3の波形パルス群より生成された分析対象特徴量セット群である。
図7に示す一例では、教師特徴量セット群と分析対象特徴量セット群が、同一の特徴量テーブルに記憶されているが、別の実施形態では教師特徴量セット群と分析対象特徴量セット群は別のテーブルに記憶されていてもよい。
【0048】
次に、プロセッサ510が、ステップS605で最適化パラメタテーブル533に記憶した機械学習最適化パラメタと、ステップS904で特徴量テーブルに記憶した分析対象特徴量セット群を学習器511に入力する。すると学習器511が、未知粒子パルス1つ1つについて、各々のパルスが第1の既知サンプルと同じ種類のパルスである確率を計算する(ステップS905)。この方法では、通常1度の測定で未知粒子のパルス波形が多数観測され、そのパルス波形各々について既知サンプルと同じ種類である確率が計算される。これらパルス毎の確率をあわせて、未知サンプルが既知サンプルと同じ種類であるか否かを識別する(ステップS906)。個々のパルス波形の確率の集合より、未知サンプルが既知サンプルと同じ種類であるか否かを識別する方法は、たとえばパルス毎の確率の平均を計算する方法があるが、本発明の実施形態ではこの計算方法はどのようなものでもよい。
【0049】
以上本発明の一実施形態として、特徴量抽出器が情報端末に、学習器がサーバに配置されている例を用いて説明したが、特徴量抽出器がサーバに配置され、ステップS603およびS903の特徴量抽出がサーバ360でおこなわれてもよい。
図5で特徴量抽出器512が点線で表示されているのは、これがサーバに配置されていてもよいことを表している。あるいは、学習器が情報端末に配置され、ステップS605の機械学習最適化パラメタの導出およびステップS905乃至S906の識別を情報端末でおこなってもよい。
図4の学習器412が点線で表示されているのは、これが情報端末にあってもよいことを表している。あるいは、特徴量テーブルと宿主属性テーブルは情報端末340にあってもよい。
図4で特徴量テーブル421と宿主属性テーブル422が点線で表されているのは、これが情報端末340にあってもよいことを表している。さらにあるいは、特徴量テーブル、宿主属性テーブルのどちらかがサーバにあってもよい。本明細書においては、サーバと情報端末とをまとめて「装置」であると考えてもよい。
【0050】
(宿主属性情報による高精度識別)
他の実施形態では、
図6で説明した機械学習プログラムの学習、および
図9で説明した機械学習プログラムによる識別において、さらに宿主属性情報を利用することで、高い精度の未知粒子識別を実現することができる。
【0051】
たとえば、同じ種類に属するとされるウイルスであっても、宿主の生存する地域等、宿主の属性に依存する亜種が存在するような場合、従来の方法で機械学習プログラムを学習させると、学習器が、複数の亜種の異なる特徴を混合して学習してしまう結果、精度の高い粒子識別ができなかった。またたとえば、生物学的には同じ選択性を持って生体細胞に作用するという意味において同種の粒子であっても、細孔電気抵抗法では宿主の属性によって異なる傾向を持つ形状のパルス波形を生ずる粒子もある。この場合も、同様の理由で精度の高い粒子識別ができなかった。
【0052】
しかし本発明の実施形態では、従来技術とは異なり、たとえば同じ宿主属性情報を有する宿主由来の既知粒子のみから得られたパルス波形から特徴量セット群を抽出し、その特徴量セット群のみを使って機械学習最適化パラメタを計算することができる。そうした処理の一例を、
図10のフロー図として示す。
図8を参照して例示的に説明すると、たとえばサーバのプロセッサ510にある検索器513が、宿主属性テーブル532の列853を「USA」を検索することで、「USA」という宿主属性情報を有する宿主IDを抽出する(ステップS1001)。次に検索器513が、特徴量テーブル中の教師データから、抽出した宿主IDに関連付けて記憶された教師ラベルおよび教師特徴量セットを抽出する(ステップS1002)。ここで抽出された教師ラベルおよび教師特徴量セットを用いてステップS605で説明した学習をおこない、特定の宿主属性情報を有する検体のみによる機械学習最適化パラメタを計算する。このことにより、「USA」の属性を持つ宿主由来粒子によるパルス波形と、その他の宿主由来粒子によるパルス波形のもつ異なる特徴を学習することがなくなり、より高い精度での粒子識別が可能となる。
図10のようなフローによって学習を行うことで、宿主属性情報ごとに各々異なる機械学習最適化パラメタを計算することになる。これらの機械学習最適化パラメタのひとつひとつが、宿主の属性ごとの粒子の特徴を表している。サーバのストレージ530は、宿主属性情報とそれに対応する機械学習最適化パラメタを関連付けて記憶する、宿主属性機械学習最適化パラメタテーブルを持っていてよい。
【0053】
本発明の実施形態に係る手法では、ここで説明した一例のように、1つの属性情報を検索キーとして宿主属性テーブルを検索してもよく、または複数の属性情報を検索キーとして宿主属性テーブルを検索してもよい。この場合は、学習によって、宿主属性の組み合わせごとの機械学習最適化パラメタが得られる。
【0054】
次に、未知粒子の識別については、
図9に示す識別フローに先立って、識別しようとする未知粒子の属性情報と同じ属性を持つ教師特徴量セットで学習した機械学習最適化パラメタを利用して、粒子識別を行う。
図8と
図7を参照して例示すれば、まず宿主属性テーブル532で、未知粒子の宿主属性情報のなかで「USA」873に関連付けられた宿主ID840を検索し、この宿主IDで特徴量テーブル531を検索し、特徴量セット743乃至744等を得る。これらの特徴量セットの各々について、
図9で示した識別の処理を行うことで、宿主ID「32010」を持つ未知粒子について、より高い精度での識別が可能である。
【0055】
本発明の実施形態によるこのような処理によって、宿主の有する属性の違いに影響されない、識別精度の高い粒子識別が可能になる。なお、ここで説明した検索器はサーバにあっても、情報端末にあってもよく、また上記の処理はサーバで行われていても情報端末で行われていてもよい。例えば
図4における検索器413が点線で表示されているのは、これが情報端末にあってもよいことを表している。
【0056】
また他の実施形態では、ステップS605における学習で学習器に与える教師データとして、ステップS604で特徴量テーブル531に記憶した特徴量セットに加えて、宿主属性テーブル532に記憶された宿主属性情報を特徴量として与えてよい。たとえば、ステップS605の学習において、教師データとして特徴量テーブル531で宿主ID720と関連付けて記憶された特徴量セット722、723、724・・・に加えて、宿主属性テーブル532で宿主ID820に関連付けて記憶された宿主属性情報863を特徴量とし、教師ラベル721を正解として学習させてもよい。
【0057】
別の実施形態ではさらに、宿主属性テーブル532に記憶された属性情報を複数をステップS605における学習に用いる教師データとして用いてよい。たとえば、属性情報863のみならず862や861も宿主ID720に関連付けられた特徴量セットとともに、教師データとして用いてよい。このようにすることで、機械学習モデルの機械学習パラメタを、宿主に依存した粒子の違いを含む最適化を施すことができる。このように本発明の実施形態により学習した機械学習モデルは、より広い汎用性をもった粒子識別のための機械学習モデルとして利用できる。
【0058】
本発明の実施形態では、上述した方法を提供できる他、当該方法を実施できる装置(ハードウェア)、プログラム、および当該プログラムの一部または全部をユーザーが実行可能な形式で格納する製品(任意の媒体、搬送波、モジュールなど)も提供できる。
【符号の説明】
【0059】
101 センサモジュール
102 センサモジュール
103 センサモジュール
110 チャンバ
111 電解液導入口
112 電極
120 チャンバ
121 電解液導入口
122 電極
130 隔壁
140 細孔
141 シリコンウェハ
142 薄膜
150 アンプ
151 電流計
152 電源
190 測定対象粒子
201 電流値
202 電流値
203 電流値
320 測定器
340 情報端末
360 サーバ
399 ネットワーク
410 プロセッサ
411 特徴量抽出器
412 学習器
413 検索器
420 ストレージ
421 特徴量テーブル
422 宿主属性テーブル
430 メモリ
440 ディスプレイ
450 I/O
460 ネットワークI/O
510 プロセッサ
511 学習器
512 特徴量抽出器
513 検索器
520 メモリ
530 ストレージ
531 特徴量テーブル
532 宿主属性テーブル
533 最適化パラメタテーブル
540 ディスプレイ
550 ネットワークI/O
551 キーボード
552 光学センサ
700 教師ラベル
710 見出し行
711 特徴量(パルス深さ)を示す列
712 特徴量(パルス幅)を示す列
713 特徴量(パルス偏度)を示す列
720 第1の宿主ID
721 教師ラベル
722 教師特徴量セット
723 教師特徴量セット
724 教師特徴量セット
730 第2の宿主ID
731 教師ラベル
732 教師特徴量セット
733 教師特徴量セット
734 教師特徴量セット
740 第3の宿主ID
741 空白
742 分析対象特徴量セット
743 分析対象特徴量セット
744 分析対象特徴量セット
810 見出し行
820 第1の宿主ID
830 第2の宿主ID
840 第3の宿主ID
851 宿主属性情報(性別)を示す列
852 宿主属性情報(年齢)を示す列
853 宿主属性情報(地域)を示す列
861 宿主属性情報
862 宿主属性情報
863 宿主属性情報
873 宿主属性情報