IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社東海理化電機製作所の特許一覧

特許7234100学習データ拡張方法、および学習データ生成装置
<>
  • 特許-学習データ拡張方法、および学習データ生成装置 図1
  • 特許-学習データ拡張方法、および学習データ生成装置 図2
  • 特許-学習データ拡張方法、および学習データ生成装置 図3
  • 特許-学習データ拡張方法、および学習データ生成装置 図4
  • 特許-学習データ拡張方法、および学習データ生成装置 図5
  • 特許-学習データ拡張方法、および学習データ生成装置 図6
  • 特許-学習データ拡張方法、および学習データ生成装置 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-02-27
(45)【発行日】2023-03-07
(54)【発明の名称】学習データ拡張方法、および学習データ生成装置
(51)【国際特許分類】
   G06N 20/00 20190101AFI20230228BHJP
   A61B 5/346 20210101ALI20230228BHJP
【FI】
G06N20/00
A61B5/346
【請求項の数】 10
(21)【出願番号】P 2019208018
(22)【出願日】2019-11-18
(65)【公開番号】P2021081917
(43)【公開日】2021-05-27
【審査請求日】2022-03-01
(73)【特許権者】
【識別番号】000003551
【氏名又は名称】株式会社東海理化電機製作所
(74)【代理人】
【識別番号】100140958
【弁理士】
【氏名又は名称】伊藤 学
(74)【代理人】
【識別番号】100137888
【弁理士】
【氏名又は名称】大山 夏子
(72)【発明者】
【氏名】名和 佑記
(72)【発明者】
【氏名】河村 大輔
(72)【発明者】
【氏名】大竹 稔
(72)【発明者】
【氏名】廣田 哲也
(72)【発明者】
【氏名】藤田 隆吾
【審査官】坂庭 剛史
(56)【参考文献】
【文献】国際公開第2019/216378(WO,A1)
【文献】特開2013-212311(JP,A)
【文献】特開2005-157354(JP,A)
【文献】HARADA, Shota et al.,"Biosignal Data Augmentation Based on Generative Adversarial Networks.",2018 40th Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC),IEEE Xplore[online],2018年10月,p.368-371,[2023年01月30日検索],インターネット<URL:https://ieeexplore.ieee.org/abstract/document/8512396>,DOI: 10.1109/EMBC.2018.8512396
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00- 3/126
G06N 20/00-20/20
A61B 5/346
(57)【特許請求の範囲】
【請求項1】
プロセッサが、
第1の方式により時間の進行に沿って取得される第1のセンサデータを教師データとし、前記第1の方式と比較してノイズの影響が少ない第2の方式により前記第1のセンサデータの取得期間と同期間に取得された第2のセンサデータ、を学習データとする、第1の学習を行うことと、
前記第1の学習により生成された学習済みモデルと、前記第2のセンサデータとを用いて、前記第1のセンサデータに発生し得るノイズの特徴が反映されたセンサデータであるノイズ反映データを生成することと、
を含み、
前記ノイズ反映データは、前記第2のセンサデータを教師データとする第2の学習において、学習データとして用いられる、
学習データ拡張方法。
【請求項2】
前記第1の学習を行うことは、取得された前記第1のセンサデータのうち、ノイズが少ない前記第1のセンサデータを教師データとして、前記ノイズが少ない前記第1のセンサデータの特徴を学習する前記第1の学習を行うこと、をさらに含み、
前記ノイズ反映データを生成することは、取得された前記第1のセンサデータのうち、ノイズの大きい前記第1のセンサデータの取得期間と同期間に取得された前記第2のセンサデータを前記学習済みモデルに入力して得られた出力データと、前記ノイズの大きい前記第1のセンサデータとの差分から抽出したノイズデータを用いて、前記ノイズ反映データを生成すること、をさらに含む、
請求項1に記載の学習データ拡張方法。
【請求項3】
前記ノイズ反映データを生成することは、前記第2のセンサデータを前記学習済みモデルに入力して得られた出力データに前記ノイズデータを付加することで前記ノイズ反映データを生成すること、をさらに含む、
請求項2に記載の学習データ拡張方法。
【請求項4】
前記ノイズ反映データを生成することは、前記第2のセンサデータの分布に係る知見に基づいて前記第2のセンサデータを変形した変形データを前記学習済みモデルに入力して得られた出力データに前記ノイズデータを付与することで、前記ノイズ反映データを生成すること、をさらに含む、
請求項3に記載の学習データ拡張方法。
【請求項5】
前記第1のセンサデータおよび前記第2のセンサデータは、被験者の生命兆候を示すバイタルデータを含む、
請求項1から請求項4までのいずれか一項に記載の学習データ拡張方法。
【請求項6】
前記第1の方式は、前記被験者と接触することが予想される少なくとも2つの電極を用いて心電波形を前記第1のセンサデータとして取得する方式であり、
前記第2の方式は、前記被験者の皮膚に装着された少なくとも2つの電極を用いて心電波形を前記第2のセンサデータとして取得する方式である、
請求項5に記載の学習データ拡張方法。
【請求項7】
前記被験者は、移動体を運転する運転手である、
請求項5または請求項6のうちいずれか一項に記載の学習データ拡張方法。
【請求項8】
第1の方式により時間の進行に沿って取得される第1のセンサデータを教師データとし、前記第1の方式と比較してノイズの影響が少ない第2の方式により前記第1のセンサデータの取得期間と同期間に取得された第2のセンサデータ、を学習データとする、第1の学習を行う学習部と、
前記第1の学習により生成された学習済みモデルと、前記第2のセンサデータとを用いて、前記第1のセンサデータに発生し得るノイズの特徴が反映されたセンサデータであるノイズ反映データを生成する生成部と、
を含み、
前記ノイズ反映データは、前記第2のセンサデータを教師データとする第2の学習において、学習データとして用いられる、
学習データ生成装置。
【請求項9】
プロセッサが、
異なる2つのセンサデータの差分に基づきノイズデータを生成することと、
前記ノイズデータを任意のセンサデータに付与することにより機械学習に用いられる学習データを生成することと、
を含む、
学習データ拡張方法。
【請求項10】
異なる2つのセンサデータの差分に基づきノイズデータを生成し、前記ノイズデータを任意のセンサデータに付与することにより機械学習に用いられる学習データを生成する生成部、
を備える、
学習データ生成装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学習データ拡張方法、および学習データ生成装置に関する。
【背景技術】
【0002】
近年、機械学習技術を利用した装置が多く開発されている。また、機械学習工程の効率化を図るための技術も提案されている。例えば、特許文献1には、加工した画像を学習データとして利用することで、学習データの量を容易に増加させる技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開平6-231257号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、学習データには、画像の他、例えば、時間の進行に沿って取得される各種のセンサデータ等、データ中の特徴を直感的に視認することが困難なデータも存在する。このようなデータに対し安易な加工を行った場合、現実には発生しない学習データが生成され、学習の効率が大幅に低下する可能がある。
【0005】
そこで、本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、現実に発生し得るデータの特徴を精度高く反映させた学習データを生成することが可能な仕組みを提供することにある。
【課題を解決するための手段】
【0006】
上記課題を解決するために、本発明のある観点によれば、プロセッサが、第1の方式により時間の進行に沿って取得される第1のセンサデータを教師データとし、前記第1の方式と比較してノイズの影響が少ない第2の方式により前記第1のセンサデータの取得期間と同期間に取得された第2のセンサデータ、を学習データとする、第1の学習を行うことと、前記第1の学習により生成された学習済みモデルと、前記第2のセンサデータとを用いて、前記第1のセンサデータに発生し得るノイズの特徴が反映されたセンサデータであるノイズ反映データを生成することと、を含み、前記ノイズ反映データは、前記第2のセンサデータを教師データとする第2の学習において、学習データとして用いられる、学習データ拡張方法が提供される。
【0007】
また、上記課題を解決するために、本発明の別の観点によれば、第1の方式により時間の進行に沿って取得される第1のセンサデータを教師データとし、前記第1の方式と比較してノイズの影響が少ない第2の方式により前記第1のセンサデータの取得期間と同期間に取得された第2のセンサデータ、を学習データとする、第1の学習を行う学習部と、前記第1の学習により生成された学習済みモデルと、前記第2のセンサデータとを用いて、前記第1のセンサデータに発生し得るノイズの特徴が反映されたセンサデータであるノイズ反映データを生成する生成部と、を含み、前記ノイズ反映データは、前記第2のセンサデータを教師データとする第2の学習において、学習データとして用いられる、学習データ生成装置が提供される。
【発明の効果】
【0008】
以上説明したように、本発明によれば、本発明の目的とするところは、現実に発生し得るデータの特徴を精度高く反映させた学習データを生成することが可能な仕組みが提供される。
【図面の簡単な説明】
【0009】
図1】本発明の一実施形態に係る学習データ生成装置10の機能構成例を示す図である。
図2】一周期における一般的な心電波形の例を示す図である。
図3】教師あり学習を利用したセンサデータの測定方式について説明するための図である。
図4】本発明の一実施形態に係る第1の拡張方法について説明するための図である。
図5】同実施形態に係る第2の拡張方法における第1の学習について説明するための図である。
図6】同実施形態に係る第2の拡張方法におけるノイズ反映データの生成について説明するための図である。
図7】同実施形態に係るノイズ反映データ生成の流れを示すフローチャートである。
【発明を実施するための形態】
【0010】
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0011】
<構成例>
(学習データ生成装置10)
まず、本実施形態に係る学習データ拡張方法を実現する学習データ生成装置10の構成について述べる。本実施形態に係る学習データ生成装置10は、教師あり学習において用いられる学習データを生成する装置である。ここで、教師あり学習とは、入力データ(学習データ)と当該入力データに対する正解データ(教師データ)のセットをコンピュータに与え、コンピュータに両者の対応を学習させる手法を指す。図1は、本実施形態に係る学習データ生成装置10の機能構成例を示す図である。図1に示すように、本実施形態に係る学習データ生成装置10は、学習部110、生成部120、および記憶部130を備えてもよい。
【0012】
本実施形態に係る学習部110は、第1の方式により時間の進行に沿って取得される第1のセンサデータを教師データとし、上記第1の方式と比較してノイズの影響が少ない第2の方式により第1のセンサデータの取得期間と同期間に取得された第2のセンサデータ、を学習データとする、第1の学習を行う、ことを特徴の一つとする。
【0013】
本実施形態に係る学習部110は、教師あり学習を実現可能な任意の機械学習手法を用いて上記のような学習を行ってよい。学習部110は、例えば、ニューラルネットワーク、SVM(Support Vector Machine)などのアルゴリズムを用いて学習を行う。
【0014】
学習部110の機能は、例えば、GPU(Graphics Processing Unit)等のプロセッサによって実現される。本実施形態に係る学習部110が有する機能の詳細については別途後述する。
【0015】
本実施形態に係る生成部120は、学習部110による第1の学習により生成された学習済みモデル125と、第2のセンサデータとを用いて、第1のセンサデータに発生し得るノイズの特徴が反映されたセンサデータであるノイズ反映データを生成する、ことを特徴の一つとする。生成部120が生成するノイズ反映データは、第2のセンサデータを教師データとする第2の学習において、学習データとして用いられてよい。
【0016】
生成部120の機能は、例えば、GPU等のプロセッサによって実現される。本実施形態に係る生成部120が有する機能の詳細については別途後述する。
【0017】
本実施形態に係る記憶部130は、学習データ生成装置10の動作に係る各種の情報を記憶する。記憶部130は、例えば、上述した第1のセンサデータ、第2センサデータ、ノイズ反映データ等を記録する。また、記憶部130は、学習部110による第1の学習で用いられる各種のパラメータ等を記憶する。
【0018】
以上、本実施形態に係る学習データ生成装置10の機能構成例について述べた。なお、図1を用いて説明した上記の構成はあくまで一例であり、本実施形態に係る学習データ生成装置10の構成は係る例に限定されない。本実施形態に係る学習データ生成装置10は、例えば、操作者による操作を受け付ける操作部や、各種のデータを出力するための出力部等をさらに備えてもよい。本実施形態に係る学習データ生成装置10の構成は、仕様や運用に応じて柔軟に変形され得る。
【0019】
また、本実施形態に係る学習データ生成装置10により生成されたノイズ反映データは、任意の学習装置による第2の学習において学習データとして用いられる。さらには、上記第2の学習により構築された学習済みモデルは、任意の測定装置に搭載されてよい。上記測定装置は、第2の学習において学習データとして用いられるノイズ反映データと類似する特徴を有するセンサデータを入力として各種の測定処理を実行することが可能である。
【0020】
<詳細>
次に、本実施形態に係る学習データ拡張方法について詳細に説明する。本実施形態に係る学習データ拡張方法は、時間の進行に沿って取得されるセンサデータを学習データとした教師あり学習を行う場合において、有用な学習データを効率的に拡張するための手法である。
【0021】
ここで、時間の進行に沿って取得されるセンサデータについて具体例を挙げて説明する。上記のようなセンサデータには、例えば、被験者の生命兆候を示す各種のバイタルデータが挙げられる。また、バイタルデータの一例としては、例えば、被験者の心臓の活動を示す心電波形が挙げられる。
【0022】
図2は、一周期における一般的な心電波形の例を示す図である。なお、図2においては、横軸において時間の経過が、縦軸において電圧の変化が示されている。図2に示すように、一般的な心電波形には、特徴的な形状を示す複数の特徴波形が観察され得る。特徴波形の一例としては、P波、Q波、R波、S波、QRS波(Q波、R波、およびS波から形成される)T波、およびU波等が挙げられる。
【0023】
このうち、例えば、R波は、心拍変動(揺らぎ)の指標として重要な特徴波形である。ある周期におけるR波と次周期におけるR波の間隔(RRI:R-R Interval)は、心拍の周期を算出するために用いられる。また、RRIにはストレスや疲労により揺らぎが生じることも知られており、被験者の身体的負担や心理的負担を検出する際にも有効な生理指標となる。その他、例えば、一周期におけるQ波とT波の間隔であるQTI(Q-T Interval)は、心室の興奮の始まりから興奮が消退するまでの時間を示しており、不整脈の検出等に重要な生理指標である。
【0024】
ここで、上記のような心電波形を取得する方式としては、被験者の皮膚に複数の電極を直接装着し、当該複数の電極により電圧の変化を記録する、例えば12誘導心電図等の方式が挙げられる。係る方式によれば、ノイズの影響が少ない高精度の心電波形を得ることができる。一方、係る方式は、被験者の行動を制限する場合も多く、また皮膚に電極を直接装着するために、被験者に煩わしさを感じさせる場合もある。
【0025】
また、心電波形を取得する他の方式としては、被験者と接触することが予想される複数の箇所に電極を設置し、複数の当該電極に被験者が接触した際に得られた電圧の変化を記録する方式が挙げられる。このような方式は、例えば、装置の操作を行う被験者の心電波形を取得したい場合等に用いられる。一例としては、車両等の移動体を運転する運転手が、運転中に接触することが予想されるステアリングや運転席の座席等に電極を配置し、当該運転手の心電図を取得する技術が知られている。係る技術によれば、運転手の皮膚に電極を直接貼り付ける必要がないため、運転手に意識させることなく心電波形を取得することが可能である。一方、この場合、運転行動に伴う運転手の体動や、車両の振動等によりノイズが生じやすく、取得される心電波形の精度が低下する可能性がある。
【0026】
このように、心電波形のようなセンサデータを取得するための複数の方式には、それぞれに利点がある一方で、取得されるセンサデータの精度に差が生じるケースも存在する。このため、ある方式が有する利点を活かしながら、同時にセンサデータの取得精度を向上させる技術が求められている。
【0027】
上記の点を解決するためには、例えば、教師あり学習を利用した測定方式が想定される。図3は、教師あり学習を利用したセンサデータの測定方式について説明するための図である。
【0028】
図3の上段には、学習時に用いる学習データおよび教師データの一例が示されている。図示するように、任意の学習装置に備えられる学習部910は、第1の方式により取得された第1のセンサデータS1を学習データとし、第1の方式と比較してノイズの影響が少ない第2の方式により、第1のセンサデータS1の取得期間と同期間に取得された第2のセンサデータS2を教師データとする教師あり学習を実行する。
【0029】
第1のセンサデータS1および第2のセンサデータS2は、例えば、時間の進行に沿って移動体の運転手である被験者から同期間に取得された心電波形であってもよい。この場合、例えば、第1の方式は、被験者と接触することが予想される少なくとも2つの電極を用いて心電波形を取得する方式であってもよい。また、第2の方式は、被験者の皮膚に装着された少なくとも2つの電極を用いて心電波形を取得する方式であってもよい。この場合、図示するように、第1の方式により取得された第1のセンサデータS1は、第2の方式により取得された第2のセンサデータと比較してノイズを多く含むものとなる。
【0030】
上記のようなデータ設定によれば、学習部910は、ノイズの多い第1のセンサデータS1を、ノイズの少ない第2のセンサデータS2に近似する学習を行うことが可能である。また、学習部910による学習により構築される学習済みモデル925は、図3の下段に示すように、ノイズの多い第1のセンサデータS1を入力として、第1のセンサデータからノイズを排除した第3のセンサデータを出力することが可能となる。
【0031】
係る手法によれば、運転手に煩わしさを感じさせない等の第1の方式が有する利点をそのままに、かつ運転手の体動や車両の振動等により生じるノイズを排除した高精度の心電波形を取得することが可能となる。
【0032】
以上、時間の進行に沿って取得されたセンサデータを学習データとした教師あり学習に関し、一例を挙げて説明した。一方、上記のような教師あり学習により精度の高い学習済みモデルを構築するためには、十分な量の学習データおよび教師データを用いた学習が求められる。しかし、十分な量の学習データを容易するためには様々なコストが必要となる。
【0033】
しかし、学習データとして、時間の進行に沿って取得されたセンサデータを用いる場合、学習データとして画像データを用いる場合とは異なり、容易な加工により学習データを拡張することが困難である。例えば、取得したセンサデータに対し安易な加工を細越した場合、現実には発生しない特徴を有するデータが生成される可能性がある。また、このようなデータを学習データとして学習を行った場合、構築される学習済みモデルの性能が著しく低下することが想定される。
【0034】
本技術思想は上記の点に着目して発想されたものであり、現実に発生し得るデータの特徴を精度高く反映させた学習データを生成することを可能とする。このために、本実施形態に係る学習データ拡張方法は、プロセッサが、第1の方式により時間の進行に沿って取得される第1のセンサデータを教師データとし、第1の方式と比較してノイズの影響が少ない第2の方式により第1のセンサデータの取得期間と同期間に取得された第2のセンサデータ、を学習データとする第1の学習を行うこと、を特徴の一つとする。また、本実施形態に係る学習データ拡張方法は、プロセッサが、上記第1の学習により生成された学習済みモデルと、第2のセンサデータとを用いて、第1のセンサデータに発生し得るノイズの特徴が反映されたセンサデータであるノイズ反映データを生成すること、を特徴の一つとする。
【0035】
なお、以下においては、本実施形態に係る第1のセンサデータおよび第2のセンサデータが、被験者の生命兆候を示すバイタルデータである場合を一例に挙げて説明を行う。より具体的には、以下における第1のセンサデータは、移動体の運転手である被験者と接触することが予想される少なくとも2つの電極を用いる第1の方式により取得される心電波形であってもよい。また、第2のセンサデータは、上記被験者の皮膚に装着された少なくとも2つの電極を用いる第2の方式により取得される心電波形であってもよい。
【0036】
また、本実施形態に係る学習データ拡張方法は、第1の拡張方法と第2の拡張方法とに大別される。まず、本実施形態に係る第1の拡張方法について詳細に説明する。図4は、本実施形態に係る第1の拡張方法について説明するための図である。
【0037】
図4の上段には、本実施形態に係る第1の拡張方法における学習データと教師データの一例が示されている。本実施形態に係る第1の拡張方法において、本実施形態に係る学習部110は、ノイズの少ない第2のセンサデータS2を学習データとし、ノイズの多い第1のセンサデータS1を教師データとする第1の学習を行う。すなわち、第1の拡張方法において、学習部110は、ノイズの少ない第2のセンサデータS2を、ノイズの多い第1のセンサデータS1に近似する学習を行う。
【0038】
また、本実施形態に係る第2の拡張方法において、本実施形態に係る生成部120は、図4の下段に示すように、学習部110による第1の学習により生成された学習済みモデル125に第2のセンサデータS2を入力し、第1のセンサデータS1に発生し得るノイズの特徴が判定されたセンサデータであるノイズ反映データNRDを生成する、ことを特徴の一つとする。
【0039】
このように、本実施形態に係る第1の拡張方法によれば、第1の学習により生成された学習済みモデル125を用いることで、ノイズの少ない第2のセンサデータS2から、第1の方式において取得される第1のセンサデータS1に発生し得るノイズの特徴が反映されたノイズ反映データNRDを直接的に容易かつ大量に生成することが可能となる。また、係るノイズ反映データNRDを学習データとし、第2のセンサデータS2を教師データとする第2の学習によれば、第1のセンサデータS1を入力として、第1のセンサデータS1からノイズを排除した第3のセンサデータS3を出力する高性能な学習済みモデルを効率的に構築することが可能となる。
【0040】
一方、上記で説明した第1の拡張方法では、生成されるノイズ反映データNRDの精度が、第1の学習において教師データとして用いる第1のセンサデータに影響を受ける可能性がある。例えば、第1の学習における教師データとして、実際には発生する頻度が低いノイズが含まれる第1のセンサデータS1を用いた場合、発生頻度が低いノイズを含むノイズ反映データNRDが多く生成され得る。
【0041】
このため、本実施形態に係る第1の拡張方法は、発生するノイズが限定的である環境においてセンサデータの測定を行う学習済みモデルを構築する際に有効であると想定される。例えば、同一の運転手が同一の車両を運転する場合、発生するノイズの種類は限定されることが予測される。このような場合においては、第1の拡張方式を用いても、ノイズ反映データNRDに発生頻度が低いノイズの影響が強く現れることを防止することができ、かつノイズ反映データNRDを容易かつ大量に生成することが可能となる。
【0042】
一方、例えば、複数の運転手が様々な車両を運転する場合等には、多種多様なノイズが発生し得ることが想定される。この場合、発生し得る各ノイズの特徴をより緻密に抽出したうえで、各ノイズの特徴を反映したノイズ反映データを生成することが望ましい。
【0043】
本実施形態に係る第2の拡張方法は上記の点に着目して発想されたものである。図5は、本実施形態に係る第2の拡張方法における第1の学習について説明するための図である。本実施形態に係る学習部110は、第2の拡張方法においても、第2の方式により取得された第2のセンサデータS2を学習データとし、第1の方式により取得された第1のセンサデータS1を教師データとする第1の学習を行う。一方、この際、第1の拡張方法とは異なり、学習部110は、取得された第1のセンサデータのうち、よりノイズが少ない第1のセンサデータS1lを教師データとして、ノイズが少ない第1のセンサデータS1lの特徴を学習する第1の学習を行うこと、を特徴の一つとする。
【0044】
上述したように、本実施形態に係る第1のセンサデータは、ノイズの影響が大きい第1の方式により取得されるセンサデータである。しかしながら、第1の方式を用いる場合であっても、取得条件(例えば、車両の走行環境等)を整えることにより、極力ノイズを排除した第1のセンサデータを取得することも可能である。
【0045】
第2の拡張方法における学習部110は、上記のように取得された、よりノイズの少ない第1のセンサデータS1lを教師データとすることで、第2のセンサデータS2を第1のセンサデータS1lに近似する学習を行う。すなわち、第2の拡張方法における学習部110は、第1の方式においてノイズの影響が小さい場合に取得され得る第1のセンサデータの特徴を反映したセンサデータを出力するための学習を行う。
【0046】
続いて、本実施形態に係る第2の拡張方法におけるノイズ反映データの生成について詳細に説明する。図6は、第2の拡張方法におけるノイズ反映データの生成について説明するための図である。
【0047】
本実施形態に係る第2の拡張方法において、生成部120は、まず、学習部110による第1の学習により構築された学習済みモデル125に第2のセンサデータS2mを入力し、出力データODを得る。ここで、学習済みモデル125に入力される第2のセンサデータS2mは、取得された第1のセンサデータのうち、ノイズの大きい第1のセンサデータS1mの取得期間と同期間に取得された第2のセンサデータであってよい。また、上述したように、出力データODは、第1の方式においてノイズの影響が小さい場合に取得され得る第1のセンサデータの特徴を反映したセンサデータといえる。
【0048】
この場合、生成部120は、ノイズの大きい第1のセンサデータS1mと、学習済みモデル125が出力した出力データODとの差分を求めることで、第1のセンサデータS1mに含まれるノイズを示すデータであるノイズデータNDを精度高く抽出することができる。本実施形態に係る第2の拡張方法において、生成部120は、上記のように抽出したノイズデータNDを用いてノイズ反映データNRDを生成すること、を特徴の一つとする。
【0049】
本実施形態に係る生成部120は、例えば、ノイズデータNDを得る際に入力した第2のセンサデータS2mとは異なる第2のセンサデータS2を学習済みモデル125に入力した場合に得られる出力データODに、上記のように抽出したノイズデータNDを付与することで、ノイズ反映データNRDを生成してもよい。
【0050】
また、生成部120は、第2のセンサデータの分布に係る知見に基づいて第2のセンサデータを変形した変形データS2eを学習済みモデル125に入力して得られた出力データにノイズデータNDを付与することで、ノイズ反映データを生成してもよい。
【0051】
例えば、健康な被検者から取得される心臓波形において、各特徴波形の分布は、ある程度の範囲に収まることが想定される。例えば、P波の高さ(電圧値の高さ)、R波の高さ、T波の高さ、P波の時間幅、QRS波の時間幅、T波の時間幅等には、それぞれ正常と見做される値が知られている。
【0052】
このことから、生成部120は、上記のような心臓波形に係る知見に基づいて第2のセンサデータS2を変形することで、現実に存在し得る範囲における多様な変形データS2eを得ることできる。例えば、図6に示す一例のように、生成部120は、T波の時間幅を変形することで、変形データS2eを生成してもよい。
【0053】
また、生成部120は、上記のように生成した変形データS2eを学習済みモデル125に入力することで、多様な出力データODを得ることができる。さらには、生成部120は、多様な出力データODに上述のように精度高く抽出したノイズデータNDを付与することで、実際に発生し得るノイズの特徴を反映した多様なノイズ反映データNRDを生成することが可能である。
【0054】
<処理の流れ>
次に、本実施形態に係る学習データ生成装置10を用いたノイズ反映データ生成の流れについて詳細に説明する。図7は、本実施形態に係るノイズ反映データ生成の流れを示すフローチャートである。なお、図7では、第1の拡張方法と第2の拡張方法とに共通の処理の流れが示されている。
【0055】
図7に示すように、本実施形態に係るノイズ反映データ生成においては、まず、第1のセンサデータおよび第2のセンサデータの取得が行われる(S102)。この際、第1のセンサデータおよび第2のセンサデータは、時間軸における同期が可能なようにタイムスタンプ等の情報と共に取得されてよい。また、第1のセンサデータおよび第2のセンサデータは、学習データ生成装置10とは別途の装置により取得されてもよい。取得された第1のセンサデータおよび第2のセンサデータは、学習データ生成装置10の記憶部130に記憶される。
【0056】
次に、学習部110が、ステップS102において取得された第1のセンサデータを教師データとし、第2のセンサデータを学習データとする第1の学習を行う(S104)。
【0057】
次に、生成部120が、ステップS104において構築された学習済みモデル125と、ステップS102において取得された第2のセンサデータとを用いて、第1のセンサデータに発生し得るノイズの特徴が反映されたノイズ反映データを生成する(S106)。ステップS106において生成されたノイズ反映データは、任意の学習装置による第2のセンサデータを教師データとする第2の学習において、学習データとして用いられる。
【0058】
<補足>
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
【0059】
例えば、上記の実施形態では、学習データ生成装置10が被験者の生命兆候を示すバイタルデータに係るデータ拡張を行う場合を主な例として述べた。一方、学習データ生成装置10によるデータ拡張の対象は、バイタルデータに限定されない。学習データ生成装置10は、例えば、任意の装置の稼働状況を示すデータ等の拡張を行うことも可能である。
【0060】
また、上記の実施形態では、心電波形を取得する第1の方式として、被験者が接触することが予想される箇所に電極を配置する方式を、第2の方式として、被験者の皮膚に電極を直接する方式を例に挙げた。一方、本技術における第1の方式および第2の方式は、ノイズの影響の受けやすさに差がある任意の異なる方式であってよい。例えば、心拍を取得する場合、第1の方式は、ドップラーセンサを用いた非接触方式であってもよいし、第2の方式は、被験者の皮膚に電極を装着する接触方式であってもよい。
【0061】
また、本明細書において説明した各装置による一連の処理は、ソフトウェア、ハードウェア、及びソフトウェアとハードウェアとの組合せのいずれを用いて実現されてもよい。ソフトウェアを構成するプログラムは、例えば、各装置の内部又は外部に設けられる記録媒体(非一時的な媒体:non-transitory media)に予め格納される。そして、各プログラムは、例えば、コンピュータによる実行時にRAMに読み込まれ、CPUなどのプロセッサにより実行される。上記記録媒体は、例えば、磁気ディスク、光ディスク、光磁気ディスク、フラッシュメモリ等である。また、上記のコンピュータプログラムは、記録媒体を用いずに、例えばネットワークを介して配信されてもよい。
【符号の説明】
【0062】
10:学習データ生成装置、110:学習部、120:生成部、125:学習済みモデル、130:記憶部
図1
図2
図3
図4
図5
図6
図7