(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-10-12
(45)【発行日】2022-10-20
(54)【発明の名称】学習データ生成装置、学習データ生成方法およびプログラム
(51)【国際特許分類】
G06N 20/00 20190101AFI20221013BHJP
G10L 15/00 20130101ALI20221013BHJP
G10L 15/06 20130101ALI20221013BHJP
【FI】
G06N20/00
G10L15/00 200J
G10L15/06 300Y
(21)【出願番号】P 2018174580
(22)【出願日】2018-09-19
【審査請求日】2021-01-05
(73)【特許権者】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(74)【代理人】
【識別番号】100147485
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】100153017
【氏名又は名称】大倉 昭人
(72)【発明者】
【氏名】蔵内 雄貴
(72)【発明者】
【氏名】阿部 直人
(72)【発明者】
【氏名】小西 宏志
(72)【発明者】
【氏名】瀬下 仁志
【審査官】杉浦 孝光
(56)【参考文献】
【文献】特開2007-300972(JP,A)
【文献】特開2008-165311(JP,A)
【文献】特開2009-128151(JP,A)
【文献】特開2012-103742(JP,A)
【文献】特開2009-273691(JP,A)
【文献】特開2018-067304(JP,A)
【文献】宮田章裕 ほか,健常歩行者センサデータを用いたバリア検出の基礎検討,情報処理学会論文誌,日本,一般社団法人情報処理学会,2018年01月15日,Vol.59, No.1,pp.22-32,ISSN 1882-7764, 特にpp.23-26
【文献】山下隆義,イラストで学ぶ ディープラーニング,株式会社 講談社,2017年02月10日,ISBN 978-4-06-153825-2, pp.70-73, 特にp.71
(58)【調査した分野】(Int.Cl.,DB名)
G06N 20/00
G10L 15/06
G10L 15/00
(57)【特許請求の範囲】
【請求項1】
機械学習に用いられる学習データがノイズを含むか否かを判定し、前記ノイズを含まないと判定した学習データを、ノイズ無し学習データとして、前記機械学習に用いられる学習データを統合した統合学習データに追加するとともに、前記ノイズを含むと判定した学習データを、ノイズ有り学習データとして、前記統合学習データに追加するノイズ判定部と、
前記ノイズ判定部によりノイズを含まないと判定された学習データにノイズを追加して、前記ノイズ有りデータとして、前記統合学習データに追加するノイズ追加部とを備えることを特徴とする学習データ生成装置。
【請求項2】
請求項1に記載の学習データ生成装置において、
前記学習データは、路面上を移動する移動体に搭載されたセンサにより検出された、前記路面の状況を示す路面データを含んで構成されることを特徴とする学習データ生成装置。
【請求項3】
請求項2に記載の学習データ生成装置において、
前記ノイズ追加部は、前記センサにより検出された路面データに、直交する3軸方向それぞれについてノイズを追加して、前記
ノイズ有り学習データとして、前記統合学習データに追加することを特徴とする学習データ生成装置。
【請求項4】
請求項2または3に記載の学習データ生成装置において、
前記移動体には複数種類のセンサが搭載され、
前記複数種類のセンサそれぞれが前記路面データを検出し、
前記ノイズ追加部は、前記複数種類のセンサそれぞれについて、該センサにより検出された路面データに、平均が0であり、分散が前記センサの検出値の分散である正規分布に従うノイズを追加することを特徴とする学習データ生成装置。
【請求項5】
学習データ生成装置における学習データ生成方法であって、
機械学習に用いられる学習データがノイズを含むか否かを判定し、前記ノイズを含まないと判定した学習データを、ノイズ無し学習データとして、前記機械学習に用いられる学習データを統合した統合学習データに追加するとともに、前記ノイズを含むと判定した学習データを、ノイズ有り学習データとして、前記統合学習データに追加するステップと、
前記ノイズを含まないと判定された学習データにノイズを追加して、前記ノイズ有りデータとして、前記統合学習データに追加するステップと、を含むことを特徴とする学習データ生成方法。
【請求項6】
コンピュータを、請求項1から4のいずれか一項に記載の学習データ生成装置として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学習データ生成装置、学習データ生成方法およびプログラムに関する。
【背景技術】
【0002】
歩道あるいは車道などの路面上を移動する自動車、歩行者、車椅子などの移動体に搭載されたセンサを用いて、移動体が移動する路面の状況(段差、勾配など)を推定する技術が検討されている(例えば、非特許文献1,2参照)。
【先行技術文献】
【非特許文献】
【0003】
【文献】宮田章裕、荒木伊織、王統順、鈴木天詩、「健常歩行者センサデータを用いたバリア検出の基礎検討」、IPSJ論文誌(2018)
【文献】「高速バスに載せたスマホの加速度センサーで路面の凹凸を検知、検証試験を実施」、[online]、[2018年9月4日検索]、インターネット<URL:https://sgforum.impress.co.jp/news/3595>
【発明の概要】
【発明が解決しようとする課題】
【0004】
上述したような路面の状況の推定は、学習データを用いた機械学習により構築されたモデルを用いて行われることが多い。しかしながら、学習データを用いた機械学習には、十分な学習精度が得られないことがある、また、機械学習のために多くの学習データが必要となり、コストの増大を招くといった問題がある。
【0005】
上記のような問題点に鑑みてなされた本発明の目的は、コストの増大を抑制しつつ、高精度な学習が可能な学習データを生成することができる学習データ生成装置、学習データ生成方法およびプログラムを提供することにある。
【課題を解決するための手段】
【0006】
上記課題を解決するため、本発明に係る学習データ生成装置は、機械学習に用いられる学習データがノイズを含むか否かを判定し、前記ノイズを含まないと判定した学習データを、ノイズ無し学習データとして、前記機械学習に用いられる学習データを統合した統合学習データに追加するとともに、前記ノイズを含むと判定した学習データを、ノイズ有り学習データとして、前記統合学習データに追加するノイズ判定部と、前記ノイズ判定部によりノイズを含まないと判定された学習データにノイズを追加して、前記ノイズ有りデータとして、前記統合学習データに追加するノイズ追加部とを備える。
【0007】
また、上記課題を解決するため、本発明に係る学習データ生成方法は、学習データ生成装置における学習データ生成方法であって、機械学習に用いられる学習データがノイズを含むか否かを判定し、前記ノイズを含まないと判定した学習データを、ノイズ無し学習データとして、前記機械学習に用いられる学習データを統合した統合学習データに追加するとともに、前記ノイズを含むと判定した学習データを、ノイズ有り学習データとして、前記統合学習データに追加するステップと、前記ノイズを含まないと判定された学習データにノイズを追加して、前記ノイズ有りデータとして、前記統合学習データに追加するステップと、を含む。
【0008】
また、上記課題を解決するため、本発明に係るプログラムは、コンピュータを上記の学習データ生成装置として機能させる。
【発明の効果】
【0009】
本発明に係る学習データ生成装置、学習データ生成方法およびプログラムによれば、コストの増大を抑制しつつ、高精度な学習が可能な学習データを生成することができる。
【図面の簡単な説明】
【0010】
【
図1】本発明の一実施形態に係る学習データ生成装置の構成例を示す図である。
【
図2】
図1に示す学習データ生成装置を含む推定システムの構成例を示す図である。
【
図3】
図1に示す学習データ生成装置における学習データ生成方法について説明するためのフローチャートである。
【
図4】
図1に示すノイズ追加部の動作を概念的に示す図である。
【
図5A】
図1に示すノイズ追加部によるノイズの追加を説明するための図である。
【
図5B】
図1に示すノイズ追加部によるノイズの追加を説明するための図である。
【発明を実施するための形態】
【0011】
以下、本発明を実施するための形態について、図面を参照しながら説明する。各図中、同一符号は、同一または同等の構成要素を示している。
【0012】
図1は、本発明の一実施形態に係る学習データ生成装置10の構成例を示す図である。本実施形態に係る学習データ生成装置10は、機械学習に用いられる学習データを生成するものである。より具体的には、本実施形態に係る学習データ生成装置10は、路面上を移動する自動車、歩行者、車椅子などの移動体に搭載されたセンサにより検出された、移動体が移動する路面の状況を示す路面データを含んで構成される学習データから、新たな学習データを生成するものである。
【0013】
図1に示す学習データ生成装置10は、ノイズ判定部11と、ノイズ追加部12と、統合学習データ記憶部13とを備える。
【0014】
ノイズ判定部11は、移動体に搭載されたセンサ(加速度センサ、ジャイロセンサ、重力センサなど)により検出された路面データを含んで構成される学習データが判定対象の学習データとして入力される。路面データは、移動体が路面上を移動する期間におけるセンサの検出値であり、時系列データである。ノイズ判定部11に入力される学習データは、例えば、所定期間における路面データに、その所定期間における路面の状況(平坦であるか、段差があるかなど)を示す教師ラベルが付与されたデータである。教師ラベルは、例えば、人手により付与される。なお、ノイズ判定部11に入力される学習データには教師ラベルが付されておらず、ノイズ判定部11による後述する判定後の任意のタイミングで教師ラベルが付されてもよい。
【0015】
ノイズ判定部11は、入力された判定対象の学習データ(路面データ)がノイズを含むか否かを判定する。一般に、移動体が粗い路面を走行する場合のセンサの検出値は、移動体が滑らかな路面を走行する場合のセンサの検出値と比べて、大きく変動する。すなわち、移動体が滑らかな路面を走行する期間では、路面データの変動は小さく、移動体が粗い路面を走行する期間では、路面データの変動は大きくなる。ノイズ判定部11は、移動体が粗い路面を走行する期間の路面データのような、変動が大きい(例えば、変動が所定値よりも大きい)期間における路面データを含んで構成される学習データを、ノイズを含むと判定する。また、ノイズ判定部11は、移動体が滑らかな路面を走行する期間の路面データのような、変動が小さい(例えば、変動が所定値よりも小さい)期間における路面データを含んで構成される学習データを、ノイズを含まないと判定する。すなわち、ノイズ判定部11は、学習データの値(本実施形態においては、路面データの値)の変動の大きさに応じて、学習データがノイズを含むか否かを判定する。
【0016】
ノイズ判定部11は、判定対象の学習データがノイズを含むと判定した場合には、判定対象の学習データを、ノイズを含む学習データ(以下、「ノイズ有り学習データ」として、統合学習データ記憶部13に記憶されている統合学習データに追加する。統合学習データとは、推定対象の種々の状態(本実施形態においては、路面の種々の状況)に対応する学習データを統合したものである。
【0017】
ノイズ判定部11は、判定対象の学習データがノイズを含まないと判定した場合には、判定対象の学習データを、ノイズを含まない学習データ(以下、「ノイズ無し学習データ」と称する)として、統合学習データに追加する。また、ノイズ判定部11は、判定対象の学習データ(ノイズ無し学習データ)をノイズ追加部12に出力する。
【0018】
ノイズ追加部12は、ノイズ判定部11によりノイズを含まないと判定された学習データにノイズを追加し(路面データにノイズを追加し)、ノイズ有り学習データとして、統合学習データ記憶部13に記憶されている統合学習データに追加する。すなわち、ノイズ追加部12は、ノイズを含まないと判定された学習データにノイズを追加して新たな学習データを生成する。ノイズ追加部12によるノイズの追加の詳細については後述する。
【0019】
統合学習データ記憶部13は、ノイズ判定部11およびノイズ追加部12から出力されたノイズ有り学習データ、および、ノイズ判定部11から出力されたノイズ無し学習データを統合して、統合学習データとして記憶する。そして、統合学習データ記憶部13は、所定量の学習データが記憶されると、記憶している統合学習データを出力する。
【0020】
図2は、本実施形態に係る学習データ生成装置10を含む推定システム1の構成例を示す図である。
図2に示す推定システム1は、例えば、移動体が移動する路面の状況を推定するものである。
【0021】
図2に示す推定システム1は、学習データ生成装置10と、学習装置20と、推定装置30とを備える。上述したように、学習データ生成装置10は、統合学習データを生成し、出力する。
【0022】
学習装置20は、学習部21を備える。学習部21は、学習データ生成装置10により生成された学習データを用いて学習用モデル22の機械学習を行い、学習済みモデル23を構築する。学習用モデル22としては、畳み込みニューラルネットワークを用いたモデル、SVM(Support Vector Machine)など種々のモデルを用いることができる。
【0023】
推定装置30は、推定部31を備える。推定部31は、路面上を移動する移動体に搭載されたセンサにより検出された路面データが入力データとして入力される。推定部31は、入力データを学習装置20により構築された学習済みモデル23に入力し、学習済みモデル23の出力を、移動体が移動する路面の状況の推定結果として出力する。
【0024】
このように、
図2に示す推定システム1においては、学習データ生成装置10は、統合学習データを生成し、学習装置20は、その統合学習データを用いて、路面の状況を推定するための学習済みモデル23を構築する。そして、推定装置30は、構築された学習済みモデル23を用いて、路面の状況を推定する。
【0025】
図3は、本実施形態に係る学習データ生成装置10における学習データ生成方法について説明するためのフローチャートである。
【0026】
ノイズ判定部11は、判定対象の学習データが入力されると(ステップS11)、判定対象の学習データはノイズを含むか否かを判定する(ステップS12)。
【0027】
判定対象の学習データはノイズを含むと判定した場合には(ステップS12:Yes)、ノイズ判定部11は、判定対象の学習データをノイズ有り学習データとして統合学習データに追加する(ステップS13)。
【0028】
判定対象の学習データはノイズを含まないと判定した場合には(ステップS12:No)、ノイズ判定部11は、判定対象の学習データをノイズ無し学習データとして統合学習データに追加する(ステップS14)。
【0029】
ノイズ追加部12は、ノイズ判定部11によりノイズを含まないと判定された学習データに対してノイズを追加し(ステップS15)、ノイズを追加した学習データを、ノイズ有り学習データとして統合学習データに追加する(ステップS16)。
【0030】
ノイズを含まない学習データは、例えば、移動体が移動する路面が滑らかである場合に対応する学習データである。ノイズ追加部12は、この学習データに、
図4に示すように、ノイズ(例えば、移動体が移動する路面に段差がある場合に対応するノイズ)を追加する。こうすることで、移動体が移動する路面が滑らかである場合に対応する学習データから、移動体が移動する路面に段差がある場合に対応する学習データを新たに生成することができる。したがって、学習データの生成のコストを抑制しつつ、十分な量の学習データを生成することができ、高精度な学習が可能となる。
【0031】
図3を再び参照すると、ステップS13あるいはステップS16の処理の後、統合学習データ記憶部13は、一定量以上の統合学習データが収集されたか否かを判定する(ステップS17)。
【0032】
一定量以上の統合学習データが収集されたと判定した場合には(ステップS17:Yes)、統合学習データ記憶部13は、記憶している統合学習データを出力し(ステップS18)、処理を終了する。
【0033】
一定量以上の統合学習データが収集されていないと判定された場合には(ステップS17:No)、ステップS11の処理に戻り、ノイズ判定部11に新たな判定対象の学習データが入力される。
【0034】
次に、ノイズ追加部12によるノイズの追加について、
図5A,5Bを参照して説明する。
【0035】
図5Aは、ノイズの追加前の学習データ(路面データ)の一例を示す図である。また、
図5Bは、ノイズの追加後の学習データ(路面データ)の一例を示す図である。
図5A,5Bにおいては、移動体に複数種類のセンサが搭載され、その複数種類のセンサそれぞれにより路面データが検出された例を示している。具体的には、
図5A,5Bにおいては、路面データとして、加速度センサにより3軸方向の加速度(加速度X、加速度Y、加速度Z)が検出され、ジャイロセンサによりロール軸、ピッチ軸およびヨー軸方向の加速度およびロール軸、ピッチ軸およびヨー軸方向の角速度(ジャイロ1軸、ジャイロ2軸、ジャイロ3軸、ジャイロ4軸、ジャイロ5軸、ジャイロ6軸)が検出され、重力センサにより重力による3軸方向の加速度(重力X、重力Y、重力Z)が検出された例を示している。
【0036】
ノイズ追加部12は、ノイズ無し学習データに対して、路面の凹凸などにより検出値が変動する鉛直方向にのみノイズを加えるのではなく、全方向にノイズを追加する。すなわち、ノイズ追加部12は、路面データに対して、直交する3軸方向(X,Y,Z軸)それぞれについてノイズを追加する。こうすることで、路面データを検出するセンサを備えるデバイスの向きによらず、学習データから路面の状況を推定するモデルを構築することができる。
【0037】
ノイズ追加部12は、複数種類のセンサそれぞれについて、例えば、センサの検出値に対して、平均が0であり、分散がそのセンサの検出値の分散である正規分布に従うノイズを追加する。すなわち、ノイズ追加部12は、ノイズ追加前のセンサの検出値をxとし、ノイズ追加後の値をx’とし、そのセンサの検出値の分散をstd^2とすると、以下の式(1)に従い、ノイズを追加する。
x’=x+N(0,std^2) ・・・式(1)
【0038】
なお、N(μ,σ^2)は、平均がμであり、分散がσ^2である正規分布に従うランダムな値を意味する。
【0039】
上述したような正規分布に従うノイズを、直交する3軸方向それぞれに追加することで、ノイズの追加の前後で、平均および分散が大きく変わらないようにすることができる。なお、学習データに追加するノイズは、上述した正規分布に従わないノイズであってもよい。また、正規分布の分散は、センサの検出値の分散よりも大きい値であってもよい。
【0040】
図5Aに示す例では、加速度センサの検出値の分散は0.31であり、ジャイロセンサの検出値の分散は0.36であり、重力センサの検出値の分散は0.30である。ノイズ追加部12は、各センサの検出値の分散を用いて、式(1)に従い、各センサの検出値にノイズを追加する。すなわち、ノイズ追加部12は、加速度センサの検出値に、平均が0であり、分散が0.31である正規分布に従うノイズを追加する。また、ノイズ追加部12は、ジャイロセンサの検出値に、平均が0であり、分散が0.36である正規分布に従うノイズを追加する。また、ノイズ追加部12は、重力センサの検出値に、平均が0であり、分散が0.30である正規分布に従うノイズを追加する。ノイズの追加後の学習データを
図5Bに示す。
【0041】
このように本実施形態においては、学習データ生成装置10は、機械学習に用いられる学習データがノイズを含むか否かを判定するノイズ判定部11と、ノイズ判定部11によりノイズを含まないと判定された学習データにノイズを追加して新たな学習データを生成するノイズ追加部12とを備える。
【0042】
ノイズを含まないと判定された学習データにノイズを追加して新たな学習データを生成することで、学習データの生成のコストを抑制しつつ、十分な量の学習データを生成することができ、高精度な学習が可能となる。
【0043】
なお、本実施形態においては、学習データ生成装置10は、移動体に搭載されたセンサにより検出された路面データから学習データを生成する例を用いて説明したが、本発明はこれに限られるものではない。学習データ生成装置10は、ノイズを含み得る種々のデータから学習データを生成することができる。
【0044】
以上、学習データ生成装置10について説明したが、学習データ生成装置10として機能させるために、コンピュータを用いることも可能である。そのようなコンピュータは、学習データ生成装置10の各機能を実現する処理内容を記述したプログラムを、該コンピュータの記憶部に格納しておき、該コンピュータのCPUによってこのプログラムを読み出して実行させることで実現することができる。
【0045】
また、プログラムは、コンピュータが読取り可能な記録媒体に記録されていてもよい。このような記録媒体を用いれば、プログラムをコンピュータにインストールすることが可能である。ここで、プログラムが記録された記録媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROMおよびDVD-ROMなどの記録媒体であってもよい。
【0046】
上述の実施形態は代表的な例として説明したが、本発明の趣旨および範囲内で、多くの変更および置換が可能であることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形および変更が可能である。例えば、実施形態の構成図に記載の複数の構成ブロックを1つに組み合わせたり、あるいは1つの構成ブロックを分割したりすることが可能である。
【符号の説明】
【0047】
1 推定システム
10 学習データ生成装置
11 ノイズ判定部
12 ノイズ追加部
13 統合学習データ記憶部
20 学習装置
21 学習部
22 学習用モデル
23 学習済みモデル
30 推定装置
31 推定部