特許第6810675号(P6810675)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 東京エレクトロンデバイス株式会社の特許一覧

<>
  • 特許6810675-情報処理装置及びプログラム 図000002
  • 特許6810675-情報処理装置及びプログラム 図000003
  • 特許6810675-情報処理装置及びプログラム 図000004
  • 特許6810675-情報処理装置及びプログラム 図000005
  • 特許6810675-情報処理装置及びプログラム 図000006
  • 特許6810675-情報処理装置及びプログラム 図000007
  • 特許6810675-情報処理装置及びプログラム 図000008
  • 特許6810675-情報処理装置及びプログラム 図000009
  • 特許6810675-情報処理装置及びプログラム 図000010
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6810675
(24)【登録日】2020年12月15日
(45)【発行日】2021年1月6日
(54)【発明の名称】情報処理装置及びプログラム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20201221BHJP
【FI】
   G06N20/00 130
【請求項の数】5
【全頁数】14
(21)【出願番号】特願2017-221038(P2017-221038)
(22)【出願日】2017年11月16日
(65)【公開番号】特開2019-91351(P2019-91351A)
(43)【公開日】2019年6月13日
【審査請求日】2019年3月8日
【前置審査】
(73)【特許権者】
【識別番号】500323188
【氏名又は名称】東京エレクトロンデバイス株式会社
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】成田 隆慶
【審査官】 打出 義尚
(56)【参考文献】
【文献】 特開2013−003706(JP,A)
【文献】 松原 崇充,玄 相昊,森本 淳,個性を考慮した周期的全身運動の予測,電子情報通信学会論文誌,日本,社団法人電子情報通信学会,2011年 1月 1日,第J94−D巻,第1号,pp.344−355
【文献】 西田 泰明,阪口 豊,身体運動の協調構造を利用した到達運動の先読みシステム,電子情報通信学会技術研究報告,日本,一般社団法人電子情報通信学会,2013年 3月 6日,Vol.112,No.480,pp.129−134
(58)【調査した分野】(Int.Cl.,DB名)
G06N 20/00
(57)【特許請求の範囲】
【請求項1】
系列データである基準データを基準として、相互相関により算出される類似度が高くなるよう他の系列データを位置合わせする位置合わせ部と、
全ての系列データが重複する部分を、対象データとして抽出する対象データ抽出部と、
複数の前記対象データと、複数の前記対象データから抽出された特徴量と、の少なくとも一方に基づいて、前記系列データのラベルを判別する判別モデルを生成するモデル生成部と
を備え、
前記モデル生成部は、予め用意された複数の学習アルゴリズムにより前記判別モデルを生成し、判別精度が最も高い前記判別モデルを出力し、
前記全ての系列データが重複する部分は、位置合わせされた系列データのうち始点が最も後ろに位置する系列データの始点から、位置合わせされた系列データのうち終点が最も前に位置する系列データの終点まで、の部分である、情報処理装置。
【請求項2】
前記対象データから特徴量を抽出する特徴量抽出部を更に備える
請求項1に記載の情報処理装置。
【請求項3】
複数の系列データの中から、前記基準データを選択する基準データ選択部を更に備える
請求項1または請求項2に記載の情報処理装置。
【請求項4】
前記系列データのラベルを判別する判別モデルに基づいて、前記対象データのラベルを判別する判別部を更に備える
請求項1から請求項までのいずれか1項に記載の情報処理装置。
【請求項5】
系列データである基準データを基準として、相互相関により算出される類似度が高くなるよう他の系列データを位置合わせする位置合わせ工程と、
全ての系列データが重複する部分を、対象データとして抽出する対象データ抽出工程と、
複数の前記対象データと、複数の前記対象データから抽出された特徴量と、の少なくとも一方に基づいて、前記系列データのラベルを判別する判別モデルを生成するモデル生成工程と
をコンピュータに実行させ、
前記モデル生成工程は、予め用意された複数の学習アルゴリズムにより前記判別モデルを生成し、判別精度が最も高い前記判別モデルを出力し、
前記全ての系列データが重複する部分は、位置合わせされた系列データのうち始点が最も後ろに位置する系列データの始点から、位置合わせされた系列データのうち終点が最も前に位置する系列データの終点まで、の部分である、プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置及びプログラムに関する。
【背景技術】
【0002】
従来、教師データを機械学習することにより判別モデルを生成し、当該判別モデルを利用して、判別対象データのラベルを判別する技術が知られている。このような技術は、例えば、機器に設置されたセンサのセンサデータに基づいて、当該機器の異常を検知するために利用されている。
【0003】
一般に、判別モデルの生成時には、教師データの前処理(正規化やサイズ調整など)が行われる。同様に、判別対象データのラベルの判別時には、判別対象データの前処理が行われる。データを前処理することにより、判別モデル自体の判別精度や、実際に判別モデルを利用して判別を実行する際の判別精度を向上させることができる。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2017−174045号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
データの適切な前処理方法は、データによって異なる。このため、前処理や前処理方法の構築は、データサイエンティストなどの専門家により行われていた。この結果、判別モデルの生成や、判別対象データのラベルの判別には、多くの手間がかかった。
【0006】
本発明は、上記の課題に鑑みてなされたものであり、データの前処理を自動化することを目的とする。
【課題を解決するための手段】
【0007】
一実施形態に係る情報処理装置は、系列データである基準データを基準として、他の系列データを位置合わせする位置合わせ部と、前記他の系列データにおける、前記基準データと対応する部分を、対象データとして抽出する対象データ抽出部と、を備える。
【発明の効果】
【0008】
本発明の各実施形態によれば、データの前処理の自動化を実現できる。
【図面の簡単な説明】
【0009】
図1】判別システムの概略構成の一例を示す図。
図2】モデル生成装置のハードウェア構成の一例を示す図。
図3】モデル生成装置及び判別装置の機能構成の一例を示す図。
図4】系列データDの一例を示す図。
図5】位置合わせされた系列データDの一例を示す図。
図6図5の各系列データD1〜D24から抽出された対象データを示す図。
図7図5の系列データD3(基準データD0)及び系列データD4から抽出された対象データをウェーブレット変換した結果を示す図。
図8】モデル生成装置の動作の一例を示すフローチャート。
図9】判別装置の動作の一例を示すフローチャート。
【発明を実施するための形態】
【0010】
以下、本発明の各実施形態について、添付の図面を参照しながら説明する。なお、各実施形態に係る明細書及び図面の記載に関して、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重畳した説明を省略する。
【0011】
一実施形態に係る判別システム100について、図1図9を参照して説明する。本実施形態に係る判別システム100は、教師データを機械学習することにより判別モデルを生成し、当該判別モデルにより判別対象データのラベルを判別するシステムである。
【0012】
まず、判別システム100の概略構成について説明する。図1は、判別システム100の概略構成の一例を示す図である。図1の判別システム100は、モデル生成装置1と、判別装置2と、を備える。
【0013】
モデル生成装置1は、情報処理装置の一例であり、教師データ(ラベルを付与された系列データD)が入力され、当該教師データに基づいて、系列データDのラベルを判別する判別モデルを生成するコンピュータである。モデル生成装置1は、PC(Personal Computer)、サーバ、スマートフォン、タブレット端末、又はマイコンであるが、これに限られない。系列データDは、1つ又は複数のデータを含むレコードが、所定の順序で並べられたものであり、時系列データ、一次元配列に変換された画像データ、及びテキストデータを含む。時系列データは、センサデータ及び音声データを含む。系列データDには、2種類以上のラベルが付与され得る。
【0014】
判別装置2は、情報処理装置の一例であり、判別対象データ(系列データD)が入力され、当該判別対象データのラベルを、モデル生成装置1が生成した判別モデルを利用して判別するコンピュータである。判別装置2は、PC、サーバ、スマートフォン、タブレット端末、又はマイコンであるが、これに限られない。判別対象データは、ラベルを付与されていてもよいし、ラベルを付与されていなくてもよい。
【0015】
なお、図1の例では、モデル生成装置1及び判別装置2は、それぞれ異なるコンピュータにより構成されているが、同一のコンピュータにより構成されてもよい。また、判別装置2は、モデル生成装置1が生成した判別モデルとは異なる判別モデルを利用して、系列データDのラベルを判別してもよい。
【0016】
次に、モデル生成装置1及び判別装置2のハードウェア構成について説明する。図2は、モデル生成装置1のハードウェア構成の一例を示す図である。図2のモデル生成装置1は、CPU(Central Processing Unit)101と、ROM(Read Only Memory)102と、RAM(Random Access Memory)103と、HDD(Hard Disk Drive)104と、入力装置105と、表示装置106と、通信インタフェース107と、バス108と、を備える。
【0017】
CPU101は、プログラムを実行することにより、モデル生成装置1の各構成を制御し、モデル生成装置1の機能を実現する。
【0018】
ROM102は、CPU101が実行するプログラムを含む各種のデータを記憶する。
【0019】
RAM103は、CPU101に作業領域を提供する。
【0020】
HDD104は、CPU101が実行するプログラムを含む各種のデータを記憶する。
【0021】
入力装置105は、モデル生成装置1にユーザの操作に応じた情報を入力する。入力装置105は、キーボード、マウス、タッチパネル、及びハードウェアボタンを含む。
【0022】
表示装置106は、ユーザの操作に応じた画面を表示する。表示装置106は、液晶ディスプレイ、プラズマディスプレイ、及び有機EL(Electro Luminescence)ディスプレイを含む。
【0023】
通信インタフェース107は、モデル生成装置1を有線又は無線でインターネットやLAN(Local Area Network)などのネットワークに接続する。モデル生成装置1は、ネットワークを介して、判別装置2と接続されてもよい。
【0024】
バス108は、CPU101、ROM102、RAM103、HDD104、入力装置105、表示装置106、及び通信インタフェース107を相互に接続する。
【0025】
なお、モデル生成装置1のハードウェア構成は、図2の例に限られない。モデル生成装置1は、CPU101、ROM102、及びRAM103を備える任意の構成で有り得る。また、判別装置2のハードウェア構成は、モデル生成装置1と同様であるため、説明を省略する。
【0026】
次に、モデル生成装置1及び判別装置2の機能構成について説明する。図3は、モデル生成装置1及び判別装置2の機能構成の一例を示す図である。
【0027】
まず、モデル生成装置1の機能構成について説明する。図3のモデル生成装置1は、系列データ記憶部11と、基準データ選択部12と、位置合わせ部13と、対象データ抽出部14と、特徴量抽出部15と、モデル生成部16と、を備える。系列データ記憶部11は、ROM102、RAM103、及びHDD104などにより実現される。基準データ選択部12、位置合わせ部13、対象データ抽出部14、特徴量抽出部15、及びモデル生成部16は、CPU101がプログラムを実行することにより実現される。
【0028】
系列データ記憶部11は、ラベルが付与された系列データD(教師データ)を複数記憶する。各系列データDは、それぞれデータファイルとして保存される。系列データ記憶部11に記憶される各系列データDのサイズは同一であってもよいし、異なってもよい。
【0029】
図4は、系列データDの一例を示す図である。図4の系列データDは、加速度センサのセンサデータであり、複数のレコードが計測時刻の順に並べられている。各レコードには、x軸方向、y軸方向、及びz軸方向の3つのデータ項目の値(データ)が含まれている。このように、系列データDには、複数のデータ項目が含まれてもよいし、1つのデータ項目が含まれてもよい。系列データ記憶部11には、図4のような系列データDが、ラベルと対応付けて記憶される。
【0030】
基準データ選択部12は、系列データ記憶部11に記憶された複数の系列データDの中から、基準データD0を選択する。基準データD0は、位置合わせ部13による位置合わせの基準となる系列データDである。基準データ選択部12は、ランダムに基準データD0を選択してもよいし、何らかのアルゴリズムに従って基準データD0を選択してもよい。基準データD0の選択方法は任意である。
【0031】
一般に、学習対象となる系列データDには、特徴的なパターンが含まれる。しかしながら、系列データDにおけるどのデータ項目に当該パターンが含まれるかはわからない。特徴的なパターンを含まないデータ項目を利用して機械学習を行うと、高精度な判別モデルを生成できないおそれがある。
【0032】
そこで、図4の例のように、各系列データDに複数のデータ項目が含まれる場合には、基準データ選択部12は、複数のデータ項目の中から、1つ又は複数のデータ項目を基準データD0として選択してもよい。基準データ選択部12は、系列データD間における類似度が最も高いデータ項目や、系列データD間における類似度が閾値以上の1つ又は複数のデータ項目を、基準データD0として選択するのが好ましい。類似度は、相互相関や動的時間伸縮法により算出できる。これにより、基準データ選択部12は、特徴的なパターンが含まれる可能性が高いデータ項目を、基準データD0として選択することができる。
【0033】
なお、基準データ選択部12は、基準データD0を選択する前に、各系列データDに対して正規化などの前処理を実行してもよい。
【0034】
位置合わせ部13は、基準データ選択部12により選択された基準データD0を基準として、系列データ記憶部11に記憶された他の系列データDを位置合わせする。基準データ選択部12により、複数のデータ項目の中から、1つ又は複数のデータ項目を基準データD0として選択されている場合には、位置合わせ部13は、他の系列データDにおける、基準データ選択部12により選択されたデータ項目を、基準データD0を基準として位置合わせする。
【0035】
一般に、学習対象となる系列データDには、特徴的なパターンが含まれる。しかしながら、当該パターンが含まれる位置は、系列データDによって異なる。このため、各系列データDの始点を一致させた状態で機械学習を行うと、各系列データDにおける特徴的なパターンの位置ずれにより、高精度な判別モデルを生成できないおそれがある。
【0036】
そこで、位置合わせ部13は、各系列データDに含まれる特徴的なパターンの位置が、基準データD0に含まれる特徴的なパターンの位置と一致するように、各系列データDを位置合わせする。具体的には、位置合わせ部13は、基準データD0と他の系列データDとの類似度が高まるように、基準データD0を基準として、他の系列データDの始点を移動させる。この際、位置合わせ部13は、必要に応じてデータの補間や間引きを行ってもよい。類似度は、相互相関や動的時間伸縮法により算出できる。位置合わせ部13は、基準データD0と他の系列データDとの類似度が最大となるように、他の系列データDの始点を移動させるのが好ましい。これにより、位置合わせ部13は、各系列データDにおける特徴的なパターンの位置を、基準データD0に含まれる特徴的なパターンの位置と一致させることができる。
【0037】
図5は、位置合わせされた系列データDの一例を示す図である。図5の例では、「ok」又は「ng」というラベルを付与された24個の系列データD1〜D24が、系列データD3(基準データD0)を基準として位置合わせされている。図5からわかるように、他の系列データD1,D2,D4〜D24は、基準データD0に対して始点を相対的に移動させることにより、位置合わせされる。
【0038】
対象データ抽出部14は、位置合わせ部13により位置合わせされた他の系列データDにおける、基準データD0と対応(重複)する部分を、対象データとして抽出する。対象データは、後段の処理で利用される対象となるデータである。対象データ抽出部14により抽出される対象データは、判別モデルを生成するための機械学習に利用されるデータに相当する。
【0039】
また、対象データ抽出部14は、各系列データDから、同一の部分を対象データとして抽出する。さらに、対象データ抽出部14は、基準データD0から、各系列データDから抽出された対象データと同一の部分を対象データとして抽出する。
【0040】
この結果、基準データD0及び他の系列データDからそれぞれ、全ての系列データDが重複する部分が対象データとして抽出される。全ての系列データDが重複する部分は、位置合わせされた系列データDのうち始点が最も後ろに位置する系列データDの始点から、位置合わせされた系列データDのうち終点が最も前に位置する系列データDの終点まで、の部分に相当する。
【0041】
例えば、図5の例では、位置合わせされた系列データDのうち始点が最も後ろに位置する系列データDは系列データD10であり、位置合わせされた系列データDのうち終点が最も前に位置する系列データDは系列データD9である。したがって、各系列データD1〜D24から、系列データD10の始点から系列データD9の終点までの部分(図5における実線で囲まれた部分)が対象データとして抽出される。
【0042】
図6は、図5の各系列データD1〜D24から抽出された対象データを示す図である。図6からわかるように、対象データは同一のサイズを有するデータとなる。対象データは、特徴的なパターンを位置合わせされた各系列データDの重複部分であるため、当該パターンを含む。後段では、この対象データを利用して処理が行われる。
【0043】
このように、本実施形態によれば、基準データ選択部12及び位置合わせ部13により、系列データ記憶部11に記憶された、サイズや特徴的なパターンの位置が不揃いの複数の系列データD(教師データ)から、サイズが同一であり、特徴的なパターンが位置合わせされた複数の対象データを自動的に抽出することができる。モデル生成装置1は、この対象データを利用して判別モデルを生成するため、高精度な判別モデルを生成することができる。
【0044】
特徴量抽出部15は、対象データ抽出部14により抽出された複数の対象データから、それぞれ特徴量を抽出する。特徴量抽出部15は、例えば、ウェーブレット変換、高速フーリエ変換、ローパスフィルタ、ハイパスフィルタなどの方法により特徴量を抽出することができる。特徴量の抽出方法は任意である。
【0045】
図7は、図5の系列データD3(基準データD0)及び系列データD4から抽出された対象データをウェーブレット変換した結果を示す図である。図7によれば、2つの対象データには類似するパターンが含まれていることがわかる。ウェーブレット変換により、このようなパターンを特徴量として抽出することができる。
【0046】
モデル生成部16は、特徴量抽出部15が抽出した複数の特徴量と、当該特徴量が抽出された系列データDに付与されたラベルと、の関係を機械学習することにより、系列データDのラベルを判別する判別モデルを生成する。具体的には、モデル生成部16は、予め用意された複数の学習アルゴリズムによりそれぞれ判別モデルを生成し、各学習アルゴリズムにより生成された判別モデルの判別精度を、クロスバリデーションにより計算する。そして、モデル生成部16は、判別精度が最も高い判別モデルを、系列データDのラベルの判別モデルとして出力する。これにより、判別精度が高い判別モデルを自動的に生成することができる。
【0047】
モデル生成部16は、ランダムフォレスト、サポートベクターマシン、ロジスティック回帰、ディープラーニングなどの、任意の学習アルゴリズムを利用できる。また、ディープラーニングのように、特徴量を抽出できる学習アルゴリズムを利用する場合には、モデル生成部16は、対象データ抽出部14が抽出した複数の対象データと、当該特徴量が抽出された系列データDに付与されたラベルと、の関係を機械学習することにより、系列データDのラベルを判別する判別モデルを生成してもよい。この場合、特徴量抽出部15は不要である。また、モデル生成部16は、特徴量に基づいて判別モデルを生成する学習アルゴリズムと、対象データに基づいて判別モデルを生成する学習アルゴリズムと、を併用してもよい。
【0048】
次に、判別装置2の機能構成について説明する。図3の判別装置2は、系列データ記憶部21と、判別モデル記憶部22と、位置合わせ部23と、対象データ抽出部24と、特徴量抽出部25と、判別部26と、を備える。系列データ記憶部21及び判別モデル記憶部22は、判別装置2のROM、RAM、及びHDDなどにより実現される。位置合わせ部23、対象データ抽出部24、特徴量抽出部25、及び判別部26は、判別装置2のCPUがプログラムを実行することにより実現される。
【0049】
系列データ記憶部21は、1つ又は複数の系列データD(判別対象データ)を記憶する。各系列データDは、それぞれデータファイルとして保存される。系列データ記憶部21に記憶される各系列データDのサイズは同一であってもよいし、異なってもよい。また、系列データDには、複数のデータ項目が含まれてもよいし、1つのデータ項目が含まれてもよい。また、系列データDは、ラベルを付与されていてもよいし、ラベルを付与されていなくてもよい。ラベルが付与されていない系列データDを判別対象データとして利用することにより、ラベルが未知の系列データDのラベルを判別することができる。また、ラベルが付与された系列データDを判別対象データとして利用することにより、判別モデルの判別精度を検証することができる。
【0050】
判別モデル記憶部22は、系列データDのラベルを判別する判別モデルを記憶する。判別モデル記憶部22には、モデル生成装置1が生成した判別モデルが記憶されてもよいし、モデル生成装置1が生成した判別モデルとは異なる判別モデルが記憶されていてもよい。
【0051】
また、判別モデル記憶部22は、基準データd0を記憶する。基準データd0は、位置合わせ部23による位置合わせの基準となる系列データDである。基準データd0は、特徴的なパターンを含み、かつ、特徴的なパターンと関係のない部分が少ない(サイズが小さい)系列データDであるのが好ましい。したがって、判別モデル記憶部22には、基準データd0として、対象データ抽出部14が基準データD0から抽出した対象データが記憶されるのが好ましい。なお、判別モデル記憶部22には、基準データd0として、対象データ抽出部14が他の系列データDから抽出した対象データが記憶されてもよいし、系列データ記憶部11に記憶された任意の系列データDが記憶されてもよい。
【0052】
位置合わせ部23は、判別モデル記憶部22に記憶された基準データd0を基準として、系列データ記憶部21に記憶された系列データDを位置合わせする。基準データd0に含まれるデータ項目と、系列データDに含まれるデータ項目と、が異なる場合には、位置合わせ部23は、系列データDにおける、基準データd0と共通のデータ項目を、基準データd0を基準として位置合わせする。
【0053】
位置合わせ部23は、各系列データDに含まれる特徴的なパターンの位置が、基準データd0に含まれる特徴的なパターンの位置と一致するように、各系列データDを位置合わせする。具体的には、位置合わせ部23は、基準データd0と系列データDとの類似度が高まるように、基準データd0を基準として、系列データDの始点を移動させる。この際、位置合わせ部13は、必要に応じてデータの補間や間引きを行ってもよい。類似度は、相互相関や動的時間伸縮法により算出できる。位置合わせ部23は、基準データd0と系列データDとの類似度が最大となるように、系列データDの始点を移動させるのが好ましい。これにより、位置合わせ部23は、系列データDにおける特徴的なパターンの位置を、基準データd0に含まれる特徴的なパターンの位置と一致させることができる。
【0054】
なお、位置合わせ部23は、系列データDを位置合わせする前に、系列データDに対して正規化などの前処理を実行してもよい。
【0055】
対象データ抽出部24は、位置合わせ部23により位置合わせされた系列データDにおける、基準データd0と対応(重複)する部分を、対象データとして抽出する。対象データは、後段の処理で利用される対象となるデータである。対象データ抽出部24により抽出される対象データは、系列データDのラベルの判別に利用されるデータに相当する。
【0056】
系列データDと基準データd0とが対応(重複)する部分は、基準データd0及び位置合わせされた系列データDのうち始点が後ろに位置する方の始点から、基準データd0及び位置合わせされた系列データDのうち終点が前に位置する方の終点まで、の部分に相当する。後段では、この対象データを利用して処理が行われる。
【0057】
このように、本実施形態によれば、位置合わせ部23により、系列データ記憶部21に記憶された、サイズや特徴的なパターンの位置が不揃いの系列データD(判別対象データ)から、サイズが同一であり、特徴的なパターンが位置合わせされた対象データを自動的に抽出することができる。判別装置2は、この対象データを利用して系列データDのラベルを判別するため、ラベルを高精度に判別することができる。
【0058】
特徴量抽出部25は、対象データ抽出部24により抽出された対象データから特徴量を抽出する。特徴量抽出部25は、例えば、ウェーブレット変換、高速フーリエ変換、ローパスフィルタ、ハイパスフィルタなどの方法により特徴量を抽出することができる。特徴量の抽出方法は任意である。
【0059】
判別部26は、特徴量抽出部25により抽出された特徴量を、判別モデル記憶部22に記憶された判別モデルを入力することにより、系列データDのラベルを判別する。
【0060】
次に、モデル生成装置1及び判別装置2の動作について説明する。
【0061】
まず、モデル生成装置1の動作について説明する。図8は、モデル生成装置1の動作の一例を示すフローチャートである。図8の動作は、モデル生成装置1のユーザが、モデル生成装置1に複数の教師データ(ラベルを付与された系列データD)を入力すると開始される。
【0062】
まず、系列データ記憶部11が、ユーザにより入力された教師データを記憶する(ステップS101)。教師データは、ユーザ端末からネットワークを介して入力されてもよいし、CD−ROMなどの記憶媒体から入力されてもよい。
【0063】
次に、基準データ選択部12が、系列データ記憶部11から系列データD(教師データ)を読み出し、読み出した系列データDの中から基準データD0を選択する(ステップS102)。基準データ選択部12は、基準データD0の選択を、定期的に実行してもよいし、ユーザからの判別モデルの生成要求に応じて実行してもよいし、系列データ記憶部11に新たな教師データが追加されるたびに実行してもよい。基準データ選択部12は、系列データD及び選択結果(基準データD0として選択された系列データDを示す情報)を位置合わせ部13に通知する。
【0064】
位置合わせ部13は、基準データ選択部12から選択結果を通知されると、基準データD0を基準として、他の系列データDを位置合わせする(ステップS103)。位置合わせ部13は、系列データD及び位置合わせ結果(位置合わせされた他の系列データDの始点の、基準データD0の始点に対する相対位置を示す情報)を対象データ抽出部14に通知する。
【0065】
対象データ抽出部14は、位置合わせ結果を通知されると、基準データD0及び他の系列データDから、対象データをそれぞれ抽出する(ステップS104)。対象データ抽出部14は、系列データD及び抽出結果(各系列データDにおける対象データの始点及び終点を示す情報)を特徴量抽出部15に通知する。また、対象データ抽出部14は、基準データD0から抽出した対象データを判別装置2に送信する。判別装置2の判別モデル記憶部22は、対象データを受信すると、当該対象データを新たな基準データd0として記憶する。
【0066】
特徴量抽出部15は、対象データ抽出部14から抽出結果を通知されると、各対象データから特徴量を抽出する(ステップS105)。特徴量抽出部15は、系列データD及び抽出結果(各対象データから抽出した特徴量)をモデル生成部16に通知する。
【0067】
モデル生成部16は、特徴量抽出部15から抽出結果を通知されると、系列データ記憶部11から各系列データDのラベルを読み出し、各系列データDの特徴量とラベルとの関係を機械学習し、判別モデルを生成する(ステップS106)。モデル生成部16は、生成した判別モデルを判別装置2に送信する。判別装置2の判別モデル記憶部22は、判別モデルを受信すると、当該判別モデルを新たな判別モデルとして記憶する。
【0068】
モデル生成装置1は、以上の動作により、判別モデルを自動的に生成することができる。なお、モデル生成装置1は、各工程で得られた結果を表示装置106に表示し、モデル生成装置1のユーザが確認できるようにしてもよい。例えば、表示装置106に、教師データの入力画面、図5のような位置合わせ結果、図6のような対象データの抽出結果、生成された判別モデル、判別モデルの判別精度などを表示することが考えられる。
【0069】
次に、判別装置2の動作について説明する。図9は、判別装置2の動作の一例を示すフローチャートである。図9の動作は、判別装置2のユーザが、判別装置2に判別対象データ(系列データD)を入力すると開始される。
【0070】
まず、系列データ記憶部21が、ユーザにより入力された判別対象データを記憶する(ステップS201)。判別対象データは、ユーザ端末からネットワークを介して入力されてもよいし、CD−ROMなどの記憶媒体から入力されてもよい。
【0071】
次に、位置合わせ部23が、系列データ記憶部21から系列データD(判別対象データ)を読み出し、判別モデル記憶部22から基準データd0を読み出し、基準データd0を基準として、系列データDを位置合わせする(ステップS202)。位置合わせ部23は、系列データDの位置合わせを、定期的に実行してもよいし、ユーザからのラベルの判別要求に応じて実行してもよいし、系列データ記憶部21に新たな判別対象データが追加されるたびに実行してもよい。位置合わせ部23は、系列データD及び位置合わせ結果(位置合わせされた系列データDの始点の、基準データd0の始点に対する相対位置を示す情報)を対象データ抽出部24に通知する。
【0072】
対象データ抽出部24は、位置合わせ結果を通知されると、系列データDから対象データを抽出する(ステップS203)。対象データ抽出部24は、抽出結果(系列データDにおける対象データの始点及び終点を示す情報)を特徴量抽出部25に通知する。
【0073】
特徴量抽出部25は、対象データ抽出部24から抽出結果を通知されると、対象データから特徴量を抽出する(ステップS204)。特徴量抽出部25は、抽出結果(対象データから抽出した特徴量)を判別部26に通知する。
【0074】
判別部26は、特徴量抽出部25から抽出結果を通知されると、判別モデル記憶部22から判別モデルを読み出し、当該判別モデルに特徴量を入力して、系列データのDのラベルを判別する(ステップS205)。
【0075】
判別装置2は、以上の動作により、系列データDのラベルを自動的に判別することができる。なお、判別装置2は、各工程で得られた結果を表示装置に表示し、判別装置2のユーザが確認できるようにしてもよい。例えば、表示装置に、判別対象データの入力画面、図5のような位置合わせ結果、図6のような対象データの抽出結果、系列データDのラベルの判別結果(系列データDのラベル)などを表示することが考えられる。
【0076】
以上説明した通り、本実施形態によれば、サイズや特徴的なパターンの位置が不揃いな系列データDの前処理(位置合わせ及びサイズ調整)を自動化することができる。また、複数の教師データから高精度な判別モデルを自動的に生成することができる。また、判別対象データのラベルを自動的に精度よく判別することができる。
【0077】
例えば、本実施形態に係る判別システム100を、工場などに設置された機器の異常検知に利用する場合について考える。この場合、まず、判別システム100のユーザは、機器の異常を検知するためのセンサ(加速度センサや温度センサなど)を機器に設置し、機器の正常時のセンサデータと、機器の異常時のセンサデータと、を収集する。次に、ユーザは、正常時に収集したセンサデータに「正常」というラベルを付与し、異常時に収集したセンサデータに「異常」というラベルを付与し、教師データとしてモデル生成装置1に入力する。上述の通り、モデル生成装置1は、センサデータ(教師データ)が入力されると、センサデータのラベルが「正常」であるか「異常」であるかを判別する判別モデルを自動的に生成する。すなわち、ユーザは、センサデータの前処理を行うことなく、簡単に判別モデルを手に入れることができる。なお、センサとモデル生成装置1とを直接又はネットワークを介して接続し、センサデータがセンサからモデル生成装置1に自動的に入力されるようにすることも可能である。この場合、入力されたセンサデータに付与すべきラベルをユーザが予め設定しておいてもよい。また、モデル生成部16が、k−means法などの、教師なし学習が可能な学習アルゴリズムを利用して、判別モデルを生成してもよい。
【0078】
その後、ユーザは、センサデータを判別対象データとして定期的に判別装置2に入力する。上述の通り、判別装置2は、センサデータ(判別対象データ)が入力されると、センサデータのラベルが「正常」であるか「異常」であるかを判別モデルに基づいて自動的に判別する。すなわち、ユーザは、センサデータの前処理を行うことなく、センサデータのラベル(機器の状態)をリアルタイムに簡単に判別することができる。なお、センサと判別装置2とを直接又はネットワークを介して接続し、センサデータがセンサから判別装置2に自動的に入力されるようにすることも可能である。
【0079】
このように、本実施形態によれば、判別モデルの生成や判別対象データのラベルの判別に要する手間を削減できるため、モデル生成装置1及び判別装置2の製造に要する時間やコストを削減できる。結果として、センサデータなどの系列データDの活用を促進できる。
【0080】
なお、上記実施形態に挙げた構成等に、その他の要素との組み合わせなど、ここで示した構成に本発明が限定されるものではない。これらの点に関しては、本発明の趣旨を逸脱しない範囲で変更可能であり、その応用形態に応じて適切に定めることができる。
【符号の説明】
【0081】
1:モデル生成装置
2:判別装置
11:系列データ記憶部
12:基準データ選択部
13:位置合わせ部
14:対象データ抽出部
15:特徴量抽出部
16:モデル生成部
21:系列データ記憶部
22:判別モデル記憶部
23:位置合わせ部
24:対象データ抽出部
25:特徴量抽出部
26:判別部
100:判別システム
図1
図2
図3
図4
図5
図6
図7
図8
図9