特許7577385 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ＳＯＩＮＮ株式会社の特許一覧

特許7577385情報処理装置、情報処理方法及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-10-25

(45)【発行日】2024-11-05

(54)【発明の名称】情報処理装置、情報処理方法及びプログラム

(51)【国際特許分類】

G06N 20/00 20190101AFI20241028BHJP

B25J 9/22 20060101ALI20241028BHJP

G06F 16/906 20190101ALI20241028BHJP

G06F 18/23 20230101ALI20241028BHJP

G06F 123/02 20230101ALN20241028BHJP

【ＦＩ】

G06N20/00

B25J9/22 Z

G06F16/906

G06F18/23

G06F123:02

【請求項の数】 11

(21)【出願番号】P 2023542213

(86)(22)【出願日】2022-03-24

(86)【国際出願番号】 JP2022014070

(87)【国際公開番号】W WO2023021776

(87)【国際公開日】2023-02-23

【審査請求日】2023-11-20

(31)【優先権主張番号】P 2021133415

(32)【優先日】2021-08-18

(33)【優先権主張国・地域又は機関】JP

【国等の委託研究の成果に係る記載事項】（出願人による申告）２０１８年度、国立研究開発法人新エネルギー・産業技術総合開発機構、「高効率・高速処理を可能とするＡＩチップ・次世代コンピューティングの技術開発／革新的ＡＩエッジコンピューティング技術の開発／動的再構成技術を活用した組み込みＡＩシステムの研究開発」、産業技術力強化法第１７条の適用を受ける特許出願

(73)【特許権者】

【識別番号】517107634

【氏名又は名称】ＳＯＩＮＮ株式会社

(74)【代理人】

【識別番号】100103894

【弁理士】

【氏名又は名称】家入健

(72)【発明者】

【氏名】長谷川修

(72)【発明者】

【氏名】井加田洸輔

(72)【発明者】

【氏名】津田直純

【審査官】山本俊介

(56)【参考文献】

【文献】国際公開第２０１６／１１４２４０（ＷＯ，Ａ１）

【文献】特開２０００－２７６４８４（ＪＰ，Ａ）

【文献】特開２００８－２９９６４０（ＪＰ，Ａ）

【文献】国際公開第２０２０／２４１４１９（ＷＯ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ３／００－９９／００

Ｂ２５Ｊ９／２２

Ｇ０６Ｆ１６／９０６

Ｇ０６Ｆ１８／２３

(57)【特許請求の範囲】

【請求項1】

学習対象から予め取得した第１の状態量と前記学習対象の動作を制御するために与えた前記第１の状態量に対応する第１の指令値と、を含む、多次元ベクトルで表されたデータ要素を複数含む時系列データに基づいた学習用データのそれぞれを第２の状態量及び第２の指令値を含む多次元ベクトルとして表されるノードとして時系列クラスタリングすることで、前記学習用データの分布構造を、複数のクラスタに分類した前記ノードの集合として学習したモデルを保持するモデル保持部と、
制御対象から取得した第３の状態量が入力データとして入力され、前記モデルに含まれる前記学習用データのデータ要素数よりも少数の前記ノードとして、前記入力データが属するクラスタと前記入力データが属するクラスタに時間的に直後のクラスタとに属するノードを選択し、選択した２つの前記クラスタに属する前記ノードから前記入力データに対して最短距離のノードを、前記入力データに一致又は近似するノードとして探索する探索部と、
前記探索したノードの前記第２の指令値に基づく値を、前記制御対象を操作するために与える出力指令値として前記制御対象へ出力する出力部と、を備える、
情報処理装置。

【請求項2】

前記探索部は、前記探索したノードが属するクラスタの一部又は全部のノードの指令値から算出される統計量に基づいて、前記出力指令値を決定する、
請求項１に記載の情報処理装置。

【請求項3】

前記探索部は、前記探索したノードの指令値を、前記出力指令値として出力する、
請求項１に記載の情報処理装置。

【請求項4】

前記探索部は、前記探索したノードとの指令値と、前記探索したノードに近似する１つ以上のノードの指令値と、から算出される統計量に基づいて、前記出力指令値を決定する、
請求項１に記載の情報処理装置。

【請求項5】

前記探索したノードに近似する１以上のノードは、前記探索したノードから所定の距離以内のノード、又は、前記探索したノードから近い順に選択された所定の個数のノードである、
請求項４に記載の情報処理装置。

【請求項6】

前記統計量は、平均値、中央値、最大値、最小値及び最頻値のいずれかである、
請求項４又は５に記載の情報処理装置。

【請求項7】

前記第２の状態量は、前記学習対象から予め取得した前記第１の状態量であり、かつ、前記第２の指令値は、前記予め取得した前記第１の状態量に応じて前記学習対象に与えられた前記第１の指令値である、
請求項１乃至６のいずれか一項に記載の情報処理装置。

【請求項8】

前記第１の指令値は、前記学習対象から予め取得した前記第１の状態量に基づいて前記学習対象の操作者が前記学習対象に与えた指令値の実績値である、
請求項７に記載の情報処理装置。

【請求項9】

前記学習用データのデータ要素に含まれる前記第１の指令値は、前記学習対象から予め取得した前記第１の状態量に対して、所定の時間だけ後に前記制御対象に与えられた指令値である、
請求項７に記載の情報処理装置。

【請求項10】

学習対象から予め取得した第１の状態量と前記学習対象の動作を制御するために与えた前記第１の状態量に対応する第１の指令値と、を含む、多次元ベクトルで表されたデータ要素を複数含む時系列データに基づいた学習用データのそれぞれを第２の状態量及び第２の指令値を含む多次元ベクトルとして表されるノードとして時系列クラスタリングすることで、前記学習用データの分布構造を、複数のクラスタに分類した前記ノードの集合として学習したモデルを保持し、
制御対象から取得した第３の状態量が入力データとして入力され、前記モデルに含まれる前記学習用データのデータ要素数よりも少数の前記ノードとして、前記入力データが属するクラスタと前記入力データが属するクラスタに時間的に直後のクラスタとに属するノードを選択し、選択した２つの前記クラスタに属する前記ノードから前記入力データに対して最短距離のノードを、前記入力データに一致又は近似するノードとして探索し、
前記探索したノードの前記第２の指令値に基づく値を、前記制御対象を操作するために与える出力指令値として前記制御対象へ出力する、
情報処理方法。

【請求項11】

学習対象から予め取得した第１の状態量と前記学習対象の動作を制御するために与えた前記第１の状態量に対応する第１の指令値と、を含む、多次元ベクトルで表されたデータ要素を複数含む時系列データに基づいた学習用データのそれぞれを第２の状態量及び第２の指令値を含む多次元ベクトルとして表されるノードとして時系列クラスタリングすることで、前記学習用データの分布構造を、複数のクラスタに分類した前記ノードの集合として学習したモデルを保持する処理と、
制御対象から取得した第３の状態量が入力データとして入力され、前記モデルに含まれる前記学習用データのデータ要素数よりも少数の前記ノードとして、前記入力データが属するクラスタと前記入力データが属するクラスタに時間的に直後のクラスタとに属するノードを選択し、選択した２つの前記クラスタに属する前記ノードから前記入力データに対して最短距離のノードを、前記入力データに一致又は近似するノードとして探索する処理と、
前記探索したノードの前記第２の指令値に基づく値を、前記制御対象を操作するために与える出力指令値として前記制御対象へ出力する処理と、をコンピュータに実行させる、
プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理装置、情報処理方法及びプログラムに関する。

【背景技術】

【0002】

今日、様々なデータ処理手法が用いられており、処理対象となるデータには様々なものがあり、例えば値が系統立って配列されているものが有る。こうした系統立ったデータの代表例として、ある現象を連続的又は間欠的に観測することで得られる一連の値の集合、すなわち現象の時間的に変化を示す値の集合である時系列データが知られている。

【0003】

こうした時系列データの分析手法として、時系列クラスタリングが知られている。時系列クラスタリングとしては、概ねWhole time-series clustering、Subsequence clustering及びTime point clusteringの３つの手法が知られている（非特許文献１及び２）。Whole time-series clusteringでは、複数の時系列データ（時系列集合）ごとに類似性を測定してクラスタリングが行われる。Subsequence clusteringでは、１つの時系列データ（時系列集合）が複数のセグメントに分けられ、セグメントごとにクラスタリングが行われる。Time point clusteringでは、１つの時系列データ（時系列集合）が点ごとに分けられ、各点同士で類似性を測定してクラスタリングが行われる。

【先行技術文献】

【特許文献】

【0004】

【文献】特開２００８－２１７２４６号公報

【文献】特開２０１４－１６４３９６号公報

【非特許文献】

【0005】

【文献】@ZoneTsuyoshi、「Toeplitz Inverse Covariance-based Clustering ～時系列クラスタリング～」、２０１８年１２月６日、Qiita、２０２１年２月９日検索、<URL: https://qiita.com/ZoneTsuyoshi/items/53dad1d0f0d43512a913>

【文献】Hiroshi、「時系列クラスタリングの研究サーベイ論文を読んだ」、２０１９年７月２０日、10001 IDEAS、２０２１年２月９日検索、<URL: https://10001ideas.com/2019/07/20/time-series-survey-paper/>

【発明の概要】

【発明が解決しようとする課題】

【0006】

例えば、あるシステムの状態量を取得して、状態量に応じた指令値を与えることで、システムの挙動を制御する手法が広く用いられている。このような制御方式において、制御処理を自動的に行う場合には、任意の時点で取得したシステムの状態量に基づいて好適な指令値を推定し、推定した指令値をシステムに与えることとなる。この場合、予め観測された、例えば人が行なった操作履歴（指令値）とシステムの状態量とからなる時系列データである学習用データを機械学習によって学習し、その学習結果に基づいて指令値を推定することが行われる。

【0007】

このとき、例えば、入力データの状態量に対応する指令値を推定するにあたって、ｋ近傍法が知られている。ｋ近傍法は学習データをそのまま使用し、入力データに近いｋ個の履歴データから操作値を出力させる。出力値は、例えば入力データに近いｋ個の履歴データの各々における所定時刻経過後の指令値の平均値などにすることができる。ｋ近傍法は、他の教師あり学習に比べると学習を行わないので、膨大なデータを必要とせず、また提供したデータの範囲内の操作となるため、様々な分野で使用されている。しかし、ｋ近傍法は、学習用データのデータ要素の全てと入力データとの間で距離を計算することとなるため、計算量が多くなり、計算に要する時間が長くなってしまうという問題を有する。

【0008】

これは、制御対象となるシステムの状態量を取得してから指令値を与えるまでの時間に余裕が有るシステムでは問題にならないものの、例えば車両など、状態量の取得に応じて迅速に指令値を与えなければならないシステムでは、計算時間の長さが迅速な指令値の付与の妨げとなってしまう。

【0009】

そこで、制御対象のシステムの運転状況に応じて、システムの状態量に応じた指令値をより高速に出力することのできる手法の確立が求められている。

【0010】

本発明は、上記の事情に鑑みて成されたものであり、制御対象のシステムの運転状況及び状態量に応じた指令値を迅速にシステムに与えることを目的とする。

【課題を解決するための手段】

【0011】

本発明の一態様である情報処理装置は、学習対象から予め取得した第１の状態量と前記学習対象の動作を制御するために与えた前記第１の状態量に対応する第１の指令値と、を含む、多次元ベクトルで表されたデータ要素を複数含む時系列データに基づいた学習用データを学習することで、前記学習用データの分布構造を学習結果に基づいた第２の状態量及び第２の指令値を含む多次元ベクトルとして表されるノードの集合として作成されたモデルを保持するモデル保持部と、制御対象から取得した第３の状態量が入力データとして入力され、前記モデルに含まれる前記学習用データのデータ要素数よりも少数の前記ノードから前記入力データに一致又は近似するノードを探索する探索部と、前記探索したノードの前記第２の指令値に基づく値を、前記制御対象を操作するために与える出力指令値として前記制御対象へ出力する出力部と、を有するものである。これにより、制御対象の運転状況及び状態量に応じた指令値を迅速に制御対象に与えることができる。

【0012】

本発明の一態様である情報処理装置は、上記の情報処理装置であって、前記モデルは、前記学習用データのそれぞれをノードとして学習することで作成され、前記探索部は、前記ノードから、前記少数の前記ノードとして、前記入力データに対して時間的に比較的近いノードを選択し、前記選択したノードから前記入力データに対して最短距離のノードを探索することが望ましい。これにより、制御対象の運転状況及び状態量に応じた指令値を迅速に制御対象に与えるにあたり、指令値の推定に用いるモデルを作成し、かつ、最短距離のノードの特定を行うことができる。

【0013】

本発明の一態様である情報処理装置は、上記の情報処理装置であって、前記モデルは、前記学習用データを時系列クラスタリングして、前記ノードを複数のクラスタに分類することで作成され、前記探索部は、前記入力データが属するクラスタと、前記入力データが属するクラスタに時間的に直後のクラスタと、を探索し、探索した２つのクラスタに属するノードから前記入力データに対して最短距離のノードを探索することが望ましい。これにより、制御対象の運転状況及び状態量に応じた指令値を迅速に制御対象に与えるにあたり、指令値の推定に用いるモデルを作成し、かつ、最短距離のノードの特定を具体的に行うことができる。

【0014】

本発明の一態様である情報処理装置は、上記の情報処理装置であって、前記探索部は、前記探索したノードが属するクラスタの一部又は全部のノードの指令値から算出される統計量に基づいて、前記出力指令値を決定することが望ましい。これにより、必要に応じて適切な出力指令値を決定することができる。

【0015】

本発明の一態様である情報処理装置は、上記の情報処理装置であって、前記学習用データのデータ要素よりも少数のノードによって前記学習用データのデータ要素の分布構造を近似的に学習することで前記モデルを作成し、作成した前記モデルを前記モデル保持部へ出力するモデル作成部をさらに有し、前記探索部は、前記モデルに含まれる前記ノードから前記入力データに近似するノードを探索することが望ましい。これにより、制御対象の運転状況及び状態量に応じた指令値を迅速に制御対象に与えるにあたり、指令値の推定に用いるモデルを作成し、かつ、最短距離のノードの特定を行うことができる。

【0016】

本発明の一態様である情報処理装置は、上記の情報処理装置であって、前記探索部は、前記探索したノードの指令値を、前記出力指令値として出力することが望ましい。これにより、制御対象の運転状況及び状態量に応じた指令値を迅速に制御対象に与えるにあたり、指令値の推定に用いるモデルを作成し、かつ、最短距離のノードの特定を行うことができる。

【0017】

本発明の一態様である情報処理装置は、上記の情報処理装置であって、前記探索部は、前記探索したノードとの指令値と、前記探索したノードに近似する１つ以上のノードの指令値と、から算出される統計量に基づいて、前記出力指令値を決定することが望ましい。これにより、出力指令値を適切に決定することができる。

【0018】

本発明の一態様である情報処理装置は、上記の情報処理装置であって、前記探索したノードに近似する１以上のノードは、前記探索したノードから所定の距離以内のノード、又は、前記探索したノードから近い順に選択された所定の個数のノードであることが望ましい。これにより、必要に応じた出力指令値を決定することができる。

【0019】

本発明の一態様である情報処理装置は、上記の情報処理装置であって、前記統計量は、平均値、中央値、最大値、最小値及び最頻値のいずれかであることが望ましい。これにより、必要に応じた出力指令値を決定することができる。

【0020】

本発明の一態様である情報処理装置は、上記の情報処理装置であって、前記第２の状態量は、前記学習対象から予め取得した前記第１の状態量であり、かつ、前記第２の指令値は、前記予め取得した前記第１の状態量に応じて前記学習対象に与えられた前記第１の指令値であることが望ましい。これにより、適切なデータに基づいてモデルを作成することができる。

【0021】

本発明の一態様である情報処理装置は、上記の情報処理装置であって、前記第１の指令値は、前記学習対象から予め取得した前記第１の状態量に基づいて前記学習対象の操作者が前記学習対象に与えた指令値の実績値であることが望ましい。これにより、適切なデータに基づいてモデルを作成することができる。

【0022】

本発明の一態様である情報処理装置は、上記の情報処理装置であって、前記学習用データのデータ要素に含まれる前記第１の指令値は、前記学習対象から予め取得した前記第１の状態量に対して、所定の時間だけ後に前記制御対象に与えられた指令値であることが望ましい。これにより、状態量の取得と指令値の出力との間のタイムラグを加味したモデルを作成することができる。

【0023】

本発明の一態様である情報処理方法は、学習対象から予め取得した第１の状態量と前記学習対象の動作を制御するために与えた前記第１の状態量に対応する第１の指令値と、を含む、多次元ベクトルで表されたデータ要素を複数含む時系列データに基づいた学習用データを学習することで、前記学習用データの分布構造を学習結果に基づいた第２の状態量及び第２の指令値を含む多次元ベクトルとして表されるノードの集合として作成されたモデルを保持し、制御対象から取得した第３の状態量が入力データとして入力され、前記モデルに含まれる前記学習用データのデータ要素数よりも少数の前記ノードから前記入力データに一致又は近似するノードを探索し、前記探索したノードの前記第２の指令値に基づく値を、前記制御対象を操作するために与える出力指令値として前記制御対象へ出力するものである。これにより、制御対象の運転状況及び状態量に応じた指令値を迅速に制御対象に与えることができる。

【0024】

本発明の一態様であるプログラムは、学習対象から予め取得した第１の状態量と前記学習対象の動作を制御するために与えた前記第１の状態量に対応する第１の指令値と、を含む、多次元ベクトルで表されたデータ要素を複数含む時系列データに基づいた学習用データを学習することで、前記学習用データの分布構造を学習結果に基づいた第２の状態量及び第２の指令値を含む多次元ベクトルとして表されるノードの集合として作成されたモデルを保持する処理と、制御対象から取得した第３の状態量が入力データとして入力され、前記モデルに含まれる前記学習用データのデータ要素数よりも少数の前記ノードから前記入力データに一致又は近似するノードを探索する処理と、前記探索したノードの前記第２の指令値に基づく値を、前記制御対象を操作するために与える出力指令値として前記制御対象へ出力する処理と、をコンピュータに実行させるものである。これにより、制御対象の運転状況及び状態量に応じた指令値を迅速に制御対象に与えることができる。

【発明の効果】

【0025】

本発明によれば、制御対象のシステムの運転状況及び状態量に応じた指令値を迅速にシステムに与えることができる。

【図面の簡単な説明】

【0026】

【図1】実施の形態１にかかる情報処理装置を実現するためのシステム構成の一例を示す図である。

【図2】実施の形態１にかかる情報処理装置の外観構成を示す図である。

【図3】実施の形態１にかかる情報処理装置の構成を模式的に示す図である。

【図4】実施の形態１にかかる情報処理装置が用いられる状況を模式的に示す図である。

【図5】実験に用いるロボットの概要を示す図である。

【図6】ロボットアームが学習する動作の例を示す図である。

【図7】ロボットアームが障害物を回避するときの各状態において作用する力を模式的に示す図である。

【図8】時系列データの形式を示す図である。

【図9】ロボットアームの動作を学習させた例を示す図である。

【図10】モデル作成部が作成するノードを示す図である。

【図11】実施の形態１にかかる情報処理装置における処理のフローチャートである。

【図12】実施の形態１にかかる情報処理装置における処理の変形例のフローチャートである。

【図13】実施の形態１にかかる情報処理装置での処理とｋ近傍法での処理とにおける距離計算の対象となるノードを示す図である。

【図14】実施の形態２にかかる情報処理装置の構成を模式的に示す図である。

【図15】実施の形態２にかかる情報処理装置が用いられる状況を模式的に示す図である。

【図16】実施の形態２にかかる情報処理装置における動作を示すフローチャートである。

【図17】実施の形態２にかかるモデル作成部の構成を模式的に示す図である。

【図18】ＳＯＩＮＮ法による学習処理のフローチャートである。

【図19】実施の形態２にかかる情報処理装置において実施の形態１で使用した学習用データをＳＯＩＮＮ法で学習することで得られたノードの分布の例を示す図である。

【発明を実施するための形態】

【0027】

以下、図面を参照して本発明の実施の形態について説明する。各図面においては、同一要素には同一の符号が付されており、必要に応じて重複説明は省略される。

【0028】

実施の形態１
図１は、実施の形態１にかかる情報処理装置を実現するためのシステム構成の一例を示す図である。情報処理装置１００は、専用コンピュータ、パーソナルコンピュータ（ＰＣ）などのコンピュータ１０００により実現可能である。但し、コンピュータは、物理的に単一である必要はなく、分散処理を実行する場合には、複数であってもよい。図１に示すように、コンピュータ１０００は、ＣＰＵ（Central Processing Unit）１００１、ＲＯＭ（Read Only Memory）１００２及びＲＡＭ（Random Access Memory）１００３を有し、これらがバス１００４を介して相互に接続されている。尚、コンピュータを動作させるためのＯＳソフトなどは、説明を省略するが、この情報処理装置を構築するコンピュータも当然有しているものとする。

【0029】

バス１００４には、入出力インターフェイス１００５も接続されている。入出力インターフェイス１００５には、例えば、キーボード、マウス、センサなどよりなる入力部１００６、ＣＲＴ、ＬＣＤなどよりなるディスプレイ、並びにヘッドフォンやスピーカなどよりなる出力部１００７、ハードディスクなどより構成される記憶部１００８、モデム、ターミナルアダプタなどより構成される通信部１００９などが接続されている。

【0030】

ＣＰＵ１００１は、ＲＯＭ１００２に記憶されている各種プログラム、又は記憶部１００８からＲＡＭ１００３にロードされた各種プログラムに従って各種の処理、本実施の形態においては、例えば後述する情報処理装置１００の各部の処理を実行する。ＣＰＵ１００１とは別にＧＰＵ（Graphics Processing Unit）を設け、ＣＰＵ１００１と同様の処理を行わせてもよい。なお、ＧＰＵは、定型的な処理を並列的に行う用途に適しており、後述する学習処理などに適用することで、ＣＰＵ１００１に比べて処理速度を向上させることも可能である。ＲＡＭ１００３には又、ＣＰＵ１００１及びＧＰＵが各種の処理を実行する上において必要なデータなども適宜記憶される。

【0031】

通信部１００９は、例えば図示しないインターネットを介しての通信処理を行ったり、ＣＰＵ１００１から提供されたデータを送信したり、通信相手から受信したデータをＣＰＵ１００１、ＲＡＭ１００３、記憶部１００８に出力したりする。記憶部１００８はＣＰＵ１００１との間でやり取りし、情報の保存・消去を行う。通信部１００９は又、他の装置との間で、アナログ信号又はディジタル信号の通信処理を行う。

【0032】

入出力インターフェイス１００５はまた、必要に応じてドライブ１０１０が接続され、例えば、磁気ディスク１０１１、光ディスク１０１２、フレキシブルディスク１０１３、又は半導体メモリ１０１４などが適宜装着され、それらから読み出されたコンピュータプログラムが必要に応じて記憶部１００８にインストールされる。

【0033】

情報処理装置１００の外観構成について説明する。図２に、実施の形態１にかかる情報処理装置１００の外観構成を示す。情報処理装置１００は、処理部１１０、表示部１２０及び入力部１３０を有する。処理部１１０は、上述のＣＰＵ１００１、ＲＯＭ１００２、ＲＡＭ１００３、バス１００４、入出力インターフェイス１００５、記憶部１００８、通信部１００９、ドライブ１０１０などを有するハードウェアとして構成される。表示部１２０は、上述の出力部１００７に対応し、オペレータが視認可能な形式で画像を表示する、ＬＣＤなどの表示装置として構成される。入力部１３０は上述の入力部１００６に対応し、マウスやキーボードなどの各種の入力手段により構成される。

【0034】

次いで、情報処理装置１００の学習対象の入力データである時系列データＴＳＤについて説明する。時系列データＴＳＤは、データ要素を表す多次元ベクトルの集合として与えられる。ｉをデータ要素の順番を表すパラメータとすると、データ要素を表す多次元ベクトルａ_ｉは、時刻ｔ_ｉ及びｍ個の成分ｐを含むベクトルとして、以下の式のように定義される。ここで、ｉは２の整数であり、ｍは１以上の整数である。

【数1】

よって、データ要素の個数をｎとすると、時系列データＴＳＤは、以下の式で表される。

【数2】

【0035】

時系列データＴＳＤは、例えば情報処理装置１００に設けられた記憶部（例えばＲＡＭ１００３や記憶部１００８）に格納される。

【0036】

以下で説明する情報処理装置１００においては機械学習が適用されるが、その前提として、機械学習の概要について説明する。以下で説明する一般的な機械学習は、あくまで以下の実施の形態で説明する制御システムの理解の前提に過ぎず、制御システムに適用される機械学習がこれに限定されるものではない。

【0037】

機械学習は、教師あり学習と教師なし学習とに大別される。以下、それぞれの手法の概要について説明する。

【0038】

一般に、教師あり学習では、与えられた変数（説明変数）からある変数（目的変数）を予測するための学習が行われる。より具体的には、教師あり学習は、入力データ（説明変数）に対して正解データ（目的変数）を与えて、入力データと正解データとの関係性を学習する手法である。

【0039】

例えば、正解データが連続値である場合には回帰分析による学習が行われる。なお、連続データの学習の手法は、回帰分析（例えば、線形回帰）に限られるものではない。回帰分析においては、入力データを各種の関数によってフィッティングすることで、入力データに対応する出力を予測することが可能となる。

【0040】

また、入力データに対する正解データがラベル情報である場合には、分類による学習が行われる。分類による学習においては、例えば、回帰（ロジスティクス回帰、サポートベクターマシン）、木（決定木、ランダムフォレスト）、ニューラルネットワーク、クラスタリング（ｋ近傍法など）等の手法が用いられる。

【0041】

教師なし学習では、正解データが与えられない状態で、入力データの特徴を学習するものである。教師なし学習の手法としては、ｋ－ｍｅａｎｓ法やＳＯＩＮＮ法に代表されるクラスタリング、ＰＣＡ法などの次元削減、ホテリングのＴ^２法などの異常検知などがある。例えば、クラスタリングでは、入力データから近似し特徴を有するものを抽出してグループ化することが可能である。

【0042】

ここで、ＳＯＩＮＮ法について説明する。ＳＯＩＮＮ法とは、学習中に必要に応じてニューロンを増殖させる学習手法であり、自己組織化ニューラルネットワーク（ＳＯＩＮＮ：Self-Organizing Incremental Neural Network）と呼ばれる手法である。ＳＯＩＮＮでは、ノード数を自律的に管理することにより非定常的な入力を学習することができ、複雑な分布形状を有するクラスに対しても適切なクラス数及び位相構造を抽出できるなど多くの利点を有する。ＳＯＩＮＮの応用例として、例えばパターン認識においては、ひらがな文字のクラスを学習させた後に、カタカナ文字のクラスなどを追加的に学習させることができる。

【0043】

このようなＳＯＩＮＮの一例として、Ｅ－ＳＯＩＮＮ（Enhanced SOINN、特許文献１）と称される手法が提案されている。Ｅ－ＳＯＩＮＮでは、学習を随時追加するオンライン追加学習が可能であり、バッチ学習ではなく学習効率が良いという利点を有している。このため、Ｅ－ＳＯＩＮＮでは、学習環境が新しい環境に変化した場合においても追加学習が可能である。また、Ｅ－ＳＯＩＮＮでは、入力データに対するノイズ耐性が高いという利点をも有している。他にも、ＬＢ－ＳＯＩＮＮ（Load Balance Self-Organizing Incremental Neural Network、特許文献２）などの各種のＳＯＩＮＮ法も提案されている。

【0044】

ＳＯＩＮＮ法では、複数のノードを有するニューラルネットワークが適用される。具体的には、情報処理装置１００は、ｎ（ｎは、１以上の整数）次元ベクトルで記述されるノードが配置される非階層構造のニューラルネットワークが入力される。ニューラルネットワークは、例えばＲＡＭ１００３などの記憶部に格納されている。

【0045】

ＳＯＩＮＮ法におけるニューラルネットワークは、入力ベクトルをニューラルネットワークに入力し、入力される入力ベクトルに基づいて、ニューラルネットワークに配置されるノード及び辺を自動的に増加させる自己増殖型ニューラルネットワークであり、自己増殖型ニューラルネットワークを用いることで、ノードを自動的に増加させることができる。

【0046】

ＳＯＩＮＮ法におけるニューラルネットワークは、非階層構造を有するものである。非階層構造を採用することで、他の層での学習を開始するタイミングを指定せずに追加学習を実施することができる。すなわち、オンラインでの追加学習を実施することができる。

【0047】

ＳＯＩＮＮ法におけるクラスタリングは、ノード及び辺を参照し、クラス分類を行うものである。ネットワークを構成するノードのクラス分類は、各種のクラス分類手法を適用可能であり、例えば特許文献２のＬＢ－ＳＯＩＮＮと同様の処理を行ってもよい。

【0048】

以下、実施の形態１にかかる情報処理装置１００の構成及び動作について説明する。図３に、実施の形態１にかかる情報処理装置１００の構成を模式的に示す。情報処理装置１００は、モデル保持部１、探索部２及び出力部３を有する。

【0049】

モデル保持部１は、時系列データである学習用データＤＡＴから作成されたモデルＭＤを読み込んで保持する。モデル保持部１は、例えば、図１のＲＡＭ１００３及び記憶部１００８など各種の記憶手段が適用可能である。

【0050】

探索部２は、適宜、モデル保持部１からモデルＭＤを読み込み可能に構成される。探索部２は、別途入力された推定の対象となるデータ（以下、入力データと称する）の状態量を参照し、読み込んだモデルＭＤに含まれるノードの中から近似するノードを探索する。そして、探索結果を、出力部３へ出力する。

【0051】

出力部３は、探索結果に基づいて決定した、入力データの状態量に対応する出力指令値を出力する。

【0052】

次いで、情報処理装置１００が用いられる状況について説明する。図４に、実施の形態１にかかる情報処理装置１００が用いられる状況を模式的に示す。情報処理装置１００は、操作者１０が操作対象装置２０（例えば、後述するロボット）に対して行った操作を学習フェーズにおいて学習し、推定フェーズにおいて学習結果に基づいて推定した指令値を操作対象装置２０に出力することで、操作対象装置２０に適切な動作を行わせるものである。なお、以下では、操作対象装置２０などの情報処理装置１００からの制御を受ける対象物を、単に制御対象とも称する。

【0053】

なお、以下では、学習フェーズで取り扱うデータと推定フェーズで取り扱うデータとを区別するため、学習フェーズで取り扱うデータは大文字で表し、推定フェーズで取り扱うデータを小文字で表す。学習フェーズで取り扱う状態量をＰ、指令値をＱと表記する。学習フェーズで取り扱う状態量、すなわち入力データをｐ、指令値、すなわち出力値をｑと表記する。

【0054】

学習フェーズにおいて、操作者１０は、適切な動作を指令するための指令値を操作対象装置２０に与えるため、指令装置１１を操作して指示ＩＮＳを入力する。指令装置１１は、入力された指示ＩＮＳに応じた指令値Ｑを、操作対象装置２０と、モデル作成部１２とへ出力する。操作対象装置２０は指令値Ｑに応じた動作を行うとともに、操作対象装置２０はモデル作成部１２へ状態量Ｐを出力する。

【0055】

これにより、モデル作成部１２は、ある時刻における、操作対象装置２０へ与えられた指令値Ｑと操作対象装置２０の状態量Ｐとを取得する。指令値Ｑ及び状態量Ｐの取得は逐次行われるため、モデル作成部１２は、指令値Ｑ及び状態量Ｐのセットと各セットを取得したタイミングを含むデータ要素を複数含む時系列データＴＳＤを得ることができる。なお、以下では、モデル作成のために予め取得される、操作対象装置２０へ与えられた指令値Ｑ及び操作対象装置２０の状態量Ｐを、それぞれ第１の指令値及び第１の状態量とも称する。

【0056】

モデル作成部１２は、時系列データを適宜加工して学習用データを作成し、学習用データを学習してモデルＭＤを生成し、モデル保持部１へ出力する。これにより、モデルＭＤはモデル保持部１によって保持される。すなわち、学習用データは、予め取得された第１の指令値及び第１の状態量からなるデータ要素が複数含まれることとなる。モデル作成部１２で作成されるモデルＭＤは、時系列データの分布構造を、少なくとも状態量及び指令値を要素として含む多次元ベクトルで記述されるノードの集合として学習したモデルである。なお、以下では、モデルＭＤのノードを記述する多次元ベクトルに含まれる状態量及び指令値を、それぞれ第２の状態量及び第２の指令値とも称する。

【0057】

推定フェーズにおいては、探索部２は、モデル保持部１からモデルＭＤを適宜読み込む。探索部２は、モデルＭＤに基づくモデルに入力データ、すなわち、操作対象装置２０から取得した状態量ｐに基づいて、モデルＭＤに含まれるノードから１つのノードＮ_ＮＥＡＲを決定する。なお、以下では、推定フェーズにおいて操作対象装置２０から取得される状態量を、第３の状態量とも称する。出力部３は、ノードＮ_ＮＥＡＲに対応する指令値を読み込み、読み込んだ指令値を指令値Ｑとして、操作対象装置２０へ出力する。本実施の形態では、モデルＭＤに含まれるノードから１つのノードＮ_ＮＥＡＲを決定したが、モデルＭＤに含まれるノードから複数のノードを決定してもよい。決定された複数のノードに対応する指令値から、例えば統計的な手法を用いて、出力する指令値を算出してもよい。

【0058】

次に、情報処理装置１００が行う処理の前提として、モデル作成部１２が取得した状態量Ｐ及び指令値Ｑで構成される時系列データＴＳＤと、時系列データＴＳＤに基づいて作成された学習用データＤＡＴをモデル作成部１２が学習することで生成されるモデルＭＤについて説明する。

【0059】

モデル作成部１２は、学習用データＤＡＴを読み込んでクラスタリングを行い、学習用データＤＡＴにクラスタリング情報を追加したものをノードとして学習する。なお、以下で説明するように、学習用データＤＡＴは状態量Ｐ、指令値Ｑ及びタイミングを示す情報を含む時系列データを適宜加工した多次元ベクトルの集合体の形式になっており、各ノードは同じ多次元ベクトルで構成される。

【0060】

具体例として、ロボットを使用した実験について学習する例について説明する。図５に、実験に用いるロボットの概要を示す。ロボット３０は、ロボットアーム３１を有しており、ロボットアーム３１の先端からは円柱ポール３３が延在しており、ロボットアーム３１と円柱ポール３３との接続部には、円柱ポール３３に作用する力を検出する力センサ３２が設けられている。これにより、円柱ポール３３に外力が掛かると、力センサ３２によってその外力を検出することができる。ロボットアーム３１は、水平方向に延在するビーム３４が図示しない多関節駆動機構などによって駆動されることで、水平面内（ｘ方向及びｙ方向）及び高さ方向（ｚ方向）の３次元方向に移動することができる。

【0061】

この例では、操作者が指令装置１１を使用してロボットアーム３１を移動させることで、ロボットアーム３１の動作を学習した。但し、ロボットアーム３１の動作の学習はこの例に限られず、操作者がロボットアーム３１を手で保持しながらその操作を学習してもよいし、遠隔操作システムなどを導入して、遠隔操作にてロボットアーム３１を操作して、その操作を学習してもよい。

【0062】

図６に、ロボットアーム３１が学習する動作の例を示す。この例では、ロボットアーム３１が障害物４０に接触しながら、水平面（ｘ－ｙ平面）内で障害物４０を回避しながら移動するものとする。

【0063】

図７に、ロボットアーム３１が障害物４０を回避するときの各状態において作用する力を模式的に示す。以下、各状態における動作と作用する力について説明する。

【0064】

［状態１］
ロボットアーム３１は、初期位置から＋ｙ方向に直進して障害物４０に接触する。この場合、状態１の最後で障害物４０に接触するまでは、ロボットアーム３１に作用する外力はほぼ０となる。

【0065】

［状態２］
ロボットアーム３１は、障害物４０に接触すると、ロボットアーム３１が障害物４０に押しつけられた状態のまま、移動方向を－ｘ方向に変えて、移動を継続する。この場合、ロボットアーム３１には、障害物４０に押しつけられたことによる－ｙ方向の反力ｆｙ２と、＋ｘ方向の摩擦力ｆｘ２が作用する。

【0066】

［状態３］
ロボットアーム３１は、障害物４０の角（－ｘ側かつ－ｙ側の角）に到達すると、移動方向を＋ｙ方向に変え、かつ、障害物４０に対して＋ｘ方向に押しつけられた状態で、移動を継続する。この場合、ロボットアーム３１には、障害物４０に押しつけられたことによる－ｘ方向の反力ｆｘ３と、－ｙ方向の摩擦力ｆｙ３が作用する。

【0067】

［状態４］
ロボットアーム３１は、障害物４０の角（－ｘ側かつ＋ｙ側の角）に到達すると、移動方向を＋ｘ方向に変え、かつ、障害物４０に対して－ｙ方向に押しつけられた状態で、移動を継続する。この場合、ロボットアーム３１には、障害物４０に押しつけられたことによる＋ｙ方向の反力ｆｙ４と、－ｘ方向の摩擦力ｆｘ４が作用する。

【0068】

次いで、本実験における時系列データの形式について説明する。図８に、時系列データＴＳＤの形式を示す。縦方向には時系列データＴＳＤの各データ要素が配列されており、各行がサンプリングされた１つのデータ要素に対応する。各データ要素は、４つの領域ＤＺ１～ＤＺ４を含んでいる。

【0069】

第１の領域ＤＺ１は、データ要素のサンプリングの番号ｉを示している。なお、ここではサンプリングの個数をｎ（ｎは１以上の整数）とし、よって、ｉは１以上ｎ以下の整数である。第２の領域ＤＺ２は、各データ要素をサンプリングした時刻（タイミング）ｔ（ｉ）を示している。

【0070】

第３の領域ＤＺ３は、ロボットアーム３１に作用する外力（ｆ_ｘ（ｉ）、ｆ_ｙ（ｉ））、速度（ｖ_ｘ（ｉ）、ｖ_ｙ（ｉ））、及び、位置（ｘ（ｉ）、ｙ（ｉ））などであり、この領域ＤＺ３に含まれる値は、制御対象の情報に関する値を示している。

【0071】

第４の領域ＤＺ４は、ロボットアーム３１に与える指令値として、操作によってロボットアーム３１に加えた力（Ｆ_ｘ（ｉ）、Ｆ_ｙ（ｉ））であり、この領域ＤＺ４に含まれる量が指令値に対応する。なお、ここでは、力を指令値としているが、これは例示に過ぎず、速度及び位置などの他の値を指令値としてもよい。

【0072】

ここでは、力、速度及び位置がいずれのデータ要素に属するかを示すためにサンプリング番号ｉを用いているが、これは例示に過ぎず、サンプリング番号ｉに変えて時刻ｔ（ｉ）を用いてもよい。

【0073】

この例では、以下の式に示すように、上記の第３の領域ＤＺ３に含まれる力及び速度を、学習用データＤＡＴに含まれる状態量Ｐ（ｉ）として用いる。

【数3】

なお、状態量Ｐはこれに限られるものではなく、必要に応じて、ｉよりも前の領域ＤＺ３に含まれる値を含めてもよいし、領域ＤＺ１、ＤＺ２及びＤ４の一部又は全部の値を含めてもよい。

【0074】

また、以下の式に示すように、上記の第４の領域ＤＺ４に含まれる指令値に対して所定の時間ｈだけ将来の指令値を指令値Ｑとして用いる。

【数4】

以上より、学習用データＤＡＴのデータ要素は以下の式で表される。

【数5】

ここで、指令値Ｑの時刻としてｈだけ将来のｉ＋ｈでの値を用いている点について説明する。本実施の形態では、操作対象装置から状態量を取得し、探索部が取得した状態量に基づいて推定した指令値を操作対象装置に与え得ることで、操作対象装置を適切に操作するものである。そこで、状態量を取得してから指令値を与えるまでの間で、ある程度のタイムラグが存在することが考え得る。この場合、ある時刻に取得した状態量に対しては、このタイムラグ分だけ将来の指令値を対応させることが望ましい。そのため、本実施の形態では、このタイムラグを反映するため、ｈだけ将来の指令値を状態量に対応させている。ただし、タイムラグが無視しうるほど小さいことも有るため、ｈは０以上の任意の値、すなわち、０以上の整数としてもよい。

【0075】

学習用データＤＡＴは、以下の式で表される。

【数6】

【0076】

なお、本実施の形態では、式［４］及び［５］において、時間的に最後にサンプリングした指令値Ｑ（ｎ）よりも将来の指令値Ｑ（ｎ＋１）～Ｑ（ｎ＋ｈ）については、指令値Ｑ（ｎ）を用いるものとした。但し、将来の指令値Ｑ（ｎ＋１）～Ｑ（ｎ＋ｈ）はこれに限られるものではなく、動作が好適なものとなるように、適宜他の値を用いてもよい。また、将来の指令値Ｑ（ｎ＋１）～Ｑ（ｎ＋ｈ）のように時系列データＴＳＤには本来存在しない指令値を有するデータ要素Ｄｉについては、学習用データＤＡＴに含めないようにしてもよい。

【0077】

本実施の形態では、学習用データＤＡＴのデータ要素数をサンプリング数ｎと同数としたが、それに限らない。例えば、｛Ｄ１，Ｄ３，Ｄ５．．｝のように要素の一部のみを学習データＤＡＴとしてもよいし、例えばＤｉとＤｉ＋１の間を補完するように新たなデータを作成して学習用データＤＡＴに加えてもよい。

【0078】

次いで、この例におけるモデル作成について説明する。モデル作成部１２は、学習用データＤＡＴに対して教師なし学習であるクラスタリングを行い、クラスタリング結果をモデルとして生成する。ここでは、クラスタリング手法としては、ｋ－ｍｅａｎｓ法を用いる。なお、クラスタリング手法はこれに限られるものではなく、ＤＢＳＣＡＮ（Density-based spatial clustering of applications with noise）などの他の各種のクラスタリング手法を用いてもよい。また、この例では距離指標としてユークリッド距離を用いるが、他の距離指標を適宜用いてもよい。

【0079】

図９に、ロボットアーム３１の動作を学習させた例を示す。図９では、可視化しやすいように、学習データの状態量の中からｆｘ，ｆｙの２次元平面を抜き出してマッピングしている。破線で分けられている領域が各々のクラスタリング領域であり、この例では４つの領域に分けられている。図６及び７に示すように、領域ＣＬ１が障害物への衝突前の状態（状態１）、領域ＣＬ２が衝突後に左方向へ移動している状態（状態２）、ＣＬ３が障害物の左側を上方向へ移動している状態（状態３）、状態ＣＬ４が障害物を右方向へ移動している状態（状態４）に対応している。

【0080】

モデル作成部１２は、学習用データＤＡＴに対してクラスタリング結果を付与したものをノードとして作成する。図１０に、モデル作成部が作成するノードを示す。図１０に示すように、学習用データＤＡＴの各データ要素にクラスタリング結果を示すＣＬ１～ＣＬ４のいずれかを付加したものがノードとして作成される。すなわち、ｉ番目のノードは、以下の式で表される。

【数7】

なお、ｃｌ_iはクラスタ番号であり、ＣＬ１～ＣＬ４のいずれかの値をとる。

【0081】

モデル作成部１２は、上式で表される学習用データＤＡＴの要素数（本実施の形態ではｎ個)のノードの集合であるモデルＭＤを出力する。モデルＭＤは、以下の式で表される。

【数8】

【0082】

学習用データは時系列データであるので、当然ながら、学習により得られるノードも時系列に順序を有している。具体的には、ノードは時間に関する量、ここではサンプリング順序と紐付けることができるので、ノードを時系列に並べることが可能である。なお、ノードに時系列の順序を持たせる方法はこれに限られるものではなく、ノードを表現する多次元ベクトルに時間に関する量（すなわち、時刻）を要素として含めることで表現してもよい。

【0083】

この例では、４つのクラスタＣＬ１～ＣＬ４は、時系列的にＣＬ１、ＣＬ２、ＣＬ３、ＣＬ４の順であることが得られる。

【0084】

次に、情報処理装置１００が行う処理について説明する。図１１に、実施の形態１にかかる情報処理装置１００における処理のフローチャートを示す。情報処理装置１００の動作は、以下のステップＳＡ１～ＳＡ５で構成される。

【0085】

ステップＳＡ１
探索部２は、モデル保持部１からモデルＭＤを読み込む。

【0086】

ステップＳＡ２
探索部２は、入力データである状態量ｐを取得する。

【0087】

ステップＳＡ３
探索部２は、入力データである状態量ｐがモデルＭＤのクラスタのいずれに属するかを取得する。以下では、入力データである状態量ｐが属するクラスタを対象クラスタＣ_ＴＲＧと称する。ここでは、入力データである状態量ｐと各クラスタの重心との距離を計算し、最短距離にある重心を有するクラスタを対象クラスタＣ_ＴＲＧとする。なお、対象クラスタＣ_ＴＲＧの決定方法はこれに限られず、他の決定方法を適宜用いてもよい。

【0088】

ステップＳＡ４
探索部２は、対象クラスタＣ_ＴＲＧと、対象クラスタＣ_ＴＲＧに対して時間的に直後のクラスタＣ_ＮＥＸＴに含まれるノードから、入力データである状態量ｐに最も近い状態量を有するノードＮ_ＮＥＡＲを１つ探索し、探索結果を出力部３へ出力する。ここでは、ノードを探索するための距離指標として、ユークリッド距離を用いる。なお、以下では、入力データである状態量ｐに最も近い状態量を有するノードＮ_ＮＥＡＲを、単に、最も近いノードＮ_ＮＥＡＲと称する。

【0089】

ここでは、最も近いノードを１つだけ探索したが、入力データである状態量ｐから近い複数のノードを探索してもよい。この場合、状態量ｐから近い順に所定個数のノードを探索してもよいし、状態量ｐから所定の距離以内の複数のノードを探索してもよい。

【0090】

探索の対象となるクラスタは、対象クラスタＣ_ＴＲＧ及び直後のクラスタＣ_ＮＥＸＴであるものとしたが、例えば、時間的に更に次のクラスタを対象にしてもよいし、直後のクラスタＣ_ＮＥＸＴのうちで時間的に早い半数のノードのみを対象としてもよい。

【0091】

また、ノードを探索するための距離指標としてユークリッド距離を用いたが、他の距離指標を適宜用いてもよい。

【0092】

ステップＳＡ５
出力部３は、最も近いノードＮ_ＮＥＡＲに基づいて決定した出力指令値ｑ_ＯＵＴを出力する。例えば、出力部３は、最も近いノードＮ_ＮＥＡＲが保持する指令値ｑ_ＮＥＡＲを、出力指令値ｑ_ＯＵＴとして出力してもよい（第１の出力指令値決定方法）。

【0093】

なお、出力部３が出力指令値ｑ_ＯＵＴを決定する方法はこれに限られるものではなく、例えば以下のように決定してもよい。例えば、出力部３は、最も近いノードＮ_ＮＥＡＲが属するクラスタの全ノードの指令値の平均値を、出力指令値ｑ_ＯＵＴとして出力してもよい（第２の出力指令値決定方法）。

【0094】

また、出力部３は、最も近いノードＮ_ＮＥＡＲが属するクラスタのノードの一部のノードの指令値の平均値を、出力指令値ｑ_ＯＵＴとして出力してもよい（第３の出力指令値決定方法）。このとき、最も近いノードＮ_ＮＥＡＲから所定の距離以内のノード、最も近いノードＮ_ＮＥＡＲから距離が近い順位に選択した所定個数のノードなど、種々の選択方法によって選択したノードの指令値の平均値を出力指令値ｑ_ＯＵＴとして出力してもよい。

【0095】

さらに、ステップＳＡ４において複数のノードを探索した場合には、複数のノードの指令値の平均値を出力指令値ｑ_ＯＵＴとして出力してもよい（第４の出力指令値決定方法）。

【0096】

なお、第２～第４の出力指令値決定方法においては平均値を用いたが、これは例示に過ぎず、中央値、最大値及び最小値など統計的な手法により算出可能な各種の値、換言すれば統計量に基づいて決定した値を指令値として算出してもよい。

【0097】

以上説明したように、本構成によれば、入力データｐに対応する出力値を求めるときに、入力データｐに対する距離を計算するノードを、全ノードではなく、限定されたクラスタ群に含まれるノードに限定することができる。これにより、一般的なｋ近傍法などの手法と比べて、距離計算の対象となるノードの数を大幅に削減することができ、入力データｐに対応する出力値を求める処理を高速化することが可能となる。

【0098】

情報処理装置１００における基本的な動作は以上で説明した通りであるが、入力データｘが複数個連続して入力される場合には、以下で説明する動作を行ってもよい。図１２に、実施の形態１にかかる情報処理装置１００における処理の変形例のフローチャートを示す。この変形例では、２個目以降の入力データｐに対しては、１つ前に入力された入力データｐに基づいて決定した対象クラスタＣ_ＴＲＧを用いて、最も近いノードＮ_ＮＥＡＲを探索するものである。図１２に示す動作では、図１１のステップＳＡ１～ＳＡ５の他に、ステップＳＡ１１～ＳＡ１４が追加されている。ＳＡ１～ＳＡ５については図１１と同様であるので、追加したステップＳＡ１１～ＳＡ１４について説明する。

【0099】

ステップＳＡ１１
ステップＳＡ１１は、ステップＳＡの前段に挿入されるステップである。探索部２は、まず初めに、動作が初期状態、すなわち、入力データｘの入力が初めてであることを示すため、初期フラグＦＧの値として０を設定する。なお、初期フラグはこの例に限られず、動作が初期状態であることを示せる限り、いなかる形式のデータでもよい。

【0100】

ステップＳＡ１２
ステップＳＡ１２は、ステップＳＡ２とステップＳＡ３との間に挿入されるステップである。探索部２は、動作が初期状態であるか、すなわち初期フラグＦＧの値が０であるか否かを判定する。初期フラグＦＧの値が０である（初期状態）場合には処理をステップＳＡ３へ進め、初期フラグＦＧの値が０ではない（初期状態ではない）場合には処理をステップＳＡ４へ進める。

【0101】

ステップＳＡ１３
ステップＳＡ１３は、ステップＳＡ３とステップＳＡ４との間に挿入されるステップである。探索部２は、動作が初期状態ではないことを示すため、初期フラグＦＧの値を１に切り替える。

【0102】

ステップＳＡ１４
探索部２は、ステップＳＡ４で取得された最も近いノードＮ_ＮＥＡＲが属するクラスタに基づいて、次回の処理における対象クラスタＣ_ＴＲＧを決定する。ここでは、今回の処理で検出した最も近いノードＮ_ＮＥＡＲのクラスタを対象クラスタＣ_ＴＲＧと決定する。なお、次回の処理における対象クラスタＣ_ＴＲＧの決定方法はこれに限られず、例えば、過去の所定回数の処理で検出された最も近いノードＮ_ＮＥＡＲが属するクラスタのうちで、最も出現頻度が多いクラスタを次回の処理における対象クラスタＣ_ＴＲＧとしてもよい。さらに、ステップＳＡ４において複数のノードを探索した場合には、その複数のノードが属するクラスタのうちで頻度の多いクラスタを次回の処理における対象クラスタＣ_ｔｒｇとしてもよい。例えば、ステップＳＡ４で５つのノードが探索され、そのクラスタが｛３，３，４，４，４｝だった場合、対象クラスタを４としてもよい。

【0103】

以上、説明した変形例によれば、前回入力された入力データｐに対応する最も近いノードＮ_ＮＥＡＲが属するクラスタを、次回入力される入力データｐに対して用いる対象クラスタＣ_ＴＲＧとすることができる。一般に時系列データは、隣接する入力データ間では急峻な変化は稀であり、比較的緩やかに変化することが期待されるため、隣接する入力データ間の距離も短くなることが期待される。

【0104】

そのため、次回の処理で入力される入力データｐについても、前回の処理の最も近いノードＮ_ＮＥＡＲからの距離は短いと考えられる。よって、次回の処理で用いるべき対象クラスタＣ_ＴＲＧも、結果として前回の処理の対象クラスタＣ_ＴＲＧと同じクラスタになる場合が多いと考えられる。そこで、本変形例においては、前回の処理の最も近いノードＮ_ＮＥＡＲが属するクラスタを次回の処理の対象クラスタＣ_ＴＲＧとして用いることで、２回目以降の処理の対象クラスタＣ_ＴＲＧを簡便な処理で決定することができる。具体的には、１回目の対象クラスタＣ_ＴＲＧの決定は、ステップＳＡ３（図１１）のように各クラスタの重心と入力データとの間の距離を算出しているため、各クラスタの重心を算出する必要がある。これに対し、本変形例においては、２回目以降の対象クラスタＣ_ＴＲＧの決定を簡便な処理で行い、各クラスタの重心を計算せずともよいので、計算量を削減して処理時間の短縮を実現できる。なお、本実施の形態では、１回目の対象クラスタＣｔｒｇの決定は、各クラスタの重心と入力データとの間の距離を算出して決定したが、これに限らず、時系列的に最初のクラスタ（本実施の形態ではＣＬ１）を１回目の対象クラスタＣｔｒｇとしてもよい。

【0105】

次いで、実施の形態１にかかる情報処理装置１００での処理の具体例について説明する。図１３に、実施の形態１にかかる情報処理装置１００での処理とｋ近傍法での処理とにおける距離計算の対象となるノードを示す。情報処理装置１００では、上述の通り、２つのクラスタＣＬ２及びＣＬ３に属するノードのみが、入力データｐに対する距離の計算の対象となる。これに対し、ｋ近傍法では、モデルＭＤに含まれる全てのノードが、入力データｐに対する距離の計算の対象となってしまう。なお、本実施の形態では、説明の簡略化のため、数十個のノードが属するクラスタを４つ含むモデルを例として説明したが、これは例示に過ぎない。より多数のクラスタを含み、かつ、１つのクラスタに属するノード数がより多いモデルにおいても、本構成を適用することで、入力データに対する距離計算の対象となるノードを、限定されたクラスタに属するノードに限定することが可能であるので、よりクラスタ数が多いモデルにおいても、指令値の出力処理をより高速化することができる。

【0106】

よって、本構成によれば、入力データｐに対応する出力値を求めるときに、入力データｐに対する距離を計算するノードを制限して、処理速度を向上させることができる。

【0107】

実施の形態２
実施の形態２にかかる情報処理装置２００について説明する。図１４に、実施の形態２にかかる情報処理装置２００の構成を模式的に示す。また、図１５に、実施の形態２にかかる情報処理装置２００が用いられる状況を模式的に示す。情報処理装置２００は、情報処理装置１００にモデル作成部４を追加し、かつ、探索部２を探索部６に置換した構成を有する。

【0108】

モデル作成部４は、時系列データである学習用データＤＡＴを読み込んでＳＯＩＮＮ法による学習を行い、モデルＭＤを作成する。作成されたモデルＭＤは、モデル保持部１へ出力される。モデル作成部４における学習については、後述する。

【0109】

探索部５は、モデルＭＤを用いて、別途入力された推定の対象となるデータ（以下、入力データと称する）の状態量を参照し、モデルＭＤに含まれるノードの中から近似するノードを探索する。そして、探索結果を、出力部３へ出力する。

【0110】

データ保持部１及び出力部３については、実施の形態１と同様であるので、説明を省略する。

【0111】

次に、情報処理装置２００が行う処理について説明する。図１６に、実施の形態２にかかる情報処理装置２００における動作のフローチャートを示す。

【0112】

ステップＳＢ１
モデル作成部４は、ＳＯＩＮＮ法により、状態量Ｐ及び指令値Ｑを受け取って保持及び加工して得られる学習用データＤＡＴを学習してモデルＭＤを作成する。ＳＯＩＮＮ法は、多次元ベクトルで記述された入力データを入力することで、入力データを表現するノードが生成され、この生成されたノードによって構成されるネットワークとしてモデルＭＤが得られるものである。以下、ＳＯＩＮＮ法における学習処理について説明する。

【0113】

モデル作成部４は、ＳＯＩＮＮ法を用いることで、ｎ次元ベクトルで記述されるノードが配置される少なくとも１層以上の構造のニューラルネットワークからなるモデルを作成する。モデル作成部４が作成するモデルを構成するニューラルネットワークは、入力ベクトルをニューラルネットワークに入力し、入力される入力ベクトルに基づいて、ニューラルネットワークに配置されるノードを自動的に増加させる自己増殖型ニューラルネットワークであり、１層構造を有するものである。

【0114】

これにより、自己増殖型ニューラルネットワークを用いてノードを自動的に増加させることができるため、順次入力ベクトルを入力することで、オンラインでの追加学習を行うことが可能である。

【0115】

以下、モデル作成部４の構成について説明する。図１７に、実施の形態２にかかるモデル作成部４の構成を模式的に示す。モデル作成部４は、入力情報取得手段４１、勝者ノード探索手段４２、類似度閾値算出手段４３、類似度閾値判定手段４４、ノード挿入手段４５、重みベクトル更新手段４６、ノード密度算出手段４７、分布重なり領域検出手段４８、辺接続判定手段４９、辺接続手段５０、辺削除手段５１、ノイズノード削除手段５２及び出力情報表示手段５３を有する。

【0116】

なお、以下のＳＯＩＮＮ法の説明において、ｉ、ｊ、ｋ、ｘなどの各種のアルファベットを用いるが、これはＳＯＩＮＮ法の説明のために便宜上用いるものであり、実施の形態１において用いられるアルファベットと重複して使用されている場合でも、異なる値を示すものであるものとする。

【0117】

入力情報取得手段４１は、モデル作成部４に入力として与えられる情報として、ｎ次元の入力ベクトルを取得する。そして、取得された入力ベクトルを一時記憶部（例えばＲＡＭ１００３）に格納し、一時記憶部に格納されたニューラルネットワークに対して順次入力する。

【0118】

勝者ノード探索手段４２は、一時記憶部に格納される入力ベクトル及びノードについて、入力ベクトルに最も近い重みベクトルを持つノードを第１勝者ノードとし、２番目に近い重みベクトルを持つノードを第２勝者ノードとして探索し、その結果を一時記憶部に格納する。すなわち、ｎ次元の入力ベクトルξに対して、一時記憶部に格納される以下の式を満足するノードを、それぞれ第１勝者ノードａ_１及び第２勝者ノードａ_２として探索し、その結果を一時記憶部に格納する。

【数9】

【数10】

ここで、ａは一時記憶部に格納されたノード集合Ａに含まれるノードであり、Ｗ_ａは一時記憶部に格納されたノードａの重みベクトルである。

【0119】

類似度閾値算出手段４３は、一時記憶部に格納されたノード及びノードの類似度閾値について、注目するノードについて、注目するノードと辺によって直接的に接続されるノード（以下、隣接ノードという。）が存在する場合には、隣接ノードのうち注目するノードからの距離が最大であるノードまでの距離を類似度閾値として算出し、その結果を一時記憶部に格納し、隣接ノードが存在しない場合には、注目するノードからの距離が最小であるノードまでの距離を類似度閾値として算出し、その結果を一時記憶部に格納する。具体的には、例えば以下のようにして注目するノードの類似度閾値を算出し、その結果を一時記憶部に格納する。
［手順Ｍ＿Ａ１］
類似度閾値算出手段４３は、新しく挿入され一時記憶部に格納されたノードｉの類似度閾値Ｔ_ｉを＋∞（十分大きな値）に設定し、その結果を一時記憶部に格納する。
［手順Ｍ＿Ａ２］
一時記憶部に格納されたノードについて、ノードｉが入力ベクトルから最も近いノードまたは２番目に近いノードとなった場合に、ノードｉが隣接ノードを持つか否かを判定し、その結果を一時記憶部に格納する。
［手順Ｍ＿Ａ３］
一時記憶部に格納された判定の結果、隣接ノードを持つ場合には、一時記憶部に格納された類似度閾値及びノードについて、類似度閾値Ｔ_ｉを隣接ノードへの最大距離とし、その結果を一時記憶部に格納する。
即ち、ノードｉについて、一時記憶部に格納される以下の式に基づいて類似度閾値Ｔ_ｉを算出し、その結果を一時記憶部に格納する。

【数11】

ここで、ｃは一時記憶部に格納されたノードｉの隣接ノード集合Ｎ_ｉに含まれるノードであり、Ｗ_ｃは一時記憶部に格納されたノードｃの重みベクトルである。
［手順Ｍ＿Ａ４］
判定の結果、隣接ノードを持たない場合には、ノードｉからノードｉを除いた他の各ノードへの距離を算出し、算出された距離のうち最小の距離を類似度閾値Ｔ_ｉとする。
即ち、ノードｉについて、一時記憶部に格納される以下の式に基づいて類似度閾値Ｔ_ｉを算出し、その結果を一時記憶部に格納する。

【数12】

【0120】

類似度閾値判定手段４４は、一時記憶部に格納された入力ベクトル、ノード及び、ノードの類似度閾値について、入力ベクトルと第１勝者ノードとの間の距離が第１勝者ノードの類似度閾値より大きいか否か、及び、入力ベクトルと第２勝者ノード間の距離が第２勝者ノードの類似度閾値より大きいか否かを判定し、その結果を一時記憶部に格納する。すなわち、一時記憶部に格納される以下の式に示すように、入力ベクトルξと第１勝者ノードａ_１の間の距離が類似度閾値Ｔ_ａ１よりも大きいか否かを判定しその結果を一時記憶部に格納すると共に、入力ベクトルξと第２勝者ノードａ_２の間の距離が類似度閾値Ｔ_ａ２よりも大きいか否かを判定しその結果を一時記憶部に格納する。

【数13】

【0121】

ノード挿入手段４５は、一時記憶部に格納された類似度閾値判定手段４４による判定結果に基づいて、一時記憶部に格納された入力ベクトルについて、入力ベクトルを新たなノードとして、入力ベクトルと同じ位置に挿入し、その結果を一時記憶部に格納する。

【0122】

重みベクトル更新手段４６は、一時記憶部に格納されたノードの重みベクトルについて、第１勝者ノードの重みベクトル及び第１勝者ノードの隣接ノードの重みベクトルをそれぞれ入力ベクトルに更に近づけるように更新し、その結果を一時記憶部に格納する。
第１勝者ノードａ_１の重みベクトルの更新量ΔＷ_ａ１、及び第１勝者ノードａ_１の隣接ノードｉの重みベクトルの更新量ΔＷ_ａｉは、例えば一時記憶部に格納される以下の式に基づいて算出し、その結果を一時記憶部に格納する。

【数14】

【数15】

ここで、ε_１（ｔ）及びε_２（ｔ）はそれぞれ一時記憶部に格納される以下の式に基づいて算出し、その結果を一時期億部に格納する。

【数16】

【数17】

なお、本実施の形態においては、追加学習に対応するため、入力ベクトルの入力回数ｔに代えて、一時記憶部に格納される第１勝者ノードａ_１が第１勝者ノードとなった累積回数Ｍ_ａ１を用いる。

【0123】

ノード密度算出手段４７は、一時記憶部に格納されたノード及びノード密度について、注目するノードについて、その隣接ノード間の平均距離に基づいて、注目するノードのノード密度を算出し、その結果を一時記憶部に格納する。さらに、ノード密度算出手段４７は、単位ノード密度算出部を有し、単位ノード密度算出部は、追加学習に対応するため、一時記憶部に格納された第１勝者ノード及びノード密度について、第１勝者ノードとその隣接ノード間の平均距離に基づいて、第１勝者ノードのノード密度を単位入力数あたりの割合として算出し、その結果を一時記憶部に格納する。さらにまた、ノード密度算出手段４７は、一時記憶部に格納されたノード及びノード密度ポイントについて、第１勝者ノード及びその隣接ノード間の平均距離に基づいて、第１勝者ノードのノード密度のポイント値を算出するノード密度ポイント算出部と、入力ベクトルの入力数が所定の単位入力数となるまでノード密度ポイントを一時記憶部に格納して累積し、入力ベクトルの入力数が所定の単位入力数になった場合に、一時記憶部に格納して累積されたノード密度ポイントを単位入力数あたりの割合として算出し、単位入力数あたりのノードのノード密度を算出し、その結果を一時記憶部に格納する単位ノード密度ポイント算出部を有する。

【0124】

具体的には、ノード密度ポイント算出部は、例えば一時記憶部に格納される以下の式に基づいてノードｉに与えられるノード密度のポイント値ｐｔ_ｉを算出し、その結果を一時記憶部に格納する。尚、ノードｉに与えられるポイント値ｐｔ_ｉは、ノードｉが第１勝者ノードとなった場合には一時記憶部に格納される以下の式に基づいて算出されるポイント値が与えられるが、ノードｉが第１勝者ノードでない場合にはノードｉにはポイントは与えられないものとする。

【数18】

ここで、ｅ_ｉはノードｉからその隣接ノードまでの平均距離を示し、一時記憶部に格納される以下の式に基づいて算出し、その結果を一時記憶部に格納する。

【数19】

尚、ｍは一時記憶部に格納されたノードｉの隣接ノードの個数を示し、Ｗ_ｉは一時記憶部に格納されたノードｉの重みベクトルを示す。

【0125】

ここで、隣接ノードへの平均距離が大きくなる場合には、ノードを含むその領域にはノードが少ないものと考えられ、逆に平均距離が小さくなる場合には、その領域にはノードが多いものと考えられる。
従って、ノードの多い領域で第１勝者ノードとなった場合には高いポイントが与えられ、ノードの少ない領域で第１勝者ノードとなった場合には低いポイントが与えられるようにノードの密度のポイント値の算出方法を上述のように構成する。
これにより、ノードを含むある程度の範囲の領域におけるノードの密集具合を推定することができるため、ノードの分布が高密度の領域に位置するノードであっても、ノードが第１勝者回数となった回数をノードの密度とする従来の場合に比べて、入力ベクトルの入力分布密度により近似した密度となるノード密度ポイントを算出することができる。

【0126】

単位ノード密度ポイント算出部は、例えば一時記憶部に格納される以下の式に基づいてノードｉの単位入力数あたりのノード密度ｄｅｎｓｉｔｙ_ｉを算出し、その結果を一時記憶部に格納する。

【数20】

ここで、連続して与えられる入力ベクトルの入力回数を予め設定され一時記憶部に格納される一定の入力回数λごとの区間に分け、各区間においてノードｉに与えられたポイントについてその合計を累積ポイントｓ_ｉと定める。なお、入力ベクトルの総入力回数を予め設定され一時記憶部に格納されるＬＴとする場合に、ＬＴ／λを区間の総数ｎとしその結果を一時記憶部に格納し、ｎのうち、ノードに与えられたポイントの合計が０以上であった区間の数をＮとして算出し、その結果を一時記憶部に格納する（Ｎとｎは必ずしも同じとならない点に注意する）。
累積ポイントｓ_ｉは、例えば一時記憶部に格納される以下の式に基づいて算出し、その結果を一時記憶部に格納する。

【数21】

ここで、ｐｔ_ｉ ^{（ｊ，ｋ）}はｊ番目の区間におけるｋ番目の入力によってノードｉに与えられたポイントを示し、上述のノード密度ポイント算出部により算出され、その結果を一時記憶部に格納する。
このように、単位ノード密度ポイント算出部は、一時記憶部に格納されたノードｉの密度ｄｅｎｓｉｔｙ_ｉを累積ポイントｓ_ｉの平均として算出し、その結果を一時記憶部に格納する。

【0127】

なお、本実施の形態においては追加学習に対応するため、ｎに代えてＮを用いる。これは、追加学習において、以前の学習で生成されたノードにはポイントが与えられないことが多く、ｎを用いて密度を算出すると、以前学習したノードの密度が次第に低くなってしまうという問題を回避するためである。即ち、ｎに代えてＮを用いてノード密度を算出することで、追加学習を長時間行った場合であっても、追加されるデータが以前学習したノードの近くに入力されない限りは、そのノードの密度を変化させずに保持することができる。
これにより、追加学習を長時間実施する場合であっても、ノードのノード密度が相対的に小さくなってしまうことを防ぐことができ、従来の手法に比べて、入力ベクトルの入力分布密度により近似したノード密度を変化させずに保持して算出することができる。

【0128】

分布重なり領域検出手段４８は、一時記憶部に格納されたノード、ノード間を接続する辺、及びノードの密度について、辺によって接続されるノードの集合であるクラスタを、ノード密度算出手段４７によって算出されるノード密度に基づいてクラスタの部分集合であるサブクラスタに分割し、その結果を一時記憶部に格納し、サブクラスタの境界である分布の重なり領域を検出し、その結果を一時記憶部に格納する。

【0129】

さらに、分布重なり領域検出手段４８は、一時記憶部に格納されたノード、ノード間を接続する辺、及びノードの密度について、ノード密度算出手段４７により算出されたノード密度に基づいて、ノード密度が局所的に最大であるノードを探索するノード探索部と、探索したノードに対して、既に他のノードに付与済みのラベルとは異なるラベルを付与する第１のラベル付与部と、第１のラベル付与部によりラベルが付与されなかったノードのうち、そのノードと辺によって接続されるノードについて、第１のラベル付与部によりラベルが付与されたノードのラベルと同じラベルを付与する第２のラベル付与部と、それぞれ異なるラベルが付与されたノード間に辺によって直接的に接続がある場合に、その辺によって接続されるノードの集合であるクラスタをクラスタの部分集合であるサブクラスタに分割するクラスタ分割部と、注目するノード及びその隣接ノードがそれぞれ異なるサブクラスタに属する場合に、その注目するノード及びその隣接ノードを含む領域を、サブクラスタの境界である分布の重なり領域として検出する分布重なり領域検出部を有する。

【0130】

具体的には、一時記憶部に格納されたノード、ノード間を接続する辺、及びノードの密度について、例えば以下のようにしてサブクラスタの境界である分布の重なり領域を検出し、その結果を一時記憶部に格納する。
［手順Ｍ＿Ｂ１］
ノード探索部は、一時記憶部に格納されたノード及びノードの密度について、ノード密度算出手段４７により算出されたノード密度に基づいて、ノード密度が局所的に最大であるノードを探索し、その結果を一時記憶部に格納する。
［手順Ｍ＿Ｂ２］
第１のラベル付与部は、一時記憶部に格納されたノード、及びノードのラベルについて、手順Ｍ＿Ｂ１において探索したノードに対して、既に他のノードに付与済みのラベルとは異なるラベルを付与し、その結果を一時記憶部に格納する。
［手順Ｍ＿Ｂ３］
第２のラベル付与部は、一時記憶部に格納されたノード、ノード間を接続する辺、及びノードのラベルについて、手順Ｍ＿Ｂ２において第１のラベル付与部によりラベルが付与されなかったノードについて、第１のラベル付与部にラベルが付与されたノードと辺によって接続されるノードについて、第１のラベル付与部によりラベルが付与されたノードのラベルと同じラベルを付与し、その結果を一時記憶部に格納する。即ち、密度が局所的に最大の隣接ノードと同じラベルを付与する。
［手順Ｍ＿Ｂ４］
クラスタ分割部は、一時記憶部に格納されたノード、ノード間を接続する辺、及びノードのラベルについて、一時記憶部に格納された辺によって接続されるノードの集合であるクラスタを、同じラベルが付与されたノードからなるクラスタの部分集合であるサブクラスタに分割し、その結果を一時記憶部に格納する。
［手順Ｍ＿Ｂ５］
分布重なり領域検出部は、一時記憶部に格納されたノード、ノード間を接続する辺、及びノードのラベルについて、注目するノードとその隣接ノードが異なるサブクラスタにそれぞれ属する場合に、その注目するノード及びその隣接ノードを含む領域を、サブクラスタの境界である分布の重なり領域として検出し、その結果を一時記憶部に格納する。

【0131】

辺接続判定手段４９は、一時記憶部に格納されたノード、ノード密度、及び分布重なり領域について、第１勝者ノード及び第２勝者ノードが分布重なり領域に位置するノードである場合に、第１勝者ノード及び第２勝者ノードのノード密度に基づいて第１勝者ノード及び第２勝者ノード間に辺を接続するか否かを判定し、その結果を一時記憶部に格納する。

【0132】

さらに辺接続判定手段４９は、一時記憶部に格納されたノード、ノード密度、ノードのサブクラスタについて、ノードが属しているサブクラスタを判定する所属サブクラスタ判定部と、ノードが属するサブクラスタの頂点の密度及びノードの密度に基づいて、第１勝者ノード及び第２勝者ノード間に辺を接続するか否かを判定する辺接続判定部を有する。

【0133】

辺接続手段５０は、一時記憶部に格納された辺接続判定手段４９の判定結果に基づいて、一時記憶部に格納されたノード及びノード間の辺について、第１勝者ノード及び第２勝者ノード間に辺を接続し、その結果を一時記憶部に格納する。

【0134】

辺削除手段５１は、一時記憶部に格納された辺接続判定手段４９の判定結果に基づいて、一時記憶部に格納されたノード及びノード間の辺について、第１勝者ノード及び第２勝者ノード間の辺を削除し、その結果を一時記憶部に格納する。

【0135】

具体的には、一時記憶部に格納されたノード、ノード密度、ノードのサブクラスタ、及びノード間の辺について、例えば以下のようにして辺接続判定手段４９は辺を接続するか否かを判定し、辺接続手段５０及び辺削除手段５１は辺の生成及び削除処理を実施し、その結果を一時記憶部に格納する。
［手順Ｍ＿Ｃ１］
所属サブクラスタ判定部は、一時記憶部に格納されたノード、ノードのサブクラスタについて、第１勝者ノード及び第２勝者ノードが属するサブクラスタをそれぞれ判定し、その結果を一時記憶部に格納する。
［手順Ｍ＿Ｃ２］
一時記憶部に格納された手順Ｍ＿Ｃ１における判定の結果、第１勝者ノード及び第２勝者ノードがどのサブクラスタにも属していない場合、又は、第１勝者ノード及び第２勝者ノードが同じサブクラスタに属している場合には、辺接続手段５０は、一時記憶部に格納されたノード及びノード間の辺について、第１勝者ノード及び第２勝者ノード間に辺を生成することによりノード間を接続し、その結果を一時記憶部に格納する。
［手順Ｍ＿Ｃ３］
一時記憶部に格納された手順Ｍ＿Ｃ１における判定の結果、第１勝者ノード及び第２勝者ノードが互いに異なるサブクラスタに属す場合には、辺接続判定部は、一時記憶部に格納されたノード、ノード密度、及びノード間の辺について、ノードが属するサブクラスタの頂点の密度及びノードの密度に基づいて、第１勝者ノード及び第２勝者ノード間に辺を接続するか否かを判定し、その結果を一時記憶部に格納する。
［手順Ｍ＿Ｃ４］
一時記憶部に格納された手順Ｍ＿Ｃ３における辺接続判定部による判定の結果、辺を接続する必要がないと判定した場合には、一時記憶部に格納されたノード及びノード間の辺について、第１勝者ノード及び第２勝者ノード間を辺によって接続せず、既にノード間が辺によって接続されていた場合には、辺削除手段５１は、一時記憶部に格納されたノード及びノード間の辺について、一時記憶部に格納された第１勝者ノード及び第２勝者ノード間の辺を削除し、その結果を一時記憶部に格納する。
［手順Ｍ＿Ｃ５］
一時記憶部に格納された手順Ｍ＿Ｃ３における辺接続判定部による判定の結果、辺を接続する必要があると判定した場合には、辺接続手段５０は、一時記憶部に格納されたノード及びノード間の辺について、第１勝者ノード及び第２勝者ノード間に辺を生成しノード間を接続する。

【0136】

ここで、辺接続判定部による判定処理について詳細に説明する。
まず、辺接続判定部は、一時記憶部に格納されたノード及びノード密度について、第１勝者ノードのノード密度ｄｅｎｓｉｔｙ_ｗｉｎ及び第２勝者ノード密度ｄｅｎｓｉｔｙ_{ｓｅｃ－ｗｉｎ}のうち、最小のノード密度ｍを例えば一時記憶部に格納される以下の式に基いて算出し、その結果を一時記憶部に格納する。

【数22】

次に、一時記憶部に格納されたノード、ノードのノード密度、及びノードのサブクラスについて、第１勝者ノード及び第２勝者ノードがそれぞれ属するサブクラスタＡ及びサブクラスタＢについて、サブクラスタＡの頂点の密度Ａ_ｍａｘ及びサブクラスタＢの頂点の密度Ｂ_ｍａｘを算出し、その結果を一時記憶部に格納する。
尚、サブクラスタに含まれるノードのうち、ノード密度が最大であるノード密度をサブクラスタの頂点の密度とする。
そして、一時記憶部に格納されたノードが属するサブクラスタの頂点の密度Ａ_ｍａｘ及びＢ_ｍａｘ、及びノードの密度ｍについて、ｍがα_ＡＡ_ｍａｘより小さく、かつ、ｍがα_ＢＢ_ｍａｘより小さいか否かを判定し、その結果を一時記憶部に格納する。即ち、一時記憶部に格納される以下の不等式を満足するか否かを判定し、その結果を一時記憶部に格納する。

【数23】

判定の結果、ｍがα_ＡＡ_ｍａｘより小さく、かつ、ｍがα_ＢＢ_ｍａｘより小さい場合には、一時記憶部に格納されたノード及びノード間の辺について、第１勝者ノード及び第２勝者ノード間には辺は不要であると判定し、その結果を一時記憶部に格納する。
一方、判定の結果、ｍがα_ＡＡ_ｍａｘ以上、または、ｍがα_ＢＢ_ｍａｘ以上である場合には、一時記憶部に格納されたノード及びノード間の辺について、第１勝者ノード及び第２勝者ノード間に辺は必要であると判定し、その結果を一時記憶部に格納する。

【0137】

このように、第１勝者ノード及び第２勝者ノードの最小ノード密度ｍを、第１勝者ノード及び第２勝者ノードをそれぞれ含むサブクラスタの平均的なノード密度と比較することで、第１勝者ノード及び第２勝者ノードを含む領域におけるノード密度の凹凸の大きさを判定することができる。即ち、サブクラスタＡ及びサブクラスタＢの間に存在する分布の谷間のノード密度ｍが、閾値α_ＡＡ_ｍａｘ又はα_ＢＢ_ｍａｘより大きな場合には、ノード密度の形状は小さな凹凸であると判定することができる。

【0138】

ここで、α_Ａ及びα_Ｂは一時記憶部に格納される以下の式に基づいて算出し、その結果を一時記憶部に格納する。尚、α_Ｂについてもα_Ａと同様にして算出することができるためここでは説明を省略する。
ｉ）Ａ_ｍａｘ／ｍｅａｎ_Ａ－１≦１の場合には、α_Ａ＝０．０とする。
ｉｉ）１＜Ａ_ｍａｘ／ｍｅａｎ_Ａ－１≦２の場合には、α_Ａ＝０．５とする。
ｉｉｉ）２＜Ａ_ｍａｘ／ｍｅａｎ_Ａ－１の場合には、α_Ａ＝１．０とする。
Ａ_ｍａｘ／ｍｅａｎ_Ａの値が１以下となるｉ）の場合には、Ａ_ｍａｘとｍｅａｎ_Ａの値は同程度であり、密度の凹凸はノイズの影響によるものと判断する。そして、αの値を０．０とすることで、サブクラスタが統合されるようにする。
また、Ａ_ｍａｘ／ｍｅａｎ_Ａの値が２を超えるｉｉｉ）の場合には、Ａ_ｍａｘはｍｅａｎ_Ａに比べて十分大きく、明らかな密度の凹凸が存在するものと判断する。そして、αの値を１．０とすることで、サブクラスタが分離されるようにする。
そして、Ａ_ｍａｘ／ｍｅａｎ_Ａの値が上述した場合以外となるｉｉ）の場合には、αの値を０．５とすることで、密度の凹凸の大きさに応じてサブクラスタが統合又は分離されるようにする。
尚、ｍｅａｎ_ＡはサブクラスタＡに属すノードｉのノード密度ｄｅｎｓｉｔｙ_ｉの平均値を示し、Ｎ_ＡをサブクラスタＡに属するノードの数として、一時記憶部に格納される以下の式に基づいて算出し、その結果を一時記憶部に格納する。

【数24】

【0139】

このように、サブクラスタへの分離を行う際に、サブクラスタに含まれるノード密度の凹凸の程度を判定し、ある基準を満たした２つのサブクラスタを１つに統合することで、分布の重なり領域の検出におけるサブクラスタの分けすぎによる不安定化を防止することができる。

【0140】

ノイズノード削除手段５２は、一時記憶部に格納されたノード、ノード密度、ノード間の辺、隣接ノードの個数について、注目するノードについて、ノード密度算出手段４７により算出されるノード密度及び注目するノードの隣接ノードの個数に基づいて、注目するノードを削除し、その結果を一時記憶部に格納する。

【0141】

さらにノイズノード削除手段５２は、一時記憶部に格納されたノード、ノード密度、ノード間の辺、隣接ノードの個数について、注目するノードのノード密度を所定の閾値と比較するノード密度比較部と、注目するノードの隣接ノードの個数を算出する隣接ノード数算出部と、注目するノードをノイズノードとみなして削除するノイズノード削除部を有する。
具体的には、例えば以下のようにして一時記憶部に格納されたノード、ノード密度、ノード間の辺、隣接ノードの個数について、ノード密度及び注目するノードの隣接ノードの個数に基づいて、注目するノードを削除し、その結果を一時記憶部に格納する。

【0142】

ノイズノード削除手段５２は、一時記憶部に格納されたノード、ノード間の辺、隣接ノードの個数について、注目するノードｉについて、隣接ノード数算出部によりその隣接ノードの個数を算出し、その結果を一時記憶部に格納する。そして、一時記憶部に格納された隣接ノードの個数に応じて、以下の処理を実施する。
ｉ）一時記憶部に格納された隣接ノード数が２の場合、ノード密度比較部はノードｉのノード密度ｄｅｎｓｉｔｙ_ｉを例えば一時記憶部に格納される以下の式に基づいて算出する閾値と比較し、その結果を一時記憶部に格納する。

【数25】

一時記憶部に格納された比較結果について、ノード密度ｄｅｎｓｉｔｙ_ｉが閾値より小さい場合には、ノイズノード削除部は、一時記憶部に格納されたノードについて、ノードを削除し、その結果を一時記憶部に格納する。
ｉｉ）一時記憶部に格納された隣接ノード数が１の場合、ノード密度比較部はノードｉのノード密度ｄｅｎｓｉｔｙ_ｉを例えば一時記憶部に格納される以下の式に基づいて算出する閾値と比較し、その結果を一時記憶部に格納する。

【数26】

一時記憶部に格納された比較の結果について、ノード密度ｄｅｎｓｉｔｙ_ｉが閾値より小さい場合には、ノイズノード削除部は、一時記憶部に格納されたノードについて、ノードを削除し、その結果を一時記憶部に格納する。
ｉｉｉ）一時記憶部に格納された隣接ノード数について、隣接ノードを持たない場合、ノイズノード削除部は、一時記憶部に格納されたノードについて、ノードを削除し、その結果を一時記憶部に格納する。
ここで、予め設定され一時記憶部に格納される所定のパラメータｃ₁及びｃ₂を調整することで、ノイズノード削除手段５２によるノイズノードの削除の振る舞いを調整することができる。

【0143】

出力情報表示手段５３は、一時記憶部に格納されたノードを含む情報、すなわちモデルＭＤを出力する。

【0144】

続いて、ＳＯＩＮＮ法による学習処理のフローについて説明する。図１８に、ＳＯＩＮＮ法による学習処理のフローチャートを示す。

【0145】

ステップＭ１
入力情報取得手段４１は、ランダムに２つの入力ベクトルを取得し、ノード集合Ａをそれらに対応する２つのノードのみを含む集合として初期化し、その結果を一時記憶部に格納する。また、辺集合Ｃ⊂Ａ×Ａを空集合として初期化し、その結果を一時記憶部に格納する。

【0146】

ステップＭ２
入力情報取得手段４１は、学習用データＤＡＴからランダムに選択された新しい入力ベクトルξを入力し、その結果を一時記憶部に格納する。ただし、一度選択された入力ベクトルが再び選択されることはない点については、言うまでもない。

【0147】

ステップＭ３
勝者ノード探索手段４２は、一時記憶部に格納された入力ベクトル及びノードについて、入力ベクトルξに最も近い重みベクトルを持つ第１勝者ノードａ_１及び２番目に近い重みベクトルを持つ第２勝者ノードａ_２を探索し、その結果を一時記憶部に格納する。

【0148】

ステップＭ４
類似度閾値判定手段４４は、一時記憶部に格納された入力ベクトル、ノード、ノードの類似度閾値について、入力ベクトルξと第１勝者ノードａ_１間の距離が第１勝者ノードａ_１の類似度閾値Ｔ_１より大きいか否か、及び、入力ベクトルξと第２勝者ノードａ_２間の距離が第２勝者ノードａ_２の類似度閾値Ｔ_２より大きいか否かを判定し、その結果を一時記憶部に格納する。
ここで、一時記憶部に格納された第１勝者ノードａ_１の類似度閾値Ｔ_１及び第２勝者ノードａ_２の類似度閾値Ｔ_２は、上述の手順Ｍ＿Ａ１～手順Ｍ＿Ａ４において示したように類似度閾値算出手段４３により算出され、その結果が一時記憶部に格納される。

【0149】

ステップＭ５
一時記憶部に格納されたステップＭ４における判定の結果、入力ベクトルξと第１勝者ノードａ_１間の距離が第１勝者ノードａ_１の類似度閾値Ｔ_１より大きい、又は、入力ベクトルξと第２勝者ノードａ_２間の距離が第２勝者ノードａ_２の類似度閾値Ｔ_２より大きい場合には、ノード挿入手段４５は、一時記憶部に格納された入力ベクトル及びノードについて、入力ベクトルξを新たなノードｉとして、入力ベクトルξと同じ位置に挿入し、その結果を一時記憶部に格納する。

【0150】

ステップＭ６
一方、一時記憶部に格納されたステップＭ４における判定の結果、入力ベクトルξと第１勝者ノードａ_１間の距離が第１勝者ノードａ_１の類似度閾値Ｔ_１以下であり、かつ、入力ベクトルξと第２勝者ノードａ_２間の距離が第２勝者ノードａ_２の類似度閾値Ｔ_２以下である場合には、辺接続判定手段４９は、一時記憶部に格納されたノード、ノード密度、ノード間の辺について、第１勝者ノードａ_１及び第２勝者ノードａ_２のノード密度に基づいて、第１勝者ノードａ_１及び第２勝者ノードａ_２間に辺を接続するか否かを判定し、その結果を一時記憶部に格納する。

【0151】

ステップＭ７
一時記憶部に格納されたステップＭ６における判定の結果、第１勝者ノードａ_１及び第２勝者ノードａ_２間に辺を生成して接続する場合には、辺接続手段５０は、一時記憶部に格納されたノード及びノード間の辺について、第１勝者ノード及び第２勝者ノード間に辺を接続し、その結果を一時記憶部に格納する。
そして、情報処理装置は、一時記憶部に格納された辺及び辺の年齢について、新しく生成された辺、及び、既にノード間に辺が生成されていた場合にはその辺について、辺の年齢を０に設定しその結果を一時記憶部に格納し、第１勝者ノードａ_１と直接的に接続される辺の年齢をインクリメントし（１増やす）、その結果を一時記憶部に格納する。
一方、一時記憶部に格納されたステップＭ６における判定の結果、第１勝者ノードａ_１及び第２勝者ノードａ_２間に辺を接続しない場合には、ステップＭ８へと処理を進めるが、既にノード間に辺が生成されていた場合には、辺削除手段５１は、一時記憶部に格納されたノード及びノード間の辺について、第１勝者ノードａ_１及び第２勝者ノードａ_２間の辺を削除し、その結果を一時記憶部に格納する。尚、上述の手順Ｍ＿Ｃ１～Ｍ＿Ｃ５において示したようにして、辺接続判定手段４９、辺接続手段５０、及び辺削除手段５１は処理を実施する。
次いで、一時記憶部に格納されたノード及びノード密度のポイント値について、第１勝者ノードａ_１について、ノード密度算出手段４７は、一時記憶部に格納された第１勝者ノードａ_１のノード密度のポイント値を算出しその結果を一時記憶部に格納し、算出され一時記憶部に格納されたノード密度のポイント値を以前までに算出され一時記憶部に格納されたポイント値に加算することで、ノード密度ポイントとして累積し、その結果を一時記憶部に格納する。
次いで、情報処理装置は、一時記憶部に格納された第１勝者ノードａ_１が第１勝者ノードとなった累積回数Ｍ_ａ１をインクリメントし（１増やす）、その結果を一時記憶部に格納する。

【0152】

ステップＭ８
重みベクトル更新手段４６は、一時記憶部に格納されたノード及びノードの重みベクトルについて、第１勝者ノードａ_１の重みベクトル及び第１勝者ノードａ_１の隣接ノードの重みベクトルをそれぞれ入力ベクトルξに更に近づけるように更新し、その結果を一時記憶部に格納する。

【0153】

ステップＭ９
情報処理装置は、一時記憶部に格納された辺について、予め設定され一時記憶部に格納された閾値ａｇｅ_ｔを超えた年齢を持つ辺を削除し、その結果を一時記憶部に格納する。尚、ａｇｅ_ｔはノイズなどの影響により誤って生成される辺を削除するために使用する。ａｇｅ_ｔに小さな値を設定することにより、辺が削除されやすくなりノイズによる影響を防ぐことができるものの、値を極端に小さくすると、頻繁に辺が削除されるようになり学習結果が不安定になる。一方、極端に大きな値をａｇｅ_ｔに設定すると、ノイズの影響で生成された辺を適切に取り除くことができない。これらを考慮して、パラメータａｇｅ_ｔは実験により予め算出し一時記憶部に格納される。

【0154】

ステップＭ１０
情報処理装置は、一時記憶部に格納された与えられた入力ベクトルξの総数について、与えられた入力ベクトルξの総数が予め設定され一時記憶部に格納されたλの倍数であるか否かを判定し、その結果を一時記憶部に格納する。一時記憶部に格納された判定の結果、入力ベクトルの総数がλの倍数でない場合にはステップＭ２へと戻り、次の入力ベクトルξを処理する。
一方、入力ベクトルξの総数がλの倍数となった場合には以下の処理を実行する。
尚、λはノイズと見なされるノードを削除する周期である。λに小さな値を設定することにより、頻繁にノイズ処理を実施することができるものの、値を極端に小さくすると、実際にはノイズではないノードを誤って削除してしまう。一方、極端に大きな値をλに設定すると、ノイズの影響で生成されたノードを適切に取り除くことができない。これらを考慮して、パラメータλは実験により予め算出し一時記憶部に格納される。

【0155】

ステップＭ１１
分布重なり領域検出手段４８は、一時記憶部に格納されたサブクラスタ及び分布の重なり領域について、上述の手順Ｍ＿Ｂ１～Ｍ＿Ｂ５において示したようにしてサブクラスタの境界である分布の重なり領域を検出し、その結果を一時記憶部に格納する。

【0156】

ステップＭ１２
ノード密度算出手段４７は、一時記憶部に格納されて累積されたノード密度ポイントを単位入力数あたりの割合として算出しその結果を一時記憶部に格納し、単位入力数あたりのノードのノード密度を算出し、その結果を一時記憶部に格納する。

【0157】

ステップＭ１３
ノイズノード削除手段５２は、一時記憶部に格納されたノードについて、ノイズノードと見なしたノードを削除し、その結果を一時記憶部に格納する。尚、ステップＭ１３においてノイズノード削除手段５２が使用するパラメータｃ_１及びｃ_２はノードをノイズと見なすか否かの判定に使用する。通常、隣接ノード数が２であるノードはノイズではないことが多いため、ｃ_１は０に近い値を使用する。また、隣接ノード数が１であるノードはノイズであることが多いため、ｃ_２は１に近い値を使用するものとし、これらのパラメータは予め設定され一時記憶部に格納される。

【0158】

ステップＭ１４
情報処理装置は、一時記憶部に格納された与えられた入力ベクトルξの総数について、与えられた入力ベクトルξの総数が予め設定され一時記憶部に格納されたＬＴであるか否かを判定し、その結果を一時記憶部に格納する。一時記憶部に格納された判定の結果、入力ベクトルの総数がＬＴの倍数でない場合にはステップＭ２へと戻り、次の入力ベクトルξを処理する。
一方、入力ベクトルξの総数がＬＴとなった場合には、学習を停止する。

【0159】

以上のステップＭ１～Ｍ１４を実行することで、ＳＯＩＮＮ法によって作成されたノードのネットワークとして構成されるモデルＭＤが得られる。図１９に、実施の形態２にかかる情報処理装置２００において実施の形態１で使用した学習用データＤＡＴをＳＯＩＮＮ法で学習することで得られたノードの分布の例を示す。図１９では、可視化しやすくするため、学習データの状態量の中からｆｘ，ｆｙの２次元平面を抜き出してマッピングしている。

【0160】

この例では、ＳＯＩＮＮ法で学習を行うことで、学習用データに含まれるデータ要素の学習結果は、ＳＯＩＮＮ法によって生成された代表的なノードによって表現されている。つまり、学習用データＤＡＴに含まれるデータ要素の数に比べて、モデルＭＤに含まれるノードの数は少なくなる。

【0161】

ＳＯＩＮＮ法は、例えば特許文献１及び２におけるＳＯＩＮＮ法が適用できる。また、学習用データに含まれるデータ要素の分布構造を、データ要素よりも少数のノードによって表現された分布構造として学習する各種のＳＯＩＮＮ法を適用してもよい。

【0162】

引き続き、図１６に戻り、情報処理装置２００でのステップＳＢ２以降の処理について説明する。

【0163】

ステップＳＢ２
探索部５は、図１１のステップＳＡ１と同様に、モデル保持部１からモデルＭＤを読み込む。

【0164】

ステップＳＢ３
探索部５は、図１１のステップＳＡ２と同様に、入力データである状態量ｐを取得する。

【0165】

ステップＳＢ４
探索部５は、図１１のステップＳＡ４と同様に、モデルＭＤから、入力データｐに最も近いノードＮ_ＮＥＡＲを探索する。

【0166】

ステップＳＢ５
出力部３は、図１１のステップＳＡ５と同様に、実施の形態１と同様である。つまり、出力部３は、最も近いノードＮ_ＮＥＡＲに基づいて決定した出力指令値ｑ_ＯＵＴを出力する。なお、実施の形態１と同様に、第１～第４の出力指令値決定方法を含む各種の方法を用いて出力指令値ｑ_ＯＵＴを決定してもよい。

【0167】

以上説明したように、本構成によれば、入力データｐに対応する出力値を求めるときに、入力データｐに対する距離を計算するノードを、学習用データのデータ要素の数よりも少ない数のノードに制限することができる。これにより、学習用データ又は学習用データのデータ要素と同じ数のノードを用いる一般的なｋ近傍法などの手法と比べて、距離計算の対象となるノードの数を大幅に削減することができ、入力データｐに対応する指令値を求める処理を高速化することが可能となる。

【0168】

よって、本構成によれば、実施の形態１と同様に、入力データｐに対応する出力値を求めるときに、入力データｐに対する距離を計算するノードを制限して、処理速度を向上させることができる。

【0169】

その他の実施の形態
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。例えば、上述の実施の形態において、２つの値の大小判定について説明したが、これは例示に過ぎず、２つの値の大小判定において２つの値が等しい場合については、必要に応じて取り扱ってもよい。すなわち、第１の値が第２の値以上であるか又は第２の値よりも小さいかの判定と、第１の値が第２の値よりも大きいか又は第２の値以下であるかの判定とについては、必要に応じていずれを採用してもよい。第１の値が第２の値以下であるか又は第２の値よりも大きいかの判定と、第１の値が第２の値よりも小さいか又は第２の値以上であるかの判定については、いずれを採用してもよい。換言すれば、２つの値の大小判定を行って２つの判定結果を得る場合、２つの値が等しい場合については、必要に応じて２つの判定結果のいずれに含めてもよい。

【0170】

上述の実施の形態では、本発明を主にハードウェアの構成として説明したが、これに限定されるものではなく、任意の処理を、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）にコンピュータプログラムを実行させることにより実現することも可能である。プログラムは、コンピュータに読み込まれたときに、コンピュータに上述の実施の形態に記載した１つ以上の機能を実行させる指令（又はソフトウェアコード）を含むものである。プログラムは、非一時的なコンピュータ可読媒体又は有形の記憶媒体に格納されてもよい。これに限られるものではないが、非一時的なコンピュータ可読媒体又は有形の記憶媒体の例は、ＲＡＭ（Random-access memory : RAM）、ＲＯＭ（Read-only memory）、フラッシュメモリ（Flash memory）、ＳＳＤ（Solid-state drive）、又は、他の種類の記憶技術、例えば、ＣＤ（Compact disc）－ＲＯＭ、ＤＶＤ（Digital versatile disc）、ブルーレイ・ディスク（Blu-ray disc登録商標）又は他の種類の光学ディスク記憶装置、磁気カセット（Magnetic cassette）、磁気テープ（Magnetic tape）、磁気ディスク記憶装置（Magnetic disk storage）又は他の磁気記憶装置を含む。プログラムは、一時的なコンピュータ可読媒体又は通信媒体によって送信されてもよい。これに限られるものではないが、一時的なコンピュータ可読媒体又は有形の記憶媒体の例は、電気的、光学的、音響的又は他の形式の伝搬信号を含んでもよい。

【0171】

実施の形態１においては、学習データＤＡＴを学習して得られたノードをクラスタリングするものとして説明したが、実施の形態２で説明したＳＯＩＮＮ法によって学習データＤＡＴを学習することで得られたノードに対してクラスタリン行ってもよいことは、言うまでもない。

【0172】

上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。

【0173】

（付記１）学習対象から予め取得した第１の状態量と前記学習対象の動作を制御するために与えた前記第１の状態量に対応する第１の指令値と、を含む、多次元ベクトルで表されたデータ要素を複数含む時系列データに基づいた学習用データを学習することで、前記学習用データの分布構造を学習結果に基づいた第２の状態量及び第２の指令値を含む多次元ベクトルとして表されるノードの集合として作成されたモデルを保持するモデル保持部と、制御対象から取得した第３の状態量が入力データとして入力され、前記モデルに含まれる前記学習用データのデータ要素数よりも少数の前記ノードから前記入力データに一致又は近似するノードを探索する探索部と、前記探索したノードの前記第２の指令値に基づく値を、前記制御対象を操作するために与える出力指令値として前記制御対象へ出力する出力部と、を備える、情報処理装置。

【0174】

（付記２）前記モデルは、前記学習用データのそれぞれをノードとして学習することで作成され、前記探索部は、前記ノードから、前記少数の前記ノードとして、前記入力データに対して時間的に比較的近いノードを選択し、前記選択したノードから前記入力データに対して最短距離のノードを探索する、付記１に記載の情報処理装置。

【0175】

（付記３）前記モデルは、前記学習用データを時系列クラスタリングして、前記ノードを複数のクラスタに分類することで作成され、前記探索部は、前記入力データが属するクラスタと、前記入力データが属するクラスタに時間的に直後のクラスタと、を探索し、探索した２つのクラスタに属するノードから前記入力データに対して最短距離のノードを探索する、付記２に記載の情報処理装置。

【0176】

（付記４）前記探索部は、前記入力データに対して重心が最短距離にあるクラスタを前記入力データが属するクラスタとして探索する、付記３に記載の情報処理装置。

【0177】

（付記５）前記探索部は、最初に入力された入力データについては、前記最初に入力された入力データに対して重心が最短距離にあるクラスタを前記最初に入力された入力データが属するクラスタとして探索し、前記最初に入力された入力データよりも後に入力される入力データについては、１つ前に入力された入力データについて探索された最短距離のノードが属するクラスタを、前記最初に入力された入力データよりも後に入力される入力データが属するクラスタとして探索する、付記３に記載の情報処理装置。

【0178】

（付記６）前記探索部は、最初に入力された入力データについては、前記最初に入力された入力データに対して重心が最短距離にあるクラスタを前記最初に入力された入力データが属するクラスタとして探索し、前記最初に入力された入力データよりも後に入力される入力データについては、過去に入力された複数の入力データについて探索された最短距離のノードが属する複数のクラスタのうちで、出現頻度が最も高いクラスタを、前記最初に入力された入力データよりも後に入力される入力データが属するクラスタとして探索する、付記４に記載の情報処理装置。

【0179】

（付記７）前記探索部は、前記探索したノードが属するクラスタの一部又は全部のノードの指令値から算出される統計量に基づいて、前記出力指令値を決定する、付記４乃至６のいずれか一つに記載の情報処理装置。

【0180】

（付記８）前記一部のノードは、前記探索したノードが属するクラスタにおいて、前記探索したノードから所定の距離以内のノード、又は、前記探索したノードから近い順に選択された所定の個数のノードである、付記７に記載の情報処理装置。

【0181】

（付記９）前記探索部は、前記探索したノードとの指令値と、前記入力データが属するクラスタ及び前記入力データが属するクラスタに時間的に直後のクラスタのうちで前記探索したノードに近似する１つ以上のノードの指令値と、から算出される統計量に基づいて、前記出力指令値を決定する、付記４乃至６のいずれか一つに記載の情報処理装置。

【0182】

（付記１０）前記探索部は、最初に入力された入力データについては、前記最初に入力された入力データに対して重心が最短距離にあるクラスタを前記最初に入力された入力データが属するクラスタとして探索し、前記最初に入力された入力データよりも後に入力される入力データについては、１つ前に入力された入力データについて探索したノードが属するクラスタと、前記探索したノードに近似する１つ以上のノードが属するクラスタとのうちで出現頻度が最も高いクラスタを、前記最初に入力された入力データよりも後に入力される入力データが属するクラスタとして探索する、付記９に記載の情報処理装置。

【0183】

（付記１１）前記学習用データのデータ要素よりも少数のノードによって前記学習用データのデータ要素の分布構造を近似的に学習することで前記モデルを作成し、作成した前記モデルを前記モデル保持部へ出力するモデル作成部をさらに備え、前記探索部は、前記モデルに含まれる前記ノードから前記入力データに近似するノードを探索する、付記１に記載の情報処理装置。

【0184】

（付記１２）前記探索部は、前記探索したノードの指令値を、前記出力指令値として出力する、付記２乃至４及び１１のいずれか一つに記載の情報処理装置。

【0185】

（付記１３）前記探索部は、前記探索したノードとの指令値と、前記探索したノードに近似する１つ以上のノードの指令値と、から算出される統計量に基づいて、前記出力指令値を決定する、付記２乃至４及び１１のいずれか一つに記載の情報処理装置。

【0186】

（付記１４）前記探索したノードに近似する１以上のノードは、前記探索したノードから所定の距離以内のノード、又は、前記探索したノードから近い順に選択された所定の個数のノードである、付記９、１０及び１３のいずれか一つに記載の情報処理装置。

【0187】

（付記１５）前記統計量は、平均値、中央値、最大値、最小値及び最頻値のいずれかである、付記７乃至１０、１３及び１４のいずれか一つに記載の情報処理装置。

【0188】

（付記１６）前記第２の状態量は、前記学習対象から予め取得した前記第１の状態量であり、かつ、前記第２の指令値は、前記予め取得した前記第１の状態量に応じて前記学習対象に与えられた前記第１の指令値である、付記１乃至１５のいずれか一つに記載の情報処理装置。

【0189】

（付記１７）前記第１の指令値は、前記学習対象から予め取得した前記第１の状態量に基づいて前記学習対象の操作者が前記学習対象に与えた指令値の実績値である、付記１６に記載の情報処理装置。

【0190】

（付記１８）前記学習用データのデータ要素に含まれる前記第１の指令値は、前記学習対象から予め取得した前記第１の状態量に対して、所定の時間だけ後に前記制御対象に与えられた指令値である、付記１６に記載の情報処理装置。

【0191】

（付記１９）前記情報処理装置は、前記学習対象又は前記制御対象に設けられる、付記１乃至１７のいずれか一つに記載の情報処理装置。

【0192】

（付記２０）前記学習対象及び前記制御対象は同一である、付記１乃至１７のいずれか一つに記載の情報処理装置。

【0193】

（付記２１）前記情報処理装置は、前記制御対象に設けられる、付記２０に記載の情報処理装置。

【0194】

（付記２２）学習対象から予め取得した第１の状態量と前記学習対象の動作を制御するために与えた前記第１の状態量に対応する第１の指令値と、を含む、多次元ベクトルで表されたデータ要素を複数含む時系列データに基づいた学習用データを学習することで、前記学習用データの分布構造を学習結果に基づいた第２の状態量及び第２の指令値を含む多次元ベクトルとして表されるノードの集合として作成されたモデルを保持し、制御対象から取得した第３の状態量が入力データとして入力され、前記モデルに含まれる前記学習用データのデータ要素数よりも少数の前記ノードから前記入力データに一致又は近似するノードを探索し、前記探索したノードの前記第２の指令値に基づく値を、前記制御対象を操作するために与える出力指令値として前記制御対象へ出力する、情報処理方法。

【0195】

（付記２３）学習対象から予め取得した第１の状態量と前記学習対象の動作を制御するために与えた前記第１の状態量に対応する第１の指令値と、を含む、多次元ベクトルで表されたデータ要素を複数含む時系列データに基づいた学習用データを学習することで、前記学習用データの分布構造を学習結果に基づいた第２の状態量及び第２の指令値を含む多次元ベクトルとして表されるノードの集合として作成されたモデルを保持する処理と、制御対象から取得した第３の状態量が入力データとして入力され、前記モデルに含まれる前記学習用データのデータ要素数よりも少数の前記ノードから前記入力データに一致又は近似するノードを探索する処理と、前記探索したノードの前記第２の指令値に基づく値を、前記制御対象を操作するために与える出力指令値として前記制御対象へ出力する処理と、をコンピュータに実行させる、プログラム。

【0196】

（付記２４）学習対象から予め取得した第１の状態量と前記学習対象の動作を制御するために与えた前記第１の状態量に対応する第１の指令値と、を含む、多次元ベクトルで表されたデータ要素を複数含む時系列データに基づいた学習用データを学習することで、前記学習用データの分布構造を学習結果に基づいた第２の状態量及び第２の指令値を含む多次元ベクトルとして表されるノードの集合としてモデルを作成するモデル作成部と、作成された前記モデルを保持するモデル保持部と、制御対象から取得した第３の状態量が入力データとして入力され、前記モデルに含まれる前記学習用データのデータ要素数よりも少数の前記ノードから前記入力データに一致又は近似するノードを探索する探索部と、前記探索したノードの前記第２の指令値に基づく値を、前記制御対象を操作するために与える出力指令値として前記制御対象へ出力する出力部と、を備える、情報処理システム。

【0197】

以上、実施の形態を参照して本願発明を説明したが、本願発明は上記によって限定されるものではない。本願発明の構成や詳細には、発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

【0198】

この出願は、２０２１年８月１８日に出願された日本出願特願２０２１－１３３４１５を基礎とする優先権を主張し、その開示の全てをここに取り込む。

【符号の説明】

【0199】

１モデル保持部
２探索部
３出力部
４モデル作成部
５探索部
１０操作者
１１指令装置
２０操作対象装置
３０ロボット
３１ロボットアーム
３２力センサ
３３円柱ポール
４１入力情報取得手段
４２勝者ノード探索手段
４３類似度閾値算出手段
４４類似度閾値判定手段
４５ノード挿入手段
４６重みベクトル更新手段
４７ノード密度算出手段
４８分布重なり領域検出手段
４９辺接続判定手段
５０辺接続手段
５１辺削除手段
５２ノイズノード削除手段
５３出力情報表示手段
１００情報処理装置
１１０処理部
１２０表示部
１３０入力部
２００情報処理装置
１０００コンピュータ
１００１ＣＰＵ
１００２ＲＯＭ
１００３ＲＡＭ
１００４バス
１００５入出力インターフェイス
１００６入力部
１００７出力部
１００８記憶部
１００９通信部
１０１０ドライブ
１０１１磁気ディスク
１０１２光ディスク
１０１３フレキシブルディスク
１０１４半導体メモリ

【図1】