IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 深▲セン▼▲憶▼▲海▼原▲識▼科技有限公司の特許一覧

<>
  • 特許-脳型知能意思決定と運動制御システム 図1
  • 特許-脳型知能意思決定と運動制御システム 図2
  • 特許-脳型知能意思決定と運動制御システム 図3
  • 特許-脳型知能意思決定と運動制御システム 図4
  • 特許-脳型知能意思決定と運動制御システム 図5
  • 特許-脳型知能意思決定と運動制御システム 図6
  • 特許-脳型知能意思決定と運動制御システム 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-02-26
(45)【発行日】2024-03-05
(54)【発明の名称】脳型知能意思決定と運動制御システム
(51)【国際特許分類】
   B25J 13/00 20060101AFI20240227BHJP
【FI】
B25J13/00 Z
【請求項の数】 17
(21)【出願番号】P 2022508557
(86)(22)【出願日】2020-08-12
(65)【公表番号】
(43)【公表日】2022-10-06
(86)【国際出願番号】 CN2020108678
(87)【国際公開番号】W WO2021027845
(87)【国際公開日】2021-02-18
【審査請求日】2022-02-09
(31)【優先権主張番号】201910738132.7
(32)【優先日】2019-08-12
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】522004601
【氏名又は名称】深▲セン▼▲憶▼▲海▼原▲識▼科技有限公司
(74)【代理人】
【識別番号】100108453
【弁理士】
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100110364
【弁理士】
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133400
【弁理士】
【氏名又は名称】阿部 達彦
(72)【発明者】
【氏名】任 化▲龍▼
【審査官】杉山 悟史
(56)【参考文献】
【文献】中国特許出願公開第106796665(CN,A)
【文献】中国特許出願公開第106027300(CN,A)
【文献】中国特許出願公開第110000781(CN,A)
【文献】中国特許出願公開第110013312(CN,A)
【文献】米国特許出願公開第2007/0255454(US,A1)
【文献】米国特許出願公開第2015/0298315(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
B25J 1/00 ~ 21/02
(57)【特許請求の範囲】
【請求項1】
脳型知能意思決定と運動制御システムであって、
自発意思決定モジュール、自動意思決定モジュール、評価モジュール、記憶モジュール、感知モジュール、複合制御モジュール、入力チャネルモジュール、出力チャネルモジュール、及び制御対象モジュールを有し、
前記自発意思決定モジュールは、前記感知モジュールにより伝達された感知情報、及び前記記憶モジュールにより伝達された記憶情報を総合し、且つ意思決定規則を踏まえて、目標と操作を自発的に選択し、前記複合制御モジュールが精密操作を実行するようガイドし、前記入力チャネルモジュールと前記出力チャネルモジュールを制御し、
前記自動意思決定モジュールは、前記自発意思決定モジュールの計算タスクが重すぎるとき、又はシステムが迅速に反応する必要があるとき、経験価値、感知情報、及び記憶情報に基づいて、目標と実行が必要な操作とを自動的に選択し、且つ前記複合制御モジュールが操作を実行するようガイドし、前記自発意思決定モジュールに協働して総合的な意思決定を行い、
前記評価モジュールは、システムの内部環境又は外部環境のフィードバックに基づいて、目標の実際価値と実行される操作の実際効果値を評価し、且つ予測誤差値を前記自発意思決定モジュール、自動意思決定モジュール、及び複合制御モジュールにフィードバックし、
前記記憶モジュールは、システム内部状態の履歴情報、及び環境の履歴情報をコーディングし、且つ記憶情報として記録し、且つ記憶情報を前記自発意思決定モジュール及び前記自動意思決定モジュールに伝達することで、意思決定過程を補助し、記憶情報を前記複合制御モジュールに伝達することで、動作シーケンスの選択と実行に影響を与え、
前記感知モジュールは、センサからの情報を感知情報として処理し、且つ感知情報を前記自発意思決定モジュール、自動意思決定モジュール、評価モジュール、記憶モジュール、総合制御モジュールに伝達し、前記感知情報は、動画情報、音声情報、力フィードバック情報、温度情報、触感情報、関節角度、角速度、角加速度情報、変位、速度、加速度情報、及び姿勢とバランス情報のうちの少なくとも1つを有し、
前記複合制御モジュールは、複数の基本制御ユニットを有し、各基本制御ユニットは、複数のニューロンを有し、ここで、少なくとも1つのニューロンは、前記自発意思決定モジュールからの入力を受信し、少なくとも1つのニューロンは、前記基本制御ユニットに位置する1つ以上のニューロンとともに単方向結合、又は双方向の興奮性結合、又は抑制性結合を形成し、少なくとも1つのニューロンは、その他の基本制御ユニットに位置する1つ以上のニューロンとともに単方向結合、又は双方向の興奮性結合、又は抑制性結合を形成し、少なくとも1つのニューロンは、前記出力チャネルモジュール、又は評価モジュールに結合され、ここでの複数の結合は、シナプス可塑性プロセスにより1つ以上の動作シーケンスを学習、記憶、コーディング、精密制御、予測、又は実行し、且つ自発意思決定モジュールに協働して複数の動作シーケンスにおいて選択又は総合して実行し、
前記入力チャネルモジュールは、前記感知モジュールにより伝達された感知情報を変換し、中継し、増幅し、且つそれぞれ前記自発意思決定モジュール、自動意思決定モジュール、及び複合制御モジュールに出力し、前記入力チャネルモジュールは、前記自発意思決定モジュールの制御信号の入力を受信して信号中継の増幅倍数を調整し、
前記出力チャネルモジュールは、前記複合制御モジュールの出力信号を変換し、中継し、増幅し、且つ受信対象モジュールに伝導し、前記出力チャネルモジュールは、前記自発意思決定モジュールの制御信号の入力を受信して信号中継の増幅倍数を調整し、
前記制御対象モジュールは、1つ以上のアクチュエータを有することを特徴とする脳型知能意思決定と運動制御システム。
【請求項2】
前記自発意思決定モジュールは、目標集合、目標-操作-効果集合、及び意思決定規則集合を有し、
前記目標集合は、現れた各目標、及びその総合価値と逼迫値を記録し、現れていない目標について、その総合価値を第1の予め設定された価値に設定することで好奇心を示し、
前記目標-操作-効果集合は、各目標での実行可能な操作、及びこの状況での各操作の総合効果値を記録し、
前記意思決定規則集合は、ユーザ定義の意思決定規則とシステムが新たに学習した意思決定規則を記録し、意思決定規則は、システムが目標、及び操作を如何に選択するかを規定し、
前記自発意思決定モジュールが目標を選択した後、前記目標、及びその総合価値を評価モジュールに伝達してから、目標-操作-効果集合から操作を選択し、
自動意思決定モジュールがその選択した目標、及び操作を送信する場合、自発意思決定モジュールは、それを自己が選択した目標と操作と重み付けして最終的な意思決定を形成し、
自発意思決定モジュールがある操作を実行することを最終的に決定した後、前記操作、及びその総合効果値を評価モジュールに伝達してから、前記操作をパルスシーケンス信号で、自発起動制御通路、及び自発停止制御通路により複合制御モジュールに伝達し、
前記自発意思決定モジュールは、前記評価モジュールから伝達してきた目標を受信すると、対応する目標の現在の総合価値に予測誤差値を加えて、更新された総合価値を得て、且つ目標集合へ更新するか、あるいは、前記評価モジュールから伝達してきた操作の予測誤差値を受信すると、対応する操作の現在の総合効果値に予測誤差値を加えて、更新された総合効果値を得て、且つ目標-操作-効果集合へ更新することを特徴とする請求項1に記載の脳型知能意思決定と運動制御システム。
【請求項3】
前記自発意思決定モジュールが目標を選択する意思決定規則は、
現れた1つ以上の目標において総合価値と逼迫値の重み付けが最大の目標を選択すること、現れた1つ以上の目標において任務に最も関係し、しかも意思決定規則に矛盾しない目標を選択すること、現れた1つ以上の目標において最も顕著な目標を選択すること、自動意思決定モジュールに引き渡して自動的に目標を選択すること、ランダムに目標を選択すること、現れていない仮想目標を選択すること、現れた目標を無視し、直接操作選択過程に入ることのうちの1つ以上を含み、
操作を選択する意思決定規則は、
目標-操作-効果集合において、選択された目標に対応する総合効果値が最大の操作を選択すること、試行錯誤学習し、且つランダムに操作を選択すること、模倣学習し、且つ複合制御モジュールを自発的に監督することにより新しい動作シーケンスを実行すること、動作を取得せず、且つ待機すること、自動意思決定モジュールに引き渡して自動的に操作を選択すること、動作を予測学習し、且つリハーサルするが、動作を実際には実行することなく、その動作の効果値を予測すること、のうちの1つ以上を有することを特徴とする請求項2に記載の脳型知能意思決定と運動制御システム。
【請求項4】
前記自動意思決定モジュールは、目標集合、及び目標-操作-効果集合を有し、
前記目標集合は、現れた各目標、及びその経験価値を記録し、現れていない目標について、その経験価値を第2の予め設定された価値に設定し、
前記目標-操作-効果集合は、各目標の採用可能な予め設定された操作、及びその経験効果値を記録し、
自動意思決定モジュールは、現在現れる1つ以上の目標において経験価値が最大の目標を自動で選択し、且つ前記目標とその経験価値を評価モジュールに伝達し、目標-操作-効果集合からこの目標に対応する各予め設定された操作における経験効果値が最大のものを選択し、且つ前記操作、及びその経験効果値を評価モジュールに伝達し、
自動意思決定モジュールは、選択した目標と操作を自発意思決定モジュールに送信してコンセンサスを形成し、自発意思決定モジュールが遅延又は否決しない場合、自動意思決定モジュールは直ちに、前記操作をパルスシーケンス信号で自動起動制御通路、及び自動停止制御通路により複合制御モジュールに伝達し、自発意思決定モジュールが否決する場合、その最終的な意思決定を基準とし、自発意思決定モジュールと自動意思決定モジュールは、各自が選択した操作を複合制御モジュールに伝達し、複合制御モジュールは、2つの操作を総合し、
前記自動意思決定モジュールは、前記評価モジュールにより伝達された目標を受信すると、対応する目標の現在の経験価値に予測誤差値を加えて、更新された経験価値を取得し、且つ目標集合へ更新するか、あるいは、前記評価モジュールにより伝達された操作の予測誤差値信号を受信すると、対応する操作の現在の経験効果値に予測誤差値を加えて、経験効果値を取得し、且つ目標-操作-効果集合へ更新することを特徴とする請求項1に記載の脳型知能意思決定と運動制御システム。
【請求項5】
前記評価モジュールは、キャッシュ、及び評価規則集合を有し、
自発意思決定モジュールからある目標とその経験価値、又はある操作とその総合効果値を伝達してくると、評価モジュールは、それらをキャッシュし、システムがフィードバック又は結果を取得したとき、評価モジュールは、評価規則に基づいて、目標の実際価値又は操作の実際効果値を評価し、且つキャッシュされた目標の総合価値を目標の実際価値から引くか、又は操作の総合効果値を操作の実際効果値から引いて、目標の予測誤差値又は操作の予測誤差値を取得し、予測誤差値を自発意思決定モジュールに伝達してそれに記憶される対応する目標の総合価値又は対応する操作の総合効果値を修正し、
自動意思決定モジュールからある目標とその経験価値、又はある操作とその総合効果値を伝達してくると、評価モジュールは、それらをキャッシュし、システムがフィードバック又は結果を取得したとき、評価モジュールは、評価規則に基づいて、目標の実際価値又は操作の実際効果値を評価し、且つキャッシュされた目標の経験価値を目標の実際価値から引くか、又は操作の経験効果値を操作の実際効果値から引いて、目標の予測誤差値又は操作の予測誤差値を取得し、予測誤差値を自動意思決定モジュールに伝達してそれに記憶される対応する目標の経験価値又は対応する操作の経験効果値を修正し、
前記評価モジュールはまた、予測誤差値を複合制御モジュールに伝達してそのコーディングされた動作シーケンス、及びその予測効果値を修正することを特徴とする請求項1に記載の脳型知能意思決定と運動制御システム。
【請求項6】
前記アクチュエータは、1つ以上のモータ、油圧素子、空気圧素子、又は人工筋肉として構成され、各アクチュエータは、前記出力チャネルモジュールにより1つ以上の基本制御ユニットに結合されて少なくとも1つのメタ動作を実行し、アクチュエータをそれぞれ前記出力チャネルモジュールにより1つ以上の異なる基本制御ユニットに結合して拮抗型制御を構成することを特徴とする請求項1に記載の脳型知能意思決定と運動制御システム。
【請求項7】
前記基本制御ユニットは、自発制御層、運動コーディング層、脱抑制層、及び中継層を有し、
前記自発制御層は、起動ニューロン、及び停止ニューロンを有し、
前記運動コーディング層は、動作起動コーディングニューロン、及び動作停止コーディングニューロンを有し、
前記脱抑制層は、脱抑制起動ニューロン、及び脱抑制停止ニューロンを有し、
前記中継層は、中継起動ニューロン、及び中継停止ニューロンを有し、
前記自発制御層において、前記起動ニューロンは、前記自発意思決定モジュールからの自発起動信号、及び前記中継起動ニューロンの興奮性結合を受信し、前記停止ニューロンは、前記自発意思決定モジュールからの自発停止信号を受信し、それらは、それぞれ入力信号を総合し、且つパルス信号にコーディングして前記運動コーディング層に対応するニューロンへ出力し、
前記運動コーディング層において、前記動作起動コーディングニューロンは、前記起動ニューロンの興奮性入力を受信し、前記動作停止コーディングニューロンは、前記停止ニューロンの興奮性入力を受信し、このほか、それらはさらにいずれも前記記憶モジュール、感知モジュール、評価モジュールからの入力を受信し、それらは、それぞれすべての入力情報を総合し、パルス信号を生成し、ひいては脱抑制層に対応するニューロンのパルス放出周波数と位相を調節し、
同一の基本制御ユニット内の動作起動コーディングニューロンと動作停止コーディングニューロンとの間は双方向抑制性結合を有し、シナプス荷重により前記基本制御ユニットに対応するメタ動作の相対的な動作強度と相対的な持続時間をコーディングし、
複数の基本制御ユニットにおける動作起動コーディングニューロンの互いの間は、双方向抑制性結合を有し、シナプス荷重により動作シーケンスにおける各メタ動作を実行する前後順序をコーディングし、
異なる基本制御ユニット内からの動作起動コーディングニューロンと動作停止コーディングニューロンとの間は双方向抑制性結合を有し、シナプス荷重により動作シーケンスにおける各メタ動作の相対的な起動時間と相対的な停止時間をコーディングし、
前記脱抑制層において、前記脱抑制起動ニューロンは、前記動作起動コーディングニューロンの抑制性入力信号、前記脱抑制停止ニューロンの抑制性入力信号、及び前記中継停止ニューロンの興奮性入力信号を受信し、且つすべての入力信号を総合し、パルス信号を生成し、抑制性結合により前記中継起動ニューロンのパルス放出周波数と位相を調節し、前記脱抑制停止ニューロンは、前記動作停止コーディングニューロンの抑制性入力信号、及び前記中継停止ニューロンの興奮性入力信号を受信し、且つすべての入力信号を総合し、パルス信号を生成し、抑制性結合により前記中継停止ニューロンのパルス放出周波数と位相を調節し、
前記中継層において、前記中継起動ニューロンは、前記脱抑制起動ニューロンの抑制性入力信号を受信し、且つ前記起動ニューロンの興奮性結合に投射することにより、動作実行を促すポジティブフィードバック閉ループを形成し、前記中継停止ニューロンは、前記停止ニューロンの興奮性入力信号、及び前記脱抑制停止ニューロンの抑制性入力信号を受信し、且つすべての入力信号を総合し、パルス信号を生成し、且つ興奮性結合により前記脱抑制起動ニューロンに投射することにより、動作の実行を抑制する通路を形成し、
前記起動ニューロン、停止ニューロン、動作起動コーディングニューロン、動作停止コーディングニューロン、脱抑制起動ニューロン、脱抑制停止ニューロン、中継起動ニューロン、及び中継停止ニューロン、又はそれらのうち少なくとも1つのニューロンは基本制御ユニットの出力であることを特徴とする請求項1に記載の脳型知能意思決定と運動制御システム。
【請求項8】
前記基本制御ユニットは、出力結合方式に基づいて、出力型基本制御ユニットと予測型基本制御ユニットの2つのサブタイプに分けられ、
前記出力型基本制御ユニットの出力は、出力チャネルモジュールに接続されることで、アクチュエータを駆動し、
前記予測型基本制御ユニットの出力は、評価モジュールに接続されることで動作シーケンスの予測効果値を予測して実際には実行しないことを特徴とする請求項1又は7に記載の脳型知能意思決定と運動制御システム。
【請求項9】
前記複合制御モジュールは、1つ以上の補助制御ユニットをさらに有し、
前記補助制御ユニットは、自発選択信号の入力端、自発選択解除信号の入力端、側抑制脱抑制ニューロン、及び迅速自励型抑制ニューロンを有し、
1つ以上の基本制御ユニットは少なくとも1つの組を形成するように構成され、前記少なくとも1つの組の基本制御ユニットは、1つの動作シーケンスをコーディングし、
各基本制御ユニットの動作起動コーディングニューロン、及び動作停止コーディングニューロンはそれぞれ1つの側抑制脱抑制ニューロンに結合し、
各組の基本制御ユニットは、1つ以上の迅速自励型抑制ニューロンを共有し、
前記側抑制脱抑制ニューロンは、自発選択信号の入力、及び所属する基本制御ユニットの運動コーディング層のニューロンの入力を総合し、パルス信号を生成し、且つ抑制性結合によりその他の組の基本制御ユニットの迅速自励型抑制ニューロンへ出力し、
前記迅速自励型抑制ニューロンは、自発選択解除信号の入力、及びそれぞれ隣接する組の基本制御ユニットの側抑制脱抑制ニューロンの入力を総合し、パルス信号を生成し、且つ抑制性結合により所属する基本制御ユニット組の各運動制御層のニューロンへ出力し、
前記自発選択信号の入力端は、自発意思決定モジュールの入力を受信して特定動作シーケンスを自発的に選択して実行に備え、
前記自発選択解除信号の入力端は、自発意思決定モジュールの入力を受信して特定動作シーケンスの実行を自発的に抑制することを特徴とする請求項1に記載の脳型知能意思決定と運動制御システム。
【請求項10】
前記起動ニューロン、停止ニューロン、動作起動コーディングニューロン、動作停止コーディングニューロンは、パルスニューロンであり、
前記脱抑制起動ニューロン、脱抑制停止ニューロン、中継起動ニューロン、中継停止ニューロン、側抑制脱抑制ニューロン、迅速自励型抑制ニューロンは、自励型パルスニューロンであることを特徴とする請求項7に記載の脳型知能意思決定と運動制御システム。
【請求項11】
前記自励型パルスニューロンの動作モードは、
入力信号がなく、又は入力信号の合計がゼロの場合、前記自励型パルスニューロンは自動的に第1の予め設定された周波数で放出し、
入力信号の合計が正の値である場合、前記自励型パルスニューロンの放出周波数は上昇し、しかも合計が大きいほど、放出周波数は高く、第1の予め設定された周波数の上限までであり、逆もまた同様であり、
入力信号の合計が負の値の場合、前記自励型パルスニューロンの放出周波数は低下し、しかも合計の絶対値が大きいほど、放出周波数は低く、放出を停止するまでであり、逆もまた同様であることであることを特徴とする請求項10に記載の脳型知能意思決定と運動制御システム。
【請求項12】
前記基本制御ユニットは、自発起動制御通路、自発停止制御通路、自動起動制御通路、自動停止制御通路、及び競合選択制御通路の5つの制御通路を有し、
前記自発起動制御通路は、所属する基本制御ユニットの起動ニューロン、動作起動コーディングニューロン、脱抑制起動ニューロン、中継起動ニューロン、及びその間の結合からなり、前記基本制御ユニットがコーディングするメタ動作を発動し、且つ持続して実行するためのものであり、
前記自発停止制御通路は、所属する基本制御ユニットの停止ニューロン、動作停止コーディングニューロン、脱抑制停止ニューロン、中継停止ニューロン、脱抑制起動ニューロン、及びその間の結合からなり、前記基本制御ユニットがコーディングするメタ動作を抑制し、停止するためのものであり、
前記自動起動制御通路は、自動意思決定モジュールの自動起動信号の出力端、所属する基本制御ユニットの脱抑制起動ニューロン、及びその間の結合からなり、自動選択するメタ動作を発動し、且つ実行するためのものであり、
前記自動停止制御通路は、自動意思決定モジュールの自動停止信号の出力端、所属する基本制御ユニットの脱抑制停止ニューロン、及びその間の結合からなり、自動選択するメタ動作を抑制し、且つ停止するためのものであり、
前記競合選択制御通路は、所属する基本制御ユニットの起動ニューロン、中継停止ニューロン、1つ以上の競合する基本制御ユニットの脱抑制起動ニューロン、及びその間の結合からなり、複数の候補のメタ動作の間で互いの競合により優れたメタ動作を選択して実行するためのものであることを特徴とする請求項7に記載の脳型知能意思決定と運動制御システム。
【請求項13】
前記複合制御モジュールは、自発監督モード、自動モード、フィードバック駆動モードの3つの動作モードをサポートし、
前記自発監督モードは、自発意思決定モジュールにより動作シーケンスを如何にして実行するかを決定し、且つティーチングを提供し、複合制御モジュールに新しい動作シーケンスを学習させるか、又は既存の動作シーケンスを更新して調整させ、自発監督モードでは、動作シーケンスの順序ごとの実行は主に、自発意思決定モジュールにより駆動され、
前記自発意思決定モジュールは、動作シーケンスにおける各時刻にどのメタ動作を実行すべきか又は停止すべきか、及び各メタ動作の強度を提供し、且つ自発起動信号及び自発停止信号を、それぞれ対応する基本制御ユニットの起動ニューロン及び停止ニューロンへ入力し、
前記自動モードにおいて、自発意思決定モジュールの関与がない、若しくは少ない場合、又は自動意思決定モジュールが初期メタ動作を提供する場合、複合制御モジュールは動作シーケンスの順序ごとの実行を自動で完了し、自動モードでは、動作シーケンスの順序ごとの実行は主に、複数の基本制御ユニットの運動コーディング層のニューロンの互いの間の結合により駆動され、自発意思決定モジュール又は自動意思決定モジュールは、動作シーケンスにおけるあるメタ動作を起点として提供し、且つ自発起動制御通路又は自動起動制御通路により起点信号を提供するだけで、動作シーケンスの残りの部分を、動作シーケンスが終了するまで自動的に順序ごとに実行し、
前記フィードバック駆動モードは、フィードバックにより動作を調整し、システムを外部環境に自動で適応させ、フィードバック駆動モードでは、動作又は動作シーケンスの実行はさらに、フィードバック信号により駆動され、評価モジュールは、フィードバック信号を複合制御モジュールの運動コーディング層のニューロンへ入力し、システムが奨励されると、フィードバック信号は、動作起動コーディングニューロンが第1の予め設定された興奮性入力バイアスを得るようにし、且つ動作停止コーディングニューロンが第1の予め設定された抑制性入力バイアスを得るようにし、これにより動作がさらに発生しやすくなり、又は現在の動作の幅、力がさらに大きくなるとともに持続時間がさらに長くなり、システムがペナルティを受けると、フィードバック信号は、動作起動コーディングニューロンが第2の予め設定された抑制性入力バイアスを得るようにし、且つ動作停止コーディングニューロンが第2の予め設定された興奮性入力バイアスを得るようにし、これにより動作がさらに発生しにくくなるか、又は現在の動作の幅、力が小さくなるか、さらには事前に終了するようになり、
前記3つの動作モードはそれぞれ独立して動作するか、又は連携して動作することを特徴とする請求項1又は7又は12に記載の脳型知能意思決定と運動制御システム。
【請求項14】
前記自発制御層のニューロンと運動コーディング層のニューロンの数の比率関係は1:Nに構成され、Nは1以上の有理数であり、各自発制御層のニューロンは、1つ以上の運動コーディング層のニューロンに結合するよう構成され、各結合のシナプス可塑性プロセスにより前記結合に上流、下流ニューロンの放出状況に基づいて、シナプス荷重を調節させ、運動コーディング層のニューロンが各メタ動作に自動で対応するようになり、ニューロン群のコーディングを実現することを特徴とする請求項7に記載の脳型知能意思決定と運動制御システム。
【請求項15】
前記自発制御層のニューロンと運動コーディング層のニューロンとの間の結合のシナプス可塑性プロセスは、評価モジュールにより伝達される誤差フィードバック信号により変調され、
前記変調の過程は、
誤差フィードバック値が正の値の場合、起動ニューロンは、動作起動コーディングニューロンのシナプスに結合され、その長期増強作用は誤差フィードバック値と正の相関を示し、一方、長期抑制作用は、誤差フィードバック値と負の相関を示し、停止ニューロンは、動作停止コーディングニューロンのシナプスに結合され、その長期増強作用は、誤差フィードバック値と負の相関を示し、一方、その長期抑制作用は、誤差フィードバック値と正の相関を示す過程と、
誤差フィードバック値が負の値の場合、起動ニューロンは、動作起動コーディングニューロンのシナプスに結合され、その長期増強作用は誤差フィードバック値の絶対値と負の相関を示し、一方、長期抑制作用は、誤差フィードバック値の絶対値と正の相関を示し、停止ニューロンは、動作停止コーディングニューロンのシナプスに結合され、その長期増強作用は、誤差フィードバック値の絶対値と正の相関を示し、一方、その長期抑制作用は、誤差フィードバック値の絶対値と負の相関を示す過程と、
誤差フィードバック値がゼロの場合、自発制御層のニューロンと運動コーディング層のニューロンとの間の結合のシナプス可塑性プロセスの重み調整係数又は重み変更量を、第1の予め設定された値に維持し、複合制御モジュールが実行を反復するとき、又は既存の動作シーケンスをリハーサルするとき、強固な結合関係を緩め、既存の動作シーケンスの変形及び過度に速い忘却の少なくとも1つを防止する過程と、のうち少なくとも1つの過程を含むことを特徴とする請求項7に記載の脳型知能意思決定と運動制御システム。
【請求項16】
前記各基本制御ユニットの動作起動コーディングニューロンの互いの間の抑制性結合は、反ヘッブ非対称遅延シナプス可塑性プロセスで重みを調整し、
前記反ヘッブ非対称遅延シナプス可塑性プロセスの動作過程は、
各シナプスはLTD累積ポテンシャルエネルギー及びLTP累積ポテンシャルエネルギーを有し、且つゼロに初期化される第1工程と、
あるニューロンが励起されると、その後の充分短い時間ウィンドウ内にその下流のニューロンも励起されれば、両者の間のシナプスのLTD累積ポテンシャルエネルギーは増加し、且つ増加量は両者のパルス放出時間間隔と負の相関をなし、そうでなければ、LTP累積ポテンシャルエネルギーの絶対値は第1の予め設定された定数を増加する第2工程と、
LTD累積ポテンシャルエネルギー、及びLTP累積ポテンシャルエネルギーはそれぞれ時間の流れとともに徐々にゼロリセットまで減衰する第3工程と、
誤差フィードバック値が正の値の場合、各シナプスのLTD累積ポテンシャルエネルギーはLTP累積ポテンシャルエネルギーと重み付けされ、且つ誤差フィードバック値を掛け、シナプス荷重に重ね合わせ、その後、LTD累積ポテンシャルエネルギー、及びLTP累積ポテンシャルエネルギーをいずれもゼロリセットする第4工程と、
誤差フィードバック値が負の値の場合、各シナプスのLTD累積ポテンシャルエネルギーはLTP累積ポテンシャルエネルギーと重み付けされ、且つ誤差フィードバック値の絶対値を掛け、シナプス荷重に重ね合わせ、その後、LTD累積ポテンシャルエネルギー、及びLTP累積ポテンシャルエネルギーをいずれもゼロリセットする第5工程と、を有し、
前記動作過程の第1工程は、システム初期化時に行われ、
前記動作過程の第2から5工程は、任意の順序に沿って行われ、且つ繰り返すことができることを特徴とする請求項7に記載の脳型知能意思決定と運動制御システム。
【請求項17】
前記中継層のニューロンと自発制御層のニューロンの数の比率関係は1:Nに構成され、Nは正の有理数であり、しかも各中継層のニューロンは、1つ以上の自発制御層のニューロンに結合するよう構成され、各結合のシナプス可塑性プロセスにより前記結合に上流、下流ニューロンの放出状況に基づいて、シナプス荷重を調節させ、中継層のニューロンが各メタ動作に自動で対応するようになり、ニューロン群のコーディングを実現することを特徴とする請求項7に記載の脳型知能意思決定と運動制御システム。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、2019年8月12日に中国特許局において出願された、出願番号201910738132.7号、発明の名称「脳型知能意思決定と運動制御システム」の中国特許出願の優先権を主張し、そのすべての内容は、引用により本出願に援用される。
【0002】
本出願は人工知能、脳型知能ニューラルネットワーク、及びロボット運動制御分野に関し、具体的には、脳型知能意思決定と運動制御システムに関する。
【背景技術】
【0003】
ロボット手部(ロボットハンド)がカメラに協働して複雑な物体を操作すること、及びロボットの両足、多足の走行と運動の均衡が保たれることは、複雑な操作能力を有するサービス型ロボットが工業分野や家庭で実用化されるための二つの重要な技術要素である。このタイプのロボットシステムの自由度数は通常高く、運動計画と運動制御という課題は非常に複雑である。その原因は多岐にわたるが、第1に、自由度数が高いシステムは、逆運動学を用いて運動軌跡を解決することが難しく、その演算複雑度が高く、且つ解決が唯一ではないことである。従って、ロボットは、可能な動作シーケンス空間内において適切な操作を選択し、且つ総合して実行する必要がある。第2に、ロボットは、環境とインタラクティブする過程において一連の適切な目標と操作を自主的に意思決定して選択し、且つフィードバックに基づいて調整する必要がある。しかも意思決定の制定と操作の実行は、システム内部の状態、外部環境情報、及び履歴情報と有機的に結合するものとし、ロボットはまた、試行錯誤、模倣、ティーチングにより既存の操作を調整し、新しい操作を学習できることで、複雑で変化の多い任務や環境に適応するものとする。第3に、ロボットは、動作シーケンスの任意のサブ動作/メタ動作から実行を開始できるものとし、各サブ動作/メタ動作を選択し、切り替え、精密制御できることで、任務の異なる初期状態から実行を開始し、且つフレキシブルに操作対象の変化や干渉に適応するものとする。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本出願の実施例の目的の1つは、脳型知能意思決定と運動制御システムを提供することであり、ロボットが環境とインタラクティブする過程において環境情報と記憶情報を効果的に結合して自主的に意思決定して目標を選択できず、操作(すなわち、動作シーケンス)をフレキシブルに選択し、総合し、実行できず、及びそのうちの各サブ動作/メタ動作を精密に制御できず、ロボットが任務の異なる初期状態から実行を開始し、且つフレキシブルに操作対象の変化や干渉に適応することをサポートできず、ロボットが自発的な試行錯誤学習、又は模倣学習により新しい動作と運動軌跡を把握することを効果的にサポートできないという課題を解決するためのものである。
【課題を解決するための手段】
【0005】
上述の技術的課題を解決するために、本出願の実施例が採用する技術的解決手段は以下のとおりである。
【0006】
脳型知能意思決定と運動制御システムであり、前記システムは、自発意思決定モジュール、自動意思決定モジュール、評価モジュール、記憶モジュール、感知モジュール、複合制御モジュール、入力チャネルモジュール、出力チャネルモジュール、及び制御対象モジュールを有する。
【0007】
前記自発意思決定モジュールは、前記感知モジュールにより伝達された感知情報、及び前記記憶モジュールにより伝達された記憶情報を総合し、且つ意思決定規則を踏まえて、目標と操作を自発的に選択し、前記複合制御モジュールが精密操作を実行するようガイドし、前記入力チャネルモジュールと前記出力チャネルモジュールを制御する。
【0008】
前記自動意思決定モジュールは、前記自発意思決定モジュールの計算タスクが重すぎ、又はシステムが迅速に反応する必要があるとき、経験価値、及び感知情報と記憶情報に基づいて、目標、及び実行が必要な操作を自動的に選択し、且つ前記複合制御モジュールが操作を実行するようガイドし、前記自発意思決定モジュールに協働して総合的な意思決定を行う。
【0009】
前記評価モジュールは、システム内部、又は外部環境のフィードバックに基づいて、目標の実際価値と実行される操作の実際効果値を評価し、且つ予測誤差値を前記自発意思決定モジュール、自動意思決定モジュール、及び/又は複合制御モジュールにフィードバックする。
【0010】
前記記憶モジュールは、システム内部状態の履歴情報、及び環境の履歴情報をコーディングし、且つ記憶情報として記録し、且つ記憶情報を前記自発意思決定モジュール、及び/又は前記自動意思モジュールに伝達することで、意思決定過程を補助し、記憶情報を前記複合制御モジュールに伝達することで、動作シーケンスの選択と実行に影響を与える。
【0011】
前記感知モジュールは、センサからの情報を感知情報として処理し、且つ感知情報を前記自発意思決定モジュール、自動意思決定モジュール、評価モジュール、記憶モジュール、総合制御モジュールに伝達し、前記感知情報は、動画情報、音声情報、力フィードバック情報、温度情報、触感情報、関節角度、角速度、角加速度情報、変位、速度、加速度情報、及び/又は姿勢とバランス情報を有する。
【0012】
前記複合制御モジュールは、複数の基本制御ユニットを有し、各基本制御ユニットは複数のニューロンを有し、ここで、少なくとも1つのニューロンは、前記自発意思決定モジュールからの入力を受信し、少なくとも1つのニューロンは、この基本制御ユニットに位置する1つ又は複数のニューロンと単方向、又は双方向の興奮性、又は抑制性結合を形成し、少なくとも1つのニューロンは、その他の基本制御ユニットに位置する1つ又は複数のニューロンと単方向、又は双方向の興奮性、又は抑制性結合を形成し、少なくとも1つのニューロンは、前記出力チャネルモジュール、又は前記評価モジュールに結合され、ここでの複数の結合は、シナプス可塑性プロセスにより1つ又は複数の動作シーケンスを学習、記憶、コーディング、精密制御、予測、又は実行し、且つ自発意思決定モジュールに協働して複数の可能な動作シーケンスにおいて優れたものを選択し、又は総合して実行する。
【0013】
前記入力チャネルモジュールは、前記感知モジュールにより伝達された感知情報を変換し、中継し、増幅し、且つそれぞれ前記意思決定モジュール、及び/又は複合制御モジュールに出力し、前記入力チャネルモジュールは、前記自発意思決定モジュールの制御信号の入力を受信して信号中継の増幅倍数を調整する。
【0014】
前記出力チャネルモジュールは、前記複合制御モジュールの出力信号を変換し、中継し、増幅し、且つ前記受信対象モジュールに伝導し、前記出力チャネルモジュールは、前記自発意思決定モジュールの制御信号の入力を受信して信号中継の増幅倍数を調整する。
【0015】
前記制御対象モジュールは、1つ又は複数のアクチュエータを有する。
【0016】
上述の技術的解決手段により、従来技術と比較して以下のことがわかる。本出願は、脳型知能意思決定と運動制御システムを提供し、このシステムは、自発意思決定モジュールと自動意思決定モジュールを提供し、マルチモーダル感知情報、記憶情報、及び意思決定規則を結合して総合的に意思決定できるだけでなく、経験情報を主として、少ない感知情報と記憶情報を結合して迅速に意思決定することもできる。しかも自発意思決定モジュールと自動意思決定モジュールは、コンセンサスを形成でき、且つ評価モジュールが環境から得るフィードバックにより、システムの目標と操作に対する予測を調整し、試行錯誤、模倣、ティーチングにより新しい操作を学習し、ロボットシステムが複雑で変化が多い任務と環境により適応できるようになる。このシステムにより提供される複合制御モジュールは、複数の動作シーケンスを選択し、総合し、実行できるだけでなく、動作シーケンスにおける任意のメタ動作から実行を開始でき、またメタ動作に対する選択、精密制御、及び実行を実現でき、ロボットシステムが任務の異なる初期状態から実行を始め、且つフレキシブルに操作対象の変化と干渉に適応できることをサポートする。このシステムは、特に、多自由度ロボットの運動計画と制御、ロボットハンドとカメラの協働操作、二足又は多足ロボットの走行とバランス、及びマルチアクチュエータの拮抗型制御などのシーンに適用される。
【0017】
本発明の実施例の技術的解決手段をさらにはっきりと説明するために、次に実施例、又は例示的な技術の説明において使用されることが必要な図面を簡単に説明するが、次の説明における図面は、本発明のいくつかの実施例に過ぎず、当業者は、創造的な労働をしない前提で、これらの図面に基づいて、その他の図面をさらに取得できることは自明である。
【図面の簡単な説明】
【0018】
図1】本出願により提供される脳型知能意思決定と運動制御システムの全体フレーム概略図である。
図2】本出願の実施例における脳型知能意思決定と運動制御システムの基本制御ユニットの概略図である。
図3】本出願の実施例における脳型知能意思決定と運動制御システムの出力型基本制御ユニットの概略図である。
図4】本出願の実施例における脳型知能意思決定と運動制御システムの予測型基本制御ユニットの概略図である。
図5】本出願の実施例における脳型知能意思決定と運動制御システムの補助制御ユニットの概略図である。
図6】本出願の実施例における脳型知能意思決定と運動制御システムの各動作起動コーディングニューロンの相互結合概略図である。
図7】本出願の実施例における脳型知能意思決定と運動制御システムの反ヘッブ非対称遅延シナプス可塑性プロセスの概略図である。
【発明を実施するための形態】
【0019】
本出願の目的、技術的解決手段、及び利点をさらにはっきりと明白にするために、以下に図面、及び実施例を踏まえて、本出願を詳細に説明する。ここで説明される具体的な実施例は、本出願を解釈するためのものであるに過ぎず、本出願を限定するためのものではないことを理解するものとする。
【0020】
本出願の技術的解決手段を説明するために、以下に具体的な図面、及び実施例を踏まえて詳細に説明する。
【0021】
図1を参照し、本出願の実施例は、脳型知能意思決定と運動制御システムを開示し、このシステムは、自発意思決定モジュール1、自動意思決定モジュール2、評価モジュール3、記憶モジュール4、感知モジュール5、複合制御モジュール6、入力チャネルモジュール7、出力チャネルモジュール8、及び制御対象モジュール9を有する。
【0022】
前記自発意思決定モジュール1は、前記感知モジュール5により伝達された感知情報、及び前記記憶モジュール4により伝達された記憶情報を総合し、且つ意思決定規則を踏まえて、目標と操作を自発的に選択し、前記複合制御モジュール6が精密操作を実行するようガイドし、前記入力チャネルモジュール7と前記出力チャネルモジュール8を制御する。
【0023】
前記自動意思決定モジュール2は、前記自発意思決定モジュール1の計算タスクが重すぎ、又はシステムが迅速に反応する必要があるとき、経験価値、及び感知情報と記憶情報に基づいて、目標と実行が必要な操作を自動的に選択し、且つ前記複合制御モジュール6が操作を実行するようガイドし、前記自発意思決定モジュール1に協働して総合的な意思決定を行う。
【0024】
前記評価モジュール3は、システム内部、又は外部環境のフィードバックに基づいて、目標の実際価値と実行される操作の実際効果値を評価し、且つ予測誤差値を前記自発意思決定モジュール1、自動意思決定モジュール2、及び/又は複合制御モジュール6にフィードバックする。
【0025】
前記記憶モジュール4は、システム内部状態の履歴情報、及び環境の履歴情報をコーディングし、且つ記憶情報として記録し、且つ記憶情報を前記自発意思決定モジュール1、及び/又は前記自動意思モジュール2に伝達することで、意思決定過程を補助し、記憶情報を前記複合制御モジュール6に伝達することで、動作シーケンスの選択と実行に影響を与える。
【0026】
前記感知モジュール5は、センサからの情報を感知情報として処理し、且つ感知情報を前記自発意思決定モジュール1、自動意思決定モジュール2、評価モジュール3、記憶モジュール4、総合制御モジュールに伝達し、前記感知情報は、動画情報、音声情報、力フィードバック情報、温度情報、触感情報、関節角度、角速度、角加速度情報、変位、速度、加速度情報、及び/又は姿勢とバランス情報を有する。
【0027】
前記複合制御モジュール6は、複数の基本制御ユニット65を有し、各基本制御ユニット65は複数のニューロンを有し、ここで、少なくとも1つのニューロンは、前記自発意思決定モジュール1からの入力を受信し、少なくとも1つのニューロンは、この基本制御ユニット65に位置する1つ又は複数のニューロンとともに単方向、又は双方向の興奮性、又は抑制性結合を形成し、少なくとも1つのニューロンは、その他の基本制御ユニット65に位置する1つ又は複数のニューロンとともに単方向、又は双方向の興奮性、又は抑制性結合を形成し、少なくとも1つのニューロンは、前記出力チャネルモジュール8、又は前記評価モジュール3に結合され、ここでの複数の結合は、シナプス可塑性プロセスにより1つ又は複数の動作シーケンスを学習、記憶、コーディング、精密制御、予測、又は実行し、且つ自発意思決定モジュール1に協働して複数の可能な動作シーケンスにおいて優れたものを選択し、又は総合して実行する。ここで、優れたものを選択するとは、競合により優れた動作シーケンスを選択して実行することであってよい。
【0028】
前記入力チャネルモジュール7は、前記感知モジュール5により伝達された感知情報を変換し、中継し、増幅し、且つそれぞれ前記意思決定モジュール、及び/又は複合制御モジュール6に出力し、前記入力チャネルモジュール7は、前記自発意思決定モジュール1の制御信号の入力を受信して信号中継の増幅倍数を調整する。
【0029】
前記出力チャネルモジュール8は、前記複合制御モジュール6の出力信号を変換し、中継し、増幅し、且つ前記受信対象モジュール9に伝導し、前記出力チャネルモジュール8は、前記自発意思決定モジュール1の制御信号の入力を受信して信号中継の増幅倍数を調整する。
【0030】
前記制御対象モジュール9は、1つ又は複数のアクチュエータを有する。
【0031】
前記自発意思決定モジュール1は、目標集合、目標-操作-効果集合、及び意思決定規則集合を有する。
【0032】
前記目標集合は、現れた各目標、及びその総合価値と逼迫値を記録し、現れていない目標について、その総合価値を第1の予め設定された価値に設定することで好奇心を示す。
【0033】
前記目標-操作-効果集合は、各目標での実行可能な操作、及びこの状況での各操作の総合効果値を記録する。
【0034】
前記意思決定規則集合は、ユーザ定義の意思決定規則とシステムが新たに学習した意思決定規則を記録し、意思決定規則は、システムが目標、及び操作を如何に選択するかを規定する。
【0035】
前記自発意思決定モジュール1が目標を選択後、この目標、及び総合価値を評価モジュール3に伝達し、目標-操作-効果集合から操作を選択する。
【0036】
自動意思決定モジュール2がその選択した目標と操作を送信する場合、自発意思決定モジュール1は、それを自己が選択した目標と操作と重み付けして最終的な意思決定を形成する。
【0037】
自発意思決定モジュール1がある操作を実行することを最終的に決定した後、この操作、及びその総合効果値を評価モジュール3に伝達し、この操作をパルスシーケンス信号で、自発起動制御通路と自発停止制御通路により複合制御モジュール6に伝達する。
【0038】
評価モジュール3が目標、及び操作の予測誤差値信号を伝達するとき、自発意思決定モジュール1は、対応する目標の現在の総合価値、又は対応する操作の現在の総合効果値に予測誤差値を加えて、更新された総合価値、又は総合効果値を得て、且つそれぞれ目標集合、及び目標-操作-効果集合へ更新する。
【0039】
前記自発意思決定モジュール1が目標を選択する意思決定規則は、以下のうちの1つ又は複数を有する。
1)現れた1つ又は複数の目標において総合価値と逼迫値の重み付けが最大の目標を選択する。
2)現れた1つ又は複数の目標において任務と最も関係があり、しかも意思決定規則と矛盾しない目標を選択する。
3)現れた1つ又は複数の目標において最も顕著な目標を選択する。
4)自動意思決定モジュール2に引き渡し目標を自動的に選択する。
5)ランダムに目標を選択する。
6)現れていない仮想目標を選択する。
7)現れた目標を無視して、直接操作選択過程に入る。
【0040】
操作を選択する意思決定規則は、以下のうちの1つ又は複数を有する。
1)目標-操作-効果集合において、選択された目標に対応する総合効果値が最大の操作を選択する。
2)試行錯誤学習し、且つランダムに操作を選択する。
3)模倣学習し、且つ複合制御モジュール6を自発的に監督することにより新しい動作シーケンスを実行する。
4)動作を採用せず、且つ待機する。
5)自動意思決定モジュール2に引き渡して自動的に操作を選択する。
6)予測学習し、且つ動作をリハーサルするが、実際には実行しないことで、その効果値を予測する。
【0041】
上述の各意思決定規則は互いに協働して実行する。
【0042】
前記自動意思決定モジュール2は、以下を有する。
前記目標集合は、現れた各目標、及びその経験価値を記録し、現れていない目標について、その経験価値を第2の予め設定された価値に設定する。
前記目標-操作-効果集合は、各目標での採用可能な予め設定された操作、及びその経験効果値を記録する。
【0043】
前記自動意思決定モジュール2は、現在現れる1つ又は複数の目標において経験価値が最大の目標を自動で選択し、且つこの目標とその経験価値を評価モジュール3に伝達し、目標-操作-効果集合からこの目標に対応する各予め設定された操作における経験効果値が最大のものを選択し、且つこの操作、及びその経験効果値を評価モジュール3に伝達する。
【0044】
自動意思決定モジュール2は、選択した目標と操作を自発意思決定モジュール1に送信してコンセンサスを形成し、自発意思決定モジュール1が遅延、又は否決しない場合、自動意思決定モジュール2は直ちに、この操作をパルスシーケンス信号で自動起動制御通路、及び自動停止制御通路により複合制御モジュール6に伝達する。自発意思決定モジュール1が否決する場合、その最終的な意思決定を基準とし、自発意思決定モジュール1と自動意思決定モジュール2が、各自が選択した操作を複合制御モジュール6に伝達する場合、複合制御モジュール6は、2つの操作を総合する。
【0045】
評価モジュール3により伝達された目標、又は操作の予測誤差値信号を受信するとき、自動意思決定モジュール2は、対応する目標の現在の経験価値、又は対応する操作の現在の経験効果値に予測誤差値を加えて、更新された経験価値、又は経験効果値を取得し、且つそれぞれ目標集合と目標-操作-効果集合へ更新する。
【0046】
前記評価モジュール3は、キャッシュ、及び評価規則集合を有する。
【0047】
自発意思決定モジュール1がある目標、及びその総合価値、又はある操作、及びその総合効果値を伝達するとき、評価モジュール3は、それらをキャッシュする。システムがフィードバック、又は結果を取得したとき、評価モジュール3は、評価規則に基づいて、目標の実際価値、又は操作の実際効果値を評価し、且つキャッシュされた目標の総合価値、又は操作の総合効果値を引いて目標、又は操作の予測誤差値を取得し、予測誤差値を自発意思決定モジュール1に伝達して、それに記憶される対応する目標の総合価値、又は対応する操作の総合効果値を修正する。
【0048】
自動意思決定モジュール2がある目標、及びその経験価値、又はある操作、及びその総合効果値を伝達するとき、評価モジュール3は、それらをキャッシュする。システムがフィードバック、又は結果を取得したとき、評価モジュール3は、評価規則に基づいて、目標の実際価値、又は操作の実際効果値を評価し、且つキャッシュされた目標の経験価値、又は操作の経験効果値を引いて目標、又は操作の予測誤差値を取得し、予測誤差値を自動意思決定モジュール2に伝達して、それに記憶される対応する目標の経験価値、又は対応する操作の経験効果値を修正する。
【0049】
前記評価モジュール3はまた、予測誤差値を複合制御モジュール6に伝達してそのコーディングされた動作シーケンス、及びその予測効果値を修正する。
【0050】
システムの意思決定、及び運動の実行が感知情報の影響を受ける程度は、入力チャネルモジュール7の増幅倍数と正の相関を示す。増幅倍数が高いほど、システムの意思決定、及び運動の実行が感知情報の影響を受ける程度は高くなる。増幅倍数が低いほど、システムの意思決定、及び運動の実行が感知情報の影響を受ける程度は低くなる。増幅倍数が0のとき、システムの意思決定、及び運動の実行は、感知情報の影響を受けない。
【0051】
システムの意思決定、及び運動の実行が感知情報の影響を受ける程度は、入力チャネルモジュール7の増幅倍数と正の相関を示す。増幅倍数が高いほど、制御対象の実行強度は高くなる。増幅倍数が低いほど、制御対象の実行程度は低くなる。増幅倍数が0のとき、複合制御モジュール6の出力を制御対象モジュール9に伝達することを阻止し、動作シーケンスは、システムでシミュレーションリハーサルするが、実際には実行しない。
【0052】
前記アクチュエータは、1つ又は複数のモータ、油圧素子、空気圧素子、又は人工筋肉アクチュエータとして構成される。各アクチュエータは、前記出力チャネルモジュール8により1つ又は複数の基本制御ユニット65に結合されて少なくとも1つのメタ動作を実行する。一対のアクチュエータをそれぞれ前記出力チャネルモジュール8により1つ又は複数の異なる基本制御ユニット65に結合して拮抗型制御を構成してもよい。
【0053】
複合制御モジュール6の出力信号は、出力チャネルモジュール8により制御対象モジュール9に出力される。出力信号は、パルスシーケンス信号であり、出力チャネルモジュール8は、パルスシーケンス信号の周波数をアクチュエータの入力電圧値、及び/又は電流値に変換し、且つ連続パルスの持続時間をアクチュエータの入力電圧、及び/又は電流の持続時間に変換し、パルス周波数が高いほど、対応するアクチュエータの出力幅、力は強い。連続パルス持続時間が長いほど、対応するアクチュエータの出力時間の持続が長く、逆もまた同様である。
【0054】
図2を参照し、前記各操作は、1つ又は複数の動作シーケンスの組み合わせを示す。各動作シーケンスは、1つ又は複数のメタ動作の時間次元における配列から構成される。任意の時間点ではゼロから複数のメタ動作が発生する。同一のメタ動作は、1つの時間点で発生し、又は異なる時間点で発生する。各メタ動作は、1つの対応するアクチュエータが実行可能な最小の動作を示す。
【0055】
前記基本制御ユニット65は、自発制御層61、運動コーディング層62、脱抑制層63、及び中継層64、並びにそのうちのニューロン、及び結合関係を有し、メタ動作をコーディングし、メタ動作の起動と停止を制御するためのものである。
【0056】
前記自発制御層61は、起動ニューロン6110、及び停止ニューロン6120を有する。
【0057】
前記運動コーディング層62は、動作起動コーディングニューロン6210、及び動作停止コーディングニューロン6220を有する。
【0058】
前記脱抑制層63は、脱抑制起動ニューロン6310、及び脱抑制停止ニューロン6320を有する。
【0059】
前記中継層64は、中継起動ニューロン6410、及び中継停止ニューロン6420を有する。
【0060】
図3を参照し、前記自発制御層61において、前記起動ニューロン6110は、前記自発意思決定モジュール1からの自発起動信号P、及び前記中継起動ニューロン6410の興奮性結合を受信する。前記停止ニューロン6120は、前記自発意思決定モジュール1からの自発停止信号Qを受信する。それらは、それぞれ入力された信号を総合し、且つパルス信号にコーディングして前記運動コーディング層62に対応するニューロンに出力する。
【0061】
前記運動コーディング層62において、前記動作起動コーディングニューロン6210は、前記起動ニューロン6110の興奮性入力を受信する。前記動作停止コーディングニューロン6220は、前記停止ニューロン6120の興奮性入力を受信する。このほか、それらはいずれも前記記憶モジュール4、感知モジュール5、評価モジュール3の入力(図2、3、4のうちのM、S、R)を受信する。それらは、それぞれすべての入力情報を総合し、パルス信号を生成し、ひいては脱抑制層63に対応するニューロンのパルス放出周波数と位相を調節する。
【0062】
同一の基本制御ユニット65内の動作起動コーディングニューロン6210と動作停止コーディングニューロン6220との間は双方向抑制性結合を有し、シナプス荷重によりこの基本制御ユニット65に対応するメタ動作の相対的な動作強度と相対的な持続時間をコーディングする。
【0063】
図6を参照し、複数の基本制御ユニット65における動作起動コーディングニューロン6210の互いの間は、双方向抑制性結合を有し、シナプス荷重により動作シーケンスにおける各メタ動作を実行する前後順序をコーディングする。
【0064】
異なる基本制御ユニット65からの動作起動コーディングニューロン6210と動作停止コーディングニューロン6220との間は双方向抑制性結合を有し、シナプス荷重により動作シーケンスにおける各メタ動作の相対的な起動時間と相対的な停止時間をコーディングする。
【0065】
前記脱抑制層63において、前記脱抑制起動ニューロン6310は、前記動作起動コーディングニューロン6210の抑制性入力信号、前記脱抑制停止ニューロン6320の抑制性入力信号、及び前記中継停止ニューロン6420の興奮性入力信号を受信し、且つすべての入力信号を総合し、パルス信号を生成し、抑制性結合により前記中継起動ニューロン6410のパルス放出周波数と位相を調節する。前記脱抑制停止ニューロン6320は、前記動作停止コーディングニューロン6220の抑制性入力信号、及び前記中継停止ニューロン6420の興奮性入力信号を受信し、且つすべての入力信号を総合し、パルス信号を生成し、抑制性結合により前記中継停止ニューロン6420のパルス放出周波数と位相を調節する。
【0066】
前記中継層64において、前記中継起動ニューロン6410は、前記脱抑制起動ニューロン6310の抑制性入力信号を受信し、且つ前記起動ニューロン6110の興奮性結合に投射することにより、動作実行を促すポジティブフィードバック閉ループを形成し、前記中継停止ニューロン6420は、前記停止ニューロン6120の興奮性入力信号、及び前記脱抑制停止ニューロン6320の抑制性入力信号を受信し、且つすべての入力信号を総合し、パルス信号を生成し、且つ興奮性結合により前記脱抑制起動ニューロン6310に投射することにより、動作実行を抑制する通路を形成する。
【0067】
前記起動ニューロン6110、停止ニューロン6120、動作起動コーディングニューロン6210、動作停止コーディングニューロン6220、脱抑制起動ニューロン6310、脱抑制停止ニューロン6320、及び中継起動ニューロン6410、及び/又は中継停止ニューロン6420は基本制御ユニット65の出力である。
【0068】
前記基本制御ユニット65は、出力結合方式に基づいて、出力型基本制御ユニット65Aと予測型基本制御ユニット65Bの2つのサブタイプに分けられる。
【0069】
図3を参照し、前記出力型基本制御ユニット65Aの出力は、出力チャネルモジュール8に接続されることで、アクチュエータを駆動する。
【0070】
図4を参照し、前記予測型基本制御ユニット65Bの出力は、評価モジュール3に接続されることで動作シーケンスの予測効果値を予測して実際には実行しない。
【0071】
図5を参照し、前記複合制御モジュール6は、1つ又は複数の補助制御ユニット66をさらに有する。前記補助制御ユニット66は、自発選択信号の入力端6630、自発選択解除信号の入力端6640、側抑制脱抑制ニューロン6610、及び迅速自励型抑制ニューロン6620をさらに有し、複数の候補の動作シーケンスにおいて実行を自発的に、又は自動で選択するためのものである。
【0072】
1つ又は複数の基本制御ユニット65は一組であり、各組の基本制御ユニット65は、1つの動作シーケンスをコーディングする。
【0073】
各基本制御ユニット65の動作起動コーディングニューロン6210、及び動作停止コーディングニューロン6220はそれぞれ1つの側抑制脱抑制ニューロン6610に結合する。
【0074】
各組の基本制御ユニット65は、1つ又は複数の迅速自励型抑制ニューロン6620を共有する。
【0075】
前記側抑制脱抑制ニューロン6610は、自発選択信号の入力、及び所属する基本制御ユニット65の運動コーディング層62のニューロンの入力を総合し、パルス信号を生成し、且つ抑制性結合によりその他の組の基本制御ユニット65の迅速自励型抑制ニューロン6620へ出力する。
【0076】
前記迅速自励型抑制ニューロン6620は、自発選択解除信号の入力、及びそれぞれ隣接する組の基本制御ユニット65の側抑制脱抑制ニューロン6610の入力を総合し、パルス信号を生成し、且つ抑制性結合によりその所属する基本制御ユニット組の各運動制御層のニューロンへ出力する。
【0077】
前記自発選択信号の入力端6630は、自発意思決定モジュール1の入力を受信して特定動作シーケンスを自発的に選択して実行に備える。
【0078】
前記自発選択解除信号の入力端6640は、自発意思決定モジュール1の入力を受信して特定動作シーケンスの実行を自発的に抑制する。
【0079】
前記起動ニューロン6110、停止ニューロン6120、動作起動コーディングニューロン6210、動作停止コーディングニューロン6220は、パルスニューロンである。
【0080】
前記脱抑制起動ニューロン6310、脱抑制停止ニューロン6320、中継起動ニューロン6410、中継停止ニューロン6420、側抑制脱抑制ニューロン6610、迅速自励型抑制ニューロン6620は、自励型パルスニューロンである。
【0081】
前記自励型パルスニューロンの動作モードは、以下のとおりである。
【0082】
入力信号がなく、又は入力信号の合計がゼロの場合、前記自励型パルスニューロンは自動的に第1の予め設定された周波数で放出し、その第1の予め設定された周波数の範囲は、10Hz~100Hzに構成される。
【0083】
入力信号の合計が正の値である場合、前記自励型パルスニューロンの放出周波数は上昇し、しかも合計が大きいほど、放出周波数は高く、第1の予め設定された周波数の上限までであり、逆もまた同様である。
【0084】
入力信号の合計が負の値の場合、前記自励型パルスニューロンの放出周波数は低下し、しかも合計の絶対値が大きいほど、放出周波数は低く、放出を停止するまでであり、逆もまた同様である。
【0085】
前記迅速自励型抑制ニューロン6620の動作モードは、自励型パルスニューロンの動作モードと同じであり、その第1の予め設定された周波数の範囲は、20Hz~200Hzに構成され、且つ出力の結合は抑制型であり、迅速に下流の対象ニューロンをオフにするためのものである。
【0086】
前記基本制御ユニット65は、5つの制御通路を有する。1)自発起動制御通路、2)自発停止制御通路、3)自動起動制御通路、4)自動停止制御通路、5)競合選択制御通路である。
【0087】
前記自発起動制御通路は、所属する基本制御ユニット65の起動ニューロン6110、動作起動コーディングニューロン6210、脱抑制起動ニューロン6310、中継起動ニューロン6410、及びその間の結合からなり、この基本制御ユニット65がコーディングするメタ動作を発動し、且つ持続して実行するためのものである。
【0088】
前記自発停止制御通路は、所属する基本制御ユニット65の停止ニューロン6120、動作停止コーディングニューロン6220、脱抑制停止ニューロン6320、中継停止ニューロン6420、脱抑制起動ニューロン6310、及びその間の結合からなり、この基本制御ユニット65がコーディングするメタ動作を抑制し、停止するためのものである。
【0089】
前記自動起動制御通路は、自動意思決定モジュール2の自動起動信号の出力端、所属する基本制御ユニット65の脱抑制起動ニューロン6310、及びその間の結合からなり、自動選択するメタ動作を発動し、且つ実行するためのものである。
【0090】
前記自動停止制御通路は、自動意思決定モジュール2の自動停止信号の出力端、所属する基本制御ユニット65の脱抑制停止ニューロン6320、及びその間の結合からなり、自動選択するメタ動作を抑制し、停止するためのものである。
【0091】
前記競合選択制御通路は、所属する基本制御ユニット65の起動ニューロン6110、中継停止ニューロン6420、複数の競合する基本制御ユニット65の脱抑制起動ニューロン6310、及びその間の結合からなり、複数の候補のメタ動作の間で互いの競合により優れたメタ動作を選択して実行するためのものである。
【0092】
動作を実行する必要がない場合、各基本制御ユニット65の自発起動制御通路において脱抑制起動ニューロン6310のみがパルス信号を自主的に生成しており、それは抑制性結合により中継起動ニューロン6410を完全に抑制するので、発生できる動作がないことになる。
【0093】
自発意思決定モジュール1がある動作シーケンスを実行することを選択するとき、自発意思決定モジュール1は、自発起動信号Pをこの動作シーケンスにおける一部、又はすべてのメタ動作に対応する基本制御ユニット65の起動ニューロン6110へ送信してパルスの放出を開始させ、又は速度を速めさせ、ひいては動作起動コーディングニューロン6210にパルスの放出を開始させ、又は速度を速めさせ、脱抑制起動ニューロン6310は、動作起動コーディングニューロン6210の抑制を受けてパルスの放出を緩め、抑制を解除することで、中継起動ニューロン6410にパルスの放出を開始させ、又は速度を速めさせ、且つさらに、ポジティブフィードバック結合により起動ニューロン6110を励起し、これによりこの基本制御ユニット65に対応するメタ動作を発動し、且つ実行を持続させる。この動作シーケンスに関連する各基本制御ユニット65における動作起動コーディングニューロン6210の互いの間の結合により、動作シーケンスが終了するまで動作シーケンスにおける各メタ動作を一定のリズムで順次実行させる。
【0094】
自発意思決定モジュール1は自発停止信号Qを送信し、且つ指定の基本制御ユニット65の停止ニューロン6120へ入力し、パルスの放出を開始させ、又は速度を速めさせ、ひいては動作停止コーディングニューロン6220にパルスの放出を開始させ、又は速度を速めさせ、脱抑制停止ニューロン6320は、動作停止コーディングニューロン6220の抑制を受けてパルスの放出を緩め、抑制を解除することで、中継停止ニューロン6420にパルスの放出を開始させ、又は速度を速めさせ、且つさらに、ポジティブフィードバック結合により脱抑制起動ニューロン6310にパルスの放出を開始させ、又は速度を速めさせ、中継起動ニューロン6410のパルスの放出を抑制させ、これによりこの基本制御ユニット65がコーディングするメタ動作を抑制し、停止する。
【0095】
自動意思決定モジュール2は自動起動信号を送信し、且つ指定の基本制御ユニット65の脱抑制起動ニューロン6310へ入力し、パルスの放出を緩めさせ、ひいては抑制を解除することで、中継起動ニューロン6410にパルスの放出を開始させ、又は速度を速めさせ、且つ自発起動制御通路のポジティブフィードバックループによりこの動作を発動させ、且つ実行を持続させる。
【0096】
自動意思決定モジュール2は自動停止信号を送信し、且つ指定の基本制御ユニット65の脱抑制停止ニューロン6320へ入力し、パルスの放出を緩めさせ、ひいては抑制を解除することで、中継停止ニューロン6420にパルスの放出を開始させ、又は速度を速めさせ、且つさらに、ポジティブフィードバック結合により脱抑制起動ニューロン6310にパルスの放出を開始させ、又は速度を速めさせ、中継起動ニューロン6410のパルスの放出を抑制させ、これによりこの基本制御ユニット65がコーディングするメタ動作を抑制し、停止する。
【0097】
前記複合制御モジュール6は、3つの動作モードをサポートし、自発監督モード、自動モード、フィードバック駆動モードである。
【0098】
前記自発監督モードは、自発意思決定モジュール1により動作シーケンスを如何にして実行するかを決定し、且つティーチングを提供し、複合制御モジュール6に新しい動作シーケンスを学習させ、又は既存の動作シーケンスを更新して調整させるためのものである。自発監督モードでは、動作シーケンスの順序ごとの実行は主に、自発意思決定モジュール1により駆動され、すなわち、自発意思決定モジュール1が動作シーケンスにおける各時刻にどのメタ動作を実行すべきか、又は停止すべきか、及び各メタ動作の強度を提供し、且つ自発起動信号P、及び自発停止信号Qをそれぞれ対応する基本制御ユニット65の起動ニューロン6110、及び停止ニューロン6120へ入力する。このモードは、ティーチング学習と模倣学習に適用される。
【0099】
前記自動モードは、自発意思決定モジュール1の関与がない、若しくは少ない場合、又は自動意思決定モジュール2が初期メタ動作を提供すると、複合制御モジュール6が動作シーケンスの順序ごとの実行を自動で完了するためのものである。自動モードでは、動作シーケンスの順序ごとの実行は主に、複数の基本制御ユニット65の運動コーディング層62のニューロンの互いの間の結合により駆動される。自発意思決定モジュール1、又は自動意思決定モジュール2が動作シーケンスにおけるあるメタ動作を起点として提供し、且つ自発起動制御通路、又は自動起動制御通路により起点信号を提供するだけで、動作シーケンスの残りの部分は、動作シーケンスが終了するまで自動的に順序ごとに実行される。このモードの利点は、動作シーケンスが、そのうちの任意のメタ動作から実行を開始でき、入口がフレキシブルであり、ロボットシステムが任務の異なる初期状態から実行を開始し、且つフレキシブルに被操作物体と干渉に適応でき、しかも動作の自動実行は主に、複合制御ユニットが(運動コーディング層62の各ニューロンの互いの間の結合のシナプス荷重により)コーディングする動作シーケンスにより決定され、自発意思決定モジュール1、及び自動意思決定モジュール2の演算量を節約することである。
【0100】
前記フィードバック駆動モードは、フィードバックにより動作を調整し、システムを外部環境に自動で適応させるためのものである。フィードバック駆動モードでは、動作、又は動作シーケンスの実行はさらに、フィードバック信号により駆動される。評価モジュール3は、フィードバック信号を複合制御モジュール6の運動コーディング層62のニューロンへ入力し、システムが奨励されると、フィードバック信号は、動作起動コーディングニューロン6210が第1の予め設定された興奮性入力バイアスを得るようにし、且つ動作停止コーディングニューロン6220が第1の予め設定された抑制性入力バイアスを得るようにし、これにより動作がさらに発生しやすくなり、又は現在の動作の幅、力がさらに大きくなり、持続時間がさらに長くなる。システムがペナルティを受けると、フィードバック信号は、動作起動コーディングニューロン6210が第2の予め設定された抑制性入力バイアスを得るようにし、且つ動作停止コーディングニューロン6220が第2の予め設定された興奮性入力バイアスを得るようにし、これにより動作がさらに発生しにくくなり、又は現在の動作の幅、力が小さくなり、さらには事前に終了するようになる。このモードの利点は、制御システムが外部のフィードバックにより動作シーケンスを調整できることであり、これにより利益を選択し、害を回避し、外部操作環境にさらに適用するようになる。
【0101】
前記3つの動作モードはそれぞれ独立して動作し、又は連携して動作する。
【0102】
前記自発制御層のニューロンと運動コーディング層62のニューロンの数の比率関係は1:Nに構成される。Nは1以上の有理数である。各自発制御層61のニューロンは、1つ又は複数の運動コーディング層62のニューロンに結合するよう構成される。各結合のシナプス可塑性プロセスによりこの結合に上流、下流ニューロンの放出状況に基づいて、シナプス荷重を調節させ、運動コーディング層62のニューロンが各メタ動作に自動で対応するようになり、ニューロン群のコーディングを実現する。
【0103】
前記自発制御層61のニューロンと運動コーディング層62のニューロンとの間の結合のシナプス可塑性プロセスは、評価モジュール3により伝達される誤差フィードバック信号により変調される。
【0104】
前記変調の過程は、以下のうちの1つ又は複数を有する。
1)誤差フィードバック値が正の値の場合、起動ニューロン6110は、動作起動コーディングニューロン6210のシナプスに結合され、その長期増強作用(LTP)は誤差フィードバック値と正の相関を示す。一方、長期抑制作用(LTD)は、誤差フィードバック値と負の相関を示す。停止ニューロン6120は、動作停止コーディングニューロン6220のシナプスに結合され、その長期増強作用(LTP)は、誤差フィードバック値と負の相関を示し、一方、その長期抑制作用(LTD)は、誤差フィードバック値と正の相関を示す。
2)誤差フィードバック値が負の値の場合、起動ニューロン6110は、動作起動コーディングニューロン6210のシナプスに結合され、その長期増強作用(LTP)は誤差フィードバック値の絶対値と負の相関を示す。一方、長期抑制作用(LTD)は、誤差フィードバック値の絶対値と正の相関を示す。停止ニューロン6120は、動作停止コーディングニューロン6220のシナプスに結合され、その長期増強作用(LTP)は、誤差フィードバック値の絶対値と正の相関を示し、一方、その長期抑制作用(LTD)は、誤差フィードバック値の絶対値と負の相関を示す。
3)誤差フィードバック値がゼロの場合、自発制御層61のニューロンと運動コーディング層62のニューロンとの間の結合のシナプス可塑性プロセスの重み調整係数、又は重み変更量を第1の予め設定された値に維持し、複合制御モジュール6が実行を反復し、又は既存の動作シーケンスをリハーサルするとき、強固な結合関係を緩め、既存の動作シーケンスが変形すること、又は過度に速い忘却を防止する。
【0105】
前記各基本制御ユニット65の動作起動コーディングニューロン6210の互いの間の抑制性結合は、反ヘッブ非対称遅延シナプス可塑性プロセスで重みを調整する。
【0106】
図7を参照し、前記反ヘッブ非対称遅延シナプス可塑性プロセスの動作過程は、以下を有する。
1)各シナプスはLTD累積ポテンシャルエネルギー(負の数でない)、及びLTP累積ポテンシャルエネルギー(正の数でない)を有し、且つゼロに初期化される。
2)あるニューロンが励起されると、その後の充分短い時間ウィンドウ内にその下流のニューロンも励起されれば、両者の間のシナプスのLTD累積ポテンシャルエネルギーは増加し、且つ増加量は両者のパルス放出時間間隔と負の相関をなし、そうでなければ、LTP累積ポテンシャルエネルギーの絶対値は1つの第1の予め設定された定数を増加する。
3)LTD累積ポテンシャルエネルギー、及びLTP累積ポテンシャルエネルギーはそれぞれ時間の流れとともに徐々にゼロリセットまで減衰する。
4)誤差フィードバック値が正の値の場合、各シナプスのLTD累積ポテンシャルエネルギーはLTP累積ポテンシャルエネルギーと重み付けされ(前者の重みは後者よりも大きい)、且つ誤差フィードバック値を掛け、シナプス荷重に重ね合わせ、その後、LTD累積ポテンシャルエネルギー、及びLTP累積ポテンシャルエネルギーをいずれもゼロリセットする。
5)誤差フィードバック値が負の値の場合、各シナプスのLTD累積ポテンシャルエネルギーはLTP累積ポテンシャルエネルギーと重み付けされ(前者の重みは後者よりも小さい)、且つ誤差フィードバック値の絶対値を掛け、シナプス荷重に重ね合わせ、その後、LTD累積ポテンシャルエネルギー、及びLTP累積ポテンシャルエネルギーをいずれもゼロリセットする。
【0107】
前記動作過程の第1工程は、システム初期化時に行われる。
【0108】
前記動作過程の第2から5工程は、任意の順序に沿って行われ、且つ繰り返すことができる。
【0109】
前記中継層64のニューロンと自発制御層61のニューロンの数の比率関係は1:Nに構成される。Nは正の有理数である。しかも各中継層64のニューロンは、1つ又は複数の自発制御層61のニューロンに結合するよう構成される。各結合のシナプス可塑性プロセスによりこの結合に上流、下流ニューロンの放出状況に基づいて、シナプス荷重を調節させ、中継層64のニューロンが各メタ動作に自動で対応するようになり、ニューロン群のコーディングを実現する。
【0110】
このシステムは、ソフトウェア、ファームウェア、又はハードウェアで実現できる。例えば、このシステムは、パルスニューラルネットワークをサポートするチップに埋め込まれ、且つロボットシステムに集積されることができる。
【0111】
使用時には、必要に応じて基本制御ユニット65の数、自発制御層61のニューロンと運動コーディング層62のニューロンの数の比率関係、及び中継層64のニューロンと自発制御層61のニューロンの数の比率関係を決定する。通常、コーディングが必要な異なる動作シーケンスが多く、単一の動作シーケンスが長いほど、基本制御ユニット65の数は多くなるものとし、運動コーディング層62のニューロンの数も多くなる。使用することが必要な異なるメタ動作の数が多いほど、自発制御層61のニューロン、及び中継層64のニューロンの数は多くなるものとする。各基本制御ユニット65は1つのメタ動作に対応し、一方、同じメタ動作は、複数の基本制御ユニット65によりコーディングに関与され、且つその総合的な影響を受けることができる。
【0112】
以上に述べたのは、本出願の好適な実施例にすぎず、本出願を限定するものではない。当業者は、本出願に各種の変更、及び変形を行うことができる。本出願の趣旨、及び原則の範囲内で行われるいずれかの修正、均等な置き換え、改良などはいずれも本出願の特許請求の範囲内に含まれるものとする。
【符号の説明】
【0113】
1 自発意思決定モジュール
2 自動意思決定モジュール
3 評価モジュール
4 記憶モジュール
5 感知モジュール
6 複合制御モジュール
7 入力チャネルモジュール
8 出力チャネルモジュール
9 制御対象モジュール
61 自発制御層
62 運動コーディング層
63 脱抑制層
64 中継層
図1
図2
図3
図4
図5
図6
図7