特許第6973430号(P6973430)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社豊田中央研究所の特許一覧

特許6973430情報処理装置、情報処理装置に知的行動を模擬させる方法、コンピュータプログラム、及び、それを記憶した記憶媒体
<>
  • 特許6973430-情報処理装置、情報処理装置に知的行動を模擬させる方法、コンピュータプログラム、及び、それを記憶した記憶媒体 図000009
  • 特許6973430-情報処理装置、情報処理装置に知的行動を模擬させる方法、コンピュータプログラム、及び、それを記憶した記憶媒体 図000010
  • 特許6973430-情報処理装置、情報処理装置に知的行動を模擬させる方法、コンピュータプログラム、及び、それを記憶した記憶媒体 図000011
  • 特許6973430-情報処理装置、情報処理装置に知的行動を模擬させる方法、コンピュータプログラム、及び、それを記憶した記憶媒体 図000012
  • 特許6973430-情報処理装置、情報処理装置に知的行動を模擬させる方法、コンピュータプログラム、及び、それを記憶した記憶媒体 図000013
  • 特許6973430-情報処理装置、情報処理装置に知的行動を模擬させる方法、コンピュータプログラム、及び、それを記憶した記憶媒体 図000014
  • 特許6973430-情報処理装置、情報処理装置に知的行動を模擬させる方法、コンピュータプログラム、及び、それを記憶した記憶媒体 図000015
  • 特許6973430-情報処理装置、情報処理装置に知的行動を模擬させる方法、コンピュータプログラム、及び、それを記憶した記憶媒体 図000016
  • 特許6973430-情報処理装置、情報処理装置に知的行動を模擬させる方法、コンピュータプログラム、及び、それを記憶した記憶媒体 図000017
  • 特許6973430-情報処理装置、情報処理装置に知的行動を模擬させる方法、コンピュータプログラム、及び、それを記憶した記憶媒体 図000018
  • 特許6973430-情報処理装置、情報処理装置に知的行動を模擬させる方法、コンピュータプログラム、及び、それを記憶した記憶媒体 図000019
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6973430
(24)【登録日】2021年11月8日
(45)【発行日】2021年11月24日
(54)【発明の名称】情報処理装置、情報処理装置に知的行動を模擬させる方法、コンピュータプログラム、及び、それを記憶した記憶媒体
(51)【国際特許分類】
   G06N 3/04 20060101AFI20211111BHJP
【FI】
   G06N3/04
【請求項の数】10
【全頁数】24
(21)【出願番号】特願2019-30330(P2019-30330)
(22)【出願日】2019年2月22日
(65)【公開番号】特開2020-135600(P2020-135600A)
(43)【公開日】2020年8月31日
【審査請求日】2020年7月21日
(73)【特許権者】
【識別番号】000003609
【氏名又は名称】株式会社豊田中央研究所
(74)【代理人】
【識別番号】100160691
【弁理士】
【氏名又は名称】田邊 淳也
(74)【代理人】
【識別番号】100157277
【弁理士】
【氏名又は名称】板倉 幸恵
(72)【発明者】
【氏名】岩本 正実
【審査官】 渡辺 順哉
(56)【参考文献】
【文献】 特開2003−317073(JP,A)
【文献】 国際公開第2018/015778(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00−99/00
(57)【特許請求の範囲】
【請求項1】
知的行動を代替可能な情報処理装置であって、
脳の複数の異なる機能について、各機能に関する行動パターンをそれぞれ学習した、各機能に対応する複数の機能部と、
前記複数の機能部を統合した脳全体に対して電気的情報が入力された際に、前記脳全体の電磁気的解析を行うことにより得られる力学量である力学的情報を求め、前記力学的情報を、統合された前記複数の機能部の重み値に関連付ける情報統合部と、
前記力学的情報としての前記力学量が予め設定された閾値より大きくなった場合に、前記複数の機能部の重み値を更新する可塑性部と、
を備える、情報処理装置。
【請求項2】
請求項1に記載の情報処理装置であって、
前記情報統合部は、
前記複数の機能部に含まれる神経ネットワークを模擬した要素を重畳することで、前記複数の機能部を統合した統合ネットワークを構成し、
前記統合ネットワークに、脳の構造と物理学特性とから得られた力学モデルを適用し、
前記力学モデルを適用した前記統合ネットワークに対して、前記入力された電気的情報を用いた電磁気的解析を行うことで、前記力学的情報としての前記力学量を求め、
求めた前記力学的情報を、前記統合ネットワークの重み値と関連付ける、情報処理装置。
【請求項3】
請求項1または請求項2に記載の情報処理装置であって、
前記閾値は、材料力学における降伏点に基づき決定されている、情報処理装置。
【請求項4】
請求項1から請求項3のいずれか一項に記載の情報処理装置であって、
前記可塑性部は、さらに、前記力学的情報を表示する、情報処理装置。
【請求項5】
請求項1から請求項のいずれか一項に記載の情報処理装置であって、さらに、
前記複数の機能部により実行可能な複数の行動から、優先的に実行すべき行動を選択する行動選択部を備える、情報処理装置。
【請求項6】
請求項に記載の情報処理装置であって、
前記行動選択部は、
前記力学的情報に基づく自由エネルギーが一定であり、かつ、複数の前記行動を実行可能なマルチタスク条件下で、
各前記機能部の目標値に対する予測誤差の最小化と、前記複数の行動に要するエネルギーの最大化と、を行う組み合わせ最適化問題を解くことにより、前記優先的に実行すべき行動を決定する、情報処理装置。
【請求項7】
知的行動を代替可能な情報処理装置であって、
脳の複数の異なる機能について、各機能に関する行動パターンをそれぞれ学習した、各機能に対応する複数の機能部と、
前記複数の機能部を統合した脳全体に対して電気的情報が入力された際に、前記脳全体の電磁気的解析を行うことにより得られる力学量である力学的情報を求め、前記力学的情報を、統合された前記複数の機能部の重み値に関連付ける情報統合部と、
前記力学的情報としての前記力学量が予め設定された閾値より大きくなった場合に、前記複数の機能部の重み値を更新する可塑性部と、
前記複数の機能部により実行可能な複数の行動から、優先的に実行すべき行動を選択する行動選択部と、
記憶部と、
を備え、
各前記機能部は、前記入力された電気的情報と、前記力学的情報と、の少なくとも一方に対する学習結果を前記記憶部に記憶し、
前記可塑性部は、前記複数の機能部の重み値を更新することで、前記力学的情報の更新を誘発し、
前記行動選択部は、更新後の前記重み値と、前記力学的情報とを用いて、前記選択を行う、情報処理装置。
【請求項8】
情報処理装置に知的行動を模擬させる方法であって、
脳の複数の異なる機能について、各機能に関する行動パターンをそれぞれ学習させた複数の機能部を準備する工程と、
電気的情報を取得する工程と、
前記複数の機能を統合した脳全体に対して、取得した前記電気的情報が入力された際に、前記脳全体の電磁気的解析を行うことにより得られる力学量である力学的情報を求める工程と、
前記力学的情報を、統合された前記複数の機能の重み値に関連付ける工程と、
前記力学的情報としての前記力学量が予め設定された閾値より大きくなった場合に、前記複数の機能部の重み値を更新する工程と、
を備える、方法。
【請求項9】
コンピュータプログラムであって、
脳の複数の異なる機能について、各機能に関する行動パターンをそれぞれ学習させた複数の機能部を準備するステップと、
電気的情報を取得するステップと、
前記複数の機能を統合した脳全体に対して、取得した前記電気的情報が入力された際に、前記脳全体の電磁気的解析を行うことにより得られる力学量である力学的情報を求めるステップと、
前記力学的情報を、統合された前記複数の機能の重み値に関連付けるステップと、
前記力学的情報としての前記力学量が予め設定された閾値より大きくなった場合に、前記複数の機能部の重み値を更新するステップと、
をコンピュータに実行させる、コンピュータプログラム
【請求項10】
記憶媒体であって、
請求項に記載のコンピュータプログラムを記憶する、記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理装置に知的行動を模擬させる方法、コンピュータプログラム、及び、それを記憶した記憶媒体に関する。
【背景技術】
【0002】
例えば人の脳のように高度な情報処理を実現する装置及びシステムが知られている(例えば、特許文献1〜3、非特許文献1,2)。特許文献1に記載のシステムは、人の脳がもつ知的情報処理を模擬するコンピュータシステムである。特許文献1に記載のシステムは、長期知覚記憶、短期知覚記憶、知覚表現の選択とワーキングメモリの情報処理、行動選択、行動出力、認知制御、をそれぞれ行うの6つの機能回路を含み、それぞれの機能が関係する脳の解剖学的部位間の相互作用を記述するための制御ロジック(フィードバック制御、フィードフォワード制御など)を有している。
【0003】
特許文献2に記載の情報処理装置は、センサで得られた物理量(映像、音声など)や、化学量(成分および組成など)を入力情報とし、入力情報保持部と内部表現コード保持部との間で双方向の変換処理(解析/逆写像)を行う解析部と、内部情報コード保持部と高次統合コード保持部との間に配置され1つまたは複数の内部表現コードを関係づけるとともにその関係を記憶する統合記憶部と、入力情報保持部、内部表現コード保持部、及び高次統合コード保持部に保持された入力情報と、内部表現コードおよび高次統合コードを監視して、解析部と統合記憶部を制御する監視制御部を有する脳型のコンピュータシステムである。
【0004】
特許文献3に記載の情報処理装置は、1つの軸索における1つの状態変数と、1つのシナプスにおける1つの状態変数を保持する機構を有し、最初の事象の発生に基づき軸索の状態変数を更新し、更新された軸索の状態変数と2番目の事象の発生に基づきシナプスの状態変数を更新する機能を有する、複数の軸索、シナプスを含むことができるニューラルネットワークからなる。特許文献3に記載の情報処理装置では、学習や記憶のために重要な神経の可塑性を表現するために、事象の発生に対する加算された重み値の変化と、ドーパミンなどの神経伝達物質による調整とに基づき、シナプスの重み値を更新する。これにより、神経の可塑性を調整する方法を提供できる。
【0005】
非特許文献1に記載の情報処理装置は、環境の変化に対する感覚入力とそれによる脳内の状態(すなわち知覚・推論、学習・記憶、注意・覚醒の状態)を示す量と行動を、自由エネルギーを最小化するように決定するモデルを有し、自由エネルギーを最小化するような行動を求める。自由エネルギーを最小化するとは、換言すれば、環境変化に対する感覚知覚の状態を示す量と、その認知の状態を示す量の差(予測誤差)を減らすことである。非特許文献1に記載の情報処理装置では、認知の状態を示す量は、自由エネルギー原理のもとで脳内の状態である知覚、記憶、注意とそれぞれ対応する神経活動、シナプス効率(シナプスコネクティビティ)、シナプスのゲインを最適化することにより決定され、これによりそれぞれ脳の誘発活動、可塑性、神経調節の特性を表現する。
【0006】
非特許文献2に記載の情報処理装置は、1つの経験に関する情報をそれと関連する概念構造の形式(統合情報の質)で特定し、かつΦmax(統合情報の量)で定量化し、その情報のメカニズムや現在の状態が、過去や未来の状態がとる確率にどのような影響を与えるか(cause-effect power)に基づき、統合された情報として脳の意識状態を評価する統合情報理論(Integrated Information Theory)からなる。脳の中にある1つのニューロンは、活性か不活性かという内部状態をもつ。この内部状態は入力情報によって影響を受け(cause)、その出力は他のニューロンに影響を与える(effect)ことから、統合情報理論を用いて、脳のニューロンの活動をミクロレベルやマクロレベルで捉えてモデル化することにより脳神経の活動を空間的、時間的、かつ活動の種類(Low, High, Burst)で再現できる。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】米国特許第9208430号明細書
【特許文献2】特開2000−259597号公報
【特許文献3】米国特許出願公開第2015/0286925号明細書
【非特許文献】
【0008】
【非特許文献1】Karl Friston、The free-energy principle: a rough guide to the brain?、Trends in Cognitive Science、2009、Vol.13, No.7、p.293-301
【非特許文献2】G. Tononi、Integrated information theory: from consciousness to its physical substrate、Nature Review Neuroscience、2016、Vol.17, No.7、p.450-461
【非特許文献3】神山 斉己、ニューロインフォマティクスと網膜研究、生物物理、2011、51(3)、p.112-117
【非特許文献4】Toru HAMASAKI, Takahiro YAMAGUCHI, Masami IWAMOTO、Estimating the influence of age-related changes in skin stiffness on tactile perception for static stimulations、Journal of Biomechanical Science and Engineering、2018、13(1)、p.17-00575
【発明の概要】
【発明が解決しようとする課題】
【0009】
しかし、特許文献1に記載の技術では、環境や身体各部からの情報の統合について、神経回路の結合やその制御ロジックだけで行っているに過ぎず、脳全体として複数の情報を統合し処理する方法については考慮されていない。また、人や環境によって異なる脳の構造(神経や血管の配置など)と、物理学的特性(材料力学、流体力学、電磁気学など)を含む力学的情報を扱うことができないので、人の脳や経験・学習における個人差を考慮することはできない。また、脳の構造と機能の関係を含んでいないので、脳の損傷による機能低下や機能改善を予測するためには利用できない。
【0010】
また、特許文献2に記載の技術では、入力情報から内部表現コード、高次統合コードへの変換のように、段階的に情報を統合して記憶する記載はあるものの、脳全体として複数の情報を統合し処理する方法については考慮されていない。また、学習モードを選択することはできるものの、神経の可塑性を表現する上で必要な、学習により重み値を書き換えるための具体的な方法については考慮されておらず、人や環境によって異なる脳の構造(神経や血管の配置など)と物理学的特性(材料力学、流体力学、電磁気学など)を含む力学的情報を扱うことができないので、人の脳や経験・学習における個人差を考慮することはできない。また、脳の構造と機能の関係を含んでいないので、脳の損傷による機能低下や機能改善を予測するためには利用できない。
【0011】
また、特許文献3に記載の技術では、複数の感覚情報入力に対して、脳全体として複数の情報を統合し処理する方法については考慮されていない。また、各脳機能に特有の神経回路が脳の情報処理に及ぼす影響の大きさについては十分に考慮されておらず、脳全体を均一な神経回路で表現し、各ニューラルネットワークにおける結合方法に力点が置かれているため、人の脳の構造と機能を考慮して効率的に情報処理を行うために適用するのは困難である。さらに、学習において重要な可塑性を調整するために神経ネットワークの重み値を書き換える方法を提供しているが、人や環境によって異なる脳の構造(神経や血管の配置など)と物理学的特性(材料力学、流体力学、電磁気学など)を含む力学的情報を扱うことができないので、人の脳や経験・学習における個人差を考慮することはできない。また、脳の構造と機能の関係を含んでいないので、脳の損傷による機能低下や機能改善を予測するためには利用できない。
【0012】
また、非特許文献1に記載の技術では、感覚刺激を与えた時の脳波計(EEG:Electroencephalograph)、脳磁計(MEG:magnetoencephalograph)、機能的MRI(Magnetic Resonance Imaging)を用いた脳活動計測データを、この情報処理装置に適用することにより、認知活動がどのようなメカニズムで行われているのか調べることができる。このため、個人の脳の構造をある程度反映させることができ、人の脳の構造と機能を考慮した情報処理を行う可能性をもっている。しかしながら、非特許文献1に記載の技術では、複数の刺激に対しての認知活動のメカニズムを考慮することができるに過ぎず、複数のタスクの中から意図的に行動選択を行う方法は含まれていない。また、脳の活動を表す実験データの統計モデルに基づき自由エネルギーを算出しており、脳の構造(神経や血管の配置など)に由来する力学的情報を含んでいないため、脳の損傷による機能低下や機能改善を予測するためには利用できない。
【0013】
また、非特許文献2に記載の技術では、脳の構造的および機能的損傷により意識レベルがどのように変化するかを調べるために有効であるものの、各脳機能に特有の神経回路が脳の情報処理に及ぼす影響の大きさについては十分に考慮されておらず、複数のタスクの中から意図的に行動選択を行う方法は含まれていない。また、脳の活動部位の変化や意識状態を知ることはできるが、学習機能を保持していないため、リハビリなどによる脳の機能改善の可能性を予測するためには利用できない。さらに、人や環境によって異なる脳の構造(神経や血管の配置など)と物理学的特性(材料力学、流体力学、電磁気学など)を含む力学的情報を扱うことができないので、人の脳や経験・学習における個人差を考慮することはできない。
【0014】
本発明は、上述した課題の少なくとも一部を解決するためになされたものであり、脳の力学的変化に伴う脳の機能変化を予測可能な技術を提供することを目的とする。
【課題を解決するための手段】
【0015】
本発明は、上述の課題の少なくとも一部を解決するためになされたものであり、以下の形態として実現することが可能である。知的行動を代替可能な情報処理装置であって、脳の複数の異なる機能について、各機能に関する行動パターンをそれぞれ学習した、各機能に対応する複数の機能部と、前記複数の機能部を統合した脳全体に対して電気的情報が入力された際に、前記脳全体の電磁気的解析を行うことにより得られる力学量である力学的情報を求め、前記力学的情報を、統合された前記複数の機能部の重み値に関連付ける情報統合部と、前記力学的情報としての前記力学量が予め設定された閾値より大きくなった場合に、前記複数の機能部の重み値を更新する可塑性部と、を備える、情報処理装置。そのほか、本発明は、以下の形態としても実現可能である。
【0016】
(1)本発明の一形態によれば、知的行動を代替可能な情報処理装置が提供される。この情報処理装置は、脳の複数の異なる機能について、各機能に関する行動パターンをそれぞれ学習した、各機能に対応する複数の機能部と、入力された電気的情報に対する、前記複数の機能部を統合した脳全体としての力学的情報を求め、前記力学的情報を、統合された前記複数の機能部の重み値に関連付ける情報統合部と、を備える。
【0017】
人の脳の構造(神経や血管の配置など)には個人差があり、それらはそのまま脳の機能・働きに影響を及ぼす。また、生まれてから成人になり年老いるまでの間における、経験や学習内容にも個人差があり、それらが人の性格、意思決定、情動行動、運動能力などの違いに影響を及ぼしている。この構成によれば、情報統合部は、脳全体としての力学的情報を、統合された複数の機能部の重み値と関連付ける。個人の脳の力学的情報は、環境や身体からの情報が変化することにより変化する。このような力学的情報を、脳の複数の機能部の重み値と関連付けることにより、力学的情報に基づいて脳の複数の機能部を再学習させることができ、可塑性に伴う脳の構造および機能の変化を表現することができる。これにより、個人の経験や、学習内容を表現することができる。また、力学的情報は、MRI(Magnetic Resonance Imaging)や、CT(Computed Tomography)などの医療用の断層撮影装置から得ることができる。情報統合部は、このような力学的情報と、脳の複数の機能部の重み値とを関連付けるため、個人の運動機能、情動機能、感覚機能などを反映させた学習をも行うことができる。さらに、力学的情報の変化は、脳神経系の損傷に伴って生じることもある。情報統合部20は、脳神経系の損傷部位が特定されると、この損傷部位の力学的情報の変化を、脳の複数の機能部の重み値に反映することができるため、学習や予測結果に変化が現れることによる、身体や精神に関連する機能低下の内容を予測できる。これらの結果、脳の力学的変化に伴う脳の機能変化を予測可能な情報処理装置を提供できる。
【0018】
(2)上記形態の情報処理装置において、前記情報統合部は、前記複数の機能部に含まれる神経ネットワークを模擬した要素を重畳することで、前記複数の機能部を統合した統合ネットワークを構成し、前記統合ネットワークに、脳の構造と物理学特性とから得られた力学モデルを適用し、前記力学モデルを適用した前記統合ネットワークに、前記入力された電気的情報を用いた電磁気的解析を行うことで、前記力学的情報を求め、求めた前記力学的情報を、前記統合ネットワークの重み値と関連付けてもよい。この構成によれば、情報統合部は、統合ネットワークに、脳の構造と物理学特性とから得られた力学モデルを適用し、電磁気的解析を行うことによって、入力された電気的情報に対する脳全体としての力学的情報を得ることができる。また、情報統合部は、得られた力学的情報を、統合ネットワークの重み値と関連付けることで再学習させることができる。
【0019】
(3)上記形態の情報処理装置では、さらに、前記力学的情報が予め設定された閾値より大きくなった場合に、前記複数の機能部の重み値を更新する可塑性部を備えていてもよい。この構成によれば、可塑性部は、力学的情報が予め設定された閾値より大きくなった場合に、複数の機能部の重み値を更新するため、脳神経系の機能的変化を模擬できる。また、複数の機能部の重み値は、脳全体としての力学的情報と関連付けられている。このため、重み値の更新は、脳全体としての力学的情報の更新へと波及するため、脳神経系の機能的変化に加えてさらに、脳神経系の構造的変化をも模擬できる。この結果、実際の脳のように、各機能ネットワークの相互作用を考慮した調整が可能となる。さらに、重み値の更新により、複数の機能部の学習モデル中の重み値を更新することができ、力学的情報の更新により、脳の構造と物理学特性とから得られた力学モデルを更新することができる。このため、更新後の学習モデルと力学モデルとを用いた処理によって、脳神経の構造・機能の変化を反映した学習が可能になる。
【0020】
(4)上記形態の情報処理装置において、前記閾値は、材料力学における降伏点に基づき決定されていてもよい。この構成によれば、重み値を更新するための閾値が、材料力学における降伏点に基づき決定されているため、ニューラルネットワークの重み値と力学的情報、換言すれば、情報学と物理学とを対応づけることで、神経の可塑性における、脳神経系の機能的変化と構造的変化を同時に表現することができる。
【0021】
(5)上記形態の情報処理装置において、前記可塑性部は、さらに、前記力学的情報を表示してもよい。この構成によれば、可塑性部は、力学的情報を表示するため、利便性を向上できる。
【0022】
(6)上記形態の情報処理装置では、さらに、前記複数の機能部により実行可能な複数の行動から、優先的に実行すべき行動を選択する行動選択部を備えていてもよい。この構成によれば、行動選択部は、複数の機能部により実行可能な複数の行動から、優先的に実行すべき行動を選択する。このため、例えば、人を模擬したデジタルヒューマンモデル(骨格、骨、筋肉、血管、心臓、臓器などの各モデルデータから、血圧や筋力を含む身体内部情報を出力可能なモデル)や、バーチャル空間における人やキャラクターの「歩く、走る、逃げる、闘う」などの身体動作や、情動行動に関する複数の行動について、意図に基づく優先行動を考慮してシミュレーションすることができ、その際に脳の構造や学習における個人差を表現できる。
【0023】
(7)上記形態の情報処理装置において、前記行動選択部は、前記力学的情報に基づく自由エネルギーが一定であり、かつ、複数の前記行動を実行可能なマルチタスク条件下で、各前記機能部の目標値に対する予測誤差の最小化と、前記複数の行動に要するエネルギーの最大化と、を行う組み合わせ最適化問題を解くことにより、前記優先的に実行すべき行動を決定してもよい。この構成によれば、行動選択部は、力学的情報に基づく自由エネルギーが一定であり、かつ、複数の行動を実行可能なマルチタスク条件下で、各機能部の目標値に対する予測誤差の最小化と、複数の行動に要するエネルギーの最大化と、を行う組み合わせ最適化問題を解くことにより、優先的に実行すべき行動を決定する。このため、行動選択部は、非常に多くの情報・データを、力学的情報という数理モデルで解析できる形式で扱うことができる。また、行動選択部が行動を選択する際には、組み合わせ最適化問題を解くことを得意とする量子コンピュータの利用も可能になることから、従来の人工知能と比較して身体性を考慮でき、かつ効率的な行動選択に関する情報処理が可能になる。
【0024】
なお、本発明は、種々の態様で実現することが可能であり、例えば、知的行動を代替可能な情報処理装置、情報処理装置に知的行動を模擬させる方法・コンピュータプログラム、このコンピュータプログラムを配布するためのサーバ装置、このコンピュータプログラムを記憶した一時的でない記憶媒体、このコンピュータプログラムを搭載したデジタルヒューマンモデル、仮想空間システム、ニューロリハビリ支援システム、シミュレーションシステム、脳機能評価システム等の形態で実現することができる。
【図面の簡単な説明】
【0025】
図1】本発明の一実施形態としての情報処理装置の構成を例示した説明図である。
図2】機能部と情報統合部とについて説明する図である。
図3】機能部の学習について説明する図である。
図4】再帰型ニューラルネットワークの一例を示す図である。
図5】時間間隔毎の機能マップ及び重み値の一例を示す図である。
図6】機能部と力学モデルとの統合について説明する図である。
図7】脳全体の硬さ分布と、ニューラルネットワークの重み値との関連付けについて説明する図である。
図8】機能部の各神経ネットワークが交差する脳機能部位における重み値及び弾性率を表す図である。
図9】可塑性部について説明する図である。
図10】行動選択部について説明する図である。
図11】脳に力学的損傷が発生した場合の一例を示す図である。
【発明を実施するための形態】
【0026】
<実施形態>
図1は、本発明の一実施形態としての情報処理装置1の構成を例示した説明図である。情報処理装置1は、人の知的行動を、人に代わって行うことのできるコンピュータであり、AI(Artificial Intelligence)とも呼ばれる。本実施形態の情報処理装置1は、以下の構成を有することにより、脳の力学的変化に伴う脳の機能変化を予測することができる。本実施形態では生物の一例として人を挙げているが、人に限らず、他の生物の知的行動を情報処理装置1に実現させてもよい。
【0027】
情報処理装置1は、機能部10と、情報統合部20と、可塑性部30と、行動選択部40とを備えている。情報処理装置1への入力100は、環境や身体からの刺激や信号を表す電気的情報である。入力100としては、例えば、外部環境の情報(光、音、熱、振動、加速度など)、五感の情報(視覚、聴覚、触覚、味覚、嗅覚)、身体内部の情報(血圧、心拍数、二酸化炭素濃度など)で感じる情報を例示できる。情報処理装置1からの出力200は、環境や身体への反応や信号を表す電気的情報である。出力200としては、例えば、筋活性度やそれに基づく動き・表情のパターンなどを例示できる。
【0028】
機能部10は、脳の複数の異なる機能(例えば、脳の感覚機能、情動機能、思考機能、運動機能)に関する行動パターンをそれぞれ記憶する複数の機能部N1,N2,・・・,NNにより構成されている。各機能部N1〜NNは、それぞれ、脳の神経ネットワークを模擬可能な構成、例えばニューラルネットワーク(Neural Network)により実現され、図示しない記憶部に記憶されている。各機能部N1〜NNは、予め与えられた多くの入力100に対して、脳の各機能にそれぞれ適した学習方法を用いて予め学習することにより準備されている。また、各機能部N1〜NNは、新たな入力100を受け付け、出力200を出力するまでの一連のプロセスを経た学習を行うことができる。学習の一例としての強化学習を行った事例について、詳細は後述する。
【0029】
情報統合部20は、機能部10の各機能部N1〜NNを統合して、脳全体としての、入力100(電気的情報)に対する力学的情報を求める。情報統合部20は、さらに、求めた力学的情報を、統合された脳全体のニューラルネットワークの重み値に関連付ける。具体的には、本実施形態の情報統合部20は、各機能部N1〜NNに含まれる神経ネットワークを模擬した要素(ノード、リンク)を重畳することで、各機能部N1〜NNを統合した統合ネットワークを構成し、この統合ネットワークに、脳の構造と物理学特性とから得られた力学モデル21を適用する。情報統合部20は、力学モデル21を適用した統合ネットワークに、入力100を用いた電磁気的解析を行うことで、力学的情報を求め、求めた力学的情報を、統合ネットワークの重み値と関連付ける。詳細は後述する。
【0030】
可塑性部30は、情報統合部20が求めた力学的情報が、予め設定された閾値より大きくなった際に、力学的情報と対応する脳全体のニューラルネットワークの重み値などの情報を、再学習により更新することで、情報処理装置1が実現する脳の構造と機能とを変化させる。詳細は後述する。
【0031】
行動選択部40は、機能部10の各機能部N1〜NNにより実行可能な複数の行動の中から、優先的に実行すべき行動を選択する。具体的には、本実施形態の行動選択部40は、力学的情報に基づく自由エネルギーが一定であり、かつ、複数の行動を実行可能なマルチタスク条件下で、各機能部N1〜NNの目標値に対する予測誤差の最小化と、複数の行動に要するエネルギーの最大化と、を行う組み合わせ最適化問題を解くことにより、優先的に実行すべき行動を決定する。行動選択リスト41には、行動選択部40が選択可能な行動が予め記憶されている。例えば、行動N1_A1〜A4は、機能部N1に関する行動であり、行動N2_A1〜A4は、機能部N2に関する行動である。なお、行動選択リスト41には、処理の過程で新たな行動候補が加えられ、更新されていく。詳細は後述する。
【0032】
情報処理装置1は、与えられた入力100に対して、機能部10、情報統合部20、可塑性部30、及び行動選択部40により次の運動を選択して、出力200を出力するループを繰り返すことにより、学習し、成長するAIを実現できる。この情報処理装置1によれば、例えば、脳の特定部位における力学的損傷に関連する脳の機能低下を予測し、機能改善のために必要な行動選択を繰り返し、脳に力学的変化を与えることによる再学習と再予測の結果とから、機能改善を予測することも可能となる。
【0033】
図2は、機能部10と情報統合部20とについて説明する図である。図2(A)〜(D)は、機能部10に含まれる各機能部N1〜NNの一例を表す図である。図2(A)では、感覚機能としての視覚に関係する機能部N1を、神経ネットワークの形で表現している。同様に、図2(B)は、感覚機能しての聴覚に関係する機能部N2を表し、図2(C)は、情動機能に関係する機能部N3を表し、図2(D)は、運動機能に関係する機能部N4を表している。図中の黒丸は、視床、体性感覚野、大脳基底核、扁桃体などの脳の機能部位を表す神経細胞の集合(各機能部位内の神経細胞同士の結合を含む)であり、ノードNと呼ぶ。各ノードNを結ぶリンクLKは、神経細胞の集合同士を結合する神経線維の集合を表している。各機能部N1〜NNにおける神経ネットワークの配置には、例えば、計測可能な個人の形状や、解剖学的部位の配置、血管や脳脊髄液の配置などを反映させてもよい。各機能部N1〜NNは、それぞれ、例えば、光、音、匂い、熱、振動、加速度、血圧、心拍数、二酸化炭素濃度などの電気的情報を入力100として受け取る。入力100は、各機能部N1〜NN内のノードNとリンクLKとを通じて伝達され、情報処理されて、環境・身体への反応などの電気的情報(出力200)として出力される。
【0034】
脳にはおよそ1000億個の神経細胞があるが、本実施形態の情報処理装置1では、それらの神経細胞を各機能部N1〜NN(図1)に分けて、神経細胞の集合体として扱う。機能部10は、図2(A)〜(D)のような脳の神経ネットワークを模擬したニューラルネットワークにより構成されているため、従来のように、大脳皮質と大脳辺縁系のみを考慮したものではなく、脳神経系への入力から出力までを考慮することができ、脳幹なども神経回路に含むことができる。図2(D)に示す運動機能N4は、姿勢制御をしながら目標運動を行うための神経ネットワークであるため、例えばコップを手にとり特定の場所に移動させるといった機能を実現させることが可能であり、従来「経験」としてモデル化されていたものに相当し得る。
【0035】
機能部10の各機能部N1〜NN(図1)を作成する際には、各機能を表す神経ネットワークを用いて学習が行われる。この際、各機能に応じて、適切な学習方法(教師なし学習、教師あり学習、強化学習など)が選択される。例えば、運動機能において重要な大脳基底核機能を表すためには強化学習が選択され、小脳の機能を表すためには教師あり学習が選択され、運動野・体性感覚野の機能を表すためには教師なし学習が選択される。一方、情動機能に関連する扁桃体や側坐核の機能を表すためには、強化学習に関連する学習方法が選択されるなど、各機能に応じて学習方法が選択され得る。なお、図2(A),(B)において、感覚機能としての視覚に関係する機能部N1と、感覚機能しての聴覚に関係する機能部N2とに区別しているように、脳のある機能(上記例では感覚機能)と、機能部10内の機能部N1〜NNとの対応関係は、1対多としてもよい。また、脳の複数の機能(例えば、情動機能と感覚機能)を、機能部10内の1つの機能部NNにまとめることで、対応関係を多対1としてもよい。
【0036】
図3は、機能部10の学習について説明する図である。図3(A)は、2層に並べられたユニットを持つニューラルネットワークの一例を表す図である。図3(B)は、1層のユニットを持つニューラルネットワークの一例を表す図である。図3(C)は、運動機能に関係する機能部N4を例示した説明図である。図3(D)は、機能部N4の強化学習の様子を表す説明図である。図3(E)は、機能部N4の筋制御についての機能マップの一例を表す図である。
【0037】
上述の通り、機能部10の各機能部では、新たな入力100の処理を経た学習を行う。以降、図3(C)及び(D)に表す、運動機能に関係する機能部N4の強化学習について例示して説明する。図3(D)に表すように、運動機能に関係する機能部N4では、大脳基底核を含む神経ネットワークが模擬されている。この大脳基底核の機能の一つである、姿勢維持を目的とした強化学習を行う場合、強化学習アルゴリズムの利用において、図3(B)に示す1層のユニットを持つニューラルネットワークを複数個用いることによって、図3(D)に示す機能部N4−1を学習モデル化する。例えば、身体からの入力100として、単関節の関節角度と、関節角速度とを用いて、出力200として、重力下において姿勢維持を実現するための各筋の筋活性度を得ることを目的とした強化学習を行う。すると、図3(E)に示すように、関節角度と関節角速度との入力に対して、それぞれの筋毎に姿勢維持を実現する最適な活性度が得られる筋制御関数、すなわち機能マップを得ることができる。また、最適値が得られたときの機能マップと、重み値Wijとが、それぞれの機能部ごとに、記憶部に記憶される。
【0038】
図4は、再帰型ニューラルネットワークの一例を示す図である。図3(D)に示す機能部N4−1の学習モデル化において、例えば、脳幹から視床、視床から体性感覚野へと伝達される神経信号をも加味する場合、図3(A)に示す2層に並べられたユニットを持つニューラルネットワークや、3層以上の多層のニューラルネットワークを用いて、神経ネットワークの結合性に応じて学習モデルを作成することができる。この際、図4に示す再帰型ニューラルネットワークRNN(Recurrent Neural Network)を用いると、空間における学習だけでなく時系列の学習を行うこともできる。再帰型ニューラルネットワークは、文章などの連続的な情報を処理する自然言語処理の分野で利用されている。さらに、再帰型ニューラルネットワークRNNに加えて、長・短期記憶LSTM(Long Short-Term Memory)の方法を併用すれば、長期にわたる記憶を実現できるため好ましい。
【0039】
図5は、時間間隔毎の機能マップ及び重み値Wijの一例を示す図である。上述のように、再帰型ニューラルネットワークRNNと長・短期記憶LSTMとを利用すれば、図5に示すように、時間間隔毎に最適な機能マップと重み値Wijを得ることができ、長期の時間において学習した情報を、機能マップを用いて記憶として蓄積することができる。最適値が得られた際の機能マップの時間的変化及び重み値Wijの時間的変化に関する情報は、それぞれの機能部ごとに、記憶部に記憶される。人は、生まれてからの経験を各機能について、記憶として蓄積していると考えられる。ただし、全ての記憶を即座に引き出せるわけではなく、即座に引き出せる記憶には制限があると考えられる。本実施形態の情報処理装置1では、即座に引き出せる記憶の情報は、機能マップからルックアップテーブルとして利用することにより取得でき、通常の情報は、重み値Wijを用いた計算から取得できる。
【0040】
図3(E)の例では、関節角度と、関節角速度とを入力とした例を示した。しかし、これらの関節角度や関節角速度に関する情報は、関節にある筋骨格系の機械受容器である関節包受容器により検知され、電気的情報として脳に伝達される。このように、環境や身体からの刺激や信号を電気的情報として扱うためには、機械受容器のような、機械刺激を電気的情報に変換する方法が必要である。この点、Hodgkin-Huxleyが提案した非線形微分方程式などを用いて、環境からの刺激を電気的情報に変換する数理モデルを利用できる。視覚、聴覚、触覚においていくつかの数理モデルが提案されており、例えば、非特許文献3に記載の技術を利用すれば、フラッシュ光の入力に対する光感受性電流を出力することができる。また、非特許文献4に記載の技術を利用すれば、有限要素法を用いた皮膚の力学モデルにより手指皮膚に圧迫や2点刺激を与えたときのメルケル細胞のインパルス応答を、それと相関があるミーゼス応力として出力することができる。このような各感覚器の数理モデルを用いることによって、刺激に対する電気的情報を得ることができる。
【0041】
図2(E)は、機能部N1〜NNの各神経ネットワークを統合した統合ネットワークNjの一例を表す図である。図2(F)は、脳の構造と物理的特性の説明図である。図2(F)では、実際の脳の構造と、材料力学及び流体力学に基づく物理的特性と、を表現した計算モデル21を概念的に表している。計算モデル21は、材料力学と流体力学の物理学計算を行うための基本モデルであり、以降「力学モデル21」とも呼ぶ(図1:情報統合部20、力学モデル21)。力学モデル21は、予め算出されて、情報処理装置1の図示しない記憶部に記憶されている。この力学モデル21には、例えば、脳の構造や、血管配置による特性が反映されている。力学モデル21に反映されている脳の特性は、ある個人のものであってもよく、一般化されたものであってもよい。図2(G)は、統合ネットワークNjと、計算モデル21との統合を説明する図である。図2(F)は、入力100に対する応力分布の一例を表す図である。
【0042】
情報統合部20は、機能部10の各機能部N1〜NNが入力100として受け取る電気的情報を、力学モデル21を用いて統合し、脳全体の力学的情報(例えば、応力分布)に変換する。具体的には、情報統合部20は、図2(F)に示す力学モデル21に、図2(E)に示す統合ネットワークNj(機能部N1〜NNの各神経ネットワークを統合したもの)の配置を用いた電磁気的解析を行う(2(G))。これにより、情報統合部20は、統合ネットワークNjに対して入力100が与えられた際の、ある時刻t1における応力分布Ns(t1)を求めることができる。
【0043】
図6は、機能部N1と、力学モデル21との統合について説明する図である。情報統合部20は、統合ネットワークNjとは別に、図2(A)〜(D)に示す各機能部N1〜NNのそれぞれに対して、力学モデル21を適用して、それぞれの応力分布を得てもよい。図6の例では、情報統合部20は、力学モデル21に、機能部N1の配置を用いた電磁気的解析を行うことにより、機能部N1に対して入力100が与えられた際の、ある時刻t1における応力分布Ns(t1)を求めている。図6の場合は、感覚機能としての視覚が、外部から刺激を受け取った場合の、脳の応力分布が得られることとなる。
【0044】
情報統合部20は、さらに、統合された力学的情報(上述の例では、応力分布)を、ニューラルネットワークの重み値Wijなどと関連付けてもよい。従来では、力学的情報の理論的算出を学問対象とする物理学と、ニューラルネットワークなどの複数の情報の関連性の推定を学問対象とする情報学と、を直接結び付ける方法は提供されていなかった。しかしながら、脳の神経線維の密度分布は、脳の硬さ分布と強い関連があるため、脳の硬さ分布において硬い部位は、脳の神経線維の分布において神経線維の密度が大きいと言える。そして、神経線維の密度が大きいということは、神経伝達がしやすくなる、すなわちニューラルネットワークの重み値が大きくなることがわかる。以降では、この着想に基づいて得られた、力学的情報としての脳全体の硬さ分布と、ニューラルネットワークの重み値とを関連付ける方法について説明する。
【0045】
図7は、脳全体の硬さ分布と、ニューラルネットワークの重み値との関連付けについて説明する図である。図7(A)は、脳全体の硬さ分布を表す力学モデル21を表す。図7(B)は、ニューラルネットワークとして表された脳全体の学習モデル22を表す。ここで、力学モデル21(図1:情報統合部20、力学モデル21、図7(A))において、脳は非線形の力学的特性を示すが、微小変形における線形の力学特性のみを考慮して、力学モデル21を式(1)のように表現する。式(1)において、σiは相当応力を、Eijは弾性率を、εiは相当ひずみを、σj0は初期の相当応力を、それぞれ表す。なお、i,j=1〜nであり、nは脳の部位の全数を表す。
【0046】
【数1】
【0047】
一方、ニューラルネットワークで表現される学習モデル22(図1:情報統合部20、学習モデル22、図7(B))を式(2)のように表現する。式(2)において、yiは出力値を、Wijは重み値を、xiは入力値を、bjはバイアスを、それぞれ表す。なお、i,j=1〜nであり、nは脳の部位の全数を表す。式(2)の右項には総和規約を用いた。
【0048】
【数2】
【0049】
上述した脳全体の硬さ分布と、ニューラルネットワークの重み値との対応関係を考慮すると、図7(A)に示す力学モデル21の弾性率Eijは、図7(B)に示す学習モデル22の重み値Wijと等価になると考えることができる。ここで、弾性率Eijは、ある部位iからある部位j方向への弾性率を示し、重み値Wijは、ある部位iからある部位jに信号が伝達するときの重み値を表す。このように、弾性率Eijと重み値Wijが等価であるなら、図7(A)に示す力学モデル21の相当応力値σiと、図7(B)に示す学習モデル22の出力値yiも等価になると考えることができる。
【0050】
ただし、例えば有限要素モデルでは、Eijは通常、直交座標系で表現される。しかし、図7(B)の学習モデル22における重み値Wijや、図7(A)の力学モデル21の弾性率Eijは、結合する部位どうしをつなぐ線分の方向を表す非直交基底ベクトルで表現される。このため、有限要素モデルなどと関連付けるためには、式(3)に示すように新座標x’iおよび旧座標xiそれぞれの基底ベクトルτ’iおよびτiについて、座標変換が必要となる。式(3)の座標変換を行うことにより、力学モデル21で得られる弾性率Eijや、相当応力σiを、学習モデル22の重み値Wijや、出力値yiと対応付けることが可能になる。
【0051】
【数3】
【0052】
図8は、機能部N1〜N4の各神経ネットワークが交差する脳機能部位における重み値及び弾性率を表す図である。図2(A)〜(D)に示す各機能部N1〜N4を構成するノードNの中には、複数の機能部N1〜NNの間で重複するノードNも存在する。脳機能のハブとなっている視床や島皮質などがそれに相当する。このような場合、図8に太枠の丸印で示すように、1つの脳機能部位Npに、重複する複数のノードNが存在する状態となる。このため、図7で説明した、脳全体の硬さ分布とニューラルネットワークの重み値の対応関係(力学モデル21と学習モデル22との対応関係)をそのまま適用できる。
【0053】
MRE(Magnetic Resonance Elastography)を用いると、脳組織の弾性特性の分布を求めることができる。MREとは、高磁場のMRI(Magnetic Resonance Imaging)装置の中で駆動できる外部加振機により、振動と同期した振動勾配磁場を与えることにより、対象とする組織の波の画像から組織の粘弾性特性を求める手法である。解像度の問題はあるが、MREを用いれば、個人の脳組織の弾性率Eijを求めることができる。一方、高磁場のMRI装置を用いた拡散MRIの強調画像DWI(Diffusion Weighted Imaging)や、DSI(Diffusion Spectrum Imaging)の手法により得られたデータを、DSI Studioなどのソフトウェアを用いて解析することにより、個人の脳の構造的なネットワークを構築することができ、上記結合する部位どうしをつなぐ線分の方向に関する情報を得ることができる。これにより、神経の方向に対応する個人の脳組織の弾性率Eijを得ることができる。また、図7で説明した、脳全体の硬さ分布とニューラルネットワークの重み値の対応関係(力学モデル21と学習モデル22との対応関係)を利用すれば、重み値Wijも得ることができるため、これらを個人の脳の構造を反映させる場合の初期値として与えることができる。
【0054】
可塑性部30は、情報統合部20において変換された力学的情報を、各機能部N1〜NNの相互間における関連部位の力学量σp(例えば、相当応力値など)として表示する。また、可塑性部30は、関連部位の力学量σpが、予め設定された閾値σyより大きくなった場合に(図1:σ=σp>σy)、ニューラルネットワークの重み値Wijを更新する。ここで、閾値σyは力学量(相当応力値など)で表現される。閾値σyは、神経生理学における神経の可塑性を再現する値であり、実験データを再現するように調整され得る。
【0055】
図9は、可塑性部30について説明する図である。図9(A)は、材料力学における塑性の概略図を示す。図9(B)は、神経の可塑性の概略図を示す。図9に示すように、本実施形態の情報処理装置1において、神経の可塑性(すなわち閾値σyの設定)は、材料力学における塑性域に達する状態、すなわち降伏点と類似する考え方を採用している。材料力学において、弾性域では繰り返し変形をさせても元の状態に戻るが、一度塑性域に入れば、元の状態には戻らず材料の形が変わってしまう。それと同様に、神経においても通常の弱い信号伝達は記憶に影響を及ぼすようなことはないが、情動体験、強い感覚受容などを体験するような信号伝達があった場合、記憶や行動選択に大きな影響を及ぼすことがある。このような場合に、脳神経系において構造的、機能的変化が起きると考えられる。このように、力学的情報とニューラルネットワークの重み値、換言すれば、物理学と情報学を対応づけることは、神経の可塑性における、脳神経系の構造的変化と機能的変化を同時に表現することができる利点がある。
【0056】
このように、可塑性部30は、各機能部N1〜NNの相互間における関連部位の力学量σp(例えば、相当応力値などの力学的情報)が閾値σyより大きくなった場合、図7で説明した対応関係に基づいて、そのときの相当応力σpを出力値ypとして対応付ける(図1:可塑性部30、σp→yp)。この結果、図1に破線枠で示すように、各機能部N1〜NNでは、出力値ypを満足するような重み値Wijを導出する再学習計算が行われ、これにより重み値Wijが更新され、更新された重み値Wijが、各機能部N1〜NNの図示しない記憶部に保存される。このことは、脳神経系の機能的変化が起きたことを示している。一方、重み値Wijが更新されると、図7で説明した対応関係に基づいて、弾性率Eijも更新される(図1:可塑性部30、W→E)。これにより、脳全体の硬さ分布が変化するので、脳神経系の構造的変化が起きたことを示している。
【0057】
図1において可塑性部30から情報統合部20へ伸びる破線矢印に示すように、更新された弾性率Eijはまた、情報統合部20の力学モデル21の弾性率Eijをも更新する。同様に、更新された重み値Wijは、各機能部N1〜NNの学習モデル22の重み値Wijを更新する。更新以降の計算においては、更新後の弾性率Eijや重み値Wijを用いた計算が行われ、脳神経の構造・機能の変化を反映した学習が可能になる。通常では、各機能部N1〜NNにおいてそれぞれの機能を実現するように学習が個別に行われ、重み値Wijなどが決められるが、実際の脳においては脳内の各機能ネットワークが相互に影響を及ぼしていると考えられている。この点、本実施形態の情報処理装置1では、可塑性部30において再学習が行われることにより、重み値Wijが更新される。更新の際、応力分布に対応するように個々のネットワークの重み値Wijが調整されるため、実際の脳のように、各機能ネットワークの相互作用を考慮した調整が可能となる。
【0058】
人の脳は日常的な行動において、情報処理装置1への入力100のように、環境や身体からの刺激・信号を受け、それに対して反応する行動をとっている。その際、正常な意識状態であれば、常に現在の感覚・情動・思考・運動(各機能部N1〜NNに相当)などの状態(現在値)を知覚し、過去の経験に基づく内部モデル(学習モデル22に相当)による予測値と比較して、現在値と予測値の誤差知覚に基づき行動を選択している。本実施形態の情報処理装置1についても、この原理に基づき行動選択を行う手法を採用する。
【0059】
脳における神経活動に関して、最近の脳波計や機能的MRIなどを用いた研究から、睡眠時においても、覚醒時と同じように脳の活動が見られることがわかっている。また、人は複数のタスクを同時に行うことができるが、その許容量には限界があり、複数のタスクを同時に同じクオリティで行うことは困難である。このような観点と生体の恒常性の観点から、脳活動に必要なエネルギーは一定であると考えられる。一方、脳における物理学的な観点からも、脳に身体からの神経の電気信号、血流、脊髄液などが入ってくるが、これらの作用による自由エネルギーは、外部への損失がない限り一定であることが考えらえる。上記のような観点から、以降では、脳全体の統合された力学的情報に基づく自由エネルギーは一定であると仮定する。
【0060】
行動選択部40は、優先行動を決めるという意図に基づき、最適な行動を選択する手段を提供する。以下、複数のタスクを同時に行うことを想定し、機能ネットワークN1,N2,N3に関係するタスクをそれぞれT1,T2,T3とし、3つのタスクを同時に行うこととする。その中で、タスクT2を優先して行う場合を想定する。この場合、環境や身体からの刺激や信号といった入力100に対して、各機能部N1〜NNにおいて、タスクT1,T2,T3のそれぞれについて、各タスクの目標値(タスクの想定イメージ)と内部モデルによる予測値の誤差を、以下の式から求めることができる。ここで、内部モデルとは、記憶部に保存された重み値Wijなどに基づくニューラルネットワークモデル、あるいは、図3(E)及び図5に示した機能マップを意味する。式(4),式(5),式(6)において、eN1,eN2,eN3は予測誤差を、yN1,yN2,yN3は内部モデルによる予測値(学習モデル22の出力値yi)を、yN10,yN20,yN30は各タスクの目標値を、それぞれ表す。
【0061】
【数4】
【0062】
【数5】
【0063】
【数6】
【0064】
ここで、図7で説明した対応関係を考慮すると、内部モデルによる予測値yN1,yN2,yN3は、それぞれ相当応力σN1,σN2,σN3に対応付けられる。このため、タスクT1,T2,T3に関係づけられる脳の自由エネルギー(ヘルムホルツの自由エネルギー)は、それぞれE(σN1),E(σN2),E(σN3)と表現することができ、上述した自由エネルギーが一定であるという条件は、以下の式(7)のように表現できる。式(7)において、脳全体の自由エネルギーETotalは、全ての機能部N1〜NNが活動するためのエネルギーの総和と、それ以外の脳の定常状態をたもつためのエネルギーEhの和である。
【0065】
【数7】
【0066】
図10は、行動選択部40について説明する図である。例えば、タスクT1とタスクT3が目標通りの行動、すわなち、eN1=0,eN3=0となる状態において、優先タスクであるT2を追加することを想定する。このとき、図10に示すように、行動選択部40は、可能性のある複数の行動A11〜A34の中から、タスクT2の予測誤差eN2が最小になるような、すなわち、機能部N2の行動部分の活動が最大となるようなタスクT2の行動を選択する。この際、式(7)の自由エネルギー一定の条件により、機能部N2の活動を大きくするために自由エネルギーE(σN2)を大きくすると、他のタスクT1とT3との活動に関係するエネルギーが小さくなるため、それぞれの初期の予測誤差eN1,eN3が大きくならないように最適化される必要がある。この問題は、組み合わせ最適化問題であり、様々な解法が提案されている。
【0067】
最近では、量子アニーリング方式を用いた量子コンピュータにより、高速かつ効率的に組み合わせ最適化問題を解くことができる。このため、例えば図10に示すように、入力100が与えられてから、機能部10、情報統合部20、可塑性部30による上述した一連処理をノイマン型のコンピュータにおいて行い、その後、行動選択部40による組み合わせ最適化問題の処理においては、量子コンピュータにより行ってもよい。情報処理装置1において、多数の機能部N1〜NNを実装する場合、式(7)条件下において意図に基づく最適な行動選択を実現するためには、量子ンピューターを用いて組み合わせ最適化問題を解くことが効率的である。
【0068】
予測誤差eN1NNが0あるいは非常に小さい場合、人は知覚することなく反応する無意識行動になり、予測誤差eN1NNが大きい場合は、意識に上る意識行動となる。このため、行動選択部40は、予測誤差の大きさによって、行動が意識的なものか無意識的なものかを判定することができる。従来から、予測誤差は、人の認知活動の大きな部分を占めることが知られる一方で、意識を単純な予測誤差だけでなく、脳内における各機能の統合の度合も重要であることも知られており、この点は、現在の神経科学分野においても明らかになっていない。本実施形態の情報処理装置1では、行動選択部40は、各機能部N1〜NNの活動が力学的情報として統合され、かつ、予測誤差eN1NNを小さくするように、各機能部N1〜NNがそれぞれ担当するマルチタスクの中から、統合された脳活動のエネルギーETotalが一定である、という条件のもとで組み合わせ最適化問題を解くことにより行動を選択している。このため、従来知られていた意識に対する概念を、別の形で含んでいる。行動選択部40は、なお、全ての機能部N1〜NNにおいて予測誤差が0あるいは非常に小さい場合は、無意識行動となることから、行動選択部40は、意識行動を選択するための最適化計算を実施しない。
【0069】
行動選択部40において選択された行動A11〜A34は、出力200、すなわち環境・身体への反応・信号として表現される。出力200は、例えば、機能部N4により表される感覚運動については、筋活性度やそれに基づく身体動作となり、機能部N4により表される情動行動については、表情筋の筋活性度やそれに基づく表情のパターン(喜び、怒りなど)となる。
【0070】
各機能部N1〜NNにおいて、思考に関連する神経ネットワークを考えるとき、様々な環境からの入力100と、各環境への反応・行動が関連付けられた出力200とが対応付けられた機能マップが、図示しない記憶部に保存される。このような場合も、行動選択部40は、個人の考え方・思想を反映した内部モデル(学習モデル22に相当)による行動結果の予測値yN1NNと、実際の行動結果の予測誤差eN1NNが得られた際、意識的な感情の変化(喜び、怒りなど)を誘発させたり、次の行動選択のための行動候補(関連する思考の機能部N1〜NN)を挙げる。図1に示す行動選択リスト41内の行動N1#A1〜NN#N4や、図10に示す行動A11〜A34は、このようにして機能部N1〜NNごとに候補として挙げられる行動である。換言すれば、各機能部N1〜NNが新たな入力100に対して学習を続ける過程で大きな予測誤差eN1NNが生じた際に、行動選択部40がそれを意識的な脳活動として捉えることで、行動選択部40は、機能部N1〜NNにおける新たな行動候補として行動選択リスト41に加える。これにより、新たな行動候補は、行動選択部40が組み合わせ最適化問題を解くときに、選択の対象となり得る。
【0071】
このように、情報処理装置1では、環境や身体からの刺激や信号を入力100として、機能部10、情報統合部20、可塑性部30、行動選択部40によって次の行動を選択し、環境や身体への反応や信号を出力200として出力するループを繰り返す。これにより、情報処理装置1では、人が経験を通して学習し、成長する過程を模擬することができる。この際、各機能部N1〜NNでは、各機能の神経ネットワークに関する学習結果(重み値Wij、最適解が得られた時の機能マップ)が、記憶部に記憶される。また、可塑性部30は、力学量σp(力学的情報)が予め設定された閾値σyよりも大きくなった際に、脳の機能(重み値Wij)を変化させ、それに伴い脳の神経構造(弾性率Eij)をも変化させる(図1:可塑性部30、W→E、可塑性部30から情報統合部20へ伸びる破線矢印)。行動選択部40は、その変化した、換言すれば成長した脳の構造(力学モデル21)と機能(学習モデル22)とを用いて、次の行動を選択する。行動により予測誤差eN1NNが生じた場合、行動選択部40は、その行動を行動選択リスト41に加える。これら一連のプロセスは、人の経験値や積極性など、人格に関わる部分を積み上げることに対応している。なお、力学モデル21と学習モデル22は、ともに入力100が与えられる限り、計算が継続される。すなわち、力学モデル21においても応力値が0にリセットされることはなく、繰り返し学習の際にも更新され、応力値は更新され続けられる。
【0072】
図11は、脳に力学的損傷が発生した場合の一例を示す図である。例えば、破線枠で囲んだ脳の特定部位において、神経の力学的損傷が発生した場合、その部位の弾性率Eijは0になる。ここで、図7で説明した対応関係を考慮すると、力学的損傷が発生した部位におけるニューラルネットワークの重み値Wijも同様に、0になる。この結果、損傷した機能に関係する行動はできなくなる。このことから、情報処理装置1において、脳の力学的損傷に伴う脳機能低下を表現することが可能になる。
【0073】
また、外部から何らかの寄与を与えることによって、脳の特定部位において力学的変化を与えることにより、弾性率Eijを変化させた場合も同様に考えることができる。この場合も、図7で説明した対応関係を考慮して、弾性率Eijが変化した部分におけるニューラルネットワークの重み値Wijを変化させる。変化した重み値Wijを利用して再学習を行い、得られた再予測の結果から、脳への寄与が機能改善につながるかどうかを予測することが可能となる。ここで、外部からの寄与として、機能改善のための行動選択、すなわち図10で説明したように、目標値に対する予測誤差eN1NNを最小化するように、関連する各機能部N1〜NNの脳活動を大きくするような行動選択を繰り返すことによって、脳に力学的変化、すなわち弾性率Eijの変化が起こる可能性がある。このため、図10で説明した行動選択は、脳の損傷や力学的変化に伴う機能低下を改善する上で重要である。
【0074】
なお、図1図10では、予め設定された各機能部N1〜NN(神経ネットワーク)を対象として説明した。しかし、実際に脳に損傷が起こった場合は、元の神経ネットワークとは関係のない部分において、新たな神経ネットワークを構築して再学習が行われる場合もある。これを実現するためには、図2に示す各機能部N1〜NNを構成する各ノードNの再配置や、新たなリンクLKによる接続が行われる必要がある。ノードNの再配置や、新たなリンクLKによる接続のためには、自己組織化の理論などが有効になる。
【0075】
コンピュータ上で人の快適性、作業性、こころの状態を評価するために、デジタルヒューマンモデルは有効である。デジタルヒューマンモデルとは、骨格、骨、筋肉、血管、心臓、臓器などの各モデルデータから、血圧や筋力を含む身体内部情報を出力可能なモデルである。本実施形態の情報処理装置1は、このようなデジタルヒューマンモデルの、感覚運動や情動行動などの入出力を制御できる。デジタルヒューマンモデルと、本実施形態の情報処理装置1とを組み合わせて使用すれば、コンピュータ上で、人の快適性や作業性などを評価することができる。
【0076】
例えば、ゴルフのスウィングのような感覚運動を想定する。図2(D)に示す機能部N4(神経ネットワーク)を用いて、身体の複数の関節・筋肉からの固有感覚情報や、手における触覚情報などが体性感覚野に伝達される。また、運動野から、目的のゴルフスウィングを達成させるような各筋の筋活性度に関する情報が、身体へ伝えられる。この際、大脳基底核や小脳と連携をとり、姿勢制御がされると共に、目標イメージの運動軌跡となるような筋活性度に調整される。このように機能部N4に対する学習が行われ、機能部10の記憶部に機能マップとして保持される。環境として風が強い場合や、足場が悪い場合は、図10に示す複数の行動選択の中から、ゴルフスウィングを優先行動とした組み合わせ最適化が行われる。この際、例えば、情動として悲しい思いをした場合、それに関連する機能部N1〜NNに活動エネルギーの一部が充てられ、ゴルフスウィングの筋制御のために十分な活動エネルギーを充てることができなくなり、上手いショットが打てないなどの状況をシミュレーションすることが可能である。
【0077】
一般に、脳の側坐核において報酬が得られる条件が記憶され、扁桃体において恐怖・不安が得られる条件が記憶される。人が快適性を評価する場合は、この2つの脳機能部位を含む神経ネットワークが関与していると考えられる。本実施形態の情報処理装置1では、図10に示すような方法により、内臓からの心拍、呼吸、血圧に関連する情報や、嗅覚や触覚などに関連する情報を入力100とし、快・喜びに対しては側坐核を含む報酬系の機能部用いて学習を行い、不快・恐れに対しては扁桃体を含む機能部において強化学習を用いて学習を行うことができる。
【0078】
また、快・不快が得られるときの入力100と出力200とを対応付ける機能マップなどを得ておき、現在の状況と機能マップなどによる予測誤差eN1NNを求める。行動選択部40は、得られた予測誤差eN1NNから快・不快の割合を求めることができるので、現在の環境における快・不快の評価が可能になる。さらに、快・不快に対する行動は、複数の行動選択の中から、意図に基づき、例えば快・喜びに対してはより多くの報酬が得られるような行動が選択されるように、不快・恐れに対しては逃げるような行動が選択されるようにしてもよい。本実施形態の情報処理装置1によれば、従来にない新しい方法で快・不快を評価することができ、かつそれに対して意図に基づく行動選択が可能になる。
【0079】
本実施形態の情報処理装置1では、個人の脳の構造を、機能部N1〜NNにおける神経ネットワークの配置の初期値として与えてもよい。そうすれば、環境や身体からの複数の刺激・信号(入力100)による学習を繰り返すことで、個人ごとに異なる学習、成長が可能となる。例えば、デジタルヒューマンモデルと組み合わせたゴルフスウィングの事例においては、個人の脳神経の構造や、個人の身体の構造的特徴などを取り入れた学習計算を行うことができるため、スポーツ競技の強化などにおける個人差に対応することができる。また、快・不快の評価においても、個人の脳神経の構造を考慮してもよい。図10で説明した、学習に伴う行動選択リスト41の増加によって、個人の特性に応じた行動評価をも可能となる。個人の生理量(血圧、心拍数、呼吸数、運動など)を計測した上で、その情報を入力100としたときの、その個人の反応・対応(官能評価結果など)を出力200とした機能マップを作り、学習計算と対応させることができれば、個人に対応した学習・成長モデルの精度はさらに向上する。
【0080】
また、事故などで頭部に損傷を受けた場合や、精神疾患などで脳の神経構造に器質的な変化が起きた場合、図11で説明したのように、力学的特性の変化に応じて、重み値Wijが変化し、脳の各機能(機能部N1〜NN)にも影響を及ぼす。このため、本実施形態の情報処理装置1は、医療の分野における診断や、治療計画策定の際にも有用な知見を与える。また、リハビリや食事の改善など、身体から受ける刺激・信号(入力100)を変化させることを繰り返し、意識的に行動する、すなわち図10で説明した脳の機能不全(あるいは脳の機能低下)を改善させるような活動を繰り返し選択することにより、関連する神経ネットワークの脳活動(例えば、機能部N1)に大きな変化を与えることができれば、それに関連する脳(たとえば、機能部N4)の神経構造も変化し機能改善するような神経ネットワークを再構成できる可能性もある。このように、本実施形態の情報処理装置1は、身体障害や精神疾患のリハビリを支援するための、ニューロリハビリ支援ツールとしても利用できる。
【0081】
<本実施形態の変形例>
本発明は上記の実施形態に限られるものではなく、その要旨を逸脱しない範囲において種々の態様において実施することが可能であり、例えば次のような変形も可能である。
【0082】
[変形例1]
上記実施形態では、情報処理装置1の構成の一例を示した。しかし、情報処理装置1の構成は種々の変形が可能である。例えば、情報処理装置1は、ネットワーク上に配置された複数の情報処理装置が協働することによって構成されてもよい。この場合、例えば、機能部10、情報統合部20、可塑性部30、行動選択部40の内の少なくとも一部が、異なる情報処理装置によって実現されてもよい。例えば、情報処理装置1には、異なる人にそれぞれ対応した、複数組の機能部10、情報統合部20、可塑性部30、及び行動選択部40が含まれていてもよい。例えば、情報処理装置1は、可塑性部30と、行動選択部40との少なくとも一方を備えていなくてもよい。
【0083】
[変形例2]
上記実施形態では、機能部10の各機能部N1〜NNはニューラルネットワークにより構成されるとした。しかし、各機能部N1〜NNは、ニューラルネットワーク以外の手段(例えば、図3(E)に示した機能マップ)により構成されていてもよい。例えば、機能部10には、各機能部N1〜NNとは別に、機能部N1〜NNの各神経ネットワークを予め統合した統合ネットワークNjが記憶されていてもよい。
【0084】
[変形例3]
上記実施形態では、情報統合部20の力学モデル21は、材料力学と流体力学の物理学計算を行うためのモデルであると例示した。しかし、力学モデル21は、材料力学、流体力学、電磁気学など、少なくとも1つの物理的特性を表現したモデルとして構成されていてもよい。
【0085】
[変形例4]
上記実施形態では、可塑性部30は、力学的情報が予め設定された閾値より大きくなった場合に重み値を更新するとした。しかし、可塑性部30は、閾値を用いずに、処理のつど重み値を更新してもよい。例えば、重み値を更新するための閾値は、材料力学における降伏点とは関係なく決定されてもよく、使用者により変更可能にされてもよい。例えば、可塑性部30は、力学量(力学的情報)の表示を省略してもよい。
【0086】
[変形例5]
上記実施形態では、行動選択部40は、複数の行動を実行可能なマルチタスクの条件下で、実行すべき複数の行動と、さらに優先的に実行すべき行動とを選択した。しかし、行動選択部40は、単一の行動のみを実行する条件下で、実行すべき1つの行動を選択してもよい。例えば、行動選択部40は、機能部の目標値に対する予測誤差の最小化と、行動に要するエネルギーの最大化と、を行う組み合わせ最適化問題を解く以外の任意の方法で、行動を選択してもよい。
【0087】
以上、実施形態、変形例に基づき本態様について説明してきたが、上記した態様の実施の形態は、本態様の理解を容易にするためのものであり、本態様を限定するものではない。本態様は、その趣旨並びに特許請求の範囲を逸脱することなく、変更、改良され得ると共に、本態様にはその等価物が含まれる。また、その技術的特徴が本明細書中に必須なものとして説明されていなければ、適宜、削除することができる。上記実施形態において、ソフトウェアによって実現された機能及び処理の一部又は全部は、ハードウェアによって実現されてもよい。また、ハードウェアによって実現された機能及び処理の一部又は全部は、ソフトウェアによって実現されてもよい。ハードウェアとしては、例えば、集積回路、ディスクリート回路、または、それらの回路を組み合わせた回路モジュールなど、各種回路(circuitry)を用いることができる。
【符号の説明】
【0088】
1…情報処理装置
10…機能部
20…情報統合部
21…力学モデル
22…学習モデル
30…可塑性部
40…行動選択部
41…行動選択リスト
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11