特許6973430 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社豊田中央研究所の特許一覧

特許6973430情報処理装置、情報処理装置に知的行動を模擬させる方法、コンピュータプログラム、及び、それを記憶した記憶媒体

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6973430

(24)【登録日】2021年11月8日

(45)【発行日】2021年11月24日

(54)【発明の名称】情報処理装置、情報処理装置に知的行動を模擬させる方法、コンピュータプログラム、及び、それを記憶した記憶媒体

(51)【国際特許分類】

G06N 3/04 20060101AFI20211111BHJP

【ＦＩ】

G06N3/04

【請求項の数】10

【全頁数】24

(21)【出願番号】特願2019-30330(P2019-30330)

(22)【出願日】2019年2月22日

(65)【公開番号】特開2020-135600(P2020-135600A)

(43)【公開日】2020年8月31日

【審査請求日】2020年7月21日

(73)【特許権者】

【識別番号】000003609

【氏名又は名称】株式会社豊田中央研究所

(74)【代理人】

【識別番号】100160691

【弁理士】

【氏名又は名称】田邊淳也

(74)【代理人】

【識別番号】100157277

【弁理士】

【氏名又は名称】板倉幸恵

(72)【発明者】

【氏名】岩本正実

【審査官】渡辺順哉

(56)【参考文献】

【文献】特開２００３−３１７０７３（ＪＰ，Ａ）

【文献】国際公開第２０１８／０１５７７８（ＷＯ，Ａ１）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｎ３／００−９９／００

(57)【特許請求の範囲】

【請求項1】

【請求項2】

請求項１に記載の情報処理装置であって、
前記情報統合部は、
前記複数の機能部に含まれる神経ネットワークを模擬した要素を重畳することで、前記複数の機能部を統合した統合ネットワークを構成し、
前記統合ネットワークに、脳の構造と物理学特性とから得られた力学モデルを適用し、
前記力学モデルを適用した前記統合ネットワークに対して、前記入力された電気的情報を用いた電磁気的解析を行うことで、前記力学的情報としての前記力学量を求め、
求めた前記力学的情報を、前記統合ネットワークの重み値と関連付ける、情報処理装置。

【請求項3】

請求項１または請求項２に記載の情報処理装置であって、
前記閾値は、材料力学における降伏点に基づき決定されている、情報処理装置。

【請求項4】

請求項１から請求項３のいずれか一項に記載の情報処理装置であって、
前記可塑性部は、さらに、前記力学的情報を表示する、情報処理装置。

【請求項5】

請求項１から請求項４のいずれか一項に記載の情報処理装置であって、さらに、
前記複数の機能部により実行可能な複数の行動から、優先的に実行すべき行動を選択する行動選択部を備える、情報処理装置。

【請求項6】

請求項５に記載の情報処理装置であって、
前記行動選択部は、
前記力学的情報に基づく自由エネルギーが一定であり、かつ、複数の前記行動を実行可能なマルチタスク条件下で、
各前記機能部の目標値に対する予測誤差の最小化と、前記複数の行動に要するエネルギーの最大化と、を行う組み合わせ最適化問題を解くことにより、前記優先的に実行すべき行動を決定する、情報処理装置。

【請求項7】

知的行動を代替可能な情報処理装置であって、
脳の複数の異なる機能について、各機能に関する行動パターンをそれぞれ学習した、各機能に対応する複数の機能部と、
前記複数の機能部を統合した脳全体に対して電気的情報が入力された際に、前記脳全体の電磁気的解析を行うことにより得られる力学量である力学的情報を求め、前記力学的情報を、統合された前記複数の機能部の重み値に関連付ける情報統合部と、
前記力学的情報としての前記力学量が予め設定された閾値より大きくなった場合に、前記複数の機能部の重み値を更新する可塑性部と、
前記複数の機能部により実行可能な複数の行動から、優先的に実行すべき行動を選択する行動選択部と、
記憶部と、
を備え、
各前記機能部は、前記入力された電気的情報と、前記力学的情報と、の少なくとも一方に対する学習結果を前記記憶部に記憶し、
前記可塑性部は、前記複数の機能部の重み値を更新することで、前記力学的情報の更新を誘発し、
前記行動選択部は、更新後の前記重み値と、前記力学的情報とを用いて、前記選択を行う、情報処理装置。

【請求項8】

情報処理装置に知的行動を模擬させる方法であって、
脳の複数の異なる機能について、各機能に関する行動パターンをそれぞれ学習させた複数の機能部を準備する工程と、
電気的情報を取得する工程と、
前記複数の機能を統合した脳全体に対して、取得した前記電気的情報が入力された際に、前記脳全体の電磁気的解析を行うことにより得られる力学量である力学的情報を求める工程と、
前記力学的情報を、統合された前記複数の機能部の重み値に関連付ける工程と、
前記力学的情報としての前記力学量が予め設定された閾値より大きくなった場合に、前記複数の機能部の重み値を更新する工程と、
を備える、方法。

【請求項9】

コンピュータプログラムであって、
脳の複数の異なる機能について、各機能に関する行動パターンをそれぞれ学習させた複数の機能部を準備するステップと、
電気的情報を取得するステップと、
前記複数の機能を統合した脳全体に対して、取得した前記電気的情報が入力された際に、前記脳全体の電磁気的解析を行うことにより得られる力学量である力学的情報を求めるステップと、
前記力学的情報を、統合された前記複数の機能部の重み値に関連付けるステップと、
前記力学的情報としての前記力学量が予め設定された閾値より大きくなった場合に、前記複数の機能部の重み値を更新するステップと、
をコンピュータに実行させる、コンピュータプログラム。

【請求項10】

記憶媒体であって、
請求項９に記載のコンピュータプログラムを記憶する、記憶媒体。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理装置、情報処理装置に知的行動を模擬させる方法、コンピュータプログラム、及び、それを記憶した記憶媒体に関する。

【背景技術】

【0002】

例えば人の脳のように高度な情報処理を実現する装置及びシステムが知られている（例えば、特許文献１〜３、非特許文献１，２）。特許文献１に記載のシステムは、人の脳がもつ知的情報処理を模擬するコンピュータシステムである。特許文献１に記載のシステムは、長期知覚記憶、短期知覚記憶、知覚表現の選択とワーキングメモリの情報処理、行動選択、行動出力、認知制御、をそれぞれ行うの６つの機能回路を含み、それぞれの機能が関係する脳の解剖学的部位間の相互作用を記述するための制御ロジック（フィードバック制御、フィードフォワード制御など）を有している。

【0003】

特許文献２に記載の情報処理装置は、センサで得られた物理量（映像、音声など）や、化学量（成分および組成など）を入力情報とし、入力情報保持部と内部表現コード保持部との間で双方向の変換処理（解析／逆写像）を行う解析部と、内部情報コード保持部と高次統合コード保持部との間に配置され１つまたは複数の内部表現コードを関係づけるとともにその関係を記憶する統合記憶部と、入力情報保持部、内部表現コード保持部、及び高次統合コード保持部に保持された入力情報と、内部表現コードおよび高次統合コードを監視して、解析部と統合記憶部を制御する監視制御部を有する脳型のコンピュータシステムである。

【0004】

特許文献３に記載の情報処理装置は、１つの軸索における１つの状態変数と、１つのシナプスにおける１つの状態変数を保持する機構を有し、最初の事象の発生に基づき軸索の状態変数を更新し、更新された軸索の状態変数と２番目の事象の発生に基づきシナプスの状態変数を更新する機能を有する、複数の軸索、シナプスを含むことができるニューラルネットワークからなる。特許文献３に記載の情報処理装置では、学習や記憶のために重要な神経の可塑性を表現するために、事象の発生に対する加算された重み値の変化と、ドーパミンなどの神経伝達物質による調整とに基づき、シナプスの重み値を更新する。これにより、神経の可塑性を調整する方法を提供できる。

【0005】

非特許文献１に記載の情報処理装置は、環境の変化に対する感覚入力とそれによる脳内の状態（すなわち知覚・推論、学習・記憶、注意・覚醒の状態）を示す量と行動を、自由エネルギーを最小化するように決定するモデルを有し、自由エネルギーを最小化するような行動を求める。自由エネルギーを最小化するとは、換言すれば、環境変化に対する感覚知覚の状態を示す量と、その認知の状態を示す量の差（予測誤差）を減らすことである。非特許文献１に記載の情報処理装置では、認知の状態を示す量は、自由エネルギー原理のもとで脳内の状態である知覚、記憶、注意とそれぞれ対応する神経活動、シナプス効率（シナプスコネクティビティ）、シナプスのゲインを最適化することにより決定され、これによりそれぞれ脳の誘発活動、可塑性、神経調節の特性を表現する。

【0006】

非特許文献２に記載の情報処理装置は、１つの経験に関する情報をそれと関連する概念構造の形式（統合情報の質）で特定し、かつΦｍａｘ（統合情報の量）で定量化し、その情報のメカニズムや現在の状態が、過去や未来の状態がとる確率にどのような影響を与えるか(cause-effect power)に基づき、統合された情報として脳の意識状態を評価する統合情報理論(Integrated Information Theory)からなる。脳の中にある１つのニューロンは、活性か不活性かという内部状態をもつ。この内部状態は入力情報によって影響を受け(cause)、その出力は他のニューロンに影響を与える(effect)ことから、統合情報理論を用いて、脳のニューロンの活動をミクロレベルやマクロレベルで捉えてモデル化することにより脳神経の活動を空間的、時間的、かつ活動の種類(Low, High, Burst)で再現できる。

【先行技術文献】

【特許文献】

【0007】

【特許文献1】米国特許第９２０８４３０号明細書

【特許文献2】特開２０００−２５９５９７号公報

【特許文献3】米国特許出願公開第２０１５／０２８６９２５号明細書

【非特許文献】

【0008】

【非特許文献1】Karl Friston、The free-energy principle: a rough guide to the brain?、Trends in Cognitive Science、2009、Vol.13, No.7、p.293-301

【非特許文献2】G. Tononi、Integrated information theory: from consciousness to its physical substrate、Nature Review Neuroscience、2016、Vol.17, No.7、p.450-461

【非特許文献3】神山斉己、ニューロインフォマティクスと網膜研究、生物物理、2011、51(3)、p.112-117

【非特許文献4】Toru HAMASAKI, Takahiro YAMAGUCHI, Masami IWAMOTO、Estimating the influence of age-related changes in skin stiffness on tactile perception for static stimulations、Journal of Biomechanical Science and Engineering、2018、13(1)、p.17-00575

【発明の概要】

【発明が解決しようとする課題】

【0009】

しかし、特許文献１に記載の技術では、環境や身体各部からの情報の統合について、神経回路の結合やその制御ロジックだけで行っているに過ぎず、脳全体として複数の情報を統合し処理する方法については考慮されていない。また、人や環境によって異なる脳の構造（神経や血管の配置など）と、物理学的特性（材料力学、流体力学、電磁気学など）を含む力学的情報を扱うことができないので、人の脳や経験・学習における個人差を考慮することはできない。また、脳の構造と機能の関係を含んでいないので、脳の損傷による機能低下や機能改善を予測するためには利用できない。

【0010】

また、特許文献２に記載の技術では、入力情報から内部表現コード、高次統合コードへの変換のように、段階的に情報を統合して記憶する記載はあるものの、脳全体として複数の情報を統合し処理する方法については考慮されていない。また、学習モードを選択することはできるものの、神経の可塑性を表現する上で必要な、学習により重み値を書き換えるための具体的な方法については考慮されておらず、人や環境によって異なる脳の構造（神経や血管の配置など）と物理学的特性（材料力学、流体力学、電磁気学など）を含む力学的情報を扱うことができないので、人の脳や経験・学習における個人差を考慮することはできない。また、脳の構造と機能の関係を含んでいないので、脳の損傷による機能低下や機能改善を予測するためには利用できない。

【0011】

また、特許文献３に記載の技術では、複数の感覚情報入力に対して、脳全体として複数の情報を統合し処理する方法については考慮されていない。また、各脳機能に特有の神経回路が脳の情報処理に及ぼす影響の大きさについては十分に考慮されておらず、脳全体を均一な神経回路で表現し、各ニューラルネットワークにおける結合方法に力点が置かれているため、人の脳の構造と機能を考慮して効率的に情報処理を行うために適用するのは困難である。さらに、学習において重要な可塑性を調整するために神経ネットワークの重み値を書き換える方法を提供しているが、人や環境によって異なる脳の構造（神経や血管の配置など）と物理学的特性（材料力学、流体力学、電磁気学など）を含む力学的情報を扱うことができないので、人の脳や経験・学習における個人差を考慮することはできない。また、脳の構造と機能の関係を含んでいないので、脳の損傷による機能低下や機能改善を予測するためには利用できない。

【0012】

また、非特許文献１に記載の技術では、感覚刺激を与えた時の脳波計（ＥＥＧ：Electroencephalograph)、脳磁計（ＭＥＧ:magnetoencephalograph）、機能的ＭＲＩ(Magnetic Resonance Imaging)を用いた脳活動計測データを、この情報処理装置に適用することにより、認知活動がどのようなメカニズムで行われているのか調べることができる。このため、個人の脳の構造をある程度反映させることができ、人の脳の構造と機能を考慮した情報処理を行う可能性をもっている。しかしながら、非特許文献１に記載の技術では、複数の刺激に対しての認知活動のメカニズムを考慮することができるに過ぎず、複数のタスクの中から意図的に行動選択を行う方法は含まれていない。また、脳の活動を表す実験データの統計モデルに基づき自由エネルギーを算出しており、脳の構造（神経や血管の配置など）に由来する力学的情報を含んでいないため、脳の損傷による機能低下や機能改善を予測するためには利用できない。

【0013】

また、非特許文献２に記載の技術では、脳の構造的および機能的損傷により意識レベルがどのように変化するかを調べるために有効であるものの、各脳機能に特有の神経回路が脳の情報処理に及ぼす影響の大きさについては十分に考慮されておらず、複数のタスクの中から意図的に行動選択を行う方法は含まれていない。また、脳の活動部位の変化や意識状態を知ることはできるが、学習機能を保持していないため、リハビリなどによる脳の機能改善の可能性を予測するためには利用できない。さらに、人や環境によって異なる脳の構造（神経や血管の配置など）と物理学的特性（材料力学、流体力学、電磁気学など）を含む力学的情報を扱うことができないので、人の脳や経験・学習における個人差を考慮することはできない。

【0014】

本発明は、上述した課題の少なくとも一部を解決するためになされたものであり、脳の力学的変化に伴う脳の機能変化を予測可能な技術を提供することを目的とする。

【課題を解決するための手段】

【0015】

本発明は、上述の課題の少なくとも一部を解決するためになされたものであり、以下の形態として実現することが可能である。知的行動を代替可能な情報処理装置であって、脳の複数の異なる機能について、各機能に関する行動パターンをそれぞれ学習した、各機能に対応する複数の機能部と、前記複数の機能部を統合した脳全体に対して電気的情報が入力された際に、前記脳全体の電磁気的解析を行うことにより得られる力学量である力学的情報を求め、前記力学的情報を、統合された前記複数の機能部の重み値に関連付ける情報統合部と、前記力学的情報としての前記力学量が予め設定された閾値より大きくなった場合に、前記複数の機能部の重み値を更新する可塑性部と、を備える、情報処理装置。そのほか、本発明は、以下の形態としても実現可能である。

【0016】

（１）本発明の一形態によれば、知的行動を代替可能な情報処理装置が提供される。この情報処理装置は、脳の複数の異なる機能について、各機能に関する行動パターンをそれぞれ学習した、各機能に対応する複数の機能部と、入力された電気的情報に対する、前記複数の機能部を統合した脳全体としての力学的情報を求め、前記力学的情報を、統合された前記複数の機能部の重み値に関連付ける情報統合部と、を備える。

【0017】

人の脳の構造（神経や血管の配置など）には個人差があり、それらはそのまま脳の機能・働きに影響を及ぼす。また、生まれてから成人になり年老いるまでの間における、経験や学習内容にも個人差があり、それらが人の性格、意思決定、情動行動、運動能力などの違いに影響を及ぼしている。この構成によれば、情報統合部は、脳全体としての力学的情報を、統合された複数の機能部の重み値と関連付ける。個人の脳の力学的情報は、環境や身体からの情報が変化することにより変化する。このような力学的情報を、脳の複数の機能部の重み値と関連付けることにより、力学的情報に基づいて脳の複数の機能部を再学習させることができ、可塑性に伴う脳の構造および機能の変化を表現することができる。これにより、個人の経験や、学習内容を表現することができる。また、力学的情報は、ＭＲＩ（Magnetic Resonance Imaging)や、ＣＴ(Computed Tomography)などの医療用の断層撮影装置から得ることができる。情報統合部は、このような力学的情報と、脳の複数の機能部の重み値とを関連付けるため、個人の運動機能、情動機能、感覚機能などを反映させた学習をも行うことができる。さらに、力学的情報の変化は、脳神経系の損傷に伴って生じることもある。情報統合部２０は、脳神経系の損傷部位が特定されると、この損傷部位の力学的情報の変化を、脳の複数の機能部の重み値に反映することができるため、学習や予測結果に変化が現れることによる、身体や精神に関連する機能低下の内容を予測できる。これらの結果、脳の力学的変化に伴う脳の機能変化を予測可能な情報処理装置を提供できる。

【0018】

（２）上記形態の情報処理装置において、前記情報統合部は、前記複数の機能部に含まれる神経ネットワークを模擬した要素を重畳することで、前記複数の機能部を統合した統合ネットワークを構成し、前記統合ネットワークに、脳の構造と物理学特性とから得られた力学モデルを適用し、前記力学モデルを適用した前記統合ネットワークに、前記入力された電気的情報を用いた電磁気的解析を行うことで、前記力学的情報を求め、求めた前記力学的情報を、前記統合ネットワークの重み値と関連付けてもよい。この構成によれば、情報統合部は、統合ネットワークに、脳の構造と物理学特性とから得られた力学モデルを適用し、電磁気的解析を行うことによって、入力された電気的情報に対する脳全体としての力学的情報を得ることができる。また、情報統合部は、得られた力学的情報を、統合ネットワークの重み値と関連付けることで再学習させることができる。

【0019】

（３）上記形態の情報処理装置では、さらに、前記力学的情報が予め設定された閾値より大きくなった場合に、前記複数の機能部の重み値を更新する可塑性部を備えていてもよい。この構成によれば、可塑性部は、力学的情報が予め設定された閾値より大きくなった場合に、複数の機能部の重み値を更新するため、脳神経系の機能的変化を模擬できる。また、複数の機能部の重み値は、脳全体としての力学的情報と関連付けられている。このため、重み値の更新は、脳全体としての力学的情報の更新へと波及するため、脳神経系の機能的変化に加えてさらに、脳神経系の構造的変化をも模擬できる。この結果、実際の脳のように、各機能ネットワークの相互作用を考慮した調整が可能となる。さらに、重み値の更新により、複数の機能部の学習モデル中の重み値を更新することができ、力学的情報の更新により、脳の構造と物理学特性とから得られた力学モデルを更新することができる。このため、更新後の学習モデルと力学モデルとを用いた処理によって、脳神経の構造・機能の変化を反映した学習が可能になる。

【0020】

（４）上記形態の情報処理装置において、前記閾値は、材料力学における降伏点に基づき決定されていてもよい。この構成によれば、重み値を更新するための閾値が、材料力学における降伏点に基づき決定されているため、ニューラルネットワークの重み値と力学的情報、換言すれば、情報学と物理学とを対応づけることで、神経の可塑性における、脳神経系の機能的変化と構造的変化を同時に表現することができる。

【0021】

（５）上記形態の情報処理装置において、前記可塑性部は、さらに、前記力学的情報を表示してもよい。この構成によれば、可塑性部は、力学的情報を表示するため、利便性を向上できる。

【0022】

（６）上記形態の情報処理装置では、さらに、前記複数の機能部により実行可能な複数の行動から、優先的に実行すべき行動を選択する行動選択部を備えていてもよい。この構成によれば、行動選択部は、複数の機能部により実行可能な複数の行動から、優先的に実行すべき行動を選択する。このため、例えば、人を模擬したデジタルヒューマンモデル（骨格、骨、筋肉、血管、心臓、臓器などの各モデルデータから、血圧や筋力を含む身体内部情報を出力可能なモデル）や、バーチャル空間における人やキャラクターの「歩く、走る、逃げる、闘う」などの身体動作や、情動行動に関する複数の行動について、意図に基づく優先行動を考慮してシミュレーションすることができ、その際に脳の構造や学習における個人差を表現できる。

【0023】

（７）上記形態の情報処理装置において、前記行動選択部は、前記力学的情報に基づく自由エネルギーが一定であり、かつ、複数の前記行動を実行可能なマルチタスク条件下で、各前記機能部の目標値に対する予測誤差の最小化と、前記複数の行動に要するエネルギーの最大化と、を行う組み合わせ最適化問題を解くことにより、前記優先的に実行すべき行動を決定してもよい。この構成によれば、行動選択部は、力学的情報に基づく自由エネルギーが一定であり、かつ、複数の行動を実行可能なマルチタスク条件下で、各機能部の目標値に対する予測誤差の最小化と、複数の行動に要するエネルギーの最大化と、を行う組み合わせ最適化問題を解くことにより、優先的に実行すべき行動を決定する。このため、行動選択部は、非常に多くの情報・データを、力学的情報という数理モデルで解析できる形式で扱うことができる。また、行動選択部が行動を選択する際には、組み合わせ最適化問題を解くことを得意とする量子コンピュータの利用も可能になることから、従来の人工知能と比較して身体性を考慮でき、かつ効率的な行動選択に関する情報処理が可能になる。

【0024】

なお、本発明は、種々の態様で実現することが可能であり、例えば、知的行動を代替可能な情報処理装置、情報処理装置に知的行動を模擬させる方法・コンピュータプログラム、このコンピュータプログラムを配布するためのサーバ装置、このコンピュータプログラムを記憶した一時的でない記憶媒体、このコンピュータプログラムを搭載したデジタルヒューマンモデル、仮想空間システム、ニューロリハビリ支援システム、シミュレーションシステム、脳機能評価システム等の形態で実現することができる。

【図面の簡単な説明】

【0025】

【図1】本発明の一実施形態としての情報処理装置の構成を例示した説明図である。

【図2】機能部と情報統合部とについて説明する図である。

【図3】機能部の学習について説明する図である。

【図4】再帰型ニューラルネットワークの一例を示す図である。

【図5】時間間隔毎の機能マップ及び重み値の一例を示す図である。

【図6】機能部と力学モデルとの統合について説明する図である。

【図7】脳全体の硬さ分布と、ニューラルネットワークの重み値との関連付けについて説明する図である。

【図8】機能部の各神経ネットワークが交差する脳機能部位における重み値及び弾性率を表す図である。

【図9】可塑性部について説明する図である。

【図10】行動選択部について説明する図である。

【図11】脳に力学的損傷が発生した場合の一例を示す図である。

【発明を実施するための形態】

【0026】

＜実施形態＞
図１は、本発明の一実施形態としての情報処理装置１の構成を例示した説明図である。情報処理装置１は、人の知的行動を、人に代わって行うことのできるコンピュータであり、ＡＩ（Artificial Intelligence）とも呼ばれる。本実施形態の情報処理装置１は、以下の構成を有することにより、脳の力学的変化に伴う脳の機能変化を予測することができる。本実施形態では生物の一例として人を挙げているが、人に限らず、他の生物の知的行動を情報処理装置１に実現させてもよい。

【0027】

情報処理装置１は、機能部１０と、情報統合部２０と、可塑性部３０と、行動選択部４０とを備えている。情報処理装置１への入力１００は、環境や身体からの刺激や信号を表す電気的情報である。入力１００としては、例えば、外部環境の情報（光、音、熱、振動、加速度など）、五感の情報（視覚、聴覚、触覚、味覚、嗅覚）、身体内部の情報（血圧、心拍数、二酸化炭素濃度など）で感じる情報を例示できる。情報処理装置１からの出力２００は、環境や身体への反応や信号を表す電気的情報である。出力２００としては、例えば、筋活性度やそれに基づく動き・表情のパターンなどを例示できる。

【0028】

機能部１０は、脳の複数の異なる機能（例えば、脳の感覚機能、情動機能、思考機能、運動機能）に関する行動パターンをそれぞれ記憶する複数の機能部Ｎ１，Ｎ２，・・・，ＮＮにより構成されている。各機能部Ｎ１〜ＮＮは、それぞれ、脳の神経ネットワークを模擬可能な構成、例えばニューラルネットワーク（Neural Network）により実現され、図示しない記憶部に記憶されている。各機能部Ｎ１〜ＮＮは、予め与えられた多くの入力１００に対して、脳の各機能にそれぞれ適した学習方法を用いて予め学習することにより準備されている。また、各機能部Ｎ１〜ＮＮは、新たな入力１００を受け付け、出力２００を出力するまでの一連のプロセスを経た学習を行うことができる。学習の一例としての強化学習を行った事例について、詳細は後述する。

【0029】

情報統合部２０は、機能部１０の各機能部Ｎ１〜ＮＮを統合して、脳全体としての、入力１００（電気的情報）に対する力学的情報を求める。情報統合部２０は、さらに、求めた力学的情報を、統合された脳全体のニューラルネットワークの重み値に関連付ける。具体的には、本実施形態の情報統合部２０は、各機能部Ｎ１〜ＮＮに含まれる神経ネットワークを模擬した要素（ノード、リンク）を重畳することで、各機能部Ｎ１〜ＮＮを統合した統合ネットワークを構成し、この統合ネットワークに、脳の構造と物理学特性とから得られた力学モデル２１を適用する。情報統合部２０は、力学モデル２１を適用した統合ネットワークに、入力１００を用いた電磁気的解析を行うことで、力学的情報を求め、求めた力学的情報を、統合ネットワークの重み値と関連付ける。詳細は後述する。

【0030】

可塑性部３０は、情報統合部２０が求めた力学的情報が、予め設定された閾値より大きくなった際に、力学的情報と対応する脳全体のニューラルネットワークの重み値などの情報を、再学習により更新することで、情報処理装置１が実現する脳の構造と機能とを変化させる。詳細は後述する。

【0031】

行動選択部４０は、機能部１０の各機能部Ｎ１〜ＮＮにより実行可能な複数の行動の中から、優先的に実行すべき行動を選択する。具体的には、本実施形態の行動選択部４０は、力学的情報に基づく自由エネルギーが一定であり、かつ、複数の行動を実行可能なマルチタスク条件下で、各機能部Ｎ１〜ＮＮの目標値に対する予測誤差の最小化と、複数の行動に要するエネルギーの最大化と、を行う組み合わせ最適化問題を解くことにより、優先的に実行すべき行動を決定する。行動選択リスト４１には、行動選択部４０が選択可能な行動が予め記憶されている。例えば、行動Ｎ１＿Ａ１〜Ａ４は、機能部Ｎ１に関する行動であり、行動Ｎ２＿Ａ１〜Ａ４は、機能部Ｎ２に関する行動である。なお、行動選択リスト４１には、処理の過程で新たな行動候補が加えられ、更新されていく。詳細は後述する。

【0032】

情報処理装置１は、与えられた入力１００に対して、機能部１０、情報統合部２０、可塑性部３０、及び行動選択部４０により次の運動を選択して、出力２００を出力するループを繰り返すことにより、学習し、成長するＡＩを実現できる。この情報処理装置１によれば、例えば、脳の特定部位における力学的損傷に関連する脳の機能低下を予測し、機能改善のために必要な行動選択を繰り返し、脳に力学的変化を与えることによる再学習と再予測の結果とから、機能改善を予測することも可能となる。

【0033】

図２は、機能部１０と情報統合部２０とについて説明する図である。図２（Ａ）〜（Ｄ）は、機能部１０に含まれる各機能部Ｎ１〜ＮＮの一例を表す図である。図２（Ａ）では、感覚機能としての視覚に関係する機能部Ｎ１を、神経ネットワークの形で表現している。同様に、図２（Ｂ）は、感覚機能しての聴覚に関係する機能部Ｎ２を表し、図２（Ｃ）は、情動機能に関係する機能部Ｎ３を表し、図２（Ｄ）は、運動機能に関係する機能部Ｎ４を表している。図中の黒丸は、視床、体性感覚野、大脳基底核、扁桃体などの脳の機能部位を表す神経細胞の集合（各機能部位内の神経細胞同士の結合を含む）であり、ノードＮと呼ぶ。各ノードＮを結ぶリンクＬＫは、神経細胞の集合同士を結合する神経線維の集合を表している。各機能部Ｎ１〜ＮＮにおける神経ネットワークの配置には、例えば、計測可能な個人の形状や、解剖学的部位の配置、血管や脳脊髄液の配置などを反映させてもよい。各機能部Ｎ１〜ＮＮは、それぞれ、例えば、光、音、匂い、熱、振動、加速度、血圧、心拍数、二酸化炭素濃度などの電気的情報を入力１００として受け取る。入力１００は、各機能部Ｎ１〜ＮＮ内のノードＮとリンクＬＫとを通じて伝達され、情報処理されて、環境・身体への反応などの電気的情報（出力２００）として出力される。

【0034】

脳にはおよそ１０００億個の神経細胞があるが、本実施形態の情報処理装置１では、それらの神経細胞を各機能部Ｎ１〜ＮＮ（図１）に分けて、神経細胞の集合体として扱う。機能部１０は、図２（Ａ）〜（Ｄ）のような脳の神経ネットワークを模擬したニューラルネットワークにより構成されているため、従来のように、大脳皮質と大脳辺縁系のみを考慮したものではなく、脳神経系への入力から出力までを考慮することができ、脳幹なども神経回路に含むことができる。図２（Ｄ）に示す運動機能Ｎ４は、姿勢制御をしながら目標運動を行うための神経ネットワークであるため、例えばコップを手にとり特定の場所に移動させるといった機能を実現させることが可能であり、従来「経験」としてモデル化されていたものに相当し得る。

【0035】

機能部１０の各機能部Ｎ１〜ＮＮ（図１）を作成する際には、各機能を表す神経ネットワークを用いて学習が行われる。この際、各機能に応じて、適切な学習方法（教師なし学習、教師あり学習、強化学習など）が選択される。例えば、運動機能において重要な大脳基底核機能を表すためには強化学習が選択され、小脳の機能を表すためには教師あり学習が選択され、運動野・体性感覚野の機能を表すためには教師なし学習が選択される。一方、情動機能に関連する扁桃体や側坐核の機能を表すためには、強化学習に関連する学習方法が選択されるなど、各機能に応じて学習方法が選択され得る。なお、図２（Ａ），（Ｂ）において、感覚機能としての視覚に関係する機能部Ｎ１と、感覚機能しての聴覚に関係する機能部Ｎ２とに区別しているように、脳のある機能（上記例では感覚機能）と、機能部１０内の機能部Ｎ１〜ＮＮとの対応関係は、１対多としてもよい。また、脳の複数の機能（例えば、情動機能と感覚機能）を、機能部１０内の１つの機能部ＮＮにまとめることで、対応関係を多対１としてもよい。

【0036】

図３は、機能部１０の学習について説明する図である。図３（Ａ）は、２層に並べられたユニットを持つニューラルネットワークの一例を表す図である。図３（Ｂ）は、１層のユニットを持つニューラルネットワークの一例を表す図である。図３（Ｃ）は、運動機能に関係する機能部Ｎ４を例示した説明図である。図３（Ｄ）は、機能部Ｎ４の強化学習の様子を表す説明図である。図３（Ｅ）は、機能部Ｎ４の筋制御についての機能マップの一例を表す図である。

【0037】

上述の通り、機能部１０の各機能部では、新たな入力１００の処理を経た学習を行う。以降、図３（Ｃ）及び（Ｄ）に表す、運動機能に関係する機能部Ｎ４の強化学習について例示して説明する。図３（Ｄ）に表すように、運動機能に関係する機能部Ｎ４では、大脳基底核を含む神経ネットワークが模擬されている。この大脳基底核の機能の一つである、姿勢維持を目的とした強化学習を行う場合、強化学習アルゴリズムの利用において、図３（Ｂ）に示す１層のユニットを持つニューラルネットワークを複数個用いることによって、図３（Ｄ）に示す機能部Ｎ４−１を学習モデル化する。例えば、身体からの入力１００として、単関節の関節角度と、関節角速度とを用いて、出力２００として、重力下において姿勢維持を実現するための各筋の筋活性度を得ることを目的とした強化学習を行う。すると、図３（Ｅ）に示すように、関節角度と関節角速度との入力に対して、それぞれの筋毎に姿勢維持を実現する最適な活性度が得られる筋制御関数、すなわち機能マップを得ることができる。また、最適値が得られたときの機能マップと、重み値Ｗ_ijとが、それぞれの機能部ごとに、記憶部に記憶される。

【0038】

図４は、再帰型ニューラルネットワークの一例を示す図である。図３（Ｄ）に示す機能部Ｎ４−１の学習モデル化において、例えば、脳幹から視床、視床から体性感覚野へと伝達される神経信号をも加味する場合、図３（Ａ）に示す２層に並べられたユニットを持つニューラルネットワークや、３層以上の多層のニューラルネットワークを用いて、神経ネットワークの結合性に応じて学習モデルを作成することができる。この際、図４に示す再帰型ニューラルネットワークＲＮＮ(Recurrent Neural Network)を用いると、空間における学習だけでなく時系列の学習を行うこともできる。再帰型ニューラルネットワークは、文章などの連続的な情報を処理する自然言語処理の分野で利用されている。さらに、再帰型ニューラルネットワークＲＮＮに加えて、長・短期記憶ＬＳＴＭ(Long Short-Term Memory)の方法を併用すれば、長期にわたる記憶を実現できるため好ましい。

【0039】

図５は、時間間隔毎の機能マップ及び重み値Ｗ_ijの一例を示す図である。上述のように、再帰型ニューラルネットワークＲＮＮと長・短期記憶ＬＳＴＭとを利用すれば、図５に示すように、時間間隔毎に最適な機能マップと重み値Ｗ_ijを得ることができ、長期の時間において学習した情報を、機能マップを用いて記憶として蓄積することができる。最適値が得られた際の機能マップの時間的変化及び重み値Ｗ_ijの時間的変化に関する情報は、それぞれの機能部ごとに、記憶部に記憶される。人は、生まれてからの経験を各機能について、記憶として蓄積していると考えられる。ただし、全ての記憶を即座に引き出せるわけではなく、即座に引き出せる記憶には制限があると考えられる。本実施形態の情報処理装置１では、即座に引き出せる記憶の情報は、機能マップからルックアップテーブルとして利用することにより取得でき、通常の情報は、重み値Ｗ_ijを用いた計算から取得できる。

【0040】

図３（Ｅ）の例では、関節角度と、関節角速度とを入力とした例を示した。しかし、これらの関節角度や関節角速度に関する情報は、関節にある筋骨格系の機械受容器である関節包受容器により検知され、電気的情報として脳に伝達される。このように、環境や身体からの刺激や信号を電気的情報として扱うためには、機械受容器のような、機械刺激を電気的情報に変換する方法が必要である。この点、Hodgkin-Huxleyが提案した非線形微分方程式などを用いて、環境からの刺激を電気的情報に変換する数理モデルを利用できる。視覚、聴覚、触覚においていくつかの数理モデルが提案されており、例えば、非特許文献３に記載の技術を利用すれば、フラッシュ光の入力に対する光感受性電流を出力することができる。また、非特許文献４に記載の技術を利用すれば、有限要素法を用いた皮膚の力学モデルにより手指皮膚に圧迫や２点刺激を与えたときのメルケル細胞のインパルス応答を、それと相関があるミーゼス応力として出力することができる。このような各感覚器の数理モデルを用いることによって、刺激に対する電気的情報を得ることができる。

【0041】

図２（Ｅ）は、機能部Ｎ１〜ＮＮの各神経ネットワークを統合した統合ネットワークＮｊの一例を表す図である。図２（Ｆ）は、脳の構造と物理的特性の説明図である。図２（Ｆ）では、実際の脳の構造と、材料力学及び流体力学に基づく物理的特性と、を表現した計算モデル２１を概念的に表している。計算モデル２１は、材料力学と流体力学の物理学計算を行うための基本モデルであり、以降「力学モデル２１」とも呼ぶ（図１：情報統合部２０、力学モデル２１）。力学モデル２１は、予め算出されて、情報処理装置１の図示しない記憶部に記憶されている。この力学モデル２１には、例えば、脳の構造や、血管配置による特性が反映されている。力学モデル２１に反映されている脳の特性は、ある個人のものであってもよく、一般化されたものであってもよい。図２（Ｇ）は、統合ネットワークＮｊと、計算モデル２１との統合を説明する図である。図２（Ｆ）は、入力１００に対する応力分布の一例を表す図である。

【0042】

情報統合部２０は、機能部１０の各機能部Ｎ１〜ＮＮが入力１００として受け取る電気的情報を、力学モデル２１を用いて統合し、脳全体の力学的情報（例えば、応力分布）に変換する。具体的には、情報統合部２０は、図２（Ｆ）に示す力学モデル２１に、図２（Ｅ）に示す統合ネットワークＮｊ（機能部Ｎ１〜ＮＮの各神経ネットワークを統合したもの）の配置を用いた電磁気的解析を行う（２（Ｇ））。これにより、情報統合部２０は、統合ネットワークＮｊに対して入力１００が与えられた際の、ある時刻ｔ¹における応力分布Ｎｓ（ｔ¹）を求めることができる。

【0043】

図６は、機能部Ｎ１と、力学モデル２１との統合について説明する図である。情報統合部２０は、統合ネットワークＮｊとは別に、図２（Ａ）〜（Ｄ）に示す各機能部Ｎ１〜ＮＮのそれぞれに対して、力学モデル２１を適用して、それぞれの応力分布を得てもよい。図６の例では、情報統合部２０は、力学モデル２１に、機能部Ｎ１の配置を用いた電磁気的解析を行うことにより、機能部Ｎ１に対して入力１００が与えられた際の、ある時刻ｔ¹における応力分布Ｎｓ（ｔ¹）を求めている。図６の場合は、感覚機能としての視覚が、外部から刺激を受け取った場合の、脳の応力分布が得られることとなる。

【0044】

情報統合部２０は、さらに、統合された力学的情報（上述の例では、応力分布）を、ニューラルネットワークの重み値Ｗ_ijなどと関連付けてもよい。従来では、力学的情報の理論的算出を学問対象とする物理学と、ニューラルネットワークなどの複数の情報の関連性の推定を学問対象とする情報学と、を直接結び付ける方法は提供されていなかった。しかしながら、脳の神経線維の密度分布は、脳の硬さ分布と強い関連があるため、脳の硬さ分布において硬い部位は、脳の神経線維の分布において神経線維の密度が大きいと言える。そして、神経線維の密度が大きいということは、神経伝達がしやすくなる、すなわちニューラルネットワークの重み値が大きくなることがわかる。以降では、この着想に基づいて得られた、力学的情報としての脳全体の硬さ分布と、ニューラルネットワークの重み値とを関連付ける方法について説明する。

【0045】

図７は、脳全体の硬さ分布と、ニューラルネットワークの重み値との関連付けについて説明する図である。図７（Ａ）は、脳全体の硬さ分布を表す力学モデル２１を表す。図７（Ｂ）は、ニューラルネットワークとして表された脳全体の学習モデル２２を表す。ここで、力学モデル２１（図１：情報統合部２０、力学モデル２１、図７（Ａ））において、脳は非線形の力学的特性を示すが、微小変形における線形の力学特性のみを考慮して、力学モデル２１を式（１）のように表現する。式（１）において、σ_iは相当応力を、Ｅ_ijは弾性率を、ε_iは相当ひずみを、σ_j0は初期の相当応力を、それぞれ表す。なお、ｉ，ｊ＝１〜ｎであり、ｎは脳の部位の全数を表す。

【0046】

【数1】

【0047】

一方、ニューラルネットワークで表現される学習モデル２２（図１：情報統合部２０、学習モデル２２、図７（Ｂ））を式（２）のように表現する。式（２）において、ｙ_iは出力値を、Ｗ_ijは重み値を、ｘ_iは入力値を、ｂ_jはバイアスを、それぞれ表す。なお、ｉ，ｊ＝１〜ｎであり、ｎは脳の部位の全数を表す。式（２）の右項には総和規約を用いた。

【0048】

【数2】

【0049】

上述した脳全体の硬さ分布と、ニューラルネットワークの重み値との対応関係を考慮すると、図７（Ａ）に示す力学モデル２１の弾性率Ｅ_ijは、図７（Ｂ）に示す学習モデル２２の重み値Ｗ_ijと等価になると考えることができる。ここで、弾性率Ｅ_ijは、ある部位ｉからある部位ｊ方向への弾性率を示し、重み値Ｗ_ijは、ある部位ｉからある部位ｊに信号が伝達するときの重み値を表す。このように、弾性率Ｅ_ijと重み値Ｗ_ijが等価であるなら、図７（Ａ）に示す力学モデル２１の相当応力値σ_iと、図７（Ｂ）に示す学習モデル２２の出力値ｙ_iも等価になると考えることができる。

【0050】

ただし、例えば有限要素モデルでは、Ｅ_ijは通常、直交座標系で表現される。しかし、図７（Ｂ）の学習モデル２２における重み値Ｗ_ijや、図７（Ａ）の力学モデル２１の弾性率Ｅ_ijは、結合する部位どうしをつなぐ線分の方向を表す非直交基底ベクトルで表現される。このため、有限要素モデルなどと関連付けるためには、式（３）に示すように新座標ｘ’_iおよび旧座標ｘ_iそれぞれの基底ベクトルτ’_iおよびτ_iについて、座標変換が必要となる。式（３）の座標変換を行うことにより、力学モデル２１で得られる弾性率Ｅ_ijや、相当応力σ_iを、学習モデル２２の重み値Ｗ_ijや、出力値ｙ_iと対応付けることが可能になる。

【0051】

【数3】

【0052】

図８は、機能部Ｎ１〜Ｎ４の各神経ネットワークが交差する脳機能部位における重み値及び弾性率を表す図である。図２（Ａ）〜（Ｄ）に示す各機能部Ｎ１〜Ｎ４を構成するノードＮの中には、複数の機能部Ｎ１〜ＮＮの間で重複するノードＮも存在する。脳機能のハブとなっている視床や島皮質などがそれに相当する。このような場合、図８に太枠の丸印で示すように、１つの脳機能部位Ｎｐに、重複する複数のノードＮが存在する状態となる。このため、図７で説明した、脳全体の硬さ分布とニューラルネットワークの重み値の対応関係（力学モデル２１と学習モデル２２との対応関係）をそのまま適用できる。

【0053】

ＭＲＥ(Magnetic Resonance Elastography)を用いると、脳組織の弾性特性の分布を求めることができる。ＭＲＥとは、高磁場のＭＲＩ(Magnetic Resonance Imaging)装置の中で駆動できる外部加振機により、振動と同期した振動勾配磁場を与えることにより、対象とする組織の波の画像から組織の粘弾性特性を求める手法である。解像度の問題はあるが、ＭＲＥを用いれば、個人の脳組織の弾性率Ｅ_ijを求めることができる。一方、高磁場のＭＲＩ装置を用いた拡散ＭＲＩの強調画像ＤＷＩ(Diffusion Weighted Imaging)や、ＤＳＩ(Diffusion Spectrum Imaging)の手法により得られたデータを、ＤＳＩＳｔｕｄｉｏなどのソフトウェアを用いて解析することにより、個人の脳の構造的なネットワークを構築することができ、上記結合する部位どうしをつなぐ線分の方向に関する情報を得ることができる。これにより、神経の方向に対応する個人の脳組織の弾性率Ｅ_ijを得ることができる。また、図７で説明した、脳全体の硬さ分布とニューラルネットワークの重み値の対応関係（力学モデル２１と学習モデル２２との対応関係）を利用すれば、重み値Ｗ_ijも得ることができるため、これらを個人の脳の構造を反映させる場合の初期値として与えることができる。

【0054】

可塑性部３０は、情報統合部２０において変換された力学的情報を、各機能部Ｎ１〜ＮＮの相互間における関連部位の力学量σ_p（例えば、相当応力値など）として表示する。また、可塑性部３０は、関連部位の力学量σ_pが、予め設定された閾値σ_yより大きくなった場合に（図１：σ＝σ_p＞σ_y）、ニューラルネットワークの重み値Ｗ_ijを更新する。ここで、閾値σ_yは力学量（相当応力値など）で表現される。閾値σ_yは、神経生理学における神経の可塑性を再現する値であり、実験データを再現するように調整され得る。

【0055】

図９は、可塑性部３０について説明する図である。図９（Ａ）は、材料力学における塑性の概略図を示す。図９（Ｂ）は、神経の可塑性の概略図を示す。図９に示すように、本実施形態の情報処理装置１において、神経の可塑性（すなわち閾値σ_yの設定）は、材料力学における塑性域に達する状態、すなわち降伏点と類似する考え方を採用している。材料力学において、弾性域では繰り返し変形をさせても元の状態に戻るが、一度塑性域に入れば、元の状態には戻らず材料の形が変わってしまう。それと同様に、神経においても通常の弱い信号伝達は記憶に影響を及ぼすようなことはないが、情動体験、強い感覚受容などを体験するような信号伝達があった場合、記憶や行動選択に大きな影響を及ぼすことがある。このような場合に、脳神経系において構造的、機能的変化が起きると考えられる。このように、力学的情報とニューラルネットワークの重み値、換言すれば、物理学と情報学を対応づけることは、神経の可塑性における、脳神経系の構造的変化と機能的変化を同時に表現することができる利点がある。

【0056】

このように、可塑性部３０は、各機能部Ｎ１〜ＮＮの相互間における関連部位の力学量σ_p（例えば、相当応力値などの力学的情報）が閾値σ_yより大きくなった場合、図７で説明した対応関係に基づいて、そのときの相当応力σ_pを出力値ｙ_pとして対応付ける（図１：可塑性部３０、σ_p→ｙ_p）。この結果、図１に破線枠で示すように、各機能部Ｎ１〜ＮＮでは、出力値ｙ_pを満足するような重み値Ｗ_ijを導出する再学習計算が行われ、これにより重み値Ｗ_ijが更新され、更新された重み値Ｗ_ijが、各機能部Ｎ１〜ＮＮの図示しない記憶部に保存される。このことは、脳神経系の機能的変化が起きたことを示している。一方、重み値Ｗ_ijが更新されると、図７で説明した対応関係に基づいて、弾性率Ｅ_ijも更新される（図１：可塑性部３０、Ｗ→Ｅ）。これにより、脳全体の硬さ分布が変化するので、脳神経系の構造的変化が起きたことを示している。

【0057】

図１において可塑性部３０から情報統合部２０へ伸びる破線矢印に示すように、更新された弾性率Ｅ_ijはまた、情報統合部２０の力学モデル２１の弾性率Ｅ_ijをも更新する。同様に、更新された重み値Ｗ_ijは、各機能部Ｎ１〜ＮＮの学習モデル２２の重み値Ｗ_ijを更新する。更新以降の計算においては、更新後の弾性率Ｅ_ijや重み値Ｗ_ijを用いた計算が行われ、脳神経の構造・機能の変化を反映した学習が可能になる。通常では、各機能部Ｎ１〜ＮＮにおいてそれぞれの機能を実現するように学習が個別に行われ、重み値Ｗ_ijなどが決められるが、実際の脳においては脳内の各機能ネットワークが相互に影響を及ぼしていると考えられている。この点、本実施形態の情報処理装置１では、可塑性部３０において再学習が行われることにより、重み値Ｗ_ijが更新される。更新の際、応力分布に対応するように個々のネットワークの重み値Ｗ_ijが調整されるため、実際の脳のように、各機能ネットワークの相互作用を考慮した調整が可能となる。

【0058】

人の脳は日常的な行動において、情報処理装置１への入力１００のように、環境や身体からの刺激・信号を受け、それに対して反応する行動をとっている。その際、正常な意識状態であれば、常に現在の感覚・情動・思考・運動（各機能部Ｎ１〜ＮＮに相当）などの状態（現在値）を知覚し、過去の経験に基づく内部モデル（学習モデル２２に相当）による予測値と比較して、現在値と予測値の誤差知覚に基づき行動を選択している。本実施形態の情報処理装置１についても、この原理に基づき行動選択を行う手法を採用する。

【0059】

脳における神経活動に関して、最近の脳波計や機能的ＭＲＩなどを用いた研究から、睡眠時においても、覚醒時と同じように脳の活動が見られることがわかっている。また、人は複数のタスクを同時に行うことができるが、その許容量には限界があり、複数のタスクを同時に同じクオリティで行うことは困難である。このような観点と生体の恒常性の観点から、脳活動に必要なエネルギーは一定であると考えられる。一方、脳における物理学的な観点からも、脳に身体からの神経の電気信号、血流、脊髄液などが入ってくるが、これらの作用による自由エネルギーは、外部への損失がない限り一定であることが考えらえる。上記のような観点から、以降では、脳全体の統合された力学的情報に基づく自由エネルギーは一定であると仮定する。

【0060】

行動選択部４０は、優先行動を決めるという意図に基づき、最適な行動を選択する手段を提供する。以下、複数のタスクを同時に行うことを想定し、機能ネットワークＮ１，Ｎ２，Ｎ３に関係するタスクをそれぞれＴ１，Ｔ２，Ｔ３とし、３つのタスクを同時に行うこととする。その中で、タスクＴ２を優先して行う場合を想定する。この場合、環境や身体からの刺激や信号といった入力１００に対して、各機能部Ｎ１〜ＮＮにおいて、タスクＴ１，Ｔ２，Ｔ３のそれぞれについて、各タスクの目標値（タスクの想定イメージ）と内部モデルによる予測値の誤差を、以下の式から求めることができる。ここで、内部モデルとは、記憶部に保存された重み値Ｗ_ijなどに基づくニューラルネットワークモデル、あるいは、図３（Ｅ）及び図５に示した機能マップを意味する。式（４），式（５），式（６）において、ｅ^N1，ｅ^N2，ｅ^N3は予測誤差を、ｙ^N1，ｙ^N2，ｙ^N3は内部モデルによる予測値（学習モデル２２の出力値ｙ_i）を、ｙ^N10，ｙ^N20，ｙ^N30は各タスクの目標値を、それぞれ表す。

【0061】

【数4】

【0062】

【数5】

【0063】

【数6】

【0064】

ここで、図７で説明した対応関係を考慮すると、内部モデルによる予測値ｙ^N1，ｙ^N2，ｙ^N3は、それぞれ相当応力σ^N1，σ^N2，σ^N3に対応付けられる。このため、タスクＴ１，Ｔ２，Ｔ３に関係づけられる脳の自由エネルギー（ヘルムホルツの自由エネルギー）は、それぞれＥ（σ^N1），Ｅ（σ^N2），Ｅ（σ^N3）と表現することができ、上述した自由エネルギーが一定であるという条件は、以下の式（７）のように表現できる。式（７）において、脳全体の自由エネルギーＥ^Totalは、全ての機能部Ｎ１〜ＮＮが活動するためのエネルギーの総和と、それ以外の脳の定常状態をたもつためのエネルギーＥｈの和である。

【0065】

【数7】

【0066】

図１０は、行動選択部４０について説明する図である。例えば、タスクＴ１とタスクＴ３が目標通りの行動、すわなち、ｅ^N1＝０，ｅ^N3＝０となる状態において、優先タスクであるＴ２を追加することを想定する。このとき、図１０に示すように、行動選択部４０は、可能性のある複数の行動Ａ１１〜Ａ３４の中から、タスクＴ２の予測誤差ｅ^N2が最小になるような、すなわち、機能部Ｎ２の行動部分の活動が最大となるようなタスクＴ２の行動を選択する。この際、式（７）の自由エネルギー一定の条件により、機能部Ｎ２の活動を大きくするために自由エネルギーＥ（σ^N2）を大きくすると、他のタスクＴ１とＴ３との活動に関係するエネルギーが小さくなるため、それぞれの初期の予測誤差ｅ^N1，ｅ^N3が大きくならないように最適化される必要がある。この問題は、組み合わせ最適化問題であり、様々な解法が提案されている。

【0067】

最近では、量子アニーリング方式を用いた量子コンピュータにより、高速かつ効率的に組み合わせ最適化問題を解くことができる。このため、例えば図１０に示すように、入力１００が与えられてから、機能部１０、情報統合部２０、可塑性部３０による上述した一連処理をノイマン型のコンピュータにおいて行い、その後、行動選択部４０による組み合わせ最適化問題の処理においては、量子コンピュータにより行ってもよい。情報処理装置１において、多数の機能部Ｎ１〜ＮＮを実装する場合、式（７）条件下において意図に基づく最適な行動選択を実現するためには、量子ンピューターを用いて組み合わせ最適化問題を解くことが効率的である。

【0068】

予測誤差ｅ^N1〜^NNが０あるいは非常に小さい場合、人は知覚することなく反応する無意識行動になり、予測誤差ｅ^N1〜^NNが大きい場合は、意識に上る意識行動となる。このため、行動選択部４０は、予測誤差の大きさによって、行動が意識的なものか無意識的なものかを判定することができる。従来から、予測誤差は、人の認知活動の大きな部分を占めることが知られる一方で、意識を単純な予測誤差だけでなく、脳内における各機能の統合の度合も重要であることも知られており、この点は、現在の神経科学分野においても明らかになっていない。本実施形態の情報処理装置１では、行動選択部４０は、各機能部Ｎ１〜ＮＮの活動が力学的情報として統合され、かつ、予測誤差ｅ^N1〜^NNを小さくするように、各機能部Ｎ１〜ＮＮがそれぞれ担当するマルチタスクの中から、統合された脳活動のエネルギーＥ^Totalが一定である、という条件のもとで組み合わせ最適化問題を解くことにより行動を選択している。このため、従来知られていた意識に対する概念を、別の形で含んでいる。行動選択部４０は、なお、全ての機能部Ｎ１〜ＮＮにおいて予測誤差が０あるいは非常に小さい場合は、無意識行動となることから、行動選択部４０は、意識行動を選択するための最適化計算を実施しない。

【0069】

行動選択部４０において選択された行動Ａ１１〜Ａ３４は、出力２００、すなわち環境・身体への反応・信号として表現される。出力２００は、例えば、機能部Ｎ４により表される感覚運動については、筋活性度やそれに基づく身体動作となり、機能部Ｎ４により表される情動行動については、表情筋の筋活性度やそれに基づく表情のパターン（喜び、怒りなど）となる。

【0070】

各機能部Ｎ１〜ＮＮにおいて、思考に関連する神経ネットワークを考えるとき、様々な環境からの入力１００と、各環境への反応・行動が関連付けられた出力２００とが対応付けられた機能マップが、図示しない記憶部に保存される。このような場合も、行動選択部４０は、個人の考え方・思想を反映した内部モデル（学習モデル２２に相当）による行動結果の予測値ｙ^N1〜^NNと、実際の行動結果の予測誤差ｅ^N1〜^NNが得られた際、意識的な感情の変化（喜び、怒りなど）を誘発させたり、次の行動選択のための行動候補（関連する思考の機能部Ｎ１〜ＮＮ）を挙げる。図１に示す行動選択リスト４１内の行動Ｎ１#Ａ１〜ＮＮ#Ｎ４や、図１０に示す行動Ａ１１〜Ａ３４は、このようにして機能部Ｎ１〜ＮＮごとに候補として挙げられる行動である。換言すれば、各機能部Ｎ１〜ＮＮが新たな入力１００に対して学習を続ける過程で大きな予測誤差ｅ^N1〜^NNが生じた際に、行動選択部４０がそれを意識的な脳活動として捉えることで、行動選択部４０は、機能部Ｎ１〜ＮＮにおける新たな行動候補として行動選択リスト４１に加える。これにより、新たな行動候補は、行動選択部４０が組み合わせ最適化問題を解くときに、選択の対象となり得る。

【0071】

このように、情報処理装置１では、環境や身体からの刺激や信号を入力１００として、機能部１０、情報統合部２０、可塑性部３０、行動選択部４０によって次の行動を選択し、環境や身体への反応や信号を出力２００として出力するループを繰り返す。これにより、情報処理装置１では、人が経験を通して学習し、成長する過程を模擬することができる。この際、各機能部Ｎ１〜ＮＮでは、各機能の神経ネットワークに関する学習結果（重み値Ｗ_ij、最適解が得られた時の機能マップ）が、記憶部に記憶される。また、可塑性部３０は、力学量σ_p（力学的情報）が予め設定された閾値σ_yよりも大きくなった際に、脳の機能（重み値Ｗ_ij）を変化させ、それに伴い脳の神経構造（弾性率Ｅ_ij）をも変化させる（図１：可塑性部３０、Ｗ→Ｅ、可塑性部３０から情報統合部２０へ伸びる破線矢印）。行動選択部４０は、その変化した、換言すれば成長した脳の構造（力学モデル２１）と機能（学習モデル２２）とを用いて、次の行動を選択する。行動により予測誤差ｅ^N1〜^NNが生じた場合、行動選択部４０は、その行動を行動選択リスト４１に加える。これら一連のプロセスは、人の経験値や積極性など、人格に関わる部分を積み上げることに対応している。なお、力学モデル２１と学習モデル２２は、ともに入力１００が与えられる限り、計算が継続される。すなわち、力学モデル２１においても応力値が０にリセットされることはなく、繰り返し学習の際にも更新され、応力値は更新され続けられる。

【0072】

図１１は、脳に力学的損傷が発生した場合の一例を示す図である。例えば、破線枠で囲んだ脳の特定部位において、神経の力学的損傷が発生した場合、その部位の弾性率Ｅ_ijは０になる。ここで、図７で説明した対応関係を考慮すると、力学的損傷が発生した部位におけるニューラルネットワークの重み値Ｗ_ijも同様に、０になる。この結果、損傷した機能に関係する行動はできなくなる。このことから、情報処理装置１において、脳の力学的損傷に伴う脳機能低下を表現することが可能になる。

【0073】

また、外部から何らかの寄与を与えることによって、脳の特定部位において力学的変化を与えることにより、弾性率Ｅ_ijを変化させた場合も同様に考えることができる。この場合も、図７で説明した対応関係を考慮して、弾性率Ｅ_ijが変化した部分におけるニューラルネットワークの重み値Ｗ_ijを変化させる。変化した重み値Ｗ_ijを利用して再学習を行い、得られた再予測の結果から、脳への寄与が機能改善につながるかどうかを予測することが可能となる。ここで、外部からの寄与として、機能改善のための行動選択、すなわち図１０で説明したように、目標値に対する予測誤差ｅ^N1〜^NNを最小化するように、関連する各機能部Ｎ１〜ＮＮの脳活動を大きくするような行動選択を繰り返すことによって、脳に力学的変化、すなわち弾性率Ｅ_ijの変化が起こる可能性がある。このため、図１０で説明した行動選択は、脳の損傷や力学的変化に伴う機能低下を改善する上で重要である。

【0074】

なお、図１や図１０では、予め設定された各機能部Ｎ１〜ＮＮ（神経ネットワーク）を対象として説明した。しかし、実際に脳に損傷が起こった場合は、元の神経ネットワークとは関係のない部分において、新たな神経ネットワークを構築して再学習が行われる場合もある。これを実現するためには、図２に示す各機能部Ｎ１〜ＮＮを構成する各ノードＮの再配置や、新たなリンクＬＫによる接続が行われる必要がある。ノードＮの再配置や、新たなリンクＬＫによる接続のためには、自己組織化の理論などが有効になる。

【0075】

コンピュータ上で人の快適性、作業性、こころの状態を評価するために、デジタルヒューマンモデルは有効である。デジタルヒューマンモデルとは、骨格、骨、筋肉、血管、心臓、臓器などの各モデルデータから、血圧や筋力を含む身体内部情報を出力可能なモデルである。本実施形態の情報処理装置１は、このようなデジタルヒューマンモデルの、感覚運動や情動行動などの入出力を制御できる。デジタルヒューマンモデルと、本実施形態の情報処理装置１とを組み合わせて使用すれば、コンピュータ上で、人の快適性や作業性などを評価することができる。

【0076】

例えば、ゴルフのスウィングのような感覚運動を想定する。図２（Ｄ）に示す機能部Ｎ４（神経ネットワーク）を用いて、身体の複数の関節・筋肉からの固有感覚情報や、手における触覚情報などが体性感覚野に伝達される。また、運動野から、目的のゴルフスウィングを達成させるような各筋の筋活性度に関する情報が、身体へ伝えられる。この際、大脳基底核や小脳と連携をとり、姿勢制御がされると共に、目標イメージの運動軌跡となるような筋活性度に調整される。このように機能部Ｎ４に対する学習が行われ、機能部１０の記憶部に機能マップとして保持される。環境として風が強い場合や、足場が悪い場合は、図１０に示す複数の行動選択の中から、ゴルフスウィングを優先行動とした組み合わせ最適化が行われる。この際、例えば、情動として悲しい思いをした場合、それに関連する機能部Ｎ１〜ＮＮに活動エネルギーの一部が充てられ、ゴルフスウィングの筋制御のために十分な活動エネルギーを充てることができなくなり、上手いショットが打てないなどの状況をシミュレーションすることが可能である。

【0077】

一般に、脳の側坐核において報酬が得られる条件が記憶され、扁桃体において恐怖・不安が得られる条件が記憶される。人が快適性を評価する場合は、この２つの脳機能部位を含む神経ネットワークが関与していると考えられる。本実施形態の情報処理装置１では、図１０に示すような方法により、内臓からの心拍、呼吸、血圧に関連する情報や、嗅覚や触覚などに関連する情報を入力１００とし、快・喜びに対しては側坐核を含む報酬系の機能部用いて学習を行い、不快・恐れに対しては扁桃体を含む機能部において強化学習を用いて学習を行うことができる。

【0078】

また、快・不快が得られるときの入力１００と出力２００とを対応付ける機能マップなどを得ておき、現在の状況と機能マップなどによる予測誤差ｅ^N1〜^NNを求める。行動選択部４０は、得られた予測誤差ｅ^N1〜^NNから快・不快の割合を求めることができるので、現在の環境における快・不快の評価が可能になる。さらに、快・不快に対する行動は、複数の行動選択の中から、意図に基づき、例えば快・喜びに対してはより多くの報酬が得られるような行動が選択されるように、不快・恐れに対しては逃げるような行動が選択されるようにしてもよい。本実施形態の情報処理装置１によれば、従来にない新しい方法で快・不快を評価することができ、かつそれに対して意図に基づく行動選択が可能になる。

【0079】

本実施形態の情報処理装置１では、個人の脳の構造を、機能部Ｎ１〜ＮＮにおける神経ネットワークの配置の初期値として与えてもよい。そうすれば、環境や身体からの複数の刺激・信号（入力１００）による学習を繰り返すことで、個人ごとに異なる学習、成長が可能となる。例えば、デジタルヒューマンモデルと組み合わせたゴルフスウィングの事例においては、個人の脳神経の構造や、個人の身体の構造的特徴などを取り入れた学習計算を行うことができるため、スポーツ競技の強化などにおける個人差に対応することができる。また、快・不快の評価においても、個人の脳神経の構造を考慮してもよい。図１０で説明した、学習に伴う行動選択リスト４１の増加によって、個人の特性に応じた行動評価をも可能となる。個人の生理量（血圧、心拍数、呼吸数、運動など）を計測した上で、その情報を入力１００としたときの、その個人の反応・対応（官能評価結果など）を出力２００とした機能マップを作り、学習計算と対応させることができれば、個人に対応した学習・成長モデルの精度はさらに向上する。

【0080】

また、事故などで頭部に損傷を受けた場合や、精神疾患などで脳の神経構造に器質的な変化が起きた場合、図１１で説明したのように、力学的特性の変化に応じて、重み値Ｗ_ijが変化し、脳の各機能（機能部Ｎ１〜ＮＮ）にも影響を及ぼす。このため、本実施形態の情報処理装置１は、医療の分野における診断や、治療計画策定の際にも有用な知見を与える。また、リハビリや食事の改善など、身体から受ける刺激・信号（入力１００）を変化させることを繰り返し、意識的に行動する、すなわち図１０で説明した脳の機能不全（あるいは脳の機能低下）を改善させるような活動を繰り返し選択することにより、関連する神経ネットワークの脳活動（例えば、機能部Ｎ１）に大きな変化を与えることができれば、それに関連する脳（たとえば、機能部Ｎ４）の神経構造も変化し機能改善するような神経ネットワークを再構成できる可能性もある。このように、本実施形態の情報処理装置１は、身体障害や精神疾患のリハビリを支援するための、ニューロリハビリ支援ツールとしても利用できる。

【0081】

＜本実施形態の変形例＞
本発明は上記の実施形態に限られるものではなく、その要旨を逸脱しない範囲において種々の態様において実施することが可能であり、例えば次のような変形も可能である。

【0082】

［変形例１］
上記実施形態では、情報処理装置１の構成の一例を示した。しかし、情報処理装置１の構成は種々の変形が可能である。例えば、情報処理装置１は、ネットワーク上に配置された複数の情報処理装置が協働することによって構成されてもよい。この場合、例えば、機能部１０、情報統合部２０、可塑性部３０、行動選択部４０の内の少なくとも一部が、異なる情報処理装置によって実現されてもよい。例えば、情報処理装置１には、異なる人にそれぞれ対応した、複数組の機能部１０、情報統合部２０、可塑性部３０、及び行動選択部４０が含まれていてもよい。例えば、情報処理装置１は、可塑性部３０と、行動選択部４０との少なくとも一方を備えていなくてもよい。

【0083】

［変形例２］
上記実施形態では、機能部１０の各機能部Ｎ１〜ＮＮはニューラルネットワークにより構成されるとした。しかし、各機能部Ｎ１〜ＮＮは、ニューラルネットワーク以外の手段（例えば、図３（Ｅ）に示した機能マップ）により構成されていてもよい。例えば、機能部１０には、各機能部Ｎ１〜ＮＮとは別に、機能部Ｎ１〜ＮＮの各神経ネットワークを予め統合した統合ネットワークＮｊが記憶されていてもよい。

【0084】

［変形例３］
上記実施形態では、情報統合部２０の力学モデル２１は、材料力学と流体力学の物理学計算を行うためのモデルであると例示した。しかし、力学モデル２１は、材料力学、流体力学、電磁気学など、少なくとも１つの物理的特性を表現したモデルとして構成されていてもよい。

【0085】

［変形例４］
上記実施形態では、可塑性部３０は、力学的情報が予め設定された閾値より大きくなった場合に重み値を更新するとした。しかし、可塑性部３０は、閾値を用いずに、処理のつど重み値を更新してもよい。例えば、重み値を更新するための閾値は、材料力学における降伏点とは関係なく決定されてもよく、使用者により変更可能にされてもよい。例えば、可塑性部３０は、力学量（力学的情報）の表示を省略してもよい。

【0086】

［変形例５］
上記実施形態では、行動選択部４０は、複数の行動を実行可能なマルチタスクの条件下で、実行すべき複数の行動と、さらに優先的に実行すべき行動とを選択した。しかし、行動選択部４０は、単一の行動のみを実行する条件下で、実行すべき１つの行動を選択してもよい。例えば、行動選択部４０は、機能部の目標値に対する予測誤差の最小化と、行動に要するエネルギーの最大化と、を行う組み合わせ最適化問題を解く以外の任意の方法で、行動を選択してもよい。

【0087】

以上、実施形態、変形例に基づき本態様について説明してきたが、上記した態様の実施の形態は、本態様の理解を容易にするためのものであり、本態様を限定するものではない。本態様は、その趣旨並びに特許請求の範囲を逸脱することなく、変更、改良され得ると共に、本態様にはその等価物が含まれる。また、その技術的特徴が本明細書中に必須なものとして説明されていなければ、適宜、削除することができる。上記実施形態において、ソフトウェアによって実現された機能及び処理の一部又は全部は、ハードウェアによって実現されてもよい。また、ハードウェアによって実現された機能及び処理の一部又は全部は、ソフトウェアによって実現されてもよい。ハードウェアとしては、例えば、集積回路、ディスクリート回路、または、それらの回路を組み合わせた回路モジュールなど、各種回路（circuitry）を用いることができる。

【符号の説明】

【0088】

１…情報処理装置
１０…機能部
２０…情報統合部
２１…力学モデル
２２…学習モデル
３０…可塑性部
４０…行動選択部
４１…行動選択リスト

【図1】