(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0026】
<実施形態>
図1は、本発明の一実施形態としての情報処理装置1の構成を例示した説明図である。情報処理装置1は、人の知的行動を、人に代わって行うことのできるコンピュータであり、AI(Artificial Intelligence)とも呼ばれる。本実施形態の情報処理装置1は、以下の構成を有することにより、脳の力学的変化に伴う脳の機能変化を予測することができる。本実施形態では生物の一例として人を挙げているが、人に限らず、他の生物の知的行動を情報処理装置1に実現させてもよい。
【0027】
情報処理装置1は、機能部10と、情報統合部20と、可塑性部30と、行動選択部40とを備えている。情報処理装置1への入力100は、環境や身体からの刺激や信号を表す電気的情報である。入力100としては、例えば、外部環境の情報(光、音、熱、振動、加速度など)、五感の情報(視覚、聴覚、触覚、味覚、嗅覚)、身体内部の情報(血圧、心拍数、二酸化炭素濃度など)で感じる情報を例示できる。情報処理装置1からの出力200は、環境や身体への反応や信号を表す電気的情報である。出力200としては、例えば、筋活性度やそれに基づく動き・表情のパターンなどを例示できる。
【0028】
機能部10は、脳の複数の異なる機能(例えば、脳の感覚機能、情動機能、思考機能、運動機能)に関する行動パターンをそれぞれ記憶する複数の機能部N1,N2,・・・,NNにより構成されている。各機能部N1〜NNは、それぞれ、脳の神経ネットワークを模擬可能な構成、例えばニューラルネットワーク(Neural Network)により実現され、図示しない記憶部に記憶されている。各機能部N1〜NNは、予め与えられた多くの入力100に対して、脳の各機能にそれぞれ適した学習方法を用いて予め学習することにより準備されている。また、各機能部N1〜NNは、新たな入力100を受け付け、出力200を出力するまでの一連のプロセスを経た学習を行うことができる。学習の一例としての強化学習を行った事例について、詳細は後述する。
【0029】
情報統合部20は、機能部10の各機能部N1〜NNを統合して、脳全体としての、入力100(電気的情報)に対する力学的情報を求める。情報統合部20は、さらに、求めた力学的情報を、統合された脳全体のニューラルネットワークの重み値に関連付ける。具体的には、本実施形態の情報統合部20は、各機能部N1〜NNに含まれる神経ネットワークを模擬した要素(ノード、リンク)を重畳することで、各機能部N1〜NNを統合した統合ネットワークを構成し、この統合ネットワークに、脳の構造と物理学特性とから得られた力学モデル21を適用する。情報統合部20は、力学モデル21を適用した統合ネットワークに、入力100を用いた電磁気的解析を行うことで、力学的情報を求め、求めた力学的情報を、統合ネットワークの重み値と関連付ける。詳細は後述する。
【0030】
可塑性部30は、情報統合部20が求めた力学的情報が、予め設定された閾値より大きくなった際に、力学的情報と対応する脳全体のニューラルネットワークの重み値などの情報を、再学習により更新することで、情報処理装置1が実現する脳の構造と機能とを変化させる。詳細は後述する。
【0031】
行動選択部40は、機能部10の各機能部N1〜NNにより実行可能な複数の行動の中から、優先的に実行すべき行動を選択する。具体的には、本実施形態の行動選択部40は、力学的情報に基づく自由エネルギーが一定であり、かつ、複数の行動を実行可能なマルチタスク条件下で、各機能部N1〜NNの目標値に対する予測誤差の最小化と、複数の行動に要するエネルギーの最大化と、を行う組み合わせ最適化問題を解くことにより、優先的に実行すべき行動を決定する。行動選択リスト41には、行動選択部40が選択可能な行動が予め記憶されている。例えば、行動N1_A1〜A4は、機能部N1に関する行動であり、行動N2_A1〜A4は、機能部N2に関する行動である。なお、行動選択リスト41には、処理の過程で新たな行動候補が加えられ、更新されていく。詳細は後述する。
【0032】
情報処理装置1は、与えられた入力100に対して、機能部10、情報統合部20、可塑性部30、及び行動選択部40により次の運動を選択して、出力200を出力するループを繰り返すことにより、学習し、成長するAIを実現できる。この情報処理装置1によれば、例えば、脳の特定部位における力学的損傷に関連する脳の機能低下を予測し、機能改善のために必要な行動選択を繰り返し、脳に力学的変化を与えることによる再学習と再予測の結果とから、機能改善を予測することも可能となる。
【0033】
図2は、機能部10と情報統合部20とについて説明する図である。
図2(A)〜(D)は、機能部10に含まれる各機能部N1〜NNの一例を表す図である。
図2(A)では、感覚機能としての視覚に関係する機能部N1を、神経ネットワークの形で表現している。同様に、
図2(B)は、感覚機能しての聴覚に関係する機能部N2を表し、
図2(C)は、情動機能に関係する機能部N3を表し、
図2(D)は、運動機能に関係する機能部N4を表している。図中の黒丸は、視床、体性感覚野、大脳基底核、扁桃体などの脳の機能部位を表す神経細胞の集合(各機能部位内の神経細胞同士の結合を含む)であり、ノードNと呼ぶ。各ノードNを結ぶリンクLKは、神経細胞の集合同士を結合する神経線維の集合を表している。各機能部N1〜NNにおける神経ネットワークの配置には、例えば、計測可能な個人の形状や、解剖学的部位の配置、血管や脳脊髄液の配置などを反映させてもよい。各機能部N1〜NNは、それぞれ、例えば、光、音、匂い、熱、振動、加速度、血圧、心拍数、二酸化炭素濃度などの電気的情報を入力100として受け取る。入力100は、各機能部N1〜NN内のノードNとリンクLKとを通じて伝達され、情報処理されて、環境・身体への反応などの電気的情報(出力200)として出力される。
【0034】
脳にはおよそ1000億個の神経細胞があるが、本実施形態の情報処理装置1では、それらの神経細胞を各機能部N1〜NN(
図1)に分けて、神経細胞の集合体として扱う。機能部10は、
図2(A)〜(D)のような脳の神経ネットワークを模擬したニューラルネットワークにより構成されているため、従来のように、大脳皮質と大脳辺縁系のみを考慮したものではなく、脳神経系への入力から出力までを考慮することができ、脳幹なども神経回路に含むことができる。
図2(D)に示す運動機能N4は、姿勢制御をしながら目標運動を行うための神経ネットワークであるため、例えばコップを手にとり特定の場所に移動させるといった機能を実現させることが可能であり、従来「経験」としてモデル化されていたものに相当し得る。
【0035】
機能部10の各機能部N1〜NN(
図1)を作成する際には、各機能を表す神経ネットワークを用いて学習が行われる。この際、各機能に応じて、適切な学習方法(教師なし学習、教師あり学習、強化学習など)が選択される。例えば、運動機能において重要な大脳基底核機能を表すためには強化学習が選択され、小脳の機能を表すためには教師あり学習が選択され、運動野・体性感覚野の機能を表すためには教師なし学習が選択される。一方、情動機能に関連する扁桃体や側坐核の機能を表すためには、強化学習に関連する学習方法が選択されるなど、各機能に応じて学習方法が選択され得る。なお、
図2(A),(B)において、感覚機能としての視覚に関係する機能部N1と、感覚機能しての聴覚に関係する機能部N2とに区別しているように、脳のある機能(上記例では感覚機能)と、機能部10内の機能部N1〜NNとの対応関係は、1対多としてもよい。また、脳の複数の機能(例えば、情動機能と感覚機能)を、機能部10内の1つの機能部NNにまとめることで、対応関係を多対1としてもよい。
【0036】
図3は、機能部10の学習について説明する図である。
図3(A)は、2層に並べられたユニットを持つニューラルネットワークの一例を表す図である。
図3(B)は、1層のユニットを持つニューラルネットワークの一例を表す図である。
図3(C)は、運動機能に関係する機能部N4を例示した説明図である。
図3(D)は、機能部N4の強化学習の様子を表す説明図である。
図3(E)は、機能部N4の筋制御についての機能マップの一例を表す図である。
【0037】
上述の通り、機能部10の各機能部では、新たな入力100の処理を経た学習を行う。以降、
図3(C)及び(D)に表す、運動機能に関係する機能部N4の強化学習について例示して説明する。
図3(D)に表すように、運動機能に関係する機能部N4では、大脳基底核を含む神経ネットワークが模擬されている。この大脳基底核の機能の一つである、姿勢維持を目的とした強化学習を行う場合、強化学習アルゴリズムの利用において、
図3(B)に示す1層のユニットを持つニューラルネットワークを複数個用いることによって、
図3(D)に示す機能部N4−1を学習モデル化する。例えば、身体からの入力100として、単関節の関節角度と、関節角速度とを用いて、出力200として、重力下において姿勢維持を実現するための各筋の筋活性度を得ることを目的とした強化学習を行う。すると、
図3(E)に示すように、関節角度と関節角速度との入力に対して、それぞれの筋毎に姿勢維持を実現する最適な活性度が得られる筋制御関数、すなわち機能マップを得ることができる。また、最適値が得られたときの機能マップと、重み値W
ijとが、それぞれの機能部ごとに、記憶部に記憶される。
【0038】
図4は、再帰型ニューラルネットワークの一例を示す図である。
図3(D)に示す機能部N4−1の学習モデル化において、例えば、脳幹から視床、視床から体性感覚野へと伝達される神経信号をも加味する場合、
図3(A)に示す2層に並べられたユニットを持つニューラルネットワークや、3層以上の多層のニューラルネットワークを用いて、神経ネットワークの結合性に応じて学習モデルを作成することができる。この際、
図4に示す再帰型ニューラルネットワークRNN(Recurrent Neural Network)を用いると、空間における学習だけでなく時系列の学習を行うこともできる。再帰型ニューラルネットワークは、文章などの連続的な情報を処理する自然言語処理の分野で利用されている。さらに、再帰型ニューラルネットワークRNNに加えて、長・短期記憶LSTM(Long Short-Term Memory)の方法を併用すれば、長期にわたる記憶を実現できるため好ましい。
【0039】
図5は、時間間隔毎の機能マップ及び重み値W
ijの一例を示す図である。上述のように、再帰型ニューラルネットワークRNNと長・短期記憶LSTMとを利用すれば、
図5に示すように、時間間隔毎に最適な機能マップと重み値W
ijを得ることができ、長期の時間において学習した情報を、機能マップを用いて記憶として蓄積することができる。最適値が得られた際の機能マップの時間的変化及び重み値W
ijの時間的変化に関する情報は、それぞれの機能部ごとに、記憶部に記憶される。人は、生まれてからの経験を各機能について、記憶として蓄積していると考えられる。ただし、全ての記憶を即座に引き出せるわけではなく、即座に引き出せる記憶には制限があると考えられる。本実施形態の情報処理装置1では、即座に引き出せる記憶の情報は、機能マップからルックアップテーブルとして利用することにより取得でき、通常の情報は、重み値W
ijを用いた計算から取得できる。
【0040】
図3(E)の例では、関節角度と、関節角速度とを入力とした例を示した。しかし、これらの関節角度や関節角速度に関する情報は、関節にある筋骨格系の機械受容器である関節包受容器により検知され、電気的情報として脳に伝達される。このように、環境や身体からの刺激や信号を電気的情報として扱うためには、機械受容器のような、機械刺激を電気的情報に変換する方法が必要である。この点、Hodgkin-Huxleyが提案した非線形微分方程式などを用いて、環境からの刺激を電気的情報に変換する数理モデルを利用できる。視覚、聴覚、触覚においていくつかの数理モデルが提案されており、例えば、非特許文献3に記載の技術を利用すれば、フラッシュ光の入力に対する光感受性電流を出力することができる。また、非特許文献4に記載の技術を利用すれば、有限要素法を用いた皮膚の力学モデルにより手指皮膚に圧迫や2点刺激を与えたときのメルケル細胞のインパルス応答を、それと相関があるミーゼス応力として出力することができる。このような各感覚器の数理モデルを用いることによって、刺激に対する電気的情報を得ることができる。
【0041】
図2(E)は、機能部N1〜NNの各神経ネットワークを統合した統合ネットワークNjの一例を表す図である。
図2(F)は、脳の構造と物理的特性の説明図である。
図2(F)では、実際の脳の構造と、材料力学及び流体力学に基づく物理的特性と、を表現した計算モデル21を概念的に表している。計算モデル21は、材料力学と流体力学の物理学計算を行うための基本モデルであり、以降「力学モデル21」とも呼ぶ(
図1:情報統合部20、力学モデル21)。力学モデル21は、予め算出されて、情報処理装置1の図示しない記憶部に記憶されている。この力学モデル21には、例えば、脳の構造や、血管配置による特性が反映されている。力学モデル21に反映されている脳の特性は、ある個人のものであってもよく、一般化されたものであってもよい。
図2(G)は、統合ネットワークNjと、計算モデル21との統合を説明する図である。
図2(F)は、入力100に対する応力分布の一例を表す図である。
【0042】
情報統合部20は、機能部10の各機能部N1〜NNが入力100として受け取る電気的情報を、力学モデル21を用いて統合し、脳全体の力学的情報(例えば、応力分布)に変換する。具体的には、情報統合部20は、
図2(F)に示す力学モデル21に、
図2(E)に示す統合ネットワークNj(機能部N1〜NNの各神経ネットワークを統合したもの)の配置を用いた電磁気的解析を行う(2(G))。これにより、情報統合部20は、統合ネットワークNjに対して入力100が与えられた際の、ある時刻t
1における応力分布Ns(t
1)を求めることができる。
【0043】
図6は、機能部N1と、力学モデル21との統合について説明する図である。情報統合部20は、統合ネットワークNjとは別に、
図2(A)〜(D)に示す各機能部N1〜NNのそれぞれに対して、力学モデル21を適用して、それぞれの応力分布を得てもよい。
図6の例では、情報統合部20は、力学モデル21に、機能部N1の配置を用いた電磁気的解析を行うことにより、機能部N1に対して入力100が与えられた際の、ある時刻t
1における応力分布Ns(t
1)を求めている。
図6の場合は、感覚機能としての視覚が、外部から刺激を受け取った場合の、脳の応力分布が得られることとなる。
【0044】
情報統合部20は、さらに、統合された力学的情報(上述の例では、応力分布)を、ニューラルネットワークの重み値W
ijなどと関連付けてもよい。従来では、力学的情報の理論的算出を学問対象とする物理学と、ニューラルネットワークなどの複数の情報の関連性の推定を学問対象とする情報学と、を直接結び付ける方法は提供されていなかった。しかしながら、脳の神経線維の密度分布は、脳の硬さ分布と強い関連があるため、脳の硬さ分布において硬い部位は、脳の神経線維の分布において神経線維の密度が大きいと言える。そして、神経線維の密度が大きいということは、神経伝達がしやすくなる、すなわちニューラルネットワークの重み値が大きくなることがわかる。以降では、この着想に基づいて得られた、力学的情報としての脳全体の硬さ分布と、ニューラルネットワークの重み値とを関連付ける方法について説明する。
【0045】
図7は、脳全体の硬さ分布と、ニューラルネットワークの重み値との関連付けについて説明する図である。
図7(A)は、脳全体の硬さ分布を表す力学モデル21を表す。
図7(B)は、ニューラルネットワークとして表された脳全体の学習モデル22を表す。ここで、力学モデル21(
図1:情報統合部20、力学モデル21、
図7(A))において、脳は非線形の力学的特性を示すが、微小変形における線形の力学特性のみを考慮して、力学モデル21を式(1)のように表現する。式(1)において、σ
iは相当応力を、E
ijは弾性率を、ε
iは相当ひずみを、σ
j0は初期の相当応力を、それぞれ表す。なお、i,j=1〜nであり、nは脳の部位の全数を表す。
【0047】
一方、ニューラルネットワークで表現される学習モデル22(
図1:情報統合部20、学習モデル22、
図7(B))を式(2)のように表現する。式(2)において、y
iは出力値を、W
ijは重み値を、x
iは入力値を、b
jはバイアスを、それぞれ表す。なお、i,j=1〜nであり、nは脳の部位の全数を表す。式(2)の右項には総和規約を用いた。
【0049】
上述した脳全体の硬さ分布と、ニューラルネットワークの重み値との対応関係を考慮すると、
図7(A)に示す力学モデル21の弾性率E
ijは、
図7(B)に示す学習モデル22の重み値W
ijと等価になると考えることができる。ここで、弾性率E
ijは、ある部位iからある部位j方向への弾性率を示し、重み値W
ijは、ある部位iからある部位jに信号が伝達するときの重み値を表す。このように、弾性率E
ijと重み値W
ijが等価であるなら、
図7(A)に示す力学モデル21の相当応力値σ
iと、
図7(B)に示す学習モデル22の出力値y
iも等価になると考えることができる。
【0050】
ただし、例えば有限要素モデルでは、E
ijは通常、直交座標系で表現される。しかし、
図7(B)の学習モデル22における重み値W
ijや、
図7(A)の力学モデル21の弾性率E
ijは、結合する部位どうしをつなぐ線分の方向を表す非直交基底ベクトルで表現される。このため、有限要素モデルなどと関連付けるためには、式(3)に示すように新座標x’
iおよび旧座標x
iそれぞれの基底ベクトルτ’
iおよびτ
iについて、座標変換が必要となる。式(3)の座標変換を行うことにより、力学モデル21で得られる弾性率E
ijや、相当応力σ
iを、学習モデル22の重み値W
ijや、出力値y
iと対応付けることが可能になる。
【0052】
図8は、機能部N1〜N4の各神経ネットワークが交差する脳機能部位における重み値及び弾性率を表す図である。
図2(A)〜(D)に示す各機能部N1〜N4を構成するノードNの中には、複数の機能部N1〜NNの間で重複するノードNも存在する。脳機能のハブとなっている視床や島皮質などがそれに相当する。このような場合、
図8に太枠の丸印で示すように、1つの脳機能部位Npに、重複する複数のノードNが存在する状態となる。このため、
図7で説明した、脳全体の硬さ分布とニューラルネットワークの重み値の対応関係(力学モデル21と学習モデル22との対応関係)をそのまま適用できる。
【0053】
MRE(Magnetic Resonance Elastography)を用いると、脳組織の弾性特性の分布を求めることができる。MREとは、高磁場のMRI(Magnetic Resonance Imaging)装置の中で駆動できる外部加振機により、振動と同期した振動勾配磁場を与えることにより、対象とする組織の波の画像から組織の粘弾性特性を求める手法である。解像度の問題はあるが、MREを用いれば、個人の脳組織の弾性率E
ijを求めることができる。一方、高磁場のMRI装置を用いた拡散MRIの強調画像DWI(Diffusion Weighted Imaging)や、DSI(Diffusion Spectrum Imaging)の手法により得られたデータを、DSI Studioなどのソフトウェアを用いて解析することにより、個人の脳の構造的なネットワークを構築することができ、上記結合する部位どうしをつなぐ線分の方向に関する情報を得ることができる。これにより、神経の方向に対応する個人の脳組織の弾性率E
ijを得ることができる。また、
図7で説明した、脳全体の硬さ分布とニューラルネットワークの重み値の対応関係(力学モデル21と学習モデル22との対応関係)を利用すれば、重み値W
ijも得ることができるため、これらを個人の脳の構造を反映させる場合の初期値として与えることができる。
【0054】
可塑性部30は、情報統合部20において変換された力学的情報を、各機能部N1〜NNの相互間における関連部位の力学量σ
p(例えば、相当応力値など)として表示する。また、可塑性部30は、関連部位の力学量σ
pが、予め設定された閾値σ
yより大きくなった場合に(
図1:σ=σ
p>σ
y)、ニューラルネットワークの重み値W
ijを更新する。ここで、閾値σ
yは力学量(相当応力値など)で表現される。閾値σ
yは、神経生理学における神経の可塑性を再現する値であり、実験データを再現するように調整され得る。
【0055】
図9は、可塑性部30について説明する図である。
図9(A)は、材料力学における塑性の概略図を示す。
図9(B)は、神経の可塑性の概略図を示す。
図9に示すように、本実施形態の情報処理装置1において、神経の可塑性(すなわち閾値σ
yの設定)は、材料力学における塑性域に達する状態、すなわち降伏点と類似する考え方を採用している。材料力学において、弾性域では繰り返し変形をさせても元の状態に戻るが、一度塑性域に入れば、元の状態には戻らず材料の形が変わってしまう。それと同様に、神経においても通常の弱い信号伝達は記憶に影響を及ぼすようなことはないが、情動体験、強い感覚受容などを体験するような信号伝達があった場合、記憶や行動選択に大きな影響を及ぼすことがある。このような場合に、脳神経系において構造的、機能的変化が起きると考えられる。このように、力学的情報とニューラルネットワークの重み値、換言すれば、物理学と情報学を対応づけることは、神経の可塑性における、脳神経系の構造的変化と機能的変化を同時に表現することができる利点がある。
【0056】
このように、可塑性部30は、各機能部N1〜NNの相互間における関連部位の力学量σ
p(例えば、相当応力値などの力学的情報)が閾値σ
yより大きくなった場合、
図7で説明した対応関係に基づいて、そのときの相当応力σ
pを出力値y
pとして対応付ける(
図1:可塑性部30、σ
p→y
p)。この結果、
図1に破線枠で示すように、各機能部N1〜NNでは、出力値y
pを満足するような重み値W
ijを導出する再学習計算が行われ、これにより重み値W
ijが更新され、更新された重み値W
ijが、各機能部N1〜NNの図示しない記憶部に保存される。このことは、脳神経系の機能的変化が起きたことを示している。一方、重み値W
ijが更新されると、
図7で説明した対応関係に基づいて、弾性率E
ijも更新される(
図1:可塑性部30、W→E)。これにより、脳全体の硬さ分布が変化するので、脳神経系の構造的変化が起きたことを示している。
【0057】
図1において可塑性部30から情報統合部20へ伸びる破線矢印に示すように、更新された弾性率E
ijはまた、情報統合部20の力学モデル21の弾性率E
ijをも更新する。同様に、更新された重み値W
ijは、各機能部N1〜NNの学習モデル22の重み値W
ijを更新する。更新以降の計算においては、更新後の弾性率E
ijや重み値W
ijを用いた計算が行われ、脳神経の構造・機能の変化を反映した学習が可能になる。通常では、各機能部N1〜NNにおいてそれぞれの機能を実現するように学習が個別に行われ、重み値W
ijなどが決められるが、実際の脳においては脳内の各機能ネットワークが相互に影響を及ぼしていると考えられている。この点、本実施形態の情報処理装置1では、可塑性部30において再学習が行われることにより、重み値W
ijが更新される。更新の際、応力分布に対応するように個々のネットワークの重み値W
ijが調整されるため、実際の脳のように、各機能ネットワークの相互作用を考慮した調整が可能となる。
【0058】
人の脳は日常的な行動において、情報処理装置1への入力100のように、環境や身体からの刺激・信号を受け、それに対して反応する行動をとっている。その際、正常な意識状態であれば、常に現在の感覚・情動・思考・運動(各機能部N1〜NNに相当)などの状態(現在値)を知覚し、過去の経験に基づく内部モデル(学習モデル22に相当)による予測値と比較して、現在値と予測値の誤差知覚に基づき行動を選択している。本実施形態の情報処理装置1についても、この原理に基づき行動選択を行う手法を採用する。
【0059】
脳における神経活動に関して、最近の脳波計や機能的MRIなどを用いた研究から、睡眠時においても、覚醒時と同じように脳の活動が見られることがわかっている。また、人は複数のタスクを同時に行うことができるが、その許容量には限界があり、複数のタスクを同時に同じクオリティで行うことは困難である。このような観点と生体の恒常性の観点から、脳活動に必要なエネルギーは一定であると考えられる。一方、脳における物理学的な観点からも、脳に身体からの神経の電気信号、血流、脊髄液などが入ってくるが、これらの作用による自由エネルギーは、外部への損失がない限り一定であることが考えらえる。上記のような観点から、以降では、脳全体の統合された力学的情報に基づく自由エネルギーは一定であると仮定する。
【0060】
行動選択部40は、優先行動を決めるという意図に基づき、最適な行動を選択する手段を提供する。以下、複数のタスクを同時に行うことを想定し、機能ネットワークN1,N2,N3に関係するタスクをそれぞれT1,T2,T3とし、3つのタスクを同時に行うこととする。その中で、タスクT2を優先して行う場合を想定する。この場合、環境や身体からの刺激や信号といった入力100に対して、各機能部N1〜NNにおいて、タスクT1,T2,T3のそれぞれについて、各タスクの目標値(タスクの想定イメージ)と内部モデルによる予測値の誤差を、以下の式から求めることができる。ここで、内部モデルとは、記憶部に保存された重み値W
ijなどに基づくニューラルネットワークモデル、あるいは、
図3(E)及び
図5に示した機能マップを意味する。式(4),式(5),式(6)において、e
N1,e
N2,e
N3は予測誤差を、y
N1,y
N2,y
N3は内部モデルによる予測値(学習モデル22の出力値y
i)を、y
N10,y
N20,y
N30は各タスクの目標値を、それぞれ表す。
【0064】
ここで、
図7で説明した対応関係を考慮すると、内部モデルによる予測値y
N1,y
N2,y
N3は、それぞれ相当応力σ
N1,σ
N2,σ
N3に対応付けられる。このため、タスクT1,T2,T3に関係づけられる脳の自由エネルギー(ヘルムホルツの自由エネルギー)は、それぞれE(σ
N1),E(σ
N2),E(σ
N3)と表現することができ、上述した自由エネルギーが一定であるという条件は、以下の式(7)のように表現できる。式(7)において、脳全体の自由エネルギーE
Totalは、全ての機能部N1〜NNが活動するためのエネルギーの総和と、それ以外の脳の定常状態をたもつためのエネルギーEhの和である。
【0066】
図10は、行動選択部40について説明する図である。例えば、タスクT1とタスクT3が目標通りの行動、すわなち、e
N1=0,e
N3=0となる状態において、優先タスクであるT2を追加することを想定する。このとき、
図10に示すように、行動選択部40は、可能性のある複数の行動A11〜A34の中から、タスクT2の予測誤差e
N2が最小になるような、すなわち、機能部N2の行動部分の活動が最大となるようなタスクT2の行動を選択する。この際、式(7)の自由エネルギー一定の条件により、機能部N2の活動を大きくするために自由エネルギーE(σ
N2)を大きくすると、他のタスクT1とT3との活動に関係するエネルギーが小さくなるため、それぞれの初期の予測誤差e
N1,e
N3が大きくならないように最適化される必要がある。この問題は、組み合わせ最適化問題であり、様々な解法が提案されている。
【0067】
最近では、量子アニーリング方式を用いた量子コンピュータにより、高速かつ効率的に組み合わせ最適化問題を解くことができる。このため、例えば
図10に示すように、入力100が与えられてから、機能部10、情報統合部20、可塑性部30による上述した一連処理をノイマン型のコンピュータにおいて行い、その後、行動選択部40による組み合わせ最適化問題の処理においては、量子コンピュータにより行ってもよい。情報処理装置1において、多数の機能部N1〜NNを実装する場合、式(7)条件下において意図に基づく最適な行動選択を実現するためには、量子ンピューターを用いて組み合わせ最適化問題を解くことが効率的である。
【0068】
予測誤差e
N1〜
NNが0あるいは非常に小さい場合、人は知覚することなく反応する無意識行動になり、予測誤差e
N1〜
NNが大きい場合は、意識に上る意識行動となる。このため、行動選択部40は、予測誤差の大きさによって、行動が意識的なものか無意識的なものかを判定することができる。従来から、予測誤差は、人の認知活動の大きな部分を占めることが知られる一方で、意識を単純な予測誤差だけでなく、脳内における各機能の統合の度合も重要であることも知られており、この点は、現在の神経科学分野においても明らかになっていない。本実施形態の情報処理装置1では、行動選択部40は、各機能部N1〜NNの活動が力学的情報として統合され、かつ、予測誤差e
N1〜
NNを小さくするように、各機能部N1〜NNがそれぞれ担当するマルチタスクの中から、統合された脳活動のエネルギーE
Totalが一定である、という条件のもとで組み合わせ最適化問題を解くことにより行動を選択している。このため、従来知られていた意識に対する概念を、別の形で含んでいる。行動選択部40は、なお、全ての機能部N1〜NNにおいて予測誤差が0あるいは非常に小さい場合は、無意識行動となることから、行動選択部40は、意識行動を選択するための最適化計算を実施しない。
【0069】
行動選択部40において選択された行動A11〜A34は、出力200、すなわち環境・身体への反応・信号として表現される。出力200は、例えば、機能部N4により表される感覚運動については、筋活性度やそれに基づく身体動作となり、機能部N4により表される情動行動については、表情筋の筋活性度やそれに基づく表情のパターン(喜び、怒りなど)となる。
【0070】
各機能部N1〜NNにおいて、思考に関連する神経ネットワークを考えるとき、様々な環境からの入力100と、各環境への反応・行動が関連付けられた出力200とが対応付けられた機能マップが、図示しない記憶部に保存される。このような場合も、行動選択部40は、個人の考え方・思想を反映した内部モデル(学習モデル22に相当)による行動結果の予測値y
N1〜
NNと、実際の行動結果の予測誤差e
N1〜
NNが得られた際、意識的な感情の変化(喜び、怒りなど)を誘発させたり、次の行動選択のための行動候補(関連する思考の機能部N1〜NN)を挙げる。
図1に示す行動選択リスト41内の行動N1#A1〜NN#N4や、
図10に示す行動A11〜A34は、このようにして機能部N1〜NNごとに候補として挙げられる行動である。換言すれば、各機能部N1〜NNが新たな入力100に対して学習を続ける過程で大きな予測誤差e
N1〜
NNが生じた際に、行動選択部40がそれを意識的な脳活動として捉えることで、行動選択部40は、機能部N1〜NNにおける新たな行動候補として行動選択リスト41に加える。これにより、新たな行動候補は、行動選択部40が組み合わせ最適化問題を解くときに、選択の対象となり得る。
【0071】
このように、情報処理装置1では、環境や身体からの刺激や信号を入力100として、機能部10、情報統合部20、可塑性部30、行動選択部40によって次の行動を選択し、環境や身体への反応や信号を出力200として出力するループを繰り返す。これにより、情報処理装置1では、人が経験を通して学習し、成長する過程を模擬することができる。この際、各機能部N1〜NNでは、各機能の神経ネットワークに関する学習結果(重み値W
ij、最適解が得られた時の機能マップ)が、記憶部に記憶される。また、可塑性部30は、力学量σ
p(力学的情報)が予め設定された閾値σ
yよりも大きくなった際に、脳の機能(重み値W
ij)を変化させ、それに伴い脳の神経構造(弾性率E
ij)をも変化させる(
図1:可塑性部30、W→E、可塑性部30から情報統合部20へ伸びる破線矢印)。行動選択部40は、その変化した、換言すれば成長した脳の構造(力学モデル21)と機能(学習モデル22)とを用いて、次の行動を選択する。行動により予測誤差e
N1〜
NNが生じた場合、行動選択部40は、その行動を行動選択リスト41に加える。これら一連のプロセスは、人の経験値や積極性など、人格に関わる部分を積み上げることに対応している。なお、力学モデル21と学習モデル22は、ともに入力100が与えられる限り、計算が継続される。すなわち、力学モデル21においても応力値が0にリセットされることはなく、繰り返し学習の際にも更新され、応力値は更新され続けられる。
【0072】
図11は、脳に力学的損傷が発生した場合の一例を示す図である。例えば、破線枠で囲んだ脳の特定部位において、神経の力学的損傷が発生した場合、その部位の弾性率E
ijは0になる。ここで、
図7で説明した対応関係を考慮すると、力学的損傷が発生した部位におけるニューラルネットワークの重み値W
ijも同様に、0になる。この結果、損傷した機能に関係する行動はできなくなる。このことから、情報処理装置1において、脳の力学的損傷に伴う脳機能低下を表現することが可能になる。
【0073】
また、外部から何らかの寄与を与えることによって、脳の特定部位において力学的変化を与えることにより、弾性率E
ijを変化させた場合も同様に考えることができる。この場合も、
図7で説明した対応関係を考慮して、弾性率E
ijが変化した部分におけるニューラルネットワークの重み値W
ijを変化させる。変化した重み値W
ijを利用して再学習を行い、得られた再予測の結果から、脳への寄与が機能改善につながるかどうかを予測することが可能となる。ここで、外部からの寄与として、機能改善のための行動選択、すなわち
図10で説明したように、目標値に対する予測誤差e
N1〜
NNを最小化するように、関連する各機能部N1〜NNの脳活動を大きくするような行動選択を繰り返すことによって、脳に力学的変化、すなわち弾性率E
ijの変化が起こる可能性がある。このため、
図10で説明した行動選択は、脳の損傷や力学的変化に伴う機能低下を改善する上で重要である。
【0074】
なお、
図1や
図10では、予め設定された各機能部N1〜NN(神経ネットワーク)を対象として説明した。しかし、実際に脳に損傷が起こった場合は、元の神経ネットワークとは関係のない部分において、新たな神経ネットワークを構築して再学習が行われる場合もある。これを実現するためには、
図2に示す各機能部N1〜NNを構成する各ノードNの再配置や、新たなリンクLKによる接続が行われる必要がある。ノードNの再配置や、新たなリンクLKによる接続のためには、自己組織化の理論などが有効になる。
【0075】
コンピュータ上で人の快適性、作業性、こころの状態を評価するために、デジタルヒューマンモデルは有効である。デジタルヒューマンモデルとは、骨格、骨、筋肉、血管、心臓、臓器などの各モデルデータから、血圧や筋力を含む身体内部情報を出力可能なモデルである。本実施形態の情報処理装置1は、このようなデジタルヒューマンモデルの、感覚運動や情動行動などの入出力を制御できる。デジタルヒューマンモデルと、本実施形態の情報処理装置1とを組み合わせて使用すれば、コンピュータ上で、人の快適性や作業性などを評価することができる。
【0076】
例えば、ゴルフのスウィングのような感覚運動を想定する。
図2(D)に示す機能部N4(神経ネットワーク)を用いて、身体の複数の関節・筋肉からの固有感覚情報や、手における触覚情報などが体性感覚野に伝達される。また、運動野から、目的のゴルフスウィングを達成させるような各筋の筋活性度に関する情報が、身体へ伝えられる。この際、大脳基底核や小脳と連携をとり、姿勢制御がされると共に、目標イメージの運動軌跡となるような筋活性度に調整される。このように機能部N4に対する学習が行われ、機能部10の記憶部に機能マップとして保持される。環境として風が強い場合や、足場が悪い場合は、
図10に示す複数の行動選択の中から、ゴルフスウィングを優先行動とした組み合わせ最適化が行われる。この際、例えば、情動として悲しい思いをした場合、それに関連する機能部N1〜NNに活動エネルギーの一部が充てられ、ゴルフスウィングの筋制御のために十分な活動エネルギーを充てることができなくなり、上手いショットが打てないなどの状況をシミュレーションすることが可能である。
【0077】
一般に、脳の側坐核において報酬が得られる条件が記憶され、扁桃体において恐怖・不安が得られる条件が記憶される。人が快適性を評価する場合は、この2つの脳機能部位を含む神経ネットワークが関与していると考えられる。本実施形態の情報処理装置1では、
図10に示すような方法により、内臓からの心拍、呼吸、血圧に関連する情報や、嗅覚や触覚などに関連する情報を入力100とし、快・喜びに対しては側坐核を含む報酬系の機能部用いて学習を行い、不快・恐れに対しては扁桃体を含む機能部において強化学習を用いて学習を行うことができる。
【0078】
また、快・不快が得られるときの入力100と出力200とを対応付ける機能マップなどを得ておき、現在の状況と機能マップなどによる予測誤差e
N1〜
NNを求める。行動選択部40は、得られた予測誤差e
N1〜
NNから快・不快の割合を求めることができるので、現在の環境における快・不快の評価が可能になる。さらに、快・不快に対する行動は、複数の行動選択の中から、意図に基づき、例えば快・喜びに対してはより多くの報酬が得られるような行動が選択されるように、不快・恐れに対しては逃げるような行動が選択されるようにしてもよい。本実施形態の情報処理装置1によれば、従来にない新しい方法で快・不快を評価することができ、かつそれに対して意図に基づく行動選択が可能になる。
【0079】
本実施形態の情報処理装置1では、個人の脳の構造を、機能部N1〜NNにおける神経ネットワークの配置の初期値として与えてもよい。そうすれば、環境や身体からの複数の刺激・信号(入力100)による学習を繰り返すことで、個人ごとに異なる学習、成長が可能となる。例えば、デジタルヒューマンモデルと組み合わせたゴルフスウィングの事例においては、個人の脳神経の構造や、個人の身体の構造的特徴などを取り入れた学習計算を行うことができるため、スポーツ競技の強化などにおける個人差に対応することができる。また、快・不快の評価においても、個人の脳神経の構造を考慮してもよい。
図10で説明した、学習に伴う行動選択リスト41の増加によって、個人の特性に応じた行動評価をも可能となる。個人の生理量(血圧、心拍数、呼吸数、運動など)を計測した上で、その情報を入力100としたときの、その個人の反応・対応(官能評価結果など)を出力200とした機能マップを作り、学習計算と対応させることができれば、個人に対応した学習・成長モデルの精度はさらに向上する。
【0080】
また、事故などで頭部に損傷を受けた場合や、精神疾患などで脳の神経構造に器質的な変化が起きた場合、
図11で説明したのように、力学的特性の変化に応じて、重み値W
ijが変化し、脳の各機能(機能部N1〜NN)にも影響を及ぼす。このため、本実施形態の情報処理装置1は、医療の分野における診断や、治療計画策定の際にも有用な知見を与える。また、リハビリや食事の改善など、身体から受ける刺激・信号(入力100)を変化させることを繰り返し、意識的に行動する、すなわち
図10で説明した脳の機能不全(あるいは脳の機能低下)を改善させるような活動を繰り返し選択することにより、関連する神経ネットワークの脳活動(例えば、機能部N1)に大きな変化を与えることができれば、それに関連する脳(たとえば、機能部N4)の神経構造も変化し機能改善するような神経ネットワークを再構成できる可能性もある。このように、本実施形態の情報処理装置1は、身体障害や精神疾患のリハビリを支援するための、ニューロリハビリ支援ツールとしても利用できる。
【0081】
<本実施形態の変形例>
本発明は上記の実施形態に限られるものではなく、その要旨を逸脱しない範囲において種々の態様において実施することが可能であり、例えば次のような変形も可能である。
【0082】
[変形例1]
上記実施形態では、情報処理装置1の構成の一例を示した。しかし、情報処理装置1の構成は種々の変形が可能である。例えば、情報処理装置1は、ネットワーク上に配置された複数の情報処理装置が協働することによって構成されてもよい。この場合、例えば、機能部10、情報統合部20、可塑性部30、行動選択部40の内の少なくとも一部が、異なる情報処理装置によって実現されてもよい。例えば、情報処理装置1には、異なる人にそれぞれ対応した、複数組の機能部10、情報統合部20、可塑性部30、及び行動選択部40が含まれていてもよい。例えば、情報処理装置1は、可塑性部30と、行動選択部40との少なくとも一方を備えていなくてもよい。
【0083】
[変形例2]
上記実施形態では、機能部10の各機能部N1〜NNはニューラルネットワークにより構成されるとした。しかし、各機能部N1〜NNは、ニューラルネットワーク以外の手段(例えば、
図3(E)に示した機能マップ)により構成されていてもよい。例えば、機能部10には、各機能部N1〜NNとは別に、機能部N1〜NNの各神経ネットワークを予め統合した統合ネットワークNjが記憶されていてもよい。
【0084】
[変形例3]
上記実施形態では、情報統合部20の力学モデル21は、材料力学と流体力学の物理学計算を行うためのモデルであると例示した。しかし、力学モデル21は、材料力学、流体力学、電磁気学など、少なくとも1つの物理的特性を表現したモデルとして構成されていてもよい。
【0085】
[変形例4]
上記実施形態では、可塑性部30は、力学的情報が予め設定された閾値より大きくなった場合に重み値を更新するとした。しかし、可塑性部30は、閾値を用いずに、処理のつど重み値を更新してもよい。例えば、重み値を更新するための閾値は、材料力学における降伏点とは関係なく決定されてもよく、使用者により変更可能にされてもよい。例えば、可塑性部30は、力学量(力学的情報)の表示を省略してもよい。
【0086】
[変形例5]
上記実施形態では、行動選択部40は、複数の行動を実行可能なマルチタスクの条件下で、実行すべき複数の行動と、さらに優先的に実行すべき行動とを選択した。しかし、行動選択部40は、単一の行動のみを実行する条件下で、実行すべき1つの行動を選択してもよい。例えば、行動選択部40は、機能部の目標値に対する予測誤差の最小化と、行動に要するエネルギーの最大化と、を行う組み合わせ最適化問題を解く以外の任意の方法で、行動を選択してもよい。
【0087】
以上、実施形態、変形例に基づき本態様について説明してきたが、上記した態様の実施の形態は、本態様の理解を容易にするためのものであり、本態様を限定するものではない。本態様は、その趣旨並びに特許請求の範囲を逸脱することなく、変更、改良され得ると共に、本態様にはその等価物が含まれる。また、その技術的特徴が本明細書中に必須なものとして説明されていなければ、適宜、削除することができる。上記実施形態において、ソフトウェアによって実現された機能及び処理の一部又は全部は、ハードウェアによって実現されてもよい。また、ハードウェアによって実現された機能及び処理の一部又は全部は、ソフトウェアによって実現されてもよい。ハードウェアとしては、例えば、集積回路、ディスクリート回路、または、それらの回路を組み合わせた回路モジュールなど、各種回路(circuitry)を用いることができる。