IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 国立大学法人大阪大学の特許一覧 ▶ 独立行政法人情報通信研究機構の特許一覧

特許7352914想起画像推定装置、想起画像推定方法、制御プログラム、記録媒体
<>
  • 特許-想起画像推定装置、想起画像推定方法、制御プログラム、記録媒体 図1
  • 特許-想起画像推定装置、想起画像推定方法、制御プログラム、記録媒体 図2
  • 特許-想起画像推定装置、想起画像推定方法、制御プログラム、記録媒体 図3
  • 特許-想起画像推定装置、想起画像推定方法、制御プログラム、記録媒体 図4
  • 特許-想起画像推定装置、想起画像推定方法、制御プログラム、記録媒体 図5
  • 特許-想起画像推定装置、想起画像推定方法、制御プログラム、記録媒体 図6
  • 特許-想起画像推定装置、想起画像推定方法、制御プログラム、記録媒体 図7
  • 特許-想起画像推定装置、想起画像推定方法、制御プログラム、記録媒体 図8
  • 特許-想起画像推定装置、想起画像推定方法、制御プログラム、記録媒体 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-09-21
(45)【発行日】2023-09-29
(54)【発明の名称】想起画像推定装置、想起画像推定方法、制御プログラム、記録媒体
(51)【国際特許分類】
   G06F 3/01 20060101AFI20230922BHJP
   A61B 5/37 20210101ALI20230922BHJP
   A61B 5/369 20210101ALI20230922BHJP
   G06F 16/583 20190101ALI20230922BHJP
【FI】
G06F3/01 515
A61B5/37
A61B5/369
G06F16/583
【請求項の数】 9
(21)【出願番号】P 2020523110
(86)(22)【出願日】2019-06-04
(86)【国際出願番号】 JP2019022113
(87)【国際公開番号】W WO2019235458
(87)【国際公開日】2019-12-12
【審査請求日】2022-05-19
(31)【優先権主張番号】P 2018107185
(32)【優先日】2018-06-04
(33)【優先権主張国・地域又は機関】JP
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成29年度、国立研究開発法人科学技術振興機構 戦略的創造研究推進事業 思考・行動を予想する脳ビックデータ(データさきがけ)、産業技術力強化法第17条の適用を受ける特許出願
(73)【特許権者】
【識別番号】504176911
【氏名又は名称】国立大学法人大阪大学
(73)【特許権者】
【識別番号】301022471
【氏名又は名称】国立研究開発法人情報通信研究機構
(74)【代理人】
【識別番号】110000338
【氏名又は名称】弁理士法人 HARAKENZO WORLD PATENT & TRADEMARK
(72)【発明者】
【氏名】▲柳▼澤 琢史
(72)【発明者】
【氏名】福間 良平
(72)【発明者】
【氏名】貴島 晴彦
(72)【発明者】
【氏名】西本 伸志
【審査官】星野 裕
(56)【参考文献】
【文献】特開2010-257343(JP,A)
【文献】特表2016-513319(JP,A)
【文献】国際公開第2017/022228(WO,A1)
【文献】特開平07-204168(JP,A)
【文献】特開昭63-054618(JP,A)
【文献】特開2016-067922(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 3/01
A61B 5/37
A61B 5/369
G06F 16/583
(57)【特許請求の範囲】
【請求項1】
被験者の脳の電気的特性を、視覚連合野を含む脳の領域の複数の計測点において計測する多点電位計測部と、
前記被験者が候補画像を視認している間に計測される前記電気的特性から、前記被験者が想起している目的画像の内容を示す復号情報を推定するデコーダと、
前記デコーダによって推定された前記復号情報に基づいて、前記被験者に過去に視認させた前記候補画像とは異なる画像を、前記被験者に次に視認させる候補画像として決定する画像決定部と、を備える
ことを特徴とする想起画像推定装置。
【請求項2】
前記画像決定部は、前記デコーダによって推定された前記復号情報と同じ、あるいは類似の前記復号情報に対応付けられた画像を、前記候補画像に続けて視認させる候補画像として決定する
ことを特徴とする請求項1に記載の想起画像推定装置。
【請求項3】
前記画像決定部は、
前記デコーダによって推定された前記復号情報と同じ、あるいは類似の前記復号情報を用いて検索用クエリを生成し、
生成した前記検索用クエリを用いて、検索対象の情報群から、前記復号情報と同じ、あるいは類似の前記復号情報に対応付けられている画像を検索し、
検索結果として取得された画像を、前記候補画像として決定する
ことを特徴とする請求項1に記載の想起画像推定装置。
【請求項4】
前記画像決定部は、前記検索結果として取得された画像を、前記候補画像に続けて視認させる候補画像として決定する
ことを特徴とする請求項3に記載の想起画像推定装置。
【請求項5】
所定の候補画像の内容を説明する1以上の説明文に含まれる1以上の単語に対応する単語ベクトルを用いて予め生成された教師復号情報と、当該所定の候補画像とが対応付けられており、
前記デコーダは、所定の候補画像を視認している間に計測される脳の電気的特性が入力された場合に、当該所定の候補画像に対応付けられた前記教師復号情報を出力するように学習される
ことを特徴とする請求項1から4のいずれか1項に記載の想起画像推定装置。
【請求項6】
前記デコーダは、前記候補画像を視認している間に計測される、脳の皮質電位、および脳の電気的な活動によって生じる磁場の少なくとも何れかを用いて、当該候補画像の内容を示す復号情報を推定する
ことを特徴とする請求項1から5のいずれか1項に記載の想起画像推定装置。
【請求項7】
被験者が候補画像を視認している間に、視覚連合野を含む脳の領域の複数の計測点において計測される脳の電気的特性から、前記被験者が想起している目的画像の内容を示す復号情報を推定する推定ステップと、
前記推定ステップにおいて推定した前記復号情報に基づいて、前記被験者に過去に視認させた前記候補画像とは異なる画像を、前記被験者に次に視認させる候補画像として決定する画像決定ステップと、を含む
ことを特徴とする想起画像推定方法。
【請求項8】
請求項1から6のいずれか1項に記載の想起画像推定装置としてコンピュータを機能させるための制御プログラムであって、前記デコーダ、および前記画像決定部としてコンピュータを機能させるための制御プログラム。
【請求項9】
請求項8に記載の制御プログラムを記録したコンピュータ読み取り可能な記録媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は想起画像の推定に関し、特に、想起された任意の画像を提示することを支援する想起画像推定装置等に関する。
【背景技術】
【0002】
筋萎縮性側索硬化症(ALS)などの進行性の神経難病、および脳血管障害などに起因して、身体の運動機能が極度に低下している患者が多数存在する。このような患者に対する支援技術の1つとして、ブレイン-マシン-インタフェース(BMI)が挙げられる。
【0003】
BMIは、患者の脳神経細胞の活動電位、あるいは皮質脳波などを計測して運動意図を読み解き、ロボットアームなどの機械の動作を制御したり、患者が意図した文字を選択して入力するよう制御したりすることを可能にする技術などを含んでいる。ALS患者を対象に実施されたアンケートによれば、患者の意思伝達をBMI技術によって支援することが強く要望されている。
【0004】
例えば、特許文献1には、呈示された画像と、画像を呈示した際に脳の視覚連合野を含む領域の複数の計測点において計測された電気的特性とを相互に対応付けて、計測された電気的特性に基づいて伝えたい画像を特定して、意思伝達を支援する意思伝達支援装置が開示されている。
【0005】
また、非特許文献1には、被験者の海馬から記録した神経細胞の発火活動を計測して、2つの画像が重なった画像を、被験者がどちらかの画像のことを考えることで、考えた方の画像を強く表示させることができる技術が開示されている。
【先行技術文献】
【特許文献】
【0006】
【文献】特開2010-257343号公報(2010年11月11日公開)
【非特許文献】
【0007】
【文献】M. Chef, N. Thiruvengadam, F. Mormann, A. Kraskov, R. Q. Quiroga, C. Koch, and I. Fried, “On-line, voluntary control of human temporal lobe neurons”,Nature, Vol. 467, No.7319, pp.1104-1108,2010.
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、上述のような従来技術は、想起した任意の画像を高い精度で推定することはできないという問題がある。
【0009】
例えば、特許文献1に記載の意思伝達支援装置は、呈示された画像に対応付けられている電気的特性に基づいて表示する画像を決定するため、表示可能な画像は呈示された画像に限られ、想起された任意の画像を表示することはできない。
【0010】
また、非特許文献1に記載の技術においても、2つの画像が重なった状態を視認している被験者が、いずれかの画像に意識を向けることによって、意識を向けた側の画像を強く表示させることはできるものの、想起された任意の画像を表示させるものではない。
【0011】
本発明の一態様は、被験者が想起している目的画像を、精度良く推定する想起画像推定装置および想起画像推定方法を実現することを目的とする。
【課題を解決するための手段】
【0012】
上記の課題を解決するために、本発明の一態様に係る想起画像推定装置は、被験者の脳の電気的特性を、視覚連合野を含む脳の領域の複数の計測点において計測する多点電位計測部と、前記被験者が候補画像を視認している間に計測される前記電気的特性から、前記被験者が想起している目的画像の内容を示す復号情報を推定するデコーダと、前記デコーダによって推定された前記復号情報に基づいて、前記被験者に視認させる候補画像を決定する画像決定部と、を備えている。
【0013】
また、本発明に係る想起画像推定方法は、上記の課題を解決するために、被験者が候補画像を視認している間に、視覚連合野を含む脳の領域の複数の計測点において計測される脳の電気的特性から、前記被験者が想起している目的画像の内容を示す復号情報を推定する推定ステップと、前記推定ステップにおいて推定した前記復号情報に基づいて、前記被験者に視認させる候補画像を決定する画像決定ステップと、を含んでいる。
【発明の効果】
【0014】
本発明の一態様によれば、被験者が想起している目的画像を、精度良く推定することができる。
【図面の簡単な説明】
【0015】
図1】本発明の一実施形態に係る想起画像推定装置の概略構成例を示す機能ブロック図である。
図2】想起画像推定装置の処理の流れの一例を示すフローチャートである。
図3】デコーダを生成するための機械学習を行う想起画像推定装置の概略構成の一例を示す機能ブロック図である。
図4】(a)は、機械学習によってデコーダを生成する方法の一例を示すフローチャートであり、(b)は、学習用画像および各画像の内容を示す復号情報の準備工程を示すフローチャートである。
図5】デコーダを生成するための学習用画像、および学習用画像の内容を説明する説明文の一例を示す図である。
図6】学習用画像を用いてデコーダを生成する手順の一例を説明するイメージ図である。
図7】本発明の一実施例の結果を示すグラフである。
図8】本発明の他の実施例の結果を示すグラフである。
図9】本発明の一実施形態に係る想起画像推定装置の概略構成例を示す機能ブロック図である。
【発明を実施するための形態】
【0016】
〔実施形態1〕
以下、本発明の一実施形態に係る想起画像推定装置10について、詳細に説明する。想起画像推定装置10は、被験者が想起している目的画像を、該目的画像の内容を示す復号情報を推定し、推定した復号情報に基づいて、被験者に視認させる候補画像を決定する装置である。想起画像推定装置10は、被験者に視認させた画像と、当該画像を視認しているときの被験者の脳Bの電気的特性との1対1の対応関係に基づいて候補画像を決定するものではない。それゆえ、想起画像推定装置10は、予め被験者に視認させた画像ではない任意の候補画像を、被験者に視認させる候補画像として決定することができる。それゆえ、想起画像推定装置10は、被験者が外部に提示したいと希望する任意の画像およびイメージを外部に提示できるように支援する装置である。ここで、「候補画像」とは、脳Bの電気的特性を計測するために被験者に視認させる画像を意図しており、「目的画像」とは、被験者が候補画像を視認しつつ想起している画像(すなわち、被験者が提示したいと希望している画像)を意図している。
【0017】
(想起画像推定装置10の構成)
まず、想起画像推定装置10の構成について、図1を用いて説明する。図1は、本発明の一実施形態に係る想起画像推定装置10の概略構成例を示す機能ブロック図である。なお、以下では想起画像推定装置10が表示部5を備える構成を例に挙げて説明するがこれに限定されない。例えば、表示部5の代わりに外部の表示装置を適用する構成であってもよい。
【0018】
図1に示すように、想起画像推定装置10は、多点電位計測部1、デコーダ2、画像決定部3、表示制御部4、表示部5、および記憶部6を備えている。
【0019】
多点電位計測部1は、被験者の脳Bの電気的特性を、視覚連合野を含む脳Bの領域の複数の計測点において計測する。より具体的には、多点電位計測部1は、複数の電極Eを備え、脳Bの皮質脳波(Electro-Cortico-Graphy:ECoG)を計測する(低侵襲的構成)。この場合、電極Eは硬膜下に留置されるECoG電極である。電極Eは、画像を視認している被験者の脳Bに生じた皮質電位を検出するための電極である。電極Eは、脳Bの大脳皮質の視覚連合野を含む領域の表面および脳溝の表面に留置され得る。なお、電極Eの数は複数(例えば、100)であればよく、特に限定されない。
【0020】
なお、多点電位計測部1は、皮質電位を計測する構成に限定されない。例えば、多点電位計測部1は、
・電極Eとして脳Bに刺入電極を用いて神経細胞の活動電位(Multi-unit Activity:MUA)を計測する構成(侵襲的構成)
・電極Eとして脳Bに刺入電極を用いる脳波(stereotactic Electro-Encephalo-Graphy:stereotactic EEG)を計測する構成(侵襲的構成)
・頭皮上に配置された電極Eを用いる頭皮脳波(scalp Electro-Encephalo-Graphy:scalp EEG)を計測する構成(非侵襲的構成)
・脳血管内に配置された電極Eを用いる脳血管内脳波(intravascular Electro-Encephalo-Graphy:intravascular EEG)を計測する構成(低侵襲的構成)
・電極Eとして脳磁図(Magneto-Encephalo-Graphy:MEG)用のセンサを用いて、脳Bの電気的な活動によって生じる磁場を計測する構成(非侵襲的構成)、のいずれかであってもよい。
【0021】
ただし、計測される脳Bの電気的特性の感度は一般に、scalp EEG<MEG<intravascular EEG<stereotactic EEG<ECoG<MUAの順である。一方、被験者の身体への負担は、scalp EEG=MEG<intravascular EEG<stereotactic EEG=ECoG<MUAの順である。達成されるべき精度と被験者の身体への負担を考慮すると、多点電位計測部1としては、MEGおよびECoGが望ましい。
【0022】
多点電位計測部1によって皮質電位を測定する構成を適用する場合、例えば、アルファ波(8~13Hz)、ベータ波(13~30Hz)、低周波ガンマ波(30~80Hz)、および高周波ガンマ波(80~150Hz)の各帯域の脳波が適用され得る。
【0023】
デコーダ2は、候補画像を視認している間に計測される電気的特性から、被験者が想起している目的画像の内容を示す復号情報を推定する。ここで、「復号情報」とは、画像の内容および意味を示す情報である。より具体的には、「復号情報」は、画像の内容および意味を、意味空間(「単語ベクトル空間」と表されてもよい)におけるベクトルとして表した情報である。画像の内容を意味空間におけるベクトルとして表す方法については、具体例を挙げて後に説明する。
【0024】
デコーダ2は、学習済のニューラルネットワークであってもよい。デコーダ2を作成するための学習には、所定の候補画像と、所定の候補画像の内容を説明する1以上の説明文に含まれる1以上の単語に対応する単語ベクトルを用いて予め生成された教師復号情報とが用いられる。この場合、デコーダ2は、入力層と出力層とを備え、所定の候補画像を視認している間に計測される脳Bの電気的特性が入力層へ入力された場合に、当該所定の候補画像に対応付けられた教師復号情報を出力層から出力するように学習される。デコーダ2を学習によって生成する処理については、後に具体例を挙げて説明する。
【0025】
画像決定部3は、デコーダ2によって推定された復号情報に基づいて、被験者に視認させる候補画像を決定する。より具体的には、画像決定部3は、デコーダ2によって推定された復号情報と同じ、あるいは類似の復号情報に関連付けられている候補画像を、被験者に視認させている候補画像に続けて視認させる候補画像として決定する。
【0026】
表示制御部4は、画像決定部3が決定した候補画像を表示するよう表示部5を制御する。また、表示制御部4は、デコーダ2を学習によって生成する処理において、学習用に準備された所定の候補画像を表示するよう表示部5を制御する。
【0027】
表示部5は、画像を表示するディスプレイである。被験者は、表示部5に表示される画像を視認しつつ、任意の目的画像を想起する。
【0028】
記憶部6は、表示部5にて表示する候補画像を記憶している。各候補画像には、各候補画像の内容を示す復号情報が対応付けられている。なお、想起画像推定装置10がデコーダ2の機械学習(教師有り学習)を行う機能も備えている場合、記憶部6には、学習用画像(所定の候補画像)および、学習用画像毎に対応付けられた復号情報(教師復号情報)を記憶している。
【0029】
上記の構成によれば、候補画像を視認している被験者の脳Bの電気的特性から、当該被験者が想起している画像の内容を示す復号情報を推定し、推定された復号情報に基づいて決定された画像を当該被験者に視認させる。これにより、候補画像を被験者に視認させ、復号情報を推定し、推定した復号情報に基づいて次の候補画像を決定する、というclosed-loop制御機構が構成され得る。ここで、closed-loop制御機構とは、被験者が候補画像を視認しているときに計測される脳Bの電気的特性から、当該被験者に視認させる候補画像を決定する、という「閉じた制御機構」を意図している。
【0030】
このようなclosed-loop制御機構を適用することによって、被験者は所望の目的画像を想起しつつ、候補画像を視認するという工程を繰り返すことになる。それゆえ、被験者自身による脳活動のトップダウン制御が脳Bの視覚野に入力され、このトップダウン制御が入力したときの脳Bの電気的特性を計測することができる。よって、被験者が想起している目的画像を精度良く推定することができる。
【0031】
ここで、トップダウン制御とは、ボトムアップ制御と同様に、脳Bが視覚情報を処理する場合の神経情報制御形態の一つである。トップダウン制御は、視覚情報の中から選ぶべき刺激について事前知識を持っている場合に、能動的に神経情報にバイアスをかけることによって目的とする刺激を選択する制御である。これに対して、ボトムアップ制御は、視覚情報に含まれる複数の刺激のうち、周囲の刺激と顕著に異なる刺激が含まれる場合などに、受動的にその顕著な刺激に注意を向けるような制御である。
【0032】
(想起画像推定装置10の処理の流れの概要)
続いて、想起画像推定装置10の処理の流れについて、図2を用いて説明する。図2は、想起画像推定装置10の処理の流れの一例を示すフローチャートである。
【0033】
まず、デコーダ2が機械学習によって生成される。具体的には、所定の候補画像を視認している間に計測される脳Bの電気的特性が入力された場合、当該所定の候補画像に対応付けられた教師復号情報を出力するように、デコーダ2を学習する(ステップS1:デコーダ生成ステップ)。図1に示すような想起画像推定装置10においては、学習済のデコーダ2が適用される。
【0034】
次に、表示制御部4は、被験者に視認させる候補画像が表示されるように表示部5を制御する(ステップS2:候補画像表示ステップ)。画像は、複数の画像からなる動画であってもよい。音声の有無は問わない。なお、被験者に最初に視認させる候補画像に特に限定は無く、例えば、想起画像推定装置10による推定処理が開始されたことを通知する画面など、任意の画像を表示すればよい。
【0035】
次に、デコーダ2は、多点電位計測部1によって計測される表示された候補画像を視認している被験者の脳Bの電気的特性から復号情報を推定する(ステップS3:推定ステップ)。
【0036】
続いて、画像決定部3は、デコーダ2によって推定された復号情報に基づいて、被験者に視認させる候補画像を決定する(ステップS4:画像決定ステップ)。
【0037】
そして、ステップ2に戻り、表示制御部4は、画像決定部3によって決定された画像が、被験者に続いて表示されるように表示部5を制御する。
【0038】
このように、ステップS2~S4の処理を繰り返すことにより、被験者は所望の目的画像を想起しつつ、候補画像を視認するというclosed-loop制御機構が構成される。
【0039】
(デコーダ2を作成するための学習を行う想起画像推定装置10aの構成)
ここでは、デコーダ2を機械学習によって生成する想起画像推定装置10aの構成について図3を用いて説明する。図3は、デコーダ2を作成するための機械学習を行う想起画像推定装置10aの概略構成の一例を示す機能ブロック図である。なお、想起画像推定装置10aは、図1に示す想起画像推定装置10と同じ機能、および同じ構成(例えば、デコーダ2の学習に関係しない画像決定部3など)を備えていてもよい。
【0040】
想起画像推定装置10aは、復号情報比較部7および重み係数補正部8を備えている。
【0041】
復号情報比較部7は、学習用画像を視認している被験者の脳Bから計測された脳Bの電気的特性から学習前(または学習中)のデコーダ2によって推定された復号情報と、当該学習用画像に対応付けられた教師復号情報とを比較する。
【0042】
重み係数補正部8は、復号情報比較部7による比較結果に基づいて、デコーダ2の重み係数を補正する。具体的には、重み係数補正部8は、学習用画像を視認している被験者の脳Bから計測された脳Bの電気的特性が入力された場合に、当該学習用画像に対応付けられた教師復号情報を出力するように、デコーダ2の現在の重み係数を補正する。
【0043】
このようにデコーダ2を機械学習によって生成することにより、目的画像を想起している被験者の脳Bの電気的特性から、目的画像の内容を示す復号情報を高い精度で推定することができるデコーダ2を作成することができる。
【0044】
(機械学習によるデコーダ2の生成)
次に、デコーダ2を作成するための機械学習の方法の概略を図4および5を用いて説明する。図4の(a)は、機械学習によってデコーダを生成する方法の一例を示すフローチャートであり、図4の(b)は、学習用画像および各画像の内容を示す復号情報の準備工程を示すフローチャートである。図5は、デコーダ2を作成するための学習用画像、および学習用画像の内容を説明する説明文の一例を示す図である。
【0045】
まず、機械学習に供される学習用画像、および各学習用画像の内容を示す教師復号情報を準備する(ステップS11:学習用画像準備ステップ)。
【0046】
<学習用画像と教師復号情報の準備>
以下、学習用画像と教師復号情報とを準備する工程の具体例について、図4の(b)を用いて説明する。なお、図4の(b)に示す工程のうち、ステップS113~S115は、一般的なパーソナルコンピュータを用いて行われ得る。
【0047】
・機械学習に用いる学習用画像を準備する工程(ステップS111)。
【0048】
・学習用画像毎に、当該学習用画像の内容および意味を説明する説明文(キャプションまたはアノテーション)を準備する工程(ステップS112)。説明文は、1文であってもよいし、複数の文章を含んでいてもよい。説明文は、画像の内容および画像を視認したときに受ける印象などを端的かつ正確に記載した文章であることが望ましい。説明文は、1または複数人に画像を見せて作成されたものであってもよいし、画像認識機能を備える人工知能を用いて人工的に作成されたものであってもよい。デコーダ2を作成するための学習用画像、および学習用画像の内容を説明する説明文については、後に具体例を挙げて説明する。
【0049】
・説明文に含まれる単語を抽出する工程(ステップS113)。この工程には、公知の形態素解析エンジンが適用され得る。このような公知の形態素解析エンジンとしては、「MeCab(和布蕪)」、「Chasen」、および「KyTea」などが挙げられる。なお、この工程は、説明文が日本語で記載されている場合に必要となる工程である。説明文が、例えば英語などのように、各単語が分かれている(例えば、単語と単語との間にスペースが存在する)言語で記載されている場合には、この工程は省略される。
【0050】
・抽出された各単語の単語ベクトルを生成する工程(ステップS114)。この工程には、意味空間における単語の分散表現を出力する機能を有する公知のツール(例えば、人工知能)が適用され得る。なお、このような公知のツールとしては、「Word2vec」、「GloVe」、「fastText」、「Doc2Vec」、および「WordNet」などが挙げられる。例えば、既存の文章(例えば、ウェブ上の「ウェキペディア」などの記述)を多数用いて学習済の「Word2vec」は、説明文から抽出された各単語について、所定の次元(例えば1000次元)の意味空間における単語ベクトルを高い精度で出力することができる。なお、単語ベクトルは互いに線形演算が可能な線形空間におけるベクトルであることが望ましいが、非線形空間における単語ベクトルであってもよい。なお、この工程は、説明文の記載に用いられた言語の種類によらず同様に実施され得る。例えば、説明文が英語で記載されている場合、Word2vecなどを英語版のウェキペディアなどを用いて学習し、学習されたWord2vecにて単語ベクトルを出力すればよい。
【0051】
・単語ベクトルの平均として、当該学習用画像に対応付ける教師復号情報を生成する工程。学習用画像の内容を説明する説明文から抽出された単語について、ステップS114にて生成された単語ベクトルのベクトル平均を求め、当該説明文の内容を示す教師復号情報を生成する。
【0052】
上述のように、教師復号情報は、各学習用画像の内容を説明する文章から抽出された単語の意味空間におけるベクトルを平均して生成される。なお、本実施形態に係る想起画像推定装置10に供される候補画像の各々についても、上記S111~S115の工程により、復号情報が生成される。
【0053】
図4の(a)に戻り、次に、多点電位計測部1は、学習用画像を視認する被験者の脳Bにおいて計測される電気的特性を計測する(ステップS12:計測ステップ)。なお、この工程では、被験者は目的画像を想起することなく、単に学習用画像を視認することが望ましい。
【0054】
続いて、計測された電気的特性を入力信号として用い、視認している学習用画像の内容を示す教師復号情報を教師信号として用いて、デコーダ2を学習させる。具体的には、まず、復号情報比較部7が、学習用画像を視認している被験者の脳Bから計測された脳Bの電気的特性から学習前(または学習中)のデコーダ2によって推定された復号情報と、当該学習用画像に対応付けられた教師復号情報とを比較する。次に、重み係数補正部8が、学習用画像を視認している被験者の脳Bから計測された脳Bの電気的特性が入力された場合に、当該学習用画像に対応付けられた教師復号情報を出力するように、デコーダ2の現在の重み係数を補正する。
【0055】
なお、図4の(a)に示すステップS11~S13の各工程は、連続して実施される必要は無く、それぞれ個別に実施され得る。例えば、ステップS11の工程は、ステップS12が実施される前に実施されてもよいし、ステップS12が実施された後に実施されてもよい。また、ステップS12を実施し、計測された電気的特性と、被験者が視認した画像とを対応付けたデータを記憶しておき、デコーダ2の学習に当該データを利用する構成でもよい。
【0056】
<学習用画像の例>
図5に示す画像は、学習用画像の一例である。この画像に対しては、「両親と娘、息子の4人家族がでかけている様子がうつっている。息子は宇宙服を着ていてその様子を父親が撮影している。背景などから宇宙についての展覧会のように感じる。みんなが笑顔で楽しい雰囲気を感じる。」という説明文が作成され得る。
【0057】
なお、ステップS112において、1つの学習用画像(および候補画像)について、複数の説明文が作成されてもよい。例えば、図5に示す学習用画像に対して、「宇宙服を着た人を3人の家族がカメラで撮っている様子である。楽しそうで、宇宙服を着る体験をしているのだと思った。」、「宇宙服を着た子供が写っています。お父さんは写真を撮っています。こんな体験ができると嬉しいでしょうね。」などの説明文も作成され得る。
【0058】
<デコーダ2の作成>
次に、デコーダ2の作成について、図6を用いて説明する。図6は、学習用画像を用いてデコーダ2を生成する手順の一例を説明するイメージ図である。なお、ここでは、被験者の脳Bの電気的特性が、皮質脳波である場合を例に挙げて説明する。
【0059】
まず、学習用画像を視認している被験者の脳Bの皮質脳波が、多点電位計測部1により計測される。
【0060】
次に、計測された皮質脳波を周波数解析し、アルファ波、ベータ波、およびガンマ波の各帯域のパワーをそれぞれ求め、これらをデコーダ2に入力する特徴行列として用いられる。
【0061】
一方、MeCabなどの形態素解析エンジンを用いて、被験者が視認している画像毎の説明文から単語を抽出し、説明文から復号情報を生成する。例えば、図6に示す説明文「雪のある山の頂上の様子。はっきりと青と白の雲のある空と、雪のある地面や水辺のむき出しの山。山には影もできている」の場合、「雪」、「山」、「頂上」、「様子」などの単語が抽出される。
【0062】
そして、抽出された単語の単語ベクトルの各要素(例えば1000次元)について平均した復号情報が教師復号情報として決定される。抽出された各単語についての単語ベクトルは、学習済のWord2vecを用いて、1000次元の単語ベクトルとして生成される。
【0063】
デコーダ2の学習過程では、アルファ波、ベータ波、およびガンマ波の各帯域のパワーを入力信号としたときに、各画像の教師復号情報を所望の精度で出力できるように重み行列が補正される。
【0064】
図6では、ridge-regressionなどの回帰処理を用いて、3600の画像について復号情報を出力するように学習する場合の例を示している。なお、ridge-regressionの代替として、深層学習、およびSparse Logistic Regression(SLR)などの解析方法を適用することも可能である。
【0065】
〔実施形態2〕
本発明の他の実施形態について、以下に説明する。なお、説明の便宜上、上記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を繰り返さない。
【0066】
(想起画像推定装置10aの構成)
被験者に視認させる候補画像を、記憶部6に記憶されている画像の中から決定するのではなく、任意の検索対象の情報群から取得する構成であってもよい。
【0067】
想起画像推定装置10aは、検索対象の情報群から画像を検索することにより、多種多様な画像を候補画像として利用する。まず、想起画像推定装置10aについて、図9を用いて説明する。図9は、本発明の一実施形態に係る想起画像推定装置10aの概略構成例を示す機能ブロック図である。
【0068】
図9に示す想起画像推定装置10aは、画像決定部3の代わりに、画像検索部3a(画像決定部)を備えている。
【0069】
画像検索部3aは、デコーダ2によって推定された復号情報と同じ、あるいは類似の復号情報を用いて検索用クエリを生成する。また、画像検索部3aは、生成した検索用クエリを用いて、検索対象の情報群から、復号情報と同じ、あるいは類似の復号情報に対応付けられている画像を検索する。検索対象の情報群は任意の情報群であってもよく、例えば、図9に示すように、インターネット上に存在するウェブサイトA60aおよびウェブサイトB60bなどが含まれ得る。次に、画像検索部3aは、検索結果として取得された画像を候補画像として決定する。また、画像検索部3aは、検索結果として取得された画像を、候補画像に続けて被検者に視認させる候補画像として決定する。
【0070】
具体的には、デコーダ2は、候補画像を視認している間に計測される電気的特性から、被験者が想起している目的画像の内容を示す復号情報を推定する。デコーダ2は、推定した復号情報(例えば、意味空間におけるベクトル)に近い1または複数の単語を推定することができる。具体的には、デコーダ2は、推定した復号情報の意味空間におけるベクトルと、該復号情報に近い各単語の意味空間におけるベクトルとの間の距離が近い順に、幾つかの単語を選択する。
【0071】
画像検索部3aは、デコーダ2によって推定された単語に中から、動詞や形容詞などについて幾つか選択し、これを用いて公知の画像検索(例えば、Google(登録商標)の画像検索など)に用いる検索用クエリを生成する。画像検索部3aは、生成した検索用クエリを用いて、デコーダ2によって推定された単語に対応付けられた画像を、ウェブ上から検索することができる。画像検索部3aは、検索結果において上位に挙げられている画像を、表示部5に表示する候補画像として決定する。
【0072】
このように構成すれば、closed-loop制御機構を適用した場合おいて被験者に提示する候補画像として、インターネット上に存在するウェブサイトを含む検索対象の情報群の多種多様な画像を利用することができる。
【0073】
closed-loop制御機構を適用することによって、被験者は所望の目的画像を想起しつつ、候補画像を視認するという工程を繰り返すことになる。それゆえ、被検者は、候補画像を視認している間に計測される電気的特性を変えることによって、任意の画像をインターネット上に存在するウェブサイトを含む検索対象の情報群から検索することができる。
【0074】
なお、図9に示す想起画像推定装置10aは、表示部5にて表示する候補画像を記憶している記憶部6を備えていない。しかし、これは一例に過ぎず、想起画像推定装置10aは、図1に示す想起画像推定装置10のように、記憶部6を備える構成であってもよい。
【0075】
この場合、画像検索部3aは、デコーダ2によって推定された復号情報と同じ、あるいは類似の復号情報に対応付けられている画像を、記憶部6およびウェブサイトA60aおよびウェブサイトB60bなどから取得する。
【0076】
〔ソフトウェアによる実現例〕
想起画像推定装置10の制御ブロック(特にデコーダ2、画像決定部3、および表示制御部4)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、ソフトウェアによって実現してもよい。
【0077】
後者の場合、想起画像推定装置10は、各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータを備えている。このコンピュータは、例えば1つ以上のプロセッサを備えていると共に、上記プログラムを記憶したコンピュータ読み取り可能な記録媒体を備えている。そして、上記コンピュータにおいて、上記プロセッサが上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記プロセッサとしては、例えばCPU(Central Processing Unit)を用いることができる。上記記録媒体としては、「一時的でない有形の媒体」、例えば、ROM(Read Only Memory)等の他、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムを展開するRAM(Random Access Memory)などをさらに備えていてもよい。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明の一態様は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
【0078】
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。
【0079】
〔まとめ〕
本発明の態様1に係る想起画像推定装置は、被験者の脳の電気的特性を、視覚連合野を含む脳の領域の複数の計測点において計測する多点電位計測部と、前記被験者が候補画像を視認している間に計測される前記電気的特性から、前記被験者が想起している目的画像の内容を示す復号情報を推定するデコーダと、前記デコーダによって推定された前記復号情報に基づいて、前記被験者に視認させる候補画像を決定する画像決定部と、を備えている。
【0080】
上記の構成によれば、候補画像を視認している被験者の脳の電気的特性から、当該被験者が想起している画像の内容を示す復号情報を推定し、推定された復号情報に基づいて決定された画像を当該被験者に視認させる。これにより、候補画像を被験者に視認させ、復号内容を推定し、推定した復号情報に基づいて次の候補画像を決定する、というclosed-loop制御機構が構成され得る。
【0081】
このようなclosed-loop機構を適用することによって、被験者は所望の目的画像を想起しつつ、候補画像を視認するという工程を繰り返すことになる。それゆえ、被験者自身による脳活動のトップダウン制御が脳の視覚野に入力され、このトップダウン制御が入力したときの脳の電気的特性を計測することができる。よって、被験者が想起している目的画像を精度良く推定することができる。
【0082】
本発明の態様2に係る想起画像推定装置は、上記態様1において、前記画像決定部は、前記デコーダによって推定された前記復号情報と同じ、あるいは類似の前記復号情報に対応付けられた画像を、前記候補画像に続けて視認させる候補画像として決定してもよい。
【0083】
また、本発明の態様3に係る想起画像推定装置は、前記画像決定部は、前記デコーダによって推定された前記復号情報と同じ、あるいは類似の前記復号情報を用いて検索用クエリを生成し、生成した前記検索用クエリを用いて、検索対象の情報群から、前記復号情報と同じ、あるいは類似の前記復号情報に関連付けられている画像を検索し、検索結果として取得された画像を、前記候補画像として決定してもよい。
【0084】
また、本発明の態様4に係る想起画像推定装置は、上記態様3において、前記画像決定部は、前記検索結果として取得された画像を、前記候補画像に続けて視認させる候補画像として決定してもよい。
【0085】
検索対象の情報群から画像を検索することにより、多種多様な画像を候補画像として利用することができる。なお、検索対象の情報群は、インターネット上のウェブサイトなどを含んでいてもよい。
【0086】
本発明の態様5に係る想起画像推定装置は、上記態様1から4のいずれかにおいて、所定の候補画像の内容を説明する1以上の説明文に含まれる1以上の単語に対応する単語ベクトルを用いて予め生成された教師復号情報と、当該所定の候補画像とが対応付けられており、前記デコーダは、所定の候補画像を視認している間に計測される脳の電気的特性が入力された場合に、当該所定の候補画像に対応付けられた前記教師復号情報を出力するように学習される構成であってもよい。
【0087】
このように、デコーダを学習によって生成することにより、目的画像を想起している被験者の脳の電気的特性から、目的画像の内容を示す復号情報を高い精度で推定することができるデコーダを生成することができる。
【0088】
本発明の態様6に係る想起画像推定装置は、上記態様1から5のいずれかにおいて、前記デコーダは、前記候補画像を視認している間に計測される、脳の皮質電位、および脳の電気的な活動によって生じる磁場の少なくとも何れかを用いて、当該候補画像の内容を示す復号情報を推定してもよい。
【0089】
また、本発明の一態様に係る想起画像推定方法は、上記の課題を解決するために、被験者が候補画像を視認している間に、視覚連合野を含む脳の領域の複数の計測点において計測される脳の電気的特性から、前記被験者が想起している目的画像の内容を示す復号情報を推定する推定ステップと、前記推定ステップにおいて推定した前記復号情報に基づいて、前記被験者に視認させる候補画像を決定する画像決定ステップと、を含んでいる。
【0090】
また、上記態様1から6のいずれかに記載の想起画像推定装置としてコンピュータを機能させるための制御プログラムであって、前記デコーダ、および前記画像決定部としてコンピュータを機能させるための制御プログラム、および当該制御プログラムを記録したコンピュータ読み取り可能な記録媒体も本発明の技術的範囲に含まれる。
【実施例1】
【0091】
本発明の一実施例について、以下に説明する。
【0092】
<推定精度の検証>
多種類の意味内容を含む60分の動画を被験者に視認させながら、多点電位計測部1によって被験者の脳Bの皮質脳波を計測した。被験者に視認させる動画は、映画の紹介ビデオなどを短く区切って編集した動画を繋ぎ合わせて準備した。60分間の動画において、同じ動画を含むさまざまな動画が何回か順不同で出現する。被験者は、視点を固定することなく、その動画を視認するように指示された。
【0093】
被験者に視認させた動画を、1秒毎の静止画像(シーン)に変換した。各シーンについて、複数人により、シーンの内容を説明する説明文が作成された。また、同じ1秒間に計測された皮質脳波について、アルファ波、ベータ波、およびガンマ波の各帯域のパワーを解析した。
【0094】
MeCabを用いて、シーン毎の説明文から単語が抽出された。抽出された各単語について、ウィキペディアを用いて学習済のWord2vecを用いて、1000次元の単語ベクトルが生成された。各シーンは、説明文から抽出された単語についての単語ベクトルの平均として生成された復号情報と対応付けられた。
【0095】
皮質脳波のパワーを入力信号として用い、各シーンの復号情報を教師信号とする機械学習を行い、デコーダ2を作成した。
【0096】
本実施例では、ridge-regressionを用いて、3600のシーンについて、統計的に有意な精度で、画像の内容を示す復号情報を推定することができた。
【0097】
このことを、図7を用いて説明する。図7の黒実線は、シーンを視認している被験者の脳Bの皮質脳波から推定した復号情報と、当該シーンに対応付けられている復号情報(すなわち、正解)との相関係数の度数分布を示している。一方、図7の灰色の線は、各シーンに対応付けられている復号情報のラベルをシャッフルしたものと、シーンを視認している被験者の脳Bの皮質脳波から推定した復号情報との相関係数の度数分布を示している。図7によれば、シーンを視認している被験者の脳Bの皮質脳波から、当該シーンに対応付けられている復号情報を有意に高い精度で推定できていることが実証された。
【0098】
<想起画像推定の実証>
次に、作成したデコーダ2を適用した想起画像推定装置10にて、被験者が想起した目的画像を推定することが可能であるか否かを検証した。
【0099】
図8において、時刻0は想起するイメージ(「文字」、「風景」等)を被験者に指示したタイミングを示している。図8の黒線は、被験者に対して指示した内容を含む画像に対応付けられた復号情報と、被験者の脳Bの皮質脳波から推定した復号情報とについて、正規化した相関係数のトライアル平均を示している(*p<0.05、Student’s t-test)。一方、図8のグレーの線は、想起するイメージが含まれない画像に対応付けられた復号情報と、被験者の脳Bの皮質脳波から推定した復号情報と正規化した相関係数のトライアル平均を示している。図8によれば、被験者が想起している画像を有意に高い精度で推定可能であることが実証された。
【符号の説明】
【0100】
1 多点電位計測部
2 デコーダ
3 画像決定部
3a 画像検索部(画像決定部)
4 表示制御部
5 表示部
6 記憶部
10、10a 想起画像推定装置
60a ウェブサイトA
60b ウェブサイトB
S1 デコーダ生成ステップ
S2 候補画像表示ステップ
S3 推定ステップ
S4 画像決定ステップ
S11 学習用画像準備ステップ
S13 学習ステップ
図1
図2
図3
図4
図5
図6
図7
図8
図9