IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社リコーの特許一覧

<>
  • 特許-情報解析装置および情報解析方法 図1
  • 特許-情報解析装置および情報解析方法 図2
  • 特許-情報解析装置および情報解析方法 図3
  • 特許-情報解析装置および情報解析方法 図4
  • 特許-情報解析装置および情報解析方法 図5
  • 特許-情報解析装置および情報解析方法 図6
  • 特許-情報解析装置および情報解析方法 図7
  • 特許-情報解析装置および情報解析方法 図8
  • 特許-情報解析装置および情報解析方法 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-29
(45)【発行日】2024-08-06
(54)【発明の名称】情報解析装置および情報解析方法
(51)【国際特許分類】
   A61B 5/00 20060101AFI20240730BHJP
   A61B 5/377 20210101ALI20240730BHJP
   A61B 5/245 20210101ALI20240730BHJP
   A61B 10/00 20060101ALI20240730BHJP
【FI】
A61B5/00 G
A61B5/377
A61B5/245
A61B10/00 E
【請求項の数】 14
(21)【出願番号】P 2020051649
(22)【出願日】2020-03-23
(65)【公開番号】P2021146102
(43)【公開日】2021-09-27
【審査請求日】2023-01-16
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成31年度国立研究開発法人科学技術振興機構センター・オブ・イノベーションプログラム『人間力活性化によるスーパー日本人の育成拠点』委託研究開発、産業技術力強化法第17条の適用を受ける特許出願
(73)【特許権者】
【識別番号】000006747
【氏名又は名称】株式会社リコー
(74)【代理人】
【識別番号】100089118
【弁理士】
【氏名又は名称】酒井 宏明
(72)【発明者】
【氏名】三坂 好央
(72)【発明者】
【氏名】森瀬 博史
(72)【発明者】
【氏名】工藤 究
【審査官】▲高▼原 悠佑
(56)【参考文献】
【文献】特開平11-056803(JP,A)
【文献】特開平09-098955(JP,A)
【文献】特開2017-148404(JP,A)
【文献】特表2015-534856(JP,A)
【文献】国際公開第2014/052938(WO,A1)
【文献】国際公開第2019/013324(WO,A1)
【文献】Meaza Demissie et. al.,Unequal group variances in microarray data analyses,BIOINFORMATICS,2008年03月14日,Vol. 24, No. 9,pp.1168-1174
(58)【調査した分野】(Int.Cl.,DB名)
A61B 5/00-5/0538
A61B 5/06-5/398
(57)【特許請求の範囲】
【請求項1】
少なくとも3以上のN個の取得条件(k)で取得されたデータ群から、前記取得条件(k)に規定される条件・属性とは異なる条件・属性で規定される単一の被検体、または複数の被検体からなる集団を抽出し、前記データ群における生体に関する特徴量を算出する特徴量算出部と、前記特徴量を出力する出力部とを有
前記特徴量は前記取得条件(k)における取得数(n)と平均値(<X>)と不偏分散(S )と前記特徴量に対する寄与度(wk(但し、寄与度(w k )のうち、少なくとも3つは0ではない)を用いて次の式(1)により表される情報解析装置。
【数1】
【請求項2】
前記N個の取得条件のうち少なくとも2つは、前記被検体へ提示する刺激の種別が互いに異なる、
ことを特徴とする請求項1に記載の情報解析装置。
【請求項3】
前記N個の取得条件のうち少なくとも2つは、前記被検体へ提示する刺激の強度が互いに異なる、
ことを特徴とする請求項1に記載の情報解析装置。
【請求項4】
前記寄与度は、少なくとも1つが正であり、少なくとも1つが負である、
ことを特徴とする請求項1乃至3のいずれか一項に記載の情報解析装置。
【請求項5】
前記N個の取得条件は、少なくとも2つが共通の要因を有しており、当該共通の要因を有する条件の組が少なくとも2組ある、
ことを特徴とする請求項1乃至4のいずれか一項に記載の情報解析装置。
【請求項6】
前記共通の要因は、前記被検体に対する視覚刺激、聴覚刺激、体性感覚刺激のいずれかである、
ことを特徴とする請求項5に記載の情報解析装置。
【請求項7】
前記共通の要因は、前記被検体が罹患している疾患の種類である、
ことを特徴とする請求項5に記載の情報解析装置。
【請求項8】
前記共通の要因は、前記被検体が有する遺伝子型の種類である、
ことを特徴とする請求項5に記載の情報解析装置。
【請求項9】
前記特徴量算出部は、前記データ群のそれぞれにおける繰り返し計測数を用いて前記特徴量を算出するものであって、
前記繰り返し計測数は、少なくとも30回よりも多く、繰り返し前記被検体の生体活動を計測した数である、
ことを特徴とする請求項1乃至8のいずれか一項に記載の情報解析装置。
【請求項10】
前記データ群に含まれるデータは、所定の時間内の複数の時刻の統計量である、
ことを特徴とする請求項1乃至9のいずれか一項に記載の情報解析装置。
【請求項11】
前記データ群に含まれるデータは、複数のセンサの計測値の統計量である、
ことを特徴とする請求項1乃至9のいずれか一項に記載の情報解析装置。
【請求項12】
前記出力部は、前記特徴量を表示装置に表示出力する、
ことを特徴とする請求項1乃至11のいずれか一項に記載の情報解析装置。
【請求項13】
前記被検体の生体活動は、当該被検体の脳の活動によって生じる磁場である、
ことを特徴とする請求項1乃至12のいずれか一項に記載の情報解析装置。
【請求項14】
コンピュータが実行する情報解析方法であって、
少なくとも3以上のN個の取得条件(k)で取得されたデータ群から、前記取得条件(k)に規定される条件・属性とは異なる条件・属性で規定される単一の被検体、または複数の被検体からなる集団を抽出し、前記データ群における生体に関する特徴量を算出し、前記特徴量を出力する処理を含み、
前記特徴量は前記取得条件(k)における取得数(n)と平均値(<X>)と不偏分散(S )と前記特徴量に対する寄与度(wk(但し、寄与度(w k )のうち、少なくとも3つは0ではない)を用いて次の式(3)により表される情報解析方法。
【数3】
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報解析装置および情報解析方法に関する。
【背景技術】
【0002】
被検体の生体情報を解析し、被検体や被検体の属する集団の生体に関する特徴量を抽出する装置として、脳磁計(MEG:Magnetoenephalography)、EEG(Electroencephalography)、fMRI(functional Magnetic Resonance Imaging)、PET(Positron Emission Tomography)、NIRS (Near-Infrared Spectroscopy)、OPM(Optically Pumped atomic Magnetometer)などの生体機能計測装置により計測されたデータを使う情報解析装置が知られている。
【0003】
これらの情報解析装置では、例えば音声や映像の刺激を被検体に提示し、感覚野等で誘発される脳神経活動やその2次活動を計測することで、ヒトの脳機能を調べることが可能である。
【0004】
ただし、脳神経活動は一般に微弱な信号であることが多く、計測されたデータには意図する脳神経活動に由来する信号以外にも、刺激装置等の電気機器や被検体の心拍や筋電等に由来する信号が重畳され、これらは目的とする脳神経活動の特徴を抽出する上でノイズとなる。そこで、例えば、周波数応答フィルタなどの手法により脳活動由来の信号とノイズを分離する手法が既に知られている。
【0005】
脳神経活動に伴って発生する磁場は微弱であり、MEGには脳神経活動以外にも刺激装置等の電気機器や被検体の心拍や筋電等に由来するノイズも含まれてしまう。そこで、周波数応答フィルタなどの手法により脳活動由来の信号とノイズを分離する手法が既に知られている。
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、上記の従来技術における脳活動由来の信号とノイズを分離する手法では、センサ自身のもつランダムノイズなど、生体信号と周波数帯の被るノイズを十分に除去することは難しかった。
【0007】
このように、ノイズが十分に除去できていないことは、特に複数の条件で取得された生体反応データから被検体や集団の特徴量を抽出する場合に問題となる。例えば、被検体に
視覚刺激を提示するという条件Aの下で複数回にわたり取得された脳活動データ群Aと、聴覚刺激を提示するという条件Bの下で複数回にわたり取得された脳活動データ群Bと、視覚刺激と聴覚刺激を同時に被検体に提示するという条件Cの下で複数回取得されたデータ群Cから、視覚と聴覚の感覚統合に関する脳活動を抽出する場合、データ群Aの平均値とデータ群Bの平均値の単純和と群Cの平均値とを比較すると、ノイズによる共通の要因部分だけ感覚統合活動を過小評価してしまう場合がある。したがって、ノイズが十分に除去できていない状況では、例えば種々の刺激による生体活動の比較を基にした特徴量(例えばバイオマーカー)の検出精度が劣化するという問題がある。
【0008】
本発明は、上記に鑑みてなされたものであって、情報の比較による特徴量の検出精度を高めることを目的とする。
【課題を解決するための手段】
【0009】
上述した課題を解決し、目的を達成するために、本発明は、少なくとも3以上のN個の取得条件で取得されたデータ群から、前記取得条件(k)に規定される条件・属性とは異なる条件・属性で規定される単一の被検体、または複数の被検体からなる集団を抽出し、前記データ群における生体に関する特徴量を算出する特徴量算出部と、前記特徴量を出力する出力部とを有、前記特徴量は前記取得条件kにおける取得数(n)と平均値(<X>)と不偏分散(S )と前記特徴量に対する寄与度(wk(但し、寄与度(w k )のうち、少なくとも3つは0ではない)を用いて次の式(1)により表されることを特徴とする。
【発明の効果】
【0010】
本発明によれば、情報の比較による特徴量の検出精度が高まるという効果を奏する。
【図面の簡単な説明】
【0011】
図1図1は、実施形態にかかる情報解析装置の機能構成例を示すブロック図である。
図2図2は、実施形態にかかる情報解析装置の動作例を示すフローチャートである。
図3図3は、特徴量算出の具体例を説明する説明図である。
図4図4は、比較例を説明する説明図である。
図5図5は、特徴量算出の具体例を説明する説明図である。
図6図6は、特徴量算出の具体例を説明する説明図である。
図7図7は、特徴量算出の具体例を説明する説明図である。
図8図8は、表示例を説明する説明図である。
図9図9は、表示例を説明する説明図である。
【発明を実施するための形態】
【0012】
以下に添付図面を参照して、情報解析装置および情報解析方法の実施形態を詳細に説明する。
【0013】
図1は、実施形態にかかる情報解析装置1の機能構成例を示すブロック図である。図1に示すように、情報解析装置1は、刺激装置3より各種の刺激が提示された被検体2の生体情報を繰り返し生体情報計測装置4で計測し、繰り返し計測した生体情報(データ群)の解析を行う装置である。
【0014】
例えば、情報解析装置1は、音声や映像の刺激を被検体2に提示し、感覚野等で誘発される脳神経活動による生体磁場を繰り返し計測して解析する脳磁計(MEG)などのデータを適用できる。
【0015】
刺激装置3は、被検体2に対して所定の強度で各種の刺激を提示する。刺激装置3が被検体2に対して与える刺激の種別については、視覚、聴覚、味覚、嗅覚、体性感覚(触覚・痛覚など)に対するものや、運動、言語、記憶、注意、遂行、社会性、情動などの脳活動を誘発する電気刺激、磁気刺激、超音波刺激等の物理的刺激や、トレーニング、リハビリテーション、投薬などがある。被検体2に対して刺激装置3が提示した刺激の内容(種別および強度など)については、刺激に関する入力情報として情報解析装置1に入力される。
【0016】
生体情報計測装置4は、被検体2の脈拍、血圧、呼吸数、神経電気的な活動によって生じる電位や磁場などの情報を繰り返し計測する。なお、繰り返し計測した生体情報は、所定の時間内の複数の時刻の統計量(平均値、最大値、最小値、中央値、分散など)であってもよい。生体情報計測装置4は、連続的あるいは断続的に繰り返し計測した生体情報を計測時の条件(計測時刻、被検体2の属性、刺激に関する入力情報など)とともに情報解析装置1に入力する。
【0017】
被検体2の属性については、例えば被検体2を識別する識別情報(ID)、性別、身長などの被検体2の身体的な特徴の他、疾患の有無および疾患タイプ、遺伝子タイプなど種々のものがある。これら被検体2の属性については、例えば生体情報計測装置4での計測時に予め入力されたものであってもよいし、メモリなどから読み出されたものであってよい。
【0018】
本実施形態では、情報解析装置1には生体情報計測装置4が繰り返し計測した磁場データを入力する。なお、情報解析装置1が解析する生体情報(繰り返し計測したデータ群)などについては磁場に限定されない。例えば、生体機能計測装置として一般的なEEG、fMRI、 PET、NIRS、OPMなどで計測されたデータを使用することができる。
【0019】
あるいは、生体情報解析装置1は、各種の刺激を被検体2に提示した際に繰り返し計測した、被検体2の脈拍、血圧、呼吸数、脳血流、眼球運動、体動などを解析してもよい。
【0020】
情報解析装置1は、入力部10、データ記憶部11、特徴量算出部12および出力部13を有する。具体的には、情報解析装置1は、プログラムをCPU(Central Processing Unit)などのプロセッサが読み出して実行することで(詳細は後述する)、入力部10、データ記憶部11、特徴量算出部12および出力部13として機能する。
【0021】
入力部10は、各種データの入力を受け付ける処理部である。具体的には、入力部10は、生体情報計測装置4が繰り返し計測した生体情報と、計測時の条件(計測時刻、被検体2の属性、刺激に関する入力情報)とを受け付ける。
【0022】
また、入力部10は、特徴量の算出に関する算出条件や、算出結果の出力条件などの諸設定をユーザ入力などにより受け付ける。算出条件としては、例えば、比較するデータ群の指定、算出に関与するパラメータ(寄与度など)などの設定などがある。また、出力条件としては、例えば、表示するグラフの指定などがある。
【0023】
データ記憶部11は、入力部10が入力を受け付けた各種データを記憶するデータベースなどである。具体的には、データ記憶部11は、生体情報計測装置4が繰り返し計測した生体情報(データ群)と、計測時の条件(計測時刻、被検体2の属性、刺激に関する入力情報)とを対応付けて記憶する。このようにデータの対応付けが行われているため、データ記憶部11に記憶された生体情報(データ群)について、被検体2の属性ごとの比較、刺激ごとの比較を行うことができる。
【0024】
特徴量算出部12は、生体情報計測装置4が繰り返し計測した被検体2の生体情報(データ群)を比較して特徴量を算出する処理部である(詳細は後述する)。出力部13は、特徴量算出部12が算出した特徴量を、設定された出力条件にしたがって表示装置5へ表示出力する処理部である。
【0025】
ここで、情報解析装置1の動作とともに、特徴量を算出する処理の詳細を説明する。図2は、実施形態にかかる情報解析装置1の動作例を示すフローチャートである。
【0026】
図2に示すように、処理が開始されると、例えば、入力部10は、生体情報計測装置4により複数の条件(例えば刺激の種別)ごとに繰り返し計測された生体情報(生体信号のデータ群)に対し、前処理を行う。なお、この前処理は、生体情報計測装置4側で実施してもよい。
【0027】
具体的には、生体情報計測装置4により複数の条件(例えば刺激の種別)ごとに繰り返し計測された生体情報(生体信号のデータ群)について、周波数応答フィルタ等(バンドパスフィルタ、ローパスフィルタ、ハイパスフィルタ、ノッチフィルタ等)により、明らかに生体信号とは周波数帯の異なるノイズを取り除く。また、生体情報のうち脳活動に関する情報に絞るため、主成分分析(PCA:principal component analysis)や独立成分分析(ICA:Independent Component Analysis)を用いて、生体信号に含まれる心拍、筋電、まばたきなどの脳活動以外の情報を除外されたデータに対して適用することができる。
【0028】
ついで、入力部10は、第1から第Nまでの条件(但しN≧3)で繰り返し計測された前処理後のデータ(生体信号のデータ群)の入力を受け付けて(S2)、入力されたデータを条件とともにデータ記憶部11へ格納する。条件については、例えば刺激の種別ごと、被検体2の属性ごとなど、様々なものがある。
【0029】
ついで、特徴量算出部12は、第1から第Nまでの条件で繰り返し計測されたデータ(生体信号のデータ群)をデータ記憶部11より読み出し、データ群同士を比較することで、特徴量(例えばバイオマーカー)の算出を行う(S3~S5)。
【0030】
具体的には、特徴量算出部12は、データ群それぞれにおける特徴量に対する寄与度(w)の設定を行う(S3)。この寄与度(w)の設定は、ユーザが任意で設定してもよいし、予めメモリ等に保存されている既定の寄与度のセットを用いてもよい。
【0031】
この寄与度は、少なくとも一つが正であり、少なくとも一つ負であることが望ましい。例えば、w>0、w>0、w<0のとき、データ群Cに含まれるデータ群Aまたは群Bと共通の影響を取り除くことができ、特徴量計算の精度向上の効果を奏する。
【0032】
例えば、条件a、b、cのそれぞれで得られたデータ群A、B、Cとする。ただし、条件cは条件aおよび条件bの双方と共通要因を有する。
【0033】
=-wは、共通の要因をもつ条件同士で、寄与度が異符号・大きさ同じであることを示している。よって、条件aと条件bの寄与度についての式について:w=-1、w=1と、条件bと条件cの寄与度についての式について:w=-1、w=1との、2式が得られる。
【0034】
また、特徴量(t)の分子については次のとおりである。
t=(w・X+w・X+w・X
=(X-(X+X))
【0035】
分子の部分は、XとXの大きさを1倍して、Xの大きさの1倍との差をとっている。したがって、得られる特徴量では、単純なa+bの線形和とは異なる特徴量、すなわち非線形効果を抽出している。
【0036】
さらに寄与度は、次の式(1)を満たすことが望ましい。
【0037】
【数1】
【0038】
次に、典型例をもとに、寄与度が満たすべき条件について説明する。条件a、a、…、aのそれぞれの寄与率をW、W、…、Wとする。ただし、条件a…、aN-1は、互いに明示的な共通要因を含まず、かつ、条件aは条件a…、aN-1のそれぞれと互いに共通要因を含むものとする。この場合、条件a、…aN-1の寄与度は符号と大きさが等しく、かつ、条件aの寄与度のみ大きさは同じで符号が異なる、つまり、W=W=…=WN-1=-Wを満たすように取ることにより、特徴量tは条件a、…aN-1に固有に含まれる要因を取り除く効果を有するが、条件a、…aN-1に共通に含まれる要因(ノイズ要因)については過剰にカウントしてしまうことになる。このような本実施形態の典型例において、式(1)の左辺は(N-2)/Nと表され、N≧3で1/3以上となる。したがって、式(1)を満たすことは本発明の方法を用いて特徴量の精度を高める効果を有するため望ましい。
【0039】
ついで、特徴量算出部12は、データ群A、B、Cのそれぞれにおいて、繰り返し計測数に対する平均値および不偏分散を算出する(S4)。
【0040】
一般に、繰り返し計測数がn≧30であれば、データの分布が正規分布に従うと近似できるとみなせる。したがって、正規分布に近いほど平均値の差の検出力が高くなるため、繰り返し計測数は多いほど望ましい。
【0041】
ついで、特徴量算出部12は、データ群A、B、Cのそれぞれにおける繰り返し計測数と、その繰り返し計測数に対する平均値および不偏分散とを用いて特徴量を算出する(S5)。ついで、出力部13は、特徴量算出部12が算出した特徴量を表示装置5へ表示出力する(S6)。
【0042】
具体的には、特徴量算出部12は、第Nのデータ群の繰り返し計測数をn、第Nのデータ群の平均値を<X>、第Nのデータ群の不偏分散をS 、第Nのデータ群の特徴量に対する寄与度をWとして、次の式(2)に代入して特徴量(t)を算出する。なお、nが十分に大きい場合は、不偏分散と標本分散はほぼ等しい値をとるため、不偏分散の代わりに標本分散を用いてもよい。
【0043】
【数2】
【0044】
ここで、上記の特徴量の算出式(2)の理論的背景について補足する。1つの母集団A(データ群A)と、2つの母集団(データ群B、C)の和(B+C)との間での統計検定量(特徴量)tを導出する。母集団分布が正規分布N(μ,σ )、N(μ,σ )、N(μ,σ )に従う母集団から、それぞれn個、n個、n個の標本を取り出すとき、各母集団から取り出した標本の標本平均<X>、<X>、<X>は、<X>~N(μ,σ )、<X>~N(μ,σ )、<X>~N(μ,σ )に従う。
【0045】
ここで、標本Bと、標本Cからそれぞれ1つのデータを取り出し、それらの和が従う分布を考える。確率変数<X>と、<X>とが互いに独立のとき、正規分布の加法性により、標本平均の和(<X>+<XC>)は次の式(3)の分布に従う。
【0046】
【数3】
【0047】
同様にして、確率変数<X>と、確率変数(<X>+<X>)が互いに独立のとき、それらの差は次の式(4)の分布に従う。
【0048】
【数4】
【0049】
一般に、X~N(μ,σ)においては、Z=(X-μ)/σ~N(0,1)と標準化することができる。よって、上記の式を標準化すると次の式(5)が得られる。
【0050】
【数5】
【0051】
ここで、σ 、σ 、σ は母集団の分散であり、未知である。そのため、標本から計算可能な標本の分散を用いて代用する。一般に、母集団の分散σは、標本の不偏分散Sとサンプル数nを用いて、σ=S/nで推定される。よって、前述の式(5)に代入すると、次の式(6)が得られる。
【0052】
【数6】
【0053】
帰無仮説は母集団Aと母集団(B+C)の平均値に差が無いとの仮定であるから、μ=(μ+μ)であり、次の式(7)の特徴量(t)を得る。
【0054】
【数7】
【0055】
ここではA、B、Cの3つのデータ群について説明したが、データ群がNまである場合でも、同様の方法で拡張可能である。
【0056】
図3は、特徴量算出の具体例を説明する説明図である。図3に示すように、第1の条件で計測された第1のデータ群A、第2の条件で計測された第2のデータ群A、第3の条件で計測された第3のデータ群Aについて、時刻iにおける特徴量(t)を算出するものとする。
【0057】
なお、説明の簡略化のため、データ群Aとデータ群Bと、データ群Aおよびデータ群Bの双方と共通の要因を備えるデータ群Cを用いている。したがって、特徴量の算出式は次の式(8)のとおりである。
【0058】
【数8】
【0059】
まず、特徴量算出部12は、時刻iの寄与度wCi=1、wAi=wBi=-1と設定する。ついで、特徴量算出部12は、時刻iにおける繰り返し計測データの平均値および不偏分散を計測条件毎に算出する。ついで、特徴量算出部12は、計測条件毎の繰り返し計測数と、その繰り返し計測数に対する平均値および不偏分散とを上記の式(8)に代入して特徴量を算出する。
【0060】
ここではデータ群A、データ群B、データ群Cのすべての条件で時刻iにおける特徴量を算出する例を説明したが、それぞれ時刻i、j、k(i≠j≠k)の場合にも同様の手続きで特徴量を算出可能である。
【0061】
図4は、比較例を説明する説明図であり、より具体的には、従来手法によるケースC1と、本実施形態によるケースC2との比較例を示している。
【0062】
図4に示すように、従来手法によるケースC1では、群Aの計測値と群Bの計測値の単純和と群Cの平均値とを比較すると、ノイズによる共通の要因部分(過小評価量)だけ過小評価してしまう。
【0063】
一般に、繰り返し計測を行うことでノイズの平均値は確率的に定数に収束していく。ここでノイズの平均値をゼロとなるように補正することで、計測値の平均値と生体信号の平均値が等しくなり、生体信号の平均値はノイズによって増減しなくなる。本実施形態では、特徴量算出部12は、上記の式(2)を用い、複数の条件によって計測された生体信号において、それぞれの平均値を比較して特徴量を算出している。したがって、情報解析装置1では、ケースC2のように、少なくとも3つ以上の計測条件によって得られた生体信号における特徴量の抽出に際して、従来のノイズ除去によって除去しきれないノイズの影響を低減し、その生体信号を基にしたバイオマーカーの精度を高めることができる。
【0064】
また、異なる条件で計測されたそれぞれの計測値に含まれるノイズの大きさは、条件間で常に一定値とは限らない。本本実施形態では、繰り返し計測した計測値に含まれるノイズの分散が条件間で異なる場合においても、特徴量の算出式の分母の項で規格化しているため、ノイズの大きさの影響なく、他の条件との比較ができるようになる。
【0065】
例えば、異なるノイズの分散をもつ異なる時刻同士の生体反応を比較する際や、異なるノイズの分散をもつ複数の被検体2同士の生体反応を比較する際に、それぞれのノイズの大きさの違いを気にすることなく比較可能となる。
【0066】
また、一般に、計測数を100回ずつ実施したとしても、実際には被検体2の体動によるアーチファクト等の理由で、解析には使えないデータもある。解析に使えるデータが条件aでn=78回、条件でn=65回、条件cでn=82回というような場合も往々にしてあり得る。
【0067】
ここで、条件cは、条件cおよび条件bの双方と共通の要因を有するとの設定である。このとき、条件aと条件bでは回数が異なるため、従来の条件a+条件bの単純和を計算する際に、条件aまたは条件bのいずれか少ない方の回数に制限される。しかも、それによって得られる条件a+条件bの回数は、条件cの回数とも異なるため、さらに回数が制限される。多く計測できた条件のデータは無駄になってしまう。ここでは3つの条件で計測する例で説明したが、条件の数が多くなるにつれてこの問題の影響は大きくなっていく。なお、条件それぞれについては、少なくとも2つが共通の要因を有しており、共通の要因を有する条件の組が少なくとも2組あることが望ましい。
【0068】
また、条件aの何回目のデータを条件bの何回目のデータと足し合わせるのか、そのペアの作り方によっても計算の結果が変わってしまうのも問題である。通常、条件aと条件bのそれぞれの計測は、一連の計測で繰り返しランダムな順番で複数回行われる。そのため例えば条件aの1回目の計測データと条件bの1回目の計測データをペアにして足し合わせるにしても、互いに1回目同士のデータを足し合わせる合理的な理由はない。条件aの1回目と条件bの3回目のデータを足し合わせてもよいことになってしまう。さらにペアの作り方は条件aと条件bのデータ数から任意に2つを選ぶ組み合わせの数だけあるため、ペアの選び方に任意性があり、それによって特徴量の算出結果が変わってしまう。しがたって、それを基にしたバイオマーカーの精度低下を招く。
【0069】
一方で、本実施形態では、条件a、b、cのそれぞれの繰り返し計測回数が異なる場合にも、そのような問題の影響なく、高精度に特徴量を一意に計算することができる。なぜなら、特徴量の算出式(2)の理論的背景の補足で説明したとおり、条件a、b、cのそれぞれの従うデータの分布を考え、それぞれの条件のデータを平均値と分散で代表させ、それらの和差を考えるため、ペアの取り方というプロセスを経ず、どの条件同士をペアにするかの問題が生じず、また、ペアの取り方によって特徴量の算出結果が変わってしまうという問題も生じない。
【0070】
さらに、従来は条件a、b、cで、解析に使えるデータ数が最も少ない条件の回数に制限されていたが、本実施形態ではペアを取るプロセスがないため、特徴量の算出にすべてのデータが使え、無駄にならない。条件数が多くなっていくにつれてこの効果は増大していく。本実施形態は、実際の計測であり得る計測回数が条件間で異なる場合においても、条件間のペアの取り方の任意性がなく、特徴量の算出結果が一意であることと、最も少ない条件の回数に合わせる必要がなく、すべてのデータを使えることから、それを基にしたバイオマーカーの精度を高めることができる。
【0071】
また、本実施形態では、少ないサンプル数(計測数や被検体2数)でも、無限回繰り返し計測して得られるであろう平均値や分散を推定することが可能である。
【0072】
一般に、各条件で繰り返し計測回数には限りがあり、無限に計測回数を稼ぐことはできない。繰り返し計測によって得られたデータは、無限回計測を行って得られたデータとのずれを有している。
【0073】
式(2)における分母のS /nの項は、限られた計測データから得られる情報(不偏分散S )から、サンプル数(計測回数や被検体数)に応じた補正をかけていると見ることができる。nが無限大のとき、S /nが0となる。これらの分散がゼロということは、実際のデータから得られた平均値と、無限回計測して得られたデータの平均値の差がゼロであることを示している。裏を返せば、nが有限である場合に、実際のデータから得られた平均値と、無限回計測して得られたデータの平均値の差のずれの程度、すなわちデータの信頼度の情報を反映している。
【0074】
つまり、本実施形態の特徴量(t)は、少ない繰り返し回数しか稼げない場合にも有効に働く。少なくとも30回よりも多ければ、繰り返し計測によって得られたデータは、無限回計測を行って得られたデータとのずれを無視できる程度になる。
【0075】
このような効果を有することで、実際の医療の現場などで、計測できる回数や被検体数が限られている場合にも、少ないサンプル数のデータから、無限回計測して得られるデータに近しい推定量を得ることができる。また、ある病気についての生体反応を調べる場合、往々にしてその病気に罹患している患者を集めてくることは難しく、ある程度少数の被検体しか確保できないことが多い。それらの被検体2のデータから得られた結果が、その病気に罹患している別の被検体集団についても同様の性質があるとまでは言えない。
【0076】
そこで、本実施形態の情報解析装置1を用いて、ある病気を罹患した被検体集団からランダムにサンプリングされた被検体集団のデータを用いて特徴量を算出すると、被検体集団のデータの平均値と分散から、ある病気を罹患した被検体集団全体のデータとの差がどの程度あるのかの情報も得られる。このように、本実施形態では、限られた被検体数のデータから得られた結果が、その病気に罹患している別の被検体集団についてもどの程度の同様の性質があるか、拡張して言及できる可能性があるという点でも優れている。
【0077】
また、先に挙げたとおり、得られた特徴量(t)は平均値の差の程度を示す量となっているため、特徴量の大小がデータの信頼度の程度を反映している。すなわち、特徴量(t)をp値に変換するなどの操作で、計算により得られた特徴量の信頼度についても言及することが可能となる。すなわち、その特徴量を基にしたバイオマーカーの信頼度も計算可能となる。こうすることで、例えば医療分野等で何らかの診断をする際に、その診断の信頼度についての情報も得られる。
【0078】
図5は、特徴量算出の具体例を説明する説明図である。図5に示すように、データ群Aは視覚刺激による被検体2の生体反応のデータ群、データ群Bは聴覚刺激による被検体2の生体反応のデータ群、データ群Cは視覚刺激および聴覚刺激の同時実施による被検体2の生体反応のデータ群とする。すなわち、データ群Cはデータ群Aの視覚反応とデータ群Bの聴覚反応の双方と共通の要因を備えている。そして、これらのデータ群について、時刻iにおける特徴量(t)を算出するものとする。
【0079】
まず、特徴量算出部12は、寄与度w=1、w=w=-1、それ以外をw=0と設定する。ついで、特徴量算出部12は、時刻iにおける繰り返し計測データの平均値および不偏分散を計測条件毎に算出する。ついで、特徴量算出部12は、計測条件毎の繰り返し計測数と、その繰り返し計測数に対する平均値および不偏分散とを上記の式(2)に代入して特徴量を算出する。
【0080】
これにより、情報解析装置1は、視覚および聴覚を同時に刺激することに関連する生体反応(視覚情報と聴覚情報の感覚統合)の特徴量を過小評価することなく抽出可能である。ここでは、視覚と聴覚と視聴覚統合の例を挙げたが、これに限定されるものではなく、
与える刺激の種別については、視覚、聴覚、味覚、嗅覚、体性感覚(触覚・痛覚など)に対するものや、運動、言語、記憶、注意、遂行、社会性、情動などの脳活動を誘発する電気刺激、磁気刺激、超音波刺激等の物理的刺激や、トレーニング、リハビリテーション、投薬などであってもよい。
【0081】
図6は、特徴量算出の具体例を説明する説明図である。図6に示すように、データ群Aは疾患(a)に罹患している被検体2の生体反応のデータ群、データ群Bは疾患(b)に罹患している被検体2の生体反応のデータ群、データ群Cは疾患(a)および疾患(b)に罹患している被検体2の生体反応のデータ群とする。すなわち、データ群Cはデータ群Aの疾患(a)に関する生体情報と、データ群Bの疾患(b)に関する生体情報の双方の生体情報を共通の要因として備えている。そして、これらのデータ群について、時刻iにおける特徴量(t)を算出するものとする。
【0082】
まず、特徴量算出部12は、寄与度w=1、w=w=-1、それ以外をw=0と設定する。ついで、特徴量算出部12は、時刻iにおける繰り返し計測データの平均値および不偏分散を計測条件毎に算出する。ついで、特徴量算出部12は、計測条件毎の繰り返し計測数と、その繰り返し計測数に対する平均値および不偏分散とを上記の式(2)に代入して特徴量を算出する。
【0083】
これにより、情報解析装置1は、疾患(a)および疾患(b)の双方に罹患していることに関連する生体反応の特徴量を、過小評価することなく抽出可能である。
【0084】
図7は、特徴量算出の具体例を説明する説明図である。図7に示すように、データ群Aは遺伝子型(a)の被検体2の生体反応のデータ群、データ群Bは遺伝子型(b)の被検体2の生体反応のデータ群、データ群Cは遺伝子型(a)および遺伝子型(b)被検体2の生体反応のデータ群とする。すなわち、データ群Cはデータ群Aの遺伝子型(a)に関する生体情報と、データ群Bの遺伝子型(b)に関する生体情報の双方を共通の要因として備えている。そして、これらのデータ群について、時刻iにおける特徴量(t)を算出するものとする。
【0085】
まず、特徴量算出部12は、寄与度w=1、w=w=-1、それ以外をw=0と設定する。ついで、特徴量算出部12は、時刻iにおける繰り返し計測データの平均値および不偏分散を計測条件毎に算出する。ついで、特徴量算出部12は、計測条件毎の繰り返し計測数と、その繰り返し計測数に対する平均値および不偏分散とを上記の式(2)に代入して特徴量を算出する。
【0086】
これにより、情報解析装置1は、遺伝子型(a)および遺伝子型(b)の双方を備えていることに関連する生体反応の特徴量を、過小評価することなく抽出可能である。
【0087】
図8図9は、表示例を説明する説明図である。出力部13は、出力条件にしたがって、例えば図8に示すように、レーダーチャートの表示画面G1を表示装置5に表示出力する。また、出力部13は、例えば図9に示すように、折れ線グラフの表示画面G2を表示装置5に表示出力する。
【0088】
特徴量は寄与度(w)の組み合わせの数だけ得られる。ある1人の被検体2について、複数の寄与度の組み合わせによって得られた特徴量を描画(例えばレーダーチャートや折れ線グラフ)し、同様の操作を複数の被検体2について行うことで、各被検体同士の特徴量の差が視覚的にわかりやすくなる。
【0089】
さらに被検体2の属性別(例えば健常群と病気群)に凡例の色を割り当てるなどして、重ねて表示してもよい。こうすることで、健常群に属する複数の被検体2の特徴量と、病気群に属する複数の被検体2の特徴量の差が視覚的にわかりやすくなる。これ以外にも被検体2の属性を分けて複数の図を表示する方法をとってもよい。なお、ここで挙げた表示例(図8、9)は一例であり、これに限定されるものではない。
【0090】
なお、本実施形態の情報解析装置1で実行されるプログラムは、ROM等に予め組み込まれて提供される。本実施形態の情報解析装置1で実行されるプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD-ROM、フレキシブルディスク(FD)、CD-R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されてコンピュータプログラムプロダクトとして提供される。
【0091】
さらに、本実施形態の情報解析装置1で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、本実施形態の情報解析装置1で実行されるプログラムをインターネット等のネットワーク経由で提供または配布するように構成してもよい。
【0092】
本実施形態の情報解析装置1で実行されるプログラムは、上述した各部(例えば入力部10、データ記憶部11、特徴量算出部12および出力部13)を含むモジュール構成となっており、実際のハードウェアとしてはCPU(プロセッサ)が上記ROMからプログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、上記各部が主記憶装置上に生成されるようになっている。
【符号の説明】
【0093】
1…情報解析装置
2…被検体
3…刺激装置
4…生体情報計測装置
5…表示装置
10…入力部
11…データ記憶部
12…特徴量算出部
13…出力部
C1、C2…ケース
G1、G2…表示画面
【先行技術文献】
【特許文献】
【0094】
【文献】特開2015-100号公報
【非特許文献】
【0095】
【文献】Oliver Werner Sakowitz et.al., “Bisensory stimulation increases gamma-responses over multiple cortical regions”, Cognitive Brain Research, Volume 11, Issue 2, April 2001, Pages 267-279
図1
図2
図3
図4
図5
図6
図7
図8
図9