(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023039927
(43)【公開日】2023-03-22
(54)【発明の名称】状態遷移解析・分析システム、方法及びプログラム
(51)【国際特許分類】
G06F 16/90 20190101AFI20230314BHJP
G06F 8/30 20180101ALI20230314BHJP
【FI】
G06F16/90
G06F8/30
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2022138785
(22)【出願日】2022-08-31
(31)【優先権主張番号】P 2021146834
(32)【優先日】2021-09-09
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】510189662
【氏名又は名称】ヴイアールアイ株式会社
(74)【代理人】
【識別番号】100110652
【弁理士】
【氏名又は名称】塩野谷 英城
(72)【発明者】
【氏名】藤田 岳史
【テーマコード(参考)】
5B175
5B376
【Fターム(参考)】
5B175DA10
5B175FB04
5B376BC14
5B376BC32
5B376FA13
(57)【要約】
【課題】複数因子の時系列データの関係性を自動的に説明できるシステムの提供を課題とする。
【解決手段】原情報に基づく複数因子の時系列データに対し時系列解析を実行し各因子の推移を数式化して各因子の推移パターンをデータ化する解析部5と、情報DB8に格納された因子に関する知識と各因子の推移パターンとに基づき当該各因子の関係性をデータ化する関係検証部6とを備える。更に、データ化した各因子の推移パターン及び関係性に基づき自然言語処理により当該関係性の説明文を生成し出力装置に出力する説明部7を有する。
【選択図】
図2
【特許請求の範囲】
【請求項1】
状態遷移の解析又は分析の対象となる原情報と,状態遷移の種々の解析処理又は分析処理を実行するプログラム部品と,を紐づける部品紐づけ情報を記憶した部品紐づけ情報記憶部と、
前記部品紐づけ情報を参照し,前記原情報に紐づけられた複数の前記プログラム部品を選択的に取得し,取得したプログラム部品を繋げて実行プログラムを構成するプログラム構成部と、
前記プログラム構成部が構成した実行プログラムを実行し,当該実行結果を出力するプログラム実行部とを備え、
当該プログラム実行部が、
原情報に基づく複数因子の時系列データに対し時系列解析を実行し各因子の推移を数式化して各因子の推移パターンをデータ化する解析部と、
情報DBに格納された前記因子に関する知識と前記各因子の推移パターンとに基づき当該各因子の関係性をデータ化する関係検証部と、
前記データ化した各因子の推移パターン及び関係性に基づき自然言語処理により当該関係性の説明文を生成し出力装置に出力する説明部と、
を動作させる状態遷移解析・分析システム。
【請求項2】
状態遷移の解析又は分析の対象となる原情報と,状態遷移の種々の解析処理又は分析処理を実行するプログラム部品と,を紐づける部品紐づけ情報を用い、
前記部品紐づけ情報を参照して,前記原情報に紐づけられた複数の前記プログラム部品を選択的に取得し,取得したプログラム部品を繋げて実行プログラムを構成するプログラム構成ステップと、
前記構成した実行プログラムを実行し,当該実行結果を出力するプログラム実行ステップと、
当該プログラム実行ステップにより、
原情報に基づく複数因子の時系列データに対し時系列解析を実行し各因子の推移を数式化して各因子の推移パターンをデータ化する解析ステップと、
情報DBに格納された前記因子に関する知識と前記各因子の推移パターンとに基づき当該各因子の関係性をデータ化する関係検証ステップと、
前記データ化した各因子の推移パターン及び関係性に基づき自然言語処理により当該関係性の説明文を生成し出力装置に出力する説明ステップと、
をコンピュータが実行する状態遷移解析・分析方法。
【請求項3】
状態遷移の解析又は分析の対象となる原情報と,状態遷移の種々の解析処理又は分析処理を実行するプログラム部品と,を紐づける部品紐づけ情報を用い、
前記部品紐づけ情報を参照して,前記原情報に紐づけられた複数の前記プログラム部品を選択的に取得し,取得したプログラム部品を繋げて実行プログラムを構成するプログラム構成ステップと、
前記構成した実行プログラムを実行し,当該実行結果を出力するプログラム実行ステップと、
当該プログラム実行ステップにより、
原情報に基づく複数因子の時系列データに対し時系列解析を実行し各因子の推移を数式化して各因子の推移パターンをデータ化する解析ステップと、
情報DBに格納された前記因子に関する知識と前記各因子の推移パターンとに基づき当該各因子の関係性をデータ化する関係検証ステップと、
前記データ化した各因子の推移パターン及び関係性に基づき自然言語処理により当該関係性の説明文を生成し出力装置に出力する説明ステップと、
をコンピュータに実行させる状態遷移解析・分析プログラム。
【請求項4】
原情報に基づく複数因子の時系列データに対し時系列解析を実行し各因子の推移を数式化して各因子の推移パターンをデータ化する解析部と、
情報DBに格納された前記因子に関する知識と前記各因子の推移パターンとに基づき当該各因子の関係性をデータ化する関係検証部と、
前記データ化した各因子の推移パターン及び関係性に基づき自然言語処理により当該関係性の説明文を生成し出力装置に出力する説明部と、
を備えた状態遷移解析・分析システム。
【請求項5】
前記原情報が複数の因子の推移を示すグラフ画像であり、前記時系列データは当該グラフ画像から抽出したものである、請求項4に記載の状態遷移解析・分析システム。
【請求項6】
原情報に基づく複数因子の時系列データに対し時系列解析を実行し各因子の推移を数式化して各因子の推移パターンをデータ化する解析ステップと、
情報DBに格納された前記因子に関する知識と前記各因子の推移パターンとに基づき当該各因子の関係性をデータ化する関係検証ステップと、
前記データ化した各因子の推移パターン及び関係性に基づき自然言語処理により当該関係性の説明文を生成し出力装置に出力する説明ステップと、
をコンピュータが実行する状態遷移解析・分析方法。
【請求項7】
前記原情報が複数の因子の推移を示すグラフ画像であり、前記時系列データは当該グラフ画像から抽出したものである、請求項6に記載の状態遷移解析・分析方法。
【請求項8】
原情報に基づく複数因子の時系列データに対し時系列解析を実行し各因子の推移を数式化して各因子の推移パターンをデータ化する解析ステップと、
情報DBに格納された前記因子に関する知識と前記各因子の推移パターンとに基づき当該各因子の関係性をデータ化する関係検証ステップと、
前記データ化した各因子の推移パターン及び関係性に基づき自然言語処理により当該関係性の説明文を生成し出力装置に出力する説明ステップと、
をコンピュータに実行させる状態遷移解析・分析プログラム。
【請求項9】
前記原情報が複数の因子の推移を示すグラフ画像であり、前記時系列データは当該グラフ画像から抽出したものである、請求項8に記載の状態遷移解析・分析プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、状態遷移解析・分析システムに係り、特に、原情報から把握可能な状態の遷移を当該原情報に対応するプログラムにより解析又は分析する、状態遷移解析・分析システムに関する。
【背景技術】
【0002】
従来、テキストデータ毎に対応する固定的なプログラム(所定のデータ解析プログラム等)を予め紐づけ、コンピュータが、入力されたテキストデータに対応する固定的なプログラムを選択し、所定のデータ解析処理等を実行するシステムがある。
【0003】
しかし、入力データ毎に対応して行うことのできる解析又は分析のプロセスが固定的であり、柔軟性に欠けるところがあった。
【0004】
また、データ解析処理の分野では、人が複数の時系列データ(グラフ画像)を観察し、そこに示された各因子の関係性を検証する作業が行われている。しかし、関係する因子の数が増えるほど、人手による関係性の検証は複雑になり、大変な労力を伴う。
【0005】
なお、出願人は当該システムに関する先行技術文献を知らない。
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明は、上記従来例の有する不都合を改善し、特に、原情報から把握可能な状態遷移の解析又は分析において、原情報毎に従来よりも柔軟な解析又は分析プログラムを実行可能とすることを課題とする。
【0007】
また、複数因子の時系列データの関係性を自動的に説明できるシステムの提供を課題とする。
【課題を解決するための手段】
【0008】
この課題を解決するため、本発明は、状態遷移の解析又は分析の対象となる原情報と,状態遷移の種々の解析処理又は分析処理を実行するプログラム部品と,を紐づける部品紐づけ情報を記憶した部品紐づけ情報記憶部を備える。また、部品紐づけ情報を参照し,原情報に紐づけられた複数のプログラム部品を選択的に取得し,取得したプログラム部品を繋げて実行プログラムを構成するプログラム構成部を有する。更に、プログラム構成部が構成した実行プログラムを実行し,当該実行結果を出力するプログラム実行部を備えている。
【0009】
これに加え、プログラム実行部が、原情報に基づく複数因子の時系列データに対し時系列解析を実行し各因子の推移を数式化して各因子の推移パターンをデータ化する解析部と、情報DBに格納された因子に関する知識と各因子の推移パターンとに基づき当該各因子の関係性をデータ化する関係検証部とを備えている。更に、データ化した各因子の推移パターン及び関係性に基づき自然言語処理により当該関係性の説明文を生成し出力装置に出力する説明部を有する、という構成を採っている。
【発明の効果】
【0010】
本発明によれば、原情報から把握可能な状態遷移の解析又は分析において、原情報毎に従来よりも柔軟な解析又は分析プログラムを実行することができる。
【0011】
また、複数の因子の時系列データの間に存在する関係性を自動的に説明することができる。
【図面の簡単な説明】
【0012】
【
図1】
図1は、本発明の一実施形態を示すシステム構成図。
【
図2】
図2は、本発明の実施例1を示すシステム構成図。
【
図5】
図5は、
図2の情報DBに格納されるデータの一例を示す構成図。
【
図6】
図6は、
図2の解析結果記憶部に格納されるデータの一例を示す構成図。
【
図7】
図7は、
図2の定型文記憶部に格納されるデータの一例を示す構成図。
【発明を実施するための形態】
【0013】
以下、本発明の一実施形態を
図1に基づいて説明する。
図1に示す状態遷移解析・分析システムは、コンピュータシステムであり、キーボード等の入力装置1と、表示装置等の出力装置2と、CPU等の処理装置(プロセッサ)3と、ハードディスクドライブ等の記憶装置4とを備えている。
【0014】
処理装置3は、解析・分析プログラム構成部31と、解析・分析プログラム実行部32とを有する。これら各部31,32は、処理装置3が、所定のプログラムを実行することにより、実現される。
【0015】
解析・分析プログラム構成部31は、原情報に応じた複数のプログラム部品を選択し繋げることにより、状態遷移の解析又は分析を行うためのプログラムを構成する。また、解析・分析プログラム実行部32は、解析・分析プログラム構成部31が構成したプログラムを実行し、原情報に対して状態遷移の解析又は分析処理を実行する。
【0016】
記憶装置4は、原情報記憶部41と、部品紐づけ情報記憶部42と、プログラム部品記憶部43とを備えている。各記憶部41,42,43は、記憶装置4の記憶領域にそれぞれ設けられている。ただし、プログラム部品記憶部43は、ローカルの記憶装置4に限らず、コンピュータネットワーク上の外部の記憶装置(図示略)に設けられていてもよい。その場合、NIC等の通信装置を介して外部のプログラム部品記憶部43を利用する。
【0017】
原情報記憶部41は、状態遷移の解析又は分析の対象となる原情報を記憶する。原情報は、例えば、或る状態からその後の状態への状態遷移を表す要素を含むデータ、グラフ画像、その他の画像又は自然文等である。原情報は、入力装置1や通信装置(図示略)から取得され、原情報記憶部41に格納される。また、原情報としての自然文は、状態遷移解析・分析システム自身が生成し原情報記憶部41に格納してもよい。
【0018】
プログラム部品記憶部43は、状態遷移の解析又は分析に用いる種々の解析処理又は分析処理を実行する複数のプログラム部品のライブラリを記憶している。プログラム部品は、例えば、API(アプリケーション・プログラミング・インターフェース)に対応したソフトウェアコンポーネントである。各プログラム部品は、例えば、次の処理を行う。
【0019】
・勾配、差分や分布等を解析する処理
・周波数解析のためのフーリエ関数や数理モデルを用いて状態の遷移を見つける処理
・時間、場所等をオーガナイズした上で相関分析を行い関係する因子を見つける処理
・解析又は分析の結果をプログラム、アルゴリズム又は自然文で表して出力する処理
・相関性を見つける処理
・原因分析を行う処理
・極限比較を行う処理
・変化率を比較する処理
・特定因子との乖離度を算定する処理
・状態遷移を数式化する処理
・状態遷移モデルを作成する処理
・状態遷移に関する自然文を作成する処理
・解析又は分析した項目や要素(factor)の関連性を整理する処理
・整理した関連性を構造化(例えば数式化など)する処理
【0020】
部品紐づけ情報記憶部42は、原情報と、当該原情報に対応するプログラム部品とを紐づける部品紐づけ情報を記憶している。原情報とプログラム部品とを紐づける形態は幾つか考えられる。例えば、原情報から抽出可能な固有値と、各プログラム部品の固有値とを紐づけた部品紐づけ情報としてもよい。また、原情報から認識可能な原情報の種類に応じた固有値と、プログラム部品の固有値とを紐づけた部品紐づけ情報としてもよい。原情報の種類(例えば、データ、グラフ画像、その他の画像又は自然文)に応じた固有値は、AI(人工知能)の学習済みモデルにより、原情報の入力に対して、当該固有値を出力として得てもよい。
【0021】
部品紐づけ情報は、複数のプログラム部品の固有値を当該プログラム部品の実行順に紐づけていてもよい。また、複数のプログラム部品の固有値(ノード)の紐づけをグラフ状(ネットワーク状)に形成し、当該ノード間の紐づけにプログラム部品の実行順序に応じた重みを設定してもよい。このようなデータ構造は、例えばグラフデータベースにより管理する。また、原情報の固有値とプログラム部品の固有値との紐づけ及び複数のプログラム部品の固有値の紐づけは、入力装置1等から人手によるマニュアル操作によって行ってもよい。
【0022】
次に、本実施形態の動作を説明する。まず、解析・分析プログラム構成部31は、原情報記憶部41から原情報を読み出し、当該原情報から抽出又は認識した固有値を取得する。続いて、部品紐づけ情報記憶部42を参照し、当該原情報の固有値に紐づいた一乃至複数のプログラム部品の固有値及びプログラム部品が複数の場合の実行順の情報を取得する。続いて、当該取得した一乃至複数のプログラム部品の固有値に対応するプログラム部品をプログラム部品記憶部43から選択して取得する。取得したプログラム部品が1つの場合、当該プログラム部品を実行プログラムとして生成する。一方、取得したプログラム部品が複数の場合、当該複数のプログラム部品を実行順に繋げて実行プログラムを生成する。
【0023】
解析・分析プログラム実行部32は、解析・分析プログラム構成部31が生成した実行プログラムを実行する。例えば、原情報としてグラフ画像を読み込み、当該グラフ画像に紐づいたプログラム部品が、数式化、状態遷移モデルの作成、自然文作成の場合、プログラムの実行により、原情報であるグラフ画像について、グラフに示された状態遷移を数式化した後、状態遷移モデルを作成し、当該状態遷移モデルに基づき状態遷移に関する説明文を作成して出力する、といった柔軟な処理を実現することが可能となる。
【0024】
同様に、原情報に応じて解析又は分析用のプログラム部品を紐づけることにより、例えば、原情報としてのグラフ画像について、グラフの勾配、差分や分布等を解析し、周波数解析のためのフーリエ関数や数理モデルを用いて状態の遷移を見つけ、時間や場所等をオーガナイズした上で相関分析を行い、関係する因子を見つける。当該結果をプログラム、アルゴリズム又は自然文の形で出力する、といった柔軟な処理も可能となる。
【実施例0025】
実施の一例として、薬剤Aの血中濃度を示すグラフの推移と、CRP値のグラフの推移とを測り、両者の関係性を説明するシステムを示す。
【0026】
[システム構成]
本実施例の構成を
図2に示す。上記実施形態と同一の部分については、同一の符号を付して重複説明を省略する。
【0027】
図2に示すグラフ説明システムは、原情報記憶部41、グラフ解析部5、グラフ関係検証部6、グラフ説明部7及び出力装置2を備えている。また、情報DB(データベース)8、解析結果記憶部9及び定型文記憶部11を有する。
【0028】
本実施例において、原情報記憶部41には、時系列データとグラフ画像とが格納されている。時系列データは、ある被験者について、薬剤Aの血中濃度の1日ごとの値と、CRP値(C反応性蛋白)の1日ごとの値と、薬剤Cの血中濃度の1日ごとの値とを含んでいる。また、グラフ画像は、第1の画像として、当該時系列データのうち、薬剤Aの血中濃度の1日ごとの推移を示す線グラフと、CRPの1日ごとの推移を示す線グラフとを重ねて図示した画像(
図3)を有する。また、第2の画像として、
図3に加えて更に、当該時系列データのうち、薬剤Cの血中濃度の1日ごとの推移を示す線グラフを重ねて図示した画像(
図4)を有する。
【0029】
グラフ解析部5は、原情報記憶部41から読み出した時系列データ又はグラフ画像から抽出した時系列データに対して時系列解析を実行し、薬剤A及びC並びにCRP値の推移をデータ化する。
【0030】
グラフ関係検証部6は、グラフ解析部5でデータ化した薬剤A及びC並びにCRP値の変化の推移について、相関や逆相関等の関係性をデータ化する。また、グラフ関係検証部6は、データ化した関係性が、薬剤A及びC並びにCRPについて情報DB8に予め登録されているそれらの既知の知識データと矛盾しないか判定する。
【0031】
グラフ説明部7は、グラフ関係検証部6で矛盾しない、とされた薬剤A及びC並びにCRP値の推移及び関係性を表すデータを受け、当該データを埋め込んだ自然文を自然言語処理により生成、出力する。
【0032】
[ソフトウェア構成]
本実施例の試作では、プログラミング言語Pythonの標準モジュール又は拡張モジュール等でオープンソースとして公開されているものを利用した。当該各モジュール(ライブラリ)は、上記実施形態のプログラム部品に該当する。一方、Pythonに限らず、Julia、Node.jsやC++等で記述してもよい。
【0033】
上記のグラフ解析部5、グラフ関係検証部6及びグラフ説明部7は、プロセッサがプログラムを実行することにより動作する。当該プログラムは、先の実施形態のとおり、解析・分析プログラム構成部31により構成され、解析・分析プログラム実行部32により実行される。
【0034】
[各部の動作]
本実施例では
図3に示すグラフの時系列データ又はグラフ画像を原情報として用いる。上述のとおり、
図3は、薬剤Aの血中濃度の1日ごとの推移を示す線グラフと、CRPの1日ごとの推移を示す線グラフとを重ねて示している。横軸は日数で1メモリが1日を示し、縦軸は薬剤Aの血中濃度とCRP値を示している。CRP値については、1メモリの大きさが1.0である。
【0035】
情報DB8には、薬剤Aに関する情報と、CRP値に関する情報とが、予め格納されている。本実施例では
図5に示すように、薬剤Aに関する情報Aとして、薬剤Aを投与する”効果”は”炎症抑制作用”であることを示すデータが記録されている。また、CRPに関する情報Bとして、”CRP”は”炎症値”であること、CRPの”上昇”は”炎症あり”を表すこと、CRPの”下降”は”炎症抑制”を表すこと、CRPの”基準値範囲”は”0.3以下”であること、を示すデータが記録されている。これに加え、薬剤Cに関する情報Cとして、薬剤Cの”効果”は”炎症抑制”と”疼痛抑制”であることを示すデータが記録されている。
【0036】
グラフ解析部5は、原情報記憶部41から実数値を伴わないグラフ画像を読み込んだ場合、OpenCV等のライブラリを使用し、画像に含まれる各グラフの輪郭を検出し、フーリエ変換やウェーブレット変換等の波長分析を利用して各グラフの時系列データを取得する。
【0037】
グラフ解析部5は、原情報記憶部41から読み出した時系列データ又は画像から取得した時系列データに対し時系列解析を実行し、各時系列データを数式化(モデル化)する。そして、当該数式に基づいて薬剤A及びCRPの推移のパターンを求める。時系列解析ではCatBoost、LightGBM、SymPy、NumPy、Pandas、scikit-learn等のライブラリを用いる。
【0038】
本実施例では、グラフ解析部5が、次に示すパターンを求めたとする。即ち、薬剤Aのパターンとして、”上昇”は”4日目”であること、”ピーク”は”7日目”であること、”投与”は”5日間”であること、を示すデータ。CRPのパターンとして、”上昇”は”3日目”であること、”ピーク”は”4日目”であること、”下降率”が”10%”であること、”収束”は”9日目”であること、”収束値”は”0.4”であること、を示すデータ、を求めたとする。グラフ解析部5は、これらのパターンを解析結果記憶部9に格納する。
【0039】
続いて、グラフ関係検証部6は、解析結果記憶部9に格納されたパターンと情報DB8に格納された情報A及びBとを用いて、以下の関係性の判定を行う。
【0040】
(1)上記パターン及び情報Bに基づき、CRP値の収束値0.4は、基準値範囲0.3以下に”近い”(差が所定値以内である)こと。
【0041】
(2)情報A及びBに基づき、”薬剤A”の投与は”炎症抑制効果”があるから”CRP値”は”下降”するという因果関係があること。
【0042】
(3)上記(2)と比較し、上記パターンで、”CRP”が”下降”(ピーク以降)しているところで、”薬剤A”の投与があることは、矛盾が無いこと。(相関に因果関係があることの検証)
グラフ関係検証部6は、矛盾が無いことを判定すると、上記のパターンデータと上記の関係性を表す検証結果データをグラフ説明部7に渡す。
【0043】
グラフ説明部7は、グラフ関係検証部6から受けたパターンデータと検証結果データから定型文に埋め込むための対応するパラメータを選択し、自然言語処理により原情報の時系列データ又はグラフ画像に対する説明文を自動生成する。定型文記憶部11には、例えば
図7に示すような一部が変数である種々の定型文テキストが格納されている。本実施例では、例えば、グラフ説明部7は、次の説明文を生成し出力装置2に出力する。
>”3日目”に”CRP”が”上昇”したため、”薬剤A”を投与。
>”5日間”投与し、その”炎症抑制効果”によって”9日目”に”CRP値”は”基準値範囲””近く”まで”下降”した。
このグラフ説明部7の処理では、Markovify、 N-grams Counter、MeCab、Bert、GPT3等のライブラリを用いる。
【0044】
本実施例によれば、時系列データやグラフ画像の説明文を自動的に生成し出力することができる。
グラフ解析部5は、薬剤AとCRPに加え、薬剤Cの時系列データについて時系列解析を実行し、各グラフを数式化する。そして、各数式から得られるパターンを示すデータを解析結果記憶部9に格納する。
グラフ関係検証部6は、解析結果記憶部9に格納されたパターンと、情報DB8に格納された薬剤A及びC並びにCRPの知識情報に基づき、次の関係性には矛盾が無いことを判定する。
グラフ説明部7は、グラフ関係検証部6から受けたパターンデータと検証結果データから定型文に埋め込むための対応するパラメータを選択し、自然言語処理により原情報の時系列データ又はグラフ画像に対する説明文を自動生成する。本実施例では、例えば、グラフ説明部7は、次の説明文を生成し出力装置2に出力する。
>”3日目””CRP値”が”上昇”したため、”薬剤A”を投与。”CRP値”は”降下”した。
>”5日目”より”薬剤C”を投与したところ、”CRP値”の”降下率”が上がった。
>”薬剤AとC”の”炎症抑制効果”により”8日目”に”CRP値”は”基準値範囲””近く”まで”下降”した。
以上のように、本実施例によれば、3つ以上の時系列データの因果関係についても説明文を自動的に生成することができる。薬剤の種類が増えたり、血液検査項目が増えた場合には、因果関係の分析は複雑になり人の手では困難であるが、この課題を解決することができる。
ここで、本発明の範囲は、特許請求の範囲に記載した発明の範囲であり、上記実施形態や実施例に限られるものではない。薬剤等の医療分野に好適であるが、他の分野にも幅広く活用することができる。