(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-05-17
(45)【発行日】2024-05-27
(54)【発明の名称】情報処理装置及び情報処理方法
(51)【国際特許分類】
G06N 5/04 20230101AFI20240520BHJP
G06F 123/02 20230101ALN20240520BHJP
【FI】
G06N5/04
G06F123:02
(21)【出願番号】P 2021154380
(22)【出願日】2021-09-22
【審査請求日】2023-07-18
(73)【特許権者】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】110004222
【氏名又は名称】弁理士法人創光国際特許事務所
(74)【代理人】
【識別番号】100166006
【氏名又は名称】泉 通博
(74)【代理人】
【識別番号】100154070
【氏名又は名称】久恒 京範
(74)【代理人】
【識別番号】100153280
【氏名又は名称】寺川 賢祐
(72)【発明者】
【氏名】西村 康孝
(72)【発明者】
【氏名】武田 直人
(72)【発明者】
【氏名】南川 敦宣
【審査官】新井 則和
(56)【参考文献】
【文献】特開2013-117926(JP,A)
【文献】特開2019-185663(JP,A)
【文献】大竹 孝樹 外,顕現的要素の出現順序に基づく物語の類似性尺度,言語処理学会第25回年次大会 発表論文集,2019年03月04日,pp. 304-307
(58)【調査した分野】(Int.Cl.,DB名)
G06N 5/04
G06F 123/02
(57)【特許請求の範囲】
【請求項1】
イベントの発生を示し、複数の前記イベントそれぞれを識別するためのイベント識別情報を含むイベント発生データを前記イベントの発生順に並べた時系列データを取得する時系列データ取得部と、
時系列データの入力に対して複数のクラスそれぞれの生起確率を示す出力データを出力するモデルに、前記時系列データ取得部が取得した前記時系列データを入力し、前記モデルが出力した出力データを取得する出力データ取得部と、
前記時系列データ取得部が取得した前記時系列データに含まれる2つのイベント発生データの発生順を入れ替えた時系列データである疑似時系列データを作成するデータ作成部と、
前記出力データ取得部に、前記データ作成部が作成した前記疑似時系列データに対応する出力データである疑似出力データを取得させ、前記時系列データ取得部が取得した前記時系列データに対応する出力データと、前記疑似出力データとの差の内容に基づいて、前記時系列データに含まれる2つのイベント発生データの発生順が重要であるか否かを判定する判定部と、
前記判定部による判定結果を出力する出力部と、
を有する情報処理装置。
【請求項2】
前記判定部は、前記時系列データ取得部が取得した前記時系列データに対応する出力データに含まれる最も生起確率が高いクラスの生起確率と、前記疑似時系列データに対応する疑似出力データに含まれる当該クラスの生起確率との差分に基づいて、前記時系列データに含まれる2つのイベント発生データの発生順が重要であるか否かを判定する、
請求項1に記載の情報処理装置。
【請求項3】
前記出力データ取得部が取得した前記出力データが示す出力結果の算定に対する、前記時系列データ取得部が取得した前記時系列データに含まれる複数の前記イベント発生データそれぞれの重要度を特定する重要度特定部をさらに有し、
前記データ作成部は、複数の前記イベント発生データのうち、特定された前記重要度が相対的に高い2つの前記イベント発生データを特定し、当該2つのイベント発生データの発生順を入れ替えた前記疑似時系列データを作成する、
請求項1又は2に記載の情報処理装置。
【請求項4】
前記判定部は、前記出力データ取得部に前記疑似時系列データに対応する前記疑似出力データを取得させるとともに、前記重要度特定部に、当該疑似出力データに対する、当該疑似時系列データに含まれる複数の前記イベント発生データそれぞれの重要度である疑似重要度を特定させ、前記時系列データ取得部が取得した前記時系列データの出力データと前記疑似出力データとの差の内容と、前記時系列データに対応する重要度と前記疑似重要度との差の内容とに基づいて、前記時系列データに含まれる2つのイベント発生データの発生順が重要であるか否かを判定する、
請求項3に記載の情報処理装置。
【請求項5】
イベントの発生を示し、複数の前記イベントそれぞれを識別するためのイベント識別情報を含むイベント発生データを前記イベントの発生順に並べた時系列データを取得する時系列データ取得部と、
時系列データの入力に対して複数のクラスそれぞれの生起確率を示す出力データを出力する分類モデル又は時系列データの入力に対して所定の事象の回帰予測を行う回帰モデルに、前記時系列データ取得部が取得した前記時系列データを入力し、前記分類モデル又は前記回帰モデルが出力した出力データを取得する出力データ取得部と、
前記出力データ取得部が取得した前記出力データが示す出力結果の算定に対する、前記時系列データ取得部が取得した前記時系列データに含まれる複数の前記イベント発生データそれぞれの重要度を特定する重要度特定部と、
前記時系列データ取得部が取得した前記時系列データに含まれる2つのイベント発生データの発生順を入れ替えた時系列データである疑似時系列データを作成するデータ作成部と、
前記出力データ取得部に、前記データ作成部が作成した前記疑似時系列データに対応する出力データである疑似出力データを取得させるとともに、前記重要度特定部に前記疑似出力データに対する、複数の前記イベント発生データそれぞれの前記重要度である疑似重要度を特定させ、前記時系列データ取得部が取得した前記時系列データの出力データに対応する重要度と、前記疑似重要度との差の内容に基づいて、前記時系列データに含まれる2つのイベント発生データの発生順が重要であるか否かを判定する判定部と、
前記判定部による判定結果を出力する出力部と、
を有する情報処理装置。
【請求項6】
前記データ作成部は、前記時系列データに含まれる複数のイベント発生データの中から2つのイベントデータの選択を受け付け、選択された2つのイベント発生データの発生順を入れ替えた前記疑似時系列データを作成する、
請求項1から5のいずれか1項に記載の情報処理装置。
【請求項7】
コンピュータが実行する、
複数のイベントそれぞれを識別するためのイベント識別情報を含み、イベントの発生を示すイベント発生データを前記イベントの発生順に並べた時系列データを取得するステップと、
時系列データの入力に対して複数のクラスそれぞれの生起確率を示す出力データを出力するモデルに取得した前記時系列データを入力し、前記モデルが出力した出力データを取得するステップと、
前記時系列データに含まれる2つのイベント発生データの発生順を入れ替えた時系列データである疑似時系列データを作成するステップと、
前記モデルに、作成された前記疑似時系列データを入力し、前記モデルが出力した出力データを疑似出力データとして取得するステップと、
取得した前記時系列データに対応する出力データと、前記疑似出力データとの差の内容に基づいて、前記時系列データに含まれる2つのイベント発生データの発生順が重要であるか否かを判定するステップと、
前記判定の結果を出力するステップと、
を有する情報処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置及び情報処理方法に関する。
【背景技術】
【0002】
従来、機械学習により生成された、時系列データの入力に対して複数のクラスそれぞれの生起確率を算出する分類モデルや、時系列データの入力に対して所定の事象の回帰予測を行う回帰モデルを用いて各種の事象を推定、予測することが行われている。
【0003】
例えば、非特許文献1では、IoT機器である宅内センサのセンサIDを、宅内センサが作動した時間順に並べた時系列データを生成し、時系列データを文章、時系列データに含まれるセンサIDを単語とし、Word2Vecを利用して、各センサに、センサ同士の共起関係を示す特徴ベクトルを割り当てる技術が開示されている。
【0004】
宅内のユーザが所定の行動又は所定の行動と連動した行動を行うことにより作動する複数のセンサは、特徴空間上で相対的に近い位置に配置される。したがって、ユーザの行動と、センサの作動状況との対応付けを行うことにより、センサの作動状況に基づいて、宅内のユーザの行動認識、及び行動予測を行うことができる。
【先行技術文献】
【非特許文献】
【0005】
【文献】Kushal Singla, and Joy Bose." IoT2Vec: Identification of Similar IoT Devices via Activity Footprints." 2018 International Conference on Advances in Computing, Communications and Informatics (ICACCI). IEEE, 2018年
【発明の概要】
【発明が解決しようとする課題】
【0006】
ところで、推定した事象に対して、イベントの発生順が重要な場合がある。例えば、宅内の複数のセンサの作動順を示す時系列データに基づいて居住者の行動を推定する場合、特定の複数のセンサが順番に作動することがある。例えば、居住者が外出する場合には、リビング照明のON、OFFを検出するセンサがOFFになった後、玄関扉の開閉を検出するセンサがOPENとなる。このように、事象の推定に対してイベントの発生順序も重要であるものの、従来の技術では、時系列データに含まれている複数のイベント発生データが示すイベントの発生順が重要であるかを提示することができないという問題があった。
【0007】
そこで、本発明はこれらの点に鑑みてなされたものであり、イベントの発生順が重要であるかを提示することを目的とする。
【課題を解決するための手段】
【0008】
本発明の第1の態様に係る情報処理装置は、イベントの発生を示し、複数の前記イベントそれぞれを識別するためのイベント識別情報を含むイベント発生データを前記イベントの発生順に並べた時系列データを取得する時系列データ取得部と、時系列データの入力に対して複数のクラスそれぞれの生起確率を示す出力データを出力するモデルに、前記時系列データ取得部が取得した前記時系列データを入力し、前記モデルが出力した出力データを取得する出力データ取得部と、前記時系列データ取得部が取得した前記時系列データに含まれる2つのイベント発生データの発生順を入れ替えた時系列データである疑似時系列データを作成するデータ作成部と、前記出力データ取得部に、前記データ作成部が作成した前記疑似時系列データに対応する出力データである疑似出力データを取得させ、前記時系列データ取得部が取得した前記時系列データに対応する出力データと、前記疑似出力データとの差の内容に基づいて、前記時系列データに含まれる2つのイベント発生データの発生順が重要であるか否かを判定する判定部と、前記判定部による判定結果を出力する出力部と、を有する。
【0009】
前記判定部は、前記時系列データ取得部が取得した前記時系列データに対応する出力データに含まれる最も生起確率が高いクラスの生起確率と、前記疑似時系列データに対応する疑似出力データに含まれる当該クラスの生起確率との差分に基づいて、前記時系列データに含まれる2つのイベント発生データの発生順が重要であるか否かを判定してもよい。
【0010】
前記情報処理装置は、前記出力データ取得部が取得した前記出力データが示す出力結果の算定に対する、前記時系列データ取得部が取得した前記時系列データに含まれる複数の前記イベント発生データそれぞれの重要度を特定する重要度特定部をさらに有し、前記データ作成部は、複数の前記イベント発生データのうち、特定された前記重要度が相対的に高い2つの前記イベント発生データを特定し、当該2つのイベント発生データの発生順を入れ替えた前記疑似時系列データを作成してもよい。
【0011】
前記判定部は、前記出力データ取得部に前記疑似時系列データに対応する前記疑似出力データを取得させるとともに、前記重要度特定部に、当該疑似出力データに対する、当該疑似時系列データに含まれる複数の前記イベント発生データそれぞれの重要度である疑似重要度を特定させ、前記時系列データ取得部が取得した前記時系列データの出力データと前記疑似出力データとの差の内容と、前記時系列データに対応する重要度と前記疑似重要度との差の内容とに基づいて、前記時系列データに含まれる2つのイベント発生データの発生順が重要であるか否かを判定してもよい。
【0012】
本発明の第2の態様に係る情報処理装置は、イベントの発生を示し、複数の前記イベントそれぞれを識別するためのイベント識別情報を含むイベント発生データを前記イベントの発生順に並べた時系列データを取得する時系列データ取得部と、時系列データの入力に対して複数のクラスそれぞれの生起確率を示す出力データを出力する分類モデル又は時系列データの入力に対して所定の事象の回帰予測を行う回帰モデルに、前記時系列データ取得部が取得した前記時系列データを入力し、前記分類モデル又は前記回帰モデルが出力した出力データを取得する出力データ取得部と、前記出力データ取得部が取得した前記出力データが示す出力結果の算定に対する、前記時系列データ取得部が取得した前記時系列データに含まれる複数の前記イベント発生データそれぞれの重要度を特定する重要度特定部と、前記時系列データ取得部が取得した前記時系列データに含まれる2つのイベント発生データの発生順を入れ替えた時系列データである疑似時系列データを作成するデータ作成部と、前記出力データ取得部に、前記データ作成部が作成した前記疑似時系列データに対応する出力データである疑似出力データを取得させるとともに、前記重要度特定部に前記疑似出力データに対する、複数の前記イベント発生データそれぞれの前記重要度である疑似重要度を特定させ、前記時系列データ取得部が取得した前記時系列データの出力データに対応する重要度と、前記疑似重要度との差の内容に基づいて、前記時系列データに含まれる2つのイベント発生データの発生順が重要であるか否かを判定する判定部と、前記判定部による判定結果を出力する出力部と、を有する。
【0013】
前記データ作成部は、前記時系列データに含まれる複数のイベント発生データの中から2つのイベントデータの選択を受け付け、選択された2つのイベント発生データの発生順を入れ替えた前記疑似時系列データを作成してもよい。
【0014】
本発明の第3の態様に係る情報処理方法は、コンピュータが実行する、複数のイベントそれぞれを識別するためのイベント識別情報を含み、イベントの発生を示すイベント発生データを前記イベントの発生順に並べた時系列データを取得するステップと、時系列データの入力に対して複数のクラスそれぞれの生起確率を示す出力データを出力するモデルに取得した前記時系列データを入力し、前記モデルが出力した出力データを取得するステップと、前記時系列データに含まれる2つのイベント発生データの発生順を入れ替えた時系列データである疑似時系列データを作成するステップと、前記モデルに、作成された前記疑似時系列データを入力し、前記モデルが出力した出力データを疑似出力データとして取得するステップと、取得した前記時系列データに対応する出力データと、前記疑似出力データとの差の内容に基づいて、前記時系列データに含まれる2つのイベント発生データの発生順が重要であるか否かを判定するステップと、前記判定の結果を出力するステップと、を有する。
【発明の効果】
【0015】
本発明によれば、イベントの発生順が重要であるかを提示することができるという効果を奏する。
【図面の簡単な説明】
【0016】
【
図1】本実施形態に係る情報処理装置の概要を説明する図である。
【
図2】本実施形態に係る情報処理装置の構成を示す図である。
【
図4】
図3に示す時系列データに対応する重要度データを示す図である。
【
図5】
図3、
図4に対応して作成された疑似時系列データを示す図である。
【
図6】
図5に示す疑似時系列データに対応する疑似重要度データを示す図である。
【発明を実施するための形態】
【0017】
[情報処理装置の概要]
図1は、本実施形態に係る情報処理装置1の概要を説明する図である。情報処理装置1は、イベントの発生を示すイベント発生データをイベントの発生順に並べた時系列データに含まれている2つのイベント発生データの発生順が重要であるかを判定するためのコンピュータである。
【0018】
図1に示すように、情報処理装置1は、イベント発生データをイベントの発生順に並べた時系列データを取得する(
図1における(1))。情報処理装置1は、時系列データの入力に対して複数のクラスそれぞれの生起確率を示す出力データを出力する機械学習モデルに、取得した時系列データを入力し、機械学習モデルが出力した出力データを取得する(
図1における(2)、(3))。
【0019】
機械学習モデルは、時系列データの入力に対して複数のクラスそれぞれの生起確率を示す出力データを出力する分類モデル又は時系列データの入力に対して所定の事象の回帰予測を行う回帰モデルである。機械学習モデルは、例えば、時系列データと、当該時系列データに対応するクラスとを関連付けた教師データに基づいて予め学習済であるものとする。
【0020】
情報処理装置1は、例えば、XAI(Explainable AI)モデルを用いて、出力データに対する複数のイベント発生データそれぞれの重要度を示す重要度データを取得する(
図1における(4))。XAIモデルは、例えば、時系列データから生成した複数の疑似データを機械学習モデルに入力し、出力データの変化を観察することにより、重要度を示す重要度データを出力するモデルである。情報処理装置1は、出力データ及び重要度データを取得すると、重要度データに基づいて、当該出力データに対する、取得した時系列データに含まれる複数のイベント発生データそれぞれの重要度を特定する(
図1における(5))。情報処理装置1は、重要度が相対的に高い2つのイベント発生データを特定し、取得した時系列データに含まれる複数のイベント発生データのうち、特定した2つのイベント発生データの発生順を入れ替えた時系列データである疑似時系列データを作成する(
図1における(6))。
【0021】
情報処理装置1は、作成した疑似時系列データを機械学習モデルに入力し、機械学習モデルが出力した出力データを疑似出力データとして取得する(
図1における(7)、(8))。情報処理装置1は、取得した時系列データに対応する出力データと、疑似出力データとの差の内容に基づいて、特定した2つのイベント発生データの発生順が重要であるか否かを判定し、判定結果を示す判定結果情報を出力する(
図1における(9)、(10))。このようにすることで、情報処理装置1は、2つのイベント発生データが示すイベントの発生順が重要であるかを提示することができる。
【0022】
[情報処理装置1の構成例]
続いて、情報処理装置1の構成について説明する。
図2は、本実施形態に係る情報処理装置1の構成を示す図である。情報処理装置1は、通信部11と、記憶部12と、制御部13とを有する。制御部13は、時系列データ取得部131と、出力データ取得部132と、重要度特定部133と、データ作成部134と、判定部135と、出力部136とを有する。
【0023】
通信部11は、インターネット等のネットワークを介して外部装置とデータを送受信するための通信インターフェースである。
記憶部12は、例えば、ROM(Read Only Memory)及びRAM(Random Access Memory)等である。記憶部12は、情報処理装置1を機能させるための各種プログラムを記憶する。例えば、記憶部12は、情報処理装置1の制御部13を、時系列データ取得部131、出力データ取得部132、重要度特定部133、データ作成部134、判定部135、及び出力部136として機能させるプログラムを記憶する。
【0024】
制御部13は、例えばCPU(Central Processing Unit)である。制御部13は、記憶部12に記憶されている各種プログラムを実行することにより、情報処理装置1に係る機能を制御する。制御部13は、記憶部12に記憶されているプログラムを実行することにより、時系列データ取得部131、出力データ取得部132、重要度特定部133、データ作成部134、判定部135、及び出力部136として機能する。
【0025】
時系列データ取得部131は、イベントの発生を示し、複数のイベントそれぞれを識別するためのイベント識別情報としてのイベントIDを含むイベント発生データをイベントの発生時刻順に並べた時系列データを取得する。例えば、時系列データ取得部131は、情報処理装置1を利用するユーザが使用するユーザ端末(不図示)から時系列データを取得する。
図3は、時系列データの一例を示す図である。
図3に示す時系列データXは、宅内に設けられている複数のセンサそれぞれの作動状況をイベントとした、イベント発生データx
1~x
10を含んでいる。なお、イベント発生データには、イベントIDと、イベントが発生した時刻を示す時刻情報とが含まれているものとするが、これに限らず、時刻情報が含まれていなくてもよい。
【0026】
出力データ取得部132は、時系列データの入力に対して複数のクラスそれぞれの生起確率を示す出力データを出力する機械学習モデルに、時系列データ取得部131が取得した時系列データを入力し、機械学習モデルが出力した出力データを取得する。
【0027】
図3に示す時系列データに基づいて人の行動を予測する場合、機械学習モデルは、例えば、時系列データと、当該時系列データに対応する人の行動を示す行動情報とを関連付けた教師データに基づいて予め学習したプログラムであって、記憶部12に記憶されているものとする。機械学習モデルは、
図3に示す、複数のセンサそれぞれの作動状況をイベントとしたイベント発生データを含む時系列データの入力に対し、宅内の人が取り得る複数の行動それぞれの生起確率を出力する。
【0028】
出力データ取得部132は、例えば、
図3に示す時系列データXを機械学習モデルに入力し、機械学習モデルから、以下に示す出力データYを取得する。出力データYにおいて、例えば、外出に対応する0.6は、宅内の人物が外出した確率が60%であることを示している。
出力データY={外出:0.6,睡眠:0.1,料理:0.05,食事:0.05,仕事:0.1,リラックス:0.1}
【0029】
なお、機械学習モデルとして機能するプログラムは、記憶部12に記憶されているものとするが、これに限らない。出力データ取得部132は、機械学習モデルとして機能する外部装置に時系列データを送信し、外部機能から出力データを取得してもよい。
【0030】
重要度特定部133は、出力データ取得部132が取得した出力データが示す出力結果の算定に対する、時系列データ取得部131が取得した時系列データに含まれる複数のイベント発生データそれぞれの重要度を特定する。具体的には、重要度特定部133は、時系列データ取得部131が取得した時系列データをXAIモデルに入力し、XAIモデルから出力された重要度データを取得させることにより、時系列データ取得部131が取得した時系列データに含まれる複数のイベント発生データそれぞれの重要度を特定する。
【0031】
図4は、
図3に示す時系列データに対応する重要度データIを示す図である。
図4に示す重要度データIは、
図3に示すイベント発生データx
1~x
10それぞれに対応する重要度i
1~i
10を含んでいる。重要度の値が大きいほど、出力データYにおいて最も生起確率が高い行動「外出」の生起確率を増加させたことを意味する。
図3に示す時系列データXと
図4に示す重要度データIとから、出力データYにおける最も生起確率が高い行動「外出」に対し、イベント発生データx
5(リビング照明OFF)、x
6(リビングTVOFF)、x
8(玄関開閉OPEN)が重要なイベント発生データであると機械学習モデルが判定していることが確認できる。
【0032】
データ作成部134は、時系列データに含まれる2つのイベント発生データの発生順を入れ替えた時系列データである疑似時系列データを作成する。具体的には、データ作成部134は、複数のイベント発生データのうち、重要度特定部133により特定された重要度が相対的に高い2つのイベント発生データを特定し、当該2つのイベント発生データの発生順を入れ替えた疑似時系列データを作成する。
【0033】
例えば、データ作成部134は、複数のイベント発生データのうち、重要度特定部133により特定された重要度が相対的に高い3つ以上のイベント発生データを特定する。データ作成部134は、特定した3つ以上のイベント発生データの中から2つのイベント発生データを選択し、当該2つのイベント発生データの発生順を入れ替えた疑似時系列データを作成する。
【0034】
図5は、
図3、
図4に対応して作成された疑似時系列データPXを示す図である。
図3及び
図4に示す例では、イベント発生データx
5、x
6、x
8が重要であることから、データ作成部134は、例えば、
図5に示すように、イベント発生データx
6と、イベント発生データx
8とを入れ替えた疑似時系列データPXを作成する。
【0035】
データ作成部134は、特定した3つ以上のイベント発生データが取り得る2つのイベント発生データの組み合わせのそれぞれに対応して、複数の疑似時系列データを作成してもよい。重要度が高い2つのイベント発生データのイベント発生順は重要である確率が高いことから、情報処理装置1は、重要度が高い2つのイベント発生データに基づいて疑似時系列データを作成することにより、重要なイベントの発生順を効率的に特定することができる。
【0036】
なお、データ作成部134は、時系列データに含まれる複数のイベント発生データの中から2つのイベントデータの選択を受け付け、選択された2つのイベント発生データの発生順を入れ替えた疑似時系列データを作成してもよい。例えば、データ作成部134は、複数のイベント発生データをユーザ端末に表示させ、当該複数のイベント発生データのうち、2つ以上のイベントデータの選択を受け付けてもよい。そして、データ作成部134は、選択された2つ以上のイベント発生データが取り得る2つのイベント発生データの組み合わせのそれぞれに対応して、複数の疑似時系列データを作成してもよい。このようにすることで、ユーザは、自身が指定した2つ以上のイベントに対応するイベント発生順が重要であるかを確認することができる。
【0037】
また、データ作成部134は、重要度特定部133により特定された重要度が相対的に高い2つのイベント発生データを特定し、当該2つのイベント発生データの発生順を入れ替えた疑似時系列データを作成したが、これに限らない。データ作成部134は、重要度が相対的に低い2つのイベント発生データの発生順を入れ替えた疑似時系列データを作成してもよい。この場合、情報処理装置1は、重要度特定部133を有していなくてもよい。
【0038】
判定部135は、発生順を入れ替えた2つのイベント発生データに対応する、発生順を入れ替える前の発生順が、機械学習モデルにおける、生起確率が相対的に高いクラスの特定に対して重要であるか否かを判定する。
【0039】
具体的には、まず、判定部135は、出力データ取得部132に、データ作成部134が作成した疑似時系列データに対応する出力データである疑似出力データを取得させる。また、判定部135は、重要度特定部133に、出力データ取得部132に取得させた疑似出力データに対する、疑似時系列データに含まれる複数のイベント発生データそれぞれの重要度である疑似重要度を特定させる。そして、判定部135は、時系列データ取得部131が取得した時系列データに対応する出力データと疑似出力データとの差の内容、又は、重要度特定部133が特定した当該時系列データに対応する重要度と疑似重要度との差の内容に基づいて、当該時系列データに含まれる、2つのイベント発生データの発生順が重要であるか否かを判定する。
【0040】
初めに、判定部135が、時系列データ取得部131が取得した時系列データに対応する出力データと疑似出力データとの差の内容に基づいて、当該時系列データに含まれる、2つのイベント発生データの発生順が重要であるか否かを判定する例について説明する。判定部135は、機械学習モデルが分類モデルである場合、時系列データ取得部131が取得した時系列データに対応する出力データと疑似出力データとの差の内容に基づいて、当該時系列データに含まれる、2つのイベント発生データの発生順が重要であるか否かを判定する。
【0041】
判定部135は、時系列データ取得部131が取得した時系列データに対応する出力データに含まれる最も生起確率が高いクラスの生起確率と、疑似時系列データに対応する疑似出力データに含まれる当該クラスの生起確率との差分に基づいて、時系列データに含まれる、発生順を入れ替えた2つのイベント発生データの、発生順を入れ替える前の発生順が重要であるか否かを判定する。
【0042】
例えば、判定部135は、時系列データ取得部131が取得した時系列データに対応する出力データに含まれる最も生起確率が高いクラスの生起確率と、疑似時系列データに対応する疑似出力データに含まれる当該クラスの生起確率との差分が第1の閾値を超える場合に、時系列データに含まれる当該2つのイベント発生データの発生順が重要であると判定し、第1の閾値未満である場合に、当該発生順が出力データにおいて生起確率が高いクラスの生起確率を変化させず、重要ではないと判定する。
【0043】
例えば、判定部135は、出力データ取得部132に、
図5に示す疑似時系列データPXを機械学習モデルに入力させ、疑似出力データpYを取得させる。疑似出力データpYの一例を以下に示す。
疑似出力データpY={外出:0.4,睡眠:0.25,料理:0.05,食事:0.05,仕事:0.1,リラックス:0.15}
【0044】
出力データYと、疑似出力データpYとを比較すると、生起確率が最も高い行動「外出」の生起確率が0.2減少していることが確認できる。例えば、第1の閾値を0.1である場合、出力データYに含まれる最も生起確率が高い行動「外出」の生起確率(0.6)と、疑似時系列データpXに対応する疑似出力データpYに含まれる当該行動「外出」の生起確率(0.4)との差分が第1の閾値を超えることから、判定部135は、発生順が入れ替えられた2つのイベント発生データx6、x8の発生順(x6、x8の順に発生)が重要であると判定する。
【0045】
ここで、第1の閾値は固定値であることとしたが、これに限らない。判定部135は、例えば、出力データにおいて最も生起確率が高いクラスの生起確率に所定割合α1を乗算した値を第1の閾値としてもよい。例えば、所定割合α1を0.2とし、出力データYに対応する第1の閾値を算出する場合を考える。この場合、出力データYに含まれる最も生起確率が高い行動「外出」の生起確率は0.6であることから、判定部135は、0.6に0.2を乗算し、0.12を第1の閾値とする。このようにすることで、情報処理装置1は、出力データに含まれる最も高い生起確率に合わせて第1の閾値を設定することができる。
【0046】
続いて、判定部135が、時系列データ取得部131が取得した時系列データに対して重要度特定部133が特定した重要度と、疑似時系列データに対して重要度特定部133が特定した疑似重要度との差の内容に基づいて、当該時系列データに含まれる、2つのイベント発生データの発生順が重要であるか否かを判定する例について説明する。
【0047】
判定部135は、機械学習モデルが分類モデル又は回帰モデルである場合、時系列データ取得部131が取得した時系列データに対して重要度特定部133が特定した重要度と、疑似時系列データに対して重要度特定部133が特定した疑似重要度との差の内容に基づいて、当該時系列データに含まれる、2つのイベント発生データの発生順が重要であるか否かを判定する。
【0048】
判定部135は、時系列データ取得部131が取得した時系列データに対して重要度特定部133が特定した重要度のうち、発生順を入れ替えた2つのイベント発生データの発生順を入れ替える前の重要度の和である第1の和と、疑似重要度のうち、発生順を入れ替えた2つのイベント発生データの重要度の和である第2の和との差分に基づいて、時系列データに含まれる、発生順を入れ替えた2つのイベント発生データの、発生順を入れ替える前の発生順が重要であるか否かを判定する。
【0049】
具体的には、判定部135は、第1の和と第2の和との差分が第2の閾値を超える場合に、時系列データに含まれる当該2つのイベント発生データの発生順が重要であると判定し、第2の閾値未満である場合に、当該発生順が重要ではないと判定する。
【0050】
図6は、
図5に示す疑似時系列データPXに対応する疑似重要度データPIを示す図である。
図4に示す、発生順を入れ替えた2つのイベント発生データx
6、x
8に対応する重要度の和(第1の和)は、0.45であり、
図6に示す、発生順を入れ替えた2つのイベント発生データの重要度の和(第2の和)は、0.15である。第2の閾値を0.1とすると、第1の和と第2の和との差分は第2の閾値よりも大きいため、判定部135は、発生順が入れ替えられた2つのイベント発生データx
6、x
8の発生順(x
6、x
8の順に発生)が重要であると判定する。
【0051】
ここで、第2の閾値は、例えば固定値であることとしたが、これに限らない。判定部135は、例えば、第1の和に対して所定割合α2を乗算した値を第2の閾値としてもよい。例えば、所定割合α2を0.2とし、第1の和に対応する第2の閾値を算出する場合を考えると、判定部135は、第1の和(0.45)に0.2を乗算し、0.09を第2の閾値とする。このようにすることで、情報処理装置1は、重要度の大きさに合わせて第2の閾値を設定することができる。
【0052】
なお、判定部135は、時系列データ取得部131が取得した時系列データに対応する出力データと疑似出力データとの差の内容、又は、重要度特定部133が特定した当該時系列データに対応する重要度と疑似重要度との差の内容に基づいて、当該時系列データに含まれる、2つのイベント発生データの発生順が重要であるか否かを判定したが、これに限らない。
【0053】
判定部135は、機械学習モデルが分類モデルである場合、時系列データ取得部131が取得した時系列データに対応する出力データと疑似出力データとの差の内容と、重要度特定部133が特定した当該時系列データに対応する重要度と疑似重要度との差の内容とに基づいて、当該時系列データに含まれる、2つのイベント発生データの発生順が重要であるか否かを判定してもよい。
【0054】
例えば、判定部135は、時系列データ取得部131が取得した時系列データに対応する出力データに含まれる最も生起確率が高いクラスの生起確率と、疑似時系列データに対応する疑似出力データに含まれる当該クラスの生起確率との差分が第1の閾値を超えるか、第1の和と第2の和との差分が第2の閾値を超える場合に、当該時系列データに含まれる、2つのイベント発生データの発生順が重要であるか否かを判定してもよい。
【0055】
また、判定部135は、機械学習モデルが分類モデルである場合に、時系列データ取得部131が取得した時系列データに対応する出力データと疑似出力データとの差の内容に基づいて、時系列データに含まれる、2つのイベント発生データの発生順が重要であるか否かを判定することとしたが、これに限らない。判定部135は、機械学習モデルが回帰モデルであり、当該回帰モデルが出力する結果が数値である場合には、時系列データ取得部131が取得した時系列データに対応する出力データと疑似出力データとの差の内容に基づいて、2つのイベント発生データの発生順が重要であるか否かを判定してもよい。
【0056】
出力部136は、判定部135による判定結果を示す判定結果情報を出力する。例えば、出力部136は、時系列データの送信元のユーザ端末に判定結果情報を送信する。なお、出力部136は、判定部135による判定結果を示すファイルを記憶部12に出力してもよい。
【0057】
[本実施形態における効果]
以上の通り、本実施形態に係る情報処理装置1は、イベントの発生を示し、イベントIDを含むイベント発生データをイベントの発生順に並べた時系列データを取得し、時系列データの入力に対して複数のクラスそれぞれの生起確率を示す出力データを出力するモデルに、取得した前記時系列データを入力し、当該モデルが出力した出力データを取得する。情報処理装置1は、取得した時系列データに含まれる2つのイベント発生データの発生順を入れ替えた時系列データである疑似時系列データを当該モデルに入力し、当該モデルから出力された出力データである疑似出力データを取得する。情報処理装置1は、取得した時系列データに対応する出力データと、取得した疑似出力データとの差の内容に基づいて、時系列データに含まれる2つのイベント発生データの発生順が重要であるか否かを判定し、判定結果を出力する。このようにすることで、情報処理装置1は、イベントの発生順が重要であるかを提示することができる。
【0058】
なお、本発明により、国連が主導する持続可能な開発目標(SDGs)の目標9「産業と技術革新の基盤をつくろう」に貢献することが可能となる。
【0059】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。
【符号の説明】
【0060】
1 情報処理装置
11 通信部
12 記憶部
13 制御部
131 時系列データ取得部
132 出力データ取得部
133 重要度特定部
134 データ作成部
135 判定部
136 出力部