特開2022-162456 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電信電話株式会社の特許一覧 ▶ 国立大学法人京都大学の特許一覧

特開2022-162456学習方法、予測方法、学習装置、予測装置、及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2022162456

(43)【公開日】2022-10-24

(54)【発明の名称】学習方法、予測方法、学習装置、予測装置、及びプログラム

(51)【国際特許分類】

G06N 20/00 20190101AFI20221017BHJP

G06N 5/04 20060101ALI20221017BHJP

【ＦＩ】

G06N20/00

G06N5/04

【審査請求】未請求

【請求項の数】8

【出願形態】ＯＬ

(21)【出願番号】P 2021067324

(22)【出願日】2021-04-12

(71)【出願人】

【識別番号】000004226

【氏名又は名称】日本電信電話株式会社

(71)【出願人】

【識別番号】504132272

【氏名又は名称】国立大学法人京都大学

(74)【代理人】

【識別番号】100107766

【弁理士】

【氏名又は名称】伊東忠重

(74)【代理人】

【識別番号】100070150

【弁理士】

【氏名又は名称】伊東忠彦

(74)【代理人】

【識別番号】100124844

【弁理士】

【氏名又は名称】石原隆治

(72)【発明者】

【氏名】大川真耶

(72)【発明者】

【氏名】戸田浩之

(72)【発明者】

【氏名】鹿島久嗣

(57)【要約】

【課題】共通潜在因子を介した間接的な関係も考慮して、複数のドメインにおけるイベント系列を予測すること。
【解決手段】一実施形態に係る学習方法は、複数ドメインにおけるイベントの履歴を表すイベント履歴情報を取得する取得手順と、前記取得手順で取得されたイベント履歴情報を用いて、前記複数ドメイン間で共通する潜在状態の時間変化を表すブラックボックス関数の積分とトリガー関数との第１の合成関数と、前記ブラックボックス関数と、バックグラウンドレートとで表されるインテンシティ関数のパラメータを学習する学習手順と、をコンピュータが実行する。
【選択図】図２

【特許請求の範囲】

【請求項1】

複数ドメインにおけるイベントの履歴を表すイベント履歴情報を取得する取得手順と、
前記取得手順で取得されたイベント履歴情報を用いて、前記複数ドメイン間で共通する潜在状態の時間変化を表すブラックボックス関数の積分とトリガー関数との第１の合成関数と、前記ブラックボックス関数と、バックグラウンドレートとで表されるインテンシティ関数のパラメータを学習する学習手順と、
をコンピュータが実行する学習方法。

【請求項2】

前記トリガー関数と前記バックグラウンドレートは、前記ドメインごとに異なる、請求項１に記載の学習方法。

【請求項3】

前記ブラックボックス関数の積分はニューラルネットワーク関数である、請求項１又は２に記載の学習方法。

【請求項4】

前記学習手順は、
前記トリガー関数と前記ブラックボックス関数との第２の合成関数と、前記ブラックボックス関数との積の積分を変数変換により解析的に解くことで、前記第２の合成関数と前記ブラックボックス関数との積の積分と、前記バックグラウンドレートとで構成される尤度を最小化し、前記インテンシティ関数のパラメータを学習する、請求項１乃至３の何れか一項に記載の学習方法。

【請求項5】

【請求項6】

複数ドメインにおけるイベントの履歴を表すイベント履歴情報を取得する取得部と、
前記取得部で取得されたイベント履歴情報を用いて、前記複数ドメイン間で共通する潜在状態の時間変化を表すブラックボックス関数の積分とトリガー関数との第１の合成関数と、前記ブラックボックス関数と、バックグラウンドレートとで表されるインテンシティ関数のパラメータを学習する学習部と、
を有する学習装置。

【請求項7】

【請求項8】

コンピュータに、請求項１乃至４の何れか一項に記載の学習方法、又は、請求項５に記載の予測方法、を実行させるプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、学習方法、予測方法、学習装置、予測装置、及びプログラムに関する。

【背景技術】

【0002】

イベント系列のモデル化には、点過程と呼ばれる確率モデルが広く用いられている。点過程は微小区間におけるイベントの発生数を記述するためのモデルで、「インテンシティ関数」を用いて任意の時刻におけるイベントの発生確率を記述する。

【0003】

イベント系列の中でも、特に犯罪、金融取引、デモやストライキの発生履歴等といったイベント系列は「伝播性」を持つことが知られている。伝播性とは或るイベントが別のイベントを引き起こし、そのイベントがまた別のイベントを引き起こすという事象が連鎖的に続く、といった性質のことである。例えば、或る地域でデモが起きるとそれに呼応して別のデモが起き、そのデモが更に別の地域に広がっていく、といった現象は伝播性を持つイベント系列で表される。このような伝播性を持つイベント系列のモデル化にはＨａｗｋｅｓ過程が広く用いられている。Ｈａｗｋｅｓ過程は点過程の一種であり、伝播のメカニズムをカーネル関数と呼ばれる関数でモデル化することで、伝播性を持つイベント系列を記述することができる。

【0004】

ここで、通常、Ｈａｗｋｅｓ過程は単一ドメインへの適用に焦点を当てたもので、複数のドメインにおけるイベント系列のモデル化にはそのまま適用することができない。これに対して、複数のドメインにおけるイベント系列のモデル化を可能とした「マルチタスクＨａｗｋｅｓ過程」というモデルが提案されている（非特許文献１）。

【先行技術文献】

【非特許文献】

【0005】

【非特許文献1】Luo, Dixin, et al. Multi-task multi-dimensional hawkes processes for modeling event sequences. (2015).

【発明の概要】

【発明が解決しようとする課題】

【0006】

しかしながら、上記の非特許文献１で提案されているモデルは、或るドメインにおいてイベントが発生した際、それに応じて別のドメインでのイベント発生確率が高まる、という強い仮定を置いている。そのため、複数のドメイン間の共通潜在因子を介した間接的な関係を記述することができない。一方で、実際には、ドメインごとのイベントの発生確率は共通潜在因子を介して間接的に関係していると考えられる。例えば、犯罪と金融取引という異なるドメインにおける２つのイベントは、景気の変化という共通潜在因子を介して関係していると考えられる。

【0007】

本発明の一実施形態は、上記の点に鑑みてなされたもので、共通潜在因子を介した間接的な関係も考慮して、複数のドメインにおけるイベント系列を予測することを目的とする。

【課題を解決するための手段】

【0008】

上記目的を達成するため、一実施形態に係る学習方法は、複数ドメインにおけるイベントの履歴を表すイベント履歴情報を取得する取得手順と、前記取得手順で取得されたイベント履歴情報を用いて、前記複数ドメイン間で共通する潜在状態の時間変化を表すブラックボックス関数の積分とトリガー関数との第１の合成関数と、前記ブラックボックス関数と、バックグラウンドレートとで表されるインテンシティ関数のパラメータを学習する学習手順と、をコンピュータが実行する。

【発明の効果】

【0009】

共通潜在因子を介した間接的な関係も考慮して、複数のドメインにおけるイベント系列を予測することができる。

【図面の簡単な説明】

【0010】

【図1】イベント履歴情報の一例を示す図である。

【図2】本実施形態に係るイベント予測装置の全体構成の一例を示す図である。

【図3】本実施形態に係るパラメータ学習処理の一例を示すフローチャートである。

【図4】本実施形態に係る予測処理の一例を示すフローチャートである。

【図5】本実施形態に係るイベント予測装置のハードウェア構成の一例を示す図である。

【発明を実施するための形態】

【0011】

以下、本発明の一実施形態について説明する。本実施形態では、共通潜在因子を介した複数ドメイン間の間接的な関係も考慮した点過程モデルを構築し、この点過程モデルにより複数ドメイン間におけるイベントの発生を予測するイベント予測装置１０について説明する。

【0012】

ここで、点過程モデルは一般に「インテンシティ関数」（又は「強度関数」）と呼ばれる関数で記述され、このインテンシティ関数はイベントの発生確率を表す。本実施形態では、潜在状態の変化を表す関数を導入し、それを用いてＨａｗｋｅｓ過程のインテンシティ関数を記述することで、複数ドメイン間の共通潜在因子を介した間接的な関係を考慮できるようにする。これにより、複数ドメインにおけるイベント系列の正確なモデル化が可能となり、未来のイベントの発生を高い精度で予測できるようになる。

【0013】

＜理論的構成＞
まず、本実施形態の理論的構成について説明する。本実施形態では、時刻ｔ_１から時刻ｔ_Ｎまでのイベントの履歴を表すイベント履歴情報が与えられるものとする。イベント履歴情報は時刻の系列で表されるデータであり、例えば、犯罪の発生履歴、金融取引の履歴、デモやストライキの発生履歴等を表すデータである。以下、イベント予測装置１０で解析対象となるイベント履歴情報を

【0014】

【数1】

と表す。ここで、ｔ_ｉは時刻（イベント発生時刻）、ｍ_ｉは時刻ｔ_ｉに発生したイベントのドメイン、Ｎはデータ数（イベント数）である。また、ドメインの数をＭとする。

【0015】

イベント履歴情報の具体例を図１に示す。図１に示す例は、ドメイン「犯罪」のイベント系列と、ドメイン「金融取引」のイベント系列と、ドメイン「ストライキ」のイベント系列とで構成されるイベント履歴情報である。すなわち、図１に示すイベント履歴情報｛（ｔ_ｉ，ｍ_ｉ）｝は、各ｉ＝１，・・・，Ｎに対して、時刻ｔ_ｉにドメインｍ_ｉ∈｛犯罪，金融取引，ストライキ｝のイベントが発生したことを表している。

【0016】

このとき、本実施形態では、与えられたイベント履歴情報を用いて、点過程モデルのパラメータを学習する。

【0017】

一般的な点過程モデルの手続きに従い、まずインテンシティ関数の設計を行う。インテンシティ関数は単位時間当たりにイベントが発生（又は生成）する確率を表す関数である。

【0018】

本実施形態では、ドメインｍのインテンシティ関数λ_ｍ（・）を以下の式（１）で表す。

【0019】

【数2】

ここで、μ_ｍは「バックグラウンドレート」と呼ばれ、過去のイベントに依らないイベントの発生確率を表す。本実施形態では、簡単のため、時間変化しない定数μ_ｍを用いるが、以下の説明はμ_ｍが時間に依存して変化する場合にも容易に一般化することが可能である。また、ｇ_ｍ（・）は既存のＨａｗｋｅｓ過程モデルで用いられるトリガー関数であり、例えば、指数減衰関数、ワイブル分布、ガンマ分布等が広く用いられている。本実施形態では、ドメインｍごとに異なるバックグラウンドレートとトリガー関数を仮定する。ｆ（ｔ）は潜在状態の時間変化を表す任意のブラックボックス関数であり、例えば、景気の変化等を表す。上記の式（１）に示す定式化は、犯罪や金融取引等の複数ドメインにまたがるイベントの発生が共通の潜在状態ｆ（ｔ）によって時間変化するという仮定に基づいている。

【0020】

【数3】

は現在時刻ｔと過去のイベントの発生時刻ｔ_ｊに依存する関数であり、以下の式（２）でモデル化される。

【0021】

【数4】

ここで、Ｆ（ｔ）は潜在状態の時間変化を表す関数ｆ（ｔ）の積分である。本実施形態では、Ｆ（ｔ）をニューラルネットワークによりモデル化する。この定式化により、尤度関数をニューラルネットワーク関数Ｆ（ｔ）とその微分ｆ（ｔ）のみを用いて書き下すことが可能になる。

【0022】

時刻Ｔまでのイベント系列

【0023】

【数5】

が与えられたとき、本実施形態における点過程モデルの尤度Ｌは以下の式（３）のように書き下すことができる。

【0024】

【数6】

Ｈａｗｋｅｓ過程の学習においては、上記の式（３）のΛ_ｉに含まれる積分が問題になる。ニューラルネットワーク関数を含む関数の積分は一般に困難であるが、上記の式（１）及び（２）の定式化によりΛ_ｉの積分を解析的に解くことができる。すなわち、ｘ＝Ｆ（ｔ）－Ｆ（ｔ_ｊ）と変数変換を行うことで、ｆ（ｔ）ｄｔ＝ｄｘの置き換えが可能になる。これをΛ_ｉに代入することで、以下の式（４）が得られる。

【0025】

【数7】

ここで、Ｇ_ｍ（・）はトリガー関数ｇ_ｍ（・）の積分であり、指数減衰関数、ワイブル分布、ガンマ分布等の多くのトリガー関数ｇ_ｍ（・）について解析解が得られる。

【0026】

そして、学習時には、上記の式（３）に示す尤度Ｌを最小化するようなニューラルネットワーク関数ｆ（・）のパラメータを推定する。なお、パラメータの最適化には既知の任意の最適化手法を用いればよい。上記の式（３）に示す尤度Ｌは全てのパラメータに関して微分可能であるため、例えば、勾配法等を用いて最適化することができる。なお、尤度Ｌの微分は、例えば、誤差逆伝播法等により計算することができる。

【0027】

＜全体構成＞
次に、本実施形態に係るイベント予測装置１０の全体構成について、図２を参照しながら説明する。図２は、本実施形態に係るイベント予測装置１０の全体構成の一例を示す図である。

【0028】

図２に示すように、本実施形態に係るイベント予測装置１０は、取得部１０１と、パラメータ学習部１０２と、指定受付部１０３と、予測部１０４と、出力部１０５と、パラメータ記憶部１０６とを有する。

【0029】

取得部１０１は、イベント予測装置１０と通信ネットワークを介して接続されるイベント履歴情報格納装置２０からイベント履歴情報を取得する。

【0030】

ここで、イベント履歴情報格納装置２０は、例えば、イベント履歴情報を格納するＷｅｂサーバやデータベースサーバ等である。なお、イベント履歴情報格納装置２０に格納されるイベント履歴情報の操作（登録、削除、修正等）は、例えば、イベント履歴情報格納装置２０と通信ネットワークを介して接続される端末（この端末は、イベント予測装置１０であってもよいし、イベント履歴情報格納装置２０自身であってもよい）等を用いて行うことが可能である。

【0031】

パラメータ学習部１０２は、取得部１０１によって取得されたイベント履歴情報を用いて、上記の式（１）に示すインテンシティ関数λ_ｍ（ｔ）のパラメータ（つまり、このインテンシティ関数λ_ｍ（ｔ）に組み込まれているニューラルネットワーク関数ｆ（ｔ）のパラメータ）を学習する。このとき、パラメータ学習部１０２は、既知の任意の最適化手法（例えば、勾配法等）により、上記の式（３）に示す尤度Ｌを最小化させることで、当該パラメータを学習する。パラメータ学習部１０２によって学習されたパラメータ（学習済みパラメータ）は、パラメータ記憶部１０６に格納される。

【0032】

指定受付部１０３は、学習済みパラメータが設定されたインテンシティ関数λ_ｍ（ｔ）を用いてドメインｍにおけるイベントの発生を予測する際に、予測対象となる時刻の指定を受け付ける。なお、例えば、イベントの種類等によっては時刻以外の情報の指定が受け付けられてもよい（例えば、犯罪の発生を予測する場合は、予測対象とする地域を示す情報の指定が受け付けられてもよい。）。

【0033】

予測部１０４は、学習済みのパラメータが設定されたインテンシティ関数λ_ｍ（ｔ）を用いて、指定受付部１０３が受け付けた時刻におけるイベントの発生を予測する。このとき、予測部１０４は、例えば、予測対象となる時刻までのイベントの発生確率を当該インテンシティ関数λ_ｍ（ｔ）により計算して、点過程シミュレーションを行うことでイベントの発生を予測する。なお、点過程シミュレーションを行う手法は様々なものが存在するが、例えば、thinningと呼ばれる手法を用いることができる。thinningについては、例えば、参考文献「OGATA, Yosihiko. On Lewis' simulation method for point processes. IEEE Transactions on Information Theory, 1981, 27.1: 23-31.」等を参照されたい。

【0034】

出力部１０５は、予測部１０４による予測結果を出力する。なお、出力部１０５は任意の出力先に当該出力結果を出力すればよい。例えば、出力部１０５は、予測結果をディスプレイ等に表示してもよいし、補助記憶装置等の記憶領域に格納してもよいし、プリンタ等から印刷してもよいし、スピーカ等から音として出力してもよいし、通信ネットワークを介して外部の装置に送信してもよい。

【0035】

なお、図２に示すイベント予測装置１０の構成は一例であって、他の構成であってもよい。例えば、イベント履歴情報格納装置２０からイベント履歴情報を取得するのではなく、イベント予測装置１０が、これらのイベント履歴情報を保持していてもよい。また、例えば、イベント予測装置１０は、後述するパラメータ学習処理を実行する装置（学習装置）と、後述する予測処理を実行する装置（予測装置）とで構成されていてもよい。

【0036】

＜パラメータ学習処理＞
次に、上記の式（１）に示すインテンシティ関数λ_ｍ（ｔ）のパラメータ（つまり、ニューラルネットワーク関数ｆ（ｔ）のパラメータ）を学習する処理の流れについて、図３を参照しながら説明する。図３は、本実施形態に係るパラメータ学習処理の一例を示すフローチャートである。

【0037】

まず、取得部１０１は、イベント履歴情報格納装置２０からイベント履歴情報を取得する（ステップＳ１０１）。なお、このとき、イベント予測装置１０のユーザは、例えば、イベント履歴情報として取得される範囲（例えば時間的な範囲、場所的な範囲等）を指定してもよい。

【0038】

次に、パラメータ学習部１０２は、上記のステップＳ１０１で取得されたイベント履歴情報を用いて、上記の式（１）に示すインテンシティ関数λ_ｍ（ｔ）のパラメータを学習する（ステップＳ１０２）。このとき、パラメータ学習部１０２は、既知の任意の最適化手法により、上記の式（３）に示す尤度Ｌを最小化させることで、上記の式（１）に示すインテンシティ関数λ_ｍ（ｔ）のパラメータを学習する。

【0039】

そして、パラメータ学習部１０２は、上記のステップＳ１０２で学習されたパラメータ（学習済みパラメータ）をパラメータ記憶部１０６に格納する（ステップＳ１０３）。これにより、共通潜在因子を介した複数ドメイン間の間接的な関係を考慮することが可能となり、学習済みパラメータを設定したインテンシティ関数λ_ｍ（ｔ）によってドメインｍにおけるイベントの発生を高い精度で予測することが可能となる。

【0040】

＜予測処理＞
次に、学習済みパラメータが設定されたインテンシティ関数λ_ｍ（ｔ）を用いてドメインｍにおけるイベントの発生を予測する処理の流れについて、図４を参照しながら説明する。図４は、本実施形態に係る予測処理の一例を示すフローチャートである。

【0041】

まず、指定受付部１０３は、予測対象となる時刻の指定を受け付ける（ステップＳ２０１）。なお、予測対象となる時刻は、例えば、イベント予測装置１０のディスプレイに表示されたＵＩ（ユーザインタフェース）上でユーザが指定することができる。また、このとき、特定のドメインｍのみを予測対象とする場合は、そのドメインｍの指定を受け付けてもよい。

【0042】

次に、予測部１０４は、パラメータ記憶部１０６に記憶されている学習済みのパラメータが設定されたインテンシティ関数λ_ｍ（ｔ）を用いて、上記のステップＳ２０１で受け付けられた時刻におけるイベントの発生を予測する（ステップＳ２０２）。

【0043】

そして、出力部１０５は、上記のステップＳ２０２における予測結果を、予め決められた出力先に出力する（ステップＳ２０３）。

【0044】

＜ハードウェア構成＞
最後に、本実施形態に係るイベント予測装置１０のハードウェア構成について、図５を参照しながら説明する。図５は、本実施形態に係るイベント予測装置１０のハードウェア構成の一例を示す図である。

【0045】

図５に示すように、本実施形態に係るイベント予測装置１０は一般的なコンピュータ又はコンピュータシステムで実現され、入力装置３０１と、表示装置３０２と、外部Ｉ／Ｆ３０３と、通信Ｉ／Ｆ３０４と、プロセッサ３０５と、メモリ装置３０６とを有する。これら各ハードウェアは、それぞれがバス３０７を介して通信可能に接続されている。

【0046】

入力装置３０１は、例えば、キーボードやマウス、タッチパネル等である。表示装置３０２は、例えば、ディスプレイ等である。なお、イベント予測装置１０は、入力装置３０１及び表示装置３０２のうちの少なくとも一方を有していなくてもよい。

【0047】

外部Ｉ／Ｆ３０３は、外部装置とのインタフェースである。外部装置には、記録媒体３０３ａ等がある。イベント予測装置１０は、外部Ｉ／Ｆ３０３を介して、記録媒体３０３ａの読み取りや書き込み等を行うことができる。記録媒体３０３ａには、例えば、イベント予測装置１０が有する各機能部（取得部１０１、パラメータ学習部１０２、指定受付部１０３、予測部１０４及び出力部１０５等）を実現する１以上のプログラムが格納されていてもよい。

【0048】

なお、記録媒体３０３ａには、例えば、ＣＤ（Compact Disc）、ＤＶＤ（Digital Versatile Disk）、ＳＤメモリカード（Secure Digital memory card）、ＵＳＢ（Universal Serial Bus）メモリカード等がある。

【0049】

通信Ｉ／Ｆ３０４は、イベント予測装置１０を通信ネットワークに接続するためのインタフェースである。イベント予測装置１０は、通信Ｉ／Ｆ３０４を介して、イベント履歴情報格納装置２０からイベント履歴情報を取得することができる。なお、イベント予測装置１０が有する各機能部を実現する１以上のプログラムは、通信Ｉ／Ｆ３０４を介して、所定のサーバ装置等から取得（ダウンロード）されてもよい。

【0050】

プロセッサ３０５は、例えば、ＣＰＵ（Central Processing Unit）やＧＰＵ（Graphics Processing Unit）等の各種演算装置である。イベント予測装置１０が有する各機能部は、メモリ装置３０６等に格納されている１以上のプログラムがプロセッサ３０５に実行させる処理により実現される。

【0051】

メモリ装置３０６は、例えば、ＨＤＤ（Hard Disk Drive）やＳＳＤ（Solid State Drive）、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、フラッシュメモリ等の各種記憶装置である。イベント予測装置１０が有するパラメータ記憶部１０６は、メモリ装置３０６を用いて実現可能である。

【0052】

本実施形態に係るイベント予測装置１０は、図５に示すハードウェア構成を有することにより、上述したパラメータ学習処理及び予測処理を実現することができる。なお、図５に示すハードウェア構成は一例であって、イベント予測装置１０は、他のハードウェア構成を有していてもよい。例えば、イベント予測装置１０は、複数のプロセッサ３０５を有していてもよいし、複数のメモリ装置３０６を有していてもよい。

【0053】

本発明は、具体的に開示された上記の実施形態に限定されるものではなく、特許請求の範囲の記載から逸脱することなく、種々の変形や変更、既知の技術との組み合わせ等が可能である。

【符号の説明】

【0054】

１０イベント予測装置
２０イベント履歴情報格納装置
１０１取得部
１０２パラメータ学習部
１０３指定受付部
１０４予測部
１０５出力部
１０６パラメータ記憶部
３０１入力装置
３０２表示装置
３０３外部Ｉ／Ｆ
３０３ａ記録媒体
３０４通信Ｉ／Ｆ
３０５プロセッサ
３０６メモリ装置
３０７バス

【図1】

【図2】

【図3】

【図4】

【図5】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版