(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-11-20
(45)【発行日】2023-11-29
(54)【発明の名称】モデル推定装置、モデル推定方法及びモデル推定プログラム
(51)【国際特許分類】
G06N 20/00 20190101AFI20231121BHJP
【FI】
G06N20/00
(21)【出願番号】P 2022561174
(86)(22)【出願日】2021-04-12
(86)【国際出願番号】 JP2021015200
(87)【国際公開番号】W WO2021210543
(87)【国際公開日】2021-10-21
【審査請求日】2022-10-06
(31)【優先権主張番号】10202003373S
(32)【優先日】2020-04-13
(33)【優先権主張国・地域又は機関】SG
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100103894
【氏名又は名称】家入 健
(72)【発明者】
【氏名】宇野 裕
(72)【発明者】
【氏名】リオン ユー チョン レイモンド
(72)【発明者】
【氏名】ソー ニ ニ
(72)【発明者】
【氏名】チョイ チ ヒン チャールズ
【審査官】児玉 崇晶
(56)【参考文献】
【文献】FUJIMAKI Ryohei, MORINAGA Satoshi,The Most Advanced Data Mining of the Big Data Era,NEC Technical Journal[online],2012年09月30日,月[retreived on 2023.10.04], Retrieved from the Internet: <URL: https://www.nec.com/en/global/techrep/journal/g12/n02/pdf/120219.pdf>
【文献】LIU Zhenqiu, SUN Fengzhu, MCGOVERN Dermot P.,Sparse generalized linear model with L0 approximation for feature selection and prediction with big omics data,BioData Mining[online],2017年12月19日,[retreived on 2023.10.04], Retrieved from the Internet: <URL: https://biodatamining.biomedcentral.com/articles/10.1186/s13040-017-0159-z><DOI: https://doi.org/10.1186/s13040-017-0159-z>
(58)【調査した分野】(Int.Cl.,DB名)
G06N 20/00
(57)【特許請求の範囲】
【請求項1】
モデル推定装置であって、
局所モデルに関する入力を受信すると、前記局所モデルに対応する関数を決定するように構成された局所モデル設定部と、
モデル推定のパラメータを最適化するための、受信した前記入力に関連する前記局所モデルの形状情報を用いて、修正された前記局所モデルの正則化項を算出する正則化項算出部と、
前記局所モデルの修正された正則化項に基づいて、
前記モデル推定のパラメータを最適化するように構成された局所モデル最適化部とを含
む、
モデル推定装置。
【請求項2】
前記修正された正則化項を用いて、潜在変数の可変確率を算出するように構成された可変確率算出部をさらに含む、請求項1に記載のモデル推定装置。
【請求項3】
前記潜在変数の可変確率に基づいて、潜在状態の数を算出及び設定するように構成されたブランチ削除部をさらに含む、請求項2に記載のモデル推定装置。
【請求項4】
前記局所モデルの前記修正された正則化項を用いて、前記
モデル推定のパラメータに含まれる1の基準値が収束したか判定するように構成された最適化判定部をさらに含む、請求項
1~3のいずれか1項に記載のモデル推定装置。
【請求項5】
前記局所モデルを決定するように構成された階層潜在構造設定部をさらに含むことを特徴とする、請求項1
~4のいずれか1項に記載のモデル推定装置。
【請求項6】
前記局所モデルの前記修正された正則化項を用いて、前記モデル推定のパラメータを分類するように構成されたゲーティング関数最適化部をさらに含む、請求項1
~5のいずれか1項に記載のモデル推定装置。
【請求項7】
最適化判定部が、前記
モデル推定のパラメータに含まれる1の基準値が収束したと判定するまで、ループ処理が繰り返し実行され、
前記ループ処理では、可変確率算出部が潜在変数の可変確率を算出し、ブランチ削除部が潜在状態の数を算出及び設定し、前記局所モデル最適化部が前記潜在変数を最適化し、ゲーティング関数最適化部が前記モデル推定のパラメータを分類し、前記最適化判定部が、前記基準値が収束したか判定する、請求項1~
6のいずれか1項に記載のモデル推定装置。
【請求項8】
前記局所モデルの前記形状情報は、前記局所モデルの指数型分布族の分布の形状を示す情報であることを特徴とする、請求項1
~7のいずれか1項に記載のモデル推定装置。
【請求項9】
モデル推定方法であって、
コンピュータが
局所モデルに関する入力を受信し、
前記入力を受信すると、前記局所モデル
に対応する関数を決定し、
モデル推定のパラメータを最適化するための、受信した前記入力に関連する前記局所モデルの形状情報を用いて、修正された前記局所モデルの正則化項を算出し、
前記局所モデルの修正された正則化項に基づいて、
前記モデル推定のパラメータを最適化することを含
む、
モデル推定方法。
【請求項10】
モデル推定プログラムであって、コンピュータに対し、
局所モデルに関する入力を受信するステップと、
前記入力を受信すると、前記局所モデルに対応する関数を決定するステップと、
モデル推定のパラメータを最適化するための、受信した前記入力に関連する前記局所モデルの形状情報を用いて、修正された前記局所モデルの正則化項を算出するステップと、
前記局所モデルの修正された正則化項に基づいて、前記モデル推定のパラメータを最適化するステップとを実行させる、モデル推定プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、モデル推定装置及びモデル推定方法に関する。
【背景技術】
【0002】
線形回帰は、スカラー応答(又は従属変数)と1以上の独立変数との関係をモデル化する手法である。予測モデルを、従属変数及び独立変数の観測データセットの値に合わせるようにトレーニングすることにより、線形回帰を用いて、エラーを予測、予想、又は削減できる。線形回帰の適用例には、ビジネス分析のための傾向予測、病気のリスクの推定や病気の予防等の疫学、金融における資産の価格設定モデル、消費支出の予測、労働の需要及び供給、人工知能による機械学習が含まれる。
【発明の概要】
【発明が解決しようとする課題】
【0003】
しかしながら、線形回帰には、いくつかの課題がある。例えば、線形回帰は非常に単純であるため、現実世界から収集されたデータセットのうちの複数の変数の間の潜在的な関係の大部分を説明することができない。このような場合、線形回帰の予測はは、不十分なものとなる。この課題を解決すべく、より複雑なモデルと、その学習アルゴリズムを用いた様々な方法が提案されている。
【0004】
最新の方法の1つは、異種混合学習(HML:Heterogeneous Mixture Learning)である。それは、区分疎線形モデル(sparse piecewise linear model)と、因数分析された漸近ベイジアン学習で構成され、それぞれ統計モデルと、その学習アルゴリズムである。HMLには、例えば、現実世界の複雑なデータセットに対する、解釈可能性、高い計算効率(スケーラビリティ)、高い表現力等のいくつかの優れた特性がある。しかしながら、HMLでは、予測誤差の分布が、ガウス分布、すなわち、対称な連続分布であるとの仮定を前提とする。これは、HMLが、ポアソン分布に属する応答変数、例えば、負でない非対称の離散分布に該当する運転手のリスクのプロファイルにおける事故件数等について、常に最適な予測が行われるとは限らないことを意味する。したがって、HMLは、事故を評価する運転手のリスクのプロファイルにおいて最適な予測をするために修正する必要がある。
【0005】
したがって、上述した課題の少なくとも一部を解決するモデル推定装置及びモデル推定方法を提供する必要がある。
【課題を解決するための手段】
【0006】
本発明の第1の態様によれば、モデル推定装置が提供される。モデル推定装置は、局所モデルに関する入力を受信すると、局所モデルに対応する関数を決定するように構成された局所モデル設定部と、局所モデルの修正された正則化項に基づいて、モデル推定のパラメータを最適化するように構成された局所モデル最適化部とを含み、局所モデルの修正された正則化項は、モデル推定のパラメータを最適化するための、受信した関するモデルの形状情報を用いて修正される。
【0007】
一実施形態では、モデル推定装置は、修正された正則化項を用いて、潜在変数(latent variable)の可変確率(variational probability)を算出するように構成された可変確率算出部をさらに含み得る。
【0008】
一実施形態では、モデル推定装置は、潜在変数の可変確率に基づいて、潜在状態の数を算出及び設定するように構成されたブランチ削除部をさらに含み得る。
【0009】
一実施形態では、モデル推定パラメータは1つの基準値を含む。
【0010】
一実施形態では、モデル推定装置は、局所モデルの修正された正則化項を用いて、基準値が収束したか判定するように構成された最適化判定部をさらに含み得る。
【0011】
一実施形態では、モデル推定装置は、局所モデルを決定するように構成された階層潜在構造設定部をさらに含み得る。
【0012】
一実施形態では、モデル推定装置は、局所モデルの修正された正則化項を用いて、モデル推定のパラメータを分類するように構成されたゲーティング関数最適化部をさらに含み得る。
【0013】
一実施形態では、最適化判定部が、基準値が収束したと判定するまで、ループ処理が繰り返し実行される。ループ処理では、可変確率算出部が潜在変数の可変確率を算出し、ブランチ削除部が潜在状態の数を算出及び設定し、局所モデル最適化部がモデル推定パラメータを最適化し、ゲーティング関数最適化部がモデル推定のパラメータを分類し、最適化判定部が、基準値が収束したか判定する。
【0014】
一実施形態では、可変確率算出部は、局所モデルに関連する受信した入力に基づいて、修正された正則化項を算出する正則化項算出部を含む。
【0015】
本発明の第2の態様によれば、モデル推定方法が提供される。モデル推定方法は、局所モデルに関連する入力を受信し、入力を受信すると、局所モデルの決定に対応する関数を決定し、局所モデルの修正された正則化項に基づいて、モデル推定のパラメータを最適化することを含み、局所モデルの修正された正則化項は、モデル推定のパラメータを最適化するための、受信した入力に関連する局所モデルの形状情報を用いて修正される。
【0016】
一実施形態では、モデル推定方法は、修正された正則化項を用いて潜在変数の可変確率を算出し、潜在変数の可変確率に基づいて潜在状態の数を算出及び設定し、局所モデルの修正された正則化項を用いてモデル推定のパラメータを分類し、局所モデルの修正された正則化項を用いて、基準値が収束したか判定することをさらに含み得る。
【0017】
一実施形態では、モデル推定方法は、局所モデルの情報に基づいて、修正された正則化項を算出することをさらに含み得る。
【図面の簡単な説明】
【0018】
添付図面は、同様の参照番号が、個別の図面の全体を通じて同じ構成要素又は機能的に類似する構成要素を示しており、また、以下の詳細な説明と共に、明細書に組み込まれ、明細書の一部を形成しており、さらに、様々な例示的な実施形態を示しており、さらに、非限定的な例である本発明の例示的な一実施形態の様々な原理及び利点を説明する。
【0019】
本発明の実施形態について、以下の図面を参照して、以下に説明する。
【0020】
【
図1】
図1は、例示的な実施形態に係るモデル推定装置における情報の流れを示す概略
図100である。
【
図2】
図2は、例示的な実施形態に係る
図1の階層潜在変数可変確率算出部110における情報の流れを示す概略
図200である。
【
図3A】
図3Aは、例示的な実施形態に係るモデル推定方法を示すフローチャート300である。
【
図3B】
図3Bは、例示的な実施形態に係るモデル推定方法を示すフローチャート300である。
【
図4】
図4は、例示的な実施形態に係る
図1のモデル推定装置を実現するのに適したコンピュータ装置400の概略図である。
【
図5】
図5は、例示的な実施形態に係る
図1のモデル推定装置の様々な機能部のための1つのユニットを実現する例示的なコンピュータ装置500である。
【発明を実施するための形態】
【0021】
以下の説明の一部は、コンピュータメモリ内のデータに関する処理のアルゴリズム及び機能的又は記号的な表現に関して、明示的又は暗黙的に示される。これらのアルゴリズムの説明及び機能的又は記号的な表現は、データ処理技術の当業者が自己の業務内容を他の当業者に最も効果的に伝えるために使用する手法である。ここで、アルゴリズムは一般に、所望の結果に繋がる矛盾のない一連のステップである。これらのステップは、例えば、保存、転送、結合、比較、及びその他の処理が可能な電気信号、磁気信号、又は光信号等の物理量の物理的な処理を必要とするステップである。
【0022】
特に明記しない限り、以下において明らかなように、本明細書の全体を通して、説明に用いる用語、例えば、「走査」、「計算(算出)」、「決定」、「置換」、「生成」、「初期化」、「出力」、「識別」、「許可」、「検証」等は、コンピュータシステム又は同様の電子装置の動作及び処理を意味することは理解されるであろう。このコンピュータシステム又は同様の電子装置は、コンピュータシステム内の物理量として表されるデータを処理し、及び、当該データを、コンピュータシステム、他のデータ記憶装置、伝送装置又は表示装置内の物理量として同様に表される他のデータに変換する。
【0023】
また、本明細書は、方法の処理を実行する装置を開示する。このような装置は、必要な目的のために特別に構築してもよく、又は、コンピュータに格納されたコンピュータプログラムによって選択的に起動又は再構成されるコンピュータ又は他の装置を備えてもよい。本明細書に示すアルゴリズム及び表示は、本質的に特定のコンピュータ又は他の装置に関するものではない。本明細書の教示によるプログラムを用いて様々なマシンを利用できる。代替的に、必要な方法のステップを実行する専用の装置を構築することが適切な場合もある。以下の説明から、コンピュータの構造が明らかとなるであろう。
【0024】
さらに、本明細書は、コンピュータプログラムも暗黙的に開示しており、本明細書に記載のモデル推定方法の個別のステップが、コンピュータコードによって実行され得ることは、当業者には明らかであろう。コンピュータプログラムは、特定のプログラミング言語及びその実装に限定されるものではない。様々なプログラミング言語及びそのコーディングを用いて、本明細書に開示の教示を実現できることは明らかであろう。さらに、コンピュータプログラムは、特定の制御フローに限定されるものではない。本開示の趣旨又は範囲から逸脱することなく、コンピュータプログラムの他の多くの変形例が存在し、異なる制御フローを使用することができる。
【0025】
さらに、コンピュータプログラムの1以上のステップを、連続ではなく、並行して実行できる。そのようなコンピュータプログラムは、任意のコンピュータ可読媒体に格納できる。コンピュータ可読媒体は、記憶装置、例えば、磁気ディスク、光ディスク、メモリチップ、又は、コンピュータとのインタフェース接続に適した他の記憶装置等を含み得る。また、コンピュータ可読媒体は、インターネットシステム等の有線媒体、又は、GSM携帯電話システム等の無線媒体を含み得る。コンピュータプログラムは、そのようなコンピュータにロードされて実行されると、好適な方法のステップを実行する装置を効果的に実現する。
【0026】
本発明の実施形態では、用語「部(機能部)」の使用は、単一のコンピュータ装置、又は、特定の機能を実現するために協働する相互接続された複数のコンピュータ装置のコンピュータネットワークの少なくとも1つを意味し得る。換言すると、部(機能部)は、単一のハードウェアユニットに含まれることがあり、また、いくつかの異なるハードウェアユニット又は多数の異なるハードウェアユニットに分散されることがある。
【0027】
図1は、例示的な実施形態に係るモデル推定装置100における情報の流れを示す概略図を示す。モデル推定装置100は、データ入力部102と、階層潜在構造設定部104と、局所モデル設定部106と、初期化部108と、階層潜在変数可変確率算出部110と、ブランチ削除部112と、局所モデル最適化部114と、ゲーティング関数最適化部116と、最適化判定部118と、モデル推定結果出力部120とを含む。
【0028】
モデル推定装置100は、データ入力部102を介して、モデルに関するデータを受信する。換言すると、データ入力部102は、画像取得装置又は入力装置等に提供又は入力された入力を受信することができる。入力データには、局所モデルの推定に必要なパラメータ、例えば、観測確率(observation probability)の種類、構成要素の数、及び潜在状態の数についての候補値が含まれ得る。また、入力データには、二分木の深さ等の階層潜在構造のパラメータが含まれ得る。代替的に、データ入力部102は、入力データを受信すると同時に、パラメータを入力し得る。局所モデルは、スパース性の制約を用いた一般化線形回帰等の回帰モデルとし得る。一般化線形回帰は、ほぼ全ての指数型分布族の誤差分布、例えば、ガウシアンモデル、ロジスティックモデル、ポアソンモデル、指数モデル等に対応し得る。受信データの分布に基づく他の種類のモデルが利用可能であることは理解されるであろう。
【0029】
階層潜在構造設定部104は、観測確率の種類と構成要素の数について、データ入力部102から受信した入力データから、階層潜在変数モデルの構造を、最適化の候補として選択及び設定するように構成される。本発明で使用する潜在構造は、設定された数の構成要素と深さの値とを有する木構造とし得る。階層潜在構造設定部104は、選択された階層潜在変数モデル構造を内部記憶装置に保存することができる。例えば、深さが2の木構造の二分木モデル(各ブランチノードが2つのブランチを有するモデル)の場合、階層潜在構造設定部104は、2つの第1のレベルノードと、4つの第2のレベルノード(この例示的な実施形態では最下位ノード)を有する階層潜在構造を選択する。別の実施形態では、潜在構造は、深さの各レベルにおいて3~4つの葉ノードを有する一般的な木構造でもよい。
【0030】
局所モデル設定部106は、階層潜在構造設定部104と協働するように構成される。様々な実施形態では、局所モデル設定部106は、データ入力部102が受信した入力に基づいて、局所モデルに対応する関数を決定するように構成される。これは、局所モデル設定部106が、各局所モデルの指数型分布族(exponential family)の特定の分布に対応する系統的なデータ及び情報を識別し、局所モデルの分布に対応する関数を決定することによって実現できる。系統的なデータは、局所モデルの平均μ、平均関数M(θ)、及びリンク関数g(T)を含み得る。この関数は、局所モデルに対応するA(θ)、A(θ)の2次導関数、フィッシャー情報行列F、又はそれらの数値近似によって表すことができる。自然指数型分布族(natural exponential family)の確率密度関数は、以下のように記述でき、
A(θ)は、分布の形状情報を含み得る。A(θ)の他の導関数、例えば、Aの2次導関数等は、Aの2次導関数及び形状情報を用いて正則化項(regularization term)が修正、改良又は精緻化されることを示す。数値近似の例では、データxが-1~1の場合、変数x
i及び変数x
jは、実質的に1に近似できる。これは、計算効率に効果的に寄与する。系統的なデータと、或る局所モデル関数の一例を、以下の表1に示す。
【表1】
【0031】
初期化部108は、階層潜在変数モデルを推定するための初期化処理を実行するように構成される。初期化処理は、モデルをより適切に最適化するためにモデルを決定する処理である。初期化は、任意の方法、例えば、各観測確率のパラメータθをランダムに設定する方法や、潜在変数の可変確率をランダムに設定する方法等によって行うことができる。例えば、初期化部108は、各構成要素について観測確率の種類をランダムに設定し、設定された種類に従って、各観測確率のパラメータをランダムに設定することができる。さらに、初期化部108は、階層潜在変数の最下位パスの可変確率をランダムに設定することができる。
【0032】
階層潜在変数可変確率算出部110は、修正された正則化項を用いて、階層潜在構造のパス潜在変数の可変確率を算出するように構成される。パラメータθは、初期化部108、又は、ブランチ削除部112、局所モデル最適化部114及びゲーティング関数最適化部116によって算出される。したがって、階層潜在変数可変確率算出部110は、パラメータθを用いて、可変確率を算出する。また、階層潜在変数可変確率算出部110は、完全変数についての推定値(例えば、最尤推定値又は最大事後確率推定値)に関する周辺対数尤度関数(marginal log-likelihood function)をラプラス近似して、その下限を最大化することにより、可変確率を算出することができる。最適化基準Aは、エキスパートの階層的混合(HME:hierarchical mixtures of expert)の数学的に扱いやすい下限の因子化情報量基準(FIC)を表すことができる。
【0033】
詳細には、最
適化基準Aは、最下位パスの潜在変数と構成要素のパラメータが与えられた場合に算出できる値である。限界対数尤度は、下記数式1で与えられる。
【数1】
ここで、正則化項(又は修正された正則化項)は、以下のように定義できる。
【数2】
上記数式では、yは応答変数を示し、xは入力変数を示し、zは潜在変数を示し、Nはサンプル数を示す。D
φjは、局所回帰モデルjの次元を示し、機械学習のAIの適応を改善するのに有利である。D
βiはゲート関数iの次元を示し、一方、z
jは潜在変数zのj番目の構成要素を示す。さらに、Eは、エキスパート、すなわち、局所回帰モデルの数を示し、q(z)は、潜在変数zの可変分布(variational distribution)を示す。θ
jは、局所モデルjのパラメータを示し、β
jは、ゲート関数iのパラメータを示し、φは、局所回帰モデルの一組のパラメータを示す。さらに、βは、バイナリゲート関数の一組のパラメータを示し、θは、一組のモデルパラメータ、例えば、β及びθを示す。さらに、A”は、A(θ)の2次導関数を示し、分布の形状に関する情報を有しており、正則化項の修正に主に寄与する。階層潜在変数可変確率算出部110の詳細な機能及び情報の流れを、
図2に示す。
【0034】
算出された可変確率は、可変確率に基づいて潜在状態の数を算出及び設定するように構成されたブランチ削除部112へ送られる。それを実現すべく、ブランチ削除部112は、下記数式4で定義されるF
φのランクを算出する。F
φは、下記数式4で定義されるF
φjのブロック行列である。Fのランクを算出する想定されるアルゴリズムの1つは、特異値分析(SVD)アルゴリズムを用いて、F
φの特異値σ
1≧σ
2…≧σ
K
(t-1)の数を計数する。そして、(Fのランクと等しい)潜在状態の数は、ブランチ削除部112が下記数式3を用いて設定する。
【数3】
例えば、σ
1=1、σ
2=0.9、…、σ
M=0.1、σ
K
(t-1)=0.0000001である。閾値デルタδ=0.1の場合、K’={1,2,…,M}及びK
(t)=max(K’)=Mである。
【数4】
【0035】
局所モデル最適化部114は、修正された局所モデルの正則化項に基づき、モデル推定のパラメータを最適化する。このパラメータは、1つの基準値を含むことができ、下記数式5を用いて最適化できる。
【数5】
したがって、この数式は、局所モデルに依存する。数式5のパラメータは、上記数式1及び数式2で定義される。
【0036】
次に、ゲーティング関数最適化部116は、局所モデル最適化部114によって推定されたモデルを用いて、ブランチノードリストを導出する。そして、ゲーティング関数最適化部116は、導出したブランチノードリストからブランチノードを1つ選択する。以下、選択されたノードを、選択ノードとも称する。ゲーティング関数最適化部116は、入力データと、階層潜在変数可変確率から得られた選択ノードの潜在変数可変確率とを用いて、選択ノードのブランチパラメータを最適化する。選択ノードのブランチパラメータは、上述したゲーティング関数に対応する。そして、ゲーティング関数最適化部116は、導出した全てのブランチノードを最適化したか否かを判定する。全てのブランチノードが最適化された場合、ゲーティング関数最適化部116は、処理を終了する。全てのブランチノードが最適化されていない場合、ゲーティング関数最適化部116は、処理を繰り返す。二分木階層モデルのベルヌーイ分布に基づくゲーティング関数を用いて、ゲーティング関数の具体例について以下に説明する。以下、ゲーティング関数をベルヌーイゲーティング関数とも称する。Xdを、Xのd番目の次元とし、g-を、この値が閾値wを超えないときに二分木の左下に分岐する確率とし、g+を、この値が閾値wを超えたときに二分木の左下に分岐する確率とする。ゲーティング関数最適化部116は、ベルヌーイ分布に基づき、上述した最適化パラメータd,w,g-,g+を最適化する。この場合、各パラメータは、典型的な階層潜在変数モデルの対数関数を用いたパラメータと異なり、解析解を有するため、最適化の高速化に寄与する。
【0037】
最適化判定部118は、局所モデルの修正された正則化項を用いて、パラメータの基準値が収束したか判定するように構成される。良好に収束することは、オーバーフィッティングの可能性が低いことを意味することは、理解されるであろう。最適化判定部118は、局所モデルクラスを拡張して、指数型分布族を含めることにより、これを実現することができる。この判定は、上述した数式1に基づいて行うことができる。
【0038】
具体的には、最適化判定部118は、上記数式2を用いて算出された最適化基準Aが収束したか否か判定する。最適化基準Aが収束していない場合、最適化判定部118は、階層潜在変数可変確率算出部110、ブランチ削除部112、局所モデル最適化部114、ゲーティング関数最適化部106及び最適化判定部118による処理が繰り返されるように、信号を階層潜在変数可変確率算出部110に送信する。例えば、最適化判定部118は、最適化基準Aの増加が既定の閾値未満である場合、最適化基準Aが収束したと判定できる。
【0039】
最適化判定部118が、基準値が収束したと判定した場合、モデル推定結果出力部120は、算出されたモデル推定結果を出力する。
【0040】
モデル推定結果出力装置120は、観測確率の種類と構成要素の数についての入力候補から設定された階層潜在変数モデル構造の候補のモデル最適化が終了した場合、隠れ状態(hidden state)の最適数、観測確率の種類、パラメータ、可変分布等を、モデル推定結果の出力結果として出力することができる。一方、最適化が終了していない候補がある場合、処理は、階層潜在構造設定部104による処理に進み、上述した同じ処理が実行される。
【0041】
図2は、階層潜在変数可変確率算出部110における情報の流れを示す概略図である。階層潜在変数可変確率算出部110は、正則化項設定部202と、最下位パス潜在変数可変確率算出部204と、階層設定部206と、正則化項算出部208と、上位パス潜在変数可変確率算出部210と、階層計算終了判定部212とを含む。一実施形態では、アルゴリズムは、階層潜在変数可変確率算出部110における情報の流れを実行するように構成され得る。例えば、アルゴリズムは、収束まで、潜在変数(例えば、q(z))を更新し、構成要素の数を更新し、ゲート関数の最適化パラメータ(例えば、d、w、g
-及びg
+等)及び局所回帰モデルのパラメータ(例えば、φ)を更新するように構成され得る。
【0042】
階層潜在変数可変確率算出部110は、正則化項設定部202を介して、局所モデルの階層潜在構造に関するデータを受信し、正則化項設定部202は、修正された正則化項を設定する。正則化項設定部202は、親ノードと同じブランチノードを有する現在のレベルの潜在変数可変確率の合計を算出するように構成され得る。また、正則化項設定部202は、その合計を、直上に位置する上位のパス潜在変数可変確率として設定できる。修正された正則化項には、正則化項が、Aの導関数及び形状情報を用いて修正されたことを示すA(θ)の高次導関数(分布の形状情報を含む)が含まれ得る。特に、A(θ)は、分布の形状に関する情報を含む、分布に関する全ての情報を含むような分配関数(partition function)とし得る。次いで、最下位パス潜在変数可変確率算出部204が、最下位パス潜在変数の可変確率を算出する。そして、階層設定部206が、データを整理(organize)し、修正済正則化項算出部208が、修正された正則化項を算出する。修正された正則化項は、上記数式2を含み得る。
【0043】
潜在変数q(z)の分布は、下記数式6を用いて更新することができる。具体的には、この数式は、先行のループ、すなわちt-1における潜在変数の分布の局所モデル推定のパラメータφから潜在変数の分布を更新することができる。数式6のパラメータは、上記数式1及び数式2で定義される。
【数6】
【0044】
次いで、上位パス潜在変数可変確率算出部210は、最上位パス潜在変数の可変確率を算出し、階層計算終了判定部212は、最上位パス潜在変数の算出された可変確率が最大化されたか判定する。最上位パス潜在変数の算出された可変確率が最大化されたと判定された場合、階層計算終了判定部212は、算出された可変確率を出力する。一方、最上位パス潜在変数の算出された可変確率が最大化されていない場合、算出された可変確率が最大化されたと判定されるまで、階層計算終了判定部212は、処理を繰り返すために、信号を階層設定部206に送信する。
【0045】
モデル推定装置の一例について説明する。具体的には、モデル推定装置を、運転手のリスクを評価する場面に適用した例である。上述したモデル推定装置を利用することにより、事故件数と運転手のリスクとの関係を分析し、運転手のリスクをより適切に評価することができる。さらに、モデル推定装置を利用することにより、得られた複数の関係、例えば、運転手のリスクと事故件数との関係、運転手のリスクと職業との関係、運転手のリスクと天候との関係、運転手のリスクと日付との関係等の切り替えルールを推定できる。運転手のリスクの予測は、複数の関係を推定するだけでなく、これらの複数の関係の切り替え方法を推定することが重要である。例えば、気温、時間及び曜日の少なくとも1つを説明変数とし、1時間後の運転手のリスクを応答変数とする仮定の多項式回帰式が各構成要素に適用された階層型潜在変数モデルについて検討する。ここで推定されるモデルは、階層潜在構造、回帰パラメータ、及び最下位パス潜在変数可変分布である。まず、データ入力装置102は、複数の異なる木構造を、階層潜在構造の候補として、説明変数及び応答変数のデータと共に、モデル推定装置に入力する。階層潜在構造設定部104は、入力された木構造を順次設定する。次いで、初期化部108は、初期化処理として、設定された階層潜在構造について回帰度及び他のパラメータをランダムに設定する。そして、このモデルは、階層潜在変数可変確率算出部110から最適化判定部118までの処理によって推定される。これらの処理により、異なる状況を表す複数の回帰モデルと、その切り替えルールが、自動的に得られる。異なる状況を表す複数の回帰モデルの例には、例えば、ラッシュアワーの交通量が発生する時間である9時頃を示す説明変数の大きな回帰係数を有する回帰モデルと、時刻を示すパラメータの小さな回帰係数を有する回帰モデルが含まれる。さらに、局所モデル最適化部114は、いずれの階層潜在構造が最適であるかを選択するように構成され得る。これにより、例えば、運転手の様々な電力消費パターンの数を自動的に検出し、最適なパターンの数と、それらの切り替えルールとの関係をモデル化することができる。
【0046】
図3A及び
図3Bは、例示的な実施形態に係るモデル推定方法を示すフローチャートを示す。ステップ302では、モデル推定装置100が、データ入力部102を介して、局所モデルに関する入力を受信する。ステップ304では、階層潜在構造設定部104が、データを整理し、受信データに基づき、様々な潜在構造を生成する。ステップ306では、局所モデル設定部106は、入力を受信すると、局所モデルに対応する関数を決定する。ステップ308では、初期化部108が、推定のための初期化処理を実行する。ステップ310では、階層潜在変数可変確率算出部110が、局所モデルの情報に基づき、修正された正則化項を算出し、さらに、ステップ312において、修正された正則化項を用いて、潜在変数の可変確率を算出する。そして、ステップ314において、潜在変数可変確率が、ブランチ削除部112に送られる。
【0047】
ステップ316では、ブランチ削除部112が、潜在変数可変確率に基づき、潜在状態の数を算出及び設定する。ステップ318では、局所モデル最適化部114が、局所モデルの修正された正則化項に基づき、モデル推定のパラメータを最適化し、このパラメータは、1つの基準値を含む。ステップ320では、ゲーティング関数最適化部116が、局所モデルの修正された正則化項を用いて、局所モデル最適化部114から受信したパラメータを分類する。ステップ322では、最適化判定部118が、局所モデルの修正された正則化項を用いて、パラメータの基準値が収束したか判定する。最適化判定部118は、パラメータの基準値が収束したと判定した場合、ステップ324でモデル推定結果出力部120が、算出されたモデル推定の結果を出力する。一方、基準値が収束しない場合、最適化判定部118が、階層潜在変数可変確率算出部110に信号を送信し、基準値が収束するまで、ステップ310からの処理を繰り返す。
【0048】
本明細書における「装置」の語の使用は、特定の機能を実行するために協働する単一のコンピュータ装置又は相互に接続された複数のコンピュータ装置を意味すると理解することができる。換言すると、機能部は、単一のハードウェアユニットに含まれることが可能であり、または、いくつかの異なるハードウェアユニットに分散され得る。装置として動作可能な例示的なコンピュータ装置について、
図4を参照して以下に説明する。
【0049】
図4は、
図1のモデル推定装置100を実現するのに適したコンピュータ装置又はコンピュータシステム400の概略図を示す。コンピュータ装置400に関する以下の説明は、例示であり、限定するものではない。
【0050】
図4に示すように、例示的なコンピュータ装置400は、ソフトウェアルーチンを実行するプロセッサ404を含む。明確にするために、単一のプロセッサが示されているが、コンピュータ装置400は、マルチプロセッサシステムを備えることもできる。プロセッサ404は、コンピュータ装置400の他のコンポーネントと通信するための通信インフラストラクチャ406に接続される。通信インフラストラクチャ406は、例えば、通信バス、クロスバー、又はネットワークを含み得る。
【0051】
コンピュータ装置400は、ランダムアクセスメモリ(RAM)等の主記憶装置408と、補助記憶装置410とをさらに含む。補助記憶装置410は、例えば、ハードディスクドライブ412及び/又はリムーバブルストレージドライブ414等を含み、ハードディスクドライブ412は、ハードディスクドライブ、ソリッドステートドライブ又はハイブリッドドライブとすることができ、リムーバブルストレージドライブ414は、磁気テープドライブ、光ディスクドライブ、ソリッドステートストレージドライブ(USBフラッシュドライブ、フラッシュメモリデバイス、ソリッドステートドライブ又はメモリカード)を含み得る。リムーバブルストレージドライブ414は、周知の方法で取り外し可能な記憶媒体418を読み取り、及び/又は取り外し可能な記憶媒体418へ書き込む。取り外し可能な記憶媒体418は、磁気テープ、光ディスク、不揮発性記憶媒体等を含み、リムーバブルストレージドライブ414によって読み取られ、書き込まれる。当業者であれば、取り外し可能な記憶媒体418が、コンピュータが実行可能なプログラムコード命令及び/又はデータが格納されたコンピュータ可読記録媒体を含むことは、理解されるであろう。
【0052】
代替的な実施形態では、補助記憶装置410は、追加で又は代わりに、コンピュータプログラム又は他の命令をコンピュータ装置400へロード可能な他の同様の手段を含み得る。そのような手段は、例えば、リムーバブルストレージユニット422及びインタフェース420を含み得る。リムーバブルストレージユニット422及びインタフェース420の例には、プログラムカートリッジ及びカートリッジインタフェース(ビデオゲームコンソール装置のプログラムカートリッジ及びカートリッジインタフェース等)、リムーバブルメモリチップ(EPROM又はPROM等)及び関連するソケット、リムーバブルソリッドステート(USBフラッシュドライブ、フラッシュメモリデバイス、ソリッドステートドライブ又はメモリカード等)、並びに、リムーバブルストレージユニット422からコンピュータシステム400へのソフトウェア及びデータの転送を可能にする他のリムーバブルストレージユニット422及びインタフェース420が含まれる。
【0053】
また、コンピュータ装置400は、少なくとも1つの通信インタフェース424を含む。通信インタフェース424は、ソフトウェア及びデータが、通信パス426を介して、コンピュータ装置400と外部デバイスとの間で転送されることを可能にする。様々な実施形態では、通信インタフェース424は、コンピュータ装置400と、データ通信ネットワーク、例えば、パブリックデータ通信ネットワーク又はプライベートデータ通信ネットワーク等との間におけるデータ転送を可能にする。通信インタフェース424は、異なる複数のコンピュータ装置400の間で、データを交換するために使用され、そのようなコンピュータ装置400は、相互接続されたコンピュータネットワークの一部を形成する。通信インタフェース424の例は、モデム、ネットワークインタフェース(イーサネットカード等)、通信ポート(シリアル、パラレル、プリンタ、GPIB、IEEE1394、RJ45、USB等)、関連する回路を備えたアンテナ等が含まれる。通信インタフェース424は、有線又は無線とし得る。通信インタフェース424を介して転送されるソフトウェア及びデータは、電子信号、電磁気信号、光信号、又は、通信インタフェース424によって受信可能な他の信号とすることができる。これらの信号は、通信パス426を介して通信インタフェースに提供される。
【0054】
図4に示すように、コンピュータ装置400は、接続されたディスプレイ430に画像を描画する処理を実行するディスプレイインタフェース402と、接続されたスピーカ434を用いてオーディオコンテンツを再生する処理を実行するオーディオインタフェース432とをさらに含む。
【0055】
本明細書で使用される用語「コンピュータプログラム製品」は部分的に、取り外し可能な記憶媒体418、リムーバブルストレージユニット422、ハードディスクドライブ412にインストールされたハードディスク、又は、通信パス426(無線リンク又はケーブル)を介して通信インタフェース424へソフトウェアを送信する搬送波を意味し得る。コンピュータ可読記憶媒体は、記録された命令及び/又はデータを、実行及び/又は処理のためにコンピュータ装置400に提供する様々な非一時的な有形の記憶媒体を意味する。このような記憶媒体の例には、コンピュータ装置400の内部に有るか、又は外部に有るかに関わらず、磁気テープ、CD-ROM、DVD、Blu-ray(登録商標)ディスク、ハードディスクドライブ、ROM若しくは集積回路、ソリッドステートドライブ(例えば、USBフラッシュドライブ、フラッシュメモリデバイス、ソリッドステートドライブ、メモリカード等)、ハイブリッドドライブ、光磁気ディスク、又は、PCMCIAカード等のコンピュータ読み取り可能なカードが含まれる。ソフトウェア、アプリケーションプログラム、命令及び又はデータをコンピュータ装置400へ提供可能な一時的な又は無形のコンピュータ可読な通信媒体の例には、無線通信チャネル又は赤外線通信チャネルの他、他のコンピュータ又はネットワーク装置へのネットワーク接続、電子メールによる通信を含むインターネット又はイントラネット、及び、ウェブサイトに記録された情報が含まれる。
【0056】
コンピュータプログラム(コンピュータプログラムコードとも称する)は、主記憶装置408及び/又は補助記憶装置410に格納される。コンピュータプログラムは、通信インタフェース424を介して受信され得る。そのようなコンピュータプログラムが実行されると、コンピュータ装置400に対し、本明細書で説明した実施形態の1以上の機能を実行させることができる。様々な実施形態では、コンピュータプログラムが実行されると、プロセッサ404に対し、上述した実施形態の機能を実行させることができる。したがって、そのようなコンピュータプログラムは、コンピュータシステム400の制御手段(コントローラ)に相当する。
【0057】
ソフトウェアは、コンピュータプログラム製品に格納され、リムーバブルストレージドライブ414、ハードディスクドライブ412、又はインタフェース420を用いて、コンピュータ装置400にロードされる。代替的に、コンピュータプログラム製品は、通信パス426を介してコンピュータシステム400にダウンロードされ得る。ソフトウェアは、プロセッサ404によって実行されると、コンピュータ装置400に対し、本明細書に記載の実施形態の機能を実行させる。
【0058】
図4の実施形態は、単なる例示であることに留意すべきである。したがって、いくつかの実施形態では、コンピュータ装置400の1以上の機能を省略することができる。また、いくつかの実施形態では、コンピュータ装置400の1以上の機能を組み合わせることができる。さらに、いくつかの実施形態では、コンピュータ装置400の1以上の機能を、1以上の構成要素に分けることができる。
【0059】
図5は、例示的な実施形態に係る、
図1に示すモデル推定装置の様々な機能部のための1つのユニットを実現する例示的なコンピュータ装置500を示す。具体的には、コンピュータ装置500は、データ入力部102と、階層潜在構造設定部104と、局所モデル設定部106と、初期化部108と、階層潜在変数可変確率算出部110と、ブランチ削除部112と、局所モデル最適化部114と、ゲーティング関数最適化部116と、最適化判定部118と、モデル推定結果出力部120とを実現することができる。
【0060】
例示的な実施形態では、
図5に示す階層潜在変数可変確率算出部110はまた、データベース506と、正則化項設定モジュール508と、正則化項算出モジュール510と、階層潜在構造モジュール512と、階層潜在変数確率モジュール514とを含み得る。メモリ504は、コンピュータプログラムコードを保存し、プロセッサ502が、コンピュータプログラムコードをコンパイルして、データベース506、正則化項設定モジュール508、正則化項算出モジュール510、階層潜在構造モジュール512、及び階層潜在変数確率モジュール514のそれぞれに対し、それらの個別の機能を実行させる。
図2を参照すると、データベース506は、修正された正則化項を格納するように構成される。正則化項設定モジュール508は、局所モデルの入力データに基づき、修正された正則化項を設定するように構成される。正則化項算出モジュール510は、修正された正則化項を算出するように構成され、階層潜在構造モジュール512は、初期化部108から局所モデルの階層潜在構造を受信するように構成される。階層潜在変数確率モジュール514は、算出された階層潜在変数確率をブランチ削除部112に送信するように構成される。
【0061】
上述したモデル推定システム及びモデル推定方法は、最適なモデル推定を提供することができ、また、入力変数と出力変数の間の複雑な関係を記述し、又は相関させることができる。
【0062】
当業者であれば、広範に説明した本発明の趣旨又は範囲から逸脱することなく、特定の実施形態で示された本発明に対する様々な変形及び/又は修正が可能であることは理解されるであろう。したがって、本実施形態は全ての点において、例示であり、限定するものでないと理解すべきである。
【0063】
例えば、上述した実施形態の全部又は一部は、以下の付記のように記載できるが、これらに限定されない。
(付記1)
モデル推定装置であって、
局所モデルに関する入力を受信すると、前記局所モデルに対応する関数を決定するように構成された局所モデル設定部と、
前記局所モデルの修正された正則化項に基づいて、モデル推定のパラメータを最適化するように構成された局所モデル最適化部とを含み、
前記修正された正則化項は、前記モデル推定のパラメータを最適化するための、受信した入力に関連する前記局所モデルの形状情報を用いて修正される、モデル推定装置。
(付記2)
前記修正された正則化項を用いて、潜在変数の可変確率を算出するように構成された可変確率算出部をさらに含む、付記1に記載のモデル推定装置。
(付記3)
前記潜在変数の可変確率に基づいて、潜在状態の数を算出及び設定するブランチ削除部をさらに含む、付記2に記載のモデル推定装置。
(付記4)
前記モデル推定のパラメータは、1つの基準値を含む、付記1に記載のモデル推定装置。
(付記5)
前記局所モデルの前記修正された正則化項を用いて、前記基準値が収束したか判定するように構成された最適化判定部をさらに含む、付記4に記載のモデル推定装置。
(付記6)
前記局所モデルを決定するように構成された階層潜在構造設定部をさらに含むことを特徴とする、付記1に記載のモデル推定装置。
(付記7)
前記局所モデルの前記修正された正則化項を用いて、前記モデル推定のパラメータを分類するように構成されたゲーティング関数最適化部をさらに含む、付記1に記載のモデル推定装置。
(付記8)
最適化判定部が、基準値が収束したと判定するまで、ループ処理が繰り返し実行され、
前記ループ処理では、可変確率算出部が潜在変数の可変確率を算出し、ブランチ削除部が潜在状態の数を算出及び設定し、前記局所モデル最適化部が潜在変数を最適化し、ゲーティング関数最適化部が前記モデル推定のパラメータを分類し、前記最適化判定部が、前記基準値が収束したか判定する、付記1~7のいずれか1項に記載のモデル推定装置。
(付記9)
可変確率算出部は、前記局所モデルに関する前記受信した入力に基づいて、前記修正された正則化項を算出する正則化項算出部を含む、付記1に記載のモデル推定装置。
(付記10)
モデル推定方法であって、
局所モデルに関する入力を受信し、
前記入力を受信すると、前記局所モデルの決定に対応する関数を決定し、
前記局所モデルの修正された正則化項に基づいて、モデル推定のパラメータを最適化することを含み、
前記修正された正則化項は、前記モデル推定のパラメータを最適化するための、受信した前記入力に関連する前記局所モデルの形状情報を用いて修正される、方法。
(付記11)
モデル推定のための前記モデル推定のパラメータは、1つの基準値を含む、付記10に記載のモデル推定方法。
(付記12)
前記修正された正則化項を用いて、潜在変数の可変確率を算出し、
前記潜在変数の前記可変確率に基づいて、潜在状態の数を算出及び設定し、
前記局所モデルの修正された正則化項を用いて、前記モデル推定のパラメータを分類し、
前記局所モデルの修正された正則化項を用いて、基準値が収束したか判定することをさらに含む、付記10又は11に記載のモデル推定方法。
(付記13)
前記基準値が収束するまで、ループ処理が繰り返し実行され、
前記ループ処理では、潜在変数の可変確率が算出され、潜在状態の数が算出及び設定され、前記モデル推定のパラメータが最適化され、前記モデル推定のパラメータが分類され、基準値が収束したか判定される、付記10~12のいずれか1項に記載のモデル推定方法。
(付記14)
前記局所モデルの情報に基づいて、前記修正された正則化項を算出することをさらに含む、付記10~13のいずれか1項に記載のモデル推定方法。
【0064】
本出願は、2020年4月13日に出願されたシンガポール特許出願第10202003373S号に基づき、その優先権を主張し、当該特許出願の開示は、参照により、その全体が本明細書に組み込まれる。
【符号の説明】
【0065】
100 装置
102 データ入力部
104 階層潜在構造設定部
106 局所モデル設定部
108 初期化部
110 階層潜在変数可変確率算出部
112 ブランチ削除部
114 局所モデル最適化部
116 ゲーティング関数最適化部
118 最適化判定部
120 モデル推定結果出力部
200 概略図
202 正則化項設定部
204 最下位パス潜在変数可変確率算出部
206 階層設定部
208 正則化項算出部
210 上位パス潜在変数可変確率算出部
212 階層計算終了判定部
400 装置
402 ディスプレイインタフェース
404 プロセッサ
406 通信インフラ
408 主記憶装置
410 補助記憶装置
412 ハードディスクドライブ
414 リムーバブルストレージドライブ
418 取り外し可能な記憶媒体
420 インタフェース
422 リムーバブルストレージユニット
424 通信インタフェース
426 通信パス
430 ディスプレイ
432 オーディオインタフェース
434 スピーカ
500 装置
502 プロセッサ
504 メモリ
506 データベース
508 正則化項設定モジュール
510 正則化項算出モジュール
512 階層潜在構造モジュール
514 階層潜在変数可変確率算出モジュール