(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-07-29
(45)【発行日】2022-08-08
(54)【発明の名称】変数最適化装置、変数最適化方法、プログラム
(51)【国際特許分類】
G06N 20/00 20190101AFI20220801BHJP
【FI】
G06N20/00
(21)【出願番号】P 2019012794
(22)【出願日】2019-01-29
【審査請求日】2021-04-06
(73)【特許権者】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(73)【特許権者】
【識別番号】518128104
【氏名又は名称】ヴィクトリア ユニバーシティ オブ ウェリントン
【氏名又は名称原語表記】Victoria University of Wellington
【住所又は居所原語表記】Kelburn Parade, Kelburn, Wellington 6140, NEW ZEALAND
(74)【代理人】
【識別番号】100121706
【氏名又は名称】中尾 直樹
(74)【代理人】
【識別番号】100128705
【氏名又は名称】中村 幸雄
(74)【代理人】
【識別番号】100147773
【氏名又は名称】義村 宗洋
(72)【発明者】
【氏名】丹羽 健太
(72)【発明者】
【氏名】ウィリム バスティアン クライン
【審査官】中村 信也
(56)【参考文献】
【文献】特開2016-212510(JP,A)
【文献】特開2017-177118(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00-3/12
G06N 7/08-99/00
G06N 5/00-7/06
(57)【特許請求の範囲】
【請求項1】
観測データを入力として、潜在変数xを最適化する最適化部を含む変数最適化装置であって、
f
0(x)を潜在変数xの損失項、y
i (i=1, …, n)を潜在変数xに対する正規化項f
i(x)の係数を表す変数(以下、係数変数という)とし、
前記最適化部は、
係数変数y
iに対する正規化項g
i(y
i) (i=1, …, n)を用いて、次式で定義されるコスト関数L(x, y):R
m×R
n→R∪{-∞, +∞}
【数33】
(ただし、y=[y
1, …, y
n]
T)の最小化問題を解くことにより、潜在変数xと係数変数yを最適化する
変数最適化装置。
【請求項2】
請求項1に記載の変数最適化装置であって、
前記最適化部は、
次式により、潜在変数xを更新する潜在変数更新部と、
【数34】
次式により、係数変数yを更新する係数変数更新部と、
【数35】
を含む変数最適化装置。
【請求項3】
変数最適化装置が、観測データを入力として、潜在変数xを最適化する最適化ステップを実行する変数最適化方法であって、
f
0(x)を潜在変数xの損失項、y
i (i=1, …, n)を潜在変数xに対する正規化項f
i(x)の係数を表す変数(以下、係数変数という)とし、
前記最適化ステップは、
係数変数y
iに対する正規化項g
i(y
i) (i=1, …, n)を用いて、次式で定義されるコスト関数L(x, y):R
m×R
n→R∪{-∞, +∞}
【数39】
(ただし、y=[y
1, …, y
n]
T)の最小化問題を解くことにより、潜在変数xと係数変数yを最適化する
変数最適化方法。
【請求項4】
請求項1または2に記載の変数最適化装
置としてコンピュータを機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機械学習において最適化の対象となるモデルの潜在変数を最適化する技術に関する。
【背景技術】
【0002】
機械学習を用いて、観測した情報(以下、観測情報という)から所望の情報を得る写像を設計するとき、(1)画像処理、音声認識、自然言語処理など、幅広い分野における個々の問題に適したコスト関数を設計する技術と、(2)当該コスト関数を最小化するように潜在変数を最適化する技術の双方が求められる。このコスト関数は、観測情報やコスト関数に含まれる(最適化すべき)潜在変数の生成過程を考慮して設計される。例えば、非特許文献1にあるように、x∈Rmを最適化すべき潜在変数として、コスト関数は次式のような複数の項の和として表現される。
【0003】
【0004】
ここで、f0は損失項(罰則項ともいう)、fi(i=1, …, n)は正規化項、γi(>0) (i=1, …, n)は事前に与えられた係数である。なお、損失項f0、正規化項fi(i=1, …, n)はいずれも閉真凸関数(以下、単に凸関数という)である。
【0005】
そして、例えば、観測情報を入力として、
図1に示す最適化アルゴリズムにより潜在変数xを逐次最適化することにより、コスト関数を最小化する潜在変数が得られる。
【先行技術文献】
【非特許文献】
【0006】
【文献】Robert Tibshirani, “Regression Shrinkage and Selection via the Lasso”, Journal of the Royal Statistical Society, Series B (Methodological), Vol.58, No.1, pp.267-288, 1996.
【発明の概要】
【発明が解決しようとする課題】
【0007】
式(1-1)における係数γ
iは、各項の相対的大きさを調整するためパラメータであり、従来、係数γ
iを人手で事前に調整し、
図1に示されるような最適化処理を実行していた。しかし、この係数γ
iの調整を慎重にしなければ、所望の結果を得ることができないことが多いという問題があった。また、例えば、音声周波数スペクトログラムや画像の局所領域ごとに異なる係数γ
iを設定する場合のように、調整すべき係数γ
iの数が増えると、人手で調整することが困難になるという問題もある。
【0008】
そこで本発明では、コスト関数の各項の相対的大きさを調整する係数を潜在変数とともに最適化する潜在変数最適化技術を提供することを目的とする。
【課題を解決するための手段】
【0009】
本発明の一態様は、観測データを入力として、潜在変数xを最適化する最適化部を含む変数最適化装置であって、f0(x)を潜在変数xの損失項、yi (i=1, …, n)を潜在変数xに対する正規化項fi(x)の係数を表す変数(以下、係数変数という)とし、前記最適化部は、係数変数yiに対する正規化項gi(yi) (i=1, …, n)を用いて、次式で定義されるコスト関数L(x, y):Rm×Rn→R∪{-∞, +∞}
【0010】
【0011】
(ただし、y=[y1, …, yn]T)の最小化問題を解くことにより、潜在変数xと係数変数yを最適化する。
【発明の効果】
【0012】
本発明によれば、コスト関数の各項の相対的大きさを調整する係数を事前に調整する必要がなく、潜在変数と同時に最適化することが可能となる。
【図面の簡単な説明】
【0013】
【
図1】従来の最適化アルゴリズムの一例を示す図である。
【
図2】本願の最適化アルゴリズムの一例を示す図である。
【
図3】対数凹分布v(x, y)の一例を示す図である。
【
図4】本願のノイズ除去アルゴリズムの一例を示す図である。
【
図5】変数最適化装置100の構成を示すブロック図である。
【
図6】変数最適化装置100の動作を示すフローチャートである。
【
図7】最適化部110の構成を示すブロック図である。
【
図8】最適化部110の動作を示すフローチャートである。
【
図9】ノイズ除去装置200の構成を示すブロック図である。
【
図10】ノイズ除去装置200の動作を示すフローチャートである。
【
図11】推定信号生成部210の構成を示すブロック図である。
【
図12】推定信号生成部210の動作を示すフローチャートである。
【
図13】第1変数更新部212の構成を示すブロック図である。
【
図14】第1変数更新部212の動作を示すフローチャートである。
【発明を実施するための形態】
【0014】
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
【0015】
各実施形態の説明に先立って、この明細書における表記方法について説明する。
【0016】
^(キャレット)は上付き添字を表す。例えば、xy^zはyzがxに対する上付き添字であり、xy^zはyzがxに対する下付き添字であることを表す。また、_(アンダースコア)は下付き添字を表す。例えば、xy_zはyzがxに対する上付き添字であり、xy_zはyzがxに対する下付き添字であることを表す。
【0017】
ある文字xに対する^xや~xのような上付き添え字の”^”や”~”は、本来”x”の真上に記載されるべきであるが、明細書の記載表記の制約上、^xや~xと記載しているものである。
【0018】
<技術的背景>
本発明の実施形態では、これまで固定のパラメータとして扱ってきた係数γiを確率的仮定が課された確率変数として扱う。つまり、本発明の実施形態では、係数γiの統計的性質を事前に仮定し、係数γiを自動で調整する。したがって、本発明の実施形態では、潜在変数xに加え、係数γiも最適化されることとなる。
【0019】
《コスト関数の基本形式》
まず、係数γiを確率変数として扱う場合のコスト関数について説明する。以下、係数γiを確率変数として扱うので、γiと異なる記号を用いて表現することにする。具体的には、正規化項の前にある、コスト関数の各項の相対的大きさを調整する係数をyi(i=1, …, n)で表し、係数変数と呼ぶことにする。
【0020】
本発明の実施形態では、潜在変数xと係数変数yi(i=1, …, n)の双方を最適化する。そのために、次式により、コスト関数Lを定義する。
【0021】
【0022】
ここで、L(x, y): Rm×Rn→R∪{-∞, +∞}はコスト関数、x∈Rmは潜在変数、y=[y1, …, yn]T∈Rnは係数変数、f0(x)は潜在変数xの損失項、fi(x) (i=1, …, n)は潜在変数xに対する正規化項、gi(yi) (i=1, …, n)は係数変数yiに対する正規化項である。なお、正規化項gi(yi)の定義域は正の領域に制限される。つまり、yi∈(0, +∞)である。
【0023】
また、損失項f0(x)、正規化項fi(x), gi(yi) (i=1, …, n)はいずれも凸関数である。このとき、コスト関数L(x, y)は、(1)yを固定したときxに関する凸関数、(2)xを固定したときyに関する凸関数となる。つまり、コスト関数L(x, y)はbi-convex(バイコンベックス)となる。
【0024】
したがって、変数{x, y}のそれぞれを次式のようにL(x, y)を最小化するように逐次的に更新することにより、不動点(つまり、コスト関数を最小化する解)を得る。
【0025】
【0026】
式(2-2)に基づく変数{x, y}の最適化アルゴリズムを
図2に示す。ここで、Tは繰り返し回数を表す1以上の整数である。
図2に示す最適化アルゴリズムは、観測データを入力として、潜在変数xと係数変数yを交互に逐次最適化するものである。
【0027】
式(2-1)と式(1-1)とを比較すると、コスト関数に関して以下の違いがあることがわかる。
(1)式(2-1)では、潜在変数xに対する正規化項に掛かる係数が変数となっている。
(2)式(2-1)では、最適化すべき変数が、潜在変数xと係数変数yの2種類ある。
(3)式(2-1)では、係数変数yiに対する正規化項giが加算されている。この項giを導入することは、係数変数yiに対する確率的仮定を事前に設定することに相当する。
【0028】
《確率モデルと関連したコスト関数の設計》
次に、コスト関数L(x, y)を構成する各項をどのように設計したらよいかの指針について説明する。具体的には、観測データ/変数の生成過程に関する統計的性質を確率分布として表現することで、コスト関数L(x, y)を構成する項を設計する方法について述べる。
【0029】
凸関数に関連する確率分布のクラスとして、対数凹分布がある(参考非特許文献1)。コスト関数の設計に用いる確率分布を対数凹分布に制限すると、解が一意に得られることが保証できる。
(参考非特許文献1:“Log-concave probability and its applications”, [online], [平成31年1月24日検索], インターネット<URL: http://econ.ucsb.edu/~tedb/Theory/delta.pdf>)
【0030】
コスト関数L(x, y)には2種類の変数{x, y}が含まれるため、その組合せに応じて3種類の対数凹分布が必要になる。具体的には、潜在変数xのみを含む対数凹分布ui(x) (i=0, …, k、ただし、kは0以上の整数)、潜在変数xと係数変数yiを含む対数凹分布vi(x, yi) (i=1, …, n)、係数変数yiのみを含む対数凹分布wi(yi) (i=1, …, n)である。
【0031】
【0032】
ここで、~φi(x) (i=0, …, k), φi(x) (i=1, …, n), ψi(x) (i=1, …, n), ξi(yi) (i=1, …, n)は凸関数である。なお、ui(x), vi(x, yi), wi(yi)は確率分布であるので、いずれも正規化されている。すなわち、∫ui(x)dx=1, ∫vi(x, yi)dxdyi=1, ∫wi(yi)dyi=1が成り立つ。
【0033】
対数凹分布u
i(x), w
i(y
i)については、任意の対数凹分布を利用できるので、~φ
i(x), ξ
i(y
i)として任意の凸関数を用いることができる。一方、対数凹分布v
i(x, y
i)については、任意の対数凹分布を利用できるわけではない。
図3に、具体的に利用できる対数凹分布v(x, y)=exp[-(yf(x)+φ(x)+ψ(y))]の例を示す。ここで、Β(θ
1, θ
2)はベータ関数、Γ(θ)はガンマ関数である。
図3の表は、v(x, y)が確率密度関数pの形式になるときのy, f(x), φ(x), ψ(y)の組合せを示したものである。なお、表の左から2列目は各変数の台(support)を表す。
【0034】
観測データ/変数の生成過程に関する統計的性質が上記対数凹の確率分布u0(x), vi(x, yi) (i=1, …, n), wi(yi) (i=1, …, n)によって与えられると仮定する。このとき、~φ0(x)を単にφ0(x)と表すこととすると、尤度関数P(x, y)は次式のようになる。
【0035】
【0036】
式(2-6)に現れる項を次式により置き換えると、
【0037】
【0038】
式(2-6)は以下のようになる。
【0039】
【0040】
式(2-7)は、コスト関数L(x, y)の最小値minx,yL(x, y)が上記仮定した生成過程の最大対数尤度maxx,ylogP(x, y)と一致することを示す。
【0041】
式(2-3)~式(2-5)で定義される対数凹分布u0(x), vi(x, yi), wi(yi)を用いて観測データ/変数の生成過程を表現すると、負の対数尤度-logP(x, y)がコスト関数L(x,y)と一致する。また、式(2-2)は、片方の変数(例えば、y)を固定して、もう片方の変数(例えば、x)に関してコスト関数を最小化する処理を意味する。したがって、当該処理は交互に尤度を最大化する処理に対応する。
【0042】
【0043】
《応用事例》
ここでは、LASSOに基づく潜在変数最適化でのコスト関数L(x, y)の設計について説明する。ノイズが混在した観測信号d∈Rmを入力とし、ノイズが除去された推定信号x∈Rmを出力する問題について考える。ここで、対象とする信号は時間領域の音声、静止画像などである。この問題におけるコスト関数を導出するため、いくつかの確率的仮定を置く。以下、各仮定について説明する。
【0044】
(仮定1):観測信号dと推定信号xの差に関する仮定
観測信号dと推定信号xの差は、次式で与えられる分散σ2のガウス分布に従うものと仮定する。
【0045】
【0046】
(仮定2):推定信号xの取り得る値に関する仮定
推定信号xは範囲c={cmin, cmax}(cmin,<cmax)のある値をとる一様分布に従うものと仮定する。
【0047】
【0048】
ここで、x=[x1, …, xm]Tである。
【0049】
(仮定3):潜在変数である推定信号xの補助変数zに対する確率的仮定
音声のスペクトログラムは、局所領域でスパース性が高いことが知られている。また、画像の隣接要素差分についても局所領域でスパース性が高いことが多い。
【0050】
そこで、音声に対しては、フレームシフトしながら窓掛けして離散フーリエ変換(DFT)した結果を補助変数zとする。また、画像に対しては、隣接するピクセルを差し引いた結果を補助変数zとする。いずれの場合も、潜在変数xに対して所定の行列Dを掛け合わせることで補助変数zが得られる。
【0051】
【0052】
ここで、行列Dは観測信号の発生に由来する行列である。
【0053】
音声/画像を局所領域ごとに分割し、合計でn個の局所領域が得られたものとすると、補助変数zもn分割される。これを、{z1, …, zn}∈zと表す。なお、分割に際して局所領域は重畳するようにしてもよい。
【0054】
補助変数zi(i=1, …, n)のスパース性より、補助変数ziは分散2βi
2のラプラス分布に従うものと仮定する。
【0055】
【0056】
式(2-4)の形式に合うように、次式の置き換えを用いると、
【0057】
【0058】
式(2-14)は次式のようになる。
【0059】
【0060】
ここで、ラプラス分布の分散βiに関連するパラメータyi(i=1, …, n)が係数変数となっている。
【0061】
(仮定4):係数変数yiに対する確率的仮定
(仮定3)では、補助変数ziのスパース性を表現するためにラプラス分布が用いられ、その分散に関連するパラメータyiは変数として扱われたが、この係数変数yiもまた対数凹分布で表現される確率分布に従うものと仮定する。
【0062】
ここでは、係数変数yiに対する確率的仮定の一例として、上限及び下限が制限されたガウス分布を用いることにする。ガウス分布の下限及び上限をζi={ζmin,i, ζmax,i}(ζmin,i>0, ζmax,i>0)、平均をμi、分散をρi
2とすると、確率分布wiは以下のようになる。
【0063】
【0064】
ここで、erf(・)は誤差関数である。
【0065】
したがって、尤度関数は、次式により与えられる。
【0066】
【0067】
(仮定1)~(仮定4)から導出された観測データ/変数の生成過程に関する式(2-9)、式(2-11)、式(2-15)、式(2-18)より、負の対数尤度であるコスト関数L(x, y)は以下で表現される。
【0068】
【0069】
したがって、
【0070】
【0071】
となる。ここで、潜在変数xとその補助変数zは、線形等式z=Dxにより関連している。
【0072】
《最適化ソルバー》
以下、コスト関数L(x, z, y)の最適化ソルバーについて説明する。変数{x, z, y}を交互に最適化することで、不動点(コスト関数を最小化する解)を得ることを目指す。ここでは、最適化ソルバーとして、従来からある近接点法に基づくアルゴリズムを適用する。
【0073】
まず、コスト関数L(x, z, y)に関して、各変数で劣微分した作用素Tを定義する。
【0074】
【0075】
そして、次式により各変数の不動点が得られる。
【0076】
【0077】
劣微分作用素Tに関連するリゾルヴェント作用素RT=(I+αT)-1(α>0)を用いて、変数{x, z, y}を更新することにする。
【0078】
【0079】
コスト関数L(x, z, y)はbi-convex関数であるので、主変数{x, z}と双対変数yを交互に更新することとする。式(2-22)は、以下の2種類の制約付最小化問題の繰り返し演算に還元される。
【0080】
【0081】
式(2-23)の問題を解くための一つの方法として交互方向乗数法(ADMM)がある。ADMMに基づいて式(2-23)を解くために、新たな双対変数λを導入する。したがって、最終的には、ADMMに基づく変数最適化アルゴリズム(最適化ソルバー)は{x, z, y, λ}の4種類の変数を逐次更新するアルゴリズムとなる。
図4に示す当該アルゴリズムはノイズ除去アルゴリズムである。なお、ε(>0), α(>0), η(>0)は所定の定数、Tは1以上の整数である。
【0082】
ここでは具体的な実験データは示さないが、係数変数yiに対する確率的仮定が適切なものであれば、当該ノイズ除去アルゴリズムを用いて高精度な信号推定が可能となることが確認された。
【0083】
<第1実施形態>
変数最適化装置100は、観測データを入力として、最適化の対象となるモデルの潜在変数xを最適化する。ここで、モデルとは、入力データを入力とし、出力データを出力とする関数のことである。また、観測データとは、潜在変数の最適化に用いる入力データのことである。
【0084】
変数最適化装置100は、潜在変数xを最適化する際、f0(x)を潜在変数xの損失項、yi (i=1, …, n)を潜在変数xに対する正規化項fi(x)の係数を表す変数(以下、係数変数という)として、係数変数yiに対する正規化項gi(yi) (i=1, …, n)を用いて次式で定義されるコスト関数L(x, y):Rm×Rn→R∪{-∞, +∞}の最小化問題を解くことにより、潜在変数xと係数変数yを最適化する。
【0085】
【0086】
(ただし、y=[y1, …, yn]Tである。)
【0087】
以下、
図5~
図6を参照して変数最適化装置100を説明する。
図5は、変数最適化装置100の構成を示すブロック図である。
図6は、変数最適化装置100の動作を示すフローチャートである。
図5に示すように変数最適化装置100は、最適化部110と、記録部190を含む。記録部190は、変数最適化装置100の処理に必要な情報を適宜記録する構成部である。記録部190は、例えば、入力となる観測データ、最適化対象となる潜在変数xや係数変数y
iを記録する。
【0088】
図6に従い変数最適化装置100の動作について説明する。
【0089】
S110において、最適化部110は、観測データを入力として、コスト関数Lの最小化問題を解くことにより潜在変数xと係数変数yを最適化する。
【0090】
以下、
図7~
図8を参照して最適化部110について説明する。
図7は、最適化部110の構成を示すブロック図である。
図8は、最適化部110の動作を示すフローチャートである。
図7に示すように最適化部110は、初期化部111、潜在変数更新部112と、係数変数更新部113と、カウンタ更新部114と、終了条件判定部115を含む。
【0091】
【0092】
S111において、初期化部111は、カウンタtを初期化する。具体的には、t=1とする。また、初期化部111は、潜在変数x、係数変数yを初期化する。
【0093】
S112において、潜在変数更新部112は、次式により、潜在変数xを更新する。
【0094】
【0095】
S113において、係数変数更新部113は、次式により、係数変数yを更新する。
【0096】
【0097】
S114において、カウンタ更新部114は、カウンタtを1だけインクリメントする。具体的には、t←t+1とする。
【0098】
S115において、終了条件判定部115は、カウンタtが所定の更新回数T(Tは1以上の整数であり、例えば10万)に達した場合(つまり、t>Tとなり、終了条件が満たされた場合)は、そのときの潜在変数の値xと係数変数の値yを出力して、処理を終了する。それ以外の場合、S112の処理に戻る。つまり、最適化部110は、S112~S115の処理を繰り返す。
【0099】
本実施形態の発明によれば、コスト関数の各項の相対的大きさを調整する係数を事前に調整する必要がなく、潜在変数と同時に最適化することが可能となる。つまり、確率モデルのパラメータを除くパラメータ(例えば、係数)については人手で調整する必要がないため、パラメータの人手による調整を可能な限り少なくすることができる。
【0100】
<第2実施形態>
ここでは、変数最適化装置100を観測信号のノイズ除去に適用した例であるノイズ除去装置200について説明する。ノイズ除去装置200は、ノイズが混在した観測信号を入力として、ノイズを除去した推定信号を生成する。
【0101】
以下、
図9~
図10を参照してノイズ除去装置200を説明する。
図9は、ノイズ除去装置200の構成を示すブロック図である。
図10は、ノイズ除去装置200の動作を示すフローチャートである。
図9に示すようにノイズ除去装置200は、推定信号生成部210と、記録部290を含む。記録部290は、ノイズ除去装置200の処理に必要な情報を適宜記録する構成部である。記録部290は、例えば、入力となる観測信号、推定信号を表す潜在変数を記録する。
【0102】
図10に従いノイズ除去装置200の動作について説明する。
【0103】
S210において、推定信号生成部210は、観測信号を入力として、コスト関数Lの最小化問題を解くことにより、推定信号を表す潜在変数xと補助変数zと係数変数yを最適化して得られた、推定信号を表す潜在変数xをノイズを除去した推定信号として生成する。ここで、x∈Rmはノイズを除去した推定信号表す潜在変数、zはz=Dx(ただし、行列Dは観測信号の発生に由来する行列)を満たす推定信号を表す潜在変数xの補助変数、{z1, …, zn}∈zは補助変数zをn分割して得られる補助変数、yi(i=1, …, n)は補助変数ziが分散2(1/yi)2のラプラス分布vi(zi, yi)に従うと仮定したとき得られる係数変数である。また、コスト関数L(x, z, y):Rm×Rn×Rn→R∪{-∞, +∞}は、次式で定義される。
【0104】
【0105】
(ただし、y=[y1, …, yn]T、u0(x|d,σ2)を観測信号dと推定信号を表す潜在変数xの差の分布を表す分散σ2のガウス分布、u1(x|c)を推定信号を表す潜在変数xの分布を表す範囲cの一様分布、wi(yi|ζi, μi, ρi
2)を係数変数yiの分布を表す下限及び上限ζi={ζmin,i, ζmax,i}(ζmin,i>0, ζmax,i>0)、平均μi、分散ρi
2のガウス分布とする。)
【0106】
以下、
図11~
図12を参照して推定信号生成部210について説明する。
図11は、推定信号生成部210の構成を示すブロック図である。
図12は、推定信号生成部210の動作を示すフローチャートである。
図11に示すように推定信号生成部210は、初期化部211、第1変数更新部212と、第2変数更新部213と、カウンタ更新部214と、終了条件判定部215を含む。
【0107】
図12に従い推定信号生成部210の動作について説明する。
【0108】
S211において、初期化部211は、カウンタtを初期化する。具体的には、t=1とする。また、初期化部111は、推定信号を表す潜在変数x、補助変数z、双対変数λ、係数変数yを初期化する。
【0109】
S212において、第1変数更新部212は、推定信号を表す潜在変数x、補助変数z、双対変数λを更新する。以下、
図13~
図14を参照して第1変数更新部212について説明する。
図13は、第1変数更新部212の構成を示すブロック図である。
図14は、第1変数更新部212の動作を示すフローチャートである。
図13に示すように第1変数更新部212は、潜在変数更新部2121と、補助変数更新部2122と、双対変数更新部2123と、収束条件判定部2124を含む。
【0110】
図14に従い第1変数更新部212の動作について説明する。なお、α, ηはそれぞれα>0, η>0を満たす所定の定数である。
【0111】
S2121において、潜在変数更新部2121は、次式により、推定信号を表す潜在変数xを更新する。
【0112】
【0113】
S2122において、補助変数更新部2122は、次式により、補助変数zを更新する。
【0114】
【0115】
S2123において、双対変数更新部2123は、次式により、双対変数λを更新する。
【0116】
【0117】
S2124において、収束条件判定部2124は、更新前後の潜在変数xの差を表す||x-xold||2
2が所定の値ε(>0)より大きい間は、S2121~S2124の処理を繰り返す。一方、収束条件判定部2124は、||x-xold||2
2が所定の値ε以下となった場合は、潜在変数x、補助変数z、双対変数λを出力し、次の処理ステップ(つまり、S213)に移行する。
【0118】
S213において、第2変数更新部213は、次式により、係数変数yを更新する。
【0119】
【0120】
S214において、カウンタ更新部214は、カウンタtを1だけインクリメントする。具体的には、t←t+1とする。
【0121】
S215において、終了条件判定部215は、カウンタtが所定の更新回数T(Tは1以上の整数であり、例えば10万)に達した場合(つまり、t>Tとなり、終了条件が満たされた場合)は、そのときの潜在変数の値xをノイズを除去した推定信号として出力して、処理を終了する。それ以外の場合、S212の処理に戻る。つまり、推定信号生成部210は、S212~S215の処理を繰り返す。
【0122】
(変形例)
上記第1変数更新部212の代わりに、以下のS212を実行する第1変数更新部212を用いるようにしてもよい。つまり、S212において、第1変数更新部212は、次式により、推定信号を表す潜在変数x、補助変数zを更新する。
【0123】
【0124】
本実施形態の発明によれば、ノイズが除去された高精度な推定信号を生成することが可能となる。
【0125】
<補記>
本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD-ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
【0126】
ハードウェアエンティティの外部記憶装置には、上述の機能を実現するために必要となるプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている(外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるROMに記憶させておくこととしてもよい)。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に記憶される。
【0127】
ハードウェアエンティティでは、外部記憶装置(あるいはROMなど)に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてメモリに読み込まれて、適宜にCPUで解釈実行・処理される。その結果、CPUが所定の機能(上記、…部、…手段などと表した各構成要件)を実現する。
【0128】
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
【0129】
既述のように、上記実施形態において説明したハードウェアエンティティ(本発明の装置)における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。
【0130】
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD-RAM(Random Access Memory)、CD-ROM(Compact Disc Read Only Memory)、CD-R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP-ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
【0131】
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
【0132】
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記憶装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
【0133】
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
【0134】
上述の本発明の実施形態の記載は、例証と記載の目的で提示されたものである。網羅的であるという意思はなく、開示された厳密な形式に発明を限定する意思もない。変形やバリエーションは上述の教示から可能である。実施形態は、本発明の原理の最も良い例証を提供するために、そして、この分野の当業者が、熟考された実際の使用に適するように本発明を色々な実施形態で、また、色々な変形を付加して利用できるようにするために、選ばれて表現されたものである。すべてのそのような変形やバリエーションは、公正に合法的に公平に与えられる幅にしたがって解釈された添付の請求項によって定められた本発明のスコープ内である。