(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-03-21
(45)【発行日】2024-03-29
(54)【発明の名称】情報処理装置、システムおよび方法
(51)【国際特許分類】
G06T 7/00 20170101AFI20240322BHJP
G06T 7/70 20170101ALI20240322BHJP
【FI】
G06T7/00 350B
G06T7/70 A
(21)【出願番号】P 2023189803
(22)【出願日】2023-11-07
【審査請求日】2023-11-07
【早期審査対象出願】
(73)【特許権者】
【識別番号】397036309
【氏名又は名称】株式会社インターネットイニシアティブ
(74)【代理人】
【識別番号】100118902
【氏名又は名称】山本 修
(74)【代理人】
【識別番号】100106208
【氏名又は名称】宮前 徹
(74)【代理人】
【識別番号】100196508
【氏名又は名称】松尾 淳一
(74)【代理人】
【識別番号】100162846
【氏名又は名称】大牧 綾子
(72)【発明者】
【氏名】柿島 純
【審査官】千葉 久博
(56)【参考文献】
【文献】特開2012-8822(JP,A)
【文献】特開2006-39658(JP,A)
【文献】特開平5-40896(JP,A)
【文献】特許第7221445(JP,B1)
【文献】国際公開第2016/132683(WO,A1)
【文献】中国特許第116153086(CN,B)
【文献】本多克宏,“ファジィクラスタリングと混合確率分布のあいまいな境界”,知能と情報,日本,日本知能情報ファジィ学会,2018年06月15日,第30巻, 第3号,p.125-127
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00
G06T 7/70
(57)【特許請求の範囲】
【請求項1】
複数の地点に配置された各カメラで撮像された画像を
分割して得られるすべての要素のそれぞれを2値化することで、前記画像について2値からなる観測データを生成する2値変換部と、
機械学習により推定された最尤パラメータを持つ混合確率分布に基づいて、前記観測データを複数のクラスタのうち1つのクラスタに分類するクラスタリング部と、
分類された前記クラスタに対応付けられた事象を決定する事象割り当て部と、
を備える、情報処理装置。
【請求項2】
前記混合確率分布は、混合ベルヌーイ分布である、請求項1に記載の情報処理装置。
【請求項3】
前記機械学習は、EM(Expectation Maximization)アルゴリズムによる最尤推定である、請求項1に記載の情報処理装置。
【請求項4】
前記クラスタと、前記事象との対応関係を定める第1のルックアップテーブルを格納するデータ格納部さらに備え、
前記事象割り当て部は、前記第1のルックアップテーブルを参照して、前記画像に割り当てる事象を決定する、請求項1に記載の情報処理装置。
【請求項5】
前記データ格納部は、前記各カメラの識別子と、前記カメラの位置との対応関係を定める第2のルックアップテーブルを格納し、
前記画像に対応付けられる前記カメラの識別子を取得し、前記第2のルックアップテーブルを参照して、取得した前記カメラの識別子に対応するカメラの場所を特定する、場所特定部をさらに備える、請求項4に記載の情報処理装置。
【請求項6】
前記データ格納部は、前記画像を
分割して得られるすべての要素の各要素を2値化した訓練データのセットを格納し、
前記訓練データのセットを用いて、混合確率分布に基づく機械学習を実行して、前記混合確率分布の最尤パラメータを推定する機械学習部をさらに備え、
前記画像の訓練データには、予め事象が対応付けされている、請求項4に記載の情報処理装置。
【請求項7】
前記事象は、前記カメラの監視対象となる道路の交通の混雑度あるいは、前記カメラの監視対象となる河川の水位の程度である、請求項1に記載の情報処理装置。
【請求項8】
請求項1から7のいずれか1項に記載の情報処理装置と、
監視対象の異なる地点にそれぞれ配置された複数の前記カメラと
を備える、請求項1から7のいずれか1項に記載のシステム。
【請求項9】
情報処理装置において実施される方法であって、
複数の地点に配置された各カメラで撮像された画像を
分割して得られるすべての要素のそれぞれを2値化することで、前記画像について2値からなる観測データを生成することと、
機械学習により推定された最尤パラメータを持つ混合確率分布に基づいて、前記観測データを複数のクラスタのうち1つのクラスタに分類することと、
分類された前記クラスタに対応付けられた事象を決定することと、
を備える、方法。
【請求項10】
前記事象の決定は、前記クラスタと、前記事象との対応関係を定める第1のルックアップテーブルを参照して決定される、請求項9に記載の方法。
【請求項11】
前記画像に対応付けられる前記カメラの識別子を取得し、前記各カメラの識別子と、前記カメラの位置との対応関係を定める第2のルックアップテーブルを参照して、取得した前記カメラの識別子に対応するカメラの場所を特定することと、
をさらに備える、請求項9に記載の方法。
【請求項12】
前記要素は、前記要素に含まれる各ピクセルの色の平均の画素値が閾値よりも大きいか、小さいかの判定結果に基づいて、各要素の色を単純化することで2値化される、請求項1に記載の情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、情報処理装置、システムおよび方法に関する。より詳細には、本開示は、複数のカメラ画像を利用して、発生している事象を推定するための情報処理装置、システムおよび方法に関する。
【背景技術】
【0002】
近年、機械学習に関する研究が幅広く行われている。特に、深層学習と呼ばれる技術の発展により、人の認識能力と同等またはそれ以上の性能を示す学習モジュールが利用可能となってきている。
【0003】
機械学習の応用例として、特許文献1に示されるように、監視カメラ等を配して、これらのカメラで撮影した画像に映り込んだ人等の物体を、学習済物体検出用ニューラルネットワークモデルで検出し、学習済物体認識用ニューラルネットワークモデルを用いて検出した物体の認識を行うようにした装置やシステムが知られている。このシステムにおいては、監視カメラで撮影される画像に基づいて、映り込んだ物体の認識を行うことができる。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1の技術において、物理的に離れた複数のカメラで監視対象を撮像し、撮像した画像群に基づいて、発生している事象を特定することはできない。物理的に離れたカメラで撮影された画像群から機械学習により特徴を抽出し、監視対象で発生している事象、例えば自然災害や、交通状態を特定できることは非常に有用である。
【0006】
上記に鑑みて本開示の目的は、物理的に離れたカメラで撮影された画像群をクラスタ化し、画像から推定される事象を特定することを可能にする情報処理装置、システムおよび方法を提供することである。
【課題を解決するための手段】
【0007】
本開示の一実施形態による情報処理装置は、複数の地点に配置された各カメラで撮像された画像を構成する要素のそれぞれを2値化することで、前記画像について2値からなる観測データを生成する2値変換部と、機械学習により推定された最尤パラメータを持つ混合確率分布に基づいて、前記観測データを複数のクラスタのうち1つのクラスタに分類するクラスタリング部と、分類された前記クラスタに対応付けられた事象を決定する事象割り当て部と、を備えることを特徴とする。
【0008】
本開示の一実施形態による方法は、情報処理装置において実施される方法であって、複数の地点に配置された各カメラで撮像された画像を構成する要素のそれぞれを2値化することで、前記画像について2値からなる観測データを生成することと、機械学習により推定された最尤パラメータを持つ混合確率分布に基づいて、前記観測データを複数のクラスタのうち1つのクラスタに分類することと、分類された前記クラスタに対応付けられた事象を決定することと、を備える、ことを特徴とする。
【図面の簡単な説明】
【0009】
【
図1】本開示の一実施形態による、機械学習システムの構成例を概略的に示す図である。
【
図2】本開示の一実施形態による、収集分析装置を実現するハードウェア構成例である情報処理装置の概略構成図である。
【
図3】本開示の一実施形態による、推論部による事象割り当て処理の手順の一例を示すフローチャートである。
【
図4A】本開示の一実施形態による、観測した画像に含まれる複数の要素のそれぞれについての2値化を説明するための概略図である。
【
図4B】本開示の一実施形態による、観測した画像に含まれる複数の要素のそれぞれについての2値化を説明するための概略図である。
【
図5A】本開示の一実施形態による、推定対象となる事象が渋滞の程度のときの第1のルックアップテーブルを例示する。
【
図5B】本開示の一実施形態による、第2のルックアップテーブルを例示する。
【
図6】本開示の一実施形態による、パラメータ生成部によるパラメータ生成処理の手順の一例を示すフローチャートである。
【発明を実施するための形態】
【0010】
[本開示の実施形態の説明]
最初に、本開示の実施形態の内容を列記して説明する。本開示の一実施形態は、以下のような構成を備える。
【0011】
〔構成1〕 上記目的を達成するための情報処理装置の特徴構成は、複数の地点に配置された各カメラで撮像された画像を構成する要素のそれぞれを2値化することで、前記画像について2値からなる観測データを生成する2値変換部(42)と、機械学習により推定された最尤パラメータを持つ混合確率分布に基づいて、前記観測データを複数のクラスタのうち1つのクラスタに分類するクラスタリング部(43)と、分類された前記クラスタに対応付けられた事象を決定する事象割り当て部(44)と、を備える、点にある。
【0012】
〔構成2〕 本開示に係る情報処理装置の別の特徴構成は、前記混合確率分布は、混合ベルヌーイ分布である、点にある。
【0013】
〔構成3〕 本開示に係る情報処理装置の別の特徴構成は、前記機械学習は、EM(ExpectationMaximization)アルゴリズムによる最尤推定である、点にある。
【0014】
〔構成4〕 本開示に係る情報処理装置の別の特徴構成は、前記クラスタと、前記事象との対応関係を定める第1のルックアップテーブル(53)を格納するデータ格納部(50)さらに備え、前記事象割り当て部は、前記第1のルックアップテーブルを参照して、前記画像に割り当てる事象を決定する、点にある。
【0015】
〔構成5〕 本開示に係る情報処理装置の別の特徴構成は、前記データ格納部は、前記各カメラの識別子と、前記カメラの位置との対応関係を定める第2のルックアップテーブルを格納し、前記画像に対応付けられる前記カメラの識別子を取得し、前記第2のルックアップテーブルを参照して、取得した前記カメラの識別子に対応するカメラの場所を特定する、場所特定部(45)をさらに備える、点にある。
【0016】
〔構成6〕 本開示に係る情報処理装置の別の特徴構成は、前記データ格納部は、前記画像を構成する各要素を2値化した訓練データのセットを格納し、前記訓練データのセットを用いて、混合確率分布に基づく機械学習を実行して、前記混合確率分布の最尤パラメータを推定する機械学習部(48)をさらに備え、前記画像の訓練データには、予め事象が対応付けされている、点にある。
【0017】
〔構成7〕 本開示に係る情報処理装置の別の特徴構成は、前記事象は、前記カメラの監視対象となる道路の交通の混雑度あるいは、前記カメラの監視対象となる河川の水位の程度である、点にある。
【0018】
〔構成8〕 本開示に係るシステムの別の特徴構成は、請求項1から7のいずれか1項に記載の情報処理装置と、監視対象の異なる地点にそれぞれ配置された複数の前記カメラとを備える、点にある。
【0019】
〔構成9〕 上記目的を達成するための方法の特徴構成は、情報処理装置において実施される方法であって、複数の地点に配置された各カメラで撮像された画像を構成する要素のそれぞれを2値化することで、前記画像について2値からなる観測データを生成することと(S304)、機械学習により推定された最尤パラメータを持つ混合確率分布に基づいて、前記観測データを複数のクラスタのうち1つのクラスタに分類することと(S306)、分類された前記クラスタに対応付けられた事象を決定することと(S308)、を備える、点にある。
【0020】
〔構成10〕 本開示に係る方法の別の特徴構成は、前記事象の決定は、前記クラスタと、前記事象との対応関係を定める第1のルックアップテーブルを参照して決定される(S308)、点にある。
【0021】
〔構成11〕 本開示に係る方法の別の特徴構成は、前記画像に対応付けられる前記カメラの識別子を取得し、前記各カメラの識別子と、前記カメラの位置との対応関係を定める第2のルックアップテーブルを参照して、取得した前記カメラの識別子に対応するカメラの場所を特定することと(S310)、をさらに備える、点にある。
【0022】
[本開示の実施形態の詳細]
以下、本開示の実施形態について図面を参照して説明する。なお、以下の説明はあくまでも一例を示すものであって、本願発明の技術的範囲を以下の実施形態に限定する趣旨ではない。図面において、同一または類似の要素には同一または類似の参照符号が付され、各実施形態の説明において同一または類似の要素に関する重複する説明は省略することがある。また、各実施形態で示される特徴は、互いに矛盾しない限り他の実施形態にも適用可能である。しかし、本開示の実施形態は、必ずしもこのような態様に限定されない。本開示の実施形態が、特許請求の範囲において規定される範囲に含まれる様々な態様を取り得ることは、当業者にとって明らかであろう。
【0023】
図1は、本開示の一実施形態による、機械学習システム100の構成例を概略的に示す図である。
図1に示されるように、機械学習システム100は、複数のカメラ11
1~11
Nと、収集分析装置40とを備えて構成される。Nは、2以上の整数である。カメラ11
1~11
Nは、配置されている地点の画像をリアルタイムで取得する監視カメラである。カメラ11
1~11
Nは、監視対象の異なる地点にそれぞれ配置される。例えば、監視対象が道路のとき、カメラ11
1~11
Nは道路の異なる場所(高速道路のインターチェンジや、橋など)に配置された交通監視カメラ、監視対象が川のとき、川の異なる場所(上流、中流、下流など)に配置された流域カメラである。カメラ11
1~11
Nは、白黒画像を取得するカメラであっても、カラー画像または映像を撮影するカメラであってもよい。
【0024】
以下において、
図1に示す機械学習システム100を構成する各エンティティについて説明をする。
【0025】
カメラ11
1~11
Nは、それぞれデータネットワーク(DN)70を介して収集分析装置40に接続される。カメラ11
1~11
Nはそれぞれ画像を取得し、取得した画像を、DN70を介してそれぞれ収集分析装置40に送信する。
図1は、カメラ11
1が取得した画像12
1、カメラ11
2が取得した画像12
2、カメラ11
3が取得した画像12
3、カメラ11
4が取得した画像12
4、カメラ11
Nが取得した画像12
Nをそれぞれ例示する。画像12
1から12
Nはそれぞれほぼ同じ時刻に取得されたものである。
【0026】
収集分析装置40は、推論部41と、パラメータ生成部47と、データ格納部50とを備える。
【0027】
推論部41は、2値変換部42と、クラスタリング部43と、事象割り当て部44と、場所特定部45とを備える。推論部41の構成については後で詳述する。
【0028】
パラメータ生成部47は、訓練データセット51を用いて混合確率分布に基づく機械学習を実行して当該混合確率分布の最尤パラメータを推定する機械学習部48を備える。パラメータ生成部47の構成については後で詳述する。
【0029】
データ格納部50には、訓練データセット51と、訓練データセット51を用いて機械学習により推定された最尤パラメータをもつ混合確率分布のパラメータ群を示すパラメータデータ52と、第1のルックアップテーブル53と、第2のルックアップテーブル54が格納される。訓練データセット51は、パラメータ生成部47用のパラメータデータ52の生成のために使用されるデータセットである。
【0030】
パラメータ生成部47は、適当なタイミングでパラメータデータ52をデータ格納部50に格納する。推論部41は、当該パラメータデータ52を読み出して、これを利用することができる。
【0031】
上記した機械学習システム100の収集分析装置40は、1つ以上のプロセッサを含む1台のコンピュータで実現されてもよいし、あるいは、通信路を介して相互接続された複数台のコンピュータで実現されてもよい。収集分析装置40の各機能部の全部または一部は、不揮発性メモリ(コンピュータ読み取り可能な記録媒体)から読み出されたコンピュータプログラムのコード(命令群)による処理を実行する1つまたは複数の演算装置(Processing Units)を含む1つ以上のプロセッサで実現可能である。たとえば、演算装置としては、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)またはNPU(Neural Network Processing Unt)が使用できる。
【0032】
図2は、本開示の一実施形態による、収集分析装置40を実現するハードウェア構成例である情報処理装置(コンピュータ)200の概略構成図である。情報処理装置200は、複数個のプロセッサコアμC,…,μCを含むプロセッサ201と、ランダムアクセスメモリ(RAM:Random Access Memory)202と、不揮発性メモリ203と、大容量メモリ204と、入出力インターフェース205と、信号路206とを含んで構成されている。信号路206は、プロセッサ201、RAM202、不揮発性メモリ203、大容量メモリ204および入出力インターフェース205を相互に接続するためのバスである。RAM202は、プロセッサ201がディジタル信号処理を実行する際に使用されるデータ記憶領域である。不揮発性メモリ203は、プロセッサ201により実行されるコンピュータプログラムのコード(命令群)が格納されているデータ記憶領域を有する。
【0033】
次に、
図3から
図5を参照しつつ、収集分析装置40の推論部41の処理のフローについて以下に詳細に説明する。
図3は、本開示の一実施形態による、推論部41による事象割り当て処理等の手順300の一例を示すフローチャートである。
【0034】
まず、ステップS302おいて、2値変換部42(
図1)は、各カメラ11
1~11
Nがそれぞれ撮像した画像を収集する。画像は各カメラ11
1~11
Nがほぼ同じ時刻にリアルタイムで撮像した画像である。
【0035】
次に、ステップS304において、2値変換部42は、収集した画像のそれぞれについて、画像を構成するすべての要素ごとに白黒の2階調を表す2値からなる観測データxnを生成する。画像を構成する要素はピクセルであってもよいし、複数のピクセルからなるブロックであってもよい。各カメラ111~11Nが撮像する画像のピクセル数が異なる場合、各カメラで撮像される画像が同じブロック数で構成されるように、2値変換部42はピクセル数に応じて、画像を分割するブロック数を調整することができる。つまり、分割数は、固定でも入力画像の条件に従って可変としてもよい。
【0036】
図4Aおよび
図4Bは、本開示の一実施形態による、観測した画像400に含まれる複数の要素のそれぞれについての2値化を説明するための概略図である。
図4Aは、1のカメラ11がある時間に撮像した画像400の一部を例示する。画像400は、複数の要素で構成され、各要素はグレースケールで表されている。図示例において要素401、403は黒色に近く、要素402は白色に近い。
【0037】
2値変換部42は、画像を構成する各要素(ブロックまたはピクセル)を2値化し、当該画像について2値からなる観測データx
nを生成することができる。例えば、要素がブロックのとき、ブロックを構成する各ピクセルの色の平均の画素値を求め、この平均の画素値が閾値より大きいか、小さいかを判定し、各ブロックの色を単純化(白と黒の2値化)する。あるいは、ブロック内で最も明るいピクセルの画素値をブロックの画素値とし、この画素値が閾値より大きいか小さいかに基づいて、ブロックの色を2値化してもよい。観測された画像400がカラー画像であっても、2値変換部42は各要素の画素値に基づいて、各要素を2値化することができる。2値変換部42は、画像400の
図4Aのすべての要素を、例えば画像400の左上から右下に向けて順に2値化し、画像400の観測データx
nを生成する。2値変換部42は、各カメラ11
1~11
Nが撮像した全ての画像について、同じ手順で二値化し、それぞれ観測データx
nを生成する。
【0038】
図4Bは、本開示の一実施形態による、
図4Aに示される観測された画像について、当該画像を構成する要素(例えばブロック)から生成される観測データx
nを例示する図である。
図4Bの例では、
図4Aに示す要素の色が黒色に近い(要素401、403)ときの観測データ値は「1」、
図4Aに示す要素の色が白色に近い(要素402)ときの観測データ値は「0」となる。観測データx
nは、「0」または「1」の値をとる2値変数を要素とする2値ベクトルとして表現されている。
図4Bの例では、
図4Aに対応する画像の観測データx
nは、ビット列
(1,0,0…0,1,1,0,0,1…0,1,1,0,0,1…1,1,1,……0,0,1…1,1,1,0,1,1…0,1,0)
のベクトルとなる。
【0039】
上述したようにパラメータ生成部47(
図1)は、機械学習により推定された最尤パラメータをもつ混合確率分布のパラメータ群を示すパラメータデータ52をデータ格納部50に格納する。推論部41は、データ格納部50からパラメータデータ52を読み出しし、当該パラメータデータ52を利用することができる。
【0040】
次に、ステップS306において、クラスタリング部43(
図1)は、データ格納部50から読み出したパラメータデータ52を利用して、当該パラメータデータ52で示される混合確率分布のパラメータ群を用いたクラスタリング(クラスタ分類)を実行する。すなわち、クラスタリング部43は、当該パラメータデータ52で示される混合確率分布に基づいて、観測データx
nを複数のクラスタのうちの1つのクラスタに分類することができる。
【0041】
本実施形態では、観測データxnの要素である2値変数の各々は、ベルヌーイ分布に従うと考えることができるから、当該パラメータデータ52で示される混合確率分布として混合ベルヌーイ分布が使用できる。機械学習としては、EM(Expectation-Maximization)アルゴリズムによる尤度推定法が使用可能である。
【0042】
混合ベルヌーイ分布のEMアルゴリズムによる最尤推定法によれば、観測データxnがk番目のクラスタに所属する割合は、負担率γnkで計算可能である。負担率γnkは、次式(1)で表される。
【0043】
【0044】
ここで、πk,μkは、EMアルゴリズムによる最尤推定法により推定された最尤パラメータである。
【0045】
ステップS306において、クラスタリング部43は、観測データxnを、負担率γn1,…,γnKのうちの最も高い負担率に対応するクラスタに分類することができる。観測データxnは、共通の特徴を有するクラスタに分類される。
【0046】
次に、ステップS308において、事象割り当て部44(
図1)は、第1のルックアップテーブル53を参照して、観測データx
nが分類された当該クラスタに対応付けされている事象を決定する。データ格納部50内の第1のルックアップテーブル53には、クラスタと事象との対応関係が予め定められている。事象は、例えば、監視対象となる道路の交通の混雑度(渋滞している、やや渋滞している、空いている)、あるいは監視対象となる河川の水位の程度(水位が低い、中位、高位)とすることができる。
【0047】
図5Aは、本開示の一実施形態による、推定対象となる事象が渋滞の程度のときの第1のルックアップテーブル53を例示する。図示例において、クラスタ1に事象1(監視対象となる道路が空いている)、クラスタ2に事象2(やや渋滞している)、クラスタ3に事象3(渋滞)が割り当てられている。あるいは、推定対象となる事象が河川の氾濫の程度のとき、クラスタ1に事象1(監視対象となる川が、通常の水位よりも低い低水位)、クラスタ2に事象2(中水位)、クラスタ3に事象3(通常の水位よりも高い高水位)、クラスタ4に事象4(氾濫の危険が高まる危険水位)、クラスタ5に事象5(氾濫)等を割り当てることができる。
【0048】
次に、ステップS310において、場所特定部45は、第2のルックアップテーブル54を参照して、事象(例えば渋滞の程度)が発生している区間を特定する。
【0049】
図5Bは、本開示の一実施形態による、第2のルックアップテーブル54を例示する。第2のルックアップテーブル54には、カメラ11
1~11
Nの識別子(例えばカメラのIPアドレス)と、監視対象に配置されるカメラ11
1~11
Nの場所(例えば、起点からの距離)との対応関係が予め定められている。
図5Bにおいて、例えば、カメラ11
1は起点に配置されており起点からの距離は0km、カメラ11
Nは起点からの距離は100kmである。場所特定部45は、各観測データx
nに対応するカメラ識別子をそれぞれ取得し、第2のルックアップテーブル54を参照して、各カメラ識別子に対応するカメラが配置されている場所(例えば、起点からの距離)をそれぞれ決定する。場所特定部45は、観測データx
nに対応付けられた事象と、観測データx
nに対応付けられたカメラの場所とに基づいて事象が発生している区間、あるいは場所を特定することができる。場所特定部45は、監視対象が道路の場合、道路が渋滞している区間や場所、あるいは監視対象が川の場合、川が氾濫している区間や場所を特定することができる。
図1の例では、場所特定部45は、カメラ11
2からカメラ11
4が設置されている区間を渋滞区間と特定している。
【0050】
場所特定部45は、特定した事象と、事象が発生している区間や場所とを含む情報を、ネットワークを介して、不図示の別の端末(サーバやユーザ端末)に送信することができる。
【0051】
以上に説明したとおり、事象割り当て部44は、各カメラ111~11Nについて取得された画像について、それぞれの画像を構成する各要素の2値からなる観測データxnを用いて、機械学習により推定された最尤パラメータをもつ混合確率分布に基づくクラスタリング(クラスタ分類)を実行し、観測データxnが分類された当該クラスタに対応付けされた事象を決定することができる。場所特定部45は、各観測データxnに対応付けられるカメラの識別子から、事象が発生している場所を特定することができる。
【0052】
次に、
図6を参照しつつ、パラメータ生成部47(
図1)の処理について以下に詳細に説明する。
図6は、本開示の一実施形態による、パラメータ生成部47によるパラメータ生成処理の手順600の一例を示すフローチャートである。
【0053】
訓練データセット51(
図1)は、
図5の観測データに相当する訓練データx
nの集合からなる。訓練データセット51は、0と1のランダムビット列を発生するアルゴリズムで生成することができる。訓練データセット51はカメラが取得した画像から作成してもよい。訓練データx
nには、それぞれ、予め各事象が対応付けされている。以下、訓練データセット51に基づくパラメータデータ52の生成方法について説明する。
【0054】
ステップS602において、機械学習部48(
図1)は、データ格納部50から訓練データセット51を読み出しする。
【0055】
次に、ステップS604において、機械学習部48は、読み出した訓練データセット51を用いて、混合確率分布に基づく機械学習を実行して当該混合確率分布の最尤パラメータを推定する。
【0056】
次に、ステップS606において、機械学習部48は、推定された最尤パラメータをもつ混合確率分布のパラメータ群をパラメータデータ52としてデータ格納部50に格納する。
【0057】
ここで、ステップS604における、機械学習部48の実行する、混合ベルヌーイ分布のEMアルゴリズムによる最尤推定法の手順を以下に説明する。
【0058】
N個の2値ベクトルx1,x2,…,xNの集合すなわち2値データセットXが、K個のパラメータベクトルμ1,μ2,…,μKの集合すなわちパラメータデータセットMをもつ混合ベルヌーイ分布に従うものとする。2値データセットXとパラメータデータセットMとは、それぞれ次式のように表される(Tは転置記号である。)。
【0059】
【0060】
ここで、n番目の2値ベクトルxnとk番目のパラメータベクトルμkの各々は、以下のようにD個の要素をもつベクトルとして表される。
【0061】
【0062】
2値ベクトルxnの要素xn(i)(i=1,2,…,D)の各々は、0または1の値をとる2値変数である。各2値ベクトルxnは、次の混合ベルヌーイ分布によって独立に生成されるものとする。
【0063】
【0064】
ここで、πは、K個の混合比率からなるパラメータデータセットであり、次式で表され得る。
【0065】
【0066】
対数尤度関数P(X|M,π)は、次式で表される。
【0067】
【0068】
対数尤度関数P(X|M,π)は、次式で表される。
【0069】
【0070】
EMアルゴリズムは、尤度(上記の尤度関数(X|M,π)または対数尤度関数P(X|M,π))が極大となるように混合ベルヌーイ分布のパラメータデータセットM,πの最尤解を求める手法である。
【0071】
先ず、機械学習部48は初期ステップを実行する。すなわち、パラメータデータM={μ1,μ2,…,μK},π={π1,π2,…,πK}および尤度を初期化する。πKの初期値は均等になるように1/Kとし、μkの初期値は正規分布(平均値=1/2、分散σ2)とする。
【0072】
次に、Eステップを実行する。すなわち、次式に従って、現在のパラメータセットM,πを用いて負担率(Responsibility)と呼ばれる値γnkを算出する。負担率γnkは、2値ベクトルxnがk番目のクラスタに所属する割合を表している。
【0073】
【0074】
次に、機械学習部48はMステップを実行する。すなわち、次式に従って、現在の負担率γnkを用いてパラメータセットM,πを更新する。
【0075】
【0076】
次に、機械学習部48は所定の収束条件を満たしているか否かを判定する。具体的には、尤度が所定の数値範囲内に収束しているか、パラメータセットM,πが収束しているか、あるいは、尤度とパラメータセットM,πがともに収束していれば、収束条件が満たされていると判定すればよい。収束条件が満たされていないと判定されたときは、Eステップに戻って繰り返し計算する。所定回数または一定時間繰り返し計算しても所定の収束条件が得られないときは、パラメータセットM,πおよびクラスタ数Kのうちのいずれかまたは全部を変更して、初期ステップからの処理を実行すればよい。
【0077】
以上、本発明の実施の形態について説明してきたが、上記した発明の実施の形態は、本発明の理解を容易にするためのものであり、本発明を限定するものではない。本発明は、その趣旨を逸脱することなく、変更、改良され得るとともに、本発明にはその均等物が含まれることはもちろんである。また、上述した課題の少なくとも一部を解決できる範囲、または、効果の少なくとも一部を奏する範囲において、実施形態および変形例の任意の組み合わせが可能であり、特許請求の範囲および明細書に記載された各構成要素の任意の組み合わせ、または、省略が可能である。
【符号の説明】
【0078】
100…機械学習システム
111~11N…カメラ
40…収集分析装置
41…推論部
42…2値変換部
43…クラスタリング部
44…事象割り当て部
45…場所特定部
47…パラメータ生成部
48…機械学習部
50…データ格納部
51…訓練データ
52…パラメータデータ
53…第1のルックアップテーブル
54…第2のルックアップテーブル
70…データネットワーク
【要約】 (修正有)
【課題】物理的に離れたカメラで撮影された画像群をクラスタ化し、画像から推定される事象を特定することを可能にする情報処理装置、システムおよび方法を提供する。
【解決手段】機械学習システム100において、収集分析装置を実現する情報処理装置の推論部は、複数の地点に配置された各カメラ11
1~11
Nで撮像された画像12
1~12
Nを構成する要素のそれぞれを2値化することで、画像について2値からなる観測データを生成する2値変換部と、機械学習により推定された最尤パラメータを持つ混合確率分布に基づいて、観測データを複数のクラスタのうち1つのクラスタに分類するクラスタリング部と、分類されたクラスタに対応付けられた事象を決定する事象割り当て部と、を備える。
【選択図】
図1