特許7225731 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特許7225731多変数データシーケンスの画像化

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-02-13

(45)【発行日】2023-02-21

(54)【発明の名称】多変数データシーケンスの画像化

(51)【国際特許分類】

G06T 1/00 20060101AFI20230214BHJP

G06T 7/00 20170101ALI20230214BHJP

【ＦＩ】

G06T1/00 510

G06T7/00 350C

【請求項の数】 11

(21)【出願番号】P 2018219065

(22)【出願日】2018-11-22

(65)【公開番号】P2020004360

(43)【公開日】2020-01-09

【審査請求日】2021-08-10

(31)【優先権主張番号】18181012.8

(32)【優先日】2018-06-29

(33)【優先権主張国・地域又は機関】EP

(73)【特許権者】

【識別番号】000005223

【氏名又は名称】富士通株式会社

(74)【代理人】

【識別番号】100107766

【弁理士】

【氏名又は名称】伊東忠重

(74)【代理人】

【識別番号】100070150

【弁理士】

【氏名又は名称】伊東忠彦

(72)【発明者】

【氏名】シャトン・トマ

【審査官】山口大志

(56)【参考文献】

【文献】特開２０１８－０２６１０８（ＪＰ，Ａ）

【文献】特開２０１２－２０３４２２（ＪＰ，Ａ）

【文献】Waqas Javed，Graphical Perception of Multiple Time Series，IEEE Transactions on Visualization and Computer Graphics，米国，2010年10月28日，Vol. 16, No. 6，927-934

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｔ１／００

Ｇ０６Ｔ７／００

ＩＥＥＥＸｐｌｏｒｅ

(57)【特許請求の範囲】

【請求項1】

多変数データセットを分類するためのデータ分類方法であって、
指定された多変数データセットについて、複数の重畳線グラフを有するデジタル画像を生成するステップであって、各線グラフは、前記多変数データセットの中の複数の変数のうちの異なる１つに対応し、前記多変数データセットの連続データアイテムに関連する変数の個々の値を表す、ステップと、
前記多変数データセットの各データアイテムについてカラライゼーション処理を実行することにより、前記生成されたデジタル画像を色付けするステップであって、前記カラライゼーション処理は、
前記データアイテムの中の正値を有する各変数について、該変数に予め割り当てられた色及び前記データアイテムの平均値に依存して、該変数の前記線グラフの下の領域を表すピクセルに色値を割り当てるステップと、
前記データアイテムの中の負値を有する各変数について、該変数に予め割り当てられた色及び前記データアイテムの平均値に依存して、該変数の前記線グラフの上の領域を表すピクセルに色値を割り当てるステップと、
前記線グラフの少なくとも２つの領域が重なり合うピクセルについて、前記色値を加算するステップと、を有する、ステップと、
前記色付けされた画像を格納するステップと、
データ分類の目的で画像認識のために訓練された深層ニューラルネットワークに、前記色付けされた画像及び少なくとも１つの予め分類された画像を入力するステップと、
前記色付けされた画像を各々の予め分類された画像と比較するステップと、
前記色付けされた画像と各予め分類された画像との間の類似度に従い、前記多変数データセットを分類するステップと、
をコンピュータが実行するデータ分類方法。

【請求項2】

色値を割り当てるステップは、
前記データアイテムの中の前記変数の値が正か負かに従い、前記変数を分けるステップと、
前記データアイテムの全ての正の変数値を、最大値から最小値へと並べるステップであって、前記正の変数値に対応する前記線グラフの下の領域について、該領域のピクセルに順番に再帰的に色を割り当てる、ステップと、
前記データアイテムの全ての負の変数値を、最大値から最小値へと並べるステップであって、前記負の変数値に対応する前記線グラフの上の領域について、該領域のピクセルに順番に再帰的に色を割り当てる、ステップと、
を有する、請求項１に記載のデータ分類方法。

【請求項3】

各変数の色は、前記データアイテムの前記平均値に対する前記変数の値の比、及び前記変数の値と前記データアイテムの前記平均値の積、のうちの１つに従い割り当てられる、請求項１又は２に記載のデータ分類方法。

【請求項4】

前記平均値はＬ２ノルムである、請求項１、２、又は３に記載のデータ分類方法。

【請求項5】

多変数データセットの中の潜在的な例外を検出するための例外検出方法であって、コンピュータが、
コンピュータにより実施される、多変数データセットを分類するためのデータ分類方法であって、
指定された多変数データセットについて、複数の重畳線グラフを有するデジタル画像を生成するステップであって、各線グラフは、前記多変数データセットの中の複数の変数のうちの異なる１つに対応し、前記多変数データセットの連続データアイテムに関連する変数の個々の値を表す、ステップと、
前記多変数データセットの各データアイテムについてカラライゼーション処理を実行することにより、前記生成されたデジタル画像を色付けするステップであって、前記カラライゼーション処理は、
前記データアイテムの中の正値を有する各変数について、該変数に予め割り当てられた色及び前記データアイテムの平均値に依存して、該変数の前記線グラフの下の領域を表すピクセルに色値を割り当てるステップと、
前記データアイテムの中の負値を有する各変数について、該変数に予め割り当てられた色及び前記データアイテムの平均値に依存して、該変数の前記線グラフの上の領域を表すピクセルに色値を割り当てるステップと、
前記線グラフの少なくとも２つの領域が重なり合うピクセルについて、前記色値を加算するステップと、を有する、ステップと、
前記色付けされた画像を格納するステップと、
データ分類の目的で画像認識のために訓練された深層ニューラルネットワークに、前記色付けされた画像及び予め分類された画像を入力するステップと、
前記色付けされた画像を前記予め分類された画像と比較するステップと、
前記色付けされた画像と前記予め分類された画像との間の相違度に従い、前記多変数データセットを例外として分類するステップと、
を実行する例外検出方法。

【請求項6】

コンピュータに格納されると、該コンピュータに請求項１～４のいずれか一項に記載のデータ分類方法、又は請求項５に記載の例外検出方法を実行させるコンピュータプログラム。

【請求項7】

画像分類機器であって、
指定された多変数データセットについて、複数の重畳線グラフを有するデジタル画像を生成するデジタル画像生成器であって、各線グラフは、前記多変数データセットの中の複数の変数のうちの異なる１つに対応し、前記多変数データセットの連続データアイテムに関連する変数の個々の値を表す、デジタル画像生成器と、
前記多変数データセットの各データアイテムについてカラライゼーション処理を実行することにより、前記生成されたデジタル画像を色付けする画像色付け器であって、前記カラライゼーション処理は、
前記データアイテムの中の正値を有する各変数について、該変数に予め割り当てられた色及び前記データアイテムの平均値に依存して、該変数の前記線グラフの下の領域を表すピクセルに色値を割り当てるステップと、
前記データアイテムの中の負値を有する各変数について、該変数に予め割り当てられた色及び前記データアイテムの平均値に依存して、該変数の前記線グラフの上の領域を表すピクセルに色値を割り当てるステップと、
前記線グラフの少なくとも２つの領域が重なり合うピクセルについて、前記色値を加算するステップと、を有する、画像色付け器と、
前記色付けされた画像を格納する画像記憶装置と、
分類システムであって、
データ分類の目的で画像認識のために訓練された深層ニューラルネットワークに、前記色付けされた画像及び少なくとも１つの予め分類された画像を入力し、
前記色付けされた画像を各々の予め分類された画像と比較し、
前記色付けされた画像と各予め分類された画像との間の類似度に従い、前記多変数データセットを分類する、分類システムと、
を有する画像分類機器。

【請求項8】

前記画像色付け器は、
前記データアイテムの中の前記変数の値が正か負かに従い、前記変数を分け、
前記データアイテムの全ての正の変数値を、最大値から最小値へと並べ、前記正の変数値に対応する前記線グラフの下の領域について、該領域のピクセルに順番に再帰的に色を割り当て、
前記データアイテムの全ての負の変数値を、最大値から最小値へと並べ、前記負の変数値に対応する前記線グラフの上の領域について、該領域のピクセルに順番に再帰的に色を割り当てる、
ことにより、色値を割り当てる、請求項７に記載の画像分類機器。

【請求項9】

前記画像色付け器は、前記データアイテムの前記平均値に対する前記変数の値の比、及び前記変数の値と前記データアイテムの前記平均値の積、のうちの１つに従い各変数の色を割り当てる、請求項７又は８に記載の画像分類機器。

【請求項10】

前記平均値はＬ２ノルムである、請求項７～９のいずれか一項に記載の画像分類機器。

【請求項11】

例外検出機器であって、
指定された多変数データセットについて、複数の重畳線グラフを有するデジタル画像を生成するデジタル画像生成器であって、各線グラフは、前記多変数データセットの中の複数の変数のうちの異なる１つに対応し、前記多変数データセットの連続データアイテムに関連する変数の個々の値を表す、デジタル画像生成器と、
前記多変数データセットの各データアイテムについてカラライゼーション処理を実行することにより、前記生成されたデジタル画像を色付けする画像色付け器であって、前記カラライゼーション処理は、
前記データアイテムの中の正値を有する各変数について、該変数に予め割り当てられた色及び前記データアイテムの平均値に依存して、該変数の前記線グラフの下の領域を表すピクセルに色値を割り当てるステップと、
前記データアイテムの中の負値を有する各変数について、該変数に予め割り当てられた色及び前記データアイテムの平均値に依存して、該変数の前記線グラフの上の領域を表すピクセルに色値を割り当てるステップと、
前記線グラフの少なくとも２つの領域が重なり合うピクセルについて、前記色値を加算するステップと、を有する、画像色付け器と、
前記色付けされた画像を格納する画像記憶装置と、
分類システムであって、
データ分類の目的で画像認識のために訓練された深層ニューラルネットワークに、前記色付けされた画像及び予め分類された画像を入力し、
前記色付けされた画像を前記予め分類された画像と比較し、
前記色付けされた画像と前記予め分類された画像との間の相違度に従い、前記多変数データセットを例外として分類する、分類システムと、
を有する例外検出機器。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、画像処理に関し、特に多変数データセットの画像化（imagification）に関する。

【背景技術】

【0002】

画像化（imagification）は、データのレコード、又は複数のレコードのウインドウを、画像として順次提示する処理である。例えば、各レコード又はウインドウは、自動画像認識技術を用いて該レコード又はウインドウを分類する又はそれらに基づき予測を生成するために使用され得る、対応する画像との１対１関係を共有する。特に、画像化（imagification）は、通常要求されるより有意に少ないデータにより正確な自動分類を可能にする転移学習手法に基づく畳み込みニューラルネットワークと結合されるよう設計された。

【0003】

ニューラルネットワークは、ユニット間のエッジにおける数値重みに従って（入力レイヤにある）入力ベクトルを（出力レイヤにある）出力ベクトルにマッピングする人工ユニットの階層化ネットワークである。重みは、訓練アルゴリズムに従い調整される。複数のレイヤを有するニューラルネットワークは、深層ニューラルネットワーク（Deep Neural Network：ＤＮＮ）として知られる。畳み込みニューラルネットワーク（Convolutional Neural Network：ＣＮＮ）は、各レイヤのニューロンがフィルタにグループ化され、各フィルタが入力データの中の異なる重複する特徴の存在又は不存在を検出する、特定の種類のＤＮＮである。添付図面の図１に示すように、ＣＮＮの複数レイヤのニューラルネットワークアーキテクチャは、１又は複数の畳み込みレイヤ、それに続くサンプリングレイヤ（プーリング、pooling）及び１又は複数の完全に接続されたレイヤ、を有して良い。ＤＮＮは、及び特定のＣＮＮでは、多くの作業において、画像を分類する際に高度に正確であることが証明されている。非画像データを画像に変換することにより、このようなネットワークの分類の精密さが利用され任意のデータセットに適用できる。

【0004】

さらに、分類に加えて、ＣＮＮは、画像から特徴ベクトル（各画像を一意に識別する数値のベクトル）を抽出するために使用できる。２つの類似する画像は２つの類似するベクトルを有するので、ｋ最近隣モデル（又は任意のベクトルに基づく分類器）は、クエリされた画像のベクトルの既にモデルにより分かっている画像のベクトルに対する類似性に基づき、画像を分類できる。最近の研究は、ＣＮＮが、画像から特徴を抽出し抽出した特徴を用いて画像認識を実行する強力且つ正確な手段を提供することを証明した。このような方法で特徴ベクトルを抽出する訓練されたＣＮＮの能力は、例え異なる主題領域からの、ＣＮＮが未だ知らない画像にも広がる。訓練されたニューラルネットワーク（又は実際には任意のモデル）を異なるが類似する領域の問題に適用する過程は、「転移学習（transfer learning）」と呼ばれ、新しい問題に対する解が通常必要とされるより有意に少ないデータにより訓練されることを可能にする。したがって、任意の画像に対して訓練されたＣＮＮを通じる転移学習は、比較的小さなデータセットから取り込まれるときでさえ、画像化データサンプルを分類する方法を提供する。

【0005】

時系列データの中の傾向を分類することは、他の領域における時系列データの特徴の分類（例えば、複合的な複数活動データの分類）のために、金融（例えば、株式市場予測）のような幾つかの領域において困難であると分かった。しかし、このデータを画像として表現し、予め訓練されたＣＮＮを用いて複合的な特徴を抽出することにより、これらの特徴を予測のために使用することが可能になる。特に、所与の時間枠の範囲内の時系列データの画像が与えられる場合、ＣＮＮから抽出した特徴ベクトルを入力として取り入れて過去から類似する時系列データを取り出すために、画像類似法が使用できる。

【0006】

時系列データは、多変数であり得るデータ系列の一例である。したがって、このようなデータを、直接分類を実行するＣＮＮを用いて、ＣＮＮに基づく転移学習を用いて、又は任意の他の画像分類方法を用いて、分類できるように、多変数データを該データを正確に表す画像に変換する必要がある。

【0007】

参照により内容がここに組み込まれるＥＰ３２３９８９７Ａ１は、多変数データに適用される画像化技術を提案している。この技術では、データは、スライドウインドウに従いセグメントに分割され、各データセグメントについて、異なる色チャネル（例えば、赤、緑、青）が、それぞれ、そのレコードの中の異なる連続変数にマッピングされ、これらの変数のベクトルがプロットの振幅にマッピングされる。

【0008】

つまり、多変数データは、座標をシーケンスの中の各データ点から何らかの色空間の中の値にマッピングすることにより、画像化される。例えば、添付の図面の図２（ｂ）に示すように、例えば手首に装着した加速度計により測定された、加速度についてのｘ、ｙ及び（図示しない）ｚの値は、ＲＧＢ色空間の中のそれぞれ赤、緑、及び青色値にマッピングされる。シーケンスの中の各データ点について、ｘ、ｙ、ｚ値のベクトルは、このマッピングにより生成された色によりプロットされ、添付の図面の図２（ａ）に示すように画像化ウインドウを生成する。図２（ａ）では、異なる色が異なる種類のハッチングにより表される。プロットの位置、プロットのパターン、プロットのサイズ、プロットの形状、又はプロットの透明性のような他の画像属性が、データ値をマッピングするために色の代わりに使用されて良い。

【0009】

ＥＰ３２３９８９７Ａ１は、時間Ｔにおいて３Ｄ時系列Ｌ２（ユークリッド）ノルムを用いる変換は、画像内のプロットの高さを符号化するために使用されて良い。Ｌ２ノルム（「ｌ^２－ｎｏｒｍ」としても記述される）｜ｘ｜は、以下のベクトルについて定められるベクトルノルムである。

【数1】

【0010】

（言葉では、Ｌ２ノルムは次のように定められる：（１）ベクトル内の全部の要素を平方する；（２）これらの平方した値を加算する；及び（３）この和の平方根をとる）。

【0011】

多変数データ系列が画像に変換された後に、特徴は、次に、このような画像から抽出されて、任意の２つの画像の間の、したがって該画像が導出されたデータ点の間の、類似性が計算されて良い。特徴は、数値又はカテゴリ値を有して良く、通常、アルゴリズム処理のためのＮ次元ベクトル空間として表される（ここで、Ｎは特徴の全体数に対応する）。目標は、データの固有特性を表すことのできる有益な特徴セットを確立すると同時に、モデルの特定のデータセットへの過学習を抑制するために十分に汎用的であることである。

【0012】

特徴は、ＣＮＮ又は任意の他の適切な特徴抽出方法を用いて抽出されて良く、類似性は、コサイン距離又は任意の他の適切な距離指標に基づいて良い。クエリされた未分類画像と前に分類された画像との間の類似性に基づき、ｋ最近隣のような、類似性に基づき分類する方法を用いて、分類及び例外検出の両方が可能である。添付の図面の図３（ａ）に示すように、分類のために、クエリされたデータ点は、メンバが特徴空間の中で該クエリされた点に最も近いクラス（例えば、「歩く」よりも「走る」）に属するとして分類される。添付の図面の図３（ｂ）に示すように、例外検出のために、クエリされたデータ点は、特徴空間の中で任意の既知のクラスから特定距離にある場合に（つまり、十分に似ていない）、例外として考えられる。

【0013】

しかしながら、ＥＰ３２３９８９７Ａ１で提案される方法に基づく改良は望ましい。特に、画像内のプロットのサイズを決定するためにＬ２（ユークリッド）ノルムを用いることにより、ベクトルの各値が、該値のそれぞれの軸に沿ってどのように独立に変化するかに関する情報は失われる場合がある。さらに、Ｌ２ノルムの各値の平方を用いることにより、ここで所与の軸上の値は他の軸より高い平均を有し、他の軸は、より高い平均を有するものと同じ比率では使用されず、訓練とテストデータセットとの間の可能な平方バイアス（possible square bias）を生成する。Ｌ２ノルムはいかなる負値も保持しないので、ベクトル方向に関する情報も失われる場合がある。さらに、（例えばエネルギを表すために使用され得る）プロットの形状は、ｘ軸に関して対称であり、情報を効率的に複製し、したがって訓練及び評価するためにモデルを長大化する。最後に、色は固定された列に関し、過剰な情報を画像に符号化するのを防ぐ。

【0014】

ＥＰ３２３９８９７Ａ１で提案された画像変換処理の中で情報が失われる場合、ベイズ誤り率（Bayes Error Rate）が劣化する場合がある（統計的分類では、ベイズ誤り率は、例えば２つのカテゴリのうちの一方へのランダムな結果の任意の分類器の最低の可能な誤り率であり、減らすことのできない誤りと同様である）。

【0015】

この及び／又は従来の画像化方法における他の上述の問題のための解決策を提供することが望ましい。

【発明の概要】

【0016】

第１の態様による一実施形態は、コンピュータにより実施される画像処理方法であって、
指定された多変数データセットについて、複数の重畳線グラフを有するデジタル画像を生成するステップであって、各線グラフは、前記多変数データセットの中の複数の変数のうちの異なる１つに対応し、前記多変数データセットの連続データアイテムに関連する変数の個々の値を表す、ステップと、
前記多変数データセットの各データアイテムについてカラライゼーション処理を実行することにより、前記生成されたデジタル画像を色付けするステップであって、前記カラライゼーション処理は、
前記データアイテムの中の正値を有する各変数について、該変数に予め割り当てられた色及び前記データアイテムの平均値に依存して、該変数の前記線グラフの下の領域を表すピクセルに色値を割り当てるステップと、
前記データアイテムの中の負値を有する各変数について、該変数に予め割り当てられた色及び前記データアイテムの平均値に依存して、該変数の前記線グラフの上の領域を表すピクセルに色値を割り当てるステップと、
前記線グラフの少なくとも２つの領域が重なり合うピクセルについて、前記色値を加算するステップと、を有する、ステップと、
前記色付けされた画像を格納するステップと、を有する画像処理方法を提供し得る。

【0017】

第２の態様による一実施形態は、画像処理機器であって、
指定された多変数データセットについて、複数の重畳線グラフを有するデジタル画像を生成するデジタル画像生成器であって、各線グラフは、前記多変数データセットの中の複数の変数のうちの異なる１つに対応し、前記多変数データセットの連続データアイテムに関連する変数の個々の値を表す、デジタル画像生成器と、
前記多変数データセットの各データアイテムについてカラライゼーション処理を実行することにより、前記生成されたデジタル画像を色付けする画像色付け器であって、前記カラライゼーション処理は、
前記データアイテムの中の正値を有する各変数について、該変数に予め割り当てられた色及び前記データアイテムの平均値に依存して、該変数の前記線グラフの下の領域を表すピクセルに色値を割り当てるステップと、
前記データアイテムの中の負値を有する各変数について、該変数に予め割り当てられた色及び前記データアイテムの平均値に依存して、該変数の前記線グラフの上の領域を表すピクセルに色値を割り当てるステップと、
前記線グラフの少なくとも２つの領域が重なり合うピクセルについて、前記色値を加算するステップと、を有する、画像色付け器と、
前記色付けされた画像を格納する画像記憶装置と、を有する画像処理機器を提供し得る。

【0018】

第１又は第２の態様による一実施形態は、何も又は殆ど何も情報損失無しに、多変数データセットを画像に変換することを可能にし得る。特に、グローバル多変数データシーケンスは、各データシーケンスの展開の軌跡を失わずに、画像内で符号化され得る。

【0019】

上述の第１及び第２の態様では、色値を割り当てるステップは、
前記データアイテムの中の前記変数の値が正か負かに従い、前記変数を分けるステップと、
前記データアイテムの全ての正の変数値を、最大値から最小値へと並べるステップであって、前記正の変数値に対応する前記線グラフの下の領域について、該領域のピクセルに順番に再帰的に色を割り当てる、ステップと、
前記データアイテムの全ての負の変数値を、最大値から最小値へと並べるステップであって、前記負の変数値に対応する前記線グラフの上の領域について、該領域のピクセルに順番に再帰的に色を割り当てる、ステップと、を有して良い。

【0020】

上述の第１及び第２の態様では、各変数の色は、前記データアイテムの前記平均値に対する前記変数の値の比、及び前記変数の値と前記データアイテムの前記平均値の積、のうちの１つに従い割り当てられて良い。

【0021】

上述の第１及び第２の態様で、平均値はＬ２ノルムであって良い。

【0022】

一実施形態は、機械学習用途に適する（限定でないが時系列データセットを含む）多変数データセットの視覚表現を生成するコンピュータにより実施される方法を提供し得る。

【0023】

特に、第３の態様による一実施形態では、多変数データセットを分類するためのデータ分類方法であって、前記方法は、
第１の態様の画像処理方法に従い、分類されるべき多変数データセットを表す色付けされた画像を取得するステップと、
データ分類の目的で画像認識のために訓練された深層ニューラルネットワークに、前記色付けされた画像及び少なくとも１つの予め分類された画像を入力するステップと、
前記色付けされた画像を各々の予め分類された画像と比較するステップと、
前記色付けされた画像と各予め分類された画像との間の類似度に従い、前記多変数データセットを分類するステップと、を有するデータ分類方法を提供し得る。

【0024】

同様に、第４の態様による一実施形態は、多変数データセットの中の潜在的変則性を検出するための変則性検出方法であって、前記方法は、
第１の態様の画像処理方法に従い、検討中の多変数データセットを表す色付けされた画像を取得するステップと、
データ分類の目的で画像認識のために訓練された深層ニューラルネットワークに、前記色付けされた画像及び予め分類された画像を入力するステップと、
前記色付けされた画像を前記予め分類された画像と比較するステップと、
前記色付けされた画像と前記予め分類された画像との間の相違度に従い、前記多変数データセットを例外として分類するステップと、を有する変則性検出方法を提供し得る。

【図面の簡単な説明】

【0025】

例として、添付の図面を参照する。

【図1】（上述した。）畳み込みニューラルネットワークのステージの説明で使用する図である。

【図2】（上述した。）以前に提案された画像化技術の説明で使用する図である。

【図3】（上述した。）画像を用いる分類及び例外検出の説明で使用する図である。

【図4】一実施形態による画像処理方法のフローチャートである。

【図5】一実施形態による画像処理機器の図である。

【図6】時系列データの傾向を予測する方法のフローチャートである。

【図7】画像処理プロセスの一実施形態を示す図である。

【図8】図７の画像処理プロセスの第１ステップのフローチャートである。

【図9】図７の画像処理プロセスの第２ステップのフローチャートである。

【図10】図７の画像処理プロセスの第２ステップの結果として生じる中間画像の例である。

【図11】図７の画像処理プロセスの第３ステップのフローチャートである。

【図12】図７の画像処理プロセスの第３ステップの結果として生じる画像の例である。

【図13】図７の画像処理プロセスの第３ステップの結果として生じる画像の別の例である。

【図14】分類システムのブロック図である。

【図15】本発明による方法を実行するのに適するコンピューティング装置のブロック図である。

【発明を実施するための形態】

【0026】

上述のように、画像内のデータの多変数シーケンスの効率的な表現を達成すると同時に、可能な限り多くの元のデータを保持することが望ましい。

【0027】

この目的のために、一実施形態は、新規な画像処理技術を有し、便宜上、「複数領域カラライゼーション技術（Multi Area Colorization Technique）」として以後参照されることがある。

【0028】

図４に、複数領域カラライゼーション技術の一実施形態による、コンピュータにより実施される画像処理方法のフローチャートが示される。ステップＳ１で、複数の重畳された線グラフを含むデジタル画像が、特定の多変数データセットについて生成される。各線グラフは、多変数データセットの中の複数の変数のうちの異なる１つに対応し、多変数データセットの連続するデータアイテムに関連する変数のそれぞれの値を表す。例えば、線グラフの水平軸上の各点で、水平軸より上又は下の線グラフの高さは、該データアイテムの変数の値を表す。ステップＳ２で、ステップＳ１で生成されたデジタル画像は、以下のように、多変数データセットの各データアイテムに対してカラライゼーション処理を実行することにより色付けされる。データアイテムの中の正値を有する各変数について、該変数に予め割り当てられた色及びデータアイテムの平均値に依存して、線グラフの下にある領域を表すピクセルに色値が割り当てられる。データアイテムの中の負値を有する各変数について、該変数に予め割り当てられた色及びデータアイテムの平均値に依存して、線グラフの上にある領域を表すピクセルに色値が割り当てられる。線グラフの少なくとも２つの領域が重なり合う領域のピクセルの色値が加算される。ステップＳ３で、色付けされた画像が格納される。

【0029】

図５に、図４の方法を実行する画像処理機器１０が示される。機器１０は、デジタル画像生成器１１、画像色付け器１２、及び画像記憶装置２０を有する。デジタル画像生成器１１は、特定の多変数データセットについて、複数の重畳された線グラフを有するデジタル画像を生成するよう構成される。各線グラフは、多変数データセットの中の複数の変数のうちの異なる１つに対応し、多変数データセットの連続するデータアイテムに関連する変数のそれぞれの値を表す。画像色付け器１２は、以下のように、多変数データセットの各データアイテムについてカラライゼーション処理を実行することにより、生成されたデジタル画像を色付けするよう構成される。データアイテムの中の正値を有する各変数について、該変数に予め割り当てられた色及びデータアイテムの平均値に依存して、線グラフの下にある領域を表すピクセルに色値が割り当てられる。データアイテムの中の負値を有する各変数について、該変数に予め割り当てられた色及びデータアイテムの平均値に依存して、線グラフの上にある領域を表すピクセルに色値が割り当てられる。線グラフの少なくとも２つの領域が重なり合う領域のピクセルの色値が加算される。画像記憶装置２０は、色付けされた画像を格納するよう構成される。

【0030】

特定の実施形態が、データセットの中の傾向を予測する際に使用するために、３つの変数、つまりｘ、ｙ、及びｚ軸に沿う動きを有する時系列データを含む多変数データセットの画像化を参照して、以下に説明される。

【0031】

図６は、時系列データの傾向を予測する方法のフローチャートである。方法は、３つの別個のプロセス：画像処理（Ｐ６１）、分類器訓練（Ｐ６２）、及び傾向予測（Ｐ６３）を有すると考えられる。本願の関心は、これらのうち第１の、画像処理である。

【0032】

図７は、画像処理プロセスＰ６１の一実施形態を示す図であり、３つのステップ：前処理（ステップＳ７１）、形状提示（ステップＳ７２）、及びカラライゼーション（ステップＳ７３）を有すると考えられる。

【0033】

図８は、前処理ステップＳ７１のフローチャートである。ステップＳ８０で、ｘ、ｙ、及びｚ軸の各々は、画像の色空間の中の固定位置を割り当てられる。この割り当ては、データセット全体で一貫して使用される限り、ランダムに行われて良い。（本例におけるように）データセットの中の変数（軸）の数は、３以下であり、ＲＧＢ色チャネル空間を使用することが適切である。しかしながら、より高次元では（Ｎ時系列）、ＲＧＢ以外の色空間がより適切であって良い。例えば、ＨＳＶ、ＨＳＬ、及びＨＳＰは、ＲＧＢ色モデルの代替表現であり、人間の視覚が色を生成する属性を知覚する方法により緊密に合わせるために設計され、より高次元に特に適する。各色は、任意の重畳が既に選択された色を再生成しないことを保証するよう選択される。

【0034】

多変数データセットの特性により、より円滑な表現を達成するために、フィルタリング、ノイズ除去、又はスムーサ、等を適用することが望ましい場合がある。例えば、ステップＳ８１で、データをゼロ中心（zero－center）にするために、各データアイテムから、それ自体の平均が除去される。このような平滑化は、それらの変動に対する平均の比が小さい場合（例えば、平均＝［０．１，０．０１，０．５］であり、１より大きい変動を有する）、任意である。ステップＳ８２で、データ値は、更に、それらが間隔［－１，１］内に残るように、Ｌ２（ユークリッド）ノルムの最大値により除算されて良い。

【0035】

図９は、形状提示プロセス（ステップＳ７２）のフローチャートである。ステップＳ９０で、前処理ステップＳ７１から出力された前処理済みデータセットは、グラフ上の線として表現される。データセット内の値は、各変数（軸）について別個にプロットされる。残りの線グラフは、表示された場合に図１０（ａ）及び１０（ｂ）に示されたもののうちの１つと同様になる中間画像である。

【0036】

図１１は、カラライゼーション処理（ステップＳ７３）のフローチャートである。本例では、カラライゼーション処理は、プロットされた線グラフの中の色として、ベクトル（ｘ，ｙ，ｚ）の角度／方向を符号化するステップを含む。

【0037】

先ず、ステップＳ１１１で、ベクトル（ｘ，ｙ，ｚ）について、変数の値が正か負かに従い、変数が分けられる。

【0038】

次に、ステップＳ１１２で、任意の正値が最大から最小へと順序付けられ、それとは別に、任意の負値が最大から最小へと順序付けられる。

【0039】

最後に、ステップＳ１１３で、正値に対応する線と水平軸との間のグラフの部分、及び負値に対応する線と水平軸との間のグラフの部分が、色付けされる。プロットライブラリがグラフ部分を色付けするために再帰的に使用される場合、正値に対応するグラフ部分は、負値に対応するグラフ部分と独立に再帰的に色付けされる。

【0040】

再順序付けステップＳ１１２は、プロットライブラリの使用を可能にするために実行される。これにより、所与の色で所与の長方形を描くことが可能になるだけである。しかしながら、このステップは、幾つかの他の手段がグラフの下にある領域を色付けするために使用される場合、必須ではない。

【0041】

このカラライゼーション処理は、画像全体が色付けされるまで、全てのベクトルに対して順次実行さえる。

【0042】

各々の場合に、各変数の色は、変数の値の、ベクトルの変数のノルムに対する比又はそれとの積に従い選択される。任意のノルムが使用できる。例えば、Ｘ＝ｆ（Ｘ）／ｎｏｒｍ（ｆ（Ｘ））、Ｘ＝［ｘ，ｙ，ｚ］であり、Ｘ［ｔ］＝１のノルム、例えばＬ２（ユークリッド）ノルムを提供する。異なる変数に対応するグラフ部分が重畳されるとき、各変数の値に関する相関的情報を保持するために、色が加算される。例えば、マッピング｛ｘ：ｒ，ｙ：ｇ，ｚ：ｂ｝により、データセットＸ＝［１，－５，２］について、Ｌ２ノルムは３０である。したがって、０～２５５のピクセル色値では、次の通りである：
Ｒ＝（１／３０）＊２５５
Ｇ＝（５／３０）＊２５５
Ｂ＝（２／３０）＊２５５
したがって、先ず、正の高さ２を有するｚについて、線グラフより下にあるグラフ部分のピクセルは、（２／３０）＊２５５（＝Ｂ）に対応する色を与えられる。次に、正の高さ１を有するｘについて、線グラフより下にあるグラフ部分のピクセルは、（３／３０）＊２５５（＝Ｒ＋Ｂ）に対応する色を与えられる。負の高さ－５を有するｙについて、線グラフより上にあるグラフ部分のピクセルは、（５／３０）＊２５５に対応する色を与えられる。このように、多変数データセットの殆ど全ての詳細を表す有色画像が達成される。

【0043】

この場合の画像は、画像に適合するために値がゼロの周辺に再び中心を置かれるとき、各データセットの平均が失われるので、データセットの全ての詳細を表さない場合がある。１つの欠点は、この方法が平均の周辺のノイズに影響されやすいことである。平均がメタデータとして保存される場合、時系列と画像＋メタデータとの間には全単射（bijection）がある。

【0044】

残念ながら本願では色画像を提示できない。しかし、図１２（ａ）及び１２（ｂ）は、それぞれ図１０（ａ）及び１０（ｂ）の中間画像に対応するために、前述のカラライゼーション処理により生成された対応するグレイスケール画像で示す。図１３に、図１０（ａ）／１２（ａ）及び１０（ｂ）／１２（ｂ）と異なるデータセットを表す別の画像が示され、明確さを向上するために、非常に粗いグレイスケールのみが使用されている。しかしながら、理解されるべきことに、実際には、前述の技術により生成された色画像は、非常に多数の異なる色、例えばピクセル色値範囲が０～２５５である２５６色により構成されて良い。

【0045】

前述の技術は、例えば、以下の画像処理アルゴリズムを用いて実施されて良い。

【数2】

【0046】

データセットは、議論されたように画像化された後に、図３（ａ）及び３（ｂ）を参照して前述したように又はそのようなタスクの可能な任意の他の技術を用いて、分類され及び／又は例外についてテストされて良い。画像は、例えば、図１３を参照して記載されるような分類システム３０を用いて処理されて良い。

【0047】

図１４は、画像、つまり画像１及び画像２を画像記憶装置２０から受信するよう構成される分類システム３０のブロック図である。画像１は既に分類されたデータセットに対応して良く、一方で、画像２は分類の必要なデータに対応して良い。各画像は、画像から、画像の特徴を表すそれぞれの特徴ベクトル、つまり特徴ベクトル１及び特徴ベクトル２を抽出するために、特徴抽出器３１に、本例では畳み込みニューラルネットワーク（ＣＮＮ）に入力される。特徴ベクトルは、コサイン距離又は任意の他の適切な距離指標に基づき、特徴ベクトル間の類似性を、したがってそれぞれの対応するデータウインドウを決定する類似性決定装置３２に入力される。未分類画像と１又は複数の前に分類された画像との間の類似性に基づき、ｋ最近隣のような、類似性に基づき分類する方法を用いて、分類及び例外検出が実質的に実行されて良い。

【0048】

複数領域カラライゼーション技術の１つの用途は、ウェアラブル且つスマートなセンサを通じて記録された人間の活動の分析である。この特定の使用法は、生データシーケンスを考慮するとき可能ではなかった、画像に基づく活動の分類を可能にする画像化に良好に適する。上述の技術を用いると、ベイズ誤り率の近似を、そして人間にとっては次に異なる活動をより容易に分類することを可能にできる。

【0049】

図１０（ａ）及び（ｂ）、１２（ａ）及び（ｂ）は、ＵＣＩ日常及び運動活動データセット（UCI Daily and Sports Activities Data Set）として知られるデータセットに対する機械学習プロジェクトの間の例として生成された。データセットは、８人の被検者により彼ら自身のスタイルでそれぞれ５分間行われた、１９個の日常及び運動活動の動きセンサデータを有する。５個のＸｓｅｎｓＭＴｘユニットが、胴、腕、及び脚に使用された。動きセンサ時系列は、上述の技術を用いて画像化され、更なる分類のために使用された。

【0050】

処理は、埋め込みとして他の表現データフォーマットにも適用され得る。例えば、自然言語処理では、言葉のベクトル表現を得ることが可能である。ベクトル表現は、時系列値として考えられる実数値を含む。これらの値は、次に、上述の技術を用いて画像としてプロットされて良い。さらに、画像化は、任意の埋め込み（embedding）に適用されて良い。例えば、画像化は、グラフ埋め込み（graph embedding）に適用されて良い。

【0051】

図１５は、本発明を実現し、本発明を具現化する方法のステップの一部又は全部を実施するために及び一実施形態の装置のタスクの一部又は全部を実行するために使用できる、データ記憶サーバのようなコンピューティング装置のブロック図である。例えば、図１５のコンピューティング装置は、図４に示した画像処理方法の全てのステップを実施し、及び図５に示した画像処理機器の全部のタスクを実行し、又は図１１のカラライゼーション技術を実施し、及び図５の画像色付け器１２のタスクを実行するために、使用されても良い。

【0052】

コンピューティング装置は、プロセッサ９９３、及びメモリ９９４を有する。任意で、コンピューティング装置は、コンピューティング装置のような他者、例えば本発明の実施形態の他のコンピューティング装置と通信するためのネットワークインタフェース９９７も有する。

【0053】

例えば、一実施形態は、このようなコンピューティング装置のネットワークで構成されて良い。任意で、コンピューティング装置は、キーボード及びマウスのような１又は複数の入力メカニズム９９６、及び１又は複数のモニタのようなディスプレイユニット９９５も有する。コンポーネントは、バス９９２を介して互いに接続可能である。

【0054】

メモリ９９４は、例えば画像処理機器内のコンピュータ記憶装置２０のタスクを実行して良く、コンピュータ実行可能命令を実行する又は格納されたデータ構造を有するよう構成される単一の媒体又は複数の媒体（例えば、集中型又は分散型データベース及び／又は関連するキャッシュ及びサーバ）を表し得るコンピュータ可読媒体を有して良い。コンピュータ実行可能命令は、例えば、汎用コンピュータ、特定目的コンピュータ又は特定目的処理装置（例えば、１又は複数のプロセッサ）によりアクセス可能であり及び１又は複数の機能又は工程を実行させる命令及びデータを有して良い。したがって、用語「コンピュータ可読記憶媒体」は、機械による実行のために命令セットを格納しエンコードし又は持ち運ぶことが可能であり、機械に本開示の方法のうち任意の１又は複数を実行させる任意の媒体も含み得る。用語「コンピュータ可読記憶媒体」は、固体メモリ、光学媒体及び磁気媒体を含むと考えられるが、これらに限定されない。例として且つ限定ではなく、このようなコンピュータ可読媒体は、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read－Only Memory）、ＥＥＰＲＯＭ（Electrically Erasable Programmable Read－Only Memory）、ＣＤ－ＲＯＭ（Compact Disc Read－Only Memory）又は他の光ディスク記憶装置、磁気ディスク記憶装置又は他の磁気記憶装置を含む非一時的若しくは有形コンピュータ可読記憶媒体、又は他の媒体、フラッシュメモリ装置（例えば、固体メモリ装置）を有し得る。

【0055】

プロセッサ９９３は、コンピューティング装置を制御し、処理工程を実行するよう、例えば図４、７、８、９及び／又は１１を参照して記載された及び請求の範囲において定められる方法を実施するためにメモリ９９４に格納されたコンピュータプログラムコードを実行するよう構成される。メモリ９９４は、プロセッサ９９３によりリード及びライトされるデータを格納する。本願明細書で参照されるとき、プロセッサは、マイクロプロセッサ、中央処理ユニット、等のような１又は複数の汎用処理装置を含み得る。プロセッサは、ＣＩＳＣ（complex instruction set computing）マイクロプロセッサ、ＲＩＳＣ（reduced instruction set computing）マイクロプロセッサ、ＶＬＩＷ（very long instruction word）マイクロプロセッサ、又は他の命令セットを実施するプロセッサ、若しくは命令セットの組合せを実施するプロセッサを含み得る。プロセッサは、ＡＳＩＣ（application specific integrated circuit）、ＦＰＧＡ（field programmable gate array）、ＤＳＰ（digital signal processor）、ネットワークプロセッサ、等のような１又は複数の特定目的処理装置も含み得る。１又は複数の実施形態では、プロセッサは、本願明細書で議論する工程又はステップを実行する命令を実行するよう構成される。

【0056】

ディスプレイユニット９９５は、コンピューティング装置により格納されたデータの提示を表示して良く、ユーザとプログラムとコンピューティング装置に格納されたデータとの間の相互作用を可能にするカーソル及びダイアログボックス及びスクリーンも表示して良い。例えば、ディスプレイユニット９９５は、画像化されるべき多変数データ、及び結果として生じた画像を表示して良い。入力メカニズム９９６は、ユーザが、画像化されるべき多変数データのようなデータ及び命令をコンピューティング装置に入力することを可能にし得る。

【0057】

ネットワークインタフェース（ネットワークＩ／Ｆ）９９７は、インターネットのようなネットワークに接続され、ネットワークを介して、分類システム３０のような他のコンピューティング装置に接続可能であって良い。ネットワークＩ／Ｆ９９７は、ネットワークを介して他の装置からのデータ入力／へのデータ出力を制御して良い。

【0058】

マイクロフォン、スピーカ、プリンタ、電源ユニット、ファン、筐体、スキャナ、トラックボール等のような他の周辺装置は、コンピューティング装置に含まれても良い。

【0059】

本発明を実現する方法は、図１５に示されたようなコンピューティング装置で実行されて良い。このようなコンピューティング装置は、図１５に示した全てのコンポーネントを有する必要はなく、これらのコンポーネントのうちの部分集合で構成されて良い。本発明を具現化する方法は、ネットワークを介して１又は複数のデータ記憶サーバと通信する単一のコンピューティング装置により実行されて良い。コンピューティング装置は、データの少なくとも一部を格納するデータ記憶装置自体であっても良い。

【0060】

本発明を実現する方法は、互いに協働して動作する複数のコンピューティング装置により実行されて良い。複数のコンピューティング装置のうちの１又は複数は、データの少なくとも一部を格納するデータ記憶サーバであっても良い。

【0061】

上述の本発明の実施形態は、実施形態のうちの任意の他の実施形態と独立に又は実施形態のうちの１又は複数の他の実施形態との任意の実現可能な組合せで、使用されても良い。

【0062】

以上の実施形態に加えて、さらに以下の付記を開示する。
（付記１）コンピュータにより実施される画像処理方法であって、
指定された多変数データセットについて、複数の重畳線グラフを有するデジタル画像を生成するステップであって、各線グラフは、前記多変数データセットの中の複数の変数のうちの異なる１つに対応し、前記多変数データセットの連続データアイテムに関連する変数の個々の値を表す、ステップと、
前記多変数データセットの各データアイテムについてカラライゼーション処理を実行することにより、前記生成されたデジタル画像を色付けするステップであって、前記カラライゼーション処理は、
前記データアイテムの中の正値を有する各変数について、該変数に予め割り当てられた色及び前記データアイテムの平均値に依存して、該変数の前記線グラフの下の領域を表すピクセルに色値を割り当てるステップと、
前記データアイテムの中の負値を有する各変数について、該変数に予め割り当てられた色及び前記データアイテムの平均値に依存して、該変数の前記線グラフの上の領域を表すピクセルに色値を割り当てるステップと、
前記線グラフの少なくとも２つの領域が重なり合うピクセルについて、前記色値を加算するステップと、を有する、ステップと、
前記色付けされた画像を格納するステップと、
を有する画像処理方法。
（付記２）色値を割り当てるステップは、
前記データアイテムの中の前記変数の値が正か負かに従い、前記変数を分けるステップと、
前記データアイテムの全ての正の変数値を、最大値から最小値へと並べるステップであって、前記正の変数値に対応する前記線グラフの下の領域について、該領域のピクセルに順番に再帰的に色を割り当てる、ステップと、
前記データアイテムの全ての負の変数値を、最大値から最小値へと並べるステップであって、前記負の変数値に対応する前記線グラフの上の領域について、該領域のピクセルに順番に再帰的に色を割り当てる、ステップと、
を有する、付記１に記載の画像処理方法。
（付記３）各変数の色は、前記データアイテムの前記平均値に対する前記変数の値の比、及び前記変数の値と前記データアイテムの前記平均値の積、のうちの１つに従い割り当てられる、付記１又は２に記載の画像処理方法。
（付記４）前記平均値はＬ２ノルムである、付記１、２、又は３に記載の画像処理方法。
（付記５）多変数データセットを分類するためのデータ分類方法であって、前記方法は、
付記１乃至４のいずれかに記載の画像処理方法に従い、分類されるべき多変数データセットを表す色付けされた画像を取得するステップと、
データ分類の目的で画像認識のために訓練された深層ニューラルネットワークに、前記色付けされた画像及び少なくとも１つの予め分類された画像を入力するステップと、
前記色付けされた画像を各々の予め分類された画像と比較するステップと、
前記色付けされた画像と各予め分類された画像との間の類似度に従い、前記多変数データセットを分類するステップと、
を有するデータ分類方法。
（付記６）多変数データセットの中の潜在的な例外を検出するための例外検出方法であって、前記方法は、
付記１乃至４のいずれかに記載の画像処理方法に従い、検討中の多変数データセットを表す色付けされた画像を取得するステップと、
データ分類の目的で画像認識のために訓練された深層ニューラルネットワークに、前記色付けされた画像及び予め分類された画像を入力するステップと、
前記色付けされた画像を前記予め分類された画像と比較するステップと、
前記色付けされた画像と前記予め分類された画像との間の相違度に従い、前記多変数データセットを例外として分類するステップと、
を有する例外検出方法。
（付記７）コンピュータに格納されると、該コンピュータに付記１乃至４のいずれか一項に記載の画像処理方法、又は付記５に記載のデータ分類方法、又は付記６に記載の例外検出方法を実行させるコンピュータプログラム。
（付記８）画像処理機器であって、
指定された多変数データセットについて、複数の重畳線グラフを有するデジタル画像を生成するデジタル画像生成器であって、各線グラフは、前記多変数データセットの中の複数の変数のうちの異なる１つに対応し、前記多変数データセットの連続データアイテムに関連する変数の個々の値を表す、デジタル画像生成器と、
前記多変数データセットの各データアイテムについてカラライゼーション処理を実行することにより、前記生成されたデジタル画像を色付けする画像色付け器であって、前記カラライゼーション処理は、
前記データアイテムの中の正値を有する各変数について、該変数に予め割り当てられた色及び前記データアイテムの平均値に依存して、該変数の前記線グラフの下の領域を表すピクセルに色値を割り当てるステップと、
前記データアイテムの中の負値を有する各変数について、該変数に予め割り当てられた色及び前記データアイテムの平均値に依存して、該変数の前記線グラフの上の領域を表すピクセルに色値を割り当てるステップと、
前記線グラフの少なくとも２つの領域が重なり合うピクセルについて、前記色値を加算するステップと、を有する、画像色付け器と、
前記色付けされた画像を格納する画像記憶装置と、
を有する画像処理機器。
（付記９）前記画像色付け器は、
前記データアイテムの中の前記変数の値が正か負かに従い、前記変数を分け、
前記データアイテムの全ての正の変数値を、最大値から最小値へと並べ、前記正の変数値に対応する前記線グラフの下の領域について、該領域のピクセルに順番に再帰的に色を割り当て、
前記データアイテムの全ての負の変数値を、最大値から最小値へと並べ、前記負の変数値に対応する前記線グラフの上の領域について、該領域のピクセルに順番に再帰的に色を割り当てる、
ことにより、色値を割り当てる、付記８に記載の画像処理機器。
（付記１０）前記画像色付け器は、前記データアイテムの前記平均値に対する前記変数の値の比、及び前記変数の値と前記データアイテムの前記平均値の積、のうちの１つに従い各変数の色を割り当てる、付記８又は９に記載の画像処理機器。
（付記１１）前記平均値はＬ２ノルムである、付記８、９、又は１０に記載の画像処理機器。

【符号の説明】

【0063】

１０画像処理機器
１１デジタル画像生成器
１２画像色付け器
２０画像記憶装置

【図1】