(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-04-28
(45)【発行日】2025-05-09
(54)【発明の名称】データ分析に用いられる方法、デバイス及びプログラム
(51)【国際特許分類】
G06Q 30/0202 20230101AFI20250430BHJP
G06Q 10/04 20230101ALI20250430BHJP
【FI】
G06Q30/0202
G06Q10/04
【外国語出願】
(21)【出願番号】P 2021056535
(22)【出願日】2021-03-30
【審査請求日】2024-03-27
(31)【優先権主張番号】202010247398.4
(32)【優先日】2020-03-31
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100103894
【氏名又は名称】家入 健
(72)【発明者】
【氏名】パン ツェン
(72)【発明者】
【氏名】リウ チュンチェン
【審査官】塩田 徳彦
(56)【参考文献】
【文献】特開2018-139036(JP,A)
【文献】特開2016-118975(JP,A)
【文献】特開平06-332881(JP,A)
【文献】米国特許出願公開第2010/0174671(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
データ分析デバイスが、
履歴イベントに影響を与えた履歴要因に関連付けられる履歴条件データと、前記履歴要因により生じた前記履歴イベントの結果を示す履歴結果データとに少なくとも基づき、前記履歴要因と前記履歴イベントの前記結果との間の関連付けを生成することと、
前記履歴イベントに関連付けられる現在のイベントについて選択される、関心のある少なくとも1つの目標結果を決定することと、
前記現在のイベントに影響を与える現在の要因と、前記関心のある少なくとも1つの目標結果に関連付けられる少なくとも1つの目標対象とを決定することと、
前記関連付けと、前記現在の要因に関連付けられる現在の条件データと、前記少なくとも1つの目標対象とに少なくとも基づき、前記関心のある少なくとも1つの目標結果のデータを決定することと
を含む、データ分析に用いられる方法。
【請求項2】
前記データ分析デバイスが、履歴条件データを取得することをさらに含み、
前記履歴条件データは、連続型履歴条件データ及び離散型履歴条件データのうちの少なくとも1つを含む、
請求項1に記載の方法。
【請求項3】
前記履歴条件データを取得することは、
データ収集デバイスから前記履歴条件データを周期的に取得することを含む、
請求項2に記載の方法。
【請求項4】
前記関連付けを生成することは、
取得した履歴条件データのデータサンプル数が閾値の数より少ないことに応じて、前記履歴条件データの前記履歴結果データに対する影響の程度を示す参考データを取得することと、
前記履歴条件データ及び前記参考データに基づき、前記履歴結果データを決定することと、
前記履歴条件データ及び前記履歴結果データに基づき、前記関連付けを決定することと
を含む、請求項2に記載の方法。
【請求項5】
前記関心のある少なくとも1つの目標結果を決定することは、
前記データ分析に関する第1指示をユーザ端末から受け取ることと、
前記第1指示に基づき、前記関心のある少なくとも1つの目標結果を決定することと
を含む、請求項1に記載の方法。
【請求項6】
前記データ分析デバイスが、前記現在の要因について選択可能なデータ範囲を示す、前記現在の要因の制約条件を決定することと、
前記データ分析デバイスが、前記制約条件に基づき、前記現在の要因に関連付けられる前記現在の条件データを決定することと
をさらに含む、請求項1に記載の方法。
【請求項7】
前記制約条件を決定することは、
前記データ分析に関する第2指示をユーザ端末から取得することと、
前記第2指示に基づき、前記制約条件を決定することと
を含む、請求項6に記載の方法。
【請求項8】
前記目標対象を決定することは、
前記現在の要因の現在の条件データのデータサンプルに関連付けられる対象の集合を決定することと、
所望のグループ分けの粒度を決定することと、
前記グループ分けの粒度に基づき、前記対象の集合の中から、前記関心のある少なくとも1つの目標結果に関連付けられる前記少なくとも1つの目標対象を決定することと
を含む、請求項1に記載の方法。
【請求項9】
前記グループ分けの粒度を決定することは、
前記データ分析に関する第3指示をユーザ端末から取得することと、
前記第3指示に基づき、前記グループ分けの粒度を決定することと
を含む、請求項8に記載の方法。
【請求項10】
前記グループ分けの粒度は、
個人の対象、
所定の対象属性を有する単一グループの対象、及び
異なる対象属性を有する複数グループの対象
のうちの少なくとも1つを含む、
請求項8に記載の方法。
【請求項11】
前記関連付けは、因果関係モデルであり、
前記目標結果の前記データを決定することは、
前記現在の条件データと、前記少なくとも1つの目標対象のタグとを前記因果関係モデルに入力することで、前記目標結果の前記データを決定することを含む、
請求項1に記載の方法。
【請求項12】
前記データ分析デバイスが、決定された前記目標結果の前記データを、ユーザ端末に出力することをさらに含む、
請求項1に記載の方法。
【請求項13】
前記データ分析デバイスが、決定された前記目標結果の前記データを、ユーザ端末に表示することをさらに備える、
請求項1に記載の方法。
【請求項14】
前記データ分析デバイスが、前記目標結果の所定の基準量を取得することと、
前記データ分析デバイスが、前記データと前記所定の基準量との差異が閾値の差異を超えていると決定したことに応じて、前記差異の特徴を表す信号を、ユーザ端末に出力することと
をさらに含む、請求項1に記載の方法。
【請求項15】
データ分析に用いられるデバイスであって、
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに結合されたメモリであって、前記少なくとも1つのプロセッサにより実行された場合、請求項1~請求項14のいずれか1項に記載の方法を前記デバイスに実行させる指令が記憶されているメモリと
を含む、デバイス。
【請求項16】
コンピュータプログラムであって、プロセッサにより実行された場合に、コンピュータに対し、請求項1~請求項14のいずれか1項に記載の方法を実行させる、
コンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示の実施形態は、人工知能分野に関し、より具体的には、データ分析に用いられる方法、デバイス及び記憶媒体に関する。
【背景技術】
【0002】
一般的に、ユーザは意思決定を行う前に、該意思決定が奏する効果を評価するか、又はさまざまな意思決定プランの効果の差を比較することを望んでいる。例えば、マーケティング調査の分野において、意思決定者は、製品、サービス、ブランド等の戦略を調整することで顧客満足度を向上させることが可能か、どのような戦略を用いれば最適な向上効果が得られるのかについて、理解することを望んでいる。
【0003】
また、例えば人事管理の分野では、管理者は、さまざまな従業員のインセンティブ方針によってどのようなインセンティブ効果が得られるかを理解して、企業の利益と従業員の利益とのバランスを取ることを望んでいる。また、故障検出の分野では、オペレータは、どの技術的なプロセス、操作方法及び機器構成を改善すれば故障の可能性を低減できるかについて、理解することを望んでいる。
【0004】
こうした意思決定により生じる可能性がある効果は、因果モデルに基づく戦略予測システムによって予測することができる。このような因果モデルは通常、履歴データによって確立することができる。因果モデルの確立後、異なる戦略を入力することで、戦略予測システムは、戦略の効果を予測して、意思決定の効果を評価し、効果が最も大きい戦略をユーザが選択するようサポートすることができる。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本開示の実施形態では、データ分析に用いられる方法、デバイス及び記憶媒体が提供される。
【課題を解決するための手段】
【0006】
本開示の第1の態様では、データ分析に用いられる方法が提供される。該方法は、履歴イベントに影響を与えた履歴要因に関連付けられる履歴条件データと、前記履歴要因により生じた前記履歴イベントの結果を示す履歴結果データとに少なくとも基づき、前記履歴要因と前記履歴イベントの前記結果との間の関連付けを生成することと、前記履歴イベントに関連付けられる現在のイベントについて選択される、関心のある少なくとも1つの目標結果を決定することと、前記現在のイベントに影響を与える現在の要因と、前記関心のある少なくとも1つの目標結果に関連付けられる少なくとも1つの目標対象とを決定することと、前記関連付けと、前記現在の要因に関連付けられる現在の条件データと、前記少なくとも1つの目標対象とに少なくとも基づき、前記関心のある少なくとも1つの目標結果のデータを決定することとを含む。
【0007】
本開示の第2の態様では、データ分析に用いられるデバイスが提供される。該デバイスは、少なくとも1つの処理ユニットと、該少なくとも1つの処理ユニットに結合され、該少なくとも1つの処理ユニットによって実行される命令を記憶する少なくとも1つのメモリとを含み、該命令は、該少なくとも1つの処理ユニットによって実行されると該デバイスに動作を実行させる。該動作は、履歴イベントに影響を与えた履歴要因に関連付けられる履歴条件データと、前記履歴要因により生じた前記履歴イベントの結果を示す履歴結果データとに少なくとも基づき、前記履歴要因と前記履歴イベントの前記結果との間の関連付けを生成することと、前記履歴イベントに関連付けられる現在のイベントについて選択される、関心のある少なくとも1つの目標結果を決定することと、前記現在のイベントに影響を与える現在の要因と、前記関心のある少なくとも1つの目標結果に関連付けられる少なくとも1つの目標対象とを決定することと、前記関連付けと、前記現在の要因に関連付けられる現在の条件データと、前記少なくとも1つの目標対象とに少なくとも基づき、前記関心のある少なくとも1つの目標結果のデータを決定することとを含む。
【0008】
本開示の第3の態様では、コンピュータ可読記憶媒体が提供される。該コンピュータ可読記憶媒体には、コンピュータが読み取り可能なプログラム命令が記憶されている。該コンピュータが読み取り可能なプログラム命令は、第1の態様で説明した方法を実行するためのものである。
【0009】
本発明の概要部分は、概念に対する選択を簡略化して提示するためのものである。これらについては、以下の実施形態においてさらに説明を行う。本発明の概要部分の記述は、本開示の重要又は必要な特徴を示すことを意図したものではなく、本開示の範囲を限定することも意図していない。
【図面の簡単な説明】
【0010】
図面を参照して、本開示の例示的な実施形態をさらに詳細に説明することで、本開示の上記及び他の目的、特徴及び利点をさらに明らかにする。本開示の例示的な実施形態において、同一の参照符号は通常、同一の部品を示す。
【0011】
【
図1】本開示の実施形態を実行可能な環境の模式図である。
【0012】
【
図2】本開示の実施形態にかかる因果関係の実例の有向非巡回グラフである。
【0013】
【
図3】本開示の実施形態にかかる1つの使用場面の模式図である。
【0014】
【
図4】本開示の実施形態にかかるデータ分析のインタラクティブプロセスの模式図である。
【0015】
【
図5】本開示の実施形態にかかるデータ分析の例示的なプロセスのフローチャートである。
【0016】
【
図6】本開示の実施形態にかかる履歴要因と履歴イベント結果との間の関連付けを決定するプロセスのフローチャートである。
【0017】
【
図7】本開示の実施形態にかかる目標対象を決定するプロセスのフローチャートである。
【0018】
【
図8】本開示の内容を実施するための実施形態の例示的なデバイスのブロック模式図である。
【発明を実施するための形態】
【0019】
以下、図面を参照しつつ、本開示の好ましい実施形態についてより詳細に説明する。図には本開示の好ましい実施形態が示されているが、本開示は様々な形式で実現することが可能であり、ここに記載された実施形態に限定されるべきではないと理解すべきである。むしろ、これらの実施形態を提供するのは、本開示をより完全なものにし、本開示の範囲を当業者に網羅的に伝えるためである。
【0020】
本明細書で使用される用語「含む(備える)」及びその変形は、「…を含むが、これらに限定されない」という開放的な「含む」を表す。特に明記されていない限り、用語「又は」は、「及び/又は」を表し、用語「…に基づいて」は、「少なくとも部分的に基づく」ことを表す。用語「1つの例示的な実施形態」及び「一実施形態」は、「少なくとも1つの例示的な実施形態」を表す。用語「他の実施形態」は、「少なくとも1つの他の実施形態」を表す。用語「第1」、「第2」等は、異なるか又は同一の対象を示すことができる。以下の文中ではさらに、その他の明確な定義及び暗黙の定義が含まれる可能性がある。
【0021】
本開示の実施形態において、用語「モデル」は一般的に、あるシステムを参照する特徴について、数学的言語を用いて概括的又は近似的に表現される該システムの関係・構造を指す。一般的にモデルは、既知のデータを利用してトレーニングを行うことで生成することができる。生成されたモデルは、モデル構成及びモデルパラメータ等を含むことができる。モデルパラメータは、具体的なモデルのタイプにより異なっていてよい。用語「因果モデル」(causal model)は一般的に、システムの因果効果構造を説明するものである。
【0022】
一般的に、ユーザは意思決定を行う前に、該意思決定が奏する効果を評価するか、又はさまざまな意思決定プランの効果の差を比較することを望んでいる。例えば、小売業では、意思決定者は、販売促進プランの策定前に、各販売促進プランがどれだけの収益をもたらすかを理解して、最適な販売促進プランを選択することを望んでいる。
【0023】
コンピュータ技術の絶え間ない発展に伴い、データ分析は既に人々の生活のさまざまな方面で広く応用されており、例えば、ディープニューラルネットワーク(DNN:Deep Neural Network)モデル等の分析デバイスは、意思決定の評価や目標予測等の各種タスクにおいて、益々応用されるようになっている。したがって、上述の意思決定により生じる可能性のある効果は、因果モデルを確立することで予測可能である。このような因果モデルは通常、履歴データにより確立することができる。因果モデルの確立後、異なる戦略を入力することで、戦略予測システムは、戦略の効果を予測し、これによって意思決定の効果についての評価を行い、各分野のユーザの要望に応えることができる。
【0024】
しかしながら、因果モデルを生成するためのデータについて、従来の解決手段では、データサンプルのタイプに対し特定のタイプが要求されるため、モデル生成には一定の限界が存在する。また、従来の解決手段で生成される因果モデル、例えば、ベイジアンネットワークに基づき生成されたモデルは、構成にいくつかの問題が存在する。例えば、こうした因果モデルは、平均的な効果の予測しか実現できず、個人又は異なる集団についてより正確な予測を行うことができないため、意思決定の精緻化に対するユーザの要望に応えることができない。したがって、異なる粒度での目標対象について、意思決定に対し、より正確で目的に合った予測を行うことが望まれている。
【0025】
また、自動化されたデータ分析スキームの実現も望まれている。こうしたスキームは例えば、ユーザ端末又は工業センサ等の情報収集デバイスから、意思決定データとしてデータサンプルを連続的に又は定期的に取得して、顧客の要求に応じて、対応する意思決定の効果を分析することができる。
【0026】
さらに、予測した意思決定の効果を評価し、予測した意思決定の効果と、ユーザが希望する効果との間に差異が存在することが判明した場合は、ユーザが適時、戦略を調整できるように、ユーザに対し警告を生成することも望まれている可能性がある。
【0027】
本開示のいくつかの実施形態によれば、データ分析に用いられる解決手段が提供される。該解決手段では、まず、履歴イベントに影響を与えた履歴要因に関連付けられる履歴条件データと、履歴結果データとに少なくとも基づき、履歴要因と履歴イベントの結果との間の関連付けを生成することができる。該履歴結果データは、履歴要因により生じた履歴イベントの結果を示す。そして、現在のイベントについて選択される、関心のある少なくとも1つの目標結果を決定することができる。該現在のイベントは、履歴イベントと一定の関連がある。その後、該現在のイベントに影響を与える現在の要因と、関心のある少なくとも1つの目標結果に関連付けられる少なくとも1つの目標対象とを決定することができ、さらに、関連付けと、現在の要因に関連付けられる現在の条件データと、少なくとも1つの目標対象とに少なくとも基づき、関心のある少なくとも1つの目標結果のデータを決定することができる。この方法により、より正確な予測が実現可能となり、意思決定の精緻化に対するユーザの要望に応えることができる。
【0028】
例示的な環境
【0029】
以下、図面を参照しながら本開示の実施形態について具体的に説明する。
図1は、本開示の複数の実施形態を実現可能な例示的な環境100の模式図を示す。
図1に示すように、該例示的な環境100はデータ分析デバイス110を含む。該データ分析デバイス110は、データベース111と、予測ユニット112とを含むことができる。
【0030】
データベース111は、例えば情報収集デバイス、アンケート調査等の方法で、複数種類のルートを介して取得された必要データファイルを記憶するために用いることができる。例えば、小売業について、データベース111は、今までの販売促進プラン及び履歴販売記録等の情報を記憶することができる。
【0031】
また、データベース111はさらに、データに対し一般的な前処理を行う機能も有することができる。該前処理は例えば、異常データの検出、データクレンジング、欠測値補定、サンプルフィルタリング、要因選択等のステップを含み、これによってデータ品質を高めることができる。
【0032】
予測ユニット112は、データベース111から抽出した既存のデータを利用して特定の知識を学習して、新たなデータを処理するために用いることができる。予測ユニット112は、例えば意思決定の評価、結果予測、目標検出等の各種タスクを実行するように設計することができる。分析ユニット120の例示には、各種のディープニューラルネットワーク(DNN)、畳み込みニューラルネットワーク(CNN:Convolutional neural network)、サポートベクターマシン(SVM:support vector machine)、決定木、ランダムフォレストモデル等が含まれるが、これらに限定されない。
【0033】
いくつかの実施形態において、予測ユニット112が、例えばいくつかの商業データにより、ショッピングモールの売上高に対する販売促進イベントの影響を評価するなど、意思決定評価タスクを実行するために用いられる場合、予測ユニット112は、入力されたショッピングモール販売促進イベントに関連付けられる要因に対する評価を提供することができる。
【0034】
いくつかの実施形態において、予測ユニット112は、データベース111の中から、履歴販売促進イベントに関連付けられる商業データを取得し、これらのデータに基づき、履歴販売促進イベントに影響を与えた要因と、結果(例えば売上高)との間の因果関係モデルを生成することができる。いくつかの実施形態において、現在の販売促進イベントに影響を与える要因を、分析ユニット120により確立された因果関係モデルに入力して、現在の販売促進イベントに関連付けられる関心のある結果を予測することができる。
【0035】
いくつかの実施形態において、産業オートメーションの場面での目標検出を実行するために予測ユニット112が用いられる場合、予測ユニット112は、例えば、技術フロー、操作方法及び機器構成に関連付けられるデータにより、機器の故障に対するそれらの影響を分析する。
【0036】
いくつかの実施形態において、予測ユニット112は、外部情報収集デバイスから周期的に、機器操作及び機器属性に関連付けられるデータサンプルを取得し、機器の故障に対するデータサンプルの影響のデータ分析を行うことができる。いくつかの機器操作及び機器の属性によって引き起こされる機器の故障の可能性が、閾値の範囲を超えていると決定した場合、予測ユニット112はさらに、ユーザに対し警告を発することができる。
【0037】
図1に示す稼働環境100は、あくまでも例示を目的としており、稼働環境を限定することを意図するものではないことを理解すべきである。稼働環境100はさらに、任意の数のコンピュータユニット又はプロセッサユニットを含むことができる。
【0038】
以下、
図1と結び付けて、予測ユニット112における因果関係モデルの生成、及び所定の目標についての予測のプロセスについて、さらに詳細に説明する。
【0039】
因果関係の例示
【0040】
図2は、本開示の実施形態にかかる因果関係の実例の有向非巡回グラフ(DAG:Directed Acyclic Graph)を示す。因果関係モデルの生成及び予測プロセスを説明する前に、まず、
図2を参照して因果効果に関する1つの実例について詳述する。
【0041】
一般的に、DAGを使用することで複数の変数の間の因果効果が説明される。該DAGは、変数を示すノードと、変数の間の因果効果を示す有向辺及び経路とを含むことができる。例えば、親ノードから、その子ノードに向かう有向辺は、親ノードが示す変数と子ノードが示す変数との間に、直接の因果効果があることを表すことができる。また、例えば、1つのノードから別のノードに向かう経路は、2つのノードが示す変数の間には、間接的な因果効果があることを表すことができる。
【0042】
図2において、変数「優遇幅」210、変数「商品タイプ」230は、処理変数であるとみなすことができ、変数「販売促進結果」240は結果変数であるとみなすことができる。変数「優遇幅」210及び変数「商品タイプ」230から、変数「販売促進結果」240までの辺203及び204は、直接辺と定義することができる。これは、変数「優遇幅」210及び変数「商品タイプ」230が、変数「販売促進結果」240に対して直接影響を及ぼし得ることを表す。
【0043】
また、
図2にはさらに、媒介変数「顧客体験」220が含まれている。変数「優遇幅」210から変数「顧客体験」220までの辺201は、直接辺と定義することができるが、変数「優遇幅」210から変数「顧客体験」220を経由して変数「販売促進結果」240に至る辺202は、間接辺と定義することができる。これは、変数「優遇幅」210が変数「顧客体験」220に影響を及ぼすことができる一方、変数「顧客体験」220もまた、変数「販売促進結果」240に影響を与え得ることを表す。
【0044】
例えば、優遇幅が比較的大きいと、商品を購入するために来店する顧客が多すぎて、ショッピングモールの負荷を超える可能性がある。その結果、ショッピングモールの駐車場が不足し、販売スタッフのサービスの水準が低下し、在庫商品が不足するといった、顧客体験に影響する状況を作り出す可能性があるため、顧客体験も最終的な売上に影響を与える。
【0045】
図2に示す有向非巡回グラフは、結果変数に影響を与える可能性がある条件変数(即ち処理変数及び媒介変数)の例示にすぎないことを理解すべきである。
図2に示す有向非巡回グラフはさらに、可能性のある他の処理変数及び媒介変数、並びにそれらと結果変数との間の直接辺及び/又は間接辺も含むことができる。
【0046】
例示的な使用場面
【0047】
図3は、本開示の実施形態にかかる1つの使用場面の模式図である。以下、
図3を参照して、本開示の実施形態にかかる適用についてさらに説明する。
【0048】
図3に示すように、使用場面500は、
図1におけるデータ分析デバイス110と、ユーザ端末310とを含むことができる。データ分析デバイス110とユーザ端末310との間は、通信が可能である。
【0049】
例えば、因果モデル確立段階では、データ分析デバイス110は、ユーザ端末から、予測しようとする目標結果に影響を与える可能性がある、目標結果に関連付けられる条件データの複数のデータサンプルを、周期的に取得することができ、これにより、データ分析デバイス110は、目標結果を予測するための因果モデルを、大量のデータサンプルに基づき確立することができる。
【0050】
いくつかの実施形態において、データ分析デバイス110が産業オートメーションの場面での目標検出を実行する場合、ユーザ端末310を例えば、産業オートメーションの場面で配置される複数の工業センサ(図示せず)に接続することができる。工業センサは、収集した環境データをユーザ端末310に報告する。これらの環境データがユーザ端末310を経由してデータ分析デバイス110に送信されることによって、データ分析デバイスは十分なデータサンプルを取得することができる。
【0051】
また、結果予測段階では、データ分析デバイス110はユーザ端末310から、ユーザの該予測プロセスに対するいくつかの個別の要望、例えば関心のある予測目標、データサンプルについての制約条件等を取得することができる。予測完了後、データ分析デバイス110はユーザ端末310に予測結果を送信することができる。
【0052】
いくつかの実施形態において、予測結果とユーザが望む結果との間に、比較的大きい差異が存在するとデータ分析デバイス110が決定した場合、データ分析デバイス110はさらに、該差異に関する警告をユーザ端末310に送信することができる。
【0053】
理解すべき点として、
図3は例示的な応用場面を示したものにすぎない。該場面には、任意の数のユーザ端末310を含むことができる。また、データ分析デバイス110は、例えばユーザ端末310のモジュールでもよく、または、該ユーザ端末310内にチップ形式で集積されてもよい。
【0054】
例示的なインタラクティブプロセス
【0055】
図4は、本開示の実施形態にかかるデータ分析のインタラクティブプロセス400の模式図を示す。インタラクティブプロセスは、
図3で示す使用場面において実施することができる。したがって、ここでも
図3のデータ分析デバイス110及びユーザ端末310を例に、インタラクティブプロセスを説明する。
【0056】
データ分析デバイス110は、ユーザ端末310から、イベントに影響を与える要因の条件データと、該要因により生じるイベント結果のデータとを取得することができる(405)。いくつかの実施形態において、条件データは、周期的に又は連続して、ユーザ端末310からデータ分析デバイス110に送信され得る。該条件データは例えば、ユーザによってユーザ端末310に入力されるデータである。該条件データは、ユーザ端末310に接続された例えばセンサ等の他のデータ収集用周辺機器によって収集され、ユーザ端末310に報告されるデータでもよい。
【0057】
データ分析デバイス110は、大量のデータサンプルにより、条件データと結果データとの間の因果関係を決定することができる(410)。例えば、センサは、部品に関する温度データ、部品が存在する産業環境の環境データ、部品の使用頻度データ及び該部品の老朽化データの複数のデータサンプルを収集する。データ分析デバイス110は例えば、該部品について、部品の温度レベル、環境要因、使用頻度が部品の老朽化に与える影響を決定することができる。また、データ分析デバイス110は例えば、該部品の故障可能性、故障の発生頻度間隔、及び、それに伴う機器のメンテナンスコスト等もさらに予測することができる。
【0058】
ユーザ端末310は、別のイベントについての指示をデータ分析デバイス110に送信することができる(415)。該指示は例えば、該別のイベントについてユーザが関心のある予測目標、該別のイベントに影響を与える可能要因、可能要因に関する制約条件、及び、ユーザが関心のある目標結果に関連付けられる目標対象のうちの1つの又は複数の情報を含むことができる。
【0059】
データ分析デバイス110は例えば、指示の中から、該別のイベントに影響を与える可能要因の条件データと、該別のイベントについてユーザが関心のある予測目標とを取得する。例えば、該可能要因の条件データは、別の部品が置かれている操作環境のいくつかの環境パラメータであり、該別の部品は、前のイベントにおける部品と同じ材料で構成されてもよい。データ分析デバイス110は、該別のイベントが前のイベントと関連付けられると決定することができ、その上で、前のイベントに基づき確立された因果関係モデルを取得することができる。
【0060】
データ分析デバイス110は、該因果関係モデルと、ユーザ端末310による指示の中から取得した1つ又は複数の情報とに基づき、該別のイベントについてユーザが関心のある予測目標の結果を決定することができる(420)。例えば、データ分析デバイス110は、ユーザ端末310による指示の中から取得した1つの又は複数の情報を因果モデルに入力し、該因果モデルの出力結果を予測目標の結果とすることができる。
【0061】
データ分析デバイス110は、該予測目標の結果をユーザ端末310に送信することができる(425)。ユーザが予測目標の結果に不満であれば、イベントに影響を与える要因の条件データを調整してデータ分析デバイス110に送信し、再度予測を行うことができる。
【0062】
また、データ分析デバイス110は予測目標の結果に基づき、自動分析を行うことができる。例えば、ユーザ端末310はその前に、所望の結果の範囲をデータ分析デバイス110に送信済みである。データ分析デバイス110は、該所望の結果の範囲に基づき、予測結果と所望の結果との間の差異が閾値の差異を超えていると決定した場合、ユーザ端末に差異に関する警告を送信することができる。
【0063】
以上、データインタラクションの観点から、本開示の実施形態によるデータ分析プロセスについて簡潔に説明した。以下ではさらに、別の実例と結び付けてデータ分析の詳細について詳述する。
【0064】
データ分析の例示的なプロセス
【0065】
以下、
図5~
図7を参照して、データ分析に用いられるプロセスをより詳細に説明する。
図5は、本開示のいくつかの実施形態にかかる、データ分析に用いられるプロセス500のフローチャートを示す。プロセス500は、
図1のデータ分析デバイス110によって実現することができる。議論しやすいように、
図1を参照してプロセス500を説明する。
【0066】
図5に示すように、ブロック510において、データ分析デバイス110は、履歴イベントに影響を与える履歴要因に関連付けられる履歴条件データと、履歴結果データとに少なくとも基づき、履歴要因と履歴イベントの結果との関連付けを生成する。該履歴結果データは、履歴要因により生じた履歴イベントの結果を示す。
【0067】
いくつかの実施形態において、データ分析デバイス110は、例えば履歴条件データを取得することができる。該履歴条件データは例えば、
図1に示すデータベース111の中から取得することができる。また、該履歴条件データは他の方法で取得してもよい。例えば、データ収集デバイスから周期的に取得してデータ分析デバイス110に送信してよい。上述したように、該データ収集デバイスは、直接又は間接的にデータ分析デバイス110に接続されている。該データ収集デバイスは、例えば複数のセンサとし得る。
【0068】
いくつかの実施形態において、取得される履歴条件データは、異なるデータタイプを含むことができる。例えば、該履歴条件データのデータサンプルは離散型であってよい。また、該履歴条件データのデータサンプルは連続型であってもよい。または、履歴条件データのデータサンプルは、離散データサンプルとともに連続データサンプルも含むことができる。
【0069】
いくつかの実施形態において、データ分析デバイス110はさらに、履歴条件データに関連付けられる履歴結果データを決定することができる。その理由は、履歴条件データは、履歴イベントに影響を与える履歴要因と関連付けられ、該履歴結果データは、履歴要因によって生じた履歴イベントの結果を示すことができるからである。例えば、
図2に示された、因果関係を表す有向非巡回グラフが示す内容によれば、履歴条件データは例えば、優遇幅の状況でもよく、履歴結果データは例えば販売促進結果の状況であってよい。該履歴結果データは例えば、データベース111から直接取得してもよい。該履歴結果データは例えば、他の外部デバイスから入力される履歴イベント記録情報の中から取得されてもよい。
【0070】
データ分析デバイス110は、該履歴条件データ及び該履歴結果データに基づき、履歴要因と履歴イベントの結果との間の関連付けを生成することができる。
【0071】
1つの起こり得る状況として、例えば、取得した履歴条件データのデータサンプルのサンプル数が不足しているか又は単純であるため、ある履歴条件データに関連付けられる履歴結果データを直接取得することができない場合がある。例えば、取得した履歴条件データのデータサンプルは、化粧品販売促進に関するデータである一方、履歴結果は、レディースファッションの販売促進に関する収益である場合である。商品タイプが異なると消費グループ、消費サイクル、消費能力に差異が生じるため、履歴条件データと履歴結果データとの間の直接的な因果関係を確立することができない。
【0072】
それらの間の関係は、他のデータを利用して決定しなければならない可能性がある。よって以下では、
図6と結び付けて
図5のブロック510についてさらに詳述する。
図6は、本開示の実施形態にかかる履歴要因と履歴イベント結果との間の関連付けを決定するプロセスのフローチャートを示す。
【0073】
ブロック610において、データ分析デバイス110は履歴条件データを取得する。ブロック620において、データ分析デバイス110は、取得した履歴条件データのデータサンプル数が閾値の数より少ないか否かを判断し、履歴条件データのデータサンプル数が閾値の数より少ない場合、即ちサンプル数不足である場合、ブロック630において、データ分析デバイス110は参考データを取得する。該参考データには、例えば、専門家の知識が含まれる。該参考データは、履歴条件データが履歴結果に与える影響の程度を示すことができる。
【0074】
続いて
図6を参照すると、ブロック640において、データ分析デバイス110は、履歴条件データ及び参考データにより、履歴結果データを決定することができる。ブロック650において、データ分析デバイス110は、履歴条件データ及び履歴結果データに基づき、前記関連付けを生成することができる。
【0075】
ブロック620に戻り、履歴条件データのデータサンプル数が閾値の数より多い場合、ブロック660において、データ分析デバイス110は履歴条件データに基づき履歴結果データを決定することができ、先に説明したとおり、ブロック650において、履歴条件データ及び履歴結果データに基づき、前記関連付けを生成する。履歴条件データのサンプルが十分である場合であっても、専門家の知識を取得して、関連付けの確立プロセスをさらに最適化してもよいことを理解すべきである。
【0076】
また、履歴イベントに影響を与える要因と履歴イベント結果との関連付け、即ち因果モデルを生成した後、因果モデルをさらに調整することができる。例えば因果グラフにおいて、履歴イベントへの影響が比較的小さい辺等を「カット」する。例えば、データ分析デバイス110は、因果モデルの各ノードの影響要素の重みを計算することによって、いくつかの分岐を削ることができる。また、ユーザからの命令を受け取ることにより「カット」のプロセスを実施してもよい。例えば、ユーザの経験に基づき、予測目標への影響が比較的小さい要因が省略される。
【0077】
再び
図5を参照すると、ブロック520において、データ分析デバイス110は、現在のイベントについて選択される、関心のある少なくとも1つの目標結果を決定する。該現在のイベントは、履歴イベントに関連付けることができる。例えば、履歴イベントは、あるショッピングモールの第1四半期の販売促進状況である場合、現在のイベントは例えば、該ショッピングモールの第3四半期の販売促進状況とし得る。
【0078】
一実施形態では、データ分析に関するユーザからの指示を受け取り、該指示に基づき、該現在のイベントについてユーザが選択する、関心のある目標結果を1つ決定することができる。この目標結果は、知りたいと望んでいる、現在のイベントの発生によって起こり得る結果であってよい。例えば、イベントが該ショッピングモールの第3四半期の販売促進状況であれば、関心のある目標結果は、例えば商品の売上である。
【0079】
該指示には、ユーザが選択する関心のある目標結果が複数含まれてもよい。こうした目標結果は、イベントの発生によって得られる可能性があるものである。例えば、イベントが例えば該ショッピングモールの第3四半期の販売促進状況である場合、関心のある目標結果は例えば、商品売上、販売利益及び販売量の増加幅等である。
【0080】
従来の方式での因果モデルでは1つの目標結果しか選択できないのに対し、本開示の実施形態にかかる因果モデルは、複数の目標結果に対する予測を実現することができる。こうすることで、データ分析の効率を高め、データ分析に拡張性と柔軟性をもたらすことができる。
【0081】
ブロック530において、データ分析デバイス110は、現在のイベントに影響を与える現在の要因と、関心のある少なくとも1つの目標結果に関連付けられる少なくとも1つの目標対象とを決定する。ここでも現在のイベントが該ショッピングモールの第3四半期の販売促進状況である場合を例とすると、現在のイベントに影響を与える現在の要因として、例えば、商品の値下げ幅、購入特典制、クーポン券交換ポイント制等の販売促進手法を挙げることができる。一実施形態において、現在のイベントに影響を与える現在の要因は、データ分析に関するユーザからの指示により、取得することができる。一実施形態において、現在のイベントに影響を与える現在の要因は、ユーザが選択した関心のある少なくとも1つの目標結果に基づき、関連する履歴イベントに影響を与えた要因の中から、自動的に選択されてもよい。
【0082】
関心のある少なくとも1つの目標結果に関連付けられる少なくとも1つの目標対象について、本開示の解決手段によれば、目標対象を異なる粒度に分割することができる。
図7は、本開示の実施形態にかかる目標対象を決定するプロセスのフローチャートである。以下、
図7と結び付けて目標対象の決定について説明を行う。
【0083】
一実施形態では、ブロック710において、データ分析デバイス110は、現在の要因の現在の条件データのデータサンプルに関連付けられる対象の集合を決定することができる。ここでも、現在のイベントが該ショッピングモールの第3四半期の販売促進状況である場合を例とすると、対象の集合は、例えば消費者全体とし得る。ブロック720において、データ分析デバイス110はさらに、所望のグループ分けの粒度を決定することができる。
【0084】
一実施形態では、データ分析に関するユーザからの指示を受け取り、ユーザが所望するグループ分けの粒度を、該指示に基づき決定することができる。
【0085】
いくつかの実施形態において、所望されるグループ分けの粒度は、例えば個人の対象とし得る。例えば、ショッピングモールのVVIP顧客である。所望されるグループ分けの粒度が、個人の粒度である場合、ユーザはトレーニングデータ又は新たなデータファイルを取得し、サンプル個人ID等の情報により、1の個人を選定し、該個人の関連データを、因果モデルの初期値として取得することができる。
【0086】
いくつかの実施形態において、所望されるグループ分けの粒度は、例えば所定の対象属性を有する単一グループの対象とし得る。例えば、年齢が28~35歳の女性消費者である。所望されるグループ分けの粒度が、集団の粒度である場合、ユーザは、トレーニングデータ又は新たなデータファイルを取得することができ、データ分析デバイス110は、該集団の各要素の平均値を自動で統計し、例えば、因果グラフ(
図2参照)における各親ノードの平均値をベースに、因果モデルにおいて親でないノードの初期値を算出することができる。
【0087】
一実施形態において、所望されるグループ分けの粒度は、例えば複数グループの対象とし得る。該複数グループの対象はそれぞれ、異なる対象属性を有する。所望されるグループ分けの粒度が、複数グループの粒度である場合、ユーザは、トレーニングデータ又は新たなデータファイルを取得し、絞り込み条件によって異なる集団に絞り込む。例えば、性別毎にグループ分けした集団、又は商品タイプ毎にグループ分けした集団のように、異なる集団に絞り込む。そして、グループ分けされた異なる集団それぞれに対して、因果モデルを確立し、因果モデルの初期値をそれぞれ算出することができる。
【0088】
ブロック730において、データ分析デバイス110は、グループ分けの粒度に基づき、対象の集合の中から、関心のある少なくとも1つの目標結果に関連付けられる少なくとも1つの目標対象を決定することができる。
【0089】
この方法により、本開示の実施形態にかかる因果モデルは、より正確な予測を実現して、意思決定の精緻化に対するユーザの要望に応えることができる。
【0090】
また、一実施形態において、データ分析デバイス110はさらに、現在の要因の制約条件を決定することができる。該制約条件は、現在の要因について選択可能なデータ範囲を示すことができる。例えば、現在のイベントに影響を与える現在の要因が、商品値下げ幅である場合、制約条件は例えば、割引が5割引から1割引までの間でもよい。さらに例えば、現在のイベントに影響を与える現在の要因が、購入特典制である場合、制約条件は例えば、商品のカテゴリー・設備に応じて、消費還元額が8%から10%と異なっていてもよい。データ分析デバイス110は、制約条件に基づき、現在の要因に関連付けられる現在の条件データを決定することができる。
【0091】
一実施形態では、データ分析に関するユーザからの指示を受け取り、該指示に基づき、ユーザが所望する制約条件を決定することができる。
【0092】
再び
図5に戻ると、ブロック540において、データ分析デバイス110は、関連付けと、現在の要因に関連付けられる現在の条件データと、少なくとも1つの目標対象とに少なくとも基づき、関心のある少なくとも1つの目標結果のデータを決定する。
【0093】
一実施形態において、関連付けは上述した因果モデルである。データ分析デバイス110は、現在の条件データと、少なくとも1つの目標対象のタグとを因果モデルに入力することができ、該モデルの出力は目標結果のデータである。
【0094】
また、一実施形態において、データ分析デバイス110は、少なくとも1つの目標対象についての条件データサンプルを取得することができる。該条件データサンプルは、履歴トレーニングデータサンプル又は新たなデータサンプルとし得る。データ分析デバイス110は、該条件データサンプル及び因果モデルに基づき、該少なくとも1つの目標対象に基づく目標結果のデータを決定することができる。
【0095】
本開示で説明したデータ分析の解決手段により、意思決定の評価に用いられる因果モデルを確立することができる。該モデルは、複数の目標及び異なる粒度の対象のグループについて、目標結果の予測を行うことができる。この方法により、分析の柔軟性と精度を高めることができる。同時に、異なる予測粒度に対するユーザの要望に応えることができる。
【0096】
例示的なデバイス
【0097】
図8は、本開示の内容の実施形態を実施可能な例示的なデバイス800のブロック模式図を示す。例えば、
図1に示すデータ分析デバイス110又は予測ユニット112は、デバイス800によって実現することができる。図に示すように、デバイス800は、中央処理ユニット(CPU)801を含む。CPU801は、読み取り専用メモリ(ROM)802に記憶されたコンピュータプログラムの命令、又は記憶ユニット808からランダムアクセスメモリ(RAM)803にロードされたコンピュータプログラムの命令に基づき、各種の適切な動作及び処理を実行することができる。RAM803にはさらに、デバイス800の操作に必要な各種プログラム及びデータを記憶することができる。CPU801、ROM802及びRAM803はバス804を介して互いに接続されている。入力/出力(I/O)ポート805もバス804に接続されている。
【0098】
デバイス800における複数の部品は、I/Oポート805に接続されている。複数の部品には、物理キーボード、マウス等の入力ユニット806、様々な種類のディスプレイ、スピーカ等の出力ユニット807、物理的な磁気ディスク、物理的な光ディスク等の記憶ユニット808、及びネットワークインタフェースカード、モデム、無線通信装置等の通信ユニット809が含まれる。通信ユニット809によって、デバイス800は、インターネットのようなコンピュータネットワーク及び/又は各種電信ネットワークを介して、他のデバイスと情報/データを交換することができる。
【0099】
上述した各プロセス及び処理、例えば方法500、600及び700は、処理ユニット801により実行することができる。例えば、いくつかの実施形態において、方法500、600及び700は、コンピュータソフトウェアプログラムとして実現可能であり、記憶ユニット808のようなデバイスが読み取り可能な媒体に、有形的に記憶されている。いくつかの実施形態において、コンピュータプログラムの一部又は全部は、ROM802及び/又は通信ユニット809を経由してデバイス800にロード及び/又はインストールすることができる。コンピュータプログラムがRAM803にロードされCPU801により実行されると、上述した方法500、600及び700の一つ又は複数の動作を実行することができる。
【0100】
本開示は、方法、装置、システム及び/又はコンピュータプログラム製品とし得る。コンピュータプログラム製品は、本開示の各態様を実行するためのコンピュータが読み取り可能なプログラム命令が格納されたコンピュータ可読記憶媒体を備えることができる。
【0101】
コンピュータ可読記憶媒体は、命令実行デバイスにより使用される命令を保持し記憶することができる有形のデバイスとし得る。コンピュータ可読記憶媒体は、例えば、電気記憶ユニット、磁気記憶ユニット、光記憶ユニット、電磁気記憶ユニット、半導体記憶ユニット、又はこれらの任意の適切な組合せとし得るが、これらに限られない。コンピュータ可読記憶媒体のより具体的な例として(全てではない)、物理的なポータブル・コンピュータ・ディスケット、物理的なハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去・書き込み可能なリードオンリーメモリ(EPROM又はフラッシュメモリ)、スタティックRAM(SRAM:Static Random Access Memory)、携帯型コンパクト物理ディスクリードオンリーメモリ(CD-ROM)、デジタル多用途物理ディスク(DVD)、メモリースティック、物理的フロッピーディスク、機械的エンコーダディスク、例えば命令が記憶されているパンチカード又は溝内の突起構造、及びこれらの任意の適切な組み合せが含まれる。ここで使用されるコンピュータ可読記憶媒体は、例えば、無線電波若しくは他の自由伝播する電磁波、導波若しくは他の送信媒体を介して伝播する電磁波(例えば、光ケーブルを介する光パルス)、又は電線で送信される電気信号のような、瞬時の信号そのものであるとは解釈されない。
【0102】
ここで説明されるコンピュータが読み取り可能なプログラム命令は、コンピュータ可読記憶媒体から各計算/処理デバイスにダウンロードすることができ、又は、ネットワーク、例えばインターネット、ローカルエリアネットワーク、ワイドエリアネットワーク及び/又は無線ネットワークを介して外部のコンピュータ又は外部記憶装置にダウンロードすることができる。ネットワークは、銅線送信ケーブル、光ケーブル送信、無線送信、ルータ、ファイアウォール、スイッチ、ゲートウェイコンピュータ及び/又はエッジサーバを含むことができる。各計算/処理デバイスにおけるネットワークインタフェースカード又はネットワークインタフェースは、コンピュータが読み取り可能なプログラム命令をネットワークから受信し、該コンピュータが読み取り可能なプログラム命令を転送し、各計算/処理デバイスのコンピュータ可読記憶媒体に記憶されるようにする。
【0103】
本開示の操作を実行するためのコンピュータプログラム命令は、アセンブラ指示文、命令セットアーキテクチャ(ISA:Instruction Set Architecture)、機械語命令、機械関連命令、マイクロコード、ファームウェア命令、状態設定データ、又は、一種類若しくは複数種類のプログラミング言語の任意の組合せで記述されたソースコード若しくはオブジェクトコードとし得る。前記プログラミング言語は、Smalltalk、C++等のオブジェクト指向のプログラミング言語、及び、「C」言語又は類似のプログラミング語言のような一般的なプロセス式プログラミング言語を含む。コンピュータが読み取り可能なプログラム命令は、全てユーザコンピュータ上で実行することができ、部分的にユーザコンピュータ上で実行することができ、1つの独立したソフトウェアパッケージとして実行することができ、ユーザコンピュータ上で部分的に実行するとともにリモートコンピュータ上で部分的に実行することができ、又は全てリモートコンピュータ若しくはサーバ上で実行することができる。リモートコンピュータにかかる状況において、リモートコンピュータは、ローカルエリアネットワーク(LAN)又はワイドエリアネットワーク(WAN)を含む任意の種類のネットワークを介して、ユーザコンピュータに接続することができ、あるいは、外部のコンピュータに接続することができる(例えばインターネットサービスプロバイダを利用しインターネットを介して接続する)。いくつかの実施形態では、コンピュータが読み取り可能なプログラム命令のステータス情報を利用して、例えばプログラマブルロジック回路、フィールドプログラマブルゲートアレイ(FPGA)又はプログラマブルロジックアレイ(PLA)のような電子回路をカスタマイズすることができる。該電子回路は、コンピュータが読み取り可能なプログラム命令を実行することで、本開示の各態様を実現することができる。
【0104】
ここでは、本開示の実施形態にかかる方法、装置(システム)及びコンピュータプログラム製品のフローチャート及び/又はブロック図を参照して、本開示の各態様を説明した。理解すべき点として、フローチャート及び/又はブロック図の各ブロック並びにフローチャート及び/又はブロック図の各ブロックの組合せは、いずれも、コンピュータが読み取り可能なプログラム命令により実現可能である。
【0105】
これらのコンピュータが読み取り可能なプログラム命令は、汎用コンピュータ、専用コンピュータ又は他のプログラミング可能なデータ処理装置のプロセッサユニットに提供されて、機器を生成することができ、これらの命令がコンピュータ又は他のプログラミング可能なデータ処理装置のプロセッサユニットで実行されると、フローチャート及び/又はブロック図の1つ又は複数のブロックで規定された機能/動作を実現する装置が生成される。これらのコンピュータが読み取り可能なプログラム命令は、コンピュータ可読記憶媒体に記憶されてもよい。これらの命令によって、コンピュータ、プログラミング可能なデータ処理装置及び/又はその他のデバイスは特定の方法で動作を行う。したがって、命令が記憶されているコンピュータ可読媒体は、フローチャート及び/又はブロック図の1つ又は複数のブロックで規定された機能/動作を実現する各態様の命令が含まれている製品を含む。
【0106】
コンピュータが読み取り可能なプログラム命令を、コンピュータ、他のプログラミング可能なデータ処理装置又は他のデバイスにロードして、コンピュータ、他のプログラミング可能なデータ処理装置又は他のデバイス上で一連の操作ステップを実行させ、コンピュータが実現するプロセスを生成してもよい。こうすることで、コンピュータ、他のプログラミング可能なデータ処理装置又は他のデバイスで実行される命令に、フローチャート及び/又はブロック図の1つ又は複数のブロックで規定された機能/動作を実現させる。
【0107】
図中のフローチャート及びブロック図は、本開示の複数の実施形態にかかるシステム、方法、コンピュータプログラム製品の実現可能なアーキテクチャ、機能及び操作を表している。この点において、フローチャート又はブロック図の各ブロックは、1つのモジュール、プログラムセグメント又は命令の一部を示すことができ、前記モジュール、プログラムセグメント又は命令の一部は、規定されたロジック機能を実現するための1つ又は複数の実行可能な命令を含む。代替的に、いくつかの実現形態では、ブロック内に表記された機能は、図中の表記と異なる順序で発生してもよい。例えば、2つの連続するブロックは実際には基本的に並行して実行することができるが、場合によっては反対の順序で実行してもよい。これは、関係する機能によって定められる。また、注意すべき点として、ブロック図及び/又はフローチャートの各ブロック、並びにブロック図及び/又はフローチャートのブロックの組合せは、規定された機能又は動作を実行する、ハードウェアに基づく専用システムで実現することができ、又は、専用のハードウェアとコンピュータ命令との組合せにより実現することができる。
【0108】
以上、本開示の各実施形態を説明したが、上述した説明は、例示的なものであり、全てを網羅したものではなく、開示された各実施形態に限定されない。説明した各実施形態の範囲及び精神から逸脱しない状況において、当業者が複数の修正及び変更を行うことができることは明らかである。ここで使用された用語は、各実施形態の原理、実際の応用又は市場での技術改良について最適な説明を行うこと、又は当業者に本明細書で開示された各実施形態を理解させることを意図して、選択したものである。