(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022101662
(43)【公開日】2022-07-06
(54)【発明の名称】エネルギー顧客の予測的セグメント化
(51)【国際特許分類】
G06Q 30/02 20120101AFI20220629BHJP
【FI】
G06Q30/02 314
【審査請求】有
【請求項の数】1
【出願形態】OL
(21)【出願番号】P 2022071562
(22)【出願日】2022-04-25
(62)【分割の表示】P 2021073240の分割
【原出願日】2016-12-15
(31)【優先権主張番号】62/269,793
(32)【優先日】2015-12-18
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】517423327
【氏名又は名称】シー3.エーアイ, インコーポレイテッド
(74)【代理人】
【識別番号】100078282
【弁理士】
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【弁理士】
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【弁理士】
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【弁理士】
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【弁護士】
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】エイドリアン アルバート
(72)【発明者】
【氏名】メヘディ マーソウミー
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049BB02
(57)【要約】 (修正有)
【課題】エネルギー消費者を分析するためのコンピュータアルゴリズムを提供する。
【解決手段】予測セグメント化を行う方法は、顧客データを受信するステップ、顧客採択ステータスを判定するステップ、初期パターンセットを生成するステップ、初期パターンセットを取捨選択するステップ、セグメントの最小有効度に関して最大値に反復的に近づいていくアルゴリズムに従ってパターンをセグメントに割り当てるステップ及びセグメントを処理するステップを備える。
【選択図】
図3
【特許請求の範囲】
【請求項1】
本明細書に記載の発明。
【発明の詳細な説明】
【技術分野】
【0001】
(発明の分野)
本願は、2015年12月18日に出願され、“Predictive Segmentation of Energy Consumers”と題された米国仮出願第62/269,793号の利益を主張するものであり、該米国仮出願の全体の内容は、参照により本明細書中に援用される。
【0002】
本発明は、エネルギー消費者を分析するためのコンピュータアルゴリズムに関する。
【背景技術】
【0003】
近年、エネルギー公益事業企業は、従来はその電気供給業者と関わりがなかった顧客基盤とのその関係を改善することにますます注力している。これまで、エネルギー企業およびその消費者は双方とも、公益事業者の役割を「光を灯し続けること」として理解していた。しかしながら、現在の技術傾向および顧客の考え方の偏移(特に、その顧客の選好の理解および予測に秀でた消費者に対面するインターネット企業の増加によって拍車がかけられている)は、公益事業におけるその顧客に関わることの関心の増加につながっている。
【0004】
これらの傾向は、複合して、データ可用性(スマートメータ等の感知インフラストラクチャを通して収集される高粒度消費データおよび消費者自体に関する他の「メタデータ」の両方)および本データを処理するための算出方法(例えば、Li and Yang(2015年)、Liu and Nielsen(2015年))の増加となっている。したがって、エネルギー公益事業者は、その顧客満足度および関与およびその顧客基盤内の環境に優しいプログラムへの参加を増加させる方法を提供し得る、分析技法にますます依拠している。顧客セグメント化は、顧客を理解し、その理解に応じて、作用する方法を識別するための技法として、大小様々な組織のマーケティングツールボックスの土台である。これは、いくつかの用途を挙げると、主に、マーケティング(包括的論評は、Association(2014年)に見られる)、オンライン広告(例えば、Yan et
al.(2009年))、または電子小売(例えば、Bhatnagar and Ghose(2004年))において使用されている。
【0005】
公益事業者が、その顧客とのより個人的かつ現代的関係を発展することを目指すにつれて、参加および関与を増加させるように、効率対策および他のプログラムについてのその通信を見直すための手段として、セグメント化を積極的に受け入れている。採用されている大部分の市場セグメント化技法は、実際は、固定規則セットの適用に焦点を当てている。例えば、大型住居に暮らし、子供を持つ消費者は、「高消費者」カテゴリに割り当てられる一方、環境保護雑誌を購読している者は、「環境保護提唱者」グループに帰属する。典型的には、これらの規則は、反事実または逸話経験、挙動研究、または小規模心理学実験から派生しており、実際は、「公然の事実」と見なされる。抽出した専門知識の結果なので、そのようなセグメント化方略は、確かに有用であり、理論および実践が知らしめられるべきである。
【0006】
本明細書に説明されるアプローチは、エネルギー消費者をセグメント化するための改良されたアプローチを提供する。
【発明の概要】
【課題を解決するための手段】
【0007】
本願は、顧客属性における特定のパターンに関して同質的であること、および所望の結果に対して予測的であることの両方である、大規模母集団内のサブグループを識別するための予測セグメント化技法を導入する。動機付けとなる設定は、エネルギー公益事業企業の顧客に対する非常に分かりやすくかつ直感的な、ある意味では最適でもある、セグメント化および標的化プロセスを作成することである。本設定では、エネルギー公益事業者は、少数のメッセージタイプが、異なるタイプの通信に応答する可能性が最も高い適切に選定された顧客に送信されるように設計することを所望する。提案される方法は、消費、人口統計、およびプログラム登録データを使用し、標準的機械学習技法を使用して、基本予測パターンを抽出する。本方法は、次に、専門家ガイドラインと、以前の挙動研究から利用可能な消費者特性についての仮説によって記述される、少数のセグメントへのパターンの実行可能な潜在的割当を定義する。アルゴリズムは、次いで、実行可能であること、および予測力を最大限にすることの両方である、両方のセグメントへのパターンの最適配分を識別する。本方法は、主要な米国エネルギー公益事業者からの大規模データセット上で実装され、その登録の可能性が平均母集団のものの2倍であって、少数の単純な直感的規則によって記述される、顧客のセグメントを得る。
本発明は、例えば、以下を提供する。
(項目1)
方法であって、
コンピュータシステムによって、それぞれが属性および顧客の採択ステータスを含む複数の顧客記録を受信するステップと、
前記コンピュータシステムによって、複数のパターンを識別するステップであって、各パターンは、前記複数の顧客記録の属性に従って、前記複数の顧客記録のうちの顧客記録のグループ化を定義する、ステップと、
前記コンピュータシステムによって、前記複数のパターンのうちの各パターンが前記複数のセグメントのうちの1つのセグメントに割り当てられるように、前記複数のパターンを複数のセグメント間に割り当てるステップであって、前記複数のパターンを前記複数のセグメント間に割り当てるステップは、前記複数のセグメントに関する最小有効度を反復的に増加させるアルゴリズムに従って行われ、各セグメントの有効度は、前記各セグメントに分散される前記複数のパターンのうちのパターンに合致する、前記複数の顧客記録のうちの顧客記録の採択ステータスの関数である、ステップと、
を含む、方法。
(項目2)
前記アルゴリズムは、方程式LFIP-Fを解くステップを含む、項目1に記載の方法。
(項目3)
前記アルゴリズムは、2分探索アルゴリズム1に従って、線形整数計画実行可能性問題を解くステップを含む、項目2に記載の方法。
(項目4)
前記複数のパターンのうちの各パターンは、前記各パターンの属性のうちの各属性に対し、前記各属性に関する閾値を備える、項目1に記載の方法。
(項目5)
前記複数のパターンを識別するステップは、決定ツリーに従って、前記複数の顧客記録を処理するステップを含む、項目1に記載の方法。
(項目6)
前記複数のパターンを識別するステップは、
決定ツリーに従って、前記複数の顧客記録を処理し、初期パターンセットを得るステップと、
前記初期パターンセットを取捨選択し、前記複数のパターンを得るステップと、
を含む、項目1に記載の方法。
(項目7)
前記初期パターンセットを取捨選択し、前記複数のパターンを得るステップは、
最小サポートを下回るサポートを有するパターンを除去するステップであって、前記パターンのセットのうちの各パターンのサポートは、前記各パターンに合致する顧客記録の数を示す、ステップ
を含む、項目6に記載の方法。
(項目8)
前記初期パターンセットを取捨選択し、前記複数のパターンを得るステップは、
最小有効度を下回る有効度を有するパターンを除去するステップであって、前記パターンのセットのうちの各パターンの有効度は、正の採択ステータスを有する前記各パターンに合致する顧客記録の割合を示す、ステップ
を含む、項目7に記載の方法。
(項目9)
前記最小有効度は、正の採択ステータスを有する前記複数の顧客記録のうちの全ての顧客記録の割合の1を上回る倍数である、項目8に記載の方法。
(項目10)
前記倍数は、少なくとも2である、項目9に記載の方法。
(項目11)
前記初期パターンセットを取捨選択し、前記複数のパターンを得るステップは、前記顧客記録のセットの最大パーセンテージを上回るものが、前記初期パターンセットの別のパターンにも合致するように、前記各パターンに合致する前記複数の顧客記録のうちの顧客記録のセットを有する、前記初期パターンセットの各パターンを除去するステップを含む、項目6に記載の方法。
(項目12)
前記最大パーセンテージは、60~75パーセントである、項目11に記載の方法。
(項目13)
各セグメントの有効度はさらに、前記各セグメントに割り当てられる各パターンの網羅行列の関数であり、各パターンの網羅行列は、前記各パターンに合致する前記複数の顧客記録のうちの各顧客記録に対して1/nの値を有し、nは、前記各顧客記録によって合致される前記複数のパターンのうちのパターンの数である、項目1に記載の方法。
(項目14)
1つまたはそれを上回る処理デバイスと、前記1つまたはそれを上回る処理デバイスに動作可能に結合される1つまたはそれを上回るメモリデバイスとを備えるシステムであって、前記1つまたはそれを上回るメモリデバイスは、実行可能コードを記憶し、前記実行可能コードは、1つまたはそれを上回るプロセッサに、
それぞれが属性および前記顧客の採択ステータスを含む複数の顧客記録を受信するステップと、
複数のパターンを識別するステップであって、各パターンは、前記複数の顧客記録の属性に従って、前記複数の顧客記録のうちの顧客記録のグループ化を定義するステップと、
前記複数のパターンのうちの各パターンが、前記複数のセグメントのうちの1つのセグメントに割り当てられ、前記複数のパターンが、前記複数のセグメントの最小有効度を最大限にすることを追求するアルゴリズムに従って前記複数のセグメント間に分散されるように、前記複数のパターンを複数のセグメント間に割り当てるステップであって、各セグメントの有効度は、前記各セグメントに分散される前記複数のパターンのうちのパターンに合致する前記複数の顧客記録のうちの顧客記録の採択ステータスの関数である、ステップと
を行わせるために有効である、システム。
(項目15)
前記アルゴリズムは、2分探索アルゴリズム1を使用して、方程式LFIP-Fに従って、線形整数計画実行可能性問題を解くステップを含む、項目14に記載のシステム。
(項目16)
前記複数のパターンのうちの各パターンは、前記各パターンの属性のうちの各属性に対し、前記各属性に関する閾値を備える、項目14に記載のシステム。
(項目17)
前記実行可能コードはさらに、前記1つまたはそれを上回るプロセッサに、
決定ツリーに従って、前記複数の顧客記録を処理し、初期パターンセットを得るステップと、
前記初期パターンセットを取捨選択し、前記複数のパターンを得るステップと、
によって、前記複数のパターンを識別させる、項目14に記載のシステム。
(項目18)
前記実行可能コードはさらに、前記1つまたはそれを上回るプロセッサに、
最小サポートを下回るサポートを有するパターンを除去するステップであって、前記パターンのセットのうちの各パターンのサポートは、前記各パターンに合致する顧客記録の数を示す、ステップと、
最小有効度を下回る有効度を有するパターンを除去するステップであって、前記パターンのセットのうちの各パターンの有効度は、正の採択ステータスを有する前記各パターンに合致する顧客記録の割合を示す、ステップと、
前記顧客記録のセットの最大パーセンテージを上回るものが、前記初期パターンセットの別のパターンにも合致するように、前記各パターンに合致する前記複数の顧客記録のうちの顧客記録のセットを有する前記初期パターンセットの各パターンを除去するステップと、
によって、前記初期パターンセットを取捨選択し、前記複数のパターンを得ることを行わせるために有効である、項目17に記載のシステム。
(項目19)
前記倍数は、少なくとも2である、項目18に記載のシステム。
(項目20)
前記実行可能コードはさらに、前記1つまたはそれを上回るプロセッサに、各セグメントの有効度を前記各セグメントに割り当てられる各パターンの網羅行列の関数として算出させるために有効であり、各パターンの網羅行列は、前記各パターンに合致する前記複数の顧客記録のうちの各顧客記録に対し、1/nの値を有し、nは、前記各顧客記録によって合致される前記複数のパターンのうちのパターンの数である、項目14に記載のシステム。
【図面の簡単な説明】
【0008】
本発明の利点が容易に理解され得るように、上記に簡単に説明される本発明のより具体的な説明が、添付の図面に図示される具体的実施形態を参照することによってもたらされるであろう。これらの図面は、本発明の典型的実施形態のみを描写するものであって、したがって、その範囲を限定するものと見なされないという理解の下、本発明は、付随の図面の使用を通して付加的具体性および詳細を伴って記載および説明されるであろう。
【0009】
【
図1】
図1は、本発明のある実施形態による、顧客の予測セグメント化を実装するためのコンポーネントの概略ブロック図である。
【0010】
【
図2】
図2は、コンピューティングデバイスの概略ブロック図である。
【0011】
【
図3】
図3は、本発明のある実施形態による、予測セグメント化を行うための方法のプロセスフロー図である。
【0012】
【
図4】
図4は、顧客データから抽出される決定ツリーを図示する、略図である。
【0013】
【
図5】
図5は、パターン有効度対規則の数の分布のプロットである。
【0014】
【
図6】
図6は、エネルギー顧客の登録を記述するための予測変数を示す、グラフである。
【0015】
【
図7】
図7は、顧客のセグメントに割り当てられるパターンのための実行可能性行列である。
【0016】
【
図8】
図8は、パターン間の重複の分布を示す、プロットである。
【0017】
【
図9】
図9は、2個のセグメントと関連付けられたパターンの実施例である。
【0018】
【
図10】
図10は、セグメント有効度対反復の数の下限および上限のプロットである。
【0019】
【
図11】
図11は、パターン/セグメント配分行列を図示する。
【0020】
【0021】
【
図13】
図13は、セグメント重複を図示する、別の略図である。
【0022】
【
図14】
図14は、セグメントの一覧と、セグメント化アルゴリズムに従う対応するパターンである。
【0023】
【化1】
に関するセグメント化アルゴリズムの感度分析を示す、プロットである。
【0024】
【化2】
に関するセグメント有効度のプロットである。
【0025】
【
図17】
図17は、セグメント化複雑性の関数としてのセグメント有効度の散布図である。
【発明を実施するための形態】
【0026】
1.動作環境および概要
図1を参照すると、本明細書に開示される方法は、図示される動作環境100によって実装されてもよい。サーバシステム102または他のタイプのコンピュータシステムは、データベース104をホストするかまたはそれにアクセスしてもよい。サーバシステム102はまた、デスクトップまたはラップトップコンピュータと置換され得るか、または、十分な計算力を伴うモバイルデバイスとさえ置換され得る。データベース104は、複数の顧客に関する顧客記録106を含んでもよい。本明細書に開示される方法は、エネルギー顧客に関して説明される。故に、各顧客記録106は、単一世帯または顧客アカウントに関するデータを含んでもよく、これは、したがって、ともに生活している複数の個人に関するデータを含んでもよい。
【0027】
顧客記録106は、氏名、アカウント番号、または他の一意の識別子の形態で1人またはそれを上回る顧客の識別子108aとして、そのような情報を含んでもよい。顧客記録106は、顧客の住所108bと、年齢、所得、性別、職業、教育レベル、および顧客を特徴付けし得る任意の他の情報等の顧客記録106と関連付けられた1人またはそれを上回る個人に関する人口統計情報108cとを含んでもよい。
【0028】
本明細書に開示される方法がエネルギー顧客に適用される場合、顧客記録106はさらに、使用量データ108d、例えば、1年、1ヶ月、または1日あたりに使用される毎時キロワット数を含んでもよい。使用量データ108dは、電力消費データの分析から得られた毎日、毎月、または季節的使用量パターンを含んでもよい。他の用途では、使用量データ108dは、別のサービスまたは特定のアイテムまたは生活必需品の購入の使用量を含み得る。
【0029】
顧客記録106は、顧客および顧客挙動のタイプを記述するパターンを識別する際に有用であり得る、顧客に関して入手可能な任意の他のデータ108eを含んでもよい。
【0030】
本明細書に開示される方法は、データを分析し、特定の措置を講じている顧客を予測する顧客データ(人口統計、使用量、およびその他)のパターンを判定するために使用される。エネルギー顧客の場合、これは、消費を低減させる、または別様に、顧客の環境影響を低減させるために、エネルギー効率プログラムに登録していること、または他の措置を講じていることを含んでもよい。故に、顧客記録106はさらに、顧客が特定のプログラムに参加することを選択しているかどうかを示す、1つまたはそれを上回る採択ステータスインジケータ108fを含んでもよい。例えば、ステータス108fは、顧客が参加を選択している場合、1であり得、そうでなければ、0であり得る。他の実施形態では、採択ステータスは、プログラムガイドラインへの準拠の程度または特定の目的に関して費やされた金銭の額を示す、値の範囲のうちの1つであってもよい。
【0031】
データベース104はさらに、そこに割り当てられる複数のパターン112を有するセグメント110を記憶してもよい。各セグメント110は、有効度114を有し、これは、正の採択ステータス108fを有し、セグメント110に割り当てられたパターン112のうちの1つに合致する、顧客記録の数の尺度である。
【0032】
セグメント110は、本明細書に以下で開示される方法を実装する、分析モジュール116によって定義されてもよい。特に、分析モジュール116は、パターン生成モジュール118aを含んでもよい。パターン生成モジュール118aは、顧客記録において同時に発生する一連の属性を識別する。以下に説明されるように、パターンは、各顧客記録内の種々の属性の値に関する閾値に関して記述されてもよい。また、以下に説明されるように、パターンは、決定ツリーまたは他のパターン識別アルゴリズムを使用して生成されてもよい。
【0033】
分析モジュール116はさらに、パターン取捨選択モジュール(pattern pruning module)118bを含んでもよい。以下に説明されるように、パターン取捨選択モジュール118bは、最小のサポート、有効度、または非重複基準を満たさない、パターンを取捨選択(prune)してもよい。分析モジュールは、セグメント化モジュール118cを含んでもよい。セグメント化モジュール118cは、セグメントの最小有効度114がパターンをセグメント間に分散させるアルゴリズムを通して増加させられたセグメント110のセットが得られるように、取捨選択118bで生き残ったパターン112をセグメント110に割り当てる。
【0034】
図2は、例示的コンピューティングデバイス200を図示する、ブロック図である。コンピューティングデバイス200は、本明細書で議論されるもの等の種々のプロシージャを行うために使用されてもよい。サーバシステム102は、コンピューティングデバイス200の属性の一部または全部を有してもよい。
【0035】
コンピューティングデバイス200は、1つまたはそれを上回るプロセッサ202と、1つまたはそれを上回るメモリデバイス204と、1つまたはそれを上回るインターフェース206と、1つまたはそれを上回る大容量記憶デバイス208と、1つまたはそれを上回る入力/出力(I/O)デバイス210と、ディスプレイデバイス230とを含み、これらの全ては、バス212に結合される。プロセッサ202は、メモリデバイス204および/または大容量記憶デバイス208内に記憶される命令を実行する、1つまたはそれを上回るプロセッサまたはコントローラを含む。プロセッサ202はまた、キャッシュメモリ等の種々のタイプのコンピュータ可読媒体を含んでもよい。
【0036】
メモリデバイス204は、揮発性メモリ(例えば、ランダムアクセスメモリ(RAM)214)および/または不揮発性メモリ(例えば、読取専用メモリ(ROM)216)等の種々のコンピュータ可読媒体を含む。メモリデバイス204はまた、フラッシュメモリ等の書込可能ROMを含んでもよい。
【0037】
大容量記憶デバイス208は、磁気テープ、磁気ディスク、光ディスク、ソリッドステートメモリ(例えば、フラッシュメモリ)等、種々のコンピュータ可読媒体を含む。
図2に示されるように、特定の大容量記憶デバイスは、ハードディスクドライブ224である。種々のドライブはまた、大容量記憶デバイス208内に含まれ、種々のコンピュータ可読媒体からの読取および/またはそこへの書込を可能にしてもよい。大容量記憶デバイス208は、可撤性媒体226および/または非可撤性媒体を含む。
【0038】
I/Oデバイス210は、データおよび/または他の情報が、コンピューティングデバイス200に入力されるかまたはそこから読み出されることを可能にする、種々のデバイスを含む。例示的I/Oデバイス210は、カーソル制御デバイス、キーボード、キーパッド、マイクロホン、モニタまたは他のディスプレイデバイス、スピーカ、ネットワークインターフェースカード、モデム、レンズ、CCDまたは他の画像捕捉デバイス、および同等物を含む。
【0039】
ディスプレイデバイス230は、情報をコンピューティングデバイス200の1人またはそれを上回るユーザに表示可能な任意のタイプのデバイスを含む。ディスプレイデバイス230の実施例は、モニタ、ディスプレイ端末、ビデオ投影デバイス、および同等物を含む。
【0040】
インターフェース206は、コンピューティングデバイス200が、他のシステム、デバイス、またはコンピューティング環境と相互作用することを可能にする、種々のインターフェースを含む。例示的インターフェース206は、ローカルエリアネットワーク(LAN)、広域ネットワーク(WAN)、無線ネットワーク、およびインターネットへのインターフェース等、任意の数の異なるネットワークインターフェース220を含む。他のインターフェースは、ユーザインターフェース218と、周辺デバイスインターフェース222とを含む。インターフェース206はまた、ポインティングデバイス(マウス、トラックパッド等)、キーボード、および同等物のためのインターフェース等、1つまたはそれを上回る周辺インターフェースを含んでもよい。
【0041】
バス212は、プロセッサ202、メモリデバイス204、インターフェース206、大容量記憶デバイス208、I/Oデバイス210、およびディスプレイデバイス230が、相互に通信すること、およびバス212に結合される他のデバイスまたはコンポーネントと通信することを可能にする。バス212は、システムバス、PCIバス、IEEE1394バス、USBバス等のいくつかのタイプのバス構造のうちの1つまたはそれを上回るものを表す。
【0042】
例証目的のために、プログラムおよび他の実行可能プログラムコンポーネントは、本明細書では、離散ブロックとして示されるが、そのようなプログラムおよびコンポーネントは、場合によって、コンピューティングデバイス200の異なる記憶コンポーネント内に常駐してもよく、プロセッサ202によって実行されることを理解されたい。代替として、本明細書に説明されるシステムおよびプロシージャは、ハードウェアにおいて、または、ハードウェア、ソフトウェア、および/またはファームウェアの組み合わせにおいて実装されることができる。例えば、1つまたはそれを上回る特定用途向け集積回路(ASIC)が、本明細書に説明されるシステムおよびプロシージャのうちの1つまたはそれを上回るものを実施するようにプログラムされることができる。
【0043】
図3を参照すると、サーバシステム102は、図示される方法300を実行してもよい。方法300は、顧客データを受信するステップ302を含んでもよい。これは、顧客に関してデータが集められる際、ある期間にわたって、データを受信するステップを含んでもよい。受信されたデータは、顧客記録106内に含まれるように上記に説明されたデータの一部または全部を含んでもよい。
【0044】
方法300はさらに、顧客採択ステータスを判定するステップ304を含んでもよい。採択ステータス108fは、受信される際に、または、顧客に対するオファーを延長する後続プログラムの一部として受信され、応答を受信する際に、顧客記録内に含まれてもよい。いずれの場合も、データは、手動でまたは自動的に、各顧客に対する採択ステータスを示すサーバシステム102に提供される。いくつかの実施形態では、方法300は、オファーを受信した顧客に対してのみ実行されてもよい。
【0045】
方法300はさらに、初期パターンセットを生成するステップ306を含んでもよい。例えば、初期パターンセットを生成するステップ306は、当技術分野において公知のような決定ツリーをトラバースするステップを含んでもよく、決定ツリーの各ノードは、顧客記録106の属性108b-108eに対応する、属性値または属性値の範囲である。例示的決定ツリーは、
図5に示され、初期パターンセットの生成は、以下の第3.2節「データからの予測パターンの抽出」および第5.2節「データから抽出される予測パターン」により詳細に説明される。
【0046】
方法300はさらに、初期パターンセットを取捨選択するステップ308を含んでもよい。これは、十分なサポートを有していないパターン(すなわち、パターンに合致する不十分な数の顧客記録106)、十分な有効度を有していないパターン(すなわち、パターンに合致し、正の採択ステータスを有する、不十分な数の顧客記録106)、および別のパターンにもまた合致する、合致する顧客記録の閾値を上回るパーセンテージを有するパターンを除去するステップを含んでもよい。取捨選択プロセスのより詳細な説明は、以下の第3.2節「データからの予測パターンの抽出」および第5.2節「データから抽出される予測パターン」に説明される。
【0047】
方法300はさらに、セグメントの最小有効度に関して最大値に反復的に近づいていくアルゴリズムに従ってパターンをセグメントに割り当てるステップ310を含んでもよく、有効度は、各セグメントに割り当てられるパターンに合致する顧客記録のどれだけ多くが正の採択ステータスを有するかについての尺度である。これは、以下の第3.1節「最小有効度の増加」に説明されるように、最適化アルゴリズムを実行するステップを含んでもよい。
【0048】
セグメントは、次いで、さらに処理されてもよい312。特に、セグメントは、標的化されたマーケティングのために使用されてもよい。すなわち、広告は、その有効度を増加させるために、1個のセグメントのパターンに合致する顧客のみに編成され、伝送されてもよい。セグメントはまた、顧客挙動を可視化するために、または任意の他の事業目標のために、使用されてもよい。
【0049】
方法300によって実装されるアルゴリズムは、以下の第2節から第3節により詳細に説明される。第4節は、以前のアプローチの概要を含み、第5節は、実際の顧客データを使用した実験結果を図示する。
【0050】
以下の説明は、セグメントの最小有効度を最大限にすることを追求する最適化アルゴリズムについてであることに留意されたい。故に、「最大」、「最適」、「最適化」、「最小限」、および「最小」という言及は、絶対または実際の最大、最適、または最小値を指すわけではなく、開示されるアルゴリズムの限界を被り、かつ開示されるアルゴリズムの有限数の反復の実施を受けて判定された最大、最適、または最小値であると理解されるものとする。
【0051】
具体的には、値「を最大限にする」、値の「最大限化」、および値の「最大」は、開示されるアルゴリズムの前の反復または開示されるアルゴリズムを行わない場合と比較して、値の増加を指すと理解されるものとするが、値の閉集合が検討され、閉集合内の最大値が、確実性を持って判定され得る場合を除く。
【0052】
値「を最小限にする」、値の「最小限化」、および値の「最小」は、開示されるアルゴリズムの前の反復または開示されるアルゴリズムを行わない場合と比較して、値の減少を指すと理解されるものとするが、値の閉集合が検討され、閉集合内の最小値が、確実性を持って判定され得る場合を除く。
【0053】
「最適化する」とは、開示されるアルゴリズムを行わない場合よりも絶対最適値に近い値を見出すことを意味すると理解されるものとし、絶対最適値を実際に見出すと理解されないものとする。同様に、「最適」値は、ほぼ最適値であると理解されるものとし、「ほぼ」は、数字を表し、それに関する数学的演算を行う正確度を表す際の限界、開示されるアルゴリズムが理論的に達成し得るものの限界、および実践的に行われ得る反復の数の限界を指す。
【0054】
2.予測セグメント化
透過的かつ有用なセグメント化方略は、以下を達成すべきである。1.実践者がそれに容易に関連させ、採択し得るように、既存の有用な専門知識および最良実践を取り込む。2.エネルギー公益事業者における非技術的プログラム管理者にとって分かりやすくかつ直感的であって、かつマーケティング通信を生成するために有用であること。3.有効度の観点から、ある最適性保証をもたらす、すなわち、母集団全体から無作為に得られた消費者より措置を講じる可能性がより高いメンバのサブグループを識別するその目的に関して、非常に弁別的である。
【0055】
第1に、多くの専門知識および実践的経験が、エネルギー公益事業者には存在し、その基盤の中から識別することを所望するある高レベルタイプの顧客についての仮説を立てることを可能にする。例えば、最も経験豊富なプログラム管理者は、「環境保護提唱者」消費者が、より「コスト優先的」な消費者(金銭節約についての議論に応答し得る)とは他のタイプの通信(環境への影響を強調する)に応答することに同意するであろう。
【0056】
第2に、本方法は、ある変数と各所与のセグメントを関連付ける既存の専門知識(例えば、「環境保護提唱者」は、その所得、世帯タイプ、および教育のレベルによって定義され得る)から開始し、最も有効なセグメント化方略につながるそれらの変数を伴う、単純論理規則を識別し得る。そのような直感的セグメントは、適切なメッセージ伝達方略を生成することを可能にするはずである。例えば、「環境保護提唱者」グループ内の消費者は、エネルギー節約の環境側面を強調する、メッセージを受信するであろう一方、「高消費者」カテゴリ内のそれらの消費者は、その多額の請求を削減し得る方法について通知されるであろう。
【0057】
課題は、次いで、(上記の第3の点に提示されるように)結果として生じるセグメントの有用な性質を確実にし、かつ課された構造を満たす最良可能セグメント化が達成されることを保証しながら、ポイント1および2の要求を取り込む、アルゴリズムセグメント化方法を開発することである。所望の結果は、エネルギー効率プログラム登録に関するマーケティング通信の影響を最大限にする、すなわち、登録する可能性がより高いそれらの顧客を標的化することである。通信の調整およびキャンペーンの管理は両方とも、コストがかかるため、少数のセグメントに対してメッセージを作成し、それらのセグメントに措置を講じる可能性がある消費者を含ませることが主眼である。
【0058】
2.1.問題設定
N人の消費者から成る母集団Xは、オペレータ(エネルギー公益事業企業)によってサービス提供される。各消費者に対し、公益事業者は、消費および顧客特性(社会人口統計および物理的構築属性等)の両方から成る、M個の数の特徴
【化3】
を観察する。したがって、全ての消費者を横断した特徴データが、行列
【化4】
内に記憶される。公益事業者はまた、各消費者iに対し、過去1年以内に任意のプログラムに登録したかどうかを観察し、これは、顧客iが登録したときに限り、バイナリ変数
【化5】
としてエンコードされる。
【0059】
公益事業者は、需要側効率プログラム登録のための標的化された通信の有効度を通知、簡略化、および増加させることを目的として、データ(X,y)を使用して、属性Xに対して「同質」である母集団内のK個のセグメントを識別することを所望する。以前のマーケティング研究に基づいて、公益事業者は、サービス提供している顧客の「タイプ」に関してある仮説を有し得る。本以前の知識は、以下の形態であると仮定される。「環境保護提唱者」は、比較的に高所得または少なくとも大学の学位を有する。「住宅改良希望者」は、住宅所有者またはその家の大黒柱である。
【0060】
次いで、データ(X,y)は、セット
【化6】
のパターン、
【化7】
を抽出することによって、これらの仮説を具体的にするために使用されることができ、これらは、これらのパターンを呈する消費者の特性を指すという点において記述的であり、かつ、あるパターンに入る消費者が母集団全体から無作為に選択された消費者より登録する可能性がより高いという点において予測的である。パターンは、したがって、以下の形態の論理表現であると定義され得る。
【化8】
式中、
【化9】
は、ベースルール(論理文)である。故に、パターンが、一連の論理積として定義される。互換的に、パターンは、パターンの論理定義に従う、消費者のセットと称され得る。ベースルールは、以下の形態であるとする。
【化10】
【0061】
したがって、ベースルールは、方向(「≧」または「≦」のいずれか)を指す、変数xj(x内のj番目の変数)と、データから学習された閾値tjとによって定義される。規則Pj(・)は、その規則を定義する変数および方向の両方が仮説に合致する場合、仮説に一致するとする。同様に、パターンPは、仮説と一致する、少なくともδ≧1の規則を含有する場合、仮説とδ一致であると定義する。
【0062】
アイテムiがパターンmによって網羅される範囲を要約する、網羅行列(coverage matrix)Cを定義することは、有用である。
【化11】
【0063】
パターンPの有効度は、そのパターンによって網羅される消費者の(経験的)登録確率として算出されてもよい。
【化12】
【0064】
上記の設定を用いて、各セグメント内の全てのパターンがそのセグメントを定義する仮説とδ一致であるように、K個のセグメントをパターンの集合として
【化13】
として定義する。
【化14】
は、セグメントとパターンとの間の許容関係を記述する、(公知の)整合性行列を定義するとする。
【化15】
【0065】
最後に、セグメント化は、以下の個々のセグメントのセットのようになる。
【化16】
【0066】
2.2.有効なセグメント化
ここで、登録の率に関して消費者セグメント間で区別可能である場合に有効となる、セグメント化方略を検討する。すなわち、優れた方略(K個のセグメントに関して)は、母集団全体において観察される全体的率qと非常に異なる(より小さいか、またはそれを上回るかのいずれかである)確率qk、k=1,・・・,Kを伴って登録する、母集団内のそれらのセグメントを識別するであろう。例えば、セグメント化が、K=2のグループAおよびBから成る場合、A内の全ての消費者が登録しているが、B内の消費者が登録していなければ(したがって、qA=1かつqB=0)、完全に有効である。完全に非有効なセグメント化は、A内の消費者がB内の消費者と同一率で登録している(したがって、qA=qB)。当然ながら、常時、効率プログラムに登録した全ての者をセグメントのうちの1つに入れることによって、消費者を2個のセグメントにグループ化し得る。しかしながら、課題は、登録を予測もする、セグメントの分かりやすい直感的定義につながる、消費者特性X内のパターンを識別することである。
【0067】
各セグメントの有効度は、そのセグメント内の消費者の(経験的)登録確率としてパターンの有効度と類似方法で算出されてもよい。
【化17】
【0068】
セグメントは、したがって、
【化18】
である場合、登録に関する優れた価値尺度の数字である。式中、
【化19】
は、全体的母集団内の登録の率である。解決したい問題は、結果として生じるセグメントが、例えば、以下の望ましい有効度性質を有するように、少なくとも
【化20】
であって、最大で
【化21】
のパターンを各セグメントに配分することである。・最小有効度を最大限にする
【化22】
・セグメントを横断して有効度の適切な平衡を確実にする
【化23】
式中、所与の加重ベクトルである、θを用いる。
【0069】
これに関して、以下のように、決定変数
【化24】
を定義する。
【化25】
【0070】
したがって、セグメントkは、以下のように定義される。
【化26】
【0071】
次いで、問題は、目的(8-9)のうちの1つが最大限にされ、以下の実行可能性制約(F
0)が満たされるように、z
mkの値を見出すこととなる。
【化27】
【0072】
所与のセグメントに関して実行可能な多くのパターン、すなわち、
【化28】
が存在し得る。さらに、パターンは、重複し得る(すなわち、定義する消費者のセットは、互いに素ではない
【化29】
)。次いで、S内のセグメントも同様に、記述する顧客内で重複するパターンを含有することが起こる場合、重複し得る。これは、制約(F0)に対処(8-9)し、かつ満たす、最適化問題の適切な定式化に付加的複雑化を課す。
【0073】
パターンが重複しない場合、セグメント有効度は、以下のように記載され得る。
【化30】
【0074】
しかしながら、パターン重複は、実質的であり得るため、上記の式は、パターン
【化31】
の複数のパターンに入る消費者をオーバカウントする。本問題に対処するために採択する1個の簡略化は、n個の異なるパターンによって網羅される消費者が各パターン上に1/nの分数網羅率を有すると見なされ得るということに留意して、網羅行列Cの定義を緩和することである。これは、修正網羅行列
【化32】
、すなわち、以下に変換される。
【化33】
【0075】
したがって、修正網羅行列は、単一パターンの分数網羅率を示す各消費者iに加重を割り当てる(等しい重要性を各パターンに与える)。便宜上、本修正行列を依然としてCと称する。
【0076】
3.予測セグメントの算出
予測セグメント化を算出するためのアルゴリズムの設計は、目的関数がとる具体的形態によって判定されるであろう(全ての制約は、単純線形形態である)。ここで、目的が、K個のセグメントを横断して最小有効度を最大限にするように、許容可能パターンをセグメントに配分することである状況に焦点を当てる(方程式(8)参照)。これは、その標的化された通信方略の最小有効度についての保証を有することを所望するプログラム管理者のための自然な要件である。
【0077】
3.1.最小有効度の増加
方程式(12)における上記の式は、各セグメントに対して決定変数をエンコードする、K個のベクトルz
kを利用する。単一決定変数ベクトルを使用して、目的および制約をより使いやすいアフィン形態で表すために、以下の表記を採用することができる。
【化34】
式中、
【化35】
を用いる。次いで、有効度は、以下として表されることができる。
【化36】
【0078】
F
0における実行可能性条件は、以下となる。
【化37】
【0079】
最大-最小目的の場合(8)では、最適化は、可能な限り、セグメントを横断して有効度の下限を増加させようとする。これは、q
ksの比較的に同質な分布をもたらす。本状況は、例えば、セグメントのそれぞれに措置が講じられるであろうとき、望ましくあり得る。この場合、最適化問題は、以下として表されてもよい。
【化38】
【0080】
問題(LFIP)は、線形制約を伴う、一般化(最大-最小)線形分数整数計画(generalized(max-min) linear-fractional integer program)である。本問題のクラスは、文献において広範に研究されている(例えば、論評に関して、Horst and Pardalos(1995年)、Feng et al.(2011)、Schaible and Shi(2004年)参照)。Boyd and Vandenberghe(2004年)に従って、以下の(LFIP)の等価な式を線形整数計画実行可能性問題(LFIP-F)として提案する。
【化39】
式中、k=1,…,Kに関して、Aは、行
【化40】
を伴う行列であって、Dは、行
【化41】
を伴う行列である。λの所与の値に関して、上記の実行可能性問題(LFIP-F)は、標準的混合整数計画パッケージを使用して解かれることができる。初期顧客特性データは、非常に大きくあり得るが(ここでは、
【化42】
の顧客)、パターンの数は、はるかに小さくなると予期され(M~1,000)、セグメントの数も同様である(ここでは、K=5)。次いで、標準的パッケージは、優れた独創的な能力を発揮することができる。次いで、対応する最適zを伴う最大値
【化43】
が、各ステップにおいて実行可能性問題(LFIP-F)を解く、反復2分探索アルゴリズム1(以下の表1参照)を使用して、効率的に見出されることができる。最適λ
*が入るように保証される、大間隔[l
0,u
0](ここでは、[0,1])から開始して、アルゴリズムは、全ステップにおいて間隔[l,u]を連続的に狭め、λ
*∈[u,b]を確実にする。これは、Patel et al.(2013)において構築された以下の補題1に概略される。
【化44】
【0081】
補題1.アルゴリズム1の出力は、公差ε内およびlog2(ε0/ε)反復内のλの最大値であるλ*に対応する最適z*である。
【0082】
補題1を証明するために、アルゴリズム1が、λがとり得る最大実行可能値である、一意の値λ
*を見出すであろうことを示さなければならない。これに関して、以下の実行可能セットを定義する。
【化45】
【0083】
本表記を用いて、以下を有する。
【化46】
セグメントz
*への最適パターン配分は、λ
*に対応する。定義上、最適λ
*は、以下の実行可能セットΛと非実行可能セット
【化47】
との間の(上)遷移点である。したがって、以下が、公差パラメータε>0(小)に関して当てはまらなければならない。
【化48】
【0084】
アルゴリズム1が最適λ*を見出すであろうことを証明するために、上記の条件を満たすことを示す必要がある。分析においてλを含有する項のみに、焦点を当てる。
【0085】
第1の条件を証明するために、以下をとる。λ∈Λそして以下が、証明されなければならない。
【化49】
【0086】
【0087】
次いで、λ+εおよび同一z
λに関して、以下を有する。
【化51】
【0088】
上記の第2の項は、ε>0であって、Dおよびzλの両方が、非ゼロ入力のみを有するため、正である。
【0089】
第2の条件を証明するために、値
【化52】
を固定し、次いで、
【化53】
またはε>0を示すことが所望される。
【化54】
という事実は、
【化55】
を含意し、したがって、λの所与の値に関して
【化56】
を有していなければならない。z
λは、
【化57】
の最大値をもたらし、実行可能性セットΛを定義する全ての他の条件を満たすλに対応する決定変数ベクトルであるとする。次いで、以下となる。
【化58】
【0090】
λの非実行可能性から、さらに、
【化59】
を有し、次いで、λ+εに関して、
【化60】
の最大値をもたらす、決定ベクトルz
λ+εをとるが、前述から、z
λ+εを含む、
【化61】
を有する。次いで、z
λ+εに関して、以下を有する。
【化62】
【0091】
次いで、
【化63】
であるため、
【化64】
と結論付けられる。したがって、アルゴリズム1は、常時、最適配分ベクトルz
*に対応する、最大限に実行可能なλ
*を見出すであろう。さらに、各ステップを用いて、アルゴリズムは、検索間隔[l,u]を半分にするため、
【化65】
の完了条件に到達するために、最大で以下のステップをとる。
【化66】
容易に明白となるように、最適化アルゴリズムは、最適解が、上記に説明されるように、各反復を用いてより小さくなる、検索窓[l,u]<ε内にあるように、最適解に近似する。
【0092】
3.2.データからの予測パターンの抽出
特徴行列Xおよびバイナリ応答(登録)ベクトルyとしてエンコードされた観察のセットを前提として、非常に有効な(q>>q
0)パターンPを抽出することが所望される。これに関して、以下のアプローチを採択する。1.可変深度の多くの決定ツリーを生成するために(ここでは、最大5個のレベルのツリーを生成した)、基本学習器として分類ツリーを有する、ランダムフォレストまたはAdaBoost Hastie et al.(2009年)等のアンサンブル方法を使用する。本ステップは、決定ツリーを各リーフまでトラバースすることによって得られる初期パターンのリストP
0を構築することを可能にする。強化アンサンブル法における基本分類子として使用されるツリーのレベルに応じて、これらの規則は、単一文(深度1のツリーまたは決定株)から複数のベースルールの論理積まで、可変形態の複雑性をとることができる。2.パターンリストP
0を取捨選択し、「品質」のあるセット基準に対応しない規則を排除する。本目的のために、以下の基準の両方を満たす場合、パターン
【化67】
を「有効」と見なすものとする。・最小サポート:|P|>η、すなわち、パターンに合致する顧客の数は、η+1が各パターンに合致する最小母集団であるように、ηを上回らなければならない。ここでは、η=500が使用される。・最小有効度:q(P)>ζq
0。ここでは、ζ=2が使用される。3.さらに、他のパターンとv%(ここでは、v=70%であるが、しかしながら、60~75%のvの値もまた、使用されてもよい)を上回って重複し、より低い有効度qを有する、パターンを除去する。例えば、合致する顧客C
1および有効度q
1を有するパターンP
1と、合致する顧客C
2およびq
1未満の有効度q
2を有するパターンP
2とに関して、v%を上回る顧客C
2が、C
1内に含まれる場合、パターンP
2は、より低い有効度を有するため、取捨選択されるであろう。
【0093】
本プロシージャは、取捨選択されたパターン
【化68】
のセットをもたらす。
【0094】
4.文献のレビュー
エネルギープログラムのための顧客標的化は、最近、エンジニアリングおよびコンピュータサイエンス、運営管理、およびマーケティングにおける見掛け上異なる文献から注目を集めている。本研究は、エネルギー公益事業者における運営およびマーケティング部署内の既存の専門知識の上に分かりやすいセグメント構築をもたらす、単純かつ透過的方法論を提供することによって、それらの分野におけるより大きい議論に寄与する。需要側管理に関するエンジニアリング研究が、最近、細部に及ぶ消費読取および社会人口統計情報を含む、詳細な顧客データの可用性によって動機付けられている。典型的には、以下のいくつかの主なエリアに焦点が当てられている。i)必要性に応じた時間帯価格またはスマートサーモスタット制御等のプログラムを通知することを目標として、家庭全体のデータ(スマートメータまたはカスタム器具のいずれかから)を使用して、ユーザの母集団の消費パターンを記述すること(Kwac et al.(2013年)、Albert and Rajagopal(2015年))、ii)総合信号から、家庭全体および個々のアプライアンス実験データの両方を収集し、別個の最終用途を再構築すること(Carrie Armel et al.(2013年)、Kolter and Jaakkola(2012年)、およびiii)エネルギー使用に及ぼす異なる外部要因(特に、天候)の平均影響を研究すること(Houde et al.(2012年)、Kavousian et al.(2013年)、Kavousian et al.(2015年)。
【0095】
エネルギー分析に関するより最近の文献は、総合需要プロファイルを使用して、プログラムを通知する、公益事業者における従来の需要管理実践の延長における消費パターンの特徴付け(負荷プロファイリング)に関する。その消費挙動がグリッドにもたらすコストによる消費者のセグメント化方略が、需要における変動率に最も寄与する消費者のグループを標的化するための方法として、Albert and Rajagopal(2014年)において提案されている。研究のポピュラーなトピックは、差別価格設定またはエネルギー削減の奨励等の介入のために後に使用され得る、典型的毎日の負荷プロファイル(典型的には、K-平均法等のオフザシェルフの教師なしアルゴリズムを使用した毎日のユーザ消費負荷形状のクラスタ化を伴う)における異質性である。本アプローチは、例えば、Flath et al.(2012年)、Rasanen and Kolehmainen(2009年)、Figueiredo et al.(2005年)、Smith et al.(2012年)、Tsekouras et al.(2007年)、Espinoza et al.(2005年)においてとられている。消費の第1の学習生成モデルに基づいて、負荷プロファイルをセグメント化し、次いで、得られたモデルをクラスタ化する他の変形例は、例えば、Albert and Rajagopal(2013)、Alzate et al.(2009年)において議論されている。しかしながら、本研究の方針は、大部分は、性質上記述的であって、典型的には、識別された負荷パターンに関する明確な使用例は、提供されておらず、そのような情報を組み込み得る公益事業者におけるプログラムは、現在殆ど存在しない。
【0096】
一方、運営管理およびマーケティング文献は、過去数年にわたって、エネルギーへの適用に関心を集めている。これは、多くの公益事業企業において、効率プログラムを用いて消費者を配分、登録、および標的化することに関わる部署が、従来、運営またはマーケティングのいずれかであったという事実によって影響されたと考えられ得る。
【0097】
5.実験設定
5.1.顧客特性データ
本願で使用したデータは、米国の北東部における大規模エネルギー企業から得られ、約100個の社会人口統計および建物特性およびN=957,150人の消費者に関する2年にわたる毎月のエネルギー消費読取値から構成された。標準的データクリーニングプロシージャ後、母集団全体を横断して少なくとも80%の有効エントリを有していた43個の着目変数が、選択された。それらのうち、19個の変数が、カテゴリ変数であって、24個は、数値変数であった。カテゴリ変数をバイナリダミー変数に変換することによって、P=304個の変数の最終データセットが得られた。q
0=4.9%の割合に対応する、合計48,310人の消費者が、データ収集に先立って、2年以内に任意のエネルギー効率プログラムに登録した。
【表1】
【表2】
【0098】
表1は、いくつかの着目カテゴリ変数を説明する。消費者の大部分(約80%)は、持ち家を所有しており、わずか約16%が賃貸である。教育レベルは、全体として、社会一般を反映し、消費者の4分の1は、それぞれ、学士号および修士号を有し、消費者の半分は、高校卒業資格またはそれ未満を有する。「環境保護意識」変数は雑誌購読、コミュニティとの関わり、政治の学習、異なる組織への加入等の要因を考慮する、第三者分析の結果を要約し、環境問題への推定される着目レベルをもたらす。
【0099】
表2は、いくつかのより数値的な着目変数を要約する。平均生年は、1957年であって、これは、ベビーブーム世代の人口統計を示唆する。サンプル内の平均家族は、12年を上回る居住年数を伴って、大型住居(6部屋)で生活している。
【0100】
5.2.データから抽出される予測パターン
予測規則が、上記の第3節に説明されるデータから抽出された。取捨選択後、予測パターンのリスト(その有効度は、少なくとも
【化69】
であって、少なくともη=500のサポートを有していた)は、それぞれ、最大5個のベースルールのM
0=2,965個のパターンを含有した(5個のベースルールを伴う1,852個のパターン、4個のベースルールを伴う963個のパターン、3個のベースルールを伴う143個のパターン、および2個のベースルールを伴う7個のパターン)。
図4は、データから抽出された高さ3の例示的決定ツリーを図示する。強調されるパターンは、有効度(正のサンプルの割合)が8%であるルートから開始する、決定ツリー内の経路である。
図5は、データから抽出されるM
0=2,965個のパターンに関する異なる複雑性(2~5個のベースルール)のパターンのためのパターン有効度q(R)の分布を図示する。予期されるように、分布は、指数関数的挙動を呈し、より低い有効度のパターンが多く、高有効度のパターンが少ない。
【0101】
登録を予測するための上位20個の最も重要な変数が、
図6に列挙される。これらは、とりわけ、住宅の所有量(融資比率、利用可能な所有権)、住宅およびそこで生活している家族のサイズ、および家族の所得額を含む。これは、登録が財政的責任の認知および住宅への改良に関する能力に依存することを示唆する。本分析は、任意のエネルギー効率プログラムへの登録のみを考慮した。より具体的なタイプの消費者に向けられた具体的プログラムの分析は、(効率的アプライアンスとは対照的な断熱に対する割引等の)重要な変数におけるより精緻化された区別をもたらすであろう可能性が高い。
【0102】
5.3.パターンとセグメントの関連付け
セグメントは、以前の挙動研究の結果およびデータを提供したエネルギー公益事業者との広範な相互作用を使用して定義された。公益事業者は、その独自の内部専門知識および研究およびFrankel et al.(2013年)等の独立の第三者挙動およびマーケティングの研究に基づいてすでに定義された少数のセグメントに入る消費者を識別することを所望した。上記の第2節に説明されるように、セグメントの目的は、i)各セグメントに対する適切な情報および立案を伴う標準化された電子メール等、少数のマーケティング通信を生成することと、ii)エネルギー効率プログラムに登録する可能性がある、各セグメントに対応する消費者を識別することとの2つであった。
【0103】
この先行技術に基づいて、公益事業者は、消費者が、K=5個のセグメント、すなわち、「環境保護提唱者」、「高消費者」、「住宅改良希望者」、「コスト優先者」、および「文化的誘因」に入ると考えていた。本仮説をエンコードするセグメント意味は、表3に要約される。これらのセグメント定義を前提として、P
0からの潜在的パターンPが、各パターンPが個別のセグメントの意味についての仮説とδ一致(第2節参照)することを確実にすることによって、異なるセグメントに関連付けられた。すなわち、所与のセグメントSに関して、それらの規則
【化70】
は、変数jおよび方向(データから学習された閾値を上回るか、または下回るかのいずれか)の両方に合致した少なくともδ個のベースルール
【化71】
を含有することが見出された。結果として生じるパターンのセットPは、M=219個のパターンを含有した。全ての消費者が、
【化72】
614,830(オリジナルサンプルの64%)を伴う低減されたパターン
【化73】
のセットによって網羅されるわけではなかったが、登録した消費者の89%は、低減されたセット内に含まれた。
【表3】
【0104】
各セグメントに対して得られたパターンの数およびその網羅率(パターン内の消費者の数)もまた、表3に列挙される。パターンの数は、初期の約3,000より小さいが、最大有効度に近づけるために十分に少ない数を選択することは、依然として、非自明なタスクである。パターン/セグメント割当実行可能性をエンコードする関連付け行列Bが、
図7に図示される。いくつかのパターンは、
図8に図示されるように、複数のセグメントに属し得る。そこでは、ユーザを網羅するパターンの数の分布が、プロットされる。大部分のユーザは、少数のパターンによって網羅される。しかしながら、同時に、50個を上回るパターンに入る少数のユーザも存在する。
【0105】
データから抽出され、セグメント「高消費者」および「コスト優先者」に割り当てられる、規則の2個の実施例が、
図9に表示される。「高消費者」に割り当てられるパターンは、消費が所与の閾値を上回る条件を伴う、少なくともδ=1のベースルールを含有する。
【0106】
6.結果
アルゴリズム1が、
【化74】
の場合における、セグメントZへのパターンのほぼ最適な実行可能配分を得るために使用された。アルゴリズムは、[0,1](ε
0の幅)から
【化75】
であるときの14回の反復における収束まで検索領域を狭める。故に、セグメントZへのパターンの配分は、ε=10
-14以内で最適解に近似する。2分探索プロセスは、
図10に図示され、これは、
【化76】
を用いて、実行可能性問題(LFIP-F)を反復的に解くことによって、セグメント有効度に関する最大下限λを見出すことを示す。
【化77】
に関する結果として生じる最適配分行列Zは、
図11に表示される。そこでは、水平軸は、許容可能割当行列Bを表すために
図10において使用されたものと同一フォーマットにおける恣意的ID番号によってパターンを順序付ける。アルゴリズムは、最良有効度性質を伴い、(F
0)における制約を満たす、少数のパターンを選択した。
【0107】
最適解は、5個のセグメントを横断して拡散される10個のパターンを含有する。表4は、結果として生じるセグメントの有効度およびサイズを要約する。最終有効度数は全て、2×q
0を上回り、1個のセグメント(「文化的誘因」)に割り当てられた消費者は、全体の母集団内でほぼ3倍の率で登録していた。
【表4】
【0108】
図12は、セグメント間の重複の実施例を示す。本重複は、セグメントを構成するパターン自体が、それらが網羅する顧客内で重複し得、実際に重複するため、誘発される。しかしながら、セグメント重複は、消費者が、彼らを1個のセグメント(「コスト優先者」等)に属するものと見なし得る、ある特徴を有し得る一方、他の特徴が、異なるセグメント(「住宅改良希望者」等)内の消費者と共有されるため、現実では、自然な概念である。セグメント化技法は、本状況を透過的に考慮する。セグメント重複のより包括的見解は、ネットワークプロットとして
図13に提示される。そこでは、各セグメントは、そのセグメント内の顧客の数に比例するサイズのノードとして表される。セグメント間のリンクの加重は、セグメントのペアワイズの重複を表す。制約が、
【化78】
から
【化79】
に変更されるにつれて、より多くのパターンがセグメントのいくつかを構築するために使用されるため、セグメント化の構造は、変化する。
【0109】
「セグメント」は、運営コストおよび複雑性を低く保ちながら、消費者間である程度まで区別する、通信の作成および管理を補助するように、プログラム管理者によって定義された構成概念であることに留意されたい。それらは、ある程度の異質性を露見させるが、同時に、介入を個人の必要性に完全に合わせることを可能にするものでもない。全ての消費者が1個のセグメントのみに属することを課すことは、非現実的仮定を課すことになり、本アプローチは、これを回避する。
【0110】
図14は、
【化80】
に関する最適パターン配分に対応するセグメントを定義する、パターンのリストを含む。各セグメントの意味についての表3における仮説は、閾値t
j(「高」および「低」が意味する内容を精密に定義する)および付加的ベースルール等の具体的情報で拡充される。例えば、高率でエネルギー効率プログラムに登録する「住宅改良希望者」の1つのタイプは、年収$75,000を上回り、$306,870を上回るその住宅の所有権を所有する、南アジア人である。同様に、「環境保護提唱者」の1つのタイプは、年収$75,000を上回り、その州の平均所得レベルの少なくとも2.5倍を稼いでおり、子供を有し、集合住宅で生活していない家族である。各セグメント内のパターンは、次いで、そのセグメント内の消費者が応答することが認められている要素を含むように、そのセグメントに対して特有のマーケティング通信を設計するために使用されてもよい。さらに、パターンの特異性(データから学習された閾値の観点から)は、登録する可能性が最も高いそれらの消費者を標的化することを可能にする。
【0111】
上記の議論から、得られたセグメント化の構造は、制約の性質に、特に、
【化81】
の値に強く依存することが顕著に明白となる。本依存性を研究するために、アルゴリズム1が、グリッド
【化82】
に関して実行された。ここで、
【化83】
である。目的
【化84】
の最適値およびセグメント化のために選択されたパターンの数は、
図15に図示される。最良結果が、
【化85】
であるときに得られた(したがって、アルゴリズムは、必要以上に多くのパターンをセグメントに引き出すわけではない)。良好な結果
【化86】
が、中値から大値の
【化87】
および低値の
【化88】
に関して得られることが示される。これらのマップは、したがって、モデル複雑性およびセグメント化有効度をトレードオフする方法のガイドラインをもたらす。
【0112】
【化89】
の所与の値に関して、
【化90】
を用いて、目的λ
*および個々のセグメント有効度値q
k、k=1,・・・,Kの変形例が、観察された。次いで、これは、個々の着目セグメントの所望の有効度値に適応するように設計され得る、結果として生じるセグメント化の複雑性のための調整パラメータとしての役割を果たすことができる。これは、
【化91】
の値に関して
図16に図示される。例えば、「文化的誘因」に強調が置かれる場合、
【化92】
を伴うセグメント化が、好ましい。kの全ての値に関して、q
kは、明確にλ
*を上回ることに留意されたい。
【0113】
最後に、セグメント化複雑性(セグメントを横断して選択されたパターンの総数)への個々のセグメント有効度の依存性が、
図17に図示される。これは、セグメント化複雑性の固定された所与の値に関して達成され得る、最良可能有効度値を強調する。例えば、効率プログラム管理者が、20~25のパターンの総数を選択することを所望する場合、「文化的誘因」セグメントの最適有効度は、常時、「コスト優先者」セグメントのものを上回ることが期待され得る。
【化93】
のその範囲に関して、「住宅改良希望者」、「環境保護提唱者」、および「文化的誘因」は全て、約11%の有効度値を有する。
【0114】
7.結論
本願は、エネルギー消費者の分かりやすい予測セグメント化をプログラム的に構築するための方法を導入した。予測セグメント化問題は、データからの第1の抽出予測パターン(論理積)に基づいて公式化され、次いで、パターンをセグメントに最適に配分する。セグメントは、以前の挙動およびエネルギー公益事業者におけるマーケティング研究を使用して定義された。最適配分は、線形制約を伴う一般化(最大-最小)線形分数整数計画を解くように公式化される。本計画を解くために、効率的2分探索アルゴリズムが、使用された。本方法は、大規模な米国のエネルギー公益事業者の約百万人の電気消費者の母集団内で最適予測セグメントを識別するために使用された。消費者の最適サブセット(その特性が、サービス提供する消費者のタイプについての公益事業者の一般的仮説と整合し、全体的母集団内の約5%の登録率の少なくとも2倍登録した)が、識別された。これらのセグメントは、公益事業者が、適切なメッセージを生成し得、かつ標的化することがより有効かつ経済的である、消費者を表す。
【0115】
上記の開示では、本明細書の一部を形成し、本開示が実践され得る具体的実装が例証として示される付随の図面を参照した。本開示の範囲から逸脱することなく、他の実装が、利用されてもよく、構造変更が、行われてもよいことを理解されたい。明細書における「一実施形態」、「ある実施形態」、「ある例示的実施形態」等の言及は、説明される実施形態が、特定の特徴、構造、または特性を含み得るが、全ての実施形態が、必ずしも、特定の特徴、構造、または特性を含まない場合もあることを示す。さらに、そのような語句は、必ずしも、同一実施形態を参照するわけではない。さらに、特定の特徴、構造、または特性が、ある実施形態に関連して説明されるとき、明示的に説明されるかどうかにかかわらず、他の実施形態に関連してそのような特徴、構造、または特性に影響を及ぼすことは、当業者の知識内であることが思量される。
【0116】
本明細書に開示されるシステム、デバイス、および方法の実装は、例えば、本明細書に議論されるように、1つまたはそれを上回るプロセッサおよびシステムメモリ等、コンピュータハードウェアを含む、特殊目的または汎用コンピュータを備える、または利用してもよい。本開示の範囲内の実装はまた、コンピュータ実行可能命令および/またはデータ構造を搬送または記憶するための物理的および他のコンピュータ可読媒体を含んでもよい。そのようなコンピュータ可読媒体は、汎用または特殊目的コンピュータシステムによってアクセスされ得る、任意の利用可能な媒体であることができる。コンピュータ実行可能命令を記憶するコンピュータ可読媒体は、コンピュータ記憶媒体(デバイス)である。コンピュータ実行可能命令を搬送するコンピュータ可読媒体は、伝送媒体である。したがって、一例として、限定ではなく、本開示の実装は、少なくとも2つの別々に異なる種類のコンピュータ可読媒体、すなわち、コンピュータ記憶媒体(デバイス)および伝送媒体を備えることができる。
【0117】
コンピュータ記憶媒体(デバイス)は、RAM、ROM、EEPROM、CD-ROM、ソリッドステートドライブ(「SSD」)(例えば、RAMに基づく)、フラッシュメモリ、相変化メモリ(「PCM」)、他のタイプのメモリ、他の光ディスク記憶装置、磁気ディスク記憶装置または他の磁気記憶デバイス、またはコンピュータ実行可能命令またはデータ構造の形態で所望のプログラムコード手段を記憶するために使用され得、汎用または特殊目的コンピュータによってアクセスされ得る、任意の他の媒体を含む。
【0118】
本明細書に開示されるデバイス、システム、および方法の実装は、コンピュータネットワークを経由して通信してもよい。「ネットワーク」は、コンピュータシステムおよび/またはモジュールおよび/または他の電子デバイス間で電子データをトランスポート可能な1つまたはそれを上回るデータリンクとして定義される。情報が、ネットワークまたは別の通信接続(有線、無線、または有線または無線の組み合わせのいずれか)を経由して、コンピュータに転送または提供されるとき、コンピュータは、接続を適切に伝送媒体と見なす。伝送媒体は、コンピュータ実行可能命令またはデータ構造の形態で所望のプログラムコード手段を搬送するために使用され得、汎用または特殊目的コンピュータによってアクセスされ得る、ネットワークおよび/またはデータリンクを含むことができる。上記の組み合わせもまた、コンピュータ可読媒体の範囲内に含まれるべきである。
【0119】
コンピュータ実行可能命令は、例えば、プロセッサにおいて実行されると、汎用コンピュータ、特殊目的コンピュータ、または特殊目的処理デバイスに、ある機能または機能群を行わせる、命令およびデータを備える。コンピュータ実行可能命令は、例えば、バイナリ、アセンブリ言語等の中間フォーマット命令、またはさらにソースコードであってもよい。本主題は、構造特徴および/または方法論的作用に特有の言語で説明されているが、添付の請求項に定義される主題は、必ずしも、上述の説明された特徴または作用に限定されないことを理解されたい。むしろ、説明された特徴および作用は、請求項を実装するための例示的形態として開示される。
【0120】
当業者は、本開示が、ダッシュボード内車両コンピュータ、パーソナルコンピュータ、デスクトップコンピュータ、ラップトップコンピュータ、メッセージプロセッサ、ハンドヘルドデバイス、マルチプロセッサシステム、マイクロプロセッサベースまたはプログラマブル消費者電子機器、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、携帯電話、PDA、タブレット、ポケベル、ルータ、スイッチ、種々の記憶デバイス、および同等物を含む、多くのタイプのコンピュータシステム構成を伴う、ネットワークコンピューティング環境内で実践されてもよいことを理解されるであろう。本開示はまた、分散型システム環境内で実践されてもよく、ネットワークを通してリンクされた(有線データリンク、無線データリンク、または有線および無線データリンクの組み合わせのいずれかによって)ローカルおよび遠隔コンピュータシステムの両方が、タスクを行う。分散型システム環境では、プログラムモジュールは、ローカルメモリ記憶デバイスおよび遠隔メモリ記憶デバイスの両方内に位置してもよい。
【0121】
さらに、必要に応じて、本明細書に説明される機能は、ハードウェア、ソフトウェア、ファームウェア、デジタルコンポーネント、またはアナログコンポーネントのうちの1つまたはそれを上回るものにおいて行われることができる。例えば、1つまたはそれを上回る特定用途向け集積回路(ASIC)が、本明細書に説明されるシステムおよびプロシージャのうちの1つまたはそれを上回るものを実施するようにプログラムされることができる。ある用語が、特定のシステムコンポーネントを指すために説明および請求項全体を通して使用される。当業者が理解するように、コンポーネントは、異なる名称によって称されてもよい。本書は、名称が異なるが機能は異ならないコンポーネントの間で区別することを意図するものではない。
【0122】
上記で議論されるセンサ実施形態は、その機能の少なくとも一部を行うために、コンピュータハードウェア、ソフトウェア、ファームウェア、または任意のそれらの組み合わせを備えてもよいことに留意されたい。例えば、センサは、1つまたはそれを上回るプロセッサ内で実行されるように構成される、コンピュータコードを含んでもよく、コンピュータコードによって制御されるハードウェア論理/電気回路を含んでもよい。これらの例示的デバイスは、例証目的で本明細書に提供され、限定することを意図するものではない。本開示の実施形態は、当業者に公知となるであろう、さらなるタイプのデバイス内に実装されてもよい。
【0123】
本開示の少なくともいくつかの実施形態は、任意のコンピュータ使用可能媒体上に記憶されるそのような論理を備える(例えば、ソフトウェアの形態で)、コンピュータプログラム製品を対象とする。そのようなソフトウェアは、1つまたはそれを上回るデータ処理デバイス内で実行されると、デバイスを本明細書に説明されるように動作させる。
【0124】
本開示の種々の実施形態が、上記に説明されたが、一例としてのみ提示され、限定ではないことを理解されたい。形態および詳細における種々の変更が、本開示の精神および範囲から逸脱することなく、その中で行われることができることは、当業者に明白となるであろう。したがって、本開示の範疇および範囲は、上記の例示的実施形態のいずれかによって限定されるべきではなく、以下の請求項およびその均等物に従ってのみ定義されるべきである。上記の説明は、例証および説明目的のために提示されている。これは、包括的であること、または本開示を開示される通りの形態に限定することを意図するものではない。多くの修正および変形例は、上記の教示に照らして、可能性として考えられる。さらに、上記の代替実装のいずれかまたは全ては、本開示の付加的ハイブリッド実装を形成するために所望される、任意の組み合わせで使用されてもよいことに留意されたい。
【0125】
本発明は、その精神または不可欠な特性から逸脱することなく、他の具体的形態で具現化さてもよい。説明される実施形態は、全ての観点において、例証のみと見なされ、制限するものではない。本発明の範囲は、したがって、上記の説明によってではなく、添付の請求項によって示される。請求項の均等物の意味および範囲内の全ての変更は、その範囲内に包含されるものとする。
【0126】
以下の参考文献は、参照することによってその全体として本明細書に組み込まれる。
【表5-1】
【表5-2】
【表5-3】
【表5-4】