IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ オラクル・インターナショナル・コーポレイションの特許一覧

特許7565265人工知能ベースの部屋のパーソナライズされた需要モデル
<>
  • 特許-人工知能ベースの部屋のパーソナライズされた需要モデル 図1
  • 特許-人工知能ベースの部屋のパーソナライズされた需要モデル 図2
  • 特許-人工知能ベースの部屋のパーソナライズされた需要モデル 図3
  • 特許-人工知能ベースの部屋のパーソナライズされた需要モデル 図4
  • 特許-人工知能ベースの部屋のパーソナライズされた需要モデル 図5
  • 特許-人工知能ベースの部屋のパーソナライズされた需要モデル 図6
  • 特許-人工知能ベースの部屋のパーソナライズされた需要モデル 図7
  • 特許-人工知能ベースの部屋のパーソナライズされた需要モデル 図8
  • 特許-人工知能ベースの部屋のパーソナライズされた需要モデル 図9
  • 特許-人工知能ベースの部屋のパーソナライズされた需要モデル 図10
  • 特許-人工知能ベースの部屋のパーソナライズされた需要モデル 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-10-02
(45)【発行日】2024-10-10
(54)【発明の名称】人工知能ベースの部屋のパーソナライズされた需要モデル
(51)【国際特許分類】
   G06Q 50/12 20120101AFI20241003BHJP
【FI】
G06Q50/12
【請求項の数】 8
(21)【出願番号】P 2021516737
(86)(22)【出願日】2020-08-17
(65)【公表番号】
(43)【公表日】2022-12-15
(86)【国際出願番号】 US2020046618
(87)【国際公開番号】W WO2021080669
(87)【国際公開日】2021-04-29
【審査請求日】2023-08-02
(31)【優先権主張番号】62/923,779
(32)【優先日】2019-10-21
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】16/784,634
(32)【優先日】2020-02-07
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】502303739
【氏名又は名称】オラクル・インターナショナル・コーポレイション
(74)【代理人】
【識別番号】110001195
【氏名又は名称】弁理士法人深見特許事務所
(72)【発明者】
【氏名】チョウ,サンフーン
(72)【発明者】
【氏名】バフティンスキー,アンドリュー
(72)【発明者】
【氏名】ヤグナバジハラ,サラスワティ
【審査官】田上 隆一
(56)【参考文献】
【文献】特開2018-018368(JP,A)
【文献】特開2001-222582(JP,A)
【文献】特開2002-092438(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
ホテル部屋についての需要および価格設定をモデリングする方法であって、
前記方法は、
コンピュータシステムが、複数の以前のゲストに関する履歴データを受信することを含み、前記履歴データは、ゲスト属性、旅行属性および外部要因属性を含む複数の属性を含み、前記旅行属性は、各部屋カテゴリの価格を含み、前記外部要因属性は、ローカルイベント、休日、ならびに、出発地および目的地における天候のうちの少なくとも1つを含み、
前記方法はさらに、
前記コンピュータシステムが、マシンラーニングソフトクラスタリングを使用して、前記複数の属性に基づいて複数の別個のクラスタを生成することと、
前記コンピュータシステムが、前記以前のゲストの各々を前記別個のクラスタの1つ以上にセグメント化することと、
前記コンピュータシステムが、前記別個のクラスタの各々について、前記履歴データにフィッティングするようにモデルを構築することとを含み、前記モデルは、前記複数の属性を表す複数の変数に基づいて、ゲストがある部屋カテゴリを選択する確率を予測し、
前記モデルを構築することは
前記モデルの尤度関数を最大化することを含み、前記尤度関数は、前記複数の変数に対応する複数の係数の絶対値の合計を表すペナルティ関数を含み、前記モデルを構築することはさらに、
前記モデルのモデルパラメータを推定することを含み、前記モデルパラメータは、前記複数の係数を含み、
前記方法はさらに、
前記コンピュータシステムが、前記ホテル部屋の最適な価格設定を決定することを含み、前記ホテル部屋の最適な価格設定を決定することは、
各部屋カテゴリの前記価格と前記モデルによって予測された前記確率とを用いることによって、対象の部屋カテゴリの前記価格を変動させたときの収益の変化を特定することと、
前記収益の変化に基づいて前記対象の部屋カテゴリの最適な価格を決定することとを含む、方法。
【請求項2】
前記モデルは、混合多項ロジットモデル(MNL)を含む、請求項1に記載の方法。
【請求項3】
前記マシンラーニングソフトクラスタリングは、ランダムフォレストベースのソフトクラスタリングを含む、請求項1または2に記載の方法。
【請求項4】
前記推定することは、期待値最大化(EM)アルゴリズムを含む、請求項1~3のいずれかに記載の方法。
【請求項5】
前記複数の変数は、ホテル予約システムに到着しない非到着ゲストおよび前記ホテル予約システムに到着したが前記ホテル部屋を予約しない非予約ゲストを含む潜在変数を含み、前記潜在変数は、前記期待値最大化(EM)アルゴリズムを使用して推定される、請求項に記載の方法。
【請求項6】
前記非到着ゲストと前記非予約ゲストとを区別することをさらに含み、前記非到着ゲストと前記非予約ゲストとを区別することは、1日を、最大で1人のゲストが到着する可能性がある複数の離散的な時間スロットに分割することを含む、請求項に記載の方法。
【請求項7】
請求項1~のいずれかに記載の方法をコンピュータに実行させるためのプログラム。
【請求項8】
請求項に記載のプログラムを格納したメモリと、
前記プログラムを実行するためのプロセッサとを備える、ホテル部屋価格設定システム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願への相互参照
本出願は、2019年10月21日に出願された米国仮特許出願連続番号第62/923,779号の優先権を主張しており、その開示は、本明細書において参照により援用される。
【0002】
分野
一実施形態は、一般的に、コンピュータシステムに関し、特に、人工知能ベースの部屋のパーソナライズされた需要モデルを生成するコンピュータシステムに関する。
【背景技術】
【0003】
背景情報
ホテル産業における競争の増加により、ホテル経営者は、パーソナライズされた価格設定およびレコメンデーションといった、より革新的な収益管理ポリシーを求めている。過去数年にわたって、ホテル経営者は、すべてのゲストが等しいわけではないことと、従来の汎用的なポリシー(one-size-fits-all policy)が効果的でないことが証明され得ることを理解するようになっている。したがって、ホテルについて、彼らのゲストをプロファイリングし、利益を最大化する目的で、適正な価格で適正な製品/サービスを提供するというニーズが存在する。
【発明の概要】
【課題を解決するための手段】
【0004】
概要
実施形態は、ホテルの部屋について需要および価格設定をモデル化する。実施形態は、複数の以前のゲストに関する履歴データを受信することを行い、履歴データは、ゲスト属性、旅行属性および外部要因属性を含む複数の属性を含む。実施形態は、マシンラーニングソフトクラスタリングを使用して、複数の属性に基づいて複数の別個のクラスタを生成することと、以前のゲストの各々を別個のクラスタの1つ以上にセグメント化することとを行う。実施形態は、別個のクラスタの各々についてモデルを構築することを行い、モデルは、ゲストがある部屋カテゴリを選択する確率を予測し、かつ、属性に対応する複数の変数を含む。実施形態は、モデルの有意でない変数を除去することと、モデルのモデルパラメータを推定することとを行い、モデルパラメータは、変数に対応する係数を含む。実施形態は、モデルパラメータ、および、パーソナライズされた価格設定アルゴリズムを使用して、ホテル部屋の最適な価格設定を決定することを行う。
【0005】
さらに別の実施形態、詳細、利点および修正例は、添付の図面に関連して解釈されるべき実施形態の以下の詳細な説明から明らかになるであろう。
【図面の簡単な説明】
【0006】
図1】本発明の実施形態に従ったコンピュータサーバ/システムのブロック図である。
図2】実施形態に従った、図1の部屋需要モデルモジュールの機能を示すフロー図である。
図3】一実施形態に従った、属性に基づくクラスタリングの例を示す図である。
図4】一実施形態に従った、相関のためにランダムフォレストマシンラーニングを使用するクラスタリングのさらに別の例を示す図である。
図5】一実施形態に従った、需要を推定するために各クラスタに混合MNLモデルを適用する例を示す図である。
図6】一実施形態に従った、完全なパーソナライズされた需要モデルを示す図である。
図7】一実施形態に従った、尤度関数の例を示す図である。
図8】実施形態に従った、変数選択アルゴリズムを示す図である。
図9】特定のゲストがある部屋カテゴリを選択する可能性を予測するために実験データセットを使用する本発明の実施形態の結果を示す図である。
図10】特定のゲストがある部屋カテゴリを選択する可能性を予測するために実験データセットを使用する本発明の実施形態の結果を示す図である。
図11】本発明の実施形態に従った、実験の検討の結果を示す図である。
【発明を実施するための形態】
【0007】
詳細な説明
実施形態は、ホテルゲストの個々の属性と、彼らの予約チャネルと、提供価格を含む部屋カテゴリ特徴とに基づいて、複数のホテル部屋カテゴリについての需要を予測するために、人工知能(「AI: artificial intelligence」)を利用する。実施形態はさらに、観察可能でない変数である、「非購入ゲスト」の割合、または、ホテルの部屋を予約しないことを決定したゲストの数を推定する。実施形態は、各個々のゲストが特定の部屋カテゴリの部屋を予約する確率を出力する。実施形態はさらに、ホテルゲストの各クラスタについて、部屋特徴の相対的な金銭価値を推定する。部屋特徴の例は、ベッドのタイプ(たとえば、キングベッド対クイーンベッド)、ビュー(たとえば、オーシャンビューまたはガーデンビュー)、部屋のサイズ、または、部屋のタイプ(たとえば、スイート対シングルルーム)であり得る。ゲスト特性および部屋特徴に基づいて、パーソナライズされた需要モデルを生成するために、実施形態は、クラスタリングと、多項選択モデリングの混合との組み合わせを使用する。
【0008】
ホテル産業における伝統的な収益管理(「RM: revenue management」)の慣習は、キャパシティ制御メカニズムを使用しており、具体的には、異なるカテゴリの製品についての部屋の利用可能性を制御し、典型的には、滞在の長さの制御を使用する。一般に、ホテル産業は、ホテルゲストの個々の属性と、彼らの予約チャネルと、部屋カテゴリ特徴とに基づく高度な需要モデルを使用していない。しかしながら、近年のホテル産業については、運営状況が有意に変わっている。インターネットを介して部屋価格の透明性が与えられると、企業旅行管理会社、レジャー旅行代理店、および、ブランドウェブサイトは、共通のディストリビューションプラットフォームに移り、互いの顧客ベースへ到達し始めた。次いで、検索エンジンが、この透明性をさらに推し進め、すべてのディストリビューションチャネルからのオンラインレートを単一のインターフェイスに集約し、ホテル部屋同士の間の最も顕著な差別化要因の1つとして価格を示した。
【0009】
この競争環境において、製品についての需要が他の選択肢が利用可能であることに依存しないという想定の下で運用される伝統的なRMソリューションは、良好に築かれた制約によりゲストをセグメント化する際にあまり効果的ではない。したがって、ホテルが、ゲストの支払意思および価格弾力性に基づく価格最適化ソリューションに向かうというニーズが存在する。
【0010】
特にオンライン販売の場合、パーソナライズされた需要モデリングおよび価格最適化は、ホテルの予約に直接的にこれらの方法を適用することの困難さに部分的により、ホテル産業において相対的にわずかな使用しか見られなかった。ホテル産業によって現在使用されている需要予測ツールのほとんどは、時系列分析に基づいて予約の全体的な数を提供することを目的としており、したがって、需要価格弾力性および部屋カテゴリ特徴を無視している。これらの需要モデリングツールはしばしば、有意に異なる支払意思を有する非均質的なゲストの存在下では、効果的でない。
【0011】
既知のソリューションとは対照的に、実施形態は、ゲスト、旅行、および外部属性に基づいてマシンラーニングベースのソフトクラスタリングモデルを適用することによりゲストベースを別個のクラスタに最初に分割することによって、パーソナライズされた戦略を実現する。既知のソリューションは、しばしば、均質的なゲストを想定して、旅行の目的(たとえば、レジャーまたはビジネス)のような容易に分離されるゲストのみに基づいて、このクラスタリングを達成した。これは、実際に適用するにはあまりに制限的であり得る。なぜならば、ゲストは、異なる選択モデルを必要とする彼ら自身の特徴を有するからである。同様の属性を有する幾人かのゲストの場合でも、彼らの選択確率は、ローカルイベント、休日、ならびに、出発地および目的地における天候といった外部属性に依存し得る。したがって、実施形態は、選択モデリングにおけるゲストの均質性の強い想定を緩和している。
【0012】
実施形態は、到着ステップおよび予約決定ステップの2つの事前のシーケンシャルなステップを含む。顧客は、ホテル部屋予約システムに到着し得る(または到着し得ない)。到着する場合、顧客は、ホテルに予約を行う(または行わない)ことを決定する。顧客は、ひとたび予約システムに到着し、かつ、部屋を予約することを決定すると、部屋タイプを選択する。しかしながら、一般に、観察可能なデータは、任意の製品を購入した顧客についてのみ利用可能であり、実施形態が単に需要モデルを観察可能なデータにフィットさせると、それは、バイアスのかかった推定につながり得、適切に価格敏感性を組み込んでいない可能性がある。これらの起こり得るバイアスを回避するために、実施形態は、非購入の場合を組み込む。非購入の場合は、顧客が当該ホテルに関心がないため予約システムに到着し得ない場合、または、顧客が予約システムに到着したが、高価格または利用可能な部屋の欠如のために購入することなく立ち去る場合である。したがって、実施形態は、非購入の場合および競争相手(または外部オプション)を考慮し得、これにより、これらの要因を考慮しない以前の産業ソリューションと比較して、顧客の初期の決定に影響が与えられ得る。
【0013】
実施形態は、ゲストをいくつかのグループまたはクラスタにクラスタリングし、同様の属性を有するゲストが同じクラスタに割り当てられる。さらに、実施形態は、各ゲストがある確率で複数のクラスタに属することを可能にすることによって、ソフトクラスタリングアプローチを実現する。次いで、実施形態は、各クラスタについて、各特定のゲストがある部屋カテゴリを選択する確率を予測する多項選択モデルを構築する。実施形態は、最適な数のクラスタを決定するために、データドリブンな交差検証アプローチを使用してグループの数を決定する。
【0014】
属性の数は一般に非常に大きいので、各グループ内のデータは疎であり得、不正確な予測につながる。これを軽減するために、実施形態は、混合多項選択モデルのペナルティを課された尤度関数を最大化することによって、最も重要でないモデル共変量についての係数をゼロに設定する「ラッソ(Lasso)」正則化方法を実現する。
【0015】
パラメータ(すなわち、到着率、各グループに属する確率、および、各共変量パラメータ)を推定するために、実施形態は、初期クラスタリング確率を求めるためにランダムフォレストベースのソフトクラスタリングを実行した後、期待値最大化(「EM: Expectation-Maximization」)アルゴリズムを使用する。2つの観察不可能な要因(すなわち、非購入プロセスおよびクラスタプロセス)により、実施形態は、それらの潜在的な要因を考慮する。最後に、上記から抽出されるパラメータは、各ゲストについて各部屋タイプの最適価格を決定するためのパーソナライズされた価格設定アルゴリズムにプラグインされる。
【0016】
ここで、本開示の実施形態に対して詳細に参照がなされ、その例は、添付の図面に示される。以下の詳細な説明では、本開示の完全な理解を提供するために、多くの具体的な詳細が記載されている。しかしながら、本開示は、これらの具体的な詳細がなくても実施され得ることが、当業者には明白であろう。他の例では、周知の方法、手順、構成要素、および回路は、実施形態の局面を不必要に不明瞭にしないように、詳細には記載されない。可能な場合は、同様の参照番号は同様の要素に使用される。
【0017】
図1は、本発明の実施形態に従ったコンピュータサーバ/システム10のブロック図である。単一のシステムとして示されているが、システム10の機能は、分散システムとして実現され得る。さらに、本明細書において開示される機能は、ネットワークを介して一緒に結合され得る別個のサーバまたはデバイス上で実現され得る。さらに、システム10の1つ以上の構成要素は、含まれなくてもよい。たとえば、ウェブサーバまたはクラウドベースの機能として実現される場合、システム10は、1つ以上のサーバとして実現され、ディスプレイ、マウスなどのユーザインターフェイスは必要とされない。
【0018】
システム10は、情報を通信するためのバス12または他の通信メカニズムと、情報を処理するための、バス12に結合されるプロセッサ22とを含む。プロセッサ22は、任意のタイプの汎用または専用プロセッサであり得る。システム10は、プロセッサ22によって実行されるべき情報および命令を格納するためのメモリ14をさらに含む。メモリ14は、ランダムアクセスメモリ(「RAM: random access memory」)、リードオンリメモリ(「ROM: read only memory」)、磁気もしくは光ディスクといったスタティックストレージ、または、任意の他のタイプのコンピュータ読取可能媒体の任意の組み合わせから構成され得る。システム10は、ネットワークへのアクセスを提供するために、ネットワークインターフェイスカードのような通信デバイス20をさらに含む。したがって、ユーザは、システム10と直接的にインターフェイス接続し得るか、または、ネットワークまたは任意の他の方法を介してリモートでインターフェイス接続し得る。
【0019】
コンピュータ読取可能媒体は、プロセッサ22によってアクセスされ得る任意の利用可能な媒体であり得、揮発性媒体および不揮発性媒体の両方、取り外し可能媒体および取り外し不可能媒体、ならびに、通信媒体を含む。通信媒体は、コンピュータ読取可能命令、データ構造、プログラムモジュール、または、搬送波または他の搬送メカニズムといった変調されたデータ信号における他のデータを含み得、かつ、任意の情報送達媒体を含む。
【0020】
プロセッサ22はさらに、バス12を介して液晶ディスプレイ(「LCD: Liquid Crystal Display」)のようなディスプレイ24に結合される。キーボード26およびコンピュータマウスのようなカーソル制御デバイス28は、ユーザがシステム10とインターフェイス接続することを可能にするように、バス12にさらに結合される。
【0021】
一実施形態では、メモリ14は、プロセッサ22によって実行されると、機能を提供するソフトウェアモジュールを格納する。モジュールは、システム10のためにオペレーティングシステム機能を提供するオペレーティングシステム15を含む。モジュールは、ホテル部屋の収益を最大化するために部屋需要モデルを生成する部屋需要モデルモジュール16と、本明細書に開示されるすべての他の機能とをさらに含む。システム10は、より大きなシステムの部分であり得る。したがって、システム10は、プロパティ管理システム(「PMS: Property Management System」)((たとえば、「Oracle Hospitality OPERA Property」または「Oracle Hospitality OPERA Cloud Services」」)、または、エンタープライズリソースプラニング(「ERP: enterprise resource planning」)システムの機能のような付加的な機能を含むよう、1つ以上の付加的な機能モジュール18を含み得る。モジュール16および18のための中央集中型ストレージを提供し、ゲストデータ、ホテルデータ、トランザクションデータなどを格納するために、データベース17がバス12に結合される。一実施形態では、データベース17は、格納されたデータを管理するために、ストラクチャードクエリランゲージ(「SQL: Structured Query Language」)を使用し得るリレーショナルデータベース管理システム(「RDBMS: relational database management system」)である。一実施形態では、特殊化されたポイントオブセール(「POS: point of sale」)端末99は、最適化を実行するために使用されるトランザクションデータおよび履歴販売データ(たとえば、ホテルゲスト/顧客のトランザクションに関するデータ)を生成する。POS端末99自体は、一実施形態に従った部屋割り当て最適化を実行するよう付加的な処理機能を含み得、それ自体によって、または、図1の他の構成要素と関連して、特殊化された部屋割り当て最適化システムとして動作し得る。
【0022】
一実施形態では、特に、多数のホテルロケーション、多数のゲスト、および大量の履歴データが存在する場合、データベース17は、インメモリデータベース(「IMDB: in-memory database」)として実現される。IMDBは、主にコンピュータデータストレージのためのメインメモリに依拠するデータベース管理システムである。これは、ディスクストレージメカニズムを採用するデータベース管理システムと対照的である。メインメモリデータベースは、ディスクアクセスがメモリアクセスよりも遅く、内部最適化アルゴリズムがよりシンプルであり、実行するCPU命令がより少ないので、ディスク最適化データベースよりも高速である。メモリ内のデータにアクセスすることによって、データをクエリ送信する際にシーク時間が取り除かれ、これにより、ディスクよりも速く予測可能な性能が提供される。
【0023】
一実施形態では、データベース17は、IMDBとして実現される場合、分散データグリッドに基づいて実現される。分散データグリッドは、コンピュータサーバの集合が1つ以上のクラスタで一緒に動作して、分散またはクラスタリングされた環境内で情報および計算のような関連動作を管理するシステムである。分散データグリッドは、これらのサーバにわたって共有されるアプリケーションオブジェクトおよびデータを管理するよう使用され得る。分散データグリッドは、低い応答時間、高いスループット、予測可能なスケーラビリティ、継続的な利用可能性、および、情報信頼性を提供する。特定の例において、たとえばオラクル社の「Oracle Coherence」データグリッドのような分散データグリッドは、より高い性能を達成するためにインメモリで情報を格納し、かつ、複数のサーバにわたって同期されるその情報のコピーを保持することにおいて冗長性を利用しており、これにより、サーバの障害の場合に、システムの復元性と、データの継続的な利用可能性とを保証する。
【0024】
一実施形態では、システム10は、エンタープライズ組織のためのアプリケーションまたは分散アプリケーションの集合を含むコンピューティング/データ処理システムであり、ロジスティックス、製造、および在庫管理機能をさらに実現し得る。アプリケーションおよびコンピューティングシステム10は、クラウドベースのネットワーキングシステム、ソフトウェア・アズ・ア・サービス(「SaaS: software-as-a-service」)アーキテクチャ、または、他のタイプのコンピューティングソリューションとともに動作するように構成され得るか、または、クラウドベースのネットワーキングシステム、ソフトウェア・アズ・ア・サービス(「SaaS: software-as-a-service」)アーキテクチャ、または、他のタイプのコンピューティングソリューションとして実現され得る。
【0025】
図2は、実施形態に従った、図1の部屋需要モデルモジュール16の機能を示すフロー図である。一実施形態では、図2のフロー図の機能は、メモリまたは他のコンピュータ読取可能もしくは有形媒体に格納されるソフトウェアによって実現され、プロセッサによって実行される。他の実施形態では、機能は、ハードウェア(たとえば、特定用途向け集積回路(「ASIC: application specific integrated circuit」)、プログラマブルゲートアレイ(「PGA: programmable gate array」)、フィールドプログラマブルゲートアレイ(「FPGA: field programmable gate array」)などの使用を通じて)実行され得るか、または、ハードウェアおよびソフトウェアの任意の組み合わせによって実行され得る。
【0026】
一般に、図2の機能は、クラスタリングと多項選択モデリングの混合との組み合わせを含むアプローチを使用する部屋の特徴と同様に、ゲストの特性に基づく、パーソナライズされた需要モデルをモデリングする。
【0027】
202において、履歴予約データおよびゲスト情報が入力データセット/データベース17から受信される。一実施形態では、入力データセット17は、オラクル社の「OPERA」データベースであり、単一のホテルまたはホテルのチェーンのような関係するホテルのグループのゲストと、利用可能な部屋とに関する詳細を含む。他の実施形態では、任意のタイプのPMSについてのゲストおよび部屋に関するデータのデータベースが使用され得る。実施形態において、入力データセット17は、ホテルオペレータの制御下でコンピューティングデバイスから電子通信を介して受信され、次いで、以下に開示されるその後の機能に必要とされる情報を抽出するためにシステム10によって解析される。
【0028】
非到着の顧客および非予約の顧客は、データベース17に記録されないので、潜在的な変数または観察されない変数として扱われる。以下により詳細に開示されるように、これらの潜在的な変数は、期待値最大化(「EM」)アルゴリズムを使用して推定される。期待値最大化(「EM」)アルゴリズムは、非到着の顧客および非予約の顧客を含むすべての顧客の割合について最も可能性の高い推定を求めるよう、需要モデルを反復的にフィッティングする。
【0029】
204において、実施形態は、マシンラーニング方法(すなわち、ソフトクラスタリング)を使用してゲストをクラスタリングする。
【0030】
パーソナライズされた戦略を実現するために、実施形態はまず、ゲスト、旅行、および、外部属性に基づいてマシンラーニングベースのソフトクラスタリングモデルを適用することによって、ゲストベースを別個のクラスタに分割する。既知のソリューションは、典型的には、均質なゲストを想定して、旅行目的(たとえば、レジャー対ビジネス)のような容易に分離可能なゲスト属性のみに基づいてこのクラスタリングを達成する。ゲストは、異なる選択モデルを必要とする自身の特性を有するので、これは、実際に適用するにはあまりに制限的であり得る。同様の属性を有する幾人かのゲストの場合であっても、彼らの選択確率は、ローカルイベント、休日、および、出発地および目的地における天候といった外部属性に依存し得る。したがって、実施形態は、選択モデリングにおけるゲストの均質性の強い想定を緩和する。
【0031】
さらに、実施形態は、到着ステップおよび予約決定ステップを含む2つの事前のシーケンシャルなステップを追加する。顧客は、予約システムに到着する(または到着しない)。到着する場合、顧客は、ホテルに予約を行うか(否か)を決定する。顧客は、ひとたび予約システムに到着し、部屋を予約することを決定すると、部屋タイプを選択する。
【0032】
しかしながら、データは、任意の製品を購入した顧客についてのみ利用可能であり、需要モデルが観察可能なデータにのみフィッティングされる場合、それは、バイアスのかかった推定につながり得、適切に価格敏感性を組み込んでいない可能性がある。これらの起こり得るバイアスを回避するために、実施形態は、非購入の場合を組み込む。非購入の場合は、顧客がホテルに関心がないため、予約システムに到着し得ない場合、または、顧客が予約システムに到着したが、高価格または利用可能な部屋の欠如のために購入することなく立ち去る場合である。したがって、実施形態は、非購入の場合および競争相手(または外部オプション)を考慮し得、これにより、これらの要因を考慮しない既知のソリューションと比較して、顧客の初期の決定に影響が与えられ得る。
【0033】
206において、実施形態は、需要を推定するために混合多項ロジットモデル(「MNL: mixture multinomial logit model」)モデルを展開する選択モデリングを実行する。204の各クラスタについて、各特定のゲストがある部屋カテゴリを選択する確率を予測する多項選択モデルが構築される。実施形態は、最適な数のクラスタを決定するために、データドリブンな交差検証アプローチを使用してグループの数を決定する。
【0034】
208において、実施形態は、ラッソ正則化方法を使用して有意でない変数を除去することによって変数選択を実行する。属性の数は通常非常に大きいので、各グループ内のデータは疎であり得、不正確な予測につながる。これを軽減するために、ラッソ正則化方法は、混合多項選択モデルのペナルティを課された尤度関数を最大化することによって、最も重要でないモデル共変量についての係数をゼロに設定する。
【0035】
210において、実施形態は、期待値最大化(「EM」)アルゴリズムを使用してモデルパラメータを推定する。パラメータ(すなわち、到着率、各クラスタグループに属する確率、および、各共変量パラメータ)を推定するために、実施形態は、初期クラスタリング確率を求めるためにランダムフォレストベースのソフトクラスタリングを実行した後、EMアルゴリズムを使用する。実施形態は、需要を予測するためにパラメトリックモデルを想定する。一般的に言えば、パラメトリックモデルは、分布の特性を決定する有限数のパラメータを有する確率分布のファミリである。モデルのパラメータは、観察されたデータから最小の偏差を提供するパラメータの値を求めるために、データに基づいて推定される。実施形態では、モデルは、3セットのパラメータを有する。まず、ランダムフォレストベースのソフトクラスタリングを行うことにより、各クラスタグループに属する確率が推定される。次に、到着率および予約選択パラメータが推定される(すなわち、予約システムに到着する確率および予約選択確率(顧客が到着する場合))。最後に、ゲスト属性、旅行属性および外的要因といった各属性パラメータが推定される。実施形態は、2つの観察不可能な要因(すなわち、非購入プロセスおよびクラスタプロセス)を含むので、それらの潜在的要因を考慮する。
【0036】
212において、実施形態は、ホテル収益を最大化するために、パーソナライズされた価格設定ポリシーアルゴリズムを生成する。上記の機能から抽出されたパラメータは、各ゲストについて各部屋タイプの最適価格を決定するために、パーソナライズされた価格設定アルゴリズムにプラグインされる。さらに、実施形態は、特定のゲストがある部屋カテゴリを選択する可能性を予測するために、当該モデルを使用し得る。
【0037】
図2の機能に加えて、実施形態は、オンラインサービスに価格を提供するデータベースを格納および更新するために、決定された最適化価格設定を使用する。これらの更新は、頻繁(たとえば、1日または1時間に複数回)であり得、修正された価格に基づいて、電子デバイスが自動的に修正される。さらに、実施形態によって、ホテルがより完全に利用され得、これにより、付加的なサービスがホテルにおいて使用される。さらに、実施形態によって、最適化された価格がネットワークを介して送信され、これにより、他のコンピューティングデバイス/サーバが、修正された最適化された価格に従って価格設定データベースにおける価格を修正する。
【0038】
パーソナライズされた需要モデル
実施形態は、K個の異なる価格を有するKタイプのホテル部屋を考慮する。購入された部屋の選択としての結果変数yは、1,...,Kの値をとる。ホテル部屋についての需要は、ホテル顧客の個々の属性、彼らの予約チャネル、および、部屋カテゴリ特徴にわたって変動し得る。xはホテル部屋の選択に影響を与える特徴のすべてを表す。パーソナライズされた需要モデルは、xが与えられた際の結果yである。
【0039】
1つの困難な問題は、データがホテル部屋の観察された購入についてのみ利用可能であることである。非購入の場合が無視され、需要モデルが購入の場合のみに基づく場合、価格敏感性を過小評価することによってバイアスにつながる。幾人かの顧客は、自身の支払意思よりも価格が高いため、購入しないと決定し得る。そのようなバイアスを回避するために、実施形態は、1日を、t=1,...,tによって示される小さな離散的な時間スライスに分割することによって顧客到着プロセスをモデル化する。離散的な時間スライスの間、最大で1人の顧客が到着し得る。時間tにおける到着プロセスは、λで示される到着確率を有するベルヌーイ分布としてモデル化される。到着が与えられると、顧客は、価格に基づいて任意のホテル部屋を予約することと、当該ホテル部屋を予約しないこととの間で決定を行うことが想定される。ロジスティック回帰モデルは、部屋価格が与えられると、予約プロセスについて考慮される。非購入(非予約)の場合、1日における各部屋の平均価格といった代わりの価格(proxy price)が使用され得る。
【0040】
到着後に予約が与えられると、ゲストは、任意の条件が与えられた自身のプレファレンスに従って、K個の異なる部屋の中から部屋を選択する。たとえば、需要は、ロイヤリティステータス、プロファイルプレファレンス、付随的なサービスといったゲスト属性、または、ローカルイベント、休日、および、天候といった外部属性に依存する。そのようなパーソナライズされた需要をモデル化するために、実施形態は、まず、ゲストの需要パターンが、各クラスタ内で均質であるが、クラスタ全体にわたって不均質であるように、情報xに基づいてゲストをG個のクラスタにセグメント化し(図2の204)、次いで、各クラスタ内で別々に多項ロットモデルを想定する(図2の206)。クラスタメンバシップは未知であるので、各クラスタに属する確率がパラメータとして特定され、次いでデータから推定される混合多項ロジットモデルが想定される。これは、「選択プロセス」と称される。以下のパーソナライズされた需要モデルは、3つのシーケンシャルなステップ(「需要モデルステップ」)を組み込む。
【0041】
【数1】
【0042】
式中、
【0043】
【数2】
【0044】
および
【0045】
【数3】
【0046】
は、平均、最小および最大などといった時間tにおけるK個の部屋価格の概要統計を表す。
【0047】
【数4】
【0048】
は、時間tにおけるkタイプの部屋価格であり、
【0049】
【数5】
【0050】
は、
【0051】
【数6】
【0052】
が与えられた際のクラスタgに属する確率を表し、zは、時間tにおいて購入した顧客についてのクラスタインジケータである。
【0053】
図3は、一実施形態に従った、属性に基づくクラスタリングの例を示す。「クラスタG」までのクラスタの数は、ベイズ情報基準(「BIC」: Bayesian Information Criterion)に基づいて選択され得る。クラスタの数(たとえばG)は、事前に未知であるので、Gはデータに基づいて選択される必要がある。BICは、クラスタの数を決定するために使用され、ガウス分布想定下で、混合成分の数を選択するための一貫した効率的な基準である。属性は、ゲスト属性、旅行属性、および、外的要因に分割され得る。
【0054】
図4は、一実施形態に従った、相関のためのランダムフォレストマシンラーニングを使用するクラスタリングのさらに別の例を示す。変数/属性間の相関は、変数の部分を選択することによって低減され得る。実施形態において、ゲスト属性、旅行属性、および、外部要因は、ランダムフォレストを通じてクラスタリングプロセスを決定する変数である。一実施形態におけるランダムフォレストは、ブートストラップサンプリング(Bootstrap sampling)により繰り返し決定木(repeated decision tree)を実現する。3つまたは4つの変数は、各決定木内において13個の変数からランダムに選択される。ブートストラップサンプルサイズは、500である。
【0055】
クラスタリングは、何らかの距離尺度に従って、各グループにおけるデータポイントが互いにより類似するように、データをサブグループにパーティショニングするプロセスである。クラスタリングのためのランダムフォレストは、サンプル間の距離の大まかな推定を与える近接行列(proximity matrix)を生成するアルゴリズムを使用する。クラスタリングのための代替的な方法が、他の実施形態において使用され得る。
【0056】
図5は、一実施形態に従った、需要を推定するために各クラスタに混合MNLモデルを適用する例を示す。顧客の需要パターンは、クラスタにわたって異なる傾向があるので、図5に示される選択モデルは、各クラスタについてのMNLに別々に従う(たとえば、クラスタ1についてはMNL1、クラスタ2についてはMNL2など)。
【0057】
データを分析する際、一般に、各観察が1つの特定の分布に由来すると想定される。しかしながら、実際には、各サンプルが同じ分布に由来すると想定することは、限定的すぎる可能性がある。データはしばしば複雑である。たとえば、データは、歪み分布(skewed-distributed)またはマルチモーダルであり得る。したがって、実施形態において、混合モデルは、データのそのような複雑な確率的挙動を表すために使用される。混合モデルは、各観察がG個の混合成分のうちの1つから生成されることを想定し、各成分内において、特定の分布を想定する。実施形態において、異なる部屋タイプについての需要が対象である。異なる部屋タイプについての需要は、カテゴリ的変数として定義され、多項ロジスティック(MNL: Multinomial Logistic)回帰モデルの混合としてモデル化される。
【0058】
図6は、一実施形態に従った、完全なパーソナライズされた需要モデルを示す。示されるように、上記需要モデルステップによって示されるように、モデルは、到着、予約、および、部屋の選択を組み込む。実施形態は、ホテル部屋を予約した顧客のみを観察し得る。マーケットにおける他の顧客は、システムに決して入らなかった(非到着)か、または、部屋を予約しなかった(非予約)かのいずれかである。これらの観察されない顧客は、一般に潜在的(または観察されない)変数と称されるものによって表される。統計的方法によって、観察された変数の分布をフィッティングすることにより、これらの変数の推定が可能になる。さらに、実施形態によって使用される統計的アプローチによって、非到着顧客と非予約顧客とが区別されることが可能になる。
【0059】
具体的には、インジケータ変数b=0で示される予約顧客がない各時間スロットtについて、到着インジケータ変数rが1または0であるか否は未知である。これらの時間スロットについて、rは潜在変数であるので、実施形態は、EMアルゴリズムを使用してモデルパラメータを推定する。ここで、EMアルゴリズムは、観察された変数に最も近くフィッティングする統計モデルにおいてパラメータの最大尤度推定を求める反復方法である。
【0060】
パーソナライズされたモデルのモデル推定
実施形態は、2つのステップを使用して、パーソナライズされたモデル(図6に示される)のモデル推定を実行する。まず、ランダムフォレスト(図5に示される)のような教師なしクラスタリング方法を使用して、時間tにおいて到着および予約した各ゲストについてクラスタgに属する確率である
【0061】
【数7】
【0062】
を計算する(「セグメント化」ステップと称される)。所与の確率について、実施形態は、モデルパラメータ
【0063】
【数8】
【0064】
の最大尤度(「ML: maximum likelihood」)推定量を求める。到着変数γは、非購入の場合(すなわち、b=0)について観察不可能であり、クラスタメンバシップ変数zは潜在的であるので、EMアルゴリズムは、ML推定量を求めるように実現される。これは、「EMステップ」と称される。
【0065】
EMアルゴリズムに関連して、すべての変数{γ,b,z:t=1,…,T}が観察される場合、完全な尤度関数を最初に考慮することが有用である。これは、以下によって与えられる。
【0066】
【数9】
【0067】
次いで、観察されたデータD={γ,b:t=1,…,T,b=1}が与えられた条件付き期待対数尤度関数は、
【0068】
【数10】
【0069】
によって示される。
【0070】
【数11】
【0071】
最大化量(maximizer)は、以下のようにEMアルゴリズムを実現することによって求められる。
【0072】
t番目の反復について、すなわち、所与のt番目の更新されたパラメータについての(Eステップ)について、実施形態は、以下を計算する。
【0073】
【数12】
【0074】
(M-ステップ)。(t+1)番目の更新されたパラメータを以下のように得る。
【0075】
【数13】
【0076】
を計算し、(β,β)に対して以下の方程式を解くことによって、
【0077】
【数14】
【0078】
を更新する。
【0079】
【数15】
【0080】
【数16】
【0081】
を更新するために、
【0082】
【数17】
【0083】
に対して方程式を解く。
【0084】
【数18】
【0085】
次いで、基準が満たされるまで、(E-ステップ)および(M-ステップ)が繰り返される。
【0086】
この推定方法は、クラスタの数Gが既知であることを暗黙的に想定している。Gは実際には未知であるので、所与のデータについて最良のGが選択される。一実施形態では、10分割交差検証(10-fold cross validation)が使用され、Gが選択され、誤分類率を最小化する。BICも利用可能である。G=1が選択される場合、混合MNLモデルに基づく提案されたパーソナライズされた需要関数は、実際に一般的に使用される古典的なMNLモデルである。換言すれば、古典的なMNLモデルは、上記モデルの特別な場合である。
【0087】
図7は、一実施形態に従った尤度関数の例を示す。尤度関数は、図2の208において、有意でない変数を除去する際に使用される。図7に示される尤度関数は、ポアソン到着プロセス(r)、二項予約プロセス(b)、および、混合多項ロジット購入選択プロセス(d)を単一のモデルに組み合わせる。
【0088】
変数選択
さらに、208および変数選択に関連して、図8は、実施形態に従った変数選択アルゴリズムを示す。図8に示されるように、ラッソペナルティ関数は、有意でないパラメータを抑制するために10分割交差検証を使用する。パラメータは、回帰モデルにおいて観察されるかまたは潜在的であるかのいずれかである各変数に対応する係数であって、観察のセットが与えられると、モデルに最良のフィットを与えると推定される係数である。
【0089】
実施形態は、最良のモデルを選択することを可能にするラッソペナルティチューニングパラメータであるκを特定する。なお、(Eステップ)は、上で開示されるEステップと同じである。なぜならば、ペナルティを課された対数尤度関数は、潜在変数ではないパラメータ
【0090】
【数19】
【0091】
の関数を加えた条件付き期待対数尤度関数であるからである。
【0092】
【数20】
【0093】
についての(Mステップ)は、ペナルティ関数によって修正される必要がある。(Eステップ)を完了した後、図8における目的関数の最大化量が決定される。上で開示される期待対数尤度関数と図8における関数との間の唯一の相違点は、右側における最後の項である。これは、
【0094】
【数21】
【0095】
のペナルティ関数である。第(t+1)番目の更新されたパラメータは、以前の(Mステップ)におけるものと同じである。ここで、図8における期待対数尤度関数の最大化量は、
【0096】
【数22】
【0097】
に対して決定される。同等に、目的関数の以下の部分の最大化量が決定され得る。
【0098】
【数23】
【0099】
多項ロジスティック回帰の下で最大化量を求めるニュートンアルゴリズム(Newton algorithm)は、応答観察のベクトルの性質により、面倒であり得る。これらの数値的な複雑性を回避するために、実施形態は、参照により本明細書に援用されるFriedman, J. et al., “Regularization paths for generalized linear models via coordinate descent”, Journal of Statistical Software, 33(1), 1 (2010)に開示される座標降下アルゴリズム(coordinate descent algorithm)を使用する。
【0100】
実施形態は、上記のように定義される対数尤度関数
【0101】
【数24】
【0102】
に対して部分的な二次近似を形成することによって部分的なニュートンステップを実行し、
【0103】
【数25】
【0104】
のみが、各kおよびgについて、ある時間における単一のクラスについて変動することを可能にする。部分的な二次近似は、以下によって与えられるよう示され得る。
【0105】
【数26】
【0106】
式中、Bは予約観察の数であり、C(・)は定数関数であり、
【0107】
【数27】
【0108】
である。
要約すると、実施形態は、(Mステップ)において、(t+1)番目の
【0109】
【数28】
【0110】
を以下のように更新する。以下の入れ子型のループを繰り返すことによって、
【0111】
【数29】
【0112】
の推定を得る。すなわち、m番目の反復およびg=1,...,Gについて、以下の反復を繰り返す。
【0113】
【数30】
【0114】
当該反復は、収束基準が満たされるまで繰り返される。
以下の表は、モデルにおける各変数およびパラメータを記載する。
【0115】
【表1】
【0116】
図6に関連して上述したモデルのような回帰構造では、変数のゼロ回帰係数(=パラメータ)は、変数がモデルから削除されることを暗示する。この意味において、有意でないパラメータを抑制することは、冗長変数の回帰係数がゼロであり、ゼロでない回帰係数を有する変数のみが残存することを意味する。有意でないパラメータを抑制することによって、実施形態は、いわゆるオーバーフィッティングの問題を回避し得る。たとえば、予約された部屋、ゲストの情報、ならびに、予約の日付および時間を含むホテル予約トランザクションのデータベースを考える。他の属性を予測するよう予約の日付および時間を使用することよって、学習セットを完全にフィッティングするモデルを構築することは容易であろう。しかしながら、このモデルは、新しいデータまで十分に一般化しない。なぜならば、それらの過去の時間が再び起こらないからである。最良の予測およびフィッティングされたモデルは、検証エラーがその大域的最小値(global minimum)を有する場合である。
【0117】
さらに、多くの変数は、モデルを複雑にする。pを、説明変数の数とする。実施形態におけるモデルは、1(到着プロセス)+2(予約プロセス)+(G-1)×(K-1)×(p+2)を有し、式中、pは、価格を除く説明変数の数である。4つの異なる部屋タイプおよび3つのクラスタが存在する場合、推定される必要があるパラメータの数は、1+2+2×3×(p+2)であり、これはpにおいて増加する。パラメータの数が増加するにつれて、モデルの複雑性も増加し、複雑なモデルに基づく予測精度もさらに悪化し得る。したがって、実施形態は、最小限の原理(parsimony principle)に従って有意でない変数を除去することによって、よりシンプルなモデルを選択する。
【0118】
212に関連して、以下の価格設定ポリシーアルゴリズムを使用して、パーソナライズされた価格設定を以下のように決定し得る。
【0119】
【数31】
【0120】
パーソナライズされた需要モデル(たとえば、図6)は、ホテル収益(revenue)を最大化するよう、パーソナライズされた価格設定ポリシーを開発するために使用され得る。総収益は、各部屋タイプの価格の関数として変化する。一実施形態では、1つの部屋タイプについての価格は、ある時間において変動され得、総収益がプロットされ得る。
【0121】
特定のゲストがある部屋カテゴリ(room category)を選択する可能性を予測するために、生成されたモデルを使用する例として、以下の実験データセットを使用する例を考える。すなわち、(1)オーストラリアのシドニーにおけるダウンタウンホテル、(2)2012年1月~2014年1月までの2年間の予約データ、(3)3つの異なる部屋タイプ($$スイート>$$デラックス>$$スーペリア)、(4)2つの異なる部屋の特徴:シティビュー、ウォータービュー、(5)総予約数:2,503、(6)事前の平均予約日:10.29日、(7)滞在の平均長さ:1.84日。
【0122】
上記のデータセットを使用して、最良のモデルは、クラスタ(G)の#=2が最も低いBICを有する、ということである。非購入の場合またはクラスタリングを考慮しなかった単一のMNLがベンチマークとして使用された。データの70%が学習に使用され、30%が試験に使用された。以下の性能尺度が使用された。
【0123】
【数32】
【0124】
以下は、部屋タイプ($$スイート>$$デラックス>$$スーペリア)のプレファレンスの順序である。すなわち、(1)デラックス-シティビュー、(2)デラックス-ウォータービュー、(3)スイート-シティビュー、(4)スイート-ウォータービュー、(5)スーペリア-シティビュー、(6)スーペリア-ウォータービュー。
【0125】
図9および図10は、特定のゲストがある部屋カテゴリを選択する可能性を予測するために、実験データセットを使用する本発明の実施形態の結果を示す。図10において、ゼロに設定された157個の係数のうち64個の係数は、対応する変数がモデルから除外されたことを暗示する。実施形態は、変数選択のためにラッソ法を使用する。すべての変数を使用するのではなく、いくつかの変数を選択するので、よりシンプルなモデルが使用されるため、予測精度は、問題であるオーバーフィッティングを回避することによって向上される。
【0126】
図11は、本発明の実施形態に従った実験の検討の結果を示す。当該検討では、部屋の在庫が表1102に示される。スーペリア部屋の価格は、他のすべての価格を一定に保ちながら、変動され、総収益が1104においてプロットされる。示されるように、最大収益は、スーペリア部屋の価格が200ドルに設定されているときであると決定される。
【0127】
開示されるように、実施形態は、ゲスト属性に基づいて、ホテル部屋のためのパーソナライズされた需要モデリングを提供する。実施形態は、異なる部屋の特徴について各ゲストクラスタの価格弾力性および支払意思を推定するために、需要選択に基づくモデルを適用する前に、ゲスト属性、旅行属性、および、外的要因に基づいて予約をクラスタリングするよう、マシンラーニングを使用する。
【0128】
実施形態は、ゲストのいくつかのクラスタが存在し、各クラスタについて多項選択モデルにフィッティングすると想定する。これらのクラスタリングメカニズムが観察不可能である場合、実施形態は、推定方法として、ソフトクラスタリングとEMアルゴリズムとの組み合わせを使用する。クラスタリングされた混合タイプの選択モデルに基づいて、実施形態は、予想される収益を定義し、最適化問題を解決して最適価格を決定し、これにより、各ゲストについて各部屋タイプに対して期待される収益を最大化する。
【0129】
いくつかの実施形態が、本明細書において具体的に例示および/または記載される。しかしながら、開示される実施形態の修正例および変形例は、本発明の精神および意図された範囲から逸脱することがなければ、添付の請求の範囲の範囲において、上記教示によって、カバーされることが理解されるであろう。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11