(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-06-28
(54)【発明の名称】人工知能ベースのホテル需要モデル
(51)【国際特許分類】
G06Q 10/04 20230101AFI20240621BHJP
G06Q 50/12 20120101ALI20240621BHJP
【FI】
G06Q10/04
G06Q50/12
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023577727
(86)(22)【出願日】2022-06-09
(85)【翻訳文提出日】2024-02-06
(86)【国際出願番号】 US2022072854
(87)【国際公開番号】W WO2023278935
(87)【国際公開日】2023-01-05
(32)【優先日】2021-06-28
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2021-08-11
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】502303739
【氏名又は名称】オラクル・インターナショナル・コーポレイション
(74)【代理人】
【識別番号】110001195
【氏名又は名称】弁理士法人深見特許事務所
(72)【発明者】
【氏名】チョウ,サンフーン
(72)【発明者】
【氏名】バフティンスキー,アンドリュー
(72)【発明者】
【氏名】ウッド,アラン
(72)【発明者】
【氏名】ペレス,ホルヘ・ルイス・リベロ
(72)【発明者】
【氏名】デュモン,ジャン-フィリップ
(72)【発明者】
【氏名】コルトハースト,ジョン・トマス
(72)【発明者】
【氏名】ディアス,デニス
【テーマコード(参考)】
5L010
5L050
【Fターム(参考)】
5L010AA04
5L050CC23
(57)【要約】
実施形態は、ホテル客室の潜在的なホテル顧客の需要モデルを生成する。実施形態は、潜在的なホテル顧客の特徴に基づいて、複数のクラスタを形成し、各クラスタは、対応する重みおよびクラスタ確率を含む。実施形態は、複数のクラスタの各々に対応する多項ロジット(「MNL」)モデルの初期推定混合を生成し、MNLモデルの混合は、特徴および重みに基づく重み付き尤度関数を含む。実施形態は、修正されたクラスタ確率を決定し、重みを更新する。実施形態は、MNLモデルの更新された推定混合を推定し、修正されたクラスタ確率および更新された重みに基づいて重み付き尤度関数を最大化する。更新重みおよびMNLモデルの更新された推定混合に基づいて、実施形態は、潜在的なホテル顧客の客室カテゴリと料金コードの組合せの選択確率を予測するように適合された需要モデルを生成する。
【特許請求の範囲】
【請求項1】
ホテル客室の潜在的なホテル顧客の需要モデルを生成する方法であって、
前記潜在的なホテル顧客の特徴に基づいて、複数のクラスタを形成するステップを含み、各クラスタは、対応する重みおよびクラスタ確率を含み、
前記方法は、
前記複数のクラスタの各々に対応する多項ロジット(MNL)モデルの初期推定混合を生成するステップをさらに含み、MNLモデルの前記混合は、前記特徴および前記重みに基づく重み付き尤度関数を含み、
前記方法は、
修正されたクラスタ確率を決定し、前記重みを更新するステップと、
更新された推定MNLモデルを推定し、前記修正されたクラスタ確率および更新された前記重みに基づいて前記重み付き尤度関数を最大化するステップと、
前記更新重みおよびMNLモデルの更新された前記推定混合に基づいて、前記潜在的なホテル顧客の客室カテゴリと料金コードの組合せの選択確率を予測するように適合された前記需要モデルを生成するステップと
をさらに含む、方法。
【請求項2】
前記潜在的なホテル顧客の前記特徴は、前記潜在的な顧客が前記ホテルの客室をリクエストする際に分かる、請求項1に記載の方法。
【請求項3】
MNLモデルの前記推定混合を生成するステップは、提示価格、前記提示における客室カテゴリおよび料金プランの位置、ならびに客室および料金の特徴に基づく、請求項1に記載の方法。
【請求項4】
前記複数のクラスタを形成するステップは、教師なし機械学習を含む、請求項1に記載の方法。
【請求項5】
前記教師なし機械学習は、ガウス混合モデルを使用する動的クラスタリングまたはソフトクラスタリングのうちの1つを含む、請求項4に記載の方法。
【請求項6】
前記決定するステップおよび前記推定するステップは、収束基準に達するまで繰り返され、前記需要モデルは、前記収束基準に達した後に生成される、請求項1に記載の方法。
【請求項7】
前記特徴は、到着日時、人数、予約チャネル、または予約ウィンドウのうちの少なくとも1つを含む、請求項1に記載の方法。
【請求項8】
前記需要モデルは、前記ホテルの客室の収益を最大化するように適合されている、請求項1に記載の方法。
【請求項9】
命令を記憶したコンピュータ可読媒体であって、前記命令は、1つまたは複数のプロセッサによって実行されると、前記プロセッサに、ホテル客室の潜在的なホテル顧客の需要モデルを生成させ、前記需要モデルを生成することは、
前記潜在的なホテル顧客の特徴に基づいて、複数のクラスタを形成することを含み、各クラスタは、対応する重みおよびクラスタ確率を含み、
前記複数のクラスタの各々に対応する多項ロジット(MNL)モデルの初期推定混合を生成することを含み、MNLモデルの前記混合は、前記特徴および前記重みに基づく重み付き尤度関数を含み、
修正されたクラスタ確率を決定し、前記重みを更新することと、
MNLモデルの更新された推定混合を推定し、前記修正されたクラスタ確率および更新された前記重みに基づいて前記重み付き尤度関数を最大化することと、
前記更新重みおよびMNLモデルの前記更新された推定混合に基づいて、前記潜在的なホテル顧客の客室カテゴリと料金コードの組合せの選択確率を予測するように適合された前記需要モデルを生成することと
を含む、コンピュータ可読媒体。
【請求項10】
前記潜在的なホテル顧客の前記特徴は、前記潜在的な顧客が前記ホテルの客室をリクエストする際に分かる、請求項9に記載のコンピュータ可読媒体。
【請求項11】
MNLモデルの前記推定混合を生成することは、提示価格、前記提示における客室カテゴリおよび料金プランの位置、ならびに客室および料金の特徴に基づく、請求項9に記載のコンピュータ可読媒体。
【請求項12】
前記複数のクラスタを形成することは、教師なし機械学習を含む、請求項9に記載のコンピュータ可読媒体。
【請求項13】
前記教師なし機械学習は、ガウス混合モデルを使用する動的クラスタリングまたはソフトクラスタリングのうちの1つを含む、請求項12に記載のコンピュータ可読媒体。
【請求項14】
前記決定することおよび前記推定することは、収束基準に達するまで繰り返され、前記需要モデルは、前記収束基準に達した後に生成される、請求項9に記載のコンピュータ可読媒体。
【請求項15】
前記特徴は、到着日時、人数、予約チャネル、または予約ウィンドウのうちの少なくとも1つを含む、請求項9に記載のコンピュータ可読媒体。
【請求項16】
前記需要モデルは、前記ホテルの客室の収益を最大化するように適合されている、請求項9に記載のコンピュータ可読媒体。
【請求項17】
ホテル客室の潜在的なホテル顧客の需要モデルを生成するホテル予約システムであって、
記憶された命令に結合された1つまたは複数のプロセッサと、
過去の予約データを記憶するデータベースと、
を備え、
前記プロセッサは
前記潜在的なホテル顧客の特徴に基づいて、複数のクラスタを形成することを行うように構成され、各クラスタは、対応する重みおよびクラスタ確率を含み、
前記複数のクラスタの各々に対応する多項ロジット(MNL)モデルの初期推定混合を生成することを行うように構成され、MNLモデルの前記混合は、前記特徴および前記重みに基づく重み付き尤度関数を含み、
修正されたクラスタ確率を決定し、前記重みを更新することと、
MNLモデルの更新された推定混合を推定し、前記修正されたクラスタ確率および更新された前記重みに基づいて前記重み付き尤度関数を最大化することと、
前記更新重みおよびMNLモデルの前記更新された推定混合に基づいて、前記潜在的なホテル顧客の客室カテゴリと料金コードの組合せの選択確率を予測するように適合された前記需要モデルを生成することと
を行うように構成されている、ホテル予約システム。
【請求項18】
前記潜在的なホテル顧客の前記特徴は、前記潜在的な顧客が前記ホテルの客室をリクエストする際に分かる、請求項17に記載のホテル予約システム。
【請求項19】
推定された前記MNLモデルを生成することは、提示価格と、前記提示における客室カテゴリおよび料金プランの位置、ならびに客室および料金の特徴に基づく、請求項17に記載のホテル予約システム。
【請求項20】
前記複数のクラスタを形成することは、教師なし機械学習を含む、請求項17に記載のホテル予約システム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2021年6月28日に出願された米国仮特許出願第63/215,688号の優先権を主張し、その開示は参照により本明細書に組み込まれる。
【0002】
分野
一実施形態は、一般にコンピュータシステムに関し、詳細には、人工知能ベースのホテル需要モデルを生成するコンピュータシステムに関する。
【背景技術】
【0003】
背景情報
ホテル業界における競争の激化により、ホテル経営者は、個人向けの価格設定および推薦など、より革新的な収益管理ポリシーを模索するようになった。ここ数年にわたって、ホテル経営者は、すべてのゲストが等しいわけではなく、従来の画一的なポリシーでは効果がない可能性があることを理解するようになった。したがって、ホテルは、ゲストをプロファイリングし、利益を最大化することを目標として、適切な価格で適切な製品/サービスを提示する必要がある。
【発明の概要】
【課題を解決するための手段】
【0004】
概要
実施形態は、ホテル客室の潜在的なホテル顧客の需要モデルを生成する。実施形態は、潜在的なホテル顧客の特徴に基づいて、複数のクラスタを形成し、各クラスタは、対応する重みおよびクラスタ確率を含む。実施形態は、複数のクラスタの各々に対応する多項ロジット(「MNL」)モデルの初期推定混合を生成し、MNLモデルの混合は、特徴および重みに基づく重み付き尤度関数を含む。実施形態は、修正されたクラスタ確率を決定し、重みを更新する。実施形態は、MNLモデルの更新された推定混合を推定し、修正されたクラスタ確率および更新された重みに基づいて重み付き尤度関数を最大化する。更新重み(update weights)およびMNLモデルの更新された推定混合に基づいて、実施形態は、潜在的なホテル顧客の客室カテゴリと料金コードの組合せの選択確率を予測するように適合された需要モデルを生成する。
【図面の簡単な説明】
【0005】
【
図1】本発明の実施形態によるホテル予約システムの概略ブロック図である。
【
図2】本発明の一実施形態によるコンピュータサーバ/システムのブロック図である。
【
図3】一実施形態による、客室需要モデルを生成するための
図2の客室需要モデルモジュールの機能の流れ図である。
【
図4】実施形態による初期クラスタリングの一例を示す図である。
【
図5】様々な提示価格、客室カテゴリ、および料金コードを示す例である。
【
図6】例示的な実施形態によるゲストクラスタの選択モデリングを示す図である。
【
図7】実施形態による、各クラスタへのMNLモデルの初期割り当てを示す図である。
【
図8】実施形態によるEM機能とともに使用される提案された尤度関数を示す図である。
【
図9】実施形態によるEM機能の一部を示す図である。
【
図10】実施形態によるEM機能の一部を示す図である。
【
図11】3つのクラスタについての本発明の実施形態の一例を示す図である。
【
図12】3つのクラスタについての本発明の実施形態の一例を示す図である。
【
図13】3つのクラスタについての本発明の実施形態の一例を示す図である。
【
図14】3つのクラスタについての本発明の実施形態の一例を示す図である。
【
図15】3つのクラスタについての本発明の実施形態の一例を示す図である。
【
図16】3つのクラスタについての本発明の実施形態の一例を示す図である。
【
図17】本発明の実施形態によるCCRとMSEとの反復による予測精度の比較を示す図である。
【
図18】実施形態による、2つのクラスタが与えられた場合に、クラスタ特性が反復によりどのように変化するかを示す図である。
【発明を実施するための形態】
【0006】
詳細な説明
実施形態は、動的に決定された観測(observations)のクラスタに構築された離散選択モデルのパラメータを推定することに基づいて、顧客によるホテルの客室カテゴリおよび関連付けられたサービスタイプの選択を予測する。各観測は、特定の価格で提示された客室カテゴリとサービスタイプのペアの順序付けられたセットから、ホテルの客室を予約し、関連付けられたサービスのタイプを選択する顧客によって行われる選択に対応する。各客室カテゴリおよびサービスのタイプは、顧客が選択する価値または効用を決定する一連の特徴によって記述される。加えて、各顧客は、「ペルソナタイプ」としても知られている、顧客が属するクラスタを決定する独自の属性のセットによって特徴付けられる。各ペルソナタイプには、予約選択の独自の効用があり得ることが想定される。
【0007】
選択確率は、ペルソナタイプごとに客室とサービスのペアの効用に基づいて多項ロジット関数としてモデル化される。実施形態は、予測精度を高め、予想収益を最大化することによって個人向けの提示を最適化するための処方的分析アプリケーションの基礎を構築する。実施形態は、スタンドアローンのシステムとして、または個人向けのホテル客室の個人向けの価格最適化システムおよび客室カテゴリと料金コードの順序の表示最適化システムの中心部分として使用することができる。実施形態は、従来この目的のために使用されてきた静的クラスタリングを使用する代わりに、顧客の選択行動を完全に反映するために、離散選択モデルのセミパラメトリック混合に基づく反復的に再構成可能な動的クラスタリングを利用する。
【0008】
一般に、ホテル業界ならびに他の比較対象業界では、競争の激化により、個人向けの提示および価格設定などのより革新的な収益管理の実践が推進されている。すべての顧客が同じであるとは限らず、従来の画一的なポリシーでは効果がないことが判明する可能性がある。個人向けの推奨システムへの入力としての需要を正確に推定することが重要である。
【0009】
実施形態は、(1)支払い意思(選択した価格帯によって示される)、(2)料金プランの選択(法人割引、朝食付きなど)、(3)旅行属性、(4)予約チャネル、(5)予約窓口、(6)滞在期間、(7)到着日、および/または(8)グループ/家族の規模、子供の人数などが異なる異質の顧客を考慮に入れて需要をモデル化することによって、ホテルの客室の需要をより正確に推定する必要性に対処する。選択に影響を与える要素には、客室の特徴、料金プランの特徴、価格、提示が示される順序が含まれ得る。
【0010】
ここで、本開示の実施形態を詳細に参照し、その例を添付の図面に示す。以下の詳細な説明では、本開示の完全な理解を提供するために、多数の具体的な詳細が記載される。しかしながら、本開示がこれらの具体的な詳細なしに実施され得ることは、当業者には明らかであろう。他の例では、実施形態の態様を不必要に不明瞭にしないように、周知の方法、手順、構成要素、および回路については詳細に説明していない。可能な限り、同様の参照番号が同様の要素に使用される。
【0011】
図1は、本発明の実施形態によるホテル予約システム100の概略ブロック図である。
図1は、潜在的なホテル顧客がホテルの部屋を予約するために対話することができる予約チャネル102を含む。チャネルには、「Amadeus」、「Sabre」、「Travel Port」などを含むグローバル配信システム(「GDS」)111、「Booking.com」、「Expedia」などを含むオンライン旅行代理店(「OTA」)112、メタ検索サイト113、および顧客がホテルの部屋を予約するための、ホテルチェーンまたは個々のホテルによって維持されているウェブサイトを含むその他の手段が含まれている。
【0012】
各ホテルチェーンのオペレーション104は、Oracle Corp.の「WebLogic Server」などのWebサービスとしてのアプリケーションプログラミングインターフェース(「API」)140によってアクセスされる。ホテルチェーンのオペレーション104には、Oracle Corp.による「OPERA Cloud Property Management」などのホテル物件管理システム(「PMS」)121と、ホテル中央予約システム(「CRS」)122と、本明細書で開示されるような最適化された需要モデリングを提供するためにシステム121、122とインターフェースする需要モデリングモジュール150とが含まれている。
【0013】
システム100を使用してホテルの部屋を獲得するホテル顧客または潜在的なホテル顧客は、通常、3段階の予約プロセスにかかわる。まず、エリア空き状況の検索が行われる。複数のホテルチェーンが示され、ホテルCRS122は静的データを提供する。静的データは、最低/最高料金、利用可能日などを含むことができる。
【0014】
予約客がホテルを選択した場合、予約客は、次のステップに進み、単一のホテル物件、複数の部屋、および料金プランを含む物件検索を行う。単一のホテル物件の場合、情報には、客室カテゴリの説明データ、料金プランの説明、および客室価格が含まれてもよく、これらは各々、特定の順序で示される。物件検索には、リアルタイムの空き状況のデータが含まれ、これにより予約客が部屋を選択する。部屋が選択されると、最終ステップは最終予約であり、クレジットカードまたは他の支払い形態によって予約が保証される。
【0015】
図2は、本発明の一実施形態によるコンピュータサーバ/システム10のブロック図である。単一のシステムとして示されているが、システム10の機能は、分散システムとして実装され得る。さらに、本明細書で開示する機能は、ネットワークを介して互いに結合され得る別個のサーバまたは装置上に実装され得る。さらに、システム10の1つまたは複数の構成要素が含まれなくてもよい。例えば、webサーバまたはクラウドベースの機能として実装される場合、システム10は、1つまたは複数のサーバとして実装され、ディスプレイ、マウスなどのユーザインターフェースは不要である。実施形態では、システム10は、
図1に示される要素のいずれかを実装するために使用され得る。
【0016】
システム10は、情報を通信するためのバス12または他の通信機構と、情報を処理するためにバス12に結合されたプロセッサ22とを含む。プロセッサ22は、任意のタイプの汎用または専用プロセッサであってもよい。システム10は、プロセッサ22によって実行される情報および命令を記憶するためのメモリ14をさらに含む。メモリ14は、ランダムアクセスメモリ(「RAM」)、読み取り専用メモリ(「ROM」)、磁気または光学ディスクなどの静的記憶装置、あるいは任意の他のタイプのコンピュータ可読媒体の任意の組合せで構成され得る。システム10は、ネットワークへのアクセスを提供するために、ネットワークインターフェースカードなどの通信デバイス20をさらに含む。したがって、ユーザは、システム10と直接、またはネットワークを通して遠隔で、またはその他の方法でインターフェースすることができる。
【0017】
コンピュータ可読媒体は、プロセッサ22によってアクセス可能な任意の利用可能な媒体であってもよく、揮発性および不揮発性媒体の両方、取り外し可能および取り外し不可能媒体、ならびに通信媒体を含む。通信媒体は、コンピュータ可読命令、データ構造、プログラムモジュール、または搬送波もしくは他の伝送機構などの変調されたデータ信号内の他のデータを含むことができ、任意の情報配信媒体を含む。
【0018】
プロセッサ22は、バス12を介して、液晶ディスプレイ(「LCD」)などのディスプレイ24にさらに結合されている。キーボード26およびコンピュータマウスなどのカーソル制御装置28がさらにバス12に結合され、ユーザがシステム10とインターフェースできるようになっている。
【0019】
一実施形態では、メモリ14は、プロセッサ22によって実行されると機能を提供するソフトウェアモジュールを記憶する。モジュールは、システム10にオペレーティングシステム機能を提供するオペレーティングシステム15を含む。モジュールは、予想されるホテル客室収益を最大化するために客室需要モデルを生成する客室需要モデルモジュール16、および本明細書で開示される他のすべての機能をさらに含む。ホテルの変動運営コストは比較的小さいため、予想収益(すなわち、客室予約確率と客室価格との積)は、実施形態における主な最適化目標である。システム10は、より大きなシステムの一部となり得る。したがって、システム10は、不動産管理システム(「PMS」)(例えば、「Oracle Hospitality OPERA Property」または「Oracle Hospitality OPERA Cloud Services」)または企業リソース計画(「ERP」)システムの機能などの追加の機能を含むために、1つまたは複数の追加の機能モジュール18を含むことができる。データベース17は、バス12に結合され、モジュール16、18のための集中記憶装置を提供し、ゲストデータ、ホテルデータ、取引データなどを記憶する。一実施形態では、データベース17は、記憶されたデータを管理するために構造化照会言語(「SQL」)を使用することができるリレーショナルデータベース管理システム(「RDBMS」)である。
【0020】
一実施形態では、特に、多数のホテルロケーション、多数のゲスト、および大量の履歴データがある場合、データベース17は、インメモリ(in-memory)データベース(「IMDB」)として実装される。IMDBは、コンピュータデータ記憶のために主にメインメモリに依存するデータベース管理システムである。これは、ディスク記憶機構を使用するデータベース管理システムとは対照的である。メインメモリデータベースは、ディスクアクセスがメモリアクセスよりも遅いため、ディスク最適化データベースよりも高速であり、内部最適化アルゴリズムがより単純で、実行されるCPU命令数がより少ない。メモリ内のデータにアクセスすることで、データを照会する際のシーク時間がなくなり、ディスクよりも高速で、予測可能な性能が得られる。
【0021】
一実施形態では、データベース17は、IMDBとして実装される場合、分散データグリッドに基づいて実装される。分散データグリッドは、コンピュータサーバの集合体が1つまたは複数のクラスタで協働して、分散またはクラスタリングされた環境内で情報および計算などの関連する動作を管理するシステムである。分散データグリッドを使用して、サーバ間で共有されるアプリケーションオブジェクトおよびデータを管理することができる。分散データグリッドは、低応答時間、ハイスループット、予測可能なスケーラビリティ、継続的な可用性、および情報の信頼性を提供する。特定の例では、例えばOracle Corp.による「Oracle Coherence」データグリッドなどの分散データグリッドは、より高い性能を達成するためにインメモリに情報を記憶しており、その情報のコピーを複数のサーバ間で同期させておく際に冗長性を採用しているため、サーバに障害が発生した場合でも、システムの回復力とデータの継続した可用性を確実なものとしている。
【0022】
一実施形態では、システム10は、企業組織用のアプリケーションまたは分散アプリケーションの集合を含むコンピューティング/データ処理システムであり、物流、製造、および在庫管理機能を実装することもできる。アプリケーションおよびコンピューティングシステム10は、クラウドベースのネットワーキングシステム、サービスとしてのソフトウェア(「SaaS」)アーキテクチャ、または他のタイプのコンピューティングソリューションとともに動作するか、またはそれらとして実装されるように構成されてもよい。
【0023】
実施形態は、ホテル顧客属性、客室カテゴリおよびサービスタイプの特徴、提示価格、ならびに客室と料金のペアが顧客に提供される順序に基づいて、複数のホテル客室カテゴリとサービスタイプの組合せに対する需要を予測する問題を解決する。顧客の特性が均質である(すなわち、同じ価格が提示された場合に予想される需要が同じはずである)と仮定するのではなく、実施形態は、顧客の特性および選択パターンがクラスタ間で異質であることを可能にするために、顧客母集団にはいくつかのクラスタが含まれると仮定する。これらの異質な顧客の需要を予測することに加えて(すなわち、同じ価格が提示される場合であっても、予想される需要が異なる可能性がある)、実施形態は、新しい割り当てを反映するために、反復して再計算される各クラスタの動的サイズおよび各クラスタの重心を推定する。この問題の主な出力は、各個々の顧客が特定の客室カテゴリとサービスタイプの組合せで客室を予約する確率である。
【0024】
実施形態では、動的クラスタリング手法を利用して、予約顧客による客室とサービスの組合せを高精度に予測できるようにする。実施形態は、各クラスタ内の顧客の特性が他のクラスタからの特性よりも均質になり得るように顧客をいくつかのクラスタに分割する初期クラスタリングから開始し、各クラスタ内の個人向けの選択モデルを仮定する。顧客のクラスタメンバーシップ(すなわち、各顧客がどのクラスタに属するか)は観測不可能であるため、実施形態は、各クラスタに属する顧客の確率を通じて「ミックス(mix)」を捕捉するソフトクラスタリング手法を採用する。
【0025】
そうするために、実施形態は、潜在的なホテル顧客の特性、客室とサービスのペアの順序、および提示される価格を含むそれらの特徴に基づいて、特定の数のクラスタを有するランダムフォレストクラスタリングアルゴリズムを使用して、教師なしクラスタリングを実装する。次に、実施形態は、初期クラスタリングから得られたクラスタ確率に重みを設定したクラスタに対応する離散選択多項ロジット(「MNL」)モデルに基づいて、観測された顧客から重み付き尤度関数を導出する。次いで、実施形態は、重み付き尤度関数を最大化して、MNLモデルにおける各共変量の係数および切片の値を得る。各顧客の複数のホテル客室カテゴリとサービスタイプの組合せに対する選択確率は、これらの値から計算される。クラスタの数は、予測精度が最も高くなる値に選択される。
【0026】
実施形態では、初期クラスタリングは、顧客の選択ではなく、顧客の特徴に基づく。顧客の選択行動をクラスタリングに組み込むために、実施形態は、初期クラスタリング確率に、前のステップで計算された選択確率を乗じたものとして重みを更新し、これは、期待値最大化(Expected-Maximization)(「EM」)アルゴリズムのEステップとして見ることができる。次いで、実施形態は、更新された重み付き尤度関数を最大化することによって、動的クラスタリングステップを実行する新たに形成されたクラスタでモデルを再適合させ、これは、EMアルゴリズムのMステップを構成する。最後に、実施形態は、収束基準が満たされるまで、このEステップとMステップを繰り返す。
【0027】
収束後、実施形態は、モデルパラメータの最終推定値を取得する。顧客自身の特性、客室とサービスのペアの順序、および提示される価格を含む客室カテゴリの特徴を有する新規顧客について、実施形態は、教師ありランダムフォレスト分類器を用いる分類問題を解くことによって、各クラスタとの関連付けを推定した後に、新規顧客の選択確率を予測することができる。
【0028】
動的反復再構成可能クラスタリングアルゴリズム/機能
一般に、実施形態は、ホテル客室需要モデルを生成するために、需要を予測するための動的反復再構成可能クラスタリングアルゴリズム/機能を実装する。対象とする顧客母集団が複数のクラスタG(G>1)から構成され、各クラスタ内の顧客間で部屋を予約するパターンは比較的均質であるが、クラスタ間の予約パターンには異質性があると仮定する。この仮定の下で、クラスタ間で異なるG個の選択モデル、すなわち、各クラスタに個別に適合された選択モデルを考慮することが直感的である。しかしながら、実際には、各顧客がどのクラスタに属しているかを示すクラスタメンバーシップは観測不可能である。対照的に、実施形態は、クラスタメンバーシップが未知の場合に、クラスタ間の顧客の異質な予約パターンを推定する問題に対処するための新規のアルゴリズム/機能を実装する。
【0029】
特に、顧客i(i=1,...,n)は、観測可能な共変量
【0030】
【0031】
の集合によって特徴付けられると仮定し、ここで、nは、データセット内の顧客の数である。Jを市場において考慮される製品の数とし、Siを顧客iにとって利用可能な製品の集合、すなわち、Si⊂{1,...,J}とする。yiは顧客iが行った製品選択を示すものとし、ここでyi∈Siである。製品j=1,...,Jは、観測可能な変数
【0032】
【0033】
の集合によって特徴付けられる。すると、クラスタg内のMNL客室選択確率は、以下のように表すことができる。liを顧客iのクラスタメンバーシップインジケータとして、
【0034】
【0035】
であり、ここで、
【0036】
【0037】
は識別可能性についてであり、B∈{1,...,J}はベースライン製品である。実施形態では、本発明の実施形態を実証するためにB=Jが設定されている。クラスタメンバーシップインジケータliは観測不可能であるため、これは潜在変数と見なされ、異なる顧客の特徴にわたってあるクラスタに属する異なる確率を説明するためのモデルが必要とされる。具体的には、混合分布と呼ばれるliのモデルを以下のように仮定する。
【0038】
【0039】
ここで、
【0040】
【0041】
は、未知の
【0042】
【0043】
に依存する確率質量関数の一般的な表記である。
liをモデル化する1つの一般的なアプローチは、MNL(ロジットとして知られている)モデルを仮定することであり、これは、顧客が確率
【0044】
【0045】
でクラスタgに属することを指定し、ここで、実施形態は、識別可能性について、
【0046】
【0047】
を設定する。ベクトル
【0048】
【0049】
は、クラスタリングにおいて顧客の特徴がどのように影響を及ぼすか、すなわち、顧客がどのクラスタに属するかを指定する。しかしながら、製品選択yiとは異なり、クラスタメンバーシップインジケータliは観測不可能であるため、混合分布の真の構造は実際には知られておらず、指定されたモデルが正しいかどうかを検証することは困難である。式(1)のように混合分布についてパラメトリックファミリを事前に指定しても、真の混合分布と一致しないことがあり、これはモデル仕様ミス問題と呼ばれ、偏ったパラメータ推定値または低い適合度測定値につながり、予測精度に影響を及ぼす。
【0050】
このようなモデル仕様ミスを回避し、予測性能を向上させるために、実施形態は、式(1)とMNLモデル(3)ではなく、式(1)と式(2)を仮定することによって、離散選択モデルのセミパラメトリック混合を実装する。モデルパラメータを
【0051】
【0052】
と表すと、
【0053】
【0054】
の尤度関数は、
【0055】
【0056】
のように記述され、ここで、
【0057】
【0058】
には、ランダムフォレストなどのノンパラメトリッククラスタリング手法を使用して推定することができる事前に指定されたパラメトリックモデル形式は課されていない。他の実施形態では、クラスタリングのための他の教師なし機械学習技術を使用することもできる。次に、実施形態は、以下のように同じ考え方のEMアルゴリズムを使用する。潜在的なクラスタリングメンバーシップインジケータliが既知であると仮定する。すると、完全な尤度関数は、
【0059】
【0060】
となり、完全な対数尤度関数は、
【0061】
【0062】
となる。
EMアルゴリズムでは、式(4)の目的関数のマクシマイザ(maximizer)は、以下の反復法を使用することによって見つけることができる。
【0063】
【0064】
具体的には、実施形態は、以下のEステップとMステップを以下のように繰り返す。
Eステップ
観測データ
【0065】
【0066】
が与えられると、liの条件付き予想を計算する。
Mステップ
パラメータ
【0067】
【0068】
を、式
【0069】
【0070】
を解くことによって更新する。
開示されているように、実施形態は、顧客の特徴に基づいて、ランダムフォレストなどの教師なしクラスタリング技術を採用する。したがって、EMアルゴリズムは、反復再構成可能クラスタリングと呼ばれるコンテキストに、以下のように調整することができる。
【0071】
初期クラスタリング
顧客レベルの共変量
【0072】
【0073】
に基づいてG個のクラスタで教師なしソフトクラスタリング(例えば、ランダムフォレスト、K平均法)の学習を実行し、各クラスタについて、クラスタリング確率
【0074】
【0075】
を求め、その結果、
【0076】
【0077】
となる。ここで、
【0078】
【0079】
は
【0080】
【0081】
の初期推定値である。
【0082】
【0083】
を用いて、式
【0084】
【0085】
を解くことによって初期パラメータ値を求める。
Eステップ
実施形態は、以下のように、観測された選択および適合された離散選択モデルを使用することによって、条件付きクラスタ確率を決定する。yi=jの場合、
【0086】
【0087】
であり、その結果、
【0088】
【0089】
である。
Mステップ
以下の式を解くことによって、選択モデルパラメータを
【0090】
【0091】
および
【0092】
【0093】
に更新する。各gについて、まず、以下の式から、j=1,...,J-1について、
【0094】
【0095】
の解を求める。
【0096】
【0097】
次に、
【0098】
【0099】
を、
【0100】
【0101】
に関して、式
【0102】
【0103】
を解くことによって得る。ここで、g=2,...,Gである。
任意のε>0について、収束基準
【0104】
【0105】
が満たされるまで、(Eステップ)と(Mステップ)を繰り返す。
上記は、EMアルゴリズムの変形と見なすことができる。実施形態では、「Dempsterらの定理(1977)」を提案された反復アルゴリズムに適用することができ、この定理は、解
【0106】
【0107】
が
【0108】
【0109】
に収束するというもので、ここで、
【0110】
【0111】
は、本発明者らの目的関数
【0112】
【0113】
のマクシマイザである。
客室カテゴリと料金コードの組合せの予測
収束後、実施形態は、モデルパラメータの最終推定値
【0114】
【0115】
を得る。
【0116】
【0117】
によって特徴付けられる新規顧客について、実施形態は、以下のように選択確率を予測する。S*を利用可能な製品とすると、j∈S*について、
【0118】
【0119】
ここで、
【0120】
【0121】
は、ソフトクラスタリングによってクラスタgに属する予測確率であり、
【0122】
【0123】
は、新規顧客が利用可能な客室jの特徴ベクトルである。
図3は、一実施形態による、客室需要モデルを生成するための
図2の客室需要モデルモジュール16の機能の流れ図である。一実施形態では、
図3の流れ図の機能は、メモリまたは他のコンピュータ可読媒体もしくは有形媒体に記憶され、プロセッサによって実行されるソフトウェアによって実装される。他の実施形態では、機能は、ハードウェア(例えば、特定用途向け集積回路(「ASIC」)、プログラマブルゲートアレイ(「PGA」)、フィールドプログラマブルゲートアレイ(「FPGA」)などの使用を通して)、またはハードウェアとソフトウェアの任意の組合せによって行われてもよい。
【0124】
302において、各顧客に割り当てられた複数の属性/特性に基づいて顧客をクラスタリングするために、初期の教師なしソフトクラスタリングが開発される。実施形態において、属性は、以下のうちの1つまたは複数を含むことができる。(1)使用されているグローバル配信システム(例えば、Amadeus、SABREなど)、(2)予約チャネル、(3)宿泊日数、(4)到着客数、(5)事前予約日、(6)週末対平日、(7)企業予約。
【0125】
302における初期クラスタリングは、顧客の選択ではなく、顧客の特徴に基づく。顧客の特徴は、部屋のリクエスト時に分かる特徴であり、到着日時、人数、および予約チャネルなどのデータを含む。加えて、顧客の特徴データには、予約ウィンドウ(すなわち、予約から到着日までの時間)などの他の推論された特徴が含まれる。
【0126】
初期クラスタリング、ならびに初期クラスタリングおよびその後のクラスタリングが動的に更新される、以下に記載される動的クラスタリングは、両方とも、機械学習を組み込む。具体的には、302における初期クラスタリングは、ランダムフォレスト、またはガウス混合モデルを使用するソフトクラスタリングアルゴリズムなどの、クラスタリングのための任意の教師なし機械学習技術を組み込むことができる。顧客の選択とは異なり、クラスタメンバーシップは観測不可能であるため、顧客特性に基づいてクラスタがどのように形成されるかについて、事前に指定されたパラメトリックモデルを仮定することはより困難であり、事前に指定されたパラメトリックモデルが正しいか否かを検証することは困難である。正しいモデルを指定しないと、パラメータ推定値に偏りが生じ、または適合度測定値が低くなり、予測精度に影響を及ぼす。実施形態は、クラスタリング構造について事前に指定されたパラメトリックモデル形式を必要としないため、モデルの仕様ミスによる偏りの可能性を回避することができる。
【0127】
図4は、実施形態による初期クラスタリングの一例を示す。
図4に示すように、ゲスト特性、外部要因、および旅行属性に基づいて、3つのクラスタが形成される。実施形態において、クラスタの数は、クラスタリングの解釈可能性に基づいて事前定義されたパラメータであり、典型的には、クラスタの数を1桁に制限する。様々な実施形態では、2~4個のクラスタが使用される。
【0128】
304において、実施形態は、ホテルの客室提示に関連するパラメータに基づいて、以下を含むホテルの客室カテゴリと料金コードの組合せに対する需要について多項ロジット(「MNL」)モデルの初期混合を推定する。(1)提示価格、(2)提示における客室カテゴリおよび料金プランの位置、ならびに(3)眺望、客室のサイズ、朝食付きかどうか、無料キャンセルなどの、客室および料金の特徴。302で形成された各クラスタについて、304で別個のMNLモデルが構築される。
図5は、様々な提示価格(例えば、335ドル)、客室カテゴリ(例えば、デラックスまたはスーペリア、キングまたはクイーンベッド)、および料金コード(例えば、「朝食付き料金」)を示す例である。304において、上の式(5)を解くことによって上の式(4)に関連して定義された
【0129】
【0130】
パラメータを推定するために、データベース(例えば、
図2のデータベース17)に記憶された過去の予約データが使用される。
【0131】
図6は、例示的な実施形態によるゲストクラスタの選択モデリングを示す。
図6に示すように、各クラスタは、固有の離散選択モデルを使用して、各顧客のホテルの部屋と料金コードの組合せの選択を予測する。
図7は、実施形態による、各クラスタへのMNLモデルの初期割り当てを示す。
【0132】
306、308、および310は、集合的かつ反復的に、期待値最大化(「EM」)機能を形成する。EM機能は、306、308、および310を含み、306のEステップで更新されるソフトクラスタリングも含む。302でのソフトクラスタリングは、繰り返されない初期クラスタリングである。306において、期待値「Eステップ」について、クラスタ確率は、現在の反復のパラメータ値で評価された顧客の選択確率を組み込むことによって更新される。
【0133】
図8は、実施形態によるEM機能とともに使用される提案された尤度関数を示す。示されるように、提案された尤度関数は、302において生成され、
図4に示されるクラスタモデルと、304において生成され、
図6に示される選択モデルとの両方を含む。提案された尤度関数は、EM機能の目的関数である。実施形態は、EM機能を使用することによってモデルパラメータを推定するために、この目的関数のマクシマイザを見つける。
【0134】
図9は、実施形態によるEM機能の一部を示す。302において実行されるソフトクラスタリングである「初期ステップ」の後、306において期待値Eステップが決定される。
【0135】
最大化「Mステップ」について308において、実施形態は、混合確率がEステップで更新されたクラスタ確率である、更新されたMNLモデルの混合を推定する。310において、収束基準である|新しい予測誤差-古い予測誤差|<0.0001が満たされるまで、306と308が繰り返される。
【0136】
312において、306、308からの推定されたパラメータを使用して、新規顧客の客室カテゴリと料金コードの組合せの選択確率を予測する需要モデルが生成される。314において、機能は終了する。
【0137】
図3の機能は、離散選択モデリングの推定を顧客セグメントのデータ駆動型識別と組み合わせて、異質な顧客母集団の様々な嗜好を捉え、解釈可能なモデル出力を提供する。312において生成された需要モデルは、ホテル経営者が顧客/ゲストの嗜好に基づいて彼らをプロファイリングするのに役立つことができる実用的なアプローチを提供し、これは以下を行うための貴重な入力として役立つ。(1)より効率的なマーケティングポリシーを策定し、受け入れられる可能性がより高い個人向けの推薦を提示し、(2)部屋タイプごとに最適な個人向けの価格および表示位置を生成する(例えば、ウォータービューおよびクイーンベッド付きスイート)。
【0138】
図10は、実施形態によるEM機能の一部を示す。
図10は、308におけるMステップと、310における収束までの繰り返しとを示す。
【0139】
図11~
図16は、3つのクラスタについての本発明の実施形態の一例を示す。
図11は、1101におけるソフトクラスタリング(
図3の302)と、1102における選択モデリング(
図3の304)とを示し、ソフトクラスタリングからのクラスタの各々に対して異なるMNLモデルが生成されている。クラスタ数は、EM機能が使用される前に予め決定される。最良のクラスタ数を選択するために、いくつかの異なる数のクラスタにわたって予測精度測定値が比較され、最も正確な予測を達成する最良の数が選択される。クラスタごとに異なるMNLが存在するが、すべてのモデルパラメータが一緒に推定される。各ゲストの初期データ1103が入力として使用され、各ゲストの初期クラスタ確率1104が生成される。
【0140】
図12は、1201において条件付きクラスタ確率を再割り当てするためにEステップを使用する第1の反復(
図3の306および308)を示す。
【0141】
図13は、1301において選択モデルを更新するためにMステップを使用する第1の反復(
図3の306および308)を示し、これは条件付きクラスタ確率を修正する。
【0142】
図14は、1301における更新された条件付きクラスタ確率であるEステップを使用する第2の反復を示し、
図15は、Mステップを使用する第2の反復を示す。説明のために、2回の反復のみを仮定している。
【0143】
次に、
図16は、新規顧客の選択確率の予測を形成する推定モデルパラメータを使用する需要モデルの生成を示す。
【0144】
評価の指標
実施形態による反復再構成可能クラスタリングの性能を調査するために、実施形態は、データセットをトレーニングデータセットとテストデータセットとに分割する。モデルパラメータならびにトレーニングデータからの初期クラスタリングを推定した後、実施形態は、テストデータ内の顧客間の製品選択の予測値を取得する。予測精度測定のために、実施形態は、正しい分類比(「CCR」)および平均二乗誤差(「MSE」)を使用する。
【0145】
CCRは、最も高い予測確率を有する選択肢が、観測された選択と一致する観測の割合として計算される。
【0146】
MSEは次のように計算される。
【0147】
【0148】
ここで、yiおよび
【0149】
【0150】
は、部屋タイプjに対する顧客iの真の選択および予測選択であり、φteは、テストデータ内の顧客のインデックスのセットであり、nteは、テストデータ内の顧客の数である。この指標は、Brierスコアとも呼ばれ、確率的予測を評価する際に一般的に使用される。
【0151】
実験では、複数の都市と国の複数のホテルの専用のデータセットを利用することによって、実際のホテルデータセットを使用して実施形態が適用された。このデータには、予約情報およびそれに対応する顧客特性が含まれている。さらに、ログデータ(すなわち、リアルタイムの顧客の予約リクエストおよびそれに対応する予約サーバシステムによる応答)が含まれている。このログから、客室および料金コードの表示順序に関する情報が抽出された。この順序は、各ホテル経営者によって戦略的に入力され、各顧客は様々な表示順序を有することになる。最終的なデータセットには、2019年7月2日から2019年7月19日までの、18の異なる客室および15の様々な料金コードの9,173件の予約が含まれていた。
【0152】
実施形態は、最初に、通常は未知である、顧客母集団の最適クラスタ数を見つける。実施形態は、最適なクラスタ数を選択するために予測基準アプローチを採用する。具体的には、実施形態は、MSEを採用し、2、3、4、および5つのクラスタの中で予測精度が最も高いクラスタ数を選択する。実験によると、4つの選択肢の中で2つのクラスタが最高の性能を有することが確認された。
【0153】
2つのクラスタが与えられると、実施形態は、実際のホテル予約データセットを使用して本発明の実施形態を実施する。具体的には、実施形態の予測精度を、単一のクラスタベンチマークと比較する。実施形態は、各データセットをトレーニングデータセット(80%)とテストデータセット(20%)に分割する。結果を以下の表1に示し、MSEに基づく基準が満たされた(すなわち、0.0001に近くなった)ため、反復は17で停止した。
【0154】
【0155】
図17は、本発明の実施形態によるCCRとMSEの反復による予測精度の比較を示す。
図11において、線1701および1702は2つのクラスタについてのものであり、線1703および1704は単一のクラスタについてのものである。示されるように、予測性能は、本発明の実施形態を使用して、2つのクラスタについては反復により改善されている。具体的には、CCRの値が増加する一方で、MSEの値は、反復により減少している。また、単一のクラスタ(すなわち、既知の解)の結果は、2つのクラスタの場合よりも悪いことが観測される。
【0156】
図18は、実施形態による、2つのクラスタが与えられた場合に、クラスタ特性が反復によりどのように変化するかを示す。具体的には、
図18は、重心値が反復によりどのように移動するかを示しており、曲線1850はCCRについてのものであり、曲線1860はMSEについてのものである。7つの属性、すなわち、グローバル配信システム(1803)、予約チャネル(1802)、宿泊日数(1806)、到着客数(1807)、事前予約日(1801)、顧客が週末に到着したかどうか(1805)、および顧客が企業コード経由で予約したかどうか(1804)が、顧客をクラスタリングして異質な顧客母集団に対処するために使用される。
図18は、反復により各クラスタについて各属性がどのように移動するかを示す。
【0157】
開示されるように、実施形態は、予約客の属性、提示における客室とサービスのペアの順序、および提示価格に基づいて、顧客の選択を予測し、ホテル業界における客室カテゴリとサービスタイプの特徴の相対的価値を推定するための新規の手法を組み込んでいる。具体的には、ホテル業界によって現在使用されている需要予測ツールのほとんどは、単一のクラスタ(すなわち、均質な顧客母集団)を仮定した時系列分析に基づいて予約の総数を提供することを目的としているため、異質な顧客母集団を無視している。これらの需要モデリングツールは、支払い意思および行動パターンが著しく異なる異質な顧客が存在する場合には効果がないことが多い。いくつかのツールが異質な顧客母集団を考慮したとしても、それらのツールは、標準的なクラスタアルゴリズムを使用しており、クラスタリングプロセス中の顧客選択行動を反映していない場合がある。さらに、一般に、いかなる需要予測ツールも、客室カテゴリと料金コードのペアの順序に対処していない。ウェブサイト上の表示順序は、提示価格に加えて、顧客の選択行動に影響を及ぼす。
【0158】
実施形態は、予約客による客室とサービスの組合せの高精度の予測を可能にする。計算実験を通して、実施形態は、動的クラスタリング手法を使用する予測料金が静的クラスタリング手法よりも約4%高くなることが示された。さらに、実施形態では、客室カテゴリと料金コードの順序に関する情報を表示最適化システムに入力することで、ホテル経営者がより適切なマーケティング戦略を策定し、より受け入れられる傾向にある個人向けの推薦を提案するのに役立つことができる。
【0159】
加えて、実施形態は、ランダムフォレスト、またはガウス混合モデルを使用するソフトクラスタリングアルゴリズムなどのクラスタリングのための任意の教師なし機械学習技術をアルゴリズムの最初のステップに組み込むことができる。顧客の選択とは異なり、クラスタメンバーシップは観測不可能であるため、顧客特性に基づいてクラスタがどのように形成されるかについて事前に指定されたパラメトリックモデルを仮定することはより困難であり、事前に指定されたパラメトリックモデルが正しいか否かを検証することは困難である。正しいモデルを指定しないと、パラメータ推定値に偏りが生じ、または適合度測定値が低くなり、予測精度に影響を及ぼす。実施形態は、クラスタリング構造について事前に指定されたパラメトリックモデル形式を必要としないため、モデルの仕様ミスによる偏りの可能性を回避することができる。
【0160】
実施形態は、特に本発明の実施形態のようにトレーニングを伴う場合は、機械学習の一形態として動的クラスタリングを実施する。実施形態は、入力のみを含むデータセットを取り込む教師なし学習を使用し、データポイントのグループ化またはクラスタリングなど、データ内の構造を見つける。クラスタ分析は、観測の集合をクラスタと呼ばれるサブセットに割り当てることであり、その結果、同じクラスタ内の観測は1つまたは複数の事前指定された基準に従って類似するが、異なるクラスタから抽出された観測は類似しない。異なるクラスタリング技術は、多くの場合、何らかの類似性メトリックによって定義され、例えば、内部的なコンパクトさ、すなわち同じクラスタのメンバ間の類似性、および分離、すなわちクラスタ間の差によって評価されるデータの構造について異なる仮定を行う。教師なしオンライン/インクリメンタル機械学習の一形態としての動的クラスタリングは、以下の2つの概念を考慮する。(1)クラスタリングモデルを考案するための学習方法のインクリメンタル性、および(2)学習したモデル(パラメータおよび構造)の自己適応。
【0161】
本明細書全体を通して記載される本開示の特徴、構造、または特性は、1つまたは複数の実施形態において任意の適切な様式で組み合わせることができる。例えば、本明細書全体を通して、「一実施形態」、「一部の実施形態」、「ある実施形態」、「特定の実施形態」、または他の類似の言語の使用は、実施形態に関連して記載される特定の特徴、構造、または特性が、本開示の少なくとも1つの実施形態に含まれ得るという事実を指す。したがって、本明細書全体を通して、語句「一実施形態」、「一部の実施形態」、「ある実施形態」、「特定の実施形態」、または他の類似の言語の出現は、必ずしも、すべて、同一グループの実施形態を指すわけではなく、記載された特徴、構造、または特性は、1つまたは複数の実施形態において任意の適切な様式で組み合わせることができる。
【0162】
当業者は、上述した実施形態が、異なる順序のステップで、および/または開示されたものとは異なる構成の要素を用いて実施され得ることを容易に理解するであろう。したがって、本開示は、概説された実施形態を考慮しているが、本開示の趣旨および範囲内に留まりながら、特定の修正、変形、および代替構造が明らかであることは、当業者には明らかであろう。したがって、本開示の境界および範囲を決定するためには、添付の特許請求の範囲を参照すべきである。
【国際調査報告】