IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ エロル エイヴリー ケーニグの特許一覧

<>
  • 特表-自動映画パフォーマンス予測 図1
  • 特表-自動映画パフォーマンス予測 図2
  • 特表-自動映画パフォーマンス予測 図3
  • 特表-自動映画パフォーマンス予測 図4
  • 特表-自動映画パフォーマンス予測 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-07-03
(54)【発明の名称】自動映画パフォーマンス予測
(51)【国際特許分類】
   G06Q 30/0282 20230101AFI20230626BHJP
【FI】
G06Q30/0282
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022573652
(86)(22)【出願日】2021-05-12
(85)【翻訳文提出日】2023-01-12
(86)【国際出願番号】 US2021032070
(87)【国際公開番号】W WO2021242527
(87)【国際公開日】2021-12-02
(31)【優先権主張番号】16/883,316
(32)【優先日】2020-05-26
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】522464252
【氏名又は名称】エロル エイヴリー ケーニグ
(74)【代理人】
【識別番号】110001243
【氏名又は名称】弁理士法人谷・阿部特許事務所
(72)【発明者】
【氏名】エロル エイヴリー ケーニグ
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049BB02
(57)【要約】
映画の識別子の受信に応答して、映画のパフォーマンスの予測が生成される。映画の特徴は、識別され、類似の映画のセットは、その特徴に基づいて、識別される。パフォーマンス統計は、これらの映画の平均経済的パフォーマンスを示す類似の映画のセットについて計算され、パフォーマンス統計に基づいて、映画のパフォーマンスの予測が生成される。予測は、ユーザーへの提示のために提供される。
【特許請求の範囲】
【請求項1】
映画のパフォーマンスを予測するためのコンピュータ実装される方法であって、
選択された映画の識別子を受信するステップと,
前記選択された映画の特徴のセットを識別するステップと、
前記特徴のセットに基づいて、類似映画のセットを識別するステップであって、前記類似映画のセット内の各映画は、選択された映画との類似性を示す特性を有するステップと、
前記類似映画のセットのパフォーマンス統計を計算するステップであって、前記パフォーマンス統計は、前記類似映画のセット内の前記映画の経済的パフォーマンスを示すステップと、
前記パフォーマンス統計に基づいて、前記選択された映画のパフォーマンスの予測を生成するステップと、
前記予測を提示のために提供するステップと
を備えたことを特徴とするコンピュータ実装される方法。
【請求項2】
類似映画のセットを識別するステップは、
候補類似映画のセット内の各候補映画と前記選択された映画との間の距離を計算するステップであって、前記距離は、前記選択した映画および前記対応する候補映画の類似性を定量化するステップと、
前記距離に基づいて、前記類似映画のセットに含める候補映画を選択するステップと
を備えた請求項1に記載のコンピュータ実装される方法。
【請求項3】
前記類似映画のセットに含める候補映画を選択するステップは、
しきい値未満である相当する距離に応答して、前記類似映画のセット内に候補映画を含めるステップを備えた請求項2に記載のコンピュータ実装される方法。
【請求項4】
所与の候補映画と前記選択された映画の間の前記距離を計算するステップは、
前記選択された映画を表す特徴ベクトルを取得するステップと、
前記選択された映画を表す特徴ベクトルを取得するステップと、
前記選択された映画を表す前記特徴ベクトルと前記選択された映画を表す前記特徴ベクトルとの間の差に基づいて、前記距離を計算するステップと
を備えた請求項2に記載のコンピュータ実装される方法。
【請求項5】
前記距離は、機械学習モデルを用いて計算される請求項2に記載のコンピュータ実装される方法。
【請求項6】
前記特徴のセットには、予算、ジャンル、ターゲット人口統計、関連する知的財産、キャスト、目標、映画が賞を受賞する可能性があるかどうか、または公開日のうちの少なくとも1つが含まれる請求項1に記載のコンピュータ実装される方法。
【請求項7】
パフォーマンス統計を計算するステップは、
前記類似映画のセット内の各映画のパフォーマンスデータを、データストアから、検索するステップと、
前記類似映画のセット内の映画の平均パフォーマンスを、前記パフォーマンスデータに基づいて、計算するステップと
を備えた請求項1に記載のコンピュータ実装される方法。
【請求項8】
前記映画のパフォーマンスデータには、予算および全世界の興行収入が含まれ、前記平均パフォーマンスを計算するステップは、
前記類似映画のセット内の各映画について、前記全世界の興行収入を前記予算で割って、興行収入に対する予算の指標を計算するステップと、
合計を生成するために、前記計算された予算を興行指標に合計するステップと、
前記合計を前記類似映画のセット内の映画の前記数で割るステップと
を備えた請求項7に記載のコンピュータ実装される方法。
【請求項9】
前記映画のパフォーマンスデータには、全世界の興行収入および国内の興行収入が含まれ、前記平均パフォーマンスを計算するステップは、
前記類似映画のセット内の各映画について、前記国内の興行収入を前記全世界の興行収入で割って、国内割合の指標を計算するステップと、
合計を生成するために、前記計算された国内割合指標を合計するステップと、
前記合計を前記類似映画のセット内の映画の前記数で割るステップと
を備えた請求項7に記載のコンピュータ実装される方法。
【請求項10】
前記映画のパフォーマンスデータには、国内の興行収入および国内の週末上映興行収入の合計が含まれ、平均パフォーマンスを計算するステップは、
前記類似映画のセット内の各映画について、前記国内の興行収入合計を国内公開週末興行収入で割って、第1の週末乗数を計算するステップと、
合計を生成するために、前記計算された第1の週末乗数を合計するステップと、
前記合計を前記類似映画のセット内の映画の前記数で割るステップと
を備えた請求項7に記載のコンピュータ実装される方法。
【請求項11】
前記予測は、複数の市場のそれぞれにおける前記映画の予測収益、抱き合わせ販売商品の注文、映画館が前記映画に専念すべきスクリーン数の推奨、前記映画をいつ公開するかの推奨、前記映画の制作に関連する1つまたは複数の役割のそれぞれの総収益への貢献度の指標、または、前記映画をオンデマンドまたはストリーミングサービスに並行し手、劇場公開の前、または代わりに開始することの推奨のうちの少なくとも1つを含む請求項1に記載のコンピュータ実装される方法。
【請求項12】
コンピューティングシステムによって実行されるとき、前記コンピューティングシステムに動作を実行させる前記映画のパフォーマンスを予測するためのコンピュータプログラムコードを含む非一時的コンピュータ読み取り可能記録媒体であって、前記動作は、
選択された映画の識別子を受信することと,
前記選択された映画の特徴のセットを識別することと、
前記特徴のセットに基づいて、類似映画のセットを識別することであって、前記類似映画のセット内の各映画は、選択された映画との類似性を示す特性を有することと、
前記類似映画のセットのパフォーマンス統計を計算することであって、前記パフォーマンス統計は、前記類似映画のセット内の前記映画の経済的パフォーマンスを示すことと、
前記パフォーマンス統計に基づいて、前記選択された映画のパフォーマンスの予測を生成することと、
前記予測を提示のために提供することと
を備えたことを特徴とする非一時的コンピュータ読み取り可能記録媒体。
【請求項13】
類似映画のセットを識別することは、
候補類似映画のセット内の各候補映画と前記選択された映画との間の距離を計算することであって、前記距離は、前記選択した映画および前記対応する候補映画の類似性を定量化することと、
前記距離に基づいて、前記類似映画のセットに含める候補映画を選択することと
を備えた請求項12に記載の非一時的コンピュータ読み取り可能記録媒体。
【請求項14】
前記特徴のセットには、予算、ジャンル、ターゲット人口統計、関連する知的財産、キャスト、目標、映画が賞を受賞する可能性があるかどうか、または公開日のうちの少なくとも1つが含まれ、
前記類似映画のセットに含める候補映画を選択することは、しきい値未満である相当する距離に応答して、前記類似映画のセット内に候補映画を含めることを備えた請求項13に記載の非一時的コンピュータ読み取り可能記録媒体。
【請求項15】
所与の候補映画と前記選択された映画の間の前記距離を計算することは、
前記選択された映画を表す特徴ベクトルを取得することと、
前記選択された映画を表す特徴ベクトルを取得することと、
前記選択された映画を表す前記特徴ベクトルと前記選択された映画を表す前記特徴ベクトルとの間の差に基づいて、前記距離を計算することと
を備えた請求項13に記載の非一時的コンピュータ読み取り可能記録媒体。
【請求項16】
パフォーマンス統計を計算することは、
前記類似映画のセット内の各映画のパフォーマンスデータを、データストアから、検索することと、
前記類似映画のセット内の映画の平均パフォーマンスを、前記パフォーマンスデータに基づいて、計算することと
を備えた請求項12に記載の非一時的コンピュータ読み取り可能記録媒体。
【請求項17】
前記映画のパフォーマンスデータには、予算および全世界の興行収入が含まれ、前記平均パフォーマンスを計算することは、
前記類似映画のセット内の各映画について、前記全世界の興行収入を前記予算で割って、興行収入に対する予算の指標を計算することと、
合計を生成するために、前記計算された予算を興行指標に合計することと、
前記合計を前記類似映画のセット内の映画の前記数で割ることと
を備えた請求項16に記載の非一時的コンピュータ読み取り可能記録媒体。
【請求項18】
前記映画のパフォーマンスデータには、全世界の興行収入および国内の興行収入が含まれ、前記平均パフォーマンスを計算することは、
前記類似映画のセット内の各映画について、前記国内の興行収入を前記全世界の興行収入で割って、国内割合の指標を計算することと、
合計を生成するために、前記計算された国内割合指標を合計することと、
前記合計を前記類似映画のセット内の映画の前記数で割ることと
を備えた請求項16に記載の非一時的コンピュータ読み取り可能記録媒体。
【請求項19】
前記映画のパフォーマンスデータには、国内の興行収入および国内の週末上映興行収入の合計が含まれ、平均パフォーマンスを計算することは、
前記類似映画のセット内の各映画について、前記国内の興行収入合計を国内公開週末興行収入で割って、第1の週末乗数を計算することと、
合計を生成するために、前記計算された第1の週末乗数を合計することと、
前記合計を前記類似映画のセット内の映画の前記数で割ることと
を備えた請求項16に記載の非一時的コンピュータ読み取り可能記録媒体。
【請求項20】
映画のパフォーマンスを予測するためのコンピュータシステムであって、
実行可能なコンピュータプログラムコードを含む非一時的コンピュータ読み取り可能記録媒体であって、前記コンピュータプログラムコードは、
選択された映画の識別子を受信することと,
前記選択された映画の特徴のセットを識別することと、
前記特徴のセットに基づいて、類似映画のセットを識別することであって、前記類似映画のセット内の各映画は、選択された映画との類似性を示す特性を有することと、
前記類似映画のセットのパフォーマンス統計を計算することであって、前記パフォーマンス統計は、前記類似映画のセット内の前記映画の経済的パフォーマンスを示すことと、
前記パフォーマンス統計に基づいて、前記選択された映画のパフォーマンスの予測を生成することと、
前記予測を提示のために提供することの命令を含む非一時的コンピュータ読み取り可能記録媒体と、
前記コンピュータプログラムコードを実行するためのプロセッサと
を備えたことを特徴とするコンピュータシステム。
【発明の詳細な説明】
【技術分野】
【0001】
説明される主題は、一般にコンピュータ生成の予測に関し、特に、映画のパフォーマンスの予測に関する。
【背景技術】
【0002】
本出願は、2020年5月26日に出願された「Automatic Movie Performance Predictor」という名称の米国特許出願第16/883,316号の優先権の利益を主張し、参照により組み込まれる。
【0003】
映画産業は、大きなビジネスである。2016年、映画館でのチケット販売は、2016年に360億ドルを超える収益を生み出した。さらに、世界中のテレビおよびその他の劇場後のビデオの収益化は、約3000億ドルの将来収益を生み出す。しかし、制作費用も高額で、同じ期間に1本の映画を制作する平均予算は、1億ドルをはるかに超える。成功した映画は、大きな利益を生み出す可能性があるが、失敗作品は、同じ程度の大きな損失をもたらす可能性がある。
【図面の簡単な説明】
【0004】
図1】一実施形態による、映画パフォーマンス予測が提供され得るネットワーク化されたコンピューティング環境を示すブロック図である。
図2】一実施形態による、パフォーマンス予測システムを示すブロック図である。
図3】一実施形態による、図2に示すパフォーマンス予測システムの映画データベースを示すブロック図である。
図4】一実施形態による、図1のネットワーク化されたコンピューティング環境での使用に適した例示的なコンピュータを示すブロック図である。
図5】一実施形態による、映画のパフォーマンスを予測する方法を示すフローチャートである。
【発明を実施するための形態】
【0005】
図面および以下の説明は、例示のみを目的として特定の実施形態を説明する。当業者は、以下の説明から、説明された原理から逸脱することなく、構造および方法の代替実施形態を採用することができることを容易に認識するであろう。ここでいくつかの実施形態を参照し、その例を添付の図に示す。類似または同様の機能を示すために、実行可能な限り、類似または同様の参照番号が、図で使用されることに留意すべきである。
【0006】
概要と利点
所与の映画が成功するかどうかは、広範囲の人々および他のものに大きな影響を与える可能性がある。いくつかの影響を挙げると、俳優のキャリアが進んだりまたは妨げられたり、映画スタジオが拡張されたりまたは閉鎖されたり、フランチャイズ権所有者が続編の制作を検討したりまたは放棄したりすることがある。所与の映画の成功または失敗の認識される可能性は、その映画自体が完成するか棚入れされるかを判定することさえあり得る。伝統的に、利害関係者は、映画の将来のパフォーマンスを予測するために、批評家やその他の人の専門家の主観的な意見に頼ることがよくあった。さらに、既存の方法は、映画の興行パフォーマンスの予測を生成する際に、独占的またはアクセスが困難なデータに依存している。公開的に(または少なくともより容易に)利用可能な情報に基づいて、映画のパフォーマンスのより客観的な予測を提供する様々な実施形態が説明される。
【0007】
一実施形態では、映画のパフォーマンスを予測するためのコンピュータベースの方法は、選択された映画の識別子を受信し、選択された映画の特徴のセットを識別することを含む。方法は、また、特徴のセットに基づいて、類似映画のセットを識別することを含み、類似映画のセット内の各映画は、選択された映画との類似性を示す特性を有する。パフォーマンス統計は、類似映画のセット内の映画の経済的パフォーマンスを示す類似映画のセットについて計算される。方法は、パフォーマンス統計に基づいて選択された映画のパフォーマンスの予測を生成し、ユーザーに提示するためのその予測を提供することをさらに含む。
【0008】
様々な実施形態では、開示された方法は、経験豊富な映画評論家の予測と平均して少なくとも同じくらい正確な映画パフォーマンスの予測を生成することができる。また、これらの予測は、主観的な判断ではなく、客観的なデータに基づいている。さらに、これらの予測は、容易に入手可能な情報に基づいて生成され得る
システム例
図1は、映画のパフォーマンスの予測が提供され得るネットワーク化コンピューティング環境100の一実施形態を図示する。図1に示される実施形態では、ネットワーク化コンピューティング環境は、パフォーマンス予測システム110、1つまたは複数のサードパーティサーバ120、およびいくつかのクライアントデバイス140を含み、これらの全ては、ネットワーク170を介して接続される。例示の目的のために3つのクライアントデバイス140が示されているが、任意の数のクライアントデバイスがネットワーク170に接続されてもよい。他の実施形態では、ネットワーク化コンピューティング環境100は、異なる要素および/または追加要素を包含する。さらに、機能は、説明した方法とは異なる方法で、要素間に分散させてもよい。例えば、一実施形態では、パフォーマンス予測システム110は、サードパーティサーバ120からのいかなるデータも使用しない。いくつかの実施形態では、パフォーマンス予測システム110は、スタンドアロンシステムであり、ネットワークに全く接続されていない場合があることに留意すべきである。
【0009】
パフォーマンス予測システム110は、特定の映画のパフォーマンスに関する予測を生成する。予測は、公開前および場合によっては映画が完成する前に、公開されている映画に関する情報に基づく場合がある。そのような情報の例としては、予算、ジャンル、ターゲット人口統計、関連する知的財産(例えば、著作権で保護されたキャラクター、映画が基になっている小説など)、キャスト、目標(賞を獲得する、お金を稼ぐ、おもちゃ他の商品を販売する、ブランドを構築するなど)、映画が受賞の可能性があると見なされるかどうか(例えば、オスカーノミネートの可能性が高い)などが挙げられる。場合によっては、公開されている情報は、独自のスタジオ情報によって補完され得る。したがって、スタジオは、競合他社のものよりも自社の映画のより正確な予測を生成することができる場合がある。しかしながら、パフォーマンス予測システム110は、公開されている情報のみを使用して正確な予測を生成し得る。典型的に、予測は、公開前に生成され、将来のパフォーマンスに関連する。それにもかかわらず、場合によっては、予測は、事実の後に生成され得る。例えば、ユーザーは、パフォーマンス予測システム110によって生成された予測を映画の実際のパフォーマンスと比較することを望んでいる場合がある。パフォーマンス予測システムの様々な実施形態を、図2および図3を参照して以下に説明する。
【0010】
サードパーティサーバ120は、パフォーマンス予測システムがデータまたはサービスを取得するために(例えば、ネットワーク170を介して)接続し得るコンピュータシステムである。サードパーティという用語が使用されるが、場合によっては、サードパーティサーバ120は、パフォーマンス予測システム110を動作させる同じものによって制御されてもよい。一実施形態では、サードパーティサーバ120は、映画に関する情報の1つまたは複数のデータベースをホストする。これらのデータベースには、タイトル、公開日(または公開予定日)、ジャンル、キャスト、予算などの情報が含まれる場合がある。パフォーマンス予測システム110は、必要に応じて、1つまたは複数のサードパーティサーバ120からそのような情報に接続し得る。例えば、パフォーマンス予測システム110は、映画タイトルを含む問い合わせをサードパーティサーバ120に提出し、それに応答して公開日、ジャンル、キャスト、および予算を受信し得る。場合によっては、パフォーマンス予測システム110は、異なるサードパーティから異なる情報を取得し得る。例えば、キャスト情報は、予算が別のソースから取得されている間、あるソースから取得され得る。あるいは、前述のように、この情報の一部または全ては、パフォーマンス予測システム110によって記憶されてもよい。
【0011】
クライアントデバイス140は、ネットワーク170を介してデータを送信および受信するだけでなく、ユーザー入力を受信することができるコンピューティングデバイスである。クライアントデバイス140は、デスクトップコンピュータ、ラップトップコンピュータ、パーソナルデジタルアシスタント(PDAs)、携帯電話、スマートフォン、および他の適切なデバイスなどの様々な形態をとることができる。一実施形態では、クライアントデバイス140は、ユーザーがパフォーマンス予測システム110と相互作用し得るインターフェース(例えば、ブラウザ、アプリなどで提示されるウェブページ)を提供する。ユーザーは、映画を識別し、クライアントデバイス140は、識別された映画のパフォーマンスの予測のためにパフォーマンス予測システム110に問い合わせる。予測は、問い合わせに応答して生成されてもよく、または予測は、パフォーマンス予測システム110が、問い合わせに応答して識別された映画の予測を検索してもよい。あるいは、ハイブリッド方法は、パフォーマンス予測システム110が、最初に要求されたときに映画の予測を生成し、次いで、生成された予測をデータベースに記憶する場合に使用され得る。したがって、パフォーマンス予測システム110が問い合わせを受信すると、それは、映画の既存の予測が存在するかどうかを確認し、存在しない場合、新しい予測を生成し得る。予測がどのように生成されるかにかかわらず、パフォーマンス予測システム110は、それをユーザーに提示するためにクライアントデバイス140に送信する。
【0012】
ネットワーク170は、ネットワーク化コンピューティング環境100の他の要素が通信する通信チャネルを提供する。ネットワーク170は、有線および/または無線通信システムの両方を使用して、ローカルエリアおよび/またはワイドエリアネットワークの任意の組み合わせを含むことができる。一実施形態では、ネットワーク170は、標準的な通信技術および/またはプロトコルを使用する。例えば、ネットワーク170は、イーサネット、802.11、マイクロ波を利用した世界標準の通信方式(WiMAX)、3G、4G、コード分割多重アクセス(CDMA)、デジタル加入者線(DSL)などの技術を使用した通信リンクを含むことができる。ネットワーク170を介して通信するために使用されるネットワークプロトコルの例には、マルチプロトコルラベルスイッチング(MPLS)、伝送制御プロトコル/インターネットプロトコル(TCP/IP)、ハイパーテキストトランスポートプロトコル(HTTP)、簡易メール転送プロトコル(SMTP)、およびファイル転送プロトコル(FTP)が含まれる。ネットワーク170を介して交換されたデータは、ハイパーテキストマークアップ言語(HTML)または拡張可能マークアップ言語(XML)などの任意の適切なフォーマットを使用して表され得る。いくつかの実施形態では、ネットワーク170の通信リンクの全てまたは一部は、任意の適切な技術または技法を使用して暗号化されてもよい。
【0013】
図2は、パフォーマンス予測システム110の一実施形態を示す。図2に示す実施形態では、パフォーマンス予測システム110は、映画データ210、映画選択モジュール220、特徴抽出モジュール230、類似映画識別モジュール240、統計生成モジュール250、および予測モジュール260を含む。他の実施形態では、パフォーマンス予測システム110は、異なるおよび/または追加要素を包含する。さらに、機能は、説明した方法とは異なる方法で、要素間に分散させてもよい。例えば、映画データ210から特徴を抽出するのではなく、一部またはすべての特徴をサードパーティサーバ120から取得してもよい。
【0014】
映画データ210は、1つまたは複数のコンピュータ読み取り可能媒体に記憶された映画に関する情報である。映画データ210は、単一のものとして示されるが、複数の場所における複数のデバイスに記憶されてもよい。例えば、映画データ210は、ネットワーク170を介してパフォーマンス予測システム110によって接続される分散されたデータベースに記憶され得る。映画データ210の一実施形態が、図3に示されている。
【0015】
図3に示す実施形態では、映画データ210は、いくつかの映画、映画A310および映画B320から映画N330に関する情報を含む。各映画について、映画データ210は、映画ID312、特徴314、およびパフォーマンスメトリック316を含む。映画IDは、タイトル、映画に割り当てられた一意の識別番号、または特定の映画を識別するために使用され得る任意の他のデータであってもよい。映画タイトルが使用され、同じタイトルの映画が複数存在する場合(例えば、リメイク)、映画を区別するために、映画ID312の一部として公開年などの追加情報が含まれても良い。
【0016】
特徴314は、それを分類し、他の映画との類似性を判定するために使用され得る、映画に関する情報である。一実施形態では、特徴は、予算、ジャンル、ターゲット人口統計、関連知的財産、キャスト、目標など、公開前に利用可能な前述の情報を含む。特徴の他の例には、公開日(例えば、休日に近い時期に公開される映画は、類似していることが多い)、基礎となるストーリーの起源(例えば、外国の民話に基づく映画と国内で生成されたストーリー)、および映画が受賞の可能性があると見なされるかどうかが含まれる。これらの特徴の一部またはすべては、「BOX OFFICE MOJO」、「IMDB」、「THE-NUMBERS.COM」などのサードパーティサービスから取得することができる。特徴314のセットは、特徴ベクトルと呼ばれる、セット内の各特徴についての値を保持する要素を有するベクトルとして表すことができる。いくつかの実施形態では、パフォーマンス予測システムは、映画データ210の一部としてそれらを記憶するのではなく、必要に応じて、サードパーティサーバ120から特徴314の一部またはすべてを取得し得ることに留意すべきである。
【0017】
パフォーマンスメトリック316は、映画がどのようにパフォーマンスしたかに関する情報を提供する。一実施形態では、パフォーマンスメトリック316は、全世界の興行収入、国内の興行収入、国内公開週末の興行収入、および全世界公開週末の興行収入を含む。他の実施形態では、パフォーマンスメトリック316は、映画のパフォーマンスの異なるまたは追加の指標を含み得る。例えば、ストリーミングまたはテレビのために利用可能になった映画について、パフォーマンスメトリック316は、これらのプラットフォームからの総再生回数および収益を含み得る。
【0018】
再び図2を参照すると、映画選択モジュール220は、予測が望まれる映画をユーザーが選択できるインターフェースを提供する。一実施形態では、映画選択モジュール220は、クライアントデバイス140を介してアクセス可能なウェブサイトを提供する。ウェブサイトは、クライアントデバイス140のユーザーが映画を選択するために記入するフォームを含む。フォームは、フリーテキストフィールド内で映画のタイトルを勧誘し、1つまたは複数のパラメータ(タイトル、キーワード、俳優、監督、ジャンル、スタジオなど)に基づいて検索機能を提供し、または(例えば、ドロップダウンリスト内で)映画のリストを提供し得る。あるいは、フォームは、予測を生成するために使用される映画に関する追加情報を求め得る。例えば、フォームは、キャスト(例えば、主役)、予算、ジャンル、ターゲット人口統計などを入力するようにユーザーに指示し得る。各特徴は、フリーテキストフィールド、ドロップダウンリストなどを介して入力されてもよい。
【0019】
別の実施形態では、映画選択モジュール220は、クライアントデバイス(例えば、アプリ)上で動作するソフトウェアが、ユーザーが映画を選択することを可能にするアプリケーションプログラミングインターフェース(API)を提供する。ソフトウェアによって提供されるインターフェースは、ウェブサイトについて上述した様々なオプションと実質的に同じ方法で動作し得る。さらなる実施形態では、映画選択モジュール220は、パフォーマンス予測システム220において同様のインターフェースを提供する。例えば、パフォーマンス予測システム220がスタンドアロンシステムとして機能する場合、または完全なソフトウェアパッケージとして提供される場合、インターフェースは、予測を生成する同じデバイス(例えば、クライアントデバイス140)上に提供され得る。
【0020】
特徴抽出モジュール230は、映画のパフォーマンスの予測を生成するために使用され得る選択された映画の特徴を識別する。一実施形態では、特徴抽出モジュール230は、対応する特徴314について選択された映画のタイトルまたは映画ID312を用いてデータベース(例えば、映画データ210)に問い合わせる。特徴抽出モジュール230は、代替的にまたは追加的に、1つまたは複数のサードパーティサーバ120から情報を収集してもよく、および/または情報は、映画選択プロセスの一部としてユーザーによって提供されてもよい。ソースまたは情報のソースに関わらず、特徴抽出モジュール230は、所望の特徴を抽出する。抽出された特徴は、選択された映画の特徴ベクトルを定義するために使用され得る。
【0021】
類似映画識別モジュール240は、選択された映画の特徴を(例えば、映画データ210に記憶された)他の映画の特徴314と比較して、類似映画のセットを識別する。一般に、対応する特徴314が類似している場合、2つの映画は、類似していると見なされる。例えば、新進気鋭の俳優(例えば、ハイリー・スタインフェルド、タイ・シェリダン、レティシア・ライト、ミリー・ボビー・ブラウンなど)を出演させる2つの映画は、概して、それらの俳優のうちの1人と古い映画スター(例えば、ブルース・ウィリス、リアム・ニーソン、ハリソン・フォード、デンゼル・ワシントンなど)を出演させる映画よりも類似しており、他の全てのものは、等しい。別の例として、感謝祭(Thanksgiving)の週に公開された2本の映画は、その週に公開された映画と夏に公開された映画よりも似ている可能性が高い。
【0022】
様々な実施形態では、類似映画識別モジュール240は、映画データ210内の選択された映画と各映画との間の距離を判定する。一実施形態では、距離は、類似性メトリックのセットに基づいている。一対の映画の類似性メトリックを計算するために、類似映画識別モジュール240は、1つの映画の特定の特徴の値を他の映画の同じ特徴の値と比較する。一対の映画の類似性メトリックを(例えば、重み付けされた組み合わせ関数を使用して)組み合わせて、映画間の類似性を示す単一の距離スコアを生成し得る。したがって、多くの特徴が類似した値を有する映画は、一般的に、いくつかの類似した特徴のみを共有する映画よりも類似していると見なされる。
【0023】
類似性メトリックの具体例を挙げると、2つの映画における主役を比較するために、類似映画識別モジュール240は、年齢、性別、人種のような人口統計情報と以前の映画の数、第1の映画からの年数、最後の年の映画の数のようなキャリア統計を比較して、差分スコアを生成することができる。数値ではないデータについて、差分スコアは、カテゴリ的値間の所定のマッピングに基づいてもよい(例えば、フランスの俳優は、中国の俳優よりもベルギーの俳優に類似していると見なされてもよい)。考慮される各要因の寄与は、その意義に基づいて重み付けされ得る。したがって、類似の人口統計学的背景を有する俳優および彼らのキャリアにおける類似点の俳優は、一般的に、高い類似性スコア(低い距離に対応する)を有するが、異なるキャリア軌道を有する異なる人口統計学的背景の俳優は、一般的に、より低い類似性スコア(より高い距離に対応する)を有する。
【0024】
別の実施形態では、類似映画識別モジュール240は、選択された映画の特徴ベクトルと映画データ210内の各映画の特徴ベクトルとの間の距離を計算する。数値でない特徴の場合、2つの値の間の距離は、所定の距離のルックアップテーブルを使用して判定されてもよい。例えば、ジャンルの場合、空想科学小説とファンタジーとの間の距離は、第1の値(例えば、1)に設定され、一方、空想科学小説とドキュメンタリーとの間の距離は、第2の、より高い値(例えば、10)に設定され得る。
【0025】
さらなる実施形態では、類似映画のセットは、ニューラルネットワークのような機械学習モデルを使用して選択される。機械学習モデルは、類似および異なる映画の例を含む人間ラベルのトレーニングデータを提供することによって、実行時間の前にトレーニングされる。ラベルは、バイナリ(類似または非類似)であってもよく、または類似性スコア(例えば、5点満点 )を示してもよい。機械学習モデルは、トレーニングデータに適用され、モデルによって提供される出力がしきい値許容範囲内で人間が生成したラベルと一致するまで(例えば、誤差逆伝播法を介して)更新される。学習されると、モデルは、選択された映画および候補映画の特徴ベクトルを入力として使用する。モデルは、選択された映画と候補映画がどの程度類似しているかを示す距離を出力する。
【0026】
使用される特定の方法にかかわらず、類似映画識別モジュール240は、選択された映画からの距離に基づいて、類似映画のセットを選択する。一実施形態では、所与の映画は、距離が類似性しきい値未満である場合、類似映画のセットに含まれる。あるいは、映画のセットは、距離が最も低いN個の映画をセットに含めた固定サイズ、N、であってもよい。
【0027】
いくつかの実施形態では、映画データ210内の各映画の距離を計算するのではなく、類似映画識別モジュール240は、1つまたは複数の特徴に基づいて、第1のフィルタを行う。例えば、同一(または密接に関連する)ジャンル内の映画のみが、映画のセットに含まれる資格があると見なされ得る。その後、類似映画識別モジュール240は、フィルタを通過する各映画の距離スコアを計算する。これにより、多数の映画が映画データ260に含まれる場合の処理能力要件が低減され得る。あるいは、類似映画のセットは、1つまたは複数のフィルタを適用することによって、フィルタリングを通じて完全に識別され得る。
【0028】
統計生成モジュール250は、類似映画のセットに基づいて、パフォーマンス統計を計算する。一実施形態では、パフォーマンス統計は、興行収入に対する予算のメトリック、国内割合のメトリック、および平均第1の週末乗数を含む。他の実施形態では、パフォーマンス統計は、異なるおよび/または追加のメトリックを含み得る。例えば、映画のメトリックには、全体的に映画を上映した劇場の数、劇場ごとの全体的な収益、公開週末に映画を上映した劇場の数、公開週末に劇場ごとの収益、映画が劇場で上映された期間、映画が劇場で上映された日付などが含まれる。
【0029】
興行収入に対する予算のメトリックは、映画の全世界の興行収入と類似映画のセットの予算との間の平均比率の指標である。興行収入メトリックに対する予算は、世界の興行収入(例えば、パフォーマンスメトリック316に示されるように)を、セット内の各映画の予算(例えば、特徴314に示されるように)で割り、結果の比率を合計し、セット内の映画の数で割ることによって計算され得る。
【0030】
国内割合メトリックは、国内(米国など)の興行収入から構成されるセット内の映画の全世界の興行収入の平均割合の指標である。いくつかの実施形態では、パフォーマンス予測システム110は、予測を生成する目的で国内とみなされる国をユーザーが選択できるようにするユーザーインターフェースを提供し得る。国内割合メトリックは、国内の興行収入をセット内の各映画の全世界の興行収入で割り、結果の比率を合計し、セット内の映画の数で割ることによって計算され得る。
【0031】
平均第1の週末乗数は、公開週末の上映するセット内の映画とそれらの全体のパフォーマンスに対する指標である。歴史的に、映画は、異なる国で異なる日に公開されていた。したがって、第1の週末の平均乗数は、国内のパフォーマンスに基づく場合がある。そのような場合、平均第1の週末乗数は、セット内の各映画の公開週末の国内興行収入の合計を国内興行収入で割り、結果の比率を合計し、セット内の映画の数で割ることによって計算され得る。しかしながら、ますます多くの映画が全世界同時に(または少なくとも多数の国で)公開されているため、この比率は、追加的または代替的に、全世界の興行収入の合計と第1の週末の全世界の興行収入から計算され得る。
【0032】
予測モジュール260は、選択された映画の特徴および類似映画のセットに関するパフォーマンス統計に基づいて、選択された映画のパフォーマンスの予測を生成する。一実施形態では、予測は、合計興行収入、国内興行収入、および公開週末の興行収入の予測を含む。興行収入の合計は、選択された映画の予算を、類似映画のセットから生成された興行収入メトリックに対する予算を乗算することによって予測され得る。国内の興行収入は、予測された合計の興行収入に、類似映画のセットから生成された国内割合メトリックを乗算することによって予測され得る。公開週末の興行収入は、予測される国内(または全世界)の興行収入を、類似映画のセットから生成された第1の週末乗数で割ることによって予測され得る。
【0033】
別の実施形態では、予測モジュール260は、集計される予測された外国パフォーマンスメトリックの単一のセットではなく、いくつかまたはすべての外国市場のための個々の予測を生成し得る。特定の外国市場の予測は、その市場における類似のジャンルおよびフランチャイズの映画の事前のパフォーマンス、ならびに関係する俳優およびその他の個人を考慮に入れることができる。例えば、外国出身の俳優が出演するハリウッド映画(比較的軽微な役割であっても)は、特に、その俳優が本国で特に人気がある場合は、その国の他の類似の映画よりも優れたパフォーマンスを発揮すると予測される場合がある。逆に、同じ映画でも、俳優の国との関係が悪い他の国では、類似映画に比べてパフォーマンスが悪い場合がある。
【0034】
予測モジュール260は、特定のユースケースに合わせて異なるまたは追加の出力を生成し得る。例えば、一実施形態では、予測モデル260は、映画の抱き合わせ販売商品の需要を予測することができる。予測モジュール260は、商品の注文を自動的に行い、販売者の契約を生成し、または商品の予測需要に基づいて1つまたは複数のマーケティングキャンペーンを創作することができる。別の例として、予測モデル260は、映画の映画館の推奨スケジュール(例えば、映画を上映するスクリーンの数および上映期間)を生成し得る。さらなる例として、予測モジュール260は、可能性のある収益を最適化するために映画がいつ公開されるべきかを判定することができ、これは、手動で、または公開をスケジュールするための自動化されたプロセスの一部として実行することができる。
【0035】
さらに別の例では、予測モジュール260は、映画の収益に対する各人の予測される影響を示す映画における各役割(例えば、俳優、監督、作家、キャラクターなど)のための指標を出力し得る。いくつかの場合(例えば、個人が収益に大きな影響を及ぼすと予想される場合)、指標は、収益のドル価値または割合の増加(または減少)である場合がある。他の場合(例えば、個人の影響がかなり小さいと予測される場合)、指標は、その役割の平均(例えば、特定の個人の修正率と役割の修正率の平均の比率)と相対的であり得る。したがって、スタジオは、指標を使用して、プロジェクトのさまざまな役割のために誰を採用するかに関する選択を知らせることができる。さらなる例では、予測モデル260がビデオに直接映画をストリーミングするためのデータにアクセスする場合、それは、劇場公開と並行して、劇場公開の前に、または劇場公開の代わりに、映画のオンデマンドまたはストリーミングバージョンを開始するように推奨を出力する場合がある。他の実施形態では、予測は、選択された映画のパフォーマンスの異なるまたは追加の推定値を含み得る。
【0036】
コンピューティングシステムアーキテクチャ
図4は、ネットワーク化コンピューティング環境100において、(例えば、パフォーマンス予測システム110またはクライアントデバイス140として)使用するのに適した例示的なコンピュータ400を示す高レベルのブロック図である。例示的なコンピュータ400は、チップセット404に結合された少なくとも1つのプロセッサ402を含む。チップセット404は、メモリコントローラーハブ420および入力/出力(I/O)コントローラーハブ422を含む。メモリ406およびグラフィックスアダプタ412は、メモリコントローラーハブ420に結合され、ディスプレイ418は、グラフィックスアダプタ412に結合される。ストレージデバイス408、キーボード410、ポインティングデバイス414、およびネットワークアダプタ416は、I/Oコントローラーハブ422に結合される。コンピュータ400の他の実施形態は、異なるアーキテクチャを有する。
【0037】
図4に示す実施形態では、ストレージデバイス408は、ハードドライブ、コンパクトディスク読み取り専用メモリ(CD-ROM)、DVD、またはソリッドステートメモリデバイスなどの非一時的なコンピュータ可読記憶媒体である。メモリ406は、プロセッサ402によって使用される命令およびデータを保持する。ポインティングデバイス414は、マウス、トラックボール、タッチスクリーン、または他のタイプのポインティングデバイスであり、コンピュータシステム400にデータを入力するためにキーボード410(オンスクリーンキーボードでもよい)と組み合わせて使用される。グラフィックスアダプタ412は、ディスプレイデバイス418上に画像および他の情報を表示する。ネットワークアダプタ416は、コンピュータシステム400を1つまたは複数のコンピュータネットワーク(例えば、ネットワーク130)に結合する。
【0038】
図1から3のものによって使用されるコンピュータのタイプは、実施形態およびものによって必要とされる処理能力に応じて変化し得る。例えば、映画データ260は、説明された機能を提供するために共に働く複数のブレードサーバーを含む分散型データベースシステムに記憶され得る。さらに、コンピュータに、キーボード410、グラフィックスアダプタ412、およびディスプレイ418のような上述のコンポーネントの一部が欠くことができる。
【0039】
例示的な方法
図5は、映画のパフォーマンスを予測するための方法500の一実施形態を図示する。図5のステップは、方法500を実行するパフォーマンス予測システム110の観点から図示される。しかしながら、ステップの一部またはすべては、他のものまたはコンポーネントによって実行され得る。加えて、いくつかの実施形態は、ステップを並行して実行してもよく、ステップを異なる順序で実行してもよく、または異なるステップを実行してもよい。例えば、映画のパフォーマンス統計は、パフォーマンス予測システム110が、必要に応じて、映画のパフォーマンス統計にアクセスすることで(例えば、映画データ210の一部として)事前に計算され、記憶され得る。
【0040】
図5に示される実施形態では、方法500は、パフォーマンス予測システム110が映画の選択を受信する510ことから始まる。方法500の記述の残りの部分について、要求は、明確さおよび利便性のためにクライアントデバイス140から受信されたと仮定される。しかしながら、前述したように、要求は、またパフォーマンス予測システム110におけるユーザー入力を介して提供されてもよい。
【0041】
パフォーマンス予測システム110は、選択された映画の特徴を識別する520。例えば、特徴には、予算、ジャンル、ターゲット人口統計、関連する知的財産、キャスト、映画の目標、および公開日が含まれる場合がある。一実施形態では、パフォーマンス予測システム110は、選択された映画の特徴が映画データ210内で既に利用可能であるかどうかを確認する。例えば、ユーザーが以前に同じ映画の予測を要求した場合、パフォーマンス予測システム110は、その時点で特徴を記憶していてもよい。特徴が映画データ210で利用できない場合、パフォーマンス予測システム110は、それらをサードパーティサーバ120から取得し、(例えば、ユーザーのクライアントデバイス140に要求を送信することによって)ユーザーからそれらを勧誘し、または任意の他の適切な方法でそれらを取得し得る。あるいは、パフォーマンス予測システム110は、特徴に関する1つまたは複数のソース(例えば、映画データ210および所定のサードパーティサーバ120)を確認し、特徴が利用可能でない場合、エラーをクライアントデバイス140に返還し得る。
【0042】
選択された映画の特徴に基づいて、パフォーマンス予測システム110は、類似映画のセットを識別する530。前述のように、セットは、固定サイズ(例えば、システム構成またはユーザーが選択したパラメータに応じて、5~20個の最も類似する映画)であり得るか、または選択した映画の特徴ベクトルとのしきい値差未満の特徴ベクトルを有するなど、所定のメトリックを満たす任意の映画を含み得る。
【0043】
パフォーマンス予測システム110は、類似映画のセットについてのパフォーマンス統計を計算する540。例えば、類似の各映画のパフォーマンス統計は、前述の興行収入に対する予算のメトリック(合計の全世界の興行収入を合計の予算で割ったもの)、国内の割合メトリック(国内の興行収入を全世界の興行収入で割ったもの)、および平均第1の週末の乗数(国内の興行収入を国内の公開週末の興行収入で割ったもの)であり得る。一実施形態では、パフォーマンス予測システム110は、セット内の各映画に関するデータ(例えば、予算およびパフォーマンスメトリック316)を映画データ210から検索する。パフォーマンス予測システム110は、検索されたデータに基づいて、パフォーマンス統計を計算する540。例えば、パフォーマンス予測システム110は、各メトリックの平均値であるセットのパフォーマンス統計を用いて、セット内の映画ごとに前述のメトリックのそれぞれを計算することができる。平均または加重平均(例えば、セット内の各映画に割り当てられた重みは、その映画の選択された映画との類似性に基づいている)を含む様々なタイプの平均を使用してもよい。
【0044】
パフォーマンス予測システム110は、パフォーマンス統計に基づいて、選択された映画のパフォーマンスを予測する550。一実施形態では、前述のように、パフォーマンス予測は、合計の興行収入、国内の興行収入、および公開週末の興行収入の3つの要素を含む。どの市場が国内市場と見なされるかは、固定されている場合もあれば、ユーザーによって選択される場合もある。予測は、(例えば、映画データ210内に)記憶されてよい。このようにして、パフォーマンス予測システム110が、選択された映画のパフォーマンスの予測のための別の要求を受信する場合、記憶された予測が使用され得る。あるいは、特定のメトリックが満たされた場合(例えば、新しい要求が受信されるたびに、記憶された予測が過去に指定された時間を超えて生成された場合、指定された数を超える映画が映画データ210に追加された場合など)、新しい予測が生成され得る。そのような場合、ユーザーインターフェースは、ユーザー(例えば、クライアントデバイス140において)が複数の予測、平均予測、時間の経過とともに予測がどのように進化したかなどを表示できるようにするためのユーザー インターフェースを提供することができる。
【0045】
それがどのように生成されるかの詳細にかかわらず、パフォーマンス予測システム110は、提示のための予測を提供する560。様々な実施形態では、パフォーマンス予測システム110は、予測(例えば、予測の各要素の値)を説明するデータを、要求が発信元であるクライアントデバイス140に送信する。クライアントデバイス140は、予測をユーザーに提示する。あるいは、予測は、ユーザーに関連する代替の通信チャネルを介して、ユーザーに送信される。例えば、予測は、電子メール、インスタントメッセージ、テキストメッセージなどを介してユーザーに送信され得る。一実施形態では、ユーザーは、予測を要求するときに、予測のための配信方法を選択し得る。
【0046】
追加的な考慮事項
上述のいくつかの部分は、アルゴリズムプロセスまたは動作の観点から実施形態を説明する。これらのアルゴリズムの説明および表現は、データ処理技術の当業者が、その作業の内容を他の当業者に効果的に伝えるために一般的に使用されている。これらの動作は、機能的、計算的、または論理的に説明されている一方で、プロセッサまたは等価電気回路、マイクロコードなどによる実行のための命令を含むコンピュータプログラムによって実装されると理解される。さらに、また、普遍性を失うことなく、時にはこれらの機能操作の配置をモジュールと呼ぶことが便利な場合もある。
【0047】
本明細書で使用される場合、「一実施形態」または「一実施形態」への言及は、その実施形態に関連して説明される特定の要素、特徴、構造、または特性が少なくとも一実施形態に含まれることを意味する。本明細書の様々な箇所に現れる「一実施形態において」という語句は、必ずしもすべてが同じ実施形態を指しているとは限らない。
【0048】
本明細書で使用される場合、用語「備える」、「備えること」、「含む」、「含むこと」、「有する」、「有すること」、またはそれらの他の変形は、非排他的な包含をカバーすることを意図している。例えば、要素のリストを備えるプロセス、方法、条項、もしくは装置は、必ずしもそれらの要素のみに限定されるのではなく、そのようなプロセス、方法、条項、もしくは装置に明示的に記載されていない、または内在する他の要素を含む場合がある。さらに、反対のことが明確に述べられていない限り、「または」は排他的またはではなく、包括的またはを指す。例えば、条件AまたはBは、以下のいずれか1つによって満たされる。Aは真(または存在する)およびBは偽(または存在しない)、Aは偽(または存在しない)およびBは真(または存在する)、ならびに、AおよびBの両方が真(または存在する)。
【0049】
さらに、「a」または「an」の使用は、本明細書における実施形態の要素およびコンポーネントを説明するために採用される。これは、単に便宜上、および開示の一般的な意味を付与するために行われているに過ぎない。この説明は、1つまたは少なくとも1つを含むと読まれるべきであり、また、別の意味であることが明らかでない限り、単数形は複数形も含む。値が「約」または「実質的に」(またはそれらの派生物)として説明される場合、文脈から別の意味が明らかでない限り、そのような値は正確な+/-10%と解釈されるべきである。例から、「約10」は、「9~11の範囲内」を意味すると理解されるべきである。
【0050】
この開示を読めば、当業者は、映画のパフォーマンスを予測するためのシステムおよびプロセスのためのさらに追加の代替の構造的および機能的設計を理解するであろう。したがって、特定の実施形態および用途が図示および説明されてきたが、説明された主題は、本明細書に開示される正確な構造および構成要素に限定されず、当業者に明らかであろう様々な修正、変更、および変形が、開示される方法および装置の配置、動作および詳細において行われ得ることを理解されたい。保護の範囲は、以下の特許請求の範囲によってのみ制限されるべきである。
図1
図2
図3
図4
図5
【国際調査報告】