(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-12-14
(45)【発行日】2022-12-22
(54)【発明の名称】自動メディア出版
(51)【国際特許分類】
H04N 21/854 20110101AFI20221215BHJP
H04N 5/262 20060101ALI20221215BHJP
H04N 21/4402 20110101ALI20221215BHJP
H04N 5/91 20060101ALI20221215BHJP
【FI】
H04N21/854
H04N5/262 080
H04N21/4402
H04N5/91
【外国語出願】
(21)【出願番号】P 2019120940
(22)【出願日】2019-06-28
【審査請求日】2019-08-09
(32)【優先日】2018-07-02
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2018-07-23
(33)【優先権主張国・地域又は機関】US
【前置審査】
(73)【特許権者】
【識別番号】500035823
【氏名又は名称】アビッド テクノロジー インコーポレイテッド
(74)【代理人】
【識別番号】100118902
【氏名又は名称】山本 修
(74)【代理人】
【識別番号】100106208
【氏名又は名称】宮前 徹
(74)【代理人】
【識別番号】100196508
【氏名又は名称】松尾 淳一
(74)【代理人】
【識別番号】100173565
【氏名又は名称】末松 亮太
(72)【発明者】
【氏名】シャイレンドラ・マートル
【審査官】鈴木 順三
(56)【参考文献】
【文献】米国特許出願公開第2013/0275312(US,A1)
【文献】米国特許出願公開第2007/0239787(US,A1)
【文献】米国特許出願公開第2010/0165112(US,A1)
【文献】特表2012-501099(JP,A)
【文献】特表2009-524294(JP,A)
【文献】特表2005-513831(JP,A)
【文献】米国特許出願公開第2013/0216206(US,A1)
【文献】もと たかし,ノンリニア編集アプリケーション Avid Media Composer7 テストレポート,ビデオα,2013年9月号,2013年09月01日,p28-36
(58)【調査した分野】(Int.Cl.,DB名)
H04N 21/00 - 21/858
H04N 5/262 - 5/28
H04N 5/76 - 5/956
(57)【特許請求の範囲】
【請求項1】
メディア・コンポジションを編集する方法であって、
メディア合成ホスト・システムにおいて実行するメディア合成アプリケーションを使用して、編集者が、
前記メディア・コンポジションを編集し、前記メディア・コンポジションが合成オブジェクトを含み、前記合成オブジェクトがソース・メディア・アセットを参照し、
前記合成オブジェクトに対して編集レンディション規則を指定し、
前記編集レンディション規則が、メディア・エッセンス・エンコーディング・パラメータの複数の値のそれぞれの値毎に、前記合成オブジェクトがどのようにレンダリングされるかを指定し、
前記編集レンディション規則を前記メディア・コンポジションの前記合成オブジェクトと関連付ける、
ことを可能にするステップと、
所与のメディア・コンポジションのレンディションが生成されるとき、レンディション・エンジンが、
前記所与のメディア・コンポジション
を受け、
前記所与のメディア・コンポジションが、前記編集者が指定し前記所与のメディア・コンポジションの合成オブジェクトと関連付け
た編集レンディション規則
を含み、
前記所与のメディア・コンポジションのレンディションに対して、
前記メディア・エッセンス・エンコーディング・パラメータ
の所与の値を指定するレンディション・プロファイルを受け、
前記所与のメディア・コンポジションのソース・メディア・アセットを入力し、
前記メディア・エッセンス・エンコーディング・パラメータの所与の値が前記合成オブジェクトに適用されるときに、前記所与のメディア・コンポジションの前記編集レンディション規
則にしたがって、前記所与のメディア・コンポジションのソース・メディア・アセットから、前記所与のメディア・コンポジションのレンディションを生成する、
ステップとを含む、方法。
【請求項2】
請求項1記載の方法において、前記メディア合成アプリケーションが、前記レンディション・エンジンを含む、方法。
【請求項3】
請求項1記載の方法において、前記レンディション・エンジンが、前記メディア合成ホスト・システムの外部にあるプラットフォーム上にホストされる、方法。
【請求項4】
請求項1記載の方法において、前記レンディション・プロファイルが、前記所与のメディア・コンポジションのレンディションを生成するために使用されるべき前記所与のメディア・コンポジションのバージョンを指定する、方法。
【請求項5】
請求項1記載の方法において、前記編集者が指定し前記所与のメディア・コンポジションの合成オブジェクトと関連付け
た前記編集レンディション規則が、空間編集レンディション規則であり、前記レンディション・プロファイルによって指定された前記メディア・エッセンス・エンコーディング・パラメータの少なくとも1つが、空間レンディション・パラメータである、方法。
【請求項6】
請求項5記載の方法において、前記空間レンディション・パラメータが、前記所与のメディア・コンポジションの前記合成オブジェクトのビデオ・フレームの一部分を定めるフレーミング・ボックスであり、前記レンディション・エンジンが、前記フレーミング・ボックス内に存在する前記所与のメディア・コンポジションの前記ソース・メディア・アセットの第1部分を、優先して前記レンディションに含ませる、方法。
【請求項7】
請求項6記載の方法において、前記レンディションに対するターゲット・ディスプレイのアスペクト比が、前記フレーミング・ボックスのアスペクト比よりも大きく、前記レンディション・エンジンが、更に、前記フレーミング・ボックスの外側にある前記所与のメディア・コンポジションの前記ソース・メディア・アセットの第2部分を、優先して前記レンディションに含ませ、前記所与のメディア・コンポジションの前記ソース・メディア・アセットの前記第2部分が、メディア・エッセンス・データを含む、方法。
【請求項8】
請求項1記載の方法において、前記編集者が指定し前記所与のメディア・コンポジションの合成オブジェクトと関連付け
た前記編集レンディション規則が、時間編集レンディション規則であり、前記レンディション・プロファイルによって指定された前記メディア・エッセンス・エンコーディング・パラメータの少なくとも1つが、時間レンディション・パラメータである、方法。
【請求項9】
請求項8記載の方法において、前記時間レンディション・パラメータが、前記所与のメディア・コンポジションの前記ソース・メディア・アセット内に時間範囲を定める時間フレーミング・レンジを含み、前記レンディション・エンジンのロジックが、前記時間フレーミング・レンジ内に存在する前記所与のメディア・コンポジションの前記ソース・メディア・アセットの時間部分を、優先して前記レンディションに含ませる、方法。
【請求項10】
請求項1記載の方法において、前記編集者が指定し前記所与のメディア・コンポジションの前記合成オブジェクトと関連付け
た前記編集レンディション規則が、ダイナミック・レンジ編集レンディション規則であり、前記レンディション・プロファイルによって指定された前記メディア・エッセンス・エンコーディング・パラメータの少なくとも1つが、ダイナミック・レンジ・レンディション・パラメータである、方法。
【請求項11】
請求項10記載の方法において、前記所与のメディア・コンポジションの前記ソース・メディア・アセットがビデオ・アセットであり、前記ダイナミック・レンジ・レンディション・パラメータが、前記所与のメディア・コンポジションの前記ソース・メディア・アセット内に画素輝度値の範囲を定めるリーガル・ダイナミック・レンジであり、前記レンディション・エンジンが、前記リーガル・ダイナミック・レンジ内に存在する輝度値を有する前記所与のメディア・コンポジションの前記ソース・メディア・アセットの画素を、優先して前記レンディションに含ませる、方法。
【請求項12】
請求項10記載の方法において、前記所与のメディア・コンポジションの前記ソース・メディア・アセットがオーディオ・アセットであり、前記ダイナミック・レンジ・レンディション・パラメータが、前記所与のメディア・コンポジションの前記ソース・メディア・アセット内のオーディオ・サンプル強度値の範囲を定めるリーガル・ダイナミック・レンジであり、前記レンディション・エンジンが、前記リーガル・ダイナミック・レンジ内に存在する強度値を有する前記所与のメディア・コンポジションの前記ソース・メディア・アセットのオーディオ・サンプルを、優先して前記レンディションに含ませる、方法。
【請求項13】
請求項1記載の方法において、前記編集者が指定し前記所与のメディア・コンポジションの合成オブジェクトと関連付け
た前記編集レンディション規則が、色編集レンディション規則であり、前記レンディション・プロファイルによって指定された前記メディア・エッセンス・エンコーディング・パラメータの少なくとも1つが、色域レンディション・パラメータである、方法。
【請求項14】
請求項13記載の方法において、
前記所与のメディア・コンポジションの前記ソース・メディア・アセットが、グラフィクス・アセットおよびビデオ・アセットの内の1つであり、
前記色域レンディション・パラメータが、多次元色空間内に多次元領域を定めるリーガル・カラー・レンジを含み、
前記レンディション・エンジンが、前記リーガル・カラー・レンジ内に存在する色値を有する前記所与のメディア・コンポジションの前記ソース・メディア・アセットの画素を、優先して前記レンディションに含ませる、方法。
【請求項15】
請求項1記載の方法において、
前記編集者が指定し前記所与のメディア・コンポジションの合成オブジェクトと関連付け
た前記編集レンディション規則が、前記レンディションのフレーム上におけるタイトル・テキストのレイアウトのための空間編集レンディション規則であり、
少なくとも1つのメディア・エッセンス・エンコーディング・パラメータが、空間フレーミング・ボックスであり、
前記所与のメディア・コンポジションの前記ソース・メディア・アセットが、テキスト・タイトリング・エフェクトであり、
前記レンディション・エンジンが、前記レンディションのフレーム上の前記空間フレーミング・ボックス内に、前記テキスト・タイトリング・エフェクトのテキストをレンダリングする、方法。
【請求項16】
請求項1記載の方法において、
前記編集者が指定し前記所与のメディア・コンポジションの合成オブジェクトと関連付け
た前記編集レンディション規則が、コンポジション編集レンディション規則であり、
少なくとも1つのメディア・エッセンス・エンコーディング・パラメータが、空間フレーミング・ボックスであり、
前記所与のメディア・コンポジションの前記ソース・メディア・アセットが、合成エフェクトであり、
前記レンディション・エンジンが、合成画像を有する前記レンディションのフレームを前記空間フレーミング・ボックス内にレンダリングする、方法。
【請求項17】
請求項1記載の方法において、前記レンディション・プロファイル、および前記編集者が指定し前記所与のメディア・コンポジションの合成オブジェクトと関連付け
た前記編集レンディション規則は、前記レンディション・エンジンが標準化された形態で受け取り、前記レンディション・エンジンが、規則を実行するための包括的ロジックを含む、方法。
【請求項18】
請求項1記載の方法において、前記レンディション・エンジンが、深層学習方法を使用して、広範囲のメディア・コンテンツ、ソース・メディア・タイプ、およびレンディション要件を扱う作業をする編集者の集団から取り込んだ編集レンディション判断から学習させるロジックを含む、方法。
【請求項19】
コンピュータ・プログラムであって、
コンピュータ・プログラム命令が格納された非一時的コンピュータ読み取り可能ストレージを含み、前記コンピュータ・プログラム命令がコンピュータによって処理されると、前記コンピュータに、メディア・コンポジションを編集する方法を実行するように命令し、前記方法が、
メディア合成ホスト・システムにおいて実行するメディア合成アプリケーションを使用して、編集者が、
前記メディア・コンポジションを編集し、前記メディア・コンポジションが合成オブジェクトを含み、前記合成オブジェクトがソース・メディア・アセットを参照し、
前記合成オブジェクトに対して編集レンディション規則を指定し、
前記編集レンディション規則が、メディア・エッセンス・エンコーディング・パラメータの複数の値のそれぞれの値毎に、前記合成オブジェクトがどのようにレンダリングされるかを指定し、
前記編集レンディション規則を前記メディア・コンポジションの前記合成オブジェクトと関連付ける、
ことを可能にするステップと、
所与のメディア・コンポジションのレンディションが生成されるとき、レンディション・エンジンが、
前記所与のメディア・コンポジション
を受け、
前記所与のメディア・コンポジションが、前記編集者が指定し前記所与のメディア・コンポジションの合成オブジェクトと関連付け
た編集レンディション規則
を含み、
前記所与のメディア・コンポジションのレンディションに対して、
前記メディア・エッセンス・エンコーディング・パラメータ
の所与の値を指定するレンディション・プロファイルを受け、
前記所与のメディア・コンポジションのソース・メディア・アセットを入力し、
前記メディア・エッセンス・エンコーディング・パラメータの所与の値が前記合成オブジェクトに適用されるときに、前記所与のメディア・コンポジションの前記編集レンディション規
則にしたがって、前記所与のメディア・コンポジションのソース・メディア・アセットから、前記所与のメディア・コンポジションのレンディションを生成する、
ステップとを含む、コンピュータ・プログラム。
【請求項20】
メディア・コンポジション編集システムであって、
コンピュータ読み取り可能命令を格納するためのメモリと、
前記メモリに接続されたプロセッサと、
を含み、前記プロセッサが、前記コンピュータ読み取り可能命令を実行すると、前記メディア・コンポジション編集システムに、
メディア合成アプリケーションを使用して、編集者が、
メディア・コンポジションを編集し、前記メディア・コンポジションが合成オブジェクトを含み、前記合成オブジェクトがソース・メディア・アセットを参照し、
前記合成オブジェクトに対して編集レンディション規則を指定し、
前記編集レンディション規則が、メディア・エッセンス・エンコーディング・パラメータの複数の値のそれぞれの値毎に、前記合成オブジェクトがどのようにレンダリングされるかを指定し、
前記編集レンディション規則を前記メディア・コンポジションの前記合成オブジェクトと関連付け
る、
ことを可能にさせ、
所与のメディア・コンポジションのレンディションが生成されるとき、レンディション・エンジンが、
前記所与のメディア・コンポジション
を受け、
前記所与のメディア・コンポジションが、前記編集者が指定し前記所与のメディア・コンポジションの合成オブジェクトと関連付け
た編集レンディション規則
を含み、
前記所与のメディア・コンポジションのレンディションに対して、
前記メディア・エッセンス・エンコーディング・パラメータ
の所与の値を指定するレンディション・プロファイルを受け、
前記所与のメディア・コンポジションのソース・メディア・アセットを入力し、
前記メディア・エッセンス・エンコーディング・パラメータの所与の値が前記合成オブジェクトに適用されるときに、前記所与のメディア・コンポジションの前記編集レンディション規
則にしたがって、前記所与のメディア・コンポジションの前記ソース・メディア・アセットから、前記所与のメディア・コンポジションのレンディションを生成する、
メディア・コンポジション編集システム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願に対する相互引用
[001] 本願は、35U.S.C.§120に基づく優先権および権利を主張し、2018年7月2日に出願された係属中の米国特許出願第10/025,043号の継続出願である。この特許出願をここで引用したことにより、その内容は本願にも含まれるものとする。
【従来技術】
【0002】
[002] メディアは、劇場、事務所、家庭、および多くの他の会場において世界中で消費されている。メディアは、大型の固定画面上、ハンドヘルド移動体デバイス上、および広範囲にわたる中間プラットフォーム上で視聴される。メディア消費設定値およびプラットフォームの数が増えるに連れて、メディアがコンシューマに配信されることが意図された会場やプラットフォームの各々に適したバージョンおよびフォーマットで、メディア・コンテンツの所与の品目が配信されることに対する要望が増えつつある。更に、出版および流通の手段も多様になっている。その結果、所与のメディア・プロジェクトが、数十、または百を超える異なる成果物(deliverable)を求めることもある。
【発明の概要】
【発明が解決しようとする課題】
【0003】
[003] 今日のメディア出版ワークフローは、時間がかかり、複雑であり、誤りが発生しやすく、その場しのぎである。メディアの作成に関与するものは、少量のバージョン、レンディッション(rendition)、および消費媒体(vehicle)しか要求されないときには、このような非効率性に対処することができたが、このような方法は、所与のメディア・プロジェクトに対する成果物が多様になるに連れて、扱い難くなりそして費用がかかり過ぎるようになった。加えて、メディア作成のストーリテリング(story-telling)段階に関与する創作編集者(creative editor)は、彼らの創作的選択を下流のレンダリング・プロセスにおいて表現する能力を有していない。したがって、メディア作成および出版パイプラインは、コンテンツを広げメディア成果物の技術的品質を高め、更に生産性を押し上げてコストを制御する新たな手法を必要としている。
【課題を解決するための手段】
【0004】
[0004] 概略的に、本明細書において説明する方法、システム、およびコンピュータ・プログラム製品は、メディア作成および出版ワークフローの部分の正当化(rationalization)および自動化を可能にする。編集プロセスの任意の段階において、編集者には、合成オブジェクトを規則とタグ付けする手段が提供される。規則は、レンディション・プロファイルによって指定された通りの出力レンダリングを可能な限り最良の品質で生成しつつ、編集者のレンディション関連選択を忠実に守るようにするには、どのようなレンダリングの判断を行い、どのように入力ソースを扱うべきか指定する。これらのタグは、コンポジションをレンダリングするときに、レンディション・エンジンによって下流において解釈される規則を規定する(provide)。これらの規則は、レンディション要件を指定する1組のプロファイルに応答して、どのようにレンディションを生成すべきか指定する。
【0005】
[0005] 概略的に、1つの態様において、メディア・コンポジションを編集する方法は、メディア合成ホスト・システムにおいて実行するメディア合成アプリケーションを使用して、編集者が、メディア・コンポジションを編集し、メディア・コンポジションが合成オブジェクトを含み、合成オブジェクトがソース・メディア・アセットを参照し、合成オブジェクトに対して編集レンディション規則を指定し、編集レンディション規則をメディア・コンポジションの合成オブジェクトと関連付けることを可能にするステップと、所与のメディア・コンポジションのレンディションが生成されるとき、レンディション・エンジンが、所与のメディア・コンポジションと、編集者が指定し所与のメディア・コンポジションの合成オブジェクトと関連付けられた編集レンディション規則とを受け、所与のメディア・コンポジションのレンディションに対して、メディア・エッセンス・エンコーディング・パラメータを指定するレンディション・プロファイルを受け、所与のコンポジションのソース・メディア・アセットを入力し、所与のコンポジションの編集レンディション規則、および所与のコンポジションのレンディションに対するメディア・エッセンス・エンコーディング・パラメータにしたがって、所与のメディア・コンポジションのソース・メディア・アセットから、所与のメディア・コンポジションのレンディションを生成するステップとを含む。
【0006】
[0006] 種々の実施形態は、以下の特徴の内1つ以上を含む。メディア合成アプリケーションが、レンディション・エンジンを含む。レンディション・エンジンが、メディア合成ホストの外部にあるプラットフォーム上にホストされる。レンディション・プロファイルが、所与のコンポジションのレンディションを生成するために使用されるべき所与のメディア・コンポジションのバージョンを指定する。編集者が指定し所与のメディア・コンポジションの合成オブジェクトと関連付けられた編集レンディション規則が、空間編集レンディション規則であり、レンディション・プロファイルによって指定されたメディア・エッセンス・エンコーディング・パラメータの少なくとも1つが、空間レンディション・パラメータである。空間レンディション・パラメータが、所与のメディア・コンポジションの合成オブジェクトのビデオ・フレームの一部分を定めるフレーミング・ボックスであり、レンディション・エンジンが、フレーミング・ボックス内に存在する所与のコンポジションのソース・メディア・アセットの第1部分を、優先してレンディションに含ませる。レンディションに対するターゲット・ディスプレイのアスペクト比が、フレーミング・ボックスのアスペクト比よりも大きく、レンディション・エンジンが、更に、フレーミング・ボックスの外側にある所与のコンポジションのソース・メディア・アセットの第2部分を、優先してレンディションに含ませ、所与のメディア・コンポジションのソース・メディア・アセットの第2部分が、メディア・エッセンス・データを含む。編集者が指定し所与のメディア・コンポジションの合成オブジェクトと関連付けられた編集レンディション規則が、時間編集レンディション規則であり、レンディション・プロファイルによって指定されたメディア・エッセンス・エンコーディング・パラメータの少なくとも1つが、時間レンディション・パラメータである。時間レンディション・パラメータが、所与のコンポジションのソース・メディア・アセット内に時間範囲を定める時間フレーミング・レンジを含み、レンディション・エンジンのロジックが、時間フレーミング・レンジ内に存在する所与のメディア・コンポジションのソース・メディア・アセットの時間部分を、優先してレンディションに含ませる。編集者が指定し所与のメディア・コンポジションの合成オブジェクトと関連付けられた編集レンディション規則が、ダイナミック・レンジ編集レンディション規則であり、レンディション・プロファイルによって指定されたメディア・エッセンス・エンコーディング・パラメータの少なくとも1つが、ダイナミック・レンジレンディション・パラメータである。所与のコンポジションのソース・メディア・アセットがビデオ・アセットであり、ダイナミック・レンジ・レンディション・パラメータが、所与のコンポジションのソース・メディア・アセット内に画素輝度(brightness)値の範囲を定めるリーガル・ダイナミック・レンジであり、レンディション・エンジンが、リーガル・レンジ内に存在する輝度値を有する所与のコンポジションのソース・メディア・アセットの画素を、優先してレンディションに含ませる。所与のコンポジションのソース・メディア・アセットがオーディオ・アセットであり、ダイナミック・レンジ・レンディション・パラメータが、所与のコンポジションのソース・メディア・アセット内のオーディオ・サンプル強度値の範囲を定めるリーガル・ダイナミック・レンジであり、レンディション・エンジンが、リーガル・レンジ内に存在する強度値を有する所与のコンポジションのソース・メディア・アセットのオーディオ・サンプルを、優先してレンディションに含ませる。編集者が指定し所与のメディア・コンポジションの合成オブジェクトと関連付けられた編集レンディション規則が、色編集レンディション規則であり、レンディション・プロファイルによって指定されたメディア・エッセンス・エンコーディング・パラメータの少なくとも1つが、色域レンディション・パラメータである。所与のコンポジションのソース・メディア・アセットが、グラフィクス・アセットおよびビデオ・アセットの内の1つであり、色域レンディション・パラメータが、多次元色空間内に多次元領域を定めるリーガル・カラー・レンジを含み、レンディション・エンジンが、リーガル・カラー・レンジ内に存在する色値を有する所与のコンポジションのソース・メディア・アセットの画素を、優先してレンディションに含ませる。編集者が指定し所与のメディア・コンポジションの合成オブジェクトと関連付けられた編集レンディション規則が、レンディションのフレーム上におけるタイトル・テキストのレイアウトのための空間編集レンディション規則であり、少なくとも1つのメディア・エッセンス・エンコーディング・パラメータが、空間フレーミング・ボックスであり、所与のコンポジションのソース・メディア・アセットが、テキスト・タイトリング・エフェクト(text titling effect)であり、レンディション・エンジンが、レンディションのフレーム上のフレーミング・ボックス内に、テキスト・タイトリング・エフェクトのテキストをレンダリングする。編集者が指定し所与のメディア・コンポジションの合成オブジェクトと関連付けられた編集レンディション規則が、コンポジション編集レンディション規則であり、少なくとも1つのメディア・エッセンス・エンコーディング・パラメータが、空間フレーミング・ボックスであり、所与のコンポジションのソース・メディア・アセットが、合成エフェクト(compositing effect)であり、レンディション・エンジンが、合成画像を有するレンディションのフレームをフレーミング・ボックス内にレンダリングする。レンディション・プロファイル、および編集者が指定し所与のメディア・コンポジションの合成オブジェクトと関連付けられた編集レンディション規則が、レンディション・エンジンによって、標準化された形態で受け取られ、レンディション・エンジンが、規則を実行するための包括的ロジックを含む。レンディション・エンジンが、深層学習方法を使用して、広範囲のメディア・コンテンツ、ソース・メディア・タイプ、およびレンディション要件を扱う作業をする編集者の集団(cohort)から取り込んだ編集レンディション判断から学習されるロジックを含む。
【0007】
[0007] 概略的に、他の態様において、 コンピュータ・プログラム製品は、コンピュータ・プログラム命令が格納された非一時的コンピュータ読み取り可能ストレージを含み、コンピュータ・プログラム命令がコンピュータによって実行されると、コンピュータに、メディア・コンポジションを編集する方法を実行するように命令する。この方法は、メディア合成ホスト・システムにおいて実行するメディア合成アプリケーションを使用して、編集者が、メディア・コンポジションを編集し、メディア・コンポジションが合成オブジェクトを含み、合成オブジェクトがソース・メディア・アセットを参照し、合成オブジェクトに対して編集レンディション規則を指定し、編集レンディション規則をメディア・コンポジションの合成オブジェクトと関連付けることを可能にするステップと、所与のメディア・コンポジションのレンディションが生成されるとき、レンディション・エンジンが、所与のメディア・コンポジションと、編集者が指定し所与のメディア・コンポジションの合成オブジェクトと関連付けられた編集レンディション規則とを受け、所与のメディア・コンポジションのレンディションに対して、メディア・エッセンス・エンコーディング・パラメータを指定するレンディション・プロファイルを受け、所与のコンポジションのソース・メディア・アセットを入力し、所与のコンポジションの編集レンディション規則、および所与のコンポジションのレンディションに対するメディア・エッセンス・エンコーディング・パラメータにしたがって、所与のメディア・コンポジションのソース・メディア・アセットから、所与のメディア・コンポジションのレンディションを生成するステップとを含む。
【0008】
[0008] 概略的に、他の態様において、メディア・コンポジション編集システムは、コンピュータ読み取り可能命令を格納するためのメモリと、このメモリに接続されたプロセッサとを含み、このプロセッサが、コンピュータ読み取り可能命令を実行すると、システムに、システムにおいて実行するメディア合成アプリケーションを使用して、編集者が、メディア・コンポジションを編集し、メディア・コンポジションが合成オブジェクトを含み、合成オブジェクトがソース・メディア・アセットを参照し、合成オブジェクトに対して編集レンディション規則を指定し、編集レンディション規則をメディア・コンポジションの合成オブジェクトと関連付けることを可能にさせ、所与のメディア・コンポジションのレンディションが生成されるとき、レンディション・エンジンが、所与のメディア・コンポジションと、編集者が指定し所与のメディア・コンポジションの合成オブジェクトと関連付けられた編集レンディション規則とを受け、所与のメディア・コンポジションのレンディションに対して、メディア・エッセンス・エンコーディング・パラメータを指定するレンディション・プロファイルを受け、所与のコンポジションのソース・メディア・アセットを入力し、所与のコンポジションの編集レンディション規則、および所与のコンポジションのレンディションに対するメディア・エッセンス・エンコーディング・パラメータにしたがって、所与のメディア・コンポジションのソース・メディア・アセットから、所与のメディア・コンポジションのレンディションを生成する。
【0009】
[0009] 概略的に、他の態様において、メディア・コンポジションのレンディションを生成する方法は、メディア・コンポジションを受けるステップであって、メディア・コンポジションが、ソース・メディア・アセットを参照する合成オブジェクトを含み、合成オブジェクトが、メディア・コンポジションの編集者によって、メディア合成アプリケーションを使用して、指定された編集レンディション規則と関連付けられる、ステップと、メディア・コンポジションのレンディションに対してメディア・エッセンス・エンコーディング・パラメータを指定するレンディション・プロファイルを受けるステップと、編集レンディション規則と、メディア・コンポジションのレンディションに対するメディア・エッセンス・エンコーディング・パラメータとにしたがって、ソース・メディア・アセットから、メディア・コンポジションのレンディションを生成するステップとを含む。
【0010】
[0010] 種々の実施形態は、以下の特徴の内1つ以上を含む。メディア・コンポジションが複数のバージョンを有し、レンディション・プロファイルが、更に、メディア・コンポジションの複数のバージョンの内、コンポジションのレンディションを生成するために使用されるべきバージョンを指定する。 編集レンディション規則が、空間編集レンディション規則であり、レンディション・プロファイルによって指定されるメディア・エッセンス・エンコーディング・パラメータの少なくとも1つが空間レンディション・パラメータである。空間レンディション・パラメータが、メディア・コンポジションの合成オブジェクトのビデオ・フレームの一部分を定めるフレーミング・ボックスであり、コンポジションのソース・メディア・アセットの内、フレーミング・ボックス内に存在する第1部分が、優先してレンディションに含まれる。レンディションに対するターゲット・ディスプレイのアスペクト比が、フレーミング・ボックスのアスペクト比よりも大きく、コンポジションのソース・メディア・アセットの内、フレーミング・ボックスの外側にある第2部分も、優先してレンディションに含まれ、メディア・コンポジションのソース・メディア・アセットの第2部分が、メディア・エッセンス・データを含む。編集レンディション規則が、時間編集レンディション規則であり、レンディション・プロファイルによって指定されたメディア・エッセンス・エンコーディング・パラメータの少なくとも1つが時間レンディション・パラメータである。時間レンディション・パラメータが、コンポジションのソース・メディア・アセット内における時間範囲を定める時間フレーミング・レンジを含み、メディア・コンポジションのソース・メディア・アセットの内、時間フレーミング・レンジ内に存在する時間部分が、優先してレンディションに含まれる。編集レンディション規則が、ダイナミック・レンジ編集レンディション規則であり、レンディション・プロファイルによって指定されたメディア・エッセンス・エンコーディング・パラメータの少なくとも1つが、ダイナミック・レンジ・レンディション・パラメータである。コンポジションのソース・メディア・アセットが、ビデオ・アセットであり、ダイナミック・レンジ・レンディション・パラメータが、コンポジションのソース・メディア・アセット内における画素輝度値の範囲を定めるリーガル・ダイナミック・レンジであり、リーガル・レンジ内に存在する輝度値を有するコンポジションのソース・メディア・アセットの画素が、優先してレンディションに含まれる。コンポジションのソース・メディア・アセットが、オーディオ・アセットであり、ダイナミック・レンジ・レンディション・パラメータが、コンポジションのソース・メディア・アセット内におけるオーディオ・サンプル強度値の範囲を定めるリーガル・ダイナミック・レンジであり、リーガル・レンジ内に存在する強度値を有するコンポジションのソース・メディア・アセットのオーディオ・サンプルが、優先してレンディションに含まれる。編集レンディション規則が、色編集レンディション規則であり、レンディション・プロファイルによって指定されたメディア・エッセンス・エンコーディング・パラメータの少なくとも1つが、色域レンディション・パラメータである。コンポジションが、グラフィクス・アセットおよびビデオ・アセットの内の1つであり、色域レンディション・パラメータが、多次元色空間内における多次元領域を定めるリーガル・カラー・レンジを含み、リーガル・カラー・レンジ内に存在する色値を有するコンポジションのソース・メディア・アセットの画素が、優先してレンディションに含まれる。編集レンディション規則が、レンディションのフレーム上におけるタイトル・テキストのレイアウトに対する空間編集レンディション規則であり、少なくとも1つのメディア・エッセンス・エンコーディング・パラメータが、空間フレーミング・ボックスであり、コンポジションのソース・メディア・アセットがテキスト・タイトリング・エフェクトであり、テキスト・タイトリング・エフェクトのテキストが、レンディションのフレーム上においてフレーミング・ボックス内にレンダリングされる。編集レンディション規則が、コンポジション編集レンディション規則であり、少なくとも1つのメディア・エッセンス・エンコーディング・パラメータが、空間フレーミング・ボックスであり、コンポジションのソース・メディア・アセットが、合成エフェクトであり、フレーミング・ボックス内に合成画像を有するレンディションのフレームがレンダリングされる。生成するステップが、規則を実行するために包括的ロジックを使用して、編集レンディション規則を解釈するステップを含む。生成するステップが、深層学習方法を使用して、広範囲のメディア・コンテンツ、ソース・メディア・タイプ、およびレンディション要件を扱う作業をする編集者の集団から取り込んだ編集レンディション判断から学習されるロジックを実行するステップを含む。
【0011】
[0011] 概略的に、他の態様において、コンピュータ・プログラム製品は、コンピュータ・プログラム命令が格納された非一時的コンピュータ読み取り可能ストレージを含み、コンピュータ・プログラム命令がコンピューティング・システムによって処理されると、コンピューティング・システムに、メディア・コンポジションのレンディションを生成する方法を実行するように命令する。この方法は、メディア・コンポジションを受けるステップであって、メディア・コンポジションが、ソース・メディア・アセットを参照する合成オブジェクトを含み、合成オブジェクトが、メディア・コンポジションの編集者によって、メディア合成アプリケーションを使用して、指定された編集レンディション規則と関連付けられる、ステップと、メディア・コンポジションのレンディションに対してメディア・エッセンス・エンコーディング・パラメータを指定するレンディション・プロファイルを受けるステップと、編集レンディション規則と、メディア・コンポジションのレンディションに対するメディア・エッセンス・エンコーディング・パラメータとにしたがって、ソース・メディア・アセットから、メディア・コンポジションのレンディションを生成するステップとを含む。
【0012】
[0012] 種々の実施形態は、以下の特徴の内1つ以上を含む。コンピューティング・システムは、メディア・コンポジションが受け取られる場所から離れている。コンピューティング・システムはクラウド内に実装される。
【0013】
[0013] 概略的に、他の態様において、メディア合成レンディション・エンジンは、コンピュータ読み取り可能命令を格納するためのメモリと、メモリに接続されたプロセッサとを含む。プロセッサがコンピュータ読み取り可能命令を実行すると、メディア合成レンディション・エンジンに、メディア・コンポジションを受けさせ、メディア・コンポジションが、ソース・メディア・アセットを参照する合成オブジェクトを含み、合成オブジェクトが、メディア・コンポジションの編集者によって、メディア合成アプリケーションを使用して、指定された編集レンディション規則と関連付けられ、メディア・コンポジションのレンディションに対してメディア・エッセンス・エンコーディング・パラメータを指定するレンディション・プロファイルを受けさせ、編集レンディション規則と、メディア・コンポジションのレンディションに対するメディア・エッセンス・エンコーディング・パラメータとにしたがって、ソース・メディア・アセットから、メディア・コンポジションのレンディションを生成させる。
【0014】
[0014] 種々の実施形態は、以下の特徴の内1つ以上を含む。メディア合成レンディション・エンジンは、メディア・コンポジションが受け取られる場所から離れて位置する。メディア合成レンディション・エンジンは、クラウド内に実装される。
【図面の簡単な説明】
【0015】
【
図1】
図1は、説明するメディア出版ワークフローを示す上位ブロック図である。
【
図2】
図2は、編集レンディション規則(editorial rendition rules)とタグ付けされたメディア・コンポジション(media composition)を示す。
【
図3】
図3は、所与のコンポジションに対する1組のレンディション・プロファイルを示す。
【
図4A】
図4Aは、1つのコンポジションからの複数のレンディションの生成を示す。
【
図4B】
図4Bは、複数のバージョンのコンポジションを含むワークフローにおけるレンディションの生成を示す。
【
図5】
図5は、空間レンディション・パラメータを定める3つのボックスを示す。
【
図6】
図6は、2つの異なる空間レンディション規則が、どのようにして、それらのレンディション・プロファイルにおいて同じ空間パラメータを有する2つのレンディションのために、異なるレンディションを、生成させるのかを示す。
【
図7】
図7は、時間的レンディション・パラメータを示す、理想化されたタイムラインを示す。
【
図8】
図8は、時間範囲と時間分解能との間における区別(distinction)を示す。
【
図9】
図9は、ダイナミック・レンジ・レンディション・パラメータを示す。
【
図10】
図10は、色空間レンディション・パラメータを示すCIE色度図である。
【
図11】
図11は、自動化メディア出版のためのシステムを示す上位ブロック図である。
【
図12】
図12は、複数のレンディション・エンジンによる自動メディア出版システムを示す上位ブロック図である。
【発明を実施するための形態】
【0016】
[0028] 本明細書において説明するシステムおよび方法は、所与のコンポジション(composition)または1組の関連コンポジションに由来する1組のメディア成果物(deliverable)を生成するための新たな枠組みを提供する。編集段階において挿入されるレンダリング規則と、コンポジションがタグ付けされるワークフローについて説明する。規則は、引き渡し可能な(deliverable)メディア・ベース製品がレンダリングされるときに、下流において自動または半自動的に解釈される。典型的な全体的(end-to-end)メディア・ワークフローは、(i)コンポジションを作成する段階、(ii)随意に、種々のターゲット地域、コンシューマの年齢層(gemographics)、および消費会場に対するコンテンツ・ケータリング(content catering)に多様性がある1つ以上のコンポジションに基づくバージョンのファミリを作成する段階、(iii)バージョンのファミリから、またはバージョンが生成されない場合、コンポジションから直接、レンディションを生成する段階、および(iv)引き渡し可能なメディア・パッケージをレンディションから生成し配布する段階とを含む。ここで中心となるのは、出版されるメディア製品のレンダリングの最適化および自動化、即ち、ワークフローにおける段階(iii)のレンディションの生成である。本明細書において使用する場合、レンディション(rendition)とは、ターゲット・プラットフォームによって消費、即ち、再生することができる形態におけるメディア・コンポジションの「平坦化」レンダリング(flattened rendering)である。共通レンディション・フォーマットには、オーディオ相互交換ファイル・フィーマット(.AIFF)、WAVEオーディオ・ファイル(.WAV)、MP3オーディオ・ファイル(.MP3)、MPEGムービー(.MPG)、Apple QuickTime Movie(.MOV)、ウィンドウズ、メディア・ビデオ・ファイル(.WMV)、マテリアル交換フォーマット(MXF),相互動作可能マスタリング・フォーマット(IMF)、およびディジタル・シネマ・パッケージ(DCP)が含まれる。
【0017】
[0029] 一般に、所与のメディア・コンポジションを、それが消費されようとしている複数のコンテキストに対して適合化および最適化する必要がある。従前では、これはトランスコーディング・プロセス(transcoding proess)によって行われていた。トランスコーディング・プロセスは、高品質平坦化ファイル(flattened file)、通例「マスタ」と呼ばれるものの空間、時間、および色の再フォーマッティングおよび圧縮を伴う。マスタは、複数のトラックおよびエフェクトが混合され1つのメディア・ストリームになった最終ミックスを表す。マスタからトランスコードするとき、結果的に得られるプログラムの品質は、マスタの品質に制限される。何故なら、どんなに良くても、トランスコーディング処理はマスタの品質を保存するだけであり、多くの場合、劣化させるからである。
【0018】
[0030] また、「マスタ」という用語は、流通マスタ(distribution master)に言及するときにも使用される。流通マスタとは、種々のメディア発信地および業務への流通のために組み立てられるパッケージである。パッケージは、言語、プログラム長、およびターゲット・ディスプレイ・パラメータというような面に対して、複数の代わりの選択肢を含む。流通マスタ内に含まれるメディア(即ち、ビデオおよびオーディオ)選択肢は、元のマスタを要求されたフォーマットにトランスコードすることによって生成されたミックス・ダウン・ファイル(mixed-down file)である。つまり、このような流通マスタが複数の代わりのトラックを含むことができるが、これらの各々は、元のソース・アセットに関して定められたプログラムのコンポジション・エレメントとしてではなく、「平坦化された」代用物として含まれる。実際、ソース・アセットは流通パッケージ内に含まれもしない。一例として、東カナダのために作成される流通マスタであれば、英語およびフランス語双方のダイアログ・トラックと、スマートフォンおよびHDテレビジョン用にフォーマットされたビデオ・ファイルとを含む。ディジタル・シネマ・パッケージ(DCP)および相互動作可能マスタリング・フォーマット(IMF)は、流通マスタ・タイプの2つの例である。
【0019】
[0031] 対照的に、本明細書において説明する方法およびシステムは、メディア成果物の発行に関する編集判断の非可逆的な適用を、成果物の具体的な要件が分かり、成果物が生成されるまで延期する。元の編集されたコンポジションおよび元のソース・アセットが利用可能にされるので、トラック・ミキシング、複合(compositing)、およびエフェクトというようなレンディション選択肢の適用を、ミックス・ダウン・バージョンではなく、元のメディアのソースに対して実行することを可能にする。例えば、HDメザニン・フォーマットで4Kソース・メディアを編集した後に4K解像度の成果物を生成するためには、従前からの方法は、編集されたHDマスタを再サンプリングして4K成果物を生成するので、その結果品質が元のものよりも低くなる。対照的に、本明細書において説明する方法を使用すると、編集が完了した後に、4Kソース材料から成果物が直接生成される。タイトルまたはクローズド・キャプションのようなテキストのレイアウトは、他の例を示す(provide)。既存の方法では、要求された宛先の画面サイズにテキストが収まらない場合、利用可能な唯一の選択肢は、画像全体をスケールするまたはクロップすることであるが、こうすると、テキストが判読できなくなる、または成果物から削除される(cropped out of)おそれがある。本明細書において説明する手法では、宛先画面サイズが指定されたときでも、元のメディアおよび文字入れエフェクト(titling effect)はなおも利用可能であるので、おそらくは宛先画面のアスペクト比のためにテキストが収まらない場合、文字入れエフェクトを再度実行し、それが宛先画面に最適に収まるように、テキストが配置される(lay out)。更に他の例は、色補正を伴う。高ダイナミック・レンジ(HDR)可能モニタ(capable monitor)への最終出力が指定される場合、8ビットまたは10ビット・マスタは、表示するために利用可能な全輝度範囲を供給できない。しかし、元のメディア・コンポジションおよびソース・メディア・アセットが未だ利用可能であるので、元のメディア(original)の全ダイナミック・レンジを、流通用レンディション(distributed rendition)に含ませることができる。
【0020】
[0032] このようなワークフローを実現するために、追加機能を編集環境に追加し、編集者が、レンディションをどのように生成すべきか定める規則および対応するパラメータを指定すること、ならびにこれらの規則をメディア・コンポジションと関連付けること、更に特定すれば、メディア・コンポジションのコンポジション・オブジェクト(compositional object)と関連付けることを可能にする。規則は、レンディションがコンポジションから生成されるときに、自動レンダリング・ソフトウェアに露出される。本明細書において説明する方法は、編集者がメディアにおいて語りたいストーリーを具体化する彼らの能力を確認するためのメカニズムを、編集者に提供する。即ち、骨の折れる手作業での副編集によって再度作成するのではなく、彼らの全創作意図(full creative intent)は、レンディションが生成されるときに、自動的に下流側で把握される。このような規則のことを「編集レンディション規則」(editorial rendition rules)と呼ぶ。何故なら、これらは本質的に事実上編集に関わり、メディア・フォーマット・レンディション規則とは区別されなければならないからである。後者は、レンディションを生成するときに種々のコデック・パラメータが適用される条件を指定することによって、メディア・ファイルの構造およびフォーマット、ならびに技術的なメディア品質を最適化する機能を果たす。既存のワークフローでは、共通フォーマットの決定は、創作的編集および組み立て仕上げプロセスの下流側にいる要員によって指定される。場合によっては、フォーマットの決定およびエンコーディングは手作業で行われることもある。本明細書において説明する方法は、ワークフローのこの段階の自動化も同様にサポートする。しかしながら、メディア・フォーマット規則およびパラメータは、レンディション指定の一部として供給され、メディア・コンポジション内ではなく、レンディション・プロファイル(以下で説明する)内で提供される。
【0021】
[0033] 本明細書において説明する方法は、メディア発行者および流通者が彼らのアセットを収益化する能力を、保管されているアセットを再利用する能力を提供することによって、高める役割を果たす。創作的判断は元のソース・メディア・アセットに対して行われ、これらのアセットと関連付けてメタデータとしてアーカイブに格納されるので、メディア作用域(media scope)および品質のフル・レンジが、任意の時点においてレンディションを生成するために利用可能であり続ける。これは、空間ドメイン(元の大きなラスタ)、時間ドメイン(元のフレーム・レート)、および色ドメイン(元のダイナミック・レンジ)に適用される。
【0022】
[0034]
図1は、説明するメディア出版ワークフロー、およびこのプロセスに関与するデータ・オブジェクトを示す上位図である。ビデオ・クリップ、オーディオ・クリップ、コンピュータ生成画像のようなソース・メディア・アセット102、および特殊エフェクトは、素材のソースを提供し、この素材はメディア編集アプリケーション106を使用する編集者104によって使用される。メディア編集アプリケーション106は、非線形ビデオ・エディタ、デジタル・オーディオ・ワークステーション(DAW)、またはコンポジション108を作成するための特殊エフェクト・アプリケーションであってもよい。このようなアプリケーションの例には、双方共マサチューセッツ州、BurlingtonのAvid(登録商標) Technology, Inc.,からのMEDIA COMPOSER(登録商標)、非線形ビデオ・エディタ、およびPRO TOOLS(登録商標)、DAW、ならびにAdobe(登録商標) Systems,IncからのAFTER-EFFECTS(登録商標)視覚エフェクト、モーション・グラフィクス、および合成アプリケーションが含まれる。コンポジション108は、一列に配列されたソース・メディア・アセット102のクリップを、編集判断、パラメータ、および設定値を指定する豊富なメタデータと共に含む複数のトラックによって表される。このコンポジションは、全てのソース・メディア・アセット、エフェクトに対する参照、およびこのコンポジションを再生またはレンダリングするために必要とされるメタデータを含む。このような「非平坦化」コンポジション(unflattened composition)は、更なる編集を許容する形態であり、先に引用した従前からの平坦化ファイル「マスタ」や、DCPおよびIMFのような流通マスタとは区別されなければならない。コンポジションの構造は、アプリケーション毎に異なる。例えば、MEDIA COMPOSERはビデオ・コンポジションを「シーケンス」と呼び、設定値、ビン・ファイル、およびクリップを含み、シーケンス・メタデータはソースへの参照を含む。PRO TOOLSは、オーディオ・コンポジションを「セッション」と呼び、セッションは、オーディオ編集およびミキシングの決定および設定値、ならびにオーディオ・ファイルおよびエフェクトのようなソース・アセットへの参照を指定するメタデータを含む。グラフィクスおよび合成コンポジション(compositing composition)は、シーン・グラフ(scene graph)として表され、グラフィクス・ソース・アセットに適用される編集判断を指定する。
【0023】
[0035] 前述のように、編集フェーズは、編集者が編集レンディション規則110を指定することを可能にすることによって、その従前からの作用域を超えて広げられる。編集者が編集レンディション規則を指定するとき、メディア合成アプリケーションは、この規則を、それが要求するかもしれない任意のパラメータの値と共に、コンポジションにおける該当する合成オブジェクト(compositional object)に添付する。
図2は、3つのトラックを含み、各トラックが1つ以上のクリップを含むコンポジション202に対する合成データ・モデルを示す。トラックおよびクリップは、合成オブジェクトの例である。トラック1 204は編集レンディション規則A206と関連付けられ、クリップ1 208は編集レンディション規則210と関連付けられる。編集レンディション規則を合成オブジェクトと関連付けるステップは、本明細書では、合成オブジェクトを規則とタグ付けするとも呼ぶ。メディア合成アプリケーションは、ユーザ・インターフェースを供給する。このユーザ・インターフェースは、編集者が、メディア・コンポジションの選択された合成オブジェクトに対して編集レンディション規則およびパラメータを作成し入力することを可能にする。一旦編集者によって指定されると、編集者は合成オブジェクトを編集レンディション規則とタグ付けすることができ、規則は、
図2に示すように、メディア・コンポジションの一部となる。編集レンディション規則の例については、以下で説明する。
【0024】
[0036] コンポジションの1つ以上のレンディションが生成されようとするとき、編集レンディション規則110は、レンディション116を生成するために、レンディション・プロファイル114によって指定されるメディア引き渡し要件(media deliverable requirement)にしたがって、レンディション・エンジン112によって解釈される。レンディション・エンジン・ロジックは、その対応するレンディション・プロファイルに見合った品質で各レンディションを生成しようとする。レンディション・エンジンは、中間ファイルに頼らずに、元のソース・アセットから開始するので、この品質は、これらのアセットの品質以下になるおそれがある。また、ソース・エフェクトおよびソース・メディアへのアクセスは、指定されたパラメータを考慮してエフェクトがどのように適用されるかに関して、高い柔軟度を提供する。
【0025】
[0037] レンディション・プロファイル114は、1つ以上の個別レンディション・プロファイルを、生成されるレンディション毎に1つずつ含む。各レンディション・プロファイルは、以下のことを指定する。(i)バージョン指定段階(version stage)を含むワークフローに対して、使用すべきバージョン、(ii)そのバージョンから生成されるべきメディア・パッケージの構造的記述、例えば、相互動作可能マスタ・フォーマット(IMF)、素材交換フォーマット(MXF)OP-AtomおよびOP1a、(iii)空間フレーミング・ボックス(framing box)のような空間パラメータ、時間フレーミング・レンジのような時間パラメータ、ならびにダイナミック・レンジおよびカラー・リーガル・レンジ(color legal ranges)のような色パラメータを含むが、これらに限定されない、エッセンス・エンコーディング・パラメータ(essence encoding parameter)、(iv)デプロイすべき流通方法。加えて、レンディション・プロファイルは、おそらくは、レンディション要件が最初に定められたときに編集者によって既に指定されている、1つ以上の編集レンディション規則も含むことができる。これらは、コンポジション内に埋め込まれた編集レンディション規則を補足することができる。更に、有効なボックスまたはフレーミング・ボックス(以下を参照)のような、特定のレンディション・パラメータが、ソース・メディア・アセット102内部に存在してもよく、編集レンディション規則110にしたがって、レンディション・プロファイル内に存在する対応するパラメータよりも優先度が与えられてもよい。しかしながら、パラメータを解釈しレンディションを生成するためにレンディション・エンジンによって使用されるロジックは、レンディション・パラメータのソースがたとえ何であっても、同一である。
図3は、所与のコンポジションに対する1組のレンディション・プロファイルの例示的な図である。
【0026】
[0038] あるワークフローでは、1つ以上の部分的にミックス・ダウンされたメディア・ファイルを含むメディア・アセットからレンディションが生成される場合がある。このような中間ファイルは、次に、レンディション・フェーズ中に他の元のメディアおよび/またはエフェクトと組み合わせられる。他の例では、背景トラックは平坦化されるが、タイトル・トラックはレンディション・フェーズの間手を付けずに残されるか、またはミックス・ダウンされたモノ・オーディオ・トラックが、レンディションの直前に指定された言語でダイアログに混合するために、レンディション・フェーズにおいて使用される。つまり、レンディション決定(renditioning decision)の中には、延期されたままのものもあり、最終レンディション(final renditioning)における柔軟性を保持し、一方他の決定は、ワークフローの早いフェーズにおいてコミットされる。
【0027】
[00391 ワークフローの最終フェーズにおいて、1つ以上のレンディションが流通マスタ内にパッケージングされ、次いで、流通マスタは、これらが消費されようとしている場所に流通される。
【0028】
[0040]
図4Aは、1つのコンポジション402からの複数のレンディション406の生成を示す。各レンディションは、1組のレンディション・プロファイル404の内対応するメンバによって指定される。
図4Bは、コンポジションの複数のバージョンが生成されるワークフローにおけるレンディションの生成を示す。各バージョンは、次に、1組のレンディションの基礎として使用することができる。バージョンとは、コンテンツおよび/または特定のエレメントのタイミングの変動(variation)を含むコンポジションの変形(variation)を指す。サブマスタまたはカプセル化クリップまたは部分的ミックス・ダウンの形態とした他のソースまたはコンポジションも、種々のバージョンに対するコンテンツを提供することができる。例えば、連続プログラムの1回分の作品を著す1組のバージョンが、その1回分の作品の個々のコンテンツを表すコンポジションからのコンテンツ、および各1回分の作品において再生(reproduce)されるオープニング・シーン(opening sequence)を含む第2マスタからのコンテンツを含むことができる。コンポジションの複数のバージョンは、各々、異なる言語のダイアログ・トラックを含むことができる。ダイアログ・トラックに加えて、異なる言語バージョンを実現するために必要とされる変形は、表題(titling)、字幕(subtitling)、および場面選択も含む(involve)ことができる。他のバージョン・タイプには、1つ以上の場面が、意図される消費会場に基づいて追加または除去されているものがある。例えば、航空機事故を含む場面は、機内航空会社バージョン(in-flight airline version)から除去される。一般聴衆に示されるバージョンは、成人聴衆に意図されたものとは異なる場面を含むことができる。他のタイプのバージョニング(versioning)では、プログラム内における広告の挿入、または流通時点において追加される広告のためのある範囲のプレースホルダ長が含まれる。生成される1組のバージョンは、1組のバージョン・プロファイルによって指定することができ、1組のバージョン・プロファイルは、コンポジションの編集が行われている間または完了した後に供給することができる。
図4Bを参照すると、コンポジション408は、バージョンA410およびバージョンB412の基礎として使用されている。レンディション・プロファイルA414にしたがって、バージョンAは、合成の基礎として使用され、これから、レンディションA1、A2、A3、およびA4 416が生成され、更にレンディション・プロファイルB418にしたがって、バージョンBは合成の基礎として使用され、これから、レンディションB1およびB2 420が生成される。
【0029】
[0041] 1組の供給されたレンディション・プロファイルの所与のメンバにしたがってレンディションを生成するとき、レンディション・エンジンは、メディア・コンポジションおよびその合成オブジェクト(またはバージョンが存在する場合は、そのコンポジションのどのバージョンか)を読み出すのに必要とされるロジックを実行し、それを使用して、空間、時間、または色に関係するレンディション・ロジックの内1つ以上が所与のレンディション・プロファイルによって供給されるエッセンス・エンコーディング・パラメータに適用されるときに、編集レンディション規則にしたがってこれらを呼び出ながら、ソース・メディア・アセット、エフェクトを、指定されたレンディションに変換する。加えて、レンディション規則は、複数の代替アセットが利用可能なときに、編集者がソース・メディア・アセットの選択を最適化するために規則を指定することを可能にすることもできる。代替アセットは、それらの空間、時間、または色解像度あるいは範囲の内1つ以上において、互いに異なってもよい。レンディション・エンジンは、編集レンディション規則を、タグ付けされたコンポジション自体から受け、更に規則の対応するパラメータを、合成規則自体、レンディション・プロファイル、およびソース・メディア・アセットの内1つ以上から受ける。
【0030】
[0042] これより、レンディション規則の3つのカテゴリ、ならびにそれらのパラメータ、空間、色、および時間パラメータについて説明する。空間パラメータは、ビデオ・フレーム内部におけるx、y範囲に関する。
図5に示すように、3つのボックスが空間パラメータを定める。ビデオ・フレーム502について、エッセンス・ボックス504はサンプルが存在する画像の範囲(extent)を定める。これは、以前にパディングとして導入された黒いサンプルを含むことができる。有効ボックス506は、パディングのために以前に導入された画素とは対照的に、画像コンテンツを含む画素の範囲を定める。編集者によって定められる1つ以上のフレーミング・ボックスが、画像の最も重要な部分がどこに位置するかに関する編集者の評価を構成する。編集者は、フレーミング・ボックスを使用して安全アクション領域、安全タイトル領域を定めるか、または画像のどこにアクター(actor)がいるかシステムに伝える。フレーミング・ボックスは、フレームのどの部分に、レンディションに含める優先度を与えるべきか決定するために、 空間型編集レンディション規則(spatial type editorial rendition rule)にしたがって呼び出される。例えば、レンディション・プロファイルによって指定されるターゲット・プレイアウト・ディスプレイのアスペクト比に依存して、使用されるべきフレーミング・ボックスの外形を,他の規則が制約する。
図5は、フレーミング・ボックス508を示す。これは、フレーミング・ボックス508およびターゲット・スクリーン510のアスペクト比が同一であり、フレーミング・ボックスによって定められる全範囲がレンディション・フレーム512内に含まれる例を示す。ソース・メディア・アセット内部で定められるエッセンス・ボックスおよび有効ボックスとは異なり、フレーミング・ボックスは性質上編集用(editorial)である。編集者によって使用されているメディア合成アプリケーションは、ユーザ・インターフェースを供給する。このユーザ・インターフェースは、編集者が、コンポジションの個々のフレーム、クリップ、または他の部分に対してフレーミング・ボックスを指定することを可能にする。例示的なユーザ・インターフェースでは、このアプリケーションは、編集者が、アプリケーションのユーザ・インターフェース内部にある再生ウィンドウに表示されているビデオ・フレームの表示上にフレーミング・ボックスを描くことを可能にする。
【0031】
[0043] 空間レンディション・パラメータは解像度とは無関係である。つまり、フレーミング・ボックスは、編集者が画素のx、y範囲に関して呼び出す(call out)ことを望む画像の部分を定める。
図6は、2つの異なる空間レンディション規則が、異なるレンディションを、同じ空間パラメータ(この場合、解像度パラメータ)をそれらの(レンディション・プロファイルに有する2つのレンディションに対して、どのように生成させるかを示す。ソース画像502は、3840×2160の解像度を有する。フレーミング・ボックス604は、(1000~2920)、(540~1620)のx、y範囲を定め、その結果、解像度を変化させることなく、フレーミング・ボックスによって定められる範囲に広がる、ソース画像602のクロップ部分(cropped portion)を示す画像606が、HD解像度で得られる。対照的に、ソース画像602のフル・レンジは、範囲を変化させることなく、単に解像度を変化させることによって、HD解像度の画像608にスケールすることができる。1920×1080HD画像を生成するためにスケールするかまたはクロップするか(または、更に一般的には、クロッピングおよびスケーリングの組み合わせを選択する)についての決定は、本質的に、性質上編集に関することである。何故なら、レンダリングされた画像の全体的な品質の方が重要でありソース画像をスケールすべきか、あるいは画像の極めて重要なコンテンツにコンシューマの注意を集中させるために画像をクロップするよりも、可能な品質の損失の方が重要でないかに関する定性的評価に依存する可能性があるからである。この例は、副編集者(sub-editor)または自動化されたレンダラ(renderer)が、不用意にフレームの最も重要な部分を切り抜くというような、拙い選択を行ったときに、空間編集レンディション規則の案内がないと起こる可能性がある曖昧さを示す。
【0032】
[0044] ヒンジング(hinging)規則は、他のタイプの空間レンディション規則である。ヒンジング規則は、インタラクティブ・エレメント、典型的にはグラフィカル・オブジェクトを、レンダリングされた表示上にどのように配置する(lay out)か指定する。これらの規則は、蝶番位置パラメータを含む。例えば、テレビジョン司会者(television presenter)によって調節することができる棒グラフは、底辺を蝶番として動かすことができ、その垂直方向の範囲が、固定された蝶番位置に関して変化する。他の空間規則およびパラメータは、ビデオ・ウォールのような1組の表示内における表示の配置、および、例えば、ピクチャ合成(picture compositing)内部のピクチャに対する合成規則を定める。
【0033】
[0045] 以下は、空間フレーミング・ボックスを使用するためのレンディション・エンジン・ロジックの例である。レンディション・ターゲット・ディスプレイが、フレーミング・ボックスと同じアスペクト比を有する場合、以下の規則が適用される。ターゲット・ディスプレイの解像度がフレーミング・ボックス内部の解像度と同じである場合、レンディション・エンジンは、単に、ソース・メディア・アセット内におけるフレーミング・ボックスの範囲をレンディションのために抽出するだけである。ターゲット・ディスプレイがフレーミング・ボックスよりも低い解像度を有する場合、フレーミング・ボックス内の画素の範囲を、ターゲット解像度までダウンサンプリングする。ターゲット・ディスプレイがフレーミング・ボックス内の解像度よりも高い解像度を有する場合、レンディションにおいて含まれる画素の範囲は、ソース・メディア・アセットにおけるフレーミング・ボックスを中心として対称的に広げられる。このような拡張の結果、レンディション・ボックスが有効ボックスに達した場合、有効ボックスに達する点を超えて必要とされる追加の解像度が、有効ボックスで制限される範囲のアップサンプリングによって得られ、またはターゲット・ディスプレイが、有効ボックスの外側であるがエッセンス・ボックスの内部にある非エッセンス部分を含むことが許される。後者の場合、ターゲット解像度に達する前に、エッセンス・ボックスの限度にも達した場合、エッセンス・ボックスで制限される範囲をアップサンプリングすることによって、残りの必要な解像度が得られる。
【0034】
[0046] レンディション・ターゲット・ディスプレイがフレーミング・ボックスのアスペクト比よりも高いアスペクト比(即ち、x解像度のy解像度に対する比率が高い)を有する場合、以下の規則を適用する。レンディション・ボックスのx範囲を、ターゲット・アスペクト比に達するまで、y解像度を変化させずに、フレーミング・ボックスの各側で対称的に広げる。結果的に得られた解像度がターゲット・ディスプレイのそれと一致した場合、これがレンディション・ボックスになる。ターゲット・ディスプレイの方が解像度が低い場合、ターゲットと一致するようにボックスをダウンサンプリングする。ターゲット・アスペクト比が得られる前に有効ボックスに達した場合、次いで、この範囲の一端のみにおいて有効ボックスに達した場合、この範囲の他端において有効ボックス以内で、範囲を広げる。ターゲットx解像度が得られる前に、x範囲の両端が有効ボックスに達した場合、有効ボックスの外側であるがエッセンス・ボックスの内側にある画素を含ませることによって、未だ必要とされるアスペクト比の追加増大を得る。所望のアスペクト比を受け入れる(accommodate)ためにはエッセンス・ボックスにおいてもメディア・サンプルが不十分である場合、x範囲の底辺および上辺において追加のパディングを挿入するか、またはy範囲をクロップする。一旦所望のアスペクト比に達したなら、解像度が要件を満たすならば、結果的に得られたボックスはレンディション・ボックスになり、またターゲット解像度を超える場合、ダウンサンプリングする。ターゲット・アスペクト比がフレーミング・ボックスのそれよりも低い場合、類似のロジックを適用する。
【0035】
[0047] ターゲット・アスペクト比を考慮するために、レンディション・エンジン・ロジックを使用してテキストを配列する(lay out)ことができる。クローズド・キャプションまたは字幕を配列するために、テキストのライン長を百分率で、例えば、ターゲット・ディスプレイの水平範囲の75%に指定することができる。同様に、ターゲット・ディスプレイ上で入手可能な解像度に見合う解像度にフォント・サイズをスケールすることができる。テキストは、これらが重なり合う画像と干渉する可能性があるので、レンディション・エンジン・ロジックは、ターゲット・ディスプレイ上のフレーミング・ボックスの範囲外に範囲が利用可能であれば、フレーミング・ボックスによって定められる範囲を超える字幕の配置を回避する、または極力抑えようとすることができる。次いで、レンディション・エンジン(renditioning engine)は、読みやすさを阻害するおそれがあるテキスト・スケーリング・アーチファクトを導入する必要なく、レンディション毎に新たにテキストを配列する。また、テキストの審美的レイアウトに対する同様の規則は、ビデオ・コンポジションの先頭および後端において表示されるタイトル、または個々の場面の境界を定めるタイトル等のタイトルにも適用される。
【0036】
[0048] 時間レンディション・パラメータは、先に説明した空間パラメータに類似している。水平軸に沿って時間を表す
図7の理想化したタイムラインにおいて示すように、時間エッセンス・レンジ(temporal essence range)702に対応する1つのクリップ全体(full clip)は、元の映像の一部ではないカウントダウン・クロックおよびカラー・バーのような、ヘッダ704およびフッタ706を含むことがある。エッセンス・レンジ全体に及ぶクリップ全体は、先に定めたエッセンス・ボックスと等価である。有効レンジ708は、元々なかったヘッダおよびフッタを除外するが、クリップのヘッド710およびテール712を含む。これらは、通例、移行の中で、例えば、直前のクリップまたは連続するクリップへのクロスフェードにおける使用のために設計される。通例、このようなヘッドおよびテールは、520個のビデオ・フレームを含む。フレーミング・レンジ714は、エッセンス・レンジの内部にあるクリップの内、元々はなかったヘッダ704およびフッタ706の双方、ならびにヘッダ710よびテール712を除外した部分である。フレーミング・レンジは、最も重要なコンテンツが存在する時間範囲を示す。クリップ内部におけるコンテンツの階層に対する指針を与えるために、追加の時間フレーミング・レンジを挿入することもできる。例えば、 第2フレーミング・レンジ716は、編集者によってクリップの中から指定され、下流における編集の進行中(on-the-fly editing)に元のクリップ長を約50%に落とすために使用される時間的部分を示す。これによって、最も重要なコンテンツを失う危険を冒すことなく、コンポジションを異なる長さにする、自動下流編集(automated downstream editing)が可能になる。空間レンディション・パラメータと同様に、時間エッセンス・レンジおよび有効レンジは、ソース・メディア・アセットのプロパティであるが、フレーミング・レンジは編集者によって指定することができる。メディア合成アプリケーションのユーザ・インターフェースは、編集者が、例えば、マーカ718および720を、クリップの表示されたタイムライン表現上に挿入して、フレーミング・レンジの開始および終了を示すことによって、フレーミング・レンジを指定することを可能にする。
【0037】
[0049] 時間レンディション・パラメータに対するレンディション・エンジン・ロジックは、空間フレーミング・ボックスのそれと同様である。レンディション・プロファイルにおいて指定されたクリップのターゲット期間が、フレーミング・レンジによって指定されたそれと同一である場合、クリップのその部分がレンディション内に含まれる。フレーミング・ボックスの期間よりも長い期間が、レンディションにおいて要求される場合、フレーミング・レンジを超えるが有効レンジ内の追加コンテンツが追加される。具体的な使用事例では、ブロードキャスト・レンディションの期間は、放送される広告のようなインサートの数に依存する場合がある。何故なら、レンディションおよびインサートを組み合わせた期間は、所定の全割り当て時間内に収まらなければならないからである。これは放映時刻の直前に決定することができ、既に作成されている編集レンディション規則による自動レンダリングを特別に価値あるものにする。補足フレーミング・レンジ(例えば、
図7の716)は、レンディション・エンジンが、30秒、1分、または2分の短縮というような、編集で指定されたフレーミング・レンジの長さ短縮によって表される、種々の予測されたインサート期間にしたがって、コンテンツをカットすることを可能にする。他の使用事例では、最終編集の一部として、フェード移行におけるように、期間延長を必要とする新たなエフェクトが適用される。すると、この状況では、追加のコンテンツがフレーミング・ボックスを超えて、有効レンジ内に広がる。期間の延長が有効レンジによって完全に供給することができず、ソース・メディアには追加の素材が存在しない場合、フレーム複製、クリップのテールにグラフィクスまたは黒いフレームをパディングするというような、期間を広げるための他の技法を使用することもできる。
【0038】
[0050] 時間範囲(temporal range)と時間解像度(temporal resolution)との間の区別、即ち、1秒当たりのビデオ・フレーム数(FPS)または1秒当たりのオーディオ・サンプル数を
図8に示す。
図8は、同じ時間範囲を有するが、異なる時間解像度を有する2つのビデオ・クリップ802および804を示す。クリップ802は、クリップ804の2倍の時間解像度を有する。例えば、50FPS対25FPSである。
【0039】
[0051] レンディションの中には、要求フレーム・レートがソース・メディア・アセットのそれから逸脱するものもある。例えば、毎秒24フレーム(FPS)のフィルム・フレーム・レートを、25FPSのビデオ・フレーム・レート(PALエンコーディングの場合)または毎秒29.97フレーム(NTSCエンコーディングの場合)でレンダリングする必要がある場合もある。このような変換を実行するとき、編集レンディション規則が、クリップの期間を保存するか否か、またはクリップ期間を変更することを許可するか否か決定する。より高いフレーム・レートに変換するときにクリップの期間を保存しようとする場合、内挿補間方法によって、例えば、3:2プルダウンによって、または余分なコンテンツをクリップに追加することによってのいずれかで、追加のフレームが得られる。より低いフレーム・レートに変換するときにクリップの期間を保存しようとする場合、クリップからフレームを除去することによって、随意に、除去されるフレームを使用して、保持されるフレームを調節/配合することによって、クリップをより少ないフレームにスケールする。クリップの期間が変動することが許される場合、ビデオの速度を変更する、即ち、多少遅くするまたは速くしつつ、クリップ・コンテンツにおけるフレーム数を保持ことができる。24FPSのスースを25FPSのレンディションにレンダリングするとき、通常では、単純なテンポ・スケーリング(tempo scaling)が容認可能であると見なされ、クリップ期間に対応するわずかな短縮が生ずるが、24FPSのソースを29.97FPSレンディションにレンダリングするとき、単純なスケーリングを行うと、過剰な高速化が生ずる結果となる。したがって、この状況では、テンポおよび期間を保存するために、新たな内挿補間フレームを挿入する。
【0040】
[0052] 色レンディション規則およびそれらの関連パラメータは、白黒ダイナミック・レンジの内ターゲット・ディスプレイにマッピングされなければならない部分、またはビデオ・エンコーディング内のターゲット・ディスプレイにマッピングされなければならない多次元カラー・レンジの部分を選択するように、レンディション・エンジンに指令する。例えば、編集によって指定されるリーガル・レンジが、SDまたはHDテレビジョン受像機上に表示することができるカラー・レンジに対応するのでもよい。他の編集によって指定されるリーガル・レンジが、HDRディスプレイ上に表示することができるもっと広いカラー・レンジに対応するのでもよい。
【0041】
[0053] 第1組の色パラメータは、ダイナミック・レンジを定める。エッセンス・レンジは、画像の画素値のエンコーディングが取ることができる値の範囲に対応する。これは、ビット長、即ち、各画素を表すために割り当てられたビットの数の関数である。有効レンジは、メディア・サンプルが存在する値の範囲に対応する。画像において実際のエンコード値(encoded value)の範囲は、通例エッセンス・レンジの部分集合であるリーガル・レンジに及ぶ。以上で定めたフレーミング・レンジに対応するリーガル・レンジは、編集者が基準黒点および白点間の範囲にマッピングするエンコード値の範囲であり、多くの場合0から100%REで示される。
【0042】
[0054]
図9は、所与のビデオ・フレームの画素値のヒストグラム・プロット902上におけるダイナミック・レンジ・パラメータを示す。エッセンス・レンジ904は、フレームが表されるエンコーディング方式によって表すことができる範囲全体に及ぶ。有効レンジ906は、フレームの画素値によってエッセンス・レンジが埋められる(populate)広さ(extent)に及び、一方リーガル・レンジ908は、基準黒点および基準白点、即ち、0から100%までのIREレンジに及ぶ範囲にマッピングされる画素値の範囲を示す。リーガル・レンジは、ブロードキャスト安全範囲(broadcast safe range)、即ち、リーガル・レンジ908のテレビジョン・モニタ910へのブロードキャストによって
図9において示されるように、標準品位(SD)または高品位(HD)テレビジョン・モニタ上において表すことができる範囲に対応することができる。色編集レンディション規則を作成するとき、編集者は、ソース・ダイナミック・レンジのどの部分が示されようとするのか示すために、リーガル・レンジを指定することができる。例えば、ビデオ・コンポジションについて、編集者が微妙な詳細を示すことを望むのが、フレームの影においてであって、もっと明るく照明されたエリアではない場合、編集者はリーガル・レンジを有効レンジの下端に向けてスライドする。高ダイナミック・レンジ・モニタに対応する追加のリーガル・レンジも指定することができる。このようなモニタは、4,000%IREまたは10,000%IREまでものダイナミック・レンジで画像(magery)を表示することができる場合もある。このようなディスプレイ上に何をマッピングすべきか指定するために、対応してもっと広いリーガル・レンジが、編集者によって有効レンジ内から指定される。メディア合成アプリケーションのユーザ・インターフェースは、編集者がリーガル・レンジを指定することを、例えば、ライン912および914をスライドさせることによって可能にし、リーガル・レンジの下限および上限を、それぞれ、画素値ヒストグラム・プロット902上の左または右に指定する(denote)。ディスプレイ・デバイス規格に対応する標準ダイナミック・レンジを選択してもよく、つまり、ライン912および914の分離を、このような規格に対応するように、例えば、0~100%IRE(SD、HD)または0~4,000%IRE(HDR)に対応するように制約することができる。
【0043】
[0055] 第2組のレンディション関係色パラメータは、多次元空間における色域を定める。ダイナミック・レンジと同様、エッセンス・レンジは、画像データを表すために使用されたエンコーディングによって表すことができる値の範囲に対応するが、この場合、RGBまたはYCBCRのような多次元色空間である。有効レンジは、表される色画像におけるメディア・サンプルが存在する色空間値の範囲に対応する。つまり、エッセンス・レンジは、元の場面からサンプリングされなかった値を含むことができる。例えば、16ビット・エンコーディングが使用される場合、可能な16ビット・コード・ワードの全てがカメラによってキャプチャされる訳ではない。
【0044】
[0056] リーガル・レンジは、編集によって決定される範囲であり、有効レンジの部分集合であり、有効レンジ全体を表示できないときに、色空間のどの部分をレンディションにおける表現のために選択すべきかについての編集者の選択を反映する。
図10は、色編集レンディション規則によって使用される色空間パラメータ選択の例を示す、照明委員会(CIE:Commission on Illumination)の色度図である。エッセンス・レンジは、外側エンベロープ1002内に含まれる。外側エンベロープ1002は、画像エンコーディング方式によって表される全ての色値に及び、画素表現の多次元ビット深さに依存する。有効レンジ1004は、エッセンス・レンジの部分集合であり、国際電気通信連合(ITU)-R BT2020色域1004に対応し、編集者指定リーガル・レンジはITU-709色域1006に対応する。メディア合成アプリケーションのユーザ・インターフェースは、例えば、編集者が、
図10におけるCIE色度図のような二次元色空間プロット上または透視三次元色空間プロット上で標準的色域(ITU-709(1006)のような)を選択することまたはこの色域のエンベロープを描画することを可能にすることによって、編集者がリーガル色域レンジ(legal color gamut range)を指定することを可能にする。このように、編集者は、BT2020色域全体を忠実に表示することができない出力ディスプレイ上で色解像度をどこに集中させるべきか指定することができる。
【0045】
[0057] 空間および時間編集レンディション規則について以上で説明したのと類似した方法で、色レンディション規則およびそれらのパラメータは、自動化レンディション・エンジンがどのようにしてレンディション・プロファイルにしたがってレンディションを生成するか決定する。例えば、レンディションのために指定されたターゲット色空間リーガル・レンジが、ソース・メディア・エッセンス・レンジよりも小さな色空間ボリューム(color space volume)を占めるとき、編集レンディション規則は、エッセンス・レンジ・ボリュームをリーガル・レンジ・ボリュームまでクロップするか否か、またはリーガル・レンジ・ボリューム内に収まるように、ソース・メディア内にある画素値を縮小するか否か決定する。逆に、ターゲット色空間リーガル・レンジが、ソース・メディア・エッセンス・レンジよりも大きなボリュームを占めるとき、レンディション規則は、エッセンス・レンジ・ボリュームを拡大し、エリアシング・アーチファクトを回避するために内挿補間値を使用するか否か、または値範囲を使用すべきか否か指定する。
【0046】
[0058] 空間、時間、および色パラメータを指定することに加えて、レンディション・プロファイルは、レンディションを完全に指定するために必要とされる補助パラメータも含むことができる。補助パラメータは、使用されるコデック、ストリーミング流通を目的とする帯域幅、ファイル・ラッパ・タイプ(file wrapper type)、ディジタル権利管理情報、およびスレートを含む。例えば、1つのレンディションを、MXFファイル・ラッパにおける1080P、および流通権利を米国のみとして指定することができる。一般に、このような補助レンディション・パラメータは、生成されるレンディションの完全な指定のために必要とされるが、性質上編集には関係なく、したがって、これらのパラメータに対して編集によって指定される値とメディアをタグ付けするための上流編集インターフェースを提供する必要はない。
【0047】
[0059] 本明細書において説明したレンディションの消費のための流通チャネルには、映画館、放映、ケーブル、衛星テレビジョンおよびラジオ、コンピュータ、タブレット、ならびにスマートフォンにストリーミングされるネット配信番組(over-the-top programming)、更にはライブ・ストリームが含まれるが、これらに限定されるのではない。消費環境には、娯楽および教育シーン(setting)、公の空間または私的組織および企業シーンが含まれる。これらの環境は、1つ以上の地理的領域に配置されてもよい。各チャネル、環境、および地理は、メディア消費に対する特定の要件を生み出すことができ、対応して特別に作られるレンディション・プロファイルにカプセル化される。
【0048】
[0060] 再度
図1を参照すると、レンディション・エンジン112は、カスタム・ソフトウェアと、随意に、メディア合成アプリケーション106の一部であるハードウェア・ロジックとを含むことができる。他の実施形態では、レンディション・エンジンは、包括的な論理エンジンを含む。この包括的な論理エンジンは、編集レンディション規則110を入力し、レンディション・プロファイル114にしたがって、規則を実行してソース・メディア・アセット102からレンディションおよびエフェクトを生成する(
図1には示されていない)。種々の実施形態において、レンディション・エンジンは、人工知能技法を含む。人工知能技法は、広範囲の合成コンテンツ、ソース・メディア・タイプ、およびレンディション要件についての編集者の集団による編集レンディション判断から学習することを伴う。深層学習方法が、多レベル・ニューラル・ネットワークをデプロイして、どのように規則およびパラメータを選択するか、そして利用可能なソース・メディアに関して、レンダリングされる出力を最適化するソースをどのように選択するか判定することができる。
【0049】
[0061]
図11は、自動化メディア出版のためのシステムを示す上位ブロック図である。メディア合成ホスト・システム1102は、コンポジション1106およびレンディション・エンジン1108を含むメディア合成アプリケーション1104をホストする。1人以上の編集者1110がコンポジションを編集する。コンポジションは、編集レンディション規則1112を指定し、コンポジション1106の1つ以上の合成オブジェクトを規則とタグ付けすることを含む。レンディション・プロファイル1114がメディア合成ホスト・システムに供給される。レンディション・プロファイル1114によって指定されたレンディションが生成されようとするとき、レンディション・エンジン1108はストレージ1118からソース・メディア・アセット1116にアクセスし、出力レンディション1120を生成しストレージ1122に出力する。図示する実施形態では、レンディション・エンジン1108は、メディア合成アプリケーションの一部として実装され、メディア合成アプリケーションのメディア・プレーヤ・ソフトウェアにアクセスすることができる。メディア合成アプリケーションは、コンポジションをその元の平坦化されていない形態で読み出すことができる。
【0050】
[0062]
図12に示す他の実施形態では、レンディション・エンジンは、メディア合成ホスト・システムの外部にある1つ以上のプラットフォームにおいて実装される。これらの実施形態では、レンディション・エンジンは、メディア合成アプリケーションによって使用されるメディア・プレーヤ・ソフトウェアと同様の機能を含むので、豊富なコンポジションをその元の平坦化されていない形態で読み出すことができる。メディア合成ホスト・システムの外部にある2つのレンディション・エンジンの使用を示す
図12を参照すると、メディア合成ホスト・システム1202は、編集レンディション規則1208とタグ付けされたコンポジション1206を含む、メディア合成アプリケーション1204をホストする。レンディションが生成されようとするとき、レンディション・エンジン1 1210およびレンディション・エンジン2 1212はレンディション・プロファイル1214およびコンポジション1206を受け、ソース・メディア・アセット1218から開始して、レンディション・プロファイルおよび編集レンディション規則1208によって指定されるレンディション1216を生成する。レンディション・エンジンは、ストレージ1220における格納のために、レンディションを出力する。レンディション・エンジンが実装される外部プラットフォームは、ホスト1202と同じ場所にあってもよく、例えば、ローカル・エリア・ネットワークによって接続されるか、あるいは1つ以上のリモート・サーバによって、またはプライベート・クラウドもしくはパブリック・クラウドによってホストされてもよい。
【0051】
[0063] 本明細書において説明したシステムの種々のコンポーネントは、汎用コンピュータ・システムを使用するコンピュータ・プログラムとして実装することができる。このようなコンピュータ・システムは、通例、情報をユーザに表示する出力デバイスと、ユーザから入力を受ける入力デバイスとの双方に接続された主ユニットを含む。主ユニットは、一般に、相互接続メカニズムを介してメモリ・システムに接続されたプロセッサを含む。また、入力デバイスおよび出力デバイスは、プロセッサおよびメモリ・システムにも、相互接続メカニズムを介して接続される。
【0052】
[0064] 1つ以上の出力デバイスをコンピュータ・システムに接続することができる。出力デバイスの例には、液晶ディスプレイ(LCD)、プラズマ・ディスプレイ、ビューア用めがねを必要とするディスプレイおよびめがねが不要のディスプレイを含む種々の立体視ディスプレイ、陰極線管、ビデオ投影システム、ならびに他のビデオ出力デバイス、プリンタ、ネットワーク・インターフェース・デバイス、ケーブル・モデムを含む、低または高帯域幅ネットワークを介して通信するためのデバイス、ならびにディスクまたはテープのような記憶デバイスが含まれるが、これらに限定されるのではない。1つ以上の入力デバイスをコンピュータ・システムに接続することができる。入力デバイスの例には、キーボード、キーパッド、トラック・ボール、マウス、ペンおよびタブレット、タッチスクリーン、カメラ、通信デバイス、ならびにデータ入力デバイスが含まれるが、これらに限定されるのではない。本発明は、コンピュータ・システムと組み合わせて使用される特定の入力または出力デバイスにも、本明細書において説明したものにも限定されない。
【0053】
[0065] コンピュータ・システムは、汎用コンピュータ・システムであってもよく、コンピュータ・プログラミング言語、スクリプト言語、またはアセンブリ言語でさえも使用してプログラミング可能である。また、コンピュータ・システムは、特別にプログラミングされた特殊目的ハードウェアであってもよい。汎用コンピュータ・システムでは、プロセッサは、通例、市販のプロセッサである。また、汎用コンピュータは、通例、オペレーティング・システムを有する。オペレーティング・システムは、他のコンピュータ・プログラムの実行を制御し、スケジューリング、デバッギング、入力/出力制御、アカウント管理、編集、ストレージ割り当て、データ管理およびメモリ管理、ならびに通信制御および通信関連サービスに対応する(provide)。コンピュータ・システムは、ローカル・ネットワークに、および/またはインターネットのような、ワイド・エリア・ネットワークに接続することもできる。接続されたネットワークは、コンピュータ・システムに、およびコンピュータ・システムから、コンピュータにおける実行のためのプログラム命令、ビデオ・データ、静止画像データ、またはオーディオ・データのようなメディア・データ、メタデータ、メディア・コンポジションに対する意見および承認情報、メディア注釈(media annotation)、ならびに他のデータを転送することができる。
【0054】
[0066] メモリ・システムは、通例、コンピュータ読み取り可能媒体を含む。この媒体は、揮発性または不揮発性、書き込み可能または書き込み不可能、および/または上書き可能もしくは上書き不可能であってもよい。メモリ・システムは、通例、データを二進形態で格納する。このようなデータは、マイクロプロセッサによって実行されるアプリケーション・プログラム、またはアプリケーション・プログラムによって処理されるためにディスクに格納されている情報を定めることができる。本発明は、特定のメモリ・システムには限定されない。磁気、光、またはソリッド・ステート・デバイスに時間ベース媒体を格納し、これらから入力することができる。これらのドライブは、ローカルまたはネットワーク・アタッチト・ディスクのアレイを含んでもよい。
【0055】
[0067] 本明細書において説明したようなシステムは、ソフトウェア、ハードウェア、ファームウェア、またはこれら3つの組み合わせで実装することができる。このシステムの種々のエレメントは、個別でもまたは組み合わせでも、1つ以上のコンピュータ・プログラム製品として実現することができ、コンピュータ・プログラム製品において、コンピュータ・プログラム命令は、コンピュータによる実行のために非一時的コンピュータ読み取り可能媒体に格納され、または接続されているローカル・エリアまたはワイド・エリア・ネットワークを介してコンピュータ・システムに転送される。プロセスの種々のステップは、このようなコンピュータ・プログラム命令を実行するコンピュータによって実行することができる。コンピュータ・システムは、マルチプロセッサ・コンピュータ・システムであってもよく、またはコンピュータ・ネットワークを介して接続された複数のコンピュータを含んでもよく、あるいはクラウドに実装されてもよい。本明細書において説明したコンポーネントは、コンピュータ・プログラムの別々のモジュールであってもよく、または別々のコンピュータ・プログラムでもよく、別々のコンピュータにおいて動作可能であってもよい。これらのコンポーネントによって生成されるデータは、メモリ・システムに格納することができ、またはコンピュータ・システム間で、搬送波信号のような種々の通信媒体によって送信することもできる。
【0056】
[0068] 以上、実施形態例について説明したが、以上のことは単なる例示であって限定ではなく、一例として紹介されたに過ぎないことは、当業者には明白なはずである。数多くの変更および他の実施形態も当業者の範囲内に入り、本発明の範囲に該当するものとして考えることとする。