IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ディズニー エンタープライゼス インコーポレイテッドの特許一覧

特開2024-16803デジタル・コンテンツの的を絞った再処理
<>
  • 特開-デジタル・コンテンツの的を絞った再処理 図1
  • 特開-デジタル・コンテンツの的を絞った再処理 図2A
  • 特開-デジタル・コンテンツの的を絞った再処理 図2B
  • 特開-デジタル・コンテンツの的を絞った再処理 図2C
  • 特開-デジタル・コンテンツの的を絞った再処理 図3
  • 特開-デジタル・コンテンツの的を絞った再処理 図4
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024016803
(43)【公開日】2024-02-07
(54)【発明の名称】デジタル・コンテンツの的を絞った再処理
(51)【国際特許分類】
   H04N 5/91 20060101AFI20240131BHJP
   H04N 21/234 20110101ALI20240131BHJP
   H04N 21/845 20110101ALI20240131BHJP
   H04N 5/765 20060101ALI20240131BHJP
   G11B 27/02 20060101ALI20240131BHJP
【FI】
H04N5/91
H04N21/234
H04N21/845
H04N5/765
G11B27/02 Z
【審査請求】有
【請求項の数】20
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2023099104
(22)【出願日】2023-06-16
(31)【優先権主張番号】17/873,511
(32)【優先日】2022-07-26
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】504399716
【氏名又は名称】ディズニー エンタープライゼス インコーポレイテッド
(74)【代理人】
【識別番号】100147485
【弁理士】
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】230118913
【弁護士】
【氏名又は名称】杉村 光嗣
(74)【代理人】
【識別番号】100169823
【弁理士】
【氏名又は名称】吉澤 雄郎
(72)【発明者】
【氏名】スコット ラブロージー
【テーマコード(参考)】
5C164
5D110
【Fターム(参考)】
5C164FA29
5C164MB44P
5C164SB01P
5C164SB26S
5C164TA08S
5D110AA27
5D110AA29
5D110CA09
5D110CC03
(57)【要約】      (修正有)
【課題】デジタル・コンテンツの的を絞った再処理用システム及び方法を提供する。
【解決手段】方法は、タイムライン上にインデックスを付けられたコンテンツを受信し、タイムライン上のタイムコードを識別する挿入データを受信し、挿入データを用いてコンテンツを符号化して、セグメント化されたコンテンツを提供する。コンテンツは、セグメント境界をタイムコードの所に有し、セグメント境界に接する第1セグメントは、セグメント境界に先行し、第2セグメントはセグメント境界に後続する。方法はまた、セグメント化されたコンテンツに基づいて、再処理用に最適なセグメント化されたコンテンツのシーケンスを決定し、第1、第2セグメントを処理して、フェードアウトを第1セグメント内又は第1セグメントに適用し、第2セグメント内又は第2セグメントにフェードインを適用し、フェードインを、第2セグメント内又は第2セグメントに適用する。
【選択図】図4
【特許請求の範囲】
【請求項1】
処理ハードウェア、及びソフトウェアコードを記憶するシステムメモリを有する計算プラットフォームを具えたシステムであって、
前記処理ハードウェアは、前記ソフトウェアコードを実行して、
タイムライン上にインデックスを付けられたデジタル・コンテンツを受信し、
前記タイムライン上のタイムコードを識別する挿入データを受信し、
前記挿入データを用いて前記デジタル・コンテンツを符号化して、セグメント化されたコンテンツを提供し、該セグメント化されたコンテンツは、前記タイムコードの所にセグメント境界を有し、かつ前記セグメント境界に接する第1セグメント及び第2セグメントを有し、前記第1セグメントは前記セグメント境界に先行し、前記第2セグメントは前記セグメント境界に後続し、
前記第1セグメント及び前記第2セグメントを再処理して、フェードアウトを前記第1セグメント内または前記第1セグメントに適用し、フェードインを前記第2セグメント内または前記第2セグメントに適用するように構成され、
前記第1セグメント及び前記第2セグメントを再処理することにより、追加的コンテンツの挿入ポイントとして設定された前記セグメント境界を有する符号化されたセグメントを提供するシステム。
【請求項2】
前記処理ハードウェアが、前記ソフトウェアコードを実行して、更に、
前記再処理の前に、前記セグメント化されたコンテンツに基づいて、前記再処理用に最適な前記セグメント化されたコンテンツのシーケンスを決定するように構成され、前記最適なシーケンスは、前記第1セグメント及び前記第2セグメントに加えて、少なくとも1つのコンテンツ・セグメントを含む、請求項1に記載のシステム。
【請求項3】
前記最適なシーケンスが、前記第1セグメント及び前記第2セグメントに加えて、複数のコンテンツ・セグメントを含み、該複数のコンテンツ・セグメントのうちの少なくとも1つが、前記第1セグメントに先行し、または前記第2セグメントに後続する、請求項2に記載のシステム。
【請求項4】
前記追加的コンテンツが新たなコンテンツである、請求項1に記載のシステム。
【請求項5】
前記追加的コンテンツが少なくとも1つの広告を含む、請求項4に記載のシステム。
【請求項6】
前記追加的コンテンツが、新たなコンテンツ、及び該新たなコンテンツに先行または該新たなコンテンツに後続するブラック・セグメントを含む、請求項1に記載のシステム。
【請求項7】
前記追加的コンテンツが、新たなコンテンツ、及び該新たなコンテンツに先行する第1ブラック・セグメント、及び該新たなコンテンツに後続する第2ブラック・セグメントを含む、請求項1に記載のシステム。
【請求項8】
前記再処理の前の前記セグメント化されたコンテンツの再生用のプレイリストと同じプレイリストを、前記再処理後の前記セグメント化されたコンテンツの再生用に使用することができる、請求項1に記載のシステム。
【請求項9】
前記再処理後の前記セグメント化されたコンテンツのタイムラインが、前記デジタル・コンテンツのタイムラインと一致する、請求項1に記載のシステム。
【請求項10】
前記セグメント化されたコンテンツが、調整可能ビットレート(ABR)コンテンツを含む、請求項1に記載のシステム。
【請求項11】
処理ハードウェア、及びソフトウェアコードを記憶するシステムメモリを有する計算プラットフォームを具えたシステムが用いる方法であって、
前記処理ハードウェアが前記ソフトウェアコードを実行することによって、タイムライン上にインデックスを付けられたデジタル・コンテンツを受信するステップと、
前記処理ハードウェアが前記ソフトウェアコードを実行することによって、前記タイムライン上のタイムコードを識別する挿入データを受信するステップと、
前記処理ハードウェアが前記ソフトウェアコードを実行することによって、前記挿入データを用いて前記デジタル・コンテンツを符号化して、セグメント化されたコンテンツを提供するステップであって、該セグメント化されたコンテンツは、前記タイムコードの所にセグメント境界を有し、かつ前記セグメント境界に接する第1セグメント及び第2セグメントを有し、前記第1セグメントは前記セグメント境界に先行し、前記第2セグメントは前記セグメント境界に後続するステップと、
前記処理ハードウェアが前記ソフトウェアコードを実行することによって、前記第1セグメント及び前記第2セグメントを再処理して、フェードアウトを前記第1セグメント内または前記第1セグメントに適用し、フェードインを前記第2セグメント内または前記第2セグメントに適用するステップとを含み、
前記第1セグメント及び前記第2セグメントを再処理することにより、追加的コンテンツの挿入ポイントとして設定された前記セグメント境界を有する符号化されたセグメントを提供する方法。
【請求項12】
前記再処理の前に、前記処理ハードウェアが前記ソフトウェアコードを実行することによって、前記セグメント化されたコンテンツに基づいて、前記再処理用に最適な前記セグメント化されたコンテンツのシーケンスを決定するステップを更に含み、前記最適なシーケンスは、前記第1セグメント及び前記第2セグメントに加えて、少なくとも1つのコンテンツ・セグメントを含む、請求項11に記載の方法。
【請求項13】
前記最適なシーケンスが、前記第1セグメント及び前記第2セグメントに加えて、複数のコンテンツ・セグメントを含み、該複数のコンテンツ・セグメントのうちの少なくとも1つが、前記第1セグメントに先行し、または前記第2セグメントに後続する、請求項12に記載の方法。
【請求項14】
前記追加的コンテンツが新たなコンテンツである、請求項11に記載の方法。
【請求項15】
前記追加的コンテンツが少なくとも1つの広告を含む、請求項14に記載の方法。
【請求項16】
前記追加的コンテンツが、新たなコンテンツ、及び該新たなコンテンツに先行または該新たなコンテンツに後続するブラック・セグメントを含む、請求項11に記載の方法。
【請求項17】
前記追加的コンテンツが、新たなコンテンツ、及び該新たなコンテンツに先行する第1ブラック・セグメント、及び該新たなコンテンツに後続する第2ブラック・セグメントを含む、請求項11に記載の方法。
【請求項18】
前記再処理の前の前記セグメント化されたコンテンツの再生用のプレイリストと同じプレイリストを、前記再処理後の前記セグメント化されたコンテンツの再生用に使用することができる、請求項11に記載の方法。
【請求項19】
前記再処理後の前記セグメント化されたコンテンツのタイムラインが、前記デジタル・コンテンツのタイムラインと一致する、請求項11に記載の方法。
【請求項20】
前記セグメント化されたコンテンツが、調整可能ビットレート(ABR)コンテンツを含む、請求項11に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
背景
コンテンツ媒体としてのそのほぼ普遍的な人気により、これまで以上のオーディオ-ビデオ(AV:audio-video:音響映像)コンテンツが制作されており、顧客にとって利用可能になっている。更に、ストリーミング(ストリーム配信)プラットフォームがAVコンテンツ用のますます重要な配信ハブになっているので、変化しやすいネットワーク状態、及びストリーミング・コンテンツを受信する多種多様な顧客の装置間のデータ処理能力の差に起因して、調整可能ビットレート(ABR:adjustable bit-rate)のAVコンテンツも、ますます重要になっている。その結果、ABRコンテンツを含むAVコンテンツを追加することができる効率、あるいは強化されたポストプロダクション(撮影後の作業、追加制作物)が、そのコンテンツのプロデューサ(制作者)、所有者、または配信者にとってますます重要になっている。
【背景技術】
【0002】
例として、一部の使用事例では、例えば広告のような追加的コンテンツを既存のAVコンテンツ、ポストプロダクションに追加することが有利であるか望ましいことがある。AVコンテンツが元々追加的コンテンツ用に事前に定められた挿入ポイントなしに制作された場合、そのコンテンツにポストプロダクションを導入することは、そのコンテンツを再生中に視聴する顧客にとって不快な、あるいは混乱する体験を生じさせ得る。例えば、AVコンテンツ中に深く考えずに挿入されている広告は、途中のシーン、更には途中のショット(場面)に見え、これにより顧客の視聴体験を目障り耳障りな感じでぶち壊しにすることがある。視聴者のぶち壊し感及び美的な意味での不快感を回避して追加的コンテンツを追加する従来の方法は、コンテンツを丸ごと再符号化することであり、今度は、広告または他の追加的コンテンツ用のセグメント境界を調整するに当たり用いる接合ポイントを考慮に入れる。しかし、こうした従来の方法は、コンテンツを再符号化するために必要な計算時間及び品質管理(QC:quality control)審査の両方の意味で、不所望なほど、一部の例では非実用的なほど高価である。
【図面の簡単な説明】
【0003】
図1】1つの実現による、デジタル・コンテンツの的を絞った再処理用の例示的システムの図である。
図2A】1つの実現による、既存のデジタル・コンテンツへの追加的コンテンツの挿入用のタイムコードを識別するマーカーを示す例示的な図である。
図2B】1つの実現による、セグメント境界を生成するための符号化後の、図2Aのデジタル・コンテンツを示す例示的な図である。
図2C】1つの実現による、図2Aのマーカーによって識別されるタイムコードの所にあるセグメント境界に接するそれぞれのセグメント内に、またはそれぞれのセグメントにフェードイン及びフェードアウトを適用するための的を絞った再処理後の、図2A及び2Bのデジタル・コンテンツを示す例示的な図である。
図3】1つの実現による、図2Cのフェードアウト及びフェードインを適用するための再処理後に、追加的コンテンツを挿入ポイントに導入する例示的な図である。
図4】1つの実現による、デジタル・コンテンツの的を絞った再処理用の例示的方法の概要を示すフローチャートである。
【発明を実施するための形態】
【0004】
詳細な説明
以下の説明は、本発明の実現に関連する具体的情報を含む。本発明は、本明細書中に具体的に説明する方法とは異なる方法で実現することができることは、当業者の認識する所である。本願中の図面、及びこれらの図面に伴う詳細な説明は、好適な実現に指向したものに過ぎない。特に断りのない限り、図面間で同様の、または対応する要素は、同様の、または対応する参照番号で示すことがある。更に、本願中の図面及び図示は一般に原寸に比例せず、実際の相対的寸法に対応することを意図していない。
【0005】
上述したように、オーディオ-ビデオ(AV)コンテンツが元々追加的コンテンツ用に事前に定められた挿入ポイントなしに制作された場合、そのコンテンツにポストプロダクションを導入することは、そのコンテンツを再生中に視聴する顧客にとって不快な、あるいは混乱する体験を生じさせ得る。例えば、AVコンテンツ中に深く考えずに挿入されている広告の形態の追加的コンテンツは、途中のシーン、更には途中のショット(場面)に見え、これにより顧客の視聴体験を目障り耳障りな感じでぶち壊しにすることがある。視聴者のぶち壊し感及び美的な意味での不快感を回避して追加的コンテンツを追加する従来の方法は、コンテンツを丸ごと再処理することであり、今度は、広告または他の追加的コンテンツ用のセグメント境界を調整するに当たり用いる接合ポイントを考慮に入れる。しかし、これも上述したように、こうした従来の方法は、コンテンツを再処理するのに必要な計算時間及び品質管理(QC)審査の両方の意味で、不所望なほど、一部の場合には非実用的なほど高価である。
【0006】
本願は、デジタル・コンテンツの的を絞った再処理用のシステム及び方法を開示する。なお、本願中に定義するように、「的を絞った再処理」という表現は、元のコンテンツの創作意図の美的意味での完全性に悪影響を与えずに、例えば広告のような新たな追加的コンテンツの導入を可能にするための、以前にトランスコードされているコンテンツの1つ以上のセクション、但しコンテンツの全体よりは小さいセクションの選択的再処理、あるいは、現在技術において既知であるブラック・スラグ(black slug)のようなブラック・セグメントを導入するための、メディア・プレイリストに対する的を絞った選択的修正、の一方または両方を参照し得る。本願中に開示する的を絞った再処理の解決策は、追加的コンテンツを上記挿入ポイントに導入することによって生成されるオーディオまたはビデオの主観的不規則性を回避するために必要であるものと考えられるセグメントのみを有利に再処理することによって、符号化されたデジタル・コンテンツのセグメント境界に追加的コンテンツをほぼシームレスに挿入することを可能にする。その結果、本発明の解決策は、再処理するために必要な時間、並びに検証に当たり必要なQC時間を大幅に低減しつつ、上述した最新技術を進歩させる、というのは、以前に符号化されたデジタル・コンテンツの的を絞ったシーケンス(列)のみを再処理するからである。
【0007】
なお、本願中に定義するように、「フェードアウト」という特徴は、十分に照明されたコンテンツからブラック(暗黒)への遷移を参照するのに対し、「フェードイン」という特徴は、ブラックから十分に照明されたコンテンツへの遷移を参照する。フェードアウト及びフェードインの各々は、例えば半秒間(0.5s)のような比較的短い継続時間、あるいは有利であるか望ましいと考えられる他のあらゆる時間間隔を有することができ、そして、デジタル・コンテンツから、例えば1つ以上の広告の形態の追加的コンテンツへ遷移し、そして元に戻る際に、主観的に快適な体験を視聴者に提供するために用いられる。
【0008】
具体例として、ストリーミング・プラットフォームは、広告支援または無広告の二者択一的であるサブスクリプション(加入)サービスを提供することができる。デジタル・コンテンツの的を絞った再処理用の本発明の解決策は、コンテンツを、フェードアウトまたはフェードインなしの無広告ティアの一部として、かつこうしたフェードアウト及びフェードインのある広告支援ティアの一部として配信することを可能にすることが有利である。換言すれば、本願中に開示する的を絞った再処理の解決策は、無広告のティア(即ち、フェードアウトまたはフェードインなし)には、クリーンで(邪魔物がなく)ぶち壊しでない体験を提供し、広告支援のティアには、ストリーム配信されるコンテンツと広告との間の(即ち、フェードイン及びフェードアウトを用いた)快適な遷移を提供する。更に、デジタル・コンテンツの的を絞った再処理のための本発明の解決策は、自動化された、あるいは実質的に自動化されたシステム及び方法を用いて実現することができることが有利である。
【0009】
本願中に定義するように、「自動化」、「自動化された」、及び「自動化する」は、システム管理者のようなユーザの関与を必要としないシステム及びプロセスを参照する。例えば、一部の実現では、人間の編集者またはQC技術者が、本明細書中に開示するシステム及び方法の性能を再検討することがあるが、こうした人間の関与は任意である。従って、一部の実現では、本願中に記載するプロセスを、開示するシステムのハードウェア処理構成要素の制御下で実行することができる。
【0010】
更に、本願中に定義するように、「デジタル・コンテンツ」は、AVコンテンツの多様な異なる種類及びジャンル、並びにオーディオ(音声)を伴わないビデオ(映像)、またはビデオを伴わないオーディオを参照し得る。デジタルAVコンテンツの具体例は、映画の形態の調整可能ビットレート(ABR)コンテンツ、TV(television:テレビジョン)のエピソードまたはシリーズ(連続物)、ビデオゲーム、及びスポーツイベントを含む。それに加えて、あるいはその代わりに、一部の実現では、「デジタル・コンテンツ」を、例えば、人物、架空のキャラクター、場所、物体、及びブランド及びロゴのような識別子のデジタル表現とすること、あるいは「デジタル・コンテンツ」がこうしたデジタル表現を含むことができ、こうしたデジタル表現は、例えば、仮想現実感(VR:virtual reality)、拡張現実感(AR:augmented reality)、または複合現実感(MR:mixed reality)環境に存在する。更に、このデジタル・コンテンツは、人物の身元、ユーザの履歴、資格、所有権、支払い、等のようなデータの連続性を提供しつつ、任意数のユーザが同期して持続的に体験することができる仮想世界を表すことができる。なお、本願が開示する概念は、従来型のAVと、対話型ビデオのような完全没入型のVR/AR/MR体験との混成であるデジタル・コンテンツに適用することもできる。
【0011】
図1に、1つの実現による、デジタル・コンテンツの的を絞った再処理用の例示的システムの図を示す。システム100は、処理ハードウェア104、及びコンピュータ可読の非一時的記憶媒体として実現されるシステムメモリ106を有する計算プラットフォーム102を含む。図1に示すように、一部の実現によれば、システムメモリ106は、的を絞った再処理のソフトウェアコード110を記憶し、コンテンツ・データベース108を任意で記憶する。
【0012】
図1に更に示すように、システム100は、トランスコードされていないデジタル・コンテンツ130(以下「デジタル・コンテンツ130」)及びデジタル・コンテンツ130用の挿入データ126を提供するコンテンツ源116、通信ネットワーク112、及びディスプレイ122を含むユーザシステム120を利用するユーザ124を含む使用環境内で実現することができる。それに加えて、図1は、コンテンツ源116及びユーザシステム120を、通信ネットワーク112経由でシステム100と通信結合する通信リンク114を示す。また図1には、デジタル・コンテンツ130に対応し、的を絞った再処理のソフトウェアコード110によって提供される再処理されたコンテンツ150も示す。
【0013】
なお、システム100は、コンテンツ130を、コンテンツ源116から通信ネットワーク112及びネットワーク通信リンク114経由で受信し、一部の実現では、コンテンツ源116が、計算プラットフォーム102と統合されたコンテンツ源の形をとることができ、あるいは、破線の通信リンク118で示すようにシステム100と直接通信することができる。更に、一部の実現では、システム100が、コンテンツ・データベース108の一方または両方を除外することができる。従って、一部の実現では、システムメモリ106が、的を絞った再処理のソフトウェアコード110は記憶するが、コンテンツ・データベース108は記憶しないことができる。
【0014】
なお、図1に示すシステム100の表現に関しては、的を絞った再処理のソフトウェアコード110及び任意のコンテンツ・データベース108を、概念的明確性のためにシステムメモリ106に記憶されるものとして表しているが、より一般的には、システムメモリ106は、あらゆるコンピュータ可読の非一時的記憶媒体の形をとることができる。本願中に用いる「コンピュータ可読の非一時的記憶媒体」という表現は、計算プラットフォーム102の処理ハードウェア104のような計算プラットフォームの処理ハードウェアに命令を提供する、搬送波または他の一時的信号を除いたあらゆる媒体を参照する。従って、コンピュータ可読の非一時的記憶媒体は、例えば揮発性媒体及び不揮発性媒体のような各種の媒体に相当することができる。揮発性媒体は、ダイナミック・ランダムアクセスメモリ(ダイナミックRAM:dynamic random access memory)のようなダイナミックメモリを含むことができるのに対し、不揮発性メモリは、光、磁気、または静電記憶デバイスを含むことができる。コンピュータ可読の非一時的記憶媒体に共通の形態は、例えば、光ディスク、RAM、プログラマブル・リードオンリー(読出し専用)メモリ(PROM:programmable read-only memory)、消去可能PROM(EPROM:erasable PROM)、及びフラッシュメモリを含む。
【0015】
更に、図1は、的を絞った再処理のソフトウェアコード110及び任意のコンテンツ・データベース108を、システムメモリ106内に互いに共同設置(同一場所に設置)されているように表しているが、この表現も概念的明確性の一助として提供するに過ぎない。より一般的には、システム100は、例えばコンピュータ・サーバーのような1つ以上の計算プラットフォームを含むことができ、これらの計算プラットフォームは、共同設置することができ、あるいは、例えばクラウドベースのシステムのような相互作用可能なようにリンクされた、但し分散型のシステムを形成することができる。その結果、処理ハードウェア104及びシステムメモリ106は、システム100内の分散プロセッサ及びメモリリソースに相当することができる。従って、的を絞った再処理のソフトウェアコード110及び任意のコンテンツ・データベース108は、システム100の分散メモリリソース内に、互いに対してリモート(遠隔的)に記憶することができることは明らかである。
【0016】
処理ハードウェア104は、例えば1つ以上の中央演算処理装置、1つ以上のグラフィックス・プロセシング・ユニット、1つ以上のテンソル処理装置、1つ以上のフィールド・プログラマブル・ゲートアレイ(FPGA:field programmable gate array)、及びアプリケーション・プログラミング・インタフェース(API:application programming interface)サーバーのような複数の処理装置を含むことができる。定義のために、本願中に用いる「中央演算処理装置(CPU:central processing unit)」、「グラフィックス・プロセシング・ユニット(GPU:graphics processing unit)」、及び「テンソル処理装置(TPU:tensor processing unit)」とは、それぞれが最新技術において慣用されている意味を有する。換言すれば、CPUは、計算プラットフォーム102の算術及び論理演算を実行するための演算装置(ALU:arithmetic logic unit:算術論理演算器)、並びに的を絞った再処理のソフトウェアコード110のようなプログラムをシステムメモリ106から読み出すための制御装置(CU:control unit)を含むのに対し、GPUは、計算が集約的なグラフィックスまたは他の処理タスクを実行することによってCPUの処理オーバーヘッドを低減するように実現することができる。TPUは、特に、機械学習モデル化のような人工知能(AI:artificial intelligence)用途向けに構成された特定用途向け集積回路(ASIC:application specific integrated circuit)である。
【0017】
更に、本願中に定義するように、「機械学習モデル」または「ML(machine learning)モデル」という表現は、データのサンプルまたは「学習データ」から学習したパターンに基づいて将来予測を行うための数学モデルを参照することがある。種々の学習アルゴリズムを用いて、入力データと出力データとの相互関係を対応付けることができる。これらの相互関係は、新たな入力データに対して将来予測を行うために用いることができる数学モデルを形成する。こうした予測モデルは、1つ以上のロジスティック回帰モデル、ベイズモデル、またはニューラルネットワーク(NN:neural network:神経回路網)を含むことができる。更に、「ディープ・ニューラルネットワーク(深層神経回路網)」は、ディープラーニング(深層学習)との関連で、入力層と出力層との間の複数の隠れ層を利用するNNを参照することがあり、このことは、生データ中に明示的に定義されていない特徴に基づく学習を可能にすることができる。種々の実現では、NNを分類器として学習させることができ、NNを利用して画像処理または自然言語処理を実行することができる。
【0018】
一部の実現では、計算プラットフォーム102が、例えばインターネットのようなパケット交換ネットワーク越しにアクセス可能な1つ以上のウェブ・サーバーに相当することができる。その代わりに、計算プラットフォーム102は、プライベート・ワイドエリア・ネットワーク(WAN:wide area network)、ローカルエリア・ネットワーク(LAN:local area network)をサポートする、あるいは他の種類の配信制限ネットワークまたはプライベート・ネットワーク内に含まれる1つ以上のコンピュータ・サーバーに相当することができる。更に他の代案として、一部の実現では、システム100を、データセンターにおけるように仮想的に実現することができる。例えば、一部の実現では、システム100をソフトウェアで、あるいは仮想マシンとして実現することができる。
【0019】
図1には、ユーザシステム120をデスクトップ・コンピュータとして示しているが、この表現も一例として提供するに過ぎない。より一般的には、ユーザシステム120は、ユーザ・インタフェースを提供し、通信ネットワーク112への接続をサポートし、そして本明細書中のユーザシステム120に属する機能を実現するのに十分なデータ処理能力を実現するあらゆる適切なモバイル(携帯)または定置のコンピュータ装置またはシステムとすることができる。例えば、他の実現では、ユーザシステム120が、ラップトップ・コンピュータ、タブレット・コンピュータ、またはスマートホンの形態をとることができる。
【0020】
ユーザシステム120のディスプレイ122に関しては、ディスプレイ122は、ユーザシステム120と物理的に統合することができ、あるいはユーザシステム120と通信結合し、但し物理的に分離することができる。例えば、ユーザシステム120がスマートホン、ラップトップ・コンピュータ、またはタブレット・コンピュータとして実現される場合、ディスプレイ122は一般にユーザシステム120と統合することができる。これとは対照的に、ユーザシステム120がデスクトップ・コンピュータとして実現される場合、ディスプレイ122は、コンピュータタワーの形態のユーザシステム120から分離されたモニターの形をとることができる。更に、ユーザシステム120のディスプレイ122は、液晶ディスプレイ(LCD:liquid crystal display)、発光ダイオード(LED:light emitting diode)ディスプレイ、有機発光ダイオード(OLED:organic LED)ディスプレイ、量子ドット(QD:quantum dot)ディスプレイ、または信号から光への物理変換を実行する他のあらゆる適切な表示スクリーンとすることができる。
【0021】
図2Aに、1つの実現による、デジタル・コンテンツ230Aに追加的コンテンツを挿入するための、タイムライン(時系列)228上にインデックスを付けたタイムコード236を識別するマーカー238を表す例示的な図を示す。デジタル・コンテンツ230Aは、概ね、図1中のデジタル・コンテンツ130に相当する。従って、デジタル・コンテンツ130は、本発明によりデジタル・コンテンツ230Aに帰する特性のいずれをも共有することができ、その逆も成り立つ。換言すれば、デジタル・コンテンツ230Aのように、デジタル・コンテンツ130はタイムライン228上にインデックスを付けることができる。なお、一部の実現では、マーカー238が、例えば、現在技術において既知である固定点の候補挿入時刻(FPCI:fixed point insertion time)の形をとることができる。
【0022】
図2Bに、セグメント境界234a、234b、234c、234d、及び234e、及びセグメント232a、232b、232c、232d、232e、及び232f(以下「セグメント232a~232f」)を生成するための符号化後の、セグメント化されたコンテンツ230Bを表す例示的な図を示し、コンテンツ230Bは図2A中のデジタル・コンテンツ230Aに相当する。なお、図2B中のセグメント境界234cは、マーカー238によって識別される、タイムライン228上のタイムコード236と一致する。
【0023】
なお、セグメント232a~232fのサイズまたは継続時間に関しては、種々の理由で、セグメント232a~232fの最小及び最大のセグメント継続時間に制限が課せられることがある。実際的意味では、例えば、単一のフレームしか含まないセグメントを有することは不所望である。その結果、ストリーミング・サービスが、配信するコンテンツ上で最小のセグメント継続時間を有するか、配信するコンテンツに最小のセグメント継続時間を課す、ということが実情であり得る。更に、一部のABRプロトコルについては、最小及び最大のセグメント継続時間を予め定めることができ、それらの値をコンテンツの記述中に含めることができる。例えば、ハイパーテキスト・トランスファー・プロトコル(HTTP:hypertext Transfer Protocol)ライブ・ストリーミング(HLS:HTTP Live Streaming)では、コンテンツ・プレイリスト・タグEXT-X-TARGETDURATIONを必要とし、この配信するコンテンツには最大のセグメント継続時間を指定する。
【0024】
図2Cに、1つの実現による、フェードアウト252をセグメント232cに適用し、フェードイン254をセグメント232d内またはセグメント232dに適用するための、セグメント境界234cに接するセグメント232c及び232dの再処理後の、図2B中のセグメント化されたコンテンツ230Bの一部分を表す図を示す。上述したように、フェードアウトまたはフェードインは、およそ0.5s、あるいは有利であるか望ましいと考えられる他のあらゆる時間間隔のタイムライン継続時間を有することができる。
【0025】
なお、図2Cに示す例示的実現によれば、セグメント232cのセグメント継続時間は、セグメント232cに適用されるフェードアウト252のタイムライン継続時間に一致するように予め定めることができるのに対し、セグメント232dのセグメント継続時間は、セグメント232dに適用されるフェードイン254のタイムライン継続時間に一致するように予め定めることができる。しかし、他の実現では、セグメント232cのセグメント継続時間をフェードアウト252のタイムライン継続時間よりも大きくすることができるのに対し、セグメント232dのセグメント継続時間をフェードイン254のタイムライン継続時間よりも大きくすることができる。従って、一部の実現では、フェードイン252を、セグメント232cの全体に適用するのではなくセグメント232c内に適用することができ、フェードイン254を、セグメント232dの全体に適用するのではなくセグメント232d内に適用することができる。換言すれば、種々の実現では、フェードアウト252及びフェードイン254を、それぞれのセグメント232c及び232d内に、またはそれぞれのセグメント232c及び232dに適用することができる。
【0026】
図3に、1つの実現による、図2Cに示すように、それぞれフェードアウト252及びフェードイン254を適用するための、セグメント232c及び232dの再処理によって提供される挿入ポイントに追加的コンテンツを導入する例示的な図を示す。図3に示すように、コンテンツを追加されたデジタル・コンテンツ356は、元々符号化されているセグメント332bと332e、再処理されたセグメント332cと332d、及び追加的コンテンツ340を含み、追加的コンテンツ340は、セグメント332cと332dとの間に提供される挿入ポイントに位置する。図3に更に示すように、追加的コンテンツ340は、少なくとも新たなコンテンツ342を含み、種々の実現では、新たなコンテンツ342に先行するブラック・セグメント344aまたは新たなセグメント342に後続するブラック・セグメント344bの一方または両方を含むこともできる。
【0027】
セグメント332b及び332eは、それぞれ、図2B中のセグメント232b及び232eに概ね相当する。更に、フェードアウト352を適用されているセグメント332c、及びフェードイン354を適用されているセグメント332dは、それぞれ、図2C中の、フェードアウト252を適用されているセグメント232c及びフェードイン254を適用されているセグメント232dに概ね相当する。従って、セグメント232b、232c、232d、232e、フェードアウト252、及びフェードイン254は、本発明により、それぞれセグメント332b、332c、332d、332e、フェードアウト352、及びフェードイン354に帰する特性のいずれをも共有することができ、その逆も成り立つ。
【0028】
システム100及び的を絞った再処理のソフトウェアコード110の機能を、図4を参照することによって更に説明する。図4に、1つの実現による、デジタル・コンテンツの的を絞った再処理用の例示的方法を提示するフローチャート460を示す。なお、図4に概略を示す方法に関しては、本願中の本発明の特徴の説明を曖昧にしないために、特定の細部及び特徴をフローチャート460から除外している。
【0029】
ここで図4を、図1及び1Aと組み合わせて参照すれば、フローチャート460は、タイムライン228上にインデックスを付けられたデジタル・コンテンツ130/230Aを受信するステップから始まる(動作461)。デジタル・コンテンツ130/230Aは、動作461において、システム100の処理ハードウェア104が、的を絞った再処理のソフトウェアコード110を実行することによって受信することができる。例えば、図1に示すように、一部の実現では、デジタル・コンテンツ130/230Aを、システム100がコンテンツ源116から、通信ネットワーク112及びネットワーク通信リンク114経由で、または通信リンク118経由で直接、のいずれかで受信することができる。しかし、図1に更に示すように、他の実現では、デジタル・コンテンツ130/230Aを、システム100がユーザシステム120から、通信ネットワーク112及びネットワーク通信リンク114経由で受信することができる。
【0030】
上述したように、デジタル・コンテンツ130/230Aは、AVコンテンツの多様な異なる種類及びジャンル、並びにオーディオを伴わないビデオ、またはビデオを伴わないオーディオのいずれをも含むことができる。デジタルAVコンテンツの具体例は、映画の形態のABRコンテンツ、TVのエピソードまたはシリーズ、ビデオゲーム、及びスポーツイベントを含む。それに加えて、あるいはその代わりに、一部の実現では、デジタル・コンテンツ130/230Aを、例えば、人物、架空のキャラクター、場所、物体、及びブランド及びロゴのような識別子のデジタル表現とすること、あるいはデジタル・コンテンツ130/230Aがこうしたデジタル表現を含むことができ、こうしたデジタル表現は、例えば、VR、AR、またはMR環境に存在する。更に、デジタル・コンテンツ130/230Aは、人物の身元、ユーザの履歴、資格、所有権、支払い、等のようなデータの連続性を提供しつつ、任意数のユーザが同期して持続的に体験することができる仮想世界を表すことができる。それに加えて、あるいはその代わりに、デジタル・コンテンツ130/230Aは、従来型のAVと、対話型ビデオのような完全没入型のVR/AR/MR体験との混成とすること、あるいはこうした混成を含むことができる。
【0031】
フローチャートは、タイムライン228上のタイムコード236を識別する挿入データ126を受信するステップを更に含む(動作462)。なお、挿入データ126に含まれるタイムコード236によって指定される、デジタル・コンテンツ130/230A内の位置は、例えば1つ以上の広告のような追加的コンテンツをデジタル・コンテンツ130/230A内に挿入するための挿入ポイントとすることができる。挿入データ126は、動作462において、システム100の処理ハードウェア104が、的を絞った再処理のソフトウェアコード110を実行することによって受信することができる。例えば、図1に示すように、一部の実現では、挿入データ126を、システム100がコンテンツ源116から、通信ネットワーク112及びネットワーク通信リンク114経由で、または通信リンク118経由で直接、のいずれかで受信することができる。しかし、図1に更に示すように、他の実現では、挿入データ126を、システム100がユーザシステム120から、通信ネットワーク112及びネットワーク通信リンク114経由で受信することができる。
【0032】
図2B図1、2A、及び4と組み合わせて参照すれば、フローチャート460は、挿入データ126を用いてデジタル・コンテンツ130/230Aを符号化して、セグメント化されたコンテンツ230Bを提供するステップを更に含み、セグメント化されたコンテンツ230Bは、セグメント境界234cをタイムコード236の所に有すると共に、セグメント境界234cに接する第1セグメント232c及び第2セグメント232dを有し、タイムライン228上で、第1セグメント232cはセグメント境界234cに先行し、第2セグメント232dはセグメント境界234cに後続する(動作463)。なお、一部の実現では、セグメント化されたコンテンツ230Bは、ABRコンテンツとすることができ、あるいはABRコンテンツを含むことができる。動作463における、挿入データ126を用いてデジタル・コンテンツ130/230Aを符号化して、セグメント化されたコンテンツ230Bを提供することは、計算プラットフォーム102の処理ハードウェア104が、的を絞った再処理のソフトウェアコード110を実行することによって実行することができる。
【0033】
一部の実現では、フローチャート460が、セグメント化されたコンテンツ230Bに基づいて、再処理用に最適なセグメント化されたコンテンツのシーケンス(セグメントの列)を決定するステップを更に含むことができ、この最適なシーケンスは、第1セグメント232c及び第2セグメント232dに加えて、少なくとも1つのコンテンツ・セグメントを含む(動作464)。例えば、第1セグメント232cの先頭にあるコンテンツ、第2セグメント232dの終端にあるコンテンツ、またはその両方にあるコンテンツは、再処理がそこで開始されるか終了するものとすれば、再処理されたコンテンツ150の再生時に耳や目につくオーディオ・アーティファクト(音声ノイズ)、ビデオ・アーティファクト(映像ノイズ)、またはオーディオ・アーティファクト及びビデオ・アーティファクトの両方を生じさせ得る特定の属性を有し得る。少なくとも第1セグメント232c及び第2セグメント232dを含むセグメント化されたコンテンツ232Bの最適な再処理のシーケンスを識別するプロセスは、こうした問題を軽減または解消するための多様な方法を含むことができる。例えば、再処理用の最適な開始時刻及び終了時刻を決定するプロセスは、ドルビービジョン(Dolby Vision:登録商標)ショット・メタデータ、シーン変化検出、チャンク(chunk)の境目の複雑性解析、等のようなコンテンツ・メタデータのうちの1つ以上を考慮することができる。
【0034】
なお、動作464は任意であり、一部の実現では、フローチャート460によって概要を示す方法から除外することができる。しかし、フローチャート460によって概要を示す方法に動作464を含める実現では、動作464を、計算プラットフォーム102の処理ハードウェア104が、的を絞った再処理のソフトウェアコード110を実行することによって実行することができる。なお、種々の使用事例では、セグメント化されたコンテンツ230Bのセグメントのうち、第1セグメント232c及び第2セグメント232dに加えて、最適な再処理のシーケンスに含まれる1つ以上のセグメントが、第1セグメント232cに先行することができ、第2セグメント232dに後続することができ、あるいは、これらのセグメントのうちの1つ以上が、第1セグメント232cに先行することができ、これらのセグメントのうちの1つ以上が第2セグメント232dに後続することができる。
【0035】
図2C及び3を図1、2A、2B、及び4と組み合わせて参照すれば、フローチャート460は、第1セグメント232c/332c、第2セグメント232d/332d、または動作464において決定した最適なシーケンスを再処理して、フェードアウト252/352を第1セグメント232c/332c内または第1セグメント232c/332cに適用し、フェードイン254/354を第2セグメント232d/332d内または第2セグメント232d/332dに適用する(動作465)。なお、第1セグメント232c/332c及び第2セグメント232d/332dを再処理することにより、追加的コンテンツ340の挿入ポイントとして設定されたセグメント境界234cを有する符号化されたセグメントを提供する。
【0036】
上述したように、そして図3に示すように、一部の実現では、追加的コンテンツ340が、新たなコンテンツ342、新たなコンテンツ342に先行するブラック・コンテンツ344a、及び新たなコンテンツ342に後続するブラック・セグメント344bを含むことができる。しかし、他の実現では、追加的コンテンツ340が、新たなコンテンツ342、及び新たなコンテンツ342に先行するブラック・コンテンツ344aまたは新たなコンテンツ342に後続するブラック・セグメント344bのいずれかを含むが、両方は含まないことができる。更に他の実現では、追加的コンテンツ340が新たなコンテンツ342を含むことができるが、ブラック・セグメント344a及び344bの両方を除外することができる。換言すれば、一部の実現では、追加的コンテンツ340が新たなコンテンツ342である。更に、一部の実現では、第1セグメント232c/332c及び第2セグメント232d/332dの一方または両方を除外することができ、ブラック・セグメント344a及びブラック・セグメント344bの一方または両方を含む追加的コンテンツ340を、元から符号化されているセグメント332bと332eとの間に挿入することができる。なお、種々の実現では、追加的コンテンツ340を、単一の広告または現在技術において既知であるアドポッド(as pod:連続する複数の広告を1まとまりとして扱う規格)のような1つ以上の広告の形態の新たなコンテンツ342とすることができ、あるいは、追加的コンテンツ340がこうした新たなコンテンツ342を含むことができる。
【0037】
動作465において実行される再処理は、計算プラットフォーム102の処理ハードウェア104が、的を絞った再処理のソフトウェアコード110を実行することによって実行することができる。例えば、第1セグメント232c/332c及び第2セグメント232d/332dを再処理して、追加的コンテンツ340の挿入ポイントとして設定されたセグメント境界234cを有する符号化されたセグメントを提供した後にも、セグメント化されたコンテンツ230Bのタイムラインはまだデジタル・コンテンツ130/230Aのタイムライン228と一致する。
【0038】
それに加えて、再処理前の、セグメント化されたコンテンツ230Bの再生用と同じプレイリストを、フェードアウト252/352をセグメント232c/332c内またはセグメント232c/332cに適用し、フェードイン254/354をセグメント232d/332d内またはセグメント232d/332dに適用する再処理後のセグメント化されたコンテンツ230Bの再生用に用いることができることが有利である。例えば、セグメント化されたコンテンツ230BがABRコンテンツの形をとる実現では、セグメント化されたコンテンツ230B用のABRプロトコル仕様が、離散したセグメントファイル用の例えばユニフォーム・リソース・ロケータ(URL:Uniform Resource Locator:統一資源位置指定子)のようなユニフォーム・リソース・アイデンティファイア(URI:Uniform Resource Identifier:統一資源識別子)を利用するプレイリストの形式を用いることができる。これらの使用事例では、セグメント化されたコンテンツ230B用の既存のプレイリストを、動作465におけるセグメント232c/332c及びセグメント232d/332dの再処理後に用いることができる。
【0039】
なお、フローチャート460によって説明した動作に関しては、動作461、462、463、及び465、あるいは動作461、462、463、464、及び465を、人間の関与を補該することができる自動化されたプロセスとして実行することができる。
【0040】
従って、本願は、デジタル・コンテンツの的を絞った再処理用のシステム及び方法を開示する。本願中に開示する的を絞った再処理の解決策は、追加的コンテンツを上記挿入ポイントに導入することによって生成されるオーディオまたはビデオの主観的不規則性を回避するために必要であるものと考えられるセグメントのみを有利に再処理することによって、符号化されたデジタル・コンテンツのセグメント境界に追加的コンテンツをほぼシームレスに挿入することを可能にする。その結果、本発明の解決策は、再処理するために必要な時間、並びに検証に当たり必要なQC時間を大幅に低減しつつ、上述した最新技術を進歩させる、というのは、以前に符号化されたデジタル・コンテンツの的を絞ったシーケンスのみを再処理するからである。
【0041】
以上の説明より、本願中に記載した概念の範囲から逸脱することなしに、これらの概念を実現するために種々の技術を用いることができることは明らかである。更に、特定の実現を参照しながらこれらの概念を説明してきたが、これらの概念の範囲から逸脱することなしに、形態及び細部に変更を加えることができることは、通常の当業者の認識する所である。このため、説明した実現は、あらゆる点で、限定的ではなく例示的なものとして考えるべきである。本願は、本明細書中に記載した特定の実現に限定されず、本発明の範囲から逸脱することなしに、多数の再構成、修正、及び代替が可能であることも明らかである。
図1
図2A
図2B
図2C
図3
図4
【外国語明細書】