IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ キヤノン株式会社の特許一覧

特許7442302データ処理装置およびその制御方法、プログラム
<>
  • 特許-データ処理装置およびその制御方法、プログラム 図1
  • 特許-データ処理装置およびその制御方法、プログラム 図2
  • 特許-データ処理装置およびその制御方法、プログラム 図3
  • 特許-データ処理装置およびその制御方法、プログラム 図4
  • 特許-データ処理装置およびその制御方法、プログラム 図5
  • 特許-データ処理装置およびその制御方法、プログラム 図6
  • 特許-データ処理装置およびその制御方法、プログラム 図7
  • 特許-データ処理装置およびその制御方法、プログラム 図8
  • 特許-データ処理装置およびその制御方法、プログラム 図9
  • 特許-データ処理装置およびその制御方法、プログラム 図10
  • 特許-データ処理装置およびその制御方法、プログラム 図11
  • 特許-データ処理装置およびその制御方法、プログラム 図12
  • 特許-データ処理装置およびその制御方法、プログラム 図13
  • 特許-データ処理装置およびその制御方法、プログラム 図14
  • 特許-データ処理装置およびその制御方法、プログラム 図15
  • 特許-データ処理装置およびその制御方法、プログラム 図16
  • 特許-データ処理装置およびその制御方法、プログラム 図17
  • 特許-データ処理装置およびその制御方法、プログラム 図18
  • 特許-データ処理装置およびその制御方法、プログラム 図19
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-02-22
(45)【発行日】2024-03-04
(54)【発明の名称】データ処理装置およびその制御方法、プログラム
(51)【国際特許分類】
   H04N 21/854 20110101AFI20240226BHJP
   H04L 67/02 20220101ALI20240226BHJP
【FI】
H04N21/854
H04L67/02
【請求項の数】 20
(21)【出願番号】P 2019211706
(22)【出願日】2019-11-22
(65)【公開番号】P2021083057
(43)【公開日】2021-05-27
【審査請求日】2022-11-11
(73)【特許権者】
【識別番号】000001007
【氏名又は名称】キヤノン株式会社
(74)【代理人】
【識別番号】110003281
【氏名又は名称】弁理士法人大塚国際特許事務所
(72)【発明者】
【氏名】強矢 亨
【審査官】鈴木 順三
(56)【参考文献】
【文献】国際公開第2019/121963(WO,A1)
【文献】米国特許出願公開第2019/52937(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 21/00 - 21/858
H04L 67/00 - 67/75
(57)【特許請求の範囲】
【請求項1】
複数のコンテンツを含む所定のフォーマットのファイルを解析して前記複数のコンテンツおよび前記複数のコンテンツの関係を示す関係情報を取得する取得手段と、
前記取得手段により取得された前記複数のコンテンツを格納する格納手段と、
前記格納手段から前記複数のコンテンツを個別に取得するための取得情報と、前記関係情報とを記述したプレイリストを生成する生成手段と、
前記プレイリストを外部装置に送信し、前記外部装置が前記プレイリストに含まれる前記取得情報を用いて要求したコンテンツを前記外部装置に送信する通信手段と、を備えることを特徴とするデータ処理装置。
【請求項2】
前記格納手段は、前記複数のコンテンツのそれぞれを、符号化データと前記符号化データの復号に必要な復号情報とを有する1つのファイルとして格納し、
前記取得情報は、前記格納手段から前記1つのファイルを取得するための情報であることを特徴とする請求項1に記載のデータ処理装置。
【請求項3】
前記格納手段は、前記複数のコンテンツのそれぞれについて、コンテンツを符号化して得られる符号化データと前記符号化データの復号に必要な復号情報を別々に格納し、
前記取得情報は、前記符号化データを取得するための情報を前記格納手段から取得するための情報と、前記復号情報を前記格納手段から取得するための情報と、を含むことを特徴とする請求項1または2に記載のデータ処理装置。
【請求項4】
前記複数のコンテンツは、静止画と前記静止画に対応するサムネイル画像とを含み、
前記関係情報は、前記静止画と前記サムネイル画像の対応を示す情報を含む、ことを特徴とする請求項1乃至3のいずれか1項に記載のデータ処理装置。
【請求項5】
前記複数のコンテンツは複数の静止画を含み、
前記関係情報は、前記複数の静止画の優先度を表す情報を含む、ことを特徴とする請求項1乃至4のいずれか1項に記載のデータ処理装置。
【請求項6】
前記複数のコンテンツは、画像と、前記画像に関連するメタデータとを含み、
前記関係情報は、前記画像と前記メタデータとの対応を示す情報を含む、ことを特徴とする請求項1乃至5のいずれか1項に記載のデータ処理装置。
【請求項7】
前記複数のコンテンツは複数の画像を含み、
前記関係情報は、前記複数の画像から派生する派生画像を表す、ことを特徴とする請求項1乃至6のいずれか1項に記載のデータ処理装置。
【請求項8】
前記派生画像は、前記複数の画像を並べて表示するグリッド画像であることを特徴とする請求項7に記載のデータ処理装置。
【請求項9】
前記派生画像は、前記複数の画像を重ね合わせて表示するオーバーレイ画像であることを特徴とする請求項7に記載のデータ処理装置。
【請求項10】
前記複数のコンテンツは、前記派生画像の生成に用いられる前記複数の画像の少なくとも1つに関連するアルファプレーンを含むことを特徴とする請求項7乃至9のいずれか1項に記載のデータ処理装置。
【請求項11】
前記関係情報は、前記派生画像と前記複数の画像について優先度を指定する情報を含むことを特徴とする請求項7乃至10のいずれか1項に記載のデータ処理装置。
【請求項12】
前記派生画像を1つの画像として生成する生成手段をさらに備え、
前記格納手段は、前記生成手段により生成された画像を前記外部装置から取得できるように格納し、
前記取得情報は、前記生成手段により生成された画像を取得するための情報を含み、
前記関係情報は、前記生成手段により生成された画像が前記派生画像の代替画像であることを示すことを特徴とする請求項7乃至11のいずれか1項に記載のデータ処理装置。
【請求項13】
前記複数のコンテンツは複数の画像を含み、
前記関係情報は、前記複数の画像のそれぞれが属する代替グループを表すことを特徴とする請求項1乃至6のいずれか1項に記載のデータ処理装置。
【請求項14】
前記複数のコンテンツは、複数の画像を含み、
前記関係情報は、前記複数の画像の各々の取得可能な時間を示すことを特徴とする請求項1に記載のデータ処理装置。
【請求項15】
前記関係情報は、取得可能な時間のそれぞれにおいて取得可能な複数の画像が存在することと、それぞれの時間における画像の優先度とを示すことを特徴とする請求項14に記載のデータ処理装置。
【請求項16】
前記所定のフォーマットはHEIF(High Efficiency Image File Format)であることを特徴とする請求項1乃至15のいずれか1項に記載のデータ処理装置。
【請求項17】
請求項1乃至16のいずれか1項に記載されたデータ処理装置の前記通信手段により送信された前記プレイリストを受信する受信手段と、
前記プレイリストに記述された前記取得情報と前記関係情報とを用いて、必要なコンテンツの送信を前記データ処理装置に要求する要求手段と、
前記要求手段の要求に応じて前記データ処理装置から送信されるコンテンツを受信し、処理する処理手段と、を備えることを特徴とするデータ処理装置。
【請求項18】
複数のコンテンツを含む所定のフォーマットのファイルを解析して前記複数のコンテンツおよび前記複数のコンテンツの関係を示す関係情報を取得する取得工程と、
前記取得工程により取得された前記複数のコンテンツを格納手段に格納する格納工程と、
前記格納手段から前記複数のコンテンツを個別に取得するための取得情報と、前記関係情報とを記述したプレイリストを生成する生成工程と、
前記プレイリストを外部装置に送信し、前記外部装置が前記プレイリストに含まれる前記取得情報を用いて要求したコンテンツを前記外部装置に送信する通信工程と、を備えることを特徴とするデータ処理装置の制御方法。
【請求項19】
請求項18に記載されたデータ処理装置の制御方法の実行により送信された前記プレイリストを受信する受信工程と、
前記プレイリストに記述された前記取得情報と前記関係情報とを用いて、必要なコンテンツの送信を前記データ処理装置に要求する要求工程と、
前記要求工程の要求に応じて前記データ処理装置から送信されるコンテンツを受信し、処理する処理工程と、を備えることを特徴とするデータ処理装置の制御方法。
【請求項20】
コンピュータを、請求項1乃至17のいずれか1項に記載のデータ処理装置の各手段として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、データ処理装置およびその制御方法、プログラムに関する。
【背景技術】
【0002】
近年、映像データをHTTP(Hypertext Transfer Protocol)でストリーミング配信する技術としてISOで標準化されたMPEG-DASH(Dynamic Adaptive Streaming over Http)が普及している。具体的には、送信装置が、映像データを所定の時間長のセグメントに分割し、セグメントを取得するためのURL(Uniform Resource Locator)をプレイリストと呼ばれるファイルに記述する。受信装置は初めにこのプレイリストを取得して、プレイリストに記述されている情報を用いて所望のセグメントを送信装置に要求して取得する。また、特許文献1では、MPEG-DASHを用いて映像データを取得する構成において、映像データに含まれる画像を時間的かつ空間的に分割して生成される複数のセグメントのうち、所望のセグメントを受信装置が選択して受信する構成が開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2016-9925号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、MPEG-DASHでは、符号化データとして動画(映像データ)を配信することしか想定されておらず、静止画を配信することは想定されていない。特許文献1は、1つの動画ファイルを時分割し、且つ、空間的に分割して得られたセグメントを配信するが、1つのファイルに複数の画像を含み得るファイル、例えばHEIFファイルを配信する場合に、個々の画像を配信可能にするものではない。なお、HEIFとは、High Efficiency Image File Formatの略である。また、本明細書において、画像とは動画と静止画を総称する用語である。従って、例えばコンテンツサーバに保持されたHEIFファイルに複数の静止画が格納され、受信装置がそのHEIFファイル中の一部の静止画のみを必要とするような場合でも、受信装置は当該HEIFファイルをまるごとダウンロードしなければならないという課題があった。
【0005】
本発明の一態様では、1つのファイルに格納された複数の画像から所望の画像を配信可能とする技術が提供される。
【課題を解決するための手段】
【0006】
本発明の一態様による送信装置は以下の構成を備える。すなわち、
複数のコンテンツを含む所定のフォーマットのファイルを解析して前記複数のコンテンツおよび前記複数のコンテンツの関係を示す関係情報を取得する取得手段と、
前記取得手段により取得された前記複数のコンテンツを格納する格納手段と、
前記格納手段から前記複数のコンテンツを個別に取得するための取得情報と、前記関係情報とを記述したプレイリストを生成する生成手段と、
前記プレイリストを外部装置に送信し、前記外部装置が前記プレイリストに含まれる前記取得情報を用いて要求したコンテンツを前記外部装置に送信する通信手段と、を備える。
【発明の効果】
【0007】
本発明によれば、1つのファイルに格納された複数の静止画から所望の静止画を配信可能とする技術が提供される。
【図面の簡単な説明】
【0008】
図1】実施形態による通信システムの構成を示す図。
図2】実施形態による送信装置の機能構成例を示すブロック図。
図3】実施形態におけるHEIFファイル解析処理の一例を示すフローチャート。
図4】送信装置において生成されるプレイリストの一例を示す図。
図5】送信装置において生成されるプレイリストの一例を示す図。
図6】送信装置において生成されるプレイリストの一例を示す図。
図7】送信装置において生成されるプレイリストの一例を示す図。
図8】送信装置において生成されるプレイリストの一例を示す図。
図9】送信装置において生成されるプレイリストの一例を示す図。
図10】送信装置において生成されるプレイリストの一例を示す図。
図11】送信装置において生成されるプレイリストの一例を示す図。
図12】送信装置において生成されるプレイリストの一例を示す図。
図13】送信装置において生成されるプレイリストの一例を示す図。
図14】送信装置において生成されるプレイリストの一例を示す図。
図15】送信装置において生成されるプレイリストの一例を示す図。
図16】送信装置において生成されるプレイリストの一例を示す図。
図17】実施形態による受信装置の機能構成例を示すブロック図。
図18】受信装置による受信処理の例を示すフローチャート。
図19】実施形態による送信装置のハードウエア構成例を示すブロック図。
【発明を実施するための形態】
【0009】
以下、添付図面を参照して実施形態を詳しく説明する。尚、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
【0010】
<第1実施形態>
図1に第1実施形態における通信システムの全体構成例を示す。送信装置100は、所定のフォーマットのファイルを配信するデータ処理装置の一例であり、ネットワーク150を介して、受信装置200と接続される。送信装置100は、画像データをHTTPプロトコルでストリーミング配信する。送信装置100は、後述のように、1つのファイルに含まれている複数の画像から所望の画像をストリーミング配信することができる。なお、送信装置100、受信装置200はそれぞれ複数存在しても良い。送信装置100の具体的な例としては、カメラ装置、ビデオカメラ装置、スマートフォン、携帯電話、PC装置、クラウドサーバ装置などが挙げられる。但し、後述の機能構成を満たすものであれば、送信装置100はこれらの例に限定されるものではない。受信装置200は、コンテンツの再生・表示機能、通信機能、及びユーザからの入力を受け付ける機能を備えるデータ処理装置である。受信装置200の具体例は、スマートフォン、携帯電話、PC装置、テレビなどが挙げられる。但し、後述の機能を備えるものであれば、受信装置200はこれらに限定されるものではない。
【0011】
ネットワーク150は、送信装置100と受信装置200を通信可能に接続する。ネットワーク150の例としては、例えば有線LAN(Local Area Network)や無線LAN(Wireless LAN)が挙げられる。但し、ネットワーク150は、これらに限られるものではなく、例えば、インターネットや3G/4G/LTE/5GなどのWAN(Wide Area Network)、アドホックネットワーク、Bluetoothなどでもよい。
【0012】
次に、第1実施形態における送信装置100の機能構成について、図2を用いて説明する。図2は、第1実施形態による送信装置100の機能構成例を示すブロック図である。
【0013】
ファイル解析部101と符号化データ抽出部102では、複数のコンテンツを含む所定のフォーマットのファイルを解析して、複数のコンテンツおよびそれら複数のコンテンツの関係を示す関係情報を取得する。本実施形態において、所定のフォーマットのファイルとは、例えばHEIF(High Efficiency Image File Format)ファイルである。また、関係情報とは、静止画とサムネイル画像の関係、派生画像とそれを構成する画像の関係などがあげられる。ファイル解析部101はHEIFファイルを取得し、その構造を解析する。符号化データ抽出部102は、HEIFファイルの解析結果を基にHEIFファイルに格納されたコンテンツの符号化データを抽出する。セグメント生成部103は、符号化データ抽出部102が抽出した符号化データを、必要に応じて通信に適した時間長やビットレートに変換し、符号化データを格納したセグメントを生成する。符号化データ変換部104は、抽出された符号化データを必要に応じて異なる符号化形式に変換する。尚、セグメント生成部103は、符号化データ変換部104により生成された符号化データを格納したセグメントを生成する機能も有する。
【0014】
配信データ格納部105は、以上のようにして取得された複数のコンテンツを、外部装置(本実施形態の例では受信装置200)が個別に取得することができるように格納する。より具体的には、配信データ格納部105は、セグメント生成部103および符号化データ変換部104で生成されたデータを格納する。プレイリスト生成部106は、配信データ格納部105から複数のコンテンツを個別に取得するための取得情報(本実施形態ではURL(Uniform Resource Locator))と、上述した関係情報とを記述したプレイリストを生成する。より具体的には、プレイリスト生成部106は、HEIFファイルの解析結果を基に配信データ格納部105に格納されたデータへのアクセスを可能とするURLを記述したプレイリストを生成する。関係情報の詳細については後述する。通信部107は外部装置である受信装置200からの要求に応じて、生成されたプレイリスト、配信データなどを、ネットワーク150を介して受信装置200に送信する。
【0015】
以上のような各機能部は、一つ又は複数のCPUが一つ又は複数のメモリに格納された所定のプログラムを実行し、制御することにより実現され得る。なお、上記機能部の各々の1部或いはすべてが専用のハードウエアによって実現されてもよい。
【0016】
ここで、図19のブロック図を参照して、実施形態による送信装置100のハードウエア構成について説明する。送信装置100は、CPU121、ROM122、RAM123、補助記憶装置124、表示部125、操作部126、通信I/F127、及びバス128を有する。
【0017】
CPU121は、ROM122やRAM123に格納されているコンピュータプログラムやデータを用いて送信装置100の全体を制御することで、図2に示す送信装置100の各機能を実現する。なお、送信装置100がCPU121とは異なる1又は複数の専用のハードウエアを有し、CPU121による処理の少なくとも一部を専用のハードウエアが実行してもよい。専用のハードウエアの例としては、ASIC(特定用途向け集積回路)、FPGA(フィールドプログラマブルゲートアレイ)、およびDSP(デジタルシグナルプロセッサ)などがある。ROM122は、変更を必要としないプログラムなどを格納する。RAM123は、補助記憶装置124から供給されるプログラムやデータ、及び通信I/F127を介して外部から供給されるデータなどを一時記憶する。補助記憶装置124は、例えばハードディスクドライブ等で構成され、画像データや音声データなどの、受信装置200への送信対象となる種々のデータ(ファイル)を記憶する。
【0018】
表示部125は、例えば液晶ディスプレイやLED等で構成され、ユーザが送信装置100を操作するためのGUI(Graphical User Interface)などを表示する。操作部126は、例えばキーボードやマウス、ジョイスティック、タッチパネル等で構成され、ユーザによる操作を受けて各種の指示をCPU121に入力する。CPU121は、表示部125を制御する表示制御部、及び操作部126を制御する操作制御部として動作する。
【0019】
通信I/F127は、送信装置100と外部の装置(例えば受信装置200)との通信に用いられる。本実施形態では、通信I/F127はネットワーク150と接続するインターフェイスである。送信装置100がネットワーク150と有線で接続される場合には、通信用のケーブルが通信I/F127に接続される。送信装置100がネットワーク150と無線で接続される場合には、通信I/F127はアンテナを備える。バス128は、送信装置100の各部をつないで情報を伝達する。
【0020】
なお、本実施形態では補助記憶装置124、表示部125、操作部126が送信装置100の内部に存在するものとするが、これらの少なくとも一つが送信装置100の外部に別の装置として存在していてもよいし、省略されてもよい。
【0021】
次に、本実施形態における送信装置100においてHEIFファイルを解析する処理の流れについて図3を用いて説明する。図3は、ファイル解析部101によるHEIFファイルの解析処理の一例を示すフローチャートである。
【0022】
まず、ステップS301において、ファイル解析部101は、配信対象となるHEIFファイルを取得する。次に、ステップS302において、ファイル解析部101は、HEIFファイルのmetaヘッダ内にハンドラタイプpictが存在するかを確認する。pictハンドラが存在しないと判定された場合(ステップS302でNO)は、ファイル解析部101は、これ以上の解析を行わずに本処理を終了する。一方、pictハンドラが存在すると判定された場合(ステップS302でYES)、ステップS303において、ファイル解析部101は、HEIFファイルに格納されているアイテムの数と種類を取得する。尚、HEIFファイルでは、格納されている画像、画像に関連するメタデータなどのコンテンツをアイテムと呼ぶ。
【0023】
次に、ステップS304において、ファイル解析部101は、アイテム間の参照情報を取得する。例えば、HEIFファイルには、静止画とそのサムネイル画像の関係を示す参照情報が格納されている。また、HEIFファイルは、複数の画像を組み合わせて1つの画像を生成するための画像を格納することができる。複数の画像を組み合わせて生成される1つの画像を派生画像と呼ぶ。HEIFにおいて、派生画像がアイテムとして含まれている場合は、派生画像とその派生画像を構成する複数の画像との関係を示す参照情報がHEIFファイルに格納されている。また、派生画像を生成するためには、複数の画像を配置するための位置の情報が必要となる。そこで、ファイル解析部101は、HEIFファイルのアイテムに派生画像が含まれている場合(S305でYES)には、ステップS306において、派生画像を生成する為の座標情報を取得する。なお、HEIFファイルのアイテムに派生画像が含まれていない場合(S305でNO)は、ステップS306はスキップされる。派生画像の扱いについては、第2実施形態により詳述する。
【0024】
ステップS307において、ファイル解析部101は、HEIFファイルからアイテムの代替情報を取得する。代替情報が設定されている具体的なケースとしては、例えば派生画像を表示する事が出来ない場合に、代わりに表示する画像を指定するケースがある。代替画像に関しては、第2実施形態でより詳しく述べる。次にステップS308において、ファイル解析部101は、各アイテムに紐づくプロパティを特定する。プロパティの具体例としては、アイテムの符号化情報、矩形サイズ情報などがあげられる。そこで次のステップS309において、ファイル解析部101は、特定したプロパティから符号化情報と画像の矩形サイズ情報を取得する。次に、ステップS310において、ファイル解析部101は、HEIFファイル内におけるアイテムの位置とサイズ情報を取得する。
【0025】
符号化データ抽出部102は、以上のようにしてファイル解析部101が取得したアイテムの位置とサイズ情報を基に、HEIFファイルからアイテムを抽出する。符号化データ変換部104は、抽出された符号化データを必要に応じて異なる符号化形式に変換する。例えば、符号化データ変換部104は、データの変換前の符号化形式がHEVCであった場合に、必要応じてこれをJPEGに変換する。取得情報は、異なる符号化形式に変換したものを取得可能なURLを含み得る。セグメント生成部103は、符号化データ抽出部102により抽出された符号化データおよび符号化データ変換部104により変換された符号化データからセグメントを生成し、配信データ格納部105に格納する。プレイリスト生成部106は、ファイル解析部101が取得した参照情報、符号化情報、画像サイズ情報などを用いて、受信装置200が配信データ格納部105に格納されたセグメントにアクセスするためのプレイリストを生成する。
【0026】
次に、第1実施形態における送信装置100において生成されるプレイリストの例について、図4図9を用いて説明する。図4は、本発明の一実施形態である送信装置において生成するプレイリストの一例であり、複数の画像が格納されたHEIFファイルを配信可能とする記述例である。図4のプレイリストは、取得情報として4つの静止画と4つのサムネイル画像のURLを含み、関係情報として静止画とサムネイル画像の対応を示す情報を含む。
【0027】
図4に示すプレイリストは、MPEG-DASHにおける配信に用いられるMPD(Media Presentation Description)の一部を示している。図4において、プレイリストは4つの画像と各々の画像のサムネイル画像が取得可能である事を示している。図4では、画像を各々Representationとして記述し、各々のSubRepresentationとしてサムネイル画像を記述している。サムネイル画像に関しては、タイプ属性401に示す様に、サムネイル画像である事を示すタイプ"thmb"が記述されている。なお、画像については、タイプ属性として"image"が記述されている。画像とサムネイル画像の関係は、RepresentationとSubRepresentationの関係により表される。
【0028】
また、図4においてマイムタイプ402(mimeType)は、Representation以下の4つの画像およびサムネイル画像のマイムタイプを示している。図4の例では、マイムタイプ402は、HEVCで符号化された画像を格納したHEIFファイルである事を示している(image/heic)。つまり、送信装置100は、配信するHEIFファイルに複数の画像が格納されていた場合、改めて各々の画像を1つだけ格納するHEIFファイルを生成する。このHEIFファイルへの再カプセル化は、セグメント生成部103で行われ、生成されたHEIFファイルは配信データ格納部105に格納される。
【0029】
また、図4においてRepresentationの属性としてプライマリ属性403~406を記述している。プライマリ属性は、複数のアイテム(画像)間の優先度を示す情報であり、関係情報の一例である。HEIFファイルでは、複数の画像が格納されている場合に、優先的に表示や印刷を行うアイテムを指定する事が出来る。図4の例ではプライマリ属性403の値を"1"、その他のプライマリ属性404、405、406の値を"0"とする事で、プライマリ属性の値"1"を設定された画像がプライマリ画像である事を示している。
【0030】
尚、HEIFファイルではプライマリアイテムを示す情報として、アイテムの識別子を1つ指定する為、MPDで表現するには、上記の様にどれか1つのプライマリ属性の値を"1"とすれば実現可能である。なお、"0"か"1"の2レベルではなく、例えば"0"を最高優先度として、"1"、"2"と値が大きくなるに従い優先度を下げる様にすれば、容易に3つ以上のレベルの優先度を表現する事ができる。
【0031】
次に、プレイリストの他の例について図5を用いて説明する。図4の例では、送信装置100が、入力されたHEIFファイルに格納されていた複数の画像のそれぞれを、画像を1つだけ格納したHEIFファイルとして再カプセル化するケースを説明した。次に、再カプセル化しないケースについて図5を用いて説明する。再カプセル化しない場合、複数のコンテンツ(本例では、複数の画像)のそれぞれについて、コンテンツを符号化して得られる符号化データと、その符号化データの復号に必要な復号情報とが別々に格納される。これらを取得するための取得情報は、符号化データを配信データ格納部105から取得するための情報と、復号情報を配信データ格納部105から取得するための情報と、を含む。図5は、第1実施形態の送信装置100において生成されるプレイリストの一例であり、特に複数の画像が格納されたHEIFファイルを配信可能とするもう1つの記述例である。
【0032】
図5において、初期化情報501はHEVCで符号化された1つ目の画像を復号する為に必要な復号情報の一例であり、画像データ502は1つ目の画像のHEVC符号化データを示す。つまり、入力されたHEIFファイルから抽出した初期化情報と符号化情報をカプセル化することなくそのまま取得可能としている。同様に、初期化情報503と画像データ504は、1つ目の画像のサムネイル画像の初期化情報と符号化情報である。
【0033】
なお、図5のマイムタイプ505は"image/H265"と記述されている。画像のサブタイプとして"H265"はIANA(Internet Assigned Number Authority)で承認されていない。しかし、図5の様に再カプセル化が不要であれば、入力されたHEIFファイルから抽出したデータをそのまま利用する事が出来る為、送信装置100での処理を簡略化する事ができる。つまり、図5の記述例では、セグメント生成部103において、抽出した画像アイテムを改めてHEIFファイルとしてカプセル化しなくても良い。
【0034】
以上、図4図5では、サムネイル画像を、画像のRepresentation内におけるSubRepresentationとして記述することで、画像とサムネイル画像の関係を表した。すなわち、RepresentationとSubRepresentationの関係が、画像間の関係情報に相当する例である。次に、サムネイル画像をRepresentationとして記述するケースについて図6を用いて説明する。図6は、第1実施形態の送信装置100において生成されるプレイリストの一例であり、特に複数の画像が格納されたHEIFファイルを配信可能とするプレイリストの記述例である。
【0035】
図6において、Representationのタイプ属性601はサムネイルである事を示す。Representationの参照識別子602に当該サムネイルの基画像のRepresentationの識別子603の値である"0"を記述する事で、このサムネイルはRepresentationの識別子が"0"の画像のサムネイルである事を示すことが出来る。すなわち、参照識別子602は、画像間の関係を表す関係情報の例である。図6では、同様に4つの画像の各々についてサムネイル画像をRepresentationとして記述している。
【0036】
また、複数の画像と各々のサムネイル画像の組合せについてのプレイリストの記述例について、図7を用いて説明する。図7は、第1実施形態の送信装置100において生成されるプレイリストの一例であり、特に複数の画像が格納されたHEIFファイルを配信可能とするプレイリストの記述例である。
【0037】
図7において、サムネイル画像は、基となる画像とは異なるRepresentationのSubRepresentationとして記述されている。SubRepresentationのタイプ属性701(type=thmb)でサムネイル画像である事を示し、参照識別子702で基となる画像のRepresentationの識別子703の値を記述している。
【0038】
第1実施形態において、ここまでに説明したMPDの記述例は、何れも複数の画像と各々のサムネイル画像を記述したものであるが、同じ属性値をまとめて記述する事で記述量を削減するケースについて、図8を用いて説明する。プレイリストの記述量の削減は、プレイリストの送受信に要する時間を削減する。図8は、第1実施形態による送信装置100において生成されるプレイリストの一例であり、特に複数の画像と各々のサムネイル画像が格納されたHEIFファイルを配信可能とする際に、MPDの記述量を削減することができる記述例である。
【0039】
図8において、同じ属性情報を持つ4つの画像が1つのRepresentationの異なるセグメントとして記述される。同様に、同じ属性情報を持つ4つのサムネイル画像も1つのRepresentationの異なるセグメントとして記述される。サムネイル画像を記述したRepresentationでは、タイプ属性801でサムネイル画像である事が示されている。また、サムネイル画像を示す各セグメントの参照識別子802により基となる画像の識別子803を記述する事で、サムネイル画像と元となる画像を紐付ける事ができる。更に図8の様にプライマリ属性804を、画像を表すセグメント毎に記述することで、プライマリアイテムも識別する事ができる。
【0040】
次に、画像以外のアイテムとして、EXIFなどのメタデータをMPDに記述するケースについて図9を用いて説明する。図9は、第1実施形態による送信装置100において生成されるプレイリストの一例であり、特にEXIFなどのメタデータをMPDに記述する場合のプレイリストの記述例である。
【0041】
図9において、MPDに記述するアイテムはXMP(Extensible Metadata Platform)とEXIFであり、マイムタイプ901はこれらメタデータのデータ形式がXMLである事を示している。図9の1つ目のRepresentationはタイプ属性902でXMPである事を示しており、参照識別子903はこのXMPが付随する画像の識別子を記述する。更にもう1つのRepresentationはタイプ属性904でEXIFである事を示しているが、図9の例では、EXIFの情報をXML形式に変換したものを取得可能である事を示しており、参照識別子905は、このEXIFが付随する画像の識別子を示す。
【0042】
以上のように、第1実施形態によれば、1つのHEIFファイルに格納された複数の画像から所望の画像を配信可能とすることが可能になる。
【0043】
<第2実施形態>
第1実施形態では、複数の画像が格納されたHEIFファイルを配信可能とするプレイリストについて説明した。第2実施形態では、HEIFの派生画像、代替画像をMPDに記述するケースについて説明する。なお、第2実施形態による通信システムをおよびデータ処理装置としての送信装置100の構成、動作は第1実施形態(図1図2図3)と同様である。第2実施形態では、特に図3のステップS306で取得される派生画像に関する記述を例示する。
【0044】
図10(a)は、派生画像の構成例を示す図である。また、図10(b)は、第2実施形態による送信装置100において生成されるプレイリストの一例であり、特に複数の画像を組み合わせて1つの画像を生成する派生画像をMPDに記述する記述例である。
【0045】
図10(a)に示されるように、本実施形態で例示される派生画像は、4つの画像(id=1~id=4の画像)を縦横に2つ並べて生成したグリッド画像である。派生画像と派生画像を構成する4つの画像は図10(b)のプレイリストにおいてRepresentationとして記述されている。派生画像のRepresentationにおいて、タイプ属性1001は派生画像を示すタイプである"dimg"が記述される。また、派生画像のRepresentationに含まれているSubRepresentationのタイプ属性1002に、派生画像の詳細タイプであるグリッド画像を示す"grid"が記述される。さらに、カウント属性1003に当該グリッド画像を構成する画像の数である"4"が記述される。
【0046】
更に、SubRepresentation以下のセグメントとして、派生画像(グリッド画像)を構成する4つのセグメント情報1004が記述される。セグメント情報1004の各セグメントは、参照識別子として構成画像(=セグメント)を含むRepresentationの識別子を記述することで、派生画像がどの画像によって構成されるのかを明示する。また、セグメント情報1004には、各セグメントの配置を示す情報として、セグメントを表示する位置を示す座標情報が記述されている。尚、図10(b)では座標情報として左上の座標を記述しているが、座標を示す情報はグリッド画像における各画像の表示位置を特定出来れば良いので、右下や中心の座標などでも良い。
【0047】
ところで、HEIFの派生画像にはグリッド以外にも種類があり、その中でもオーバーレイ画像はグリッド画像と同様の記述方法で表現する事ができる。派生画像としてオーバーレイ画像を生成、表示するには、派生画像を構成する画像の座標情報以外に、それらを重ねるための順番を示すレイヤー情報が必要となる。レイヤー情報は、例えば、セグメント情報1004に記述された各セグメントの属性情報の1つとして記述され得る。あるいは、セグメント情報1004に記述されるセグメントの順番がレイヤーの順序を示すものとしても良い。
【0048】
次に、図10(b)で説明した派生画像の記述量を削減するプレイリストについて図11を用いて説明する。図11は、第2実施形態による送信装置100において生成されるプレイリストの他の例であり、特に複数の画像を組み合わせて1つの画像を生成する派生画像を配信可能とする際に、MPDの記述量を削減する記述例である。
【0049】
図11において、派生画像に関する記述は図10の例と同様である。すなわち、Representationのタイプ属性("dimg")で識別し、SubRepresentationのタイプ属性("grid")とカウント属性("4")で派生画像の詳細タイプと派生画像を構成するセグメントの数が示される。一方、派生画像を構成する構成画像については、第1実施形態で説明した図8のプレイリストと同様に、同じ属性情報を持つ構成画像を1つのRepresentationにまとめることで記述量を削減している。ところが、構成画像を1つのRepresentationにまとめると、派生画像のセグメント情報が参照するRepresentationの識別子が、構成画像間で同一になってしまう。そこで、本実施形態では、派生画像を構成するセグメントに記述される参照識別子1101は、構成画像をまとめたRepresentationの識別子1102と構成画像であるセグメントの補助識別子1103を組合せて記述する。図11では、2つの識別子をハイフンでつなげる形式で記述している。
【0050】
次に、図3のステップS307で、アイテムの代替情報が取得された場合について説明する。例えば、受信装置200の能力によっては、プレイリストに記載された派生画像を表示できない場合がある。その様な場合に、派生画像の代わりに表示する画像を記述したプレイリストについて図12を用いて説明する。図12は、第2実施形態による送信装置100において生成されるプレイリストの一例であり、表示する画像に優先度を設定する事で代替画像を示す記述例である。
【0051】
図12において、派生画像は4つの構成画像と1つのSEI(Supplemental Enhancement Information:アルファプレーン)から生成される。ここで、派生画像の表示を最優先とするが、受信装置200が派生画像を表示できない場合には、その派生画像を構成する画像のうちの1つが派生画像に替えて表示される代替画像として用いられる。この場合、派生画像のプライマリ属性を最高優先度とし、代替画像として用いる画像にはその次の優先度を設定する。プライマリ属性の値が"0"を最高優先度とし、数が大きくなる毎に優先度が低くなるものとする。図12では派生画像のプライマリ属性1201の値を"0"としている。また、次点として1つ目の構成画像のプライマリ属性1202の値を"1"として、更に次点として2つ目の構成画像のプライマリ属性1203の値と3つ目の構成画像のプライマリ属性1204の値を共に"2"としている。プライマリ属性の値が等しい場合は、どちらを選択しても良いものとする。
【0052】
次に、代替画像を示す方法として、優先度ではなく代替グループを設定するケースについて、図13を用いて説明する。図13は、第2実施形態による送信装置100において生成されるプレイリストの一例であり、画像に代替グループを設定する記述例である。図13では、HEIFファイルに含まれている複数のコンテンツは、相互に代替する画像のグループを代替グループとして含み、関係情報は、複数の画像のそれぞれがどの代替グループに属するかを表す。
【0053】
図13において、画像1~6は代替グループ属性1301~1306が記述されており、代替グループ属性の値が等しいものが代替可能なグループを表す。図13では、代替グループ属性1301~1303の値が"1"、代替グループ属性1304~1306の値が"2"と記述されている。よって、受信装置200は、画像1~3の中から1つ、同様に画像4~6の中から1つを選択して使用する事ができる。図13のプレイリストの例では、サイズの異なる複数の画像を含む2つの代替グループが記述されている。なお、図13では、サイズが異なる複数の画像が代替グループに属している例を示したがこれに限られるものではない。例えば、異なる符号化方法で符号化された複数の画像が代替グループに属してもよい。このようにすれば、受信装置200は、自身が対応している符号化データに対応して、柔軟に画像を選択することができる。
【0054】
次に、受信装置200において派生画像を表示できない場合を考慮して、生成済みの派生画像を用意するケースについて、図14を用いて説明する。図14は、第2実施形態による送信装置100において生成されるプレイリストの一例であり、予め送信装置100側で派生画像を生成することで派生画像を取得可能にする記述例である。
【0055】
図14のプレイリストにおいて、派生画像1401は、図10における派生画像の記述と同様に4つの構成画像から生成される。派生画像1402は、派生画像1401を1つの画像としてHEVCで再符号化したものである。また、派生画像1403は、派生画像1401を1つの画像としてJPEGで再符号化したものである。派生画像1402,1403は、符号化データ変換部104で生成される。また、3つの派生画像は同じ代替グループに設定されている(alt="1")。派生画像1402,1403は、派生画像1401の代替画像となり得る。従って、4つの構成画像から派生画像を生成する事ができない受信装置200は、1つの画像として生成済みの派生画像である派生画像1402(HEIF)か派生画像1403(JPEG)のどちらかを取得して利用することができる。
【0056】
以上、第2実施形態では、派生画像、代替画像に関する関係情報を例示した。なお、第2実施形態では、複数の静止画を組み合わせて1つの画像を表示する派生画像の記述方法を中心に説明してきたが、本実施形態で説明した方法を用いれば、静止画と動画を組み合わせた派生画像を記述する事も容易になし得る事は言うまでもない。
【0057】
<第3実施形態>
次に、第3実施形態として、スライドショーの様に再生時間に応じて表示する画像を変更させるケースについて説明する。なお、第3実施形態による通信システムをおよび送信装置の構成、処理は第1実施形態(図1図2図3)と同様である。
【0058】
図15は、第3実施形態である送信装置において生成するプレイリストの一例であり、特に再生時刻の経過と共に取得可能な画像を変更する記述例である。図15では、10秒間のピリオド(duration="PTIM10.0S")が3つ存在し、各々のピリオドで異なる画像が取得可能となっている。したがって、受信装置200は各々のピリオドにおいて、異なる画像を取得して表示する事ができる。図15のプレイリストの例では、image1.heic→image2.heic→image3.heicの順に、各画像が10秒ずつ表示される。
【0059】
次に、図15を用いて説明した、再生時間に応じて表示する画像を変更するケースに対応したMPDの記述量を削減する方法について図16を用いて説明する。図16は、第3実施形態による送信装置100において生成されるプレイリストの一例であり、特に再生時刻の経過と共に表示すべき画像を変更する記述例である。
【0060】
配信可能な画像が複数のピリオドで共通な場合、同じ画像に関する情報(属性情報や取得用URLなど)をピリオド毎に記述するのは冗長である為、図16では、ピリオド毎に異なる情報をまとめて記述する。図16において、ピリオド情報1601には、ピリオド毎に異なる情報のみを記載するものとし、優先度要素1602としてピリオド毎に最優先となるRepresentationの識別子を記述する。尚、優先度要素の記述方法としては、ピリオド情報1603に記述されている優先度要素1604の様に、ピリオド毎に優先度が高い(或いは低い)順にRepresentationの識別子を記述しても良い。ここで、図16に示すMPDの例を受信した受信装置200は、各ピリオドにおいて、表示可能な画像の中で最も優先度が高い画像を表示する事が期待される。
【0061】
以上のように、第1~第3実施形態によれば、HEIFファイルをMPEG-DASHで配信することが出来るので、例えばHEIFファイルの中から所望の静止画のみを取得したり、所定の時間毎に取得可能な静止画を設定したりすること、などが可能となる。
【0062】
<第4実施形態>
第4実施形態では、第1実施形態~第3実施形態で説明した送信装置100からプレイリストを受信し、受信したプレイリストを用いて送信装置100からコンテンツ(画像)を取得する受信装置200を説明する。
【0063】
図17は、受信装置200のハードウエア構成例を示すブロック図である。受信装置200において、通信部1701は、ネットワーク150と接続して送信装置100との通信を行う。一つ又は複数のメモリ1702は、一つ又は複数のCPU1703により実行される各種プログラムを格納する。また、メモリ1702は、CPU1703が各種処理を実行する際の作業メモリを提供する。メモリ1702は、ROM、RAM、ハードディスクなど、またはそれらの組み合わせである。CPU1703は、メモリ1702に格納されたプログラムを実行して、各種の制御を実行する。例えば、CPU1703は、送信装置100からプレイリストを受信してメモリ1702に保持し、プレイリストを用いて送信装置100から画像を取得し、ディスプレイ1704に画像を表示する。
【0064】
図18は、受信装置200が送信装置100からコンテンツ(画像)を取得する取得処理を説明するフローチャートである。ステップS1801において、CPU1703は、送信装置100にプレイリストを要求する。ステップS1802において、CPU1703は、送信装置100からプレイリストを受信する。受信したプレイリストは、メモリ1702に保持される。
【0065】
次に、CPU1703は、ステップS1803において、プレイリストの格納先が記載されたセグメントのうち、所望のセグメントを選択する。セグメントの選択は、例えば、受信装置200に対するユーザ操作に基づいてなされてよいし、実行中のアプリケーションからの指示に基づいてなされてもよい。次に、CPU1703は、ステップS1804において、ステップS1803で選択されたセグメントを送信装置100に対して通信部1701を介して要求する。ステップS1805において、CPU1703は、通信部1701を介して送信装置100からセグメントのデータ(例えば、静止画、サムネイル画像など)を取得する。なお、CPU1703は、プレイリスト中のセグメントに記述されたURLを用いて、送信装置100からセグメントを取得することができる。ステップS1806において、CPU1703は、ステップS1805で受信したデータを再生する。例えば、CPU1703は、受信した静止画をディスプレイ1704に表示する。
【0066】
例えば、以下のような処理が実現される。CPU1703は、図4のプレイリストを受信した場合に、複数のサムネイル画像のセグメントを要求することにより複数のサムネイル画像を送信装置100から取得してディスプレイ1704に表示する。その後、例えばユーザによるサムネイル画像の選択操作に応じて、CPU1703は選択されたサムネイル画像に対応する静止画のセグメントを送信装置100に要求し、そのセグメントデータである静止画を取得してディスプレイ1704に表示する。
【0067】
また、CPU1703は、最高優先度の画像を表示する設定の下で図10のプレイリスト受信した場合に、最高優先度の画像は派生画像(グリッド画像)である。したがって、CPU1703は、派生画像の記述に従って、必要な画像のセグメントを要求することにより4枚の画像を受信し、グリッド画像を生成し、ディスプレイ1704に表示する。また、第3実施形態の図15図16に示したプレイリストを用いれば、受信装置200は、HEIFファイルに含まれている複数のファイルを順次に、スライドショーのように表示させることができる。
【0068】
以上のように、第1実施形態~第3実施形態のプレイリストを受信した受信装置は、複数のアイテムを含むHEIFファイルの全体を受信することなく、そのHEIFファイルに含まれている複数のアイテムの中の必要なアイテムを選択的に受信することができる。
【0069】
<その他の実施形態>
以上、実施形態例を詳述したが、本発明は例えば、システム、装置、方法、プログラム若しくは記録媒体(記憶媒体)等としての実施態様をとることが可能である。具体的には、複数の機器(例えば、ホストコンピュータ、インターフェイス機器、撮像装置、webアプリケーション等)から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
【0070】
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
【0071】
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。
【符号の説明】
【0072】
100:送信装置、101:ファイル解析部、102:符号化データ抽出部、103:セグメント生成部、104:符号化データ変換部、105:配信データ格納部、106:プレイリスト生成部、107:通信部、150:ネットワーク、200:受信装置
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19