(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-10-27
(45)【発行日】2022-11-07
(54)【発明の名称】動的フォーマット変換をサポートするオーディオメタデータ提供装置及びオーディオデータ再生装置、前記装置が行う方法、並びに前記動的フォーマット変換が記録されたコンピュータで読み出し可能な記録媒体
(51)【国際特許分類】
H04S 7/00 20060101AFI20221028BHJP
【FI】
H04S7/00 300
(21)【出願番号】P 2021113487
(22)【出願日】2021-07-08
(62)【分割の表示】P 2020018862の分割
【原出願日】2015-09-16
【審査請求日】2021-08-04
(31)【優先権主張番号】10-2014-0127751
(32)【優先日】2014-09-24
(33)【優先権主張国・地域又は機関】KR
(31)【優先権主張番号】10-2015-0059445
(32)【優先日】2015-04-28
(33)【優先権主張国・地域又は機関】KR
(73)【特許権者】
【識別番号】596180076
【氏名又は名称】韓國電子通信研究院
【氏名又は名称原語表記】Electronics and Telecommunications Research Institute
【住所又は居所原語表記】218,Gajeong-ro Yuseong-gu Daejeon 34129,Republic of Korea
(74)【代理人】
【識別番号】100091487
【氏名又は名称】中村 行孝
(74)【代理人】
【識別番号】100107582
【氏名又は名称】関根 毅
(74)【代理人】
【識別番号】100096921
【氏名又は名称】吉元 弘
(72)【発明者】
【氏名】ユ、ジェ、ヒョン
(72)【発明者】
【氏名】イ、テ、ジン
(72)【発明者】
【氏名】イ、ソク、ジン
【審査官】西村 純
(56)【参考文献】
【文献】特開2011-193164(JP,A)
【文献】特開平06-165079(JP,A)
【文献】特開2008-288935(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04S 1/00- 7/00
(57)【特許請求の範囲】
【請求項1】
第1フォーマットにより制作された多チャネルオーディオデータ、及びオーディオメタデータから多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の動的フォーマット変換情報を識別するステップと、
前記動的フォーマット変換情報を用いて前記第1フォーマットの多チャネルオーディオデータを第2フォーマットに変換するステップと、
前記第2フォーマットに変換された多チャネルオーディオデータを再生するステップと、
を含み、
前記動的フォーマット変換情報は、多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の複数のフォーマット変換方式を含み、
前記再生環境は、多チャネルオーディオデータが再生されるとき、スピーカのレイアウトに基づいて決定され
る、多チャネルオーディオデータ再生方法。
【請求項2】
前記動的フォーマット変換情報は、前記第1フォーマットから第2フォーマットに変換するためのマトリックスを含む、請求項1に記載の多チャネルオーディオデータ再生方法。
【請求項3】
第1フォーマットにより制作された多チャネルオーディオデータ、及びオーディオメタデータから多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の動的フォーマット変換情報を識別するステップと、
前記動的フォーマット変換情報を用いて前記第1フォーマットの多チャネルオーディオデータを第2フォーマットに変換するステップと、
前記第2フォーマットに変換された多チャネルオーディオデータを再生するステップと、
を含み、
前記動的フォーマット変換情報は、多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の複数のフォーマット変換方式を含み、
前記多チャネルオーディオデータの再生環境は、前記多チャネルオーディオデータが再生されるスピーカのレイアウトに基づいて決定され、
前記多チャネルオーディオデータの再生環境に基づいた第2フォーマットが第1フォーマットと異なる場合、前記多チャネルオーディオデータの再生環境に基づいた第2フォーマットに応じて
動的フォーマット変換情報が選択され、前記選択された動的フォーマット変換情報により多チャネルオーディオデータの第1フォーマットが第2フォーマットに変換される、多チャネルオーディオデータ再生方法。
【請求項4】
前記動的フォーマット変換情報は、前記第1フォーマットから第2フォーマットに変換するためのマトリックスを含む、請求項3に記載の多チャネルオーディオデータ再生方法。
【請求項5】
前記スピーカのレイアウトは、前記スピーカそれぞれの位置と前記スピーカの個数を含む、請求項3に記載の多チャネルオーディオデータ再生方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は多チャネルオーディオデータ再生方法に関し、より詳しくは、多チャネルオーディオデータの様々なフォーマット間の変換方法に関する。
【背景技術】
【0002】
3DTV、3Dシネマ、UHDTVなど次世代コンテンツ再生環境に対する研究開発が持続しながら、オーディオも多チャネルラウドスピーカを用いる音響再生環境に素早い変化が行われている。
【0003】
映画館及びHDTVのための立体音響の5.1チャネルシステム以後に上りチャネルを含む様々なマルチャネルオーディオシステムが導入され、ITU-R(International Telecommunication Union Radiocommunications Sector)では、最近Recommendation BS.2051を制定して10.2チャネル、13.1チャネル、22.2チャネルなどをはじめとする総8個の多チャネルフォーマットを次世代オーディオシステム(advanced sound system)として定義した。したがって、これからは様々なフォーマットにベースを置いたオーディオコンテンツが製造される可能性が極めて高まっている。
【0004】
このような環境では、1つのフォーマットに製造されたコンテンツが異なるフォーマットに再生する可能性も極めて高いため、コンテンツ間の適切な変換方法が求められている。従来には、コンテンツの多チャネルオーディオフォーマットから再生環境側の新しい多チャネルオーディオフォーマットにフォーマット変換することにおいて一括的な変換を行った。しかし、このような一括の変換方法は、コンテンツ著作者の著作意図を毀損し、意図とは異なる変換を行う恐れがあるという短所がある。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明の目的は、多チャネルオーディオデータの様々なフォーマット間に著作者の著作意図が完全に保持されるようにフォーマットを変換する動的フォーマット変換方法を提供するためのオーディオメタデータ提供装置、方法及び動的フォーマット変換方法によりフォーマットを変換して再生する装置、方法、並びに動的フォーマット変換方法が記録された記録媒体を提案する。
【0006】
本発明の目的は、多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境による第2フォーマットとの間の変換を行うことのできる動的フォーマット変換情報が含まれたオーディオメタデータを生成できるオーディオメタデータ提供装置及び方法を提供する。
【0007】
本発明の目的は、多チャネルオーディオデータ及び動的フォーマット変換情報が含まれたオーディオメタデータを識別して第1フォーマットから第2フォーマットに多チャネルオーディオデータを変換した後再生する多チャネルオーディオデータ再生装置及び方法を提供する。
【0008】
本発明の目的は、多チャネルオーディオデータ及び動的フォーマット変換情報が含まれたオーディオメタデータが記録されたコンピュータで読み出し可能な記録媒体を提供する。
【課題を解決するための手段】
【0009】
本発明の一実施形態に係るオーディオメタデータ提供装置は、多チャネルオーディオデータで多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の動的フォーマット変換情報を識別する変換情報識別部と、前記識別された動的フォーマット変換情報を含むオーディオメタデータを生成するオーディオメタデータ生成部とを含む。
【0010】
前記動的フォーマット変換情報は、多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の複数のフォーマット変換方式が多チャネルオーディオデータの再生区間ごとに設定されたものである。
【0011】
前記複数のフォーマット変換方式が設定された再生区間は、互いに同一の再生長さを有するか、又は互いに異なる再生長さを有してもよい。
【0012】
前記多チャネルオーディオデータの再生環境は、前記多チャネルオーディオデータが再生するスピーカのレイアウトに基づいて決定されてもよい。
【0013】
前記複数のフォーマット変換方式は、前記第1フォーマットから第2フォーマットに変換するためのマトリックスを含んでもよい。
【0014】
前記動的フォーマット変換情報は、多チャネルオーディオデータの再生区間ごとに相異に設定されるか、又は部分的に繰り返されるように設定されてもよい。
【0015】
本発明の一実施形態に係る多チャネルオーディオデータ再生装置は、第1フォーマットにより製作された多チャネルオーディオデータ、及びオーディオメタデータから多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の動的フォーマット変換情報を識別するデータ識別部と、前記動的フォーマット変換情報を用いて前記第1フォーマットの多チャネルオーディオデータを第2フォーマットに変換するオーディオデータ変換部と、前記第2フォーマットに変換された多チャネルオーディオデータを再生するオーディオデータ再生部とを含む。
【0016】
前記多チャネルオーディオデータ変換部の再生区間は、互いに同一の再生長さを有するか、又は互いに異なる再生長さを有してもよい。
【0017】
前記多チャネルオーディオデータ変換部のフォーマット変換方式は、多チャネルオーディオデータの再生区間ごとに相異に変換するか、又は部分的に繰り返されるように変換してもよい。
【0018】
前記多チャネルオーディオデータの再生環境は、前記多チャネルオーディオデータが再生するスピーカのレイアウトに基づいて決定されてもよい。
【0019】
本発明の一実施形態に係るオーディオメタデータ提供方法は、多チャネルオーディオデータで多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の動的フォーマット変換情報を識別するステップと、前記識別された動的フォーマット変換情報を含むオーディオメタデータを生成するステップとを含む。
【0020】
前記複数のフォーマット変換方式が設定された再生区間は、互いに同一の再生長さを有するか、又は互いに異なる再生長さを有してもよい。
【0021】
前記多チャネルオーディオデータの再生環境は、前記多チャネルオーディオデータが再生するスピーカのレイアウトに基づいて決定されてもよい。
【0022】
前記複数のフォーマット変換方式は、前記第1フォーマットから第2フォーマットに変換するためのマトリックスを含んでもよい。
【0023】
前記動的フォーマット変換情報は、多チャネルオーディオデータの再生区間ごとに相異に設定されるか、又は部分的に繰り返されるように設定されてもよい。
【0024】
本発明の一実施形態に係る多チャネルオーディオデータ再生方法は、第1フォーマットにより製作された多チャネルオーディオデータ、及びオーディオメタデータから多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の動的フォーマット変換情報を識別するステップと、前記動的フォーマット変換情報を用いて前記第1フォーマットの多チャネルオーディオデータを第2フォーマットに変換するステップと、前記第2フォーマットに変換された多チャネルオーディオデータを再生するステップとを含む。
【0025】
前記多チャネルオーディオデータ変換部の再生区間は、互いに同一の再生長さを有するか、又は互いに異なる再生長さを有してもよい。
【0026】
前記多チャネルオーディオデータ変換部のフォーマット変換方式は、多チャネルオーディオデータの再生区間ごとに相異に変換するか、又は部分的に繰り返されるように変換してもよい。
【0027】
前記多チャネルオーディオデータの再生環境は、前記多チャネルオーディオデータが再生するスピーカのレイアウトに基づいて決定されてもよい。
【0028】
本発明の一実施形態に係るコンピュータで読み出し可能な記録媒体は、1つ以上のチャネルから構成された多チャネルオーディオデータと、多チャネルオーディオデータで多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の動的フォーマット変換情報が含まれたオーディオメタデータとが記録される。
【発明の効果】
【0029】
本発明の一実施形態によると、多チャネルオーディオデータの様々なフォーマット間に著作者の著作意図が完全に保持されるよう、フォーマットを変換する動的フォーマット変換方法を提供するためのオーディオメタデータ提供装置、方法、及び動的フォーマット変換方法によりフォーマットを変換して再生する装置、方法、並びに動的フォーマット変換方法が記録された記録媒体を提供することができる。
【0030】
本発明の一実施形態によると、多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の変換を行うことのできる動的フォーマット変換情報が含まれたオーディオメタデータを生成できるオーディオメタデータ提供装置及び方法を提供することができる。
【0031】
本発明の一実施形態によると、多チャネルオーディオデータ及び動的フォーマット変換情報が含まれたオーディオメタデータを識別し、第1フォーマットから第2フォーマットに多チャネルオーディオデータを変換した後、再生する多チャネルオーディオデータ再生装置及び方法を提供することができる。
【0032】
本発明の一実施形態によると、多チャネルオーディオデータ及び動的フォーマット変換情報が含まれたオーディオメタデータが記録されたコンピュータで読み出し可能な記録媒体を提供することができる。
【図面の簡単な説明】
【0033】
【
図1】本発明の一実施形態に係るオーディオメタデータ提供装置とオーディオメタデータ及び多チャネルオーディオデータ再生装置を示す図である。
【
図2】本発明の一実施形態に係る多チャネルオーディオデータのフォーマットを一括的に変換する一例を示す図である。
【
図3】本発明の一実施形態に係る動的フォーマット変換情報に多チャネルオーディオデータのフォーマットを変換する一例を示す図である。
【
図4】本発明の一実施形態に係る1つ以上の動的フォーマット変換情報を含むオーディオメタデータを示す図である。
【
図5】本発明の一実施形態に係るマトリックス方式を用いてフォーマット間の変換を行う実施形態を説明するための図である。
【
図6】本発明の一実施形態に係るオーディオメタデータ提供装置が動的フォーマット変換情報の含まれたオーディオメタデータを提供する動作を示したフローチャートである。
【
図7】本発明の一実施形態に係る多チャネルオーディオデータ再生装置が多チャネルオーディオデータのフォーマットを変換した後、これを再生する動作を示したフローチャートである。
【発明を実施するための形態】
【0034】
以下、本発明の実施形態について添付の図面を参照しながら詳細に説明する。
【0035】
図1は、本発明の一実施形態に係るオーディオメタデータ提供装置110とオーディオメタデータ140及び多チャネルオーディオデータ再生装置160を示す図である。
【0036】
図1を参考すると、オーディオメタデータ提供装置110は、動的フォーマット変換情報を識別する変換情報識別部120及び識別された動的フォーマット変換情報を含むオーディオメタデータ140を生成するオーディオメタデータ生成部130を含む。動的フォーマット変換情報は、多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の複数のフォーマット変換方式が多チャネルオーディオデータの再生区間ごとに設定されたものである。
【0037】
本発明の一実施形態によると、変換情報識別部120は、多チャネルオーディオデータの著作者から動的フォーマット変換情報を識別する。更なる実施形態によると、変換情報識別部120は、1つ以上のオーディオメタデータから複数の動的フォーマット変換情報を識別する。
【0038】
本発明の一実施形態によると、変換情報識別部120で識別された動的フォーマット変換情報に基づいてオーディオメタデータを生成するオーディオメタデータ生成部130が提供される。オーディオメタデータ生成部130は、オーディオメタデータに識別された複数の動的フォーマット変換情報を含む。本発明の一実施形態によると、オーディオメタデータ生成部130は、動的フォーマット変換情報の各フォーマット変換方式をマトリックスの形態に含むことができる。更なる実施形態によると、オーディオメタデータ生成部130は、メタデータに識別された動的フォーマット変換情報と共に、メタデータに一般的に含まれる情報(例えば、著作者、レコード名、発売年度など)を含んでもよい。
【0039】
本発明の一実施形態によると、オーディオメタデータ提供装置110は、多チャネルオーディオデータ提供装置の一部の構成として含まれている。
【0040】
オーディオメタデータ提供装置110から動的フォーマット変換情報150を含むオーディオメタデータ140が提供される。本発明の一実施形態によると、オーディオメタデータ140は、動的フォーマット変換情報150だけではなく、メタデータに一般的に含まれる情報を含んでもよい。本発明の他の一実施形態によると、オーディオメタデータは、多チャネルオーディオデータと共に提供され得る。本発明の更なる一実施形態によると、オーディオメタデータ140は、リアルタイムで多チャネルオーディオデータ再生装置160に送信されたり、又は、多チャネルオーディオデータ再生装置160に予め送信されて多チャネルオーディオデータ再生装置160のバッファ、メモリのような格納媒体に格納され得る。又は、オーディオメタデータ140は、CD-ROM、CD-RW、DVD-R、DVD-RWなどのような光記録媒体に格納されて配布され得る。
【0041】
多チャネルオーディオデータを動的フォーマット変換情報によってフォーマット間に変換した後、これを再生できる多チャネルオーディオデータ再生装置160が提供される。多チャネルオーディオデータ再生装置160は、動的フォーマット変換情報を識別するデータ識別部170、識別された動的フォーマット変換情報でフォーマット間の変換を行うオーディオデータ変換部180、及び変換された多チャネルオーディオデータを再生するオーディオデータ再生部190を含む。
【0042】
本発明の一実施形態によると、データ識別部170は、オーディオメタデータ140で多チャネルオーディオデータの再生環境に基づいた第2フォーマットに該当する動的フォーマット変換情報を識別する。多チャネルオーディオデータの再生環境は、多チャネルオーディオデータが再生するスピーカのレイアウトに基づいて決定される。本発明の一実施形態によると、データ識別部170は、オーディオメタデータに記録された1つ以上の動的フォーマット変換情報のうち、第2フォーマットに対応する動的フォーマット変換情報を選択して識別することができる。
【0043】
本発明の一実施形態によると、オーディオデータ変換部180は、識別した動的フォーマット変換情報によって多チャネルオーディオデータを多チャネルオーディオ著作者が設定した第1フォーマットから多チャネルオーディオデータの再生環境に基づいた第2フォーマットに変換する。動的フォーマット変換情報は、第1フォーマットと第2フォーマットとの間の複数のフォーマット変換方式が多チャネルオーディオデータの再生区間ごとに設定されたものである。
【0044】
本発明の一実施形態によると、オーディオデータ変換部180は、再生時間により動的フォーマット変換情報から再生時間を含む再生区間を識別し、動的フォーマット変換情報で当該再生区間に設定されたフォーマット変換方式を識別して第1フォーマットと第2フォーマットとの間のフォーマット変換を行う。本発明の一実施形態によると、複数のフォーマット変換方式が設定された再生区間は、互いに同一の再生長さを有するか、互いに異なる再生長さを有し得る。本発明の一実施形態によると、オーディオデータ変換部180は、動的フォーマット変換情報によって再生区間ごとに互いに異なるフォーマット変換方式を用いて変換するか、又は部分的にフォーマット変換方式を繰り返されるように用いて変換することができる。
【0045】
本発明の一実施形態によると、第2フォーマットに変換された多チャネルオーディオデータを再生するオーディオデータ再生部190が提供される。第2フォーマットは多チャネルオーディオデータの再生環境に基づいて、多チャネルオーディオデータの再生環境は多チャネルオーディオデータが再生するスピーカのレイアウトに基づいて決定される。オーディオデータ再生部190は、1つ以上のスピーカの出力部から構成される。オーディオデータ再生部190は、第2フォーマットに変換された多チャネルオーディオデータに対して各チャネルに対応するスピーカからオーディオデータを出力する。
【0046】
本発明の一実施形態によると、オーディオデータ再生部190は、出力部に接続されたスピーカの個数を把握して多チャネルオーディオデータの再生環境を識別する。さらに、オーディオデータ再生部190は、スピーカの個数だけではなく、各スピーカの位置を識別したり、ユーザから再生環境に関する情報が入力されることで再生環境を識別することができる。
【0047】
図2は、本発明の一実施形態に係る多チャネルオーディオデータのフォーマットを一括的に変換する一例を示す図である。
【0048】
多チャネルオーディオデータは、多チャネルオーディオデータの著作者が設定した多チャネルオーディオデータフォーマットの第1フォーマットに合わせて製作される。多チャネルオーディオデータを再生する側の多チャネルオーディオデータフォーマットの第2フォーマットは、多チャネルオーディオデータの再生環境に基づく。多チャネルオーディオデータの再生環境は、多チャネルオーディオデータが再生するスピーカのレイアウトに基づいて決定されるため、第2フォーマットは、多チャネルオーディオデータの第1フォーマットと異なり得る。本発明の一実施形態によると、多チャネルオーディオデータの再生環境に基づく第2フォーマットが第1フォーマットと異なる場合、多チャネルオーディオデータ再生装置のオーディオデータ変換部は、一括的なフォーマット変換方式200により変換を行うことができる。
【0049】
図2を参照すると、第1フォーマットは、10.2チャネルフォーマットであると仮定する。一括的なフォーマット変換方式200によると、第2フォーマットが5.1チャネルフォーマットである場合、聴者の左側の前面スピーカLは第1フォーマットの左側の前面スピーカLと左側上段スピーカLHの線形結合(linear combination)として決定される。他の例として、第2フォーマットが7.1チャネルフォーマットである場合、右側の後面スピーカRBは、第1フォーマットの右側の後面スピーカRBと中央スピーカCHの線形結合に決定される。
【0050】
一括的なフォーマット変換方式200によると、フォーマット変換方式はチャネル間の線形結合であることから、非線形変換はできない。また、再生区間ごとにフォーマット変換方式は変化されない。本発明の一実施形態によると、多チャネルオーディオデータの再生区間ごとに1つ以上のフォーマット変換方式が設定された 動的フォーマット変換情報が提供される。また、第1フォーマットと第2フォーマットとの間の非線形変換をサポートするフォーマット変換方式が提供される。
【0051】
図3は、本発明の一実施形態に係る多チャネルオーディオデータのフォーマット変換を行うことのできる動的フォーマット変換情報を示す図である。
【0052】
図3を参考すると、動的フォーマット変換情報310は、多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の複数のフォーマット変換方式(例えば、フォーマット変換方式K320、L340、M330)が多チャネルオーディオデータの再生区間ごとに設定されたものである。
【0053】
本発明の一実施形態によると、それぞれのフォーマット変換方式は、同一の第2フォーマットにフォーマットを変換する。ただし、変換する方式は互いに異なってもよい。
図3を参照して説明すると、フォーマット変換方式K320は、第1フォーマットの複数の左側スピーカLeft
1とLeft
2の線形結合で第2フォーマットの左側スピーカLeftの出力データを決定する。フォーマット変換方式M330は、第1フォーマットの複数の左側スピーカのうちの1つであるLeft
1だけで第2フォーマットの左側スピーカLeftの出力データを決定する。本発明の一実施形態によると、それぞれの変換方式は非線形変換を含むことができる。
【0054】
本発明の一実施形態によると、多チャネルオーディオデータ再生装置は、動的フォーマット変換情報から再生区間ごとに設定されたフォーマット変換方式を識別して変換することができる。
図3を参照すると、多チャネルオーディオデータ再生装置は、再生区間t=0からt=t
1まで多チャネルオーディオデータをフォーマット変換方式K320によって変換する。多チャネルオーディオデータ再生装置は、以後の再生区間t=t
1からt=t
2まで多チャネルオーディオデータをフォーマット変換方式M330によって変換する。同様に、多チャネルオーディオデータ再生装置は、再生区間t=t
3からt=t
4まではフォーマット変換方式L340によって変換を行い、以後の再生区間でも同じ作業を繰り返す。
【0055】
本発明の一実施形態によると、動的フォーマット変換情報310は、多チャネルオーディオデータの再生区間ごとにフォーマット変換方式を相異に設定するか、又は部分的に繰り返されるように設定してもよい。
図3を参照すると、フォーマット変換方式K320は、再生区間t=0からt=t
1だけではなく、再生区間t=t
2からt=t
3でも再び設定され得る。本発明の一実施形態によると、フォーマット変換方式は、一括的なフォーマット変換方式や線形結合による変換だけではなく、非線形変換も含むことができる。
【0056】
本発明の一実施形態によると、フォーマット変換方式が設定されたそれぞれの再生区間は互いに同一の再生長さを有するか、互いに異なる再生長さを有し得る。
図3を参照すると、再生区間t=t
1からt=t
2と再生区間t=t
7からt=t
8は互いに同じ再生長さを有し得る。
【0057】
図4は、本発明の一実施形態に係る1つ以上の動的フォーマット変換情報を含むオーディオメタデータを示す図である。
【0058】
図4を参考すると、多チャネルオーディオデータの再生環境が様々であるため、オーディオメタデータ140は、1つ以上の動的フォーマット変換情報420、430を含む。多チャネルオーディオデータ再生装置160は、多チャネルオーディオデータの再生環境に基づいた第2フォーマットに該当する動的フォーマット変換情報を選択し、多チャネルオーディオデータのフォーマットを変換する。再生環境は、多チャネルオーディオデータが再生するスピーカのレイアウトに基づいて決定される。
【0059】
図4を参照すると、多チャネルオーディオデータの著作者が設定した第1フォーマットが22.2チャネルフォーマットであり、多チャネルオーディオデータの再生環境に基づいた第2フォーマットが10.2チャネルフォーマットであると仮定する。多チャネルオーディオデータ再生装置160のデータ識別部170は、オーディオメタデータの複数の動的フォーマット変換情報420、430のうち第2フォーマットに対応する動的フォーマット変換情報(1)420を識別する。同様に、多チャネルオーディオデータの再生環境に基づいた第2フォーマットが5.1チャネルフォーマットであれば、多チャネルオーディオデータ再生装置のデータ識別部170は動的フォーマット変換情報(2)430を識別する。
【0060】
先に仮定した10.2チャネルフォーマットで、オーディオデータ変換部180は、識別された動的フォーマット変換情報(1)420によって多チャネルオーディオデータのフォーマットを変換する。すなわち、オーディオデータ変換部180は、再生区間ごとに設定された複数のフォーマット変換方式440に基づいて多チャネルオーディオデータを再生区間t=0からt=t
1まではフォーマット変換方式K450によって変換し、再生区間t=t
1からt=t2まではフォーマット変換方式M460によって変換する。本発明の一実施形態によると、動的フォーマット変換情報は、多チャネルオーディオデータの再生区間ごとに相異に設定されるか、又は部分的に繰り返されるように設定され得る。また、フォーマット変換方式が設定されたそれぞれの再生区間の再生長さも互いに異なるか、同じであってもよい。
図4を参考すると、フォーマット変換方式K450は、再生区間t=
0からt=t1で用いられるが、その後の再生区間でも繰り返し用いてもよい。また、再生区間t=0からt=t
1と再生区間t=t
1からt=t
2の再生長さも互いに異なるか、同じであってもよい。
【0061】
図5は、本発明の一実施形態に係るマトリックス方式を用いてフォーマット間の変換を行う実施形態を説明するための図である。
【0062】
図5を参考すると、動的フォーマット変換情報でそれぞれのフォーマット変換方式は、変換マトリックス530、540に格納され得る。変換マトリックスは、多チャネルオーディオデータの著作者が設定した第1フォーマットから多チャネルオーディオデータの再生環境に基づいた第2フォーマットに変換するためのマトリックスである。オーディオデータ変換部は、第1フォーマットチャネルマトリックスを変換マトリックスに適用して第2フォーマットチャネルマトリックスを出力することで、第1フォーマットから第2フォーマットに変換することができる。
【0063】
図5を参照すると、多チャネルオーディオデータの著作者は、10.2チャネルフォーマット(第1フォーマット)に多チャネルオーディオデータを製作510したと仮定し、多チャネルオーディオデータの再生環境は、5.1チャネルフォーマット(第2フォーマット)であると仮定する。この場合、フォーマット変換550を参考すると、オーディオデータ変換部は、第1フォーマットチャネルマトリックス580(チャネルマトリックスの各元素は各チャネルに対応する)を変換マトリックス570に適用して第2フォーマットチャネルマトリックス560を出力する方式によりフォーマットを変換する。したがって、
図5に示す場合、第1フォーマットの10.2チャネルフォーマットは12個のチャネルを有し、第2フォーマットの5.1チャネルフォーマットは6個のチャネルを有するため、フォーマット変換方式に関する情報を含む変換マトリックス530、540は6行12列に構成される。
【0064】
また、オーディオデータ変換部は、再生区間ごとに設定されたフォーマット変換方式に合わせて変換マトリックス570を交換して変換することができる。例えば、
図5に示す動的フォーマット変換情報520で、再生区間t=0からt=t
1まで変換方式Kが設定されているため、当該の再生区間でオーディオデータ変換部は、変換マトリックス570を変換方式Kに対する変換マトリックス530に設定して変換を行う。再生区間t=t
1からt=t
2まで変換方式Mが設定されているため、当該の再生区間でオーディオデータ変換部は、変換マトリックス570を変換方式Mに対する変換マトリックス540に設定して変換を行う。
【0065】
図6は、本発明の一実施形態に係るオーディオメタデータ提供装置が動的フォーマット変換情報の含まれたオーディオメタデータを提供する動作を示したフローチャートである。
【0066】
ステップS610において、オーディオメタデータ提供装置は、動的フォーマット変換情報を識別する。動的フォーマット変換情報は、多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の複数のフォーマット変換方式が多チャネルオーディオデータの再生区間ごとに設定されたものである。本発明の一実施形態によると、オーディオメタデータ提供装置は、多チャネルオーディオデータの著作者から動的フォーマット変換情報を識別する。本発明の他の実施形態によると、多チャネルオーディオデータ再生装置は、1つ以上のオーディオメタデータから複数の動的フォーマット変換情報を識別する。
【0067】
ステップS620において、オーディオメタデータ提供装置は、識別された動的フォーマット変換情報を含むオーディオメタデータを生成する。ここで、オーディオメタデータ提供装置は、オーディオメタデータに一般的に含まれる情報(例えば、著作者、レコード名、発売年度など)を含んでもよい。本発明の一実施形態によると、オーディオメタデータ提供装置は、複数の動的フォーマット変換情報をオーディオメタデータに含み得る。本発明の一実施形態によると、オーディオメタデータ提供装置は、動的フォーマット変換情報の各フォーマット変換方式をマトリックスの形態(例えば、
図5に示す変換マトリックス530、540)にオーディオメタデータに記録することができる。
【0068】
図7は、本発明の一実施形態に係る多チャネルオーディオデータ再生装置が多チャネルオーディオデータのフォーマットを変換した後、これを再生する動作を示したフローチャートである。
【0069】
ステップS710において、多チャネルオーディオデータ再生装置は、多チャネルオーディオデータ及びオーディオメタデータを受信する。本発明の一実施形態によると、オーディオメタデータは、多チャネルオーディオデータと共に提供されたり、別に提供されてもよい。本発明の一実施形態によると、オーディオメタデータは、リアルタイムで多チャネルオーディオデータ再生装置に受信されたり、又は、多チャネルオーディオデータ再生装置に予め送信されて多チャネルオーディオデータ再生装置のバッファ、メモリのような格納媒体に格納されてもよい。また、オーディオメタデータは、CD-ROM、CD-RW、DVD-R、DVD-RWなどのような光記録媒体に格納されて受信され得る。
【0070】
ステップS720において、多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットが異なる場合、多チャネルオーディオデータ再生装置は、オーディオメタデータで動的フォーマット変換情報を識別することになる。本発明の一実施形態によると、オーディオメタデータは、1つ以上の動的フォーマット変換情報を含んでもよく、この場合、多チャネルオーディオデータ再生装置は、多チャネルオーディオデータ再生装置の第2フォーマットに対応する動的フォーマット変換情報を識別することができる。多チャネルオーディオデータの再生環境は、多チャネルオーディオデータが再生するスピーカのレイアウトに基づいて決定される。
【0071】
オーディオメタデータで識別した動的フォーマット変換情報は、多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとの間の複数のフォーマット変換方式が多チャネルオーディオデータの再生区間ごとに設定されたものである。動的フォーマット変換情報の複数のフォーマット変換方式が設定された再生区間は、互いに同一の再生長さを有するか、互いに異なる再生長さを有し得る。動的フォーマット変換情報の再生区間ごとに設定されたフォーマット変換方式は、相異に設定されるか、又は部分的に繰り返されるように設定され得る。
【0072】
ステップS730において、多チャネルオーディオデータ再生装置は、識別した動的フォーマット変換情報によって多チャネルオーディオデータの著作者が設定した第1フォーマットで多チャネルオーディオデータの再生環境に基づいた第2フォーマットに変換を行う。本発明の一実施形態によると、変換する再生区間は、動的フォーマット変換情報によって同一の再生長さを有するか、互いに異なる再生長さを有し得る。本発明の一実施形態によると、フォーマット変換方式は、多チャネルオーディオデータの再生区間ごとに相異に変換したり、部分的に繰り返されるように変換してもよい。
【0073】
ステップS740において、多チャネルオーディオデータ再生装置は、変換された多チャネルオーディオデータを再生する。多チャネルオーディオデータ再生装置は、第2フォーマットに変換された多チャネルオーディオデータに対して各チャネルに対応するスピーカからオーディオデータを出力する。本発明の一実施形態によると、多チャネルオーディオデータの著作者が設定した第1フォーマットと多チャネルオーディオデータの再生環境に基づいた第2フォーマットとが互いに同一な場合、多チャネルオーディオデータ再生装置は変換を行うことなく、多チャネルオーディオデータを再生することができる。
【0074】
本発明の実施形態に係る方法は、多様なコンピュータ手段を介して様々な処理を実行することができるプログラム命令の形態で実現され、コンピュータで読取可能な記録媒体に記録されてもよい。コンピュータ読取可能な媒体は、プログラム命令、データファイル、データ構造などのうち1つまたはその組合せを含んでもよい。媒体に記録されるプログラム命令は、本発明の目的のために特別に設計されて構成されたものでもよく、コンピュータソフトウェア分野の技術を有する当業者にとって公知のものであり、使用可能なものであってもよい。コンピュータ読取可能な記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体、CD-ROM、DVDのような光記録媒体、光ディスクのような光磁気媒体、及びROM、RAM、フラッシュメモリなどのようなプログラム命令を保存して実行するように特別に構成されたハードウェア装置が含まれてもよい。プログラム命令の例には、コンパイラによって作られるような機械語コードだけでなく、インタープリタなどを用いてコンピュータによって実行できる高級言語コードが含まれる。前記したハードウェア装置は、本発明の動作を行うために1つ以上のソフトウェアモジュールとして動作するように構成されてもよく、その逆も同様である。
【0075】
上述したように、本発明を限定された実施形態と図面によって説明したが、本発明は、上記の実施形態に限定されることなく、本発明が属する分野における通常の知識を有する者であれば、このような実施形態から多様な修正及び変形が可能である。
【0076】
したがって、本発明の範囲は、開示された実施形態に限定されるものではなく、特許請求の範囲だけではなく特許請求の範囲と均等なものなどによって定められるものである。
【符号の説明】
【0077】
310:動的フォーマット変換情報
320:フォーマット変換方式K
330:フォーマット変換方式M
340:フォーマット変換方式L