IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本放送協会の特許一覧

特開2023-177676音響メタデータ座標系変換装置及びプログラム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023177676
(43)【公開日】2023-12-14
(54)【発明の名称】音響メタデータ座標系変換装置及びプログラム
(51)【国際特許分類】
   H04S 7/00 20060101AFI20231207BHJP
【FI】
H04S7/00 300
【審査請求】未請求
【請求項の数】4
【出願形態】OL
(21)【出願番号】P 2022090470
(22)【出願日】2022-06-02
(71)【出願人】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】100147485
【弁理士】
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】230118913
【弁護士】
【氏名又は名称】杉村 光嗣
(74)【代理人】
【識別番号】100161148
【弁理士】
【氏名又は名称】福尾 誠
(72)【発明者】
【氏名】岩崎 泰士
(72)【発明者】
【氏名】久保 弘樹
(72)【発明者】
【氏名】大出 訓史
(72)【発明者】
【氏名】中山 靖茂
【テーマコード(参考)】
5D162
【Fターム(参考)】
5D162AA13
5D162CC12
5D162CD01
5D162EG02
(57)【要約】
【課題】極座標値から規格値と一致する直交座標値へ変換、又は直交座標値から規格値と一致する極座標値へ変換でき、かつ音声オブジェクトの座標値のずれを補正する。
【解決手段】音響メタデータ座標系変換装置1は、リスニングルームの基準点及び配置する各スピーカ位置における極座標値及び直交座標値の対応関係をもとに、リスニングルームの壁面に対して、複数の矩形領域を規定する矩形領域規定部11と、音声オブジェクトのZ座標値zを導出し、前記zの高さにおける水平面と矩形領域の辺との交点を線分領域の端点とし、zが中層のZ座標値と一致しない場合には、直交座標値に対応する極座標値の方位角のずれを考慮して、線分領域の端点の座標値を補正する線分領域規定部12と、音声オブジェクトが属する線分領域を探索し、該線分領域の端点を用いて音声オブジェクトの直交座標値を導出する座標導出部13と、を備える。
【選択図】図1
【特許請求の範囲】
【請求項1】
音響メタデータに付与された音声オブジェクトの位置情報を極座標値から直交座標値に変換する音響メタデータ座標系変換装置であって、
リスニングルームの基準点及び配置する各スピーカ位置における、極座標値及び直交座標値の対応関係をもとに、前記リスニングルームの壁面に対して、上層・中層・下層で各座標系の対応関係が既知の位置を端点とする複数の矩形領域を規定する矩形領域規定部と、
音声オブジェクトのZ座標値zを導出し、前記zの高さにおける水平面と前記矩形領域の辺との交点を線分領域の端点とし、前記zが前記中層のZ座標値と一致しない場合には、直交座標値に対応する極座標値の方位角のずれを考慮して、前記線分領域の端点の座標値を補正する線分領域規定部と、
前記音声オブジェクトが属する前記線分領域を探索し、該線分領域の端点を用いて前記音声オブジェクトの直交座標値を導出する座標導出部と、
を備える音響メタデータ座標系変換装置。
【請求項2】
音響メタデータに付与された音声オブジェクトの位置情報を直交座標値から極座標値に変換する音響メタデータ座標系変換装置であって、
リスニングルームの基準点及び配置する各スピーカ位置における、極座標値及び直交座標値の対応関係をもとに、前記リスニングルームの壁面に対して、上層・中層・下層で各座標系の対応関係が既知の位置を端点とする複数の矩形領域を規定する矩形領域規定部と、
音声オブジェクトの高さzにおける水平面と前記矩形領域の辺との交点を線分領域の端点とし、前記zが前記中層のZ座標値と一致しない場合には、直交座標値に対応する極座標値の方位角のずれを考慮して、前記線分領域の端点の座標値を補正する線分領域規定部と、
前記音声オブジェクトが属する前記線分領域を探索し、該線分領域の端点を用いて前記音声オブジェクトの極座標値を導出する座標導出部と、
を備える音響メタデータ座標系変換装置。
【請求項3】
前記リスニングルームの基準点は、
前記リスニングルームの上層、中層、及び下層の各層における四隅の計12点、又は
前記リスニングルームの上層、中層、及び下層の各層における四隅、並びに聴取者の前方、後方、及び側方の計24点である、請求項1又は2に記載の音響メタデータ座標系変換装置。
【請求項4】
コンピュータを、請求項1又は2に記載の音響メタデータ座標系変換装置として機能させるためのプログラム。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音響メタデータに付与する音声オブジェクトの位置情報を変換する音響メタデータ座標系変換装置及びプログラムに関する。
【背景技術】
【0002】
オブジェクトベース音響では、音声信号に音声オブジェクトの3次元位置情報を音響メタデータとして付与して送信し、レンダラーによりスピーカ配置に適応した音声信号を各スピーカに分配することが可能である。位置情報は、その定義がITU-Rで規格化されており、極座標系(方位角、仰角、距離の3変数で位置を規定)、あるいは直交座標系(X座標値、Y座標値、Z座標値の3変数で位置を規定)として与えるが、レンダラーが採用している再生方式により解釈可能な座標系はいずれか一方の座標系に限定されるため、座標系の変換が必要となる。また、オブジェクトベース音響のレンダラーによっては、直交座標系で記述された音声オブジェクトの位置をリスニングルームの四隅に配置されるスピーカとの相対的な位置関係(距離の比)と定めるため、端に3次元ユークリッド空間における極座標と直交座標の幾何的な変換は適用できず、スピーカ配置に基づいた変換則を適用することが必要となる。
【0003】
従来、音響メタデータにおける座標系変換はITU-Rで規格化されており、非特許文献1では、5.1.4のスピーカ配置における極座標値と直交座標値の対応をもとに、座標系を変換する方法が規定されている。なお、当該チャンネルフォーマットのスピーカ配置は、例えば非特許文献2に記載されている。
【先行技術文献】
【非特許文献】
【0004】
【非特許文献1】ITU-R BS.2127-0, “Audio Definition Model renderer for advanced sound systems”, 2019
【非特許文献2】ITU-R BS.2051-1, “Advanced sound system for programme production”, 2017
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、5.1.4ベースの変換である非特許文献1で規定された技術を用いて、22.2ch,7.1.4などのスピーカ位置に配置された音声オブジェクトの極座標値を直交座標値に変換すると、22.2ch,7.1.4の非特許文献1で定められたスピーカの直交座標値とは異なる値になるという問題があった。同様に、5.1.4ベースの変換である非特許文献1で規定された技術を用いて、22.2ch,7.1.4などのスピーカ位置に配置された音声オブジェクトの直交座標値を極交座標値に変換すると、22.2ch,7.1.4の非特許文献1で定められたスピーカの極交座標値とは異なる値になるという問題があった。
【0006】
また、22.2chや7.1.4などのリスニングルームの中層と上層・下層の四隅に配置されるスピーカの方位角が異なる場合には、仰角方向又はZ軸方向において音声オブジェクトの座標値のずれが大きくなるという問題があった。
【0007】
かかる事情に鑑みてなされた本発明の目的は、5.1.4以外のスピーカ配置にレンダリングされる場合においても、極座標値から規格値と一致する直交座標値へ変換、又は直交座標値から規格値と一致する極座標値へ変換することができるとともに、仰角方向又はZ軸方向における音声オブジェクトの座標値のずれを補正することが可能な音響メタデータ座標系変換装置及びプログラムを提供することにある。
【課題を解決するための手段】
【0008】
上記課題を解決するため、本発明に係る音響メタデータ座標系変換装置は、音響メタデータに付与された音声オブジェクトの位置情報を極座標値から直交座標値に変換する音響メタデータ座標系変換装置であって、リスニングルームの基準点及び配置する各スピーカ位置における、極座標値及び直交座標値の対応関係をもとに、前記リスニングルームの壁面に対して、上層・中層・下層で各座標系の対応関係が既知の位置を端点とする複数の矩形領域を規定する矩形領域規定部と、音声オブジェクトのZ座標値zを導出し、前記zの高さにおける水平面と前記矩形領域の辺との交点を線分領域の端点とし、前記zが中層のZ座標値z=0と一致しない場合には、直交座標値に対応する極座標値の方位角のずれを考慮して、前記線分領域の端点の座標値を補正する線分領域規定部と、前記音声オブジェクトが属する前記線分領域を探索し、該線分領域の端点を用いて前記音声オブジェクトの直交座標値を導出する座標導出部と、を備える。
【0009】
また、上記課題を解決するため、本発明に係る音響メタデータ座標系変換装置は、音響メタデータに付与された音声オブジェクトの位置情報を直交座標値から極座標値に変換する音響メタデータ座標系変換装置であって、リスニングルームの基準点及び配置する各スピーカ位置における、極座標値及び直交座標値の対応関係をもとに、前記リスニングルームの壁面に対して、上層・中層・下層で各座標系の対応関係が既知の位置を端点とする複数の矩形領域を規定する矩形領域規定部と、音声オブジェクトの高さzにおける水平面と前記矩形領域の辺との交点を線分領域の端点とし、前記zが中層のZ座標値z=0と一致しない場合には、直交座標値に対応する極座標値の方位角のずれを考慮して、前記線分領域の端点の座標値を補正する線分領域規定部と、前記音声オブジェクトが属する前記線分領域を探索し、該線分領域の端点を用いて前記音声オブジェクトの極座標値を導出する座標導出部と、を備える。
【0010】
さらに、本発明に係る音響メタデータ座標系変換装置において、前記リスニングルームの基準点は、前記リスニングルームの上層、中層、及び下層の各層における四隅の計12点、又は前記リスニングルームの上層、中層、及び下層の各層における四隅、並びに聴取者の前方、後方、及び側方の計24点であってもよい。
【0011】
また、上記課題を解決するため、本発明に係るプログラムは、コンピュータを、上記音響メタデータ座標系変換装置として機能させる。
【発明の効果】
【0012】
本発明によれば、任意のスピーカ配置に対して、各スピーカの極座標値及び直交座標値間の対応、及び仰角方向又はZ軸方向における座標値のずれを補正しつつ、一意に極座標値及び直交座標値間で相互に変換することが可能となる。
【図面の簡単な説明】
【0013】
図1】第1の実施形態に係る音響メタデータ座標系変換装置の構成例を示すブロック図である。
図2】第1の実施形態に係る音響メタデータ座標系変換装置における、極座標値を直交座標値に変換する手順を示すフローチャートである。
図3】第1の実施形態に係る音響メタデータ座標系変換装置における、直交座標系のリスニングルームと矩形領域規定の基準となる点の一例を示す図である。
図4A】第1の実施形態に係る音響メタデータ座標系変換装置における、リスニングルーム壁面の展開図において規定された複数の矩形領域と、音声オブジェクトの高さに応じて規定される線分領域のイメージを示す図である。
図4B図4Aに対応するリスニングルームを示す図である。
図5】第1の実施形態に係る音響メタデータ座標系変換装置における、スピーカ配置を22.2chとした場合の、音声オブジェクトの方位角を-180度から180度まで1度刻みで座標系変換を行った結果を示す図である。
図6】第1の実施形態に係る音響メタデータ座標系変換装置における、スピーカ配置を22.2chとした場合の、極座標系において(30,-30,1)の位置からスピーカM+030の位置を通って(30,-30,1)の位置までを直線的に移動する音声オブジェクト、及び(-30,-30,1)の位置からスピーカM-030の位置を通って(-30,-30,1)の位置までを直線的に移動する音声オブジェクトについて座標系変換を行った結果を示す図である。
図7】第1の実施形態に係る音響メタデータ座標系変換装置における、スピーカ配置を7.1.4とした場合の、音声オブジェクトの方位角を-180度から180度まで1度刻みで座標系変換を行った結果を示す図である。
図8】第1の実施形態に係る音響メタデータ座標系変換装置における、スピーカ配置を7.1.4とした場合の、極座標系において(30,-30,1)の位置からスピーカM+030の位置を通って(30,-30,1)の位置までを直線的に移動する音声オブジェクト、及び(-30,-30,1)の位置からスピーカM-030の位置を通って(-30,-30,1)の位置までを直線的に移動する音声オブジェクトについて座標系変換を行った結果を示す図である。
図9】第1の実施形態に係る音響メタデータ座標系変換装置における、スピーカ配置を5.1.4とした場合の、音声オブジェクトの方位角を-180度から180度まで1度刻みで座標系変換を行った結果を示す図である。
図10】第1の実施形態に係る音響メタデータ座標系変換装置における、スピーカ配置を5.1.4とした場合の、極座標系において(30,-30,1)の位置からスピーカM+030の位置を通って(30,-30,1)の位置までを直線的に移動する音声オブジェクト、及び(-30,-30,1)の位置からスピーカM-030の位置を通って(-30,-30,1)の位置までを直線的に移動する音声オブジェクトについて座標系変換を行った結果を示す図である。
図11】第1の実施形態に係る音響メタデータ座標系変換装置における、スピーカ配置を22.2ch及び仮想的なスピーカを中層±110度、中層±150度とした場合の、音声オブジェクトの方位角を-180度から180度まで1度刻みで座標系変換を行った結果を示す図である。
図12】第2の実施形態に係る音響メタデータ座標系変換装置の構成例を示すブロック図である。
図13】第2の実施形態に係る音響メタデータ座標系変換装置における、直交座標値を極座標値に変換する手順を示すフローチャートである。
図14】第2の実施形態に係る音響メタデータ座標系変換装置における、スピーカ配置を22.2chとした場合の、音声オブジェクトの方位角を-180度から180度まで1度刻みで座標系変換を行った結果を示す図である。
図15】第2の実施形態に係る音響メタデータ座標系変換装置における、スピーカ配置を22.2chとした場合の、直交座標系において(-1,+1,-1)の位置から(-1,+1,+1)の位置までを直線的に移動する音声オブジェクト、及び(+1,+1,-1)の位置から(+1,+1,+1)の位置までを直線的に移動する音声オブジェクトについて座標系変換を行った結果を示す図である。
図16】第2の実施形態に係る音響メタデータ座標系変換装置における、スピーカ配置を7.1.4とした場合の、音声オブジェクトの直交座標系における方位角で-180度から180度まで1度刻みで座標系変換を行った結果を示す図である。
図17】第2の実施形態に係る音響メタデータ座標系変換装置における、スピーカ配置を7.1.4とした場合の、直交座標系において(-1,+1,-1)の位置から(-1,+1,+1)の位置までを直線的に移動する音声オブジェクト、及び(+1,+1,-1)の位置から(+1,+1,+1)の位置までを直線的に移動する音声オブジェクトについて座標系変換を行った結果を示す図である。
図18】第2の実施形態に係る音響メタデータ座標系変換装置における、スピーカ配置を5.1.4とした場合の、音声オブジェクトの直交座標系における方位角で-180度から180度まで1度刻みで座標系変換を行った結果を示す図である。
図19】第2の実施形態に係る音響メタデータ座標系変換装置における、スピーカ配置を5.1.4とした場合の、直交座標系において(-1,+1,-1)の位置から(-1,+1,+1)の位置までを直線的に移動する音声オブジェクト、及び(+1,+1,-1)の位置から(+1,+1,+1)の位置までを直線的に移動する音声オブジェクトについて座標系変換を行った結果を示す図である。
図20】第2の実施形態に係る音響メタデータ座標系変換装置における、スピーカ配置を22.2ch/7.1.4/5.1.4とした場合の、音声オブジェクトの極座標系において方位角で-180度から180度まで5度刻み、仰角で-90度から90度まで15度刻みの位置で極座標値から直交座標値に変換を行った後、その直交座標値を本発明により極座標値に変換した結果を示す図である。
図21】第2の実施形態に係る音響メタデータ座標系変換装置における、スピーカ配置を22.2chとし、リスニングルームの左前方(x,y)=(-1,1)/右前方(x,y)=(1,1)の対応する方位角を高さzによらず±30度とした場合の音声オブジェクトの直交座標系における方位角で-180度から180度まで1度刻みで座標系変換を行った結果を示す図である。
図22】第2の実施形態に係る音響メタデータ座標系変換装置における、スピーカ配置を22.2chとし、リスニングルームの左前方(x,y)=(-1,1)/右前方(x,y)=(1,1)の対応する方位角を高さzによらず±30度とした場合の、直交座標系におい(-1,+1,-1)の位置から(-1,+1,+1)の位置までを直線的に移動する音声オブジェクト、及び(+1,+1,-1)の位置から(+1,+1,+1)の位置までを直線的に移動する音声オブジェクトについて座標系変換を行った結果を示す図である。
【発明を実施するための形態】
【0014】
以下、実施形態について、図面を参照して詳細に説明する。本明細書において、直交座標値はX座標、Y座標、及びZ座標の3変数の組(x,y,z)で表し、極座標値は方位角、仰角、及び距離の3変数の組(φ,θ,d)で表す。
【0015】
<第1の実施形態>
第1の実施形態では、音声信号に付与された音響メタデータ中の極座標値(φ,θ,d)を直交座標値(x,y,z)に変換する音響メタデータ座標系変換装置について説明する。
【0016】
図1は、第1の実施形態に係る音響メタデータ座標系変換装置1の構成例を示すブロック図である。図1に示す音響メタデータ座標系変換装置1は、矩形領域規定部11と、線分領域規定部12と、座標導出部13と、を備える。矩形領域規定部11は、極座標系の音響メタデータ、リスニングルーム情報、及びスピーカ配置情報を入力する。ここで、「リスニングルーム情報」とは、リスニングルーム基準点の極座標及び直交座標値を示す情報である。また、「スピーカ配置情報」とは、スピーカ位置の極座標及び直交座標値を示す情報である。
【0017】
図2は、音響メタデータ座標系変換装置1における、音声オブジェクトの位置情報を極座標値から直交座標値に変換する手順を示すフローチャートである。本アルゴリズムは大きくステップS1からステップS3の3ステップに分けることができる。
【0018】
ステップS1では、矩形領域規定部11にて、リスニングルームの基準点及び配置する各スピーカ位置における、極座標値及び直交座標値の対応関係をもとに、リスニングルームの壁面に対して、上層・中層・下層で各座標系の対応関係が既知の位置を端点とする複数の矩形領域を規定する。
【0019】
ステップS2では、線分領域規定部12にて、仰角及び距離をもとに音声オブジェクトのZ座標値を導出する。そして、中層と上層・下層とで線分領域端点の方位角が異なる場合に生じる極座標値と直交座標値の仰角方向のずれを考慮して、線分領域端点の座標値を補正する。ここで、「線分領域」とは、音声オブジェクトが位置する高さzの水平面と矩形領域との交線を意味し、「線分領域端点(線分領域の端点)」とは、高さzの水平面と矩形領域の辺との交点を意味する。
【0020】
ステップS3では、座標導出部13にて、音声オブジェクトが属する線分領域を探索し、該線分領域の端点を用いて音声オブジェクトの直交座標値を導出する。
【0021】
(ステップS1の動作説明)
ステップS11では、極座標値から直交座標値の対応関係を規定するために、リスニングルームの基準点及び各スピーカ位置の、極座標及び直交座標を入力する。
【0022】
リスニングルームの基準点は、リスニングルームの上層、中層、及び下層の各層における四隅の計12点であってもよい。また、リスニングルームの基準点は、リスニングルームの上層、中層、及び下層の各層における四隅、並びに聴取者の前方、後方、及び側方の計24点であってもよい。
【0023】
図3は、直交座標系のリスニングルームと座標変換の基準となる点の一例を示す図である。リスニングルーム基準点は、図3に示す上層・中層・下層の頂点(±1,±1,±1)、(±1,±1,0)(複合任意)、及び各辺中点(±1,0,±1)、(0,±1,±1)、(±1,±1,0)、(0,±1,0)(複合任意)を指す。なお、聴取点側方の座標値を厳密に指定しなくてもよい場合に各辺の中点については入力を省略してもよく、以下の処理は同様に成立する。
【0024】
ステップS12では、リスニングルーム壁面に複数の矩形領域を規定する。
【0025】
図4Aは、リスニングルーム壁面の展開図において規定された複数の矩形領域と、音声オブジェクトの高さに応じて規定される線分領域のイメージを示す図である。図4Bは、図4Aに対応するリスニングルームを示す図である。本図において、黒丸は矩形領域の端点のうち、スピーカ又は基準点が存在する位置を示している。破線の白丸は矩形領域の端点のうち、スピーカ又は基準点が存在せず、計算的に求めた仮想的な方位角を適用した位置を示している。斜線を付した丸は音声オブジェクトの位置を示している。破線の四角は線分領域の端点を示しており、音声オブジェクトの位置する高さに応じて補正した方位角が適用される。
【0026】
ステップS12では、リスニングルーム壁面を、図4に示すような、リスニングルーム基準点又はスピーカ位置を矩形領域の端点にとり、上層における端点が(x,y,+1)、(x,y,+1)、中層における端点が(x,y,0)、(x,y,0)、下層における端点が(x,y,-1)、(x,y,-1)となる複数の矩形領域に分割する。ただし、x,yは、矩形領域の聴取点から見て左側の端点におけるX,Y座標を表し、x,yは、矩形領域の聴取点から見て右側の端点におけるX,Y座標を表す。
【0027】
このとき得た矩形領域の上層・中層・下層の端点のうち、スピーカも基準点も存在しない各座標系間の対応関係が規定されていない点については、リスニングルーム基準点やスピーカ位置における各座標系間の対応関係と矛盾しない任意の規則を用いて仮想的に極座標値を算出する。仮想的な極座標値における仰角については上層・中層・下層いずれかの仰角値を採用し、例えば聴取点の前方、後方に位置する方位角については式(1)(2)を用いて算出してもよい。ここで、φ,xは、算出したい仮想的に算出する方位角とそのx座標を示す。φ~,φ~,x~,x~は、仮想的に算出する方位角を挟み込むリスニングルーム基準点の聴取点から見て左側及び右側の点の方位角とX座標を示す。また、聴取点の側方に位置する方位角については、式(1)(2)におけるxをyに置換することで同様に算出できる。
【0028】
【数1】
【数2】
【0029】
(ステップS2の動作説明)
ステップS21では、音声オブジェクトのZ座標値を導出し、そのZ座標値をもとに線分領域を規定する。ただし、Z座標値を導出する上で、音声オブジェクトが上層より上又は下層より下に位置する場合には、リスニングルームの天井又は底面上の音声オブジェクトとして変換し、上層と下層の間に位置する場合には、リスニングルームの壁面上または内部の音声オブジェクトとして変換する。
【0030】
ステップS22では、音声オブジェクトが上層より上又は下層より下に位置するか判定する。音声オブジェクトが上層より上又は下層より下に位置する場合、音声オブジェクトのZ座標はリスニングルームの上層又は下層のZ座標として得る。
【0031】
音声オブジェクトが上層と下層の間に位置する場合には、そのZ座標を上層・下層スピーカの仰角値と矛盾しない任意の変換則により算出する。音声オブジェクトのZ座標算出方法は例えば式(3)としてもよい。ただし、変数θ,θ,θ’,θ’はそれぞれ極座標系における上層・下層の仰角、直交座標系における上層・下層の仰角を表す。θ’,θ’は聴取点と上層正面位置の水平方向と垂直方向の距離比を考慮し45度を用いることにし、θ,θは、例えば非特許文献2に規定される上層・下層スピーカの仰角30度を用いる。また、式(3)の代わりに非特許文献1に規定される|θ|=|θ|を仮定したZ座標の算出則を用いてもよい。
【0032】
【数3】
【0033】
ステップS23では、リスニングルーム壁面上に音声オブジェクトが位置する場合には、音声オブジェクトの高さzにおける水平面と矩形領域との交線を新たに線分領域として定める(図4参照)。矩形領域は上層の高さ(z=1)、中層の高さ(z=0)、及び下層の高さ(z=-1)においてそれぞれ端点を規定し、線分領域は音声オブジェクトが位置する高さzにおいて端点を規定する。そして、音声オブジェクトのZ座標値zが中層のZ座標値z=0と一致せず、かつ中層と上層・下層とで矩形領域端点の方位角が異なる場合には、直交座標値に対応する極座標値の方位角のずれを考慮して、線分領域端点の直交座標値(x、y)に対応する極座標値の方位角φを補正する。線分領域端点の補正則として、例えば式(4)を用いてもよい。ただし、φ(x,y,z)は座標(x,y,z)における線分領域端点の方位角であり、φ(x,y,0)、φ(x,y,1)、φ(x,y,-1)はそれぞれ矩形領域の中層、上層、下層における矩形領域端点の方位角である。
【0034】
【数4】
【0035】
(ステップS3の動作説明)
最後に、ステップS31では、音声オブジェクトが属する線分領域端点のXY平面上の位置ベクトル(x,y,0)、(x,y,0)を用いてX、Y座標値を算出し、先に導出したZ座標値を加算し、直交座標値を導出する。音声オブジェクトが属する線分領域の探索については、音声オブジェクトの方位角と線分領域端点の方位角の大小関係に基づいて決定する。ただし、天井又は底面に音声オブジェクトが位置する場合は、矩形領域の上層又は下層における端点を線分領域端点とみなし、その方位角と音声オブジェクトの方位角の大小関係により決定する。直交座標値の導出は、例えば、式(6)により得られる線分領域端点の内分比p∈[0,1]、及び式(7)により得られる位置ベクトルの大きさを制御する量rxyを用いて、式(5)により同一壁面上に位置する任意の線分領域端点をp:(1-p)に内分する位置ベクトルとして算出してもよい。また、式(6)の代わりに非特許文献1に規定されるタンジェント関数による内分比の算出則を用いてもよく、式(7)の代わりに非特許文献1に規定される|θ|=|θ|を仮定した算出則を用いてもよい。
【0036】
【数5】
【数6】
【数7】
【0037】
(実施例)
音響メタデータ座標系変換装置1の効果を確認するため、従来手法及び本発明により座標系変換を行い、規格値と比較する数値実験を行った。「従来手法」とは、5.1.4における極座標値と直交座標値の対応関係をもとに座標系変換した場合(非特許文献1)を示している。「本発明」とは、音響メタデータ座標系変換装置1により座標系変換した場合を示している。「規格値」とは、スピーカ位置における規格上の極座標値と直交座標値の対応関係により座標系変換した場合(ただし、スピーカが存在する位置のみ変換可能)を示している。
【0038】
(実施例:22.2ch)
リスニングルーム基準点の各座標系の対応関係を表1のとおりとし、スピーカ配置を22.2ch、すなわちスピーカ位置における各座標系の対応関係を表2のとおりとした場合、リスニングルーム壁面は表3に示す10個の矩形領域に分割される。表2のスピーカ配置情報におけるスピーカラベルは非特許文献2を参考に記載し、U(Upper):上層、M(Middle):中層、B(Bottom):下層、T(Top):頭上を表す。表3は矩形領域端点の方位角のみを示し、算出した仮想的な方位角については数値を括弧で囲う。
【0039】
【表1】
【表2】
【表3】
【0040】
図5は、スピーカ配置を22.2chとした場合の、上層・中層・下層において音声オブジェクトの方位角を-180度から180度まで1度刻みで座標系変換を行った結果を示す図である。本図の左側のグラフは変換前の方位角(横軸)と変換後のX座標(縦軸)の関係を示し、右側のグラフは変換前の方位角(横軸)と変換後のY座標(縦軸)の関係を示す。図5を参照すると、従来手法による変換結果は、上層、中層において部分的に規格値に基づいた変換結果と一致していないのに対して、本発明による変換結果は、規格値に基づいた変換結果と全て一致することが確認できる。
【0041】
図6は、スピーカ配置を22.2chとした場合の、極座標系において(30,-30,1)の位置からスピーカM+030の位置を通って(30,-30,1)の位置までを直線的に移動する音声オブジェクト、及び(-30,-30,1)の位置からスピーカM-030の位置を通って(-30,-30,1)の位置までを直線的に移動する音声オブジェクトについて座標系変換を行った結果を示す図である。本図のグラフは変換後のX座標(横軸)とZ座標(縦軸)の関係を示す。図6を参照すると、従来手法による変換結果では、音声オブジェクトが中層から上層・下層に移動するにつれて、方位角±45度のスピーカに近づいていくが、本発明による変換結果は、方位角±45度のスピーカと方位角0度のスピーカの間の位置に近づくように座標値が変換され、仰角方向の座標ずれの補正効果が確認できる。
【0042】
(実施例:7.1.4)
リスニングルーム基準点の各座標系の対応関係を22.2chの場合と同様に表3のとおりとし、スピーカ配置を7.1.4、すなわちスピーカ位置における各座標系の対応関係を表4のとおりとした場合、リスニングルーム壁面は表5に示す7個の矩形領域に分割される。
【0043】
【表4】
【表5】
【0044】
図7は、スピーカ配置を7.1.4とした場合の、上層・中層・下層において音声オブジェクトの方位角を-180度から180度まで1度刻みで座標系変換を行った結果を示す図である。本図の左側のグラフは変換前の方位角(横軸)と変換後のX座標(縦軸)の関係を示し、右側のグラフは変換前の方位角(横軸)と変換後のY座標(縦軸)の関係を示す。図7を参照すると、従来手法による変換結果は、上層、中層において部分的に規格値に基づいた変換結果と一致していないのに対して、本発明による変換結果は、規格値に基づいた変換結果と全て一致することが確認できる。
【0045】
図8は、スピーカ配置を7.1.4とした場合の、極座標系において(30,-30,1)位置からスピーカM+030の位置を通って(30,-30,1)の位置までを直線的に移動する音声オブジェクト、及び(-30,-30,1)の位置からスピーカM-030の位置を通って(-30,-30,1)の位置までを直線的に移動する音声オブジェクトについて座標系変換を行った結果を示す図である。本図のグラフは変換後のX座標(横軸)とZ座標(縦軸)の関係を示す。図8を参照すると、従来手法による変換結果では、音声オブジェクトが中層から上層・下層に移動するにつれて、方位角±45度のスピーカに近づいていくが、一方で提案法では、方位角±45度のスピーカと方位角0度のスピーカの間の位置に近づくように座標値が変換され、仰角方向の座標ずれの補正効果が確認できる。
【0046】
(実施例:5.1.4)
リスニングルーム基準点の各座標系の対応関係を表6のとおりとし、スピーカ配置を5.1.4、すなわちスピーカ位置における各座標系の対応関係を表7のとおりとした場合、リスニングルーム壁面は表8に示す5個の矩形領域に分割される。なお、本例ではリスニングルームの各辺中点については極座標の規定を省略した。
【0047】
【表6】
【表7】
【表8】
【0048】
図9は、スピーカ配置を5.1.4とした場合の、上層・中層・下層において音声オブジェクトの方位角を-180度から180度まで1度刻みで座標系変換を行った結果を示す図である。本図の左側のグラフは変換前の方位角(横軸)と変換後のX座標(縦軸)の関係を示し、右側のグラフは変換前の方位角(横軸)と変換後のY座標(縦軸)の関係を示す図である。図9を参照すると、従来手法及び本発明による変換結果がスピーカ位置において規格値に基づいた変換結果と全て一致し、それ以外の位置においても双方の変換結果に大きく相違がないことが確認できる。
【0049】
図10は、スピーカ配置を5.1.4とした場合の、極座標系において(30,-30,1)の位置からスピーカM+030の位置を通ってスピーカU+030の位置までを直線的に移動する音声オブジェクト、及び(-30,-30,1)の位置からスピーカM-030の位置を通ってスピーカU-030の位置までを直線的に移動する音声オブジェクトについて座標系変換を行った結果を示す図である。本図のグラフは変換後のX座標(横軸)とZ座標(縦軸)の関係を示す。図10を参照すると、5.1.4のスピーカ配置においては中層と上層のスピーカの方位角が一致しているので、線分領域端点の高さに応じた補正は行われず、従来手法と同等の変換結果を得ることが確認できる。
【0050】
以上の実験により、音響メタデータ座標系変換装置1は、5.1.4のスピーカ配置においては5.1.4をベースとした従来手法と同程度の変換性能を有し、7.1.4や22.2chにおいては、従来手法と異なり全てのスピーカ位置で非特許文献1に規定された座標値と一致する変換結果を得ることができ、かつ、仰角方向の座標ずれについても補正の効果があることが確認できる。
【0051】
(バリエーション)
以上、音響メタデータ座標系変換装置1について説明したが、スピーカ配置情報は、入力されたリスニングルーム情報に矛盾しなければ必ずしも規格に合致した値でなくともよく、配置するスピーカに加えて、仮想的なスピーカを追加することで、矩形領域内における音声オブジェクトの単位角度あたりの移動量を制御することも可能となる。
【0052】
例えば、リスニングルーム基準点の各座標系の対応関係を表1のとおりとし、スピーカ配置情報を、表9のように22.2chのスピーカ配置に加えて、仮想的なスピーカを中層±110度、中層±150度について直交座標値を指定した場合、リスニングルーム壁面は表10に示す14個の矩形領域に分割される。
【0053】
【表9】
【表10】
【0054】
図11は、スピーカ配置を22.2ch及び仮想的なスピーカを中層±110度、中層±150度とした場合の、音声オブジェクトの方位角を-180度から180度まで1度刻みで座標系変換を行った結果を示す図である。本図の左側のグラフは変換前の方位角(横軸)と変換後のX座標(縦軸)の関係を示し、右側のグラフは変換前の方位角(横軸)と変換後のY座標(縦軸)の関係を示す。図11から、方位角±90度から方位角±135度(複合同順)、方位角±135度から方位角±180度(複合同順)の矩形領域において、音声オブジェクトの単位角度あたりの移動量が変化していることを確認できる。
【0055】
また、この矩形領域内における音声オブジェクトの単位角度あたりの移動量は、式(6)と異なる線分領域端点の内分比の算出則を採用することでも制御することができ、例えば、定義域を線分領域端点の方位角、かつ値域が[0,1]で制約される関数(例えば、多項式関数やスプライン関数や、シグモイド関数など)、非特許文献1で用いられるタンジェント則を用いた方法を使用してもよい。
【0056】
<第2の実施形態>
次に、第2の実施形態について説明する。第2の実施形態では、音声信号に付与された音響メタデータ中の直交座標値(x,y,z)を極座標値(φ,θ,d)に変換する音響メタデータ座標系変換装置について説明する。
【0057】
図12は、第2の実施形態に係る音響メタデータ座標系変換装置2の構成例を示すブロック図である。図12に示す音響メタデータ座標系変換装置2は、矩形領域規定部21と、線分領域規定部22と、座標導出部23と、を備える。なお、第1の実施形態に係る音響メタデータ座標系変換装置1が、音響メタデータ座標系変換装置2の機能を備えていてもよい。
【0058】
図12は、音響メタデータ座標系変換装置2における、音声オブジェクトの位置情報を直交座標値から極座標値に変換する手順を示すフローチャートである。本アルゴリズムは大きくステップS4からステップS6の3ステップに分けることができる。
【0059】
ステップS4では、矩形領域規定部21にて、リスニングルームの基準点及び配置する各スピーカ位置における、極座標値及び直交座標値の対応関係をもとに、リスニングルームの壁面を上層・中層・下層で各座標系の対応関係が既知の位置を端点とする複数の矩形領域を規定する。
【0060】
ステップS5では、線分領域規定部22にて、音声オブジェクトの直交座標値を用いて、Z軸方向で生じる直交座標と極交座標の対応関係を補正した線分領域端点を規定する。
【0061】
ステップS6では、座標導出部23にて、音声オブジェクトが属する線分領域を探索し、線分領域端点の直交座標値と極座標の対応関係をもとに音声オブジェクトの極座標値を導出する。
【0062】
(ステップS4の動作説明)
ステップS41では、直交座標値から極座標値の対応関係を規定するために、リスニングルームの基準点及び各スピーカ位置の、極座標及び直交座標を入力する。ステップS42は、リスニングルーム壁面に複数の矩形領域を規定する。ステップS4の動作は、第1の実施形態で説明したステップS1の動作と同じであるため、詳細な説明を省略する。
【0063】
(ステップS5の動作説明)
ステップS51では、音声オブジェクトが上層より上、又は下層より下に位置するか判定する。
【0064】
ステップS52では、音声オブジェクトのZ座標値をもとに線分領域端点を規定する。具体的には、音声オブジェクトがリスニングルームの天井又は底面に位置する場合には、上層又は下層において規定された矩形領域端点を線分領域端点として使用する。音声オブジェクトが上層より下、下層より上に位置する場合には、音声オブジェクトの高さzにおける水平面と矩形領域との交線を新たに線分領域として定め、音声オブジェクトZ座標値zが中層のZ座標値z=0と一致せず、かつ中層と上層・下層とで矩形領域端点の方位角が異なる場合には、直交座標値に対応する極座標値の方位角のずれを考慮して、線分領域端点の直交座標値(x、y)に対応する極座標値の方位角φを補正する。線分領域端点の補正則として、例えば上述したように式(4)を用いてもよい。
【0065】
(ステップS6の動作説明)
最後に、ステップS61では、音声オブジェクトが属する線分領域端点の情報をもとに極座標値を導出する。音声オブジェクトが属する線分領域の探索については、音声オブジェクト及び線分領域端点の直交座標系における方位角φ’の大小関係に基づいて決定する。直交座標系における方位角は、例えば、非特許文献1で規定されている式(8)を用いて算出する。ただし、天井又は底面に音声オブジェクトが位置する場合は、上層又は下層における矩形領域端点を線分領域端点とみなし、その方位角と音声オブジェクトの方位角の大小関係により決定する。
【数8】
【0066】
次に、音声オブジェクトの方位角を、その音声オブジェクトが属する線分領域端点を用いて導出する。例えば非特許文献1に規定された式(9)により得た直交座標系における音声オブジェクト位置の線分領域端点の内分比g,gを用いて式(10)により算出してもよい。式(10)は、第1の実施形態に例示した極座標値から直交座標系における線分領域の内分比を導出する関数の逆関数に相当する。ただし、gは線分領域の左側端点の方位角と右側端点の方位角の平均に相当する位置における内分比で、例えば式(11)により算出される。また、式(10)の代わりに、非特許文献1に規定されるタンジェント関数による方位角の算出則を用いてもよい。
【数9】
【数10】
【数11】
【0067】
次に、音声オブジェクトの仰角θをZ座標より導出する。例えば、非特許文献1に規定されている式(12)により算出される直交座標系における仰角θ’を用いて、式(13)により仰角を算出してもよい。ただし、変数θ,θ,θ’,θ’はそれぞれ極座標系における上層・下層の仰角、直交座標系における上層・下層の仰角を表す。θ’,θ’は聴取点と上層正面位置の水平方向と垂直方向の距離比を考慮し45度を用いることにし、θ,θは、例えば非特許文献2に規定される上層・下層スピーカの仰角30度を用いる。また、式(13)の代わりに、非特許文献1に規定される|θ’|=|θ’|を仮定した算出則を用いてもよい。
【数12】
【数13】
【0068】
最後に、音声オブジェクトの距離dを導出する。例えば式(14)を用いて算出してもよい。また、式(14)の代わりに、非特許文献1に規定される|θ’|=|θ’|を仮定した算出則を用いてもよい。
【数14】
【0069】
(実施例)
音響メタデータ座標系変換装置2の効果を確認するため、従来手法及び本発明により座標系変換を行い、規格値と比較する数値実験を行った。図中に示す「従来手法」とは、5.1.4における極座標値と直交座標値の対応関係をもとに座標系変換した場合(非特許文献1)を示している。「本発明」とは、音響メタデータ座標系変換装置2により座標系変換した場合を示している。「規格値」とは、スピーカ位置における規格上の極座標値と直交座標値の対応関係により座標系変換した場合(ただし、スピーカが存在する位置のみ変換可能)を示している。
【0070】
(実施例:22.2ch)
リスニングルーム基準点の各座標系の対応関係を上記表1のとおりとし、スピーカ配置を22.2ch、すなわちスピーカ位置における各座標系の対応関係を上記表2のとおりとした場合、リスニングルーム壁面は上記表3に示す10個の矩形領域に分割される。
【0071】
図14は、スピーカ配置を22.2chとした場合の、上層・中層・下層において音声オブジェクトの直交座標系における方位角で-180度から180度まで1度刻みで座標系変換を行った結果を示す図である。本図のグラフは、変換前の直交座標(x,y)(横軸)と変換後の方位角(縦軸)の関係を示す。図14を参照すると、従来手法による変換結果は、上層、中層において部分的に規格値に基づいた変換結果と一致していないのに対して、本発明による変換結果は、規格値に基づいた変換結果と全て一致することが確認できる。
【0072】
図15は、スピーカ配置を22.2chとした場合の、直交標系において(-1,+1,-1)の位置から(-1,+1,+1)の位置までを直線的に移動する音声オブジェクト、及び(+1,+1,-1)の位置から(+1,+1,+1)の位置までを直線的に移動する音声オブジェクトについて座標系変換を行った結果を示す図である。本図のグラフは変換後の方位角(横軸)と仰角(縦軸)の関係を示す。図15を参照すると、スピーカ位置の規格値に則るならば、直交座標系において(-1,+1,-1)の位置から(-1,+1,+1)の位置までを直線的に移動した場合、スピーカB±045の位置から、スピーカM±030の位置を経由しスピーカU±045の位置まで移動するはずである。従来手法による変換結果では常に方位角±30度を維持している一方で、提案法では、想定どおりに音声オブジェクトが移動するように座標値が変換され、Z軸方向の座標ずれの補正効果が確認できる。
【0073】
(実施例:7.1.4)
リスニングルーム基準点の各座標系の対応関係を22.2chの場合と同様に上記表3のとおりとし、スピーカ配置を7.1.4、すなわちスピーカ位置における各座標系の対応関係を上記表4のとおりとした場合、リスニングルーム壁面は上記表5に示す7個の矩形領域に分割される。
【0074】
図16は、スピーカ配置を7.1.4とした場合の、上層・中層・下層において音声オブジェクトの直交座標系における方位角を-180度から180度まで1度刻みで座標系変換を行った結果示す図である。本図のグラフは、変換前の直交座標(x,y)(横軸)と変換後の方位角(縦軸)の関係を示す。図16を参照すると、従来手法による変換結果は、上層、中層において部分的に規格値に基づいた変換結果と一致していないのに対して、本発明による変換結果は、規格値に基づいた変換結果と全て一致することが確認できる。
【0075】
図17は、スピーカ配置を7.1.4とした場合の、直交座標系において(-1,+1,-1)の位置から(-1,+1,+1)の位置までを直線的に移動する音声オブジェクト、及び(+1,+1,-1)の位置から(+1,+1,+1)の位置までを直線的に移動する音声オブジェクトについて座標系変換を行った結果を示す図である。本図のグラフは変換後の方位角(横軸)と仰角(縦軸)の関係を示す。図17を参照すると、従来手法による変換結果では常に方位角±30度を維持している一方で、提案法では、想定どおりに音声オブジェクトが移動するように座標値が変換され、Z軸方向の座標ずれの補正効果が確認できる。
【0076】
(実施例:5.1.4)
リスニングルーム基準点の各座標系の対応関係を上記表6のとおりとし、スピーカ配置を5.1.4、すなわちスピーカ位置における各座標系の対応関係を上記表7のとおりとした場合、リスニングルーム壁面は上記表8に示す5個の矩形領域に分割される。
【0077】
図18は、スピーカ配置を5.1.4とした場合の、上層・中層・下層において音声オブジェクトの直交座標系における方位角で-180度から180度まで1度刻みで座標系変換を行った結果を示す図である。本図のグラフは、変換前の直交座標(x,y)(横軸)と変換後の方位角(縦軸)の関係を示す。図18を参照すると、従来手法及び本発明による変換結果がスピーカ位置において規格値に基づいた変換結果と全て一致し、それ以外位置においても双方の変換結果に大きく相違がないことが確認できる。
【0078】
図19は、スピーカ配置を5.1.4とした場合の、直交座標系において(-1,+1,-1)の位置から(-1,+1,+1)の位置までを直線的に移動する音声オブジェクト、及び(+1,+1,-1)の位置から(+1,+1,+1)の位置までを直線的に移動する音声オブジェクトについて座標系変換を行った結果を示す図である。本図のグラフは、変換後の方位角(横軸)と仰角(縦軸)の関係を示す。図19を参照すると、5.1.4のスピーカ配置においては中層と上層のスピーカの方位角が一致しているので、線分領域端点の高さに応じた補正は行われず、従来手法と同等の変換結果を得ることが確認できる。
【0079】
したがって、本実験により、5.1.4のスピーカ配置においては5.1.4をベースとした従来手法と同程度の変換性能を有し、7.1.4や22.2chにおいては、従来手法と異なり全てのスピーカ位置で非特許文献1に規定された座標値と一致する変換結果を得ることができ、かつ、Z軸方向の座標ずれについても補正の効果があることが確認できる。
【0080】
図20は、リスニングルーム情報やスピーカ配置情報を前記の実施例のとおり(22.2ch/7.1.4/5.1.4)とし、音声オブジェクトの極座標系において方位角で-180度から180度まで5度刻み、仰角で-90度から90度まで15度刻みの位置で第1の実施形態に係る音響メタデータ座標系変換装置1により、極座標値から直交座標値に変換を行った後、その直交座標値を音響メタデータ座標系変換装置2により極座標値に変換した結果を示す図である。本図のグラフは、変換前の極座標における方位角(横軸)と変換後の方位角(縦軸)の関係を示す。図20を参照すると、変換前の方位角φが±180度のときを除き、変換後の方位角φ^との関係がφ^=φの直線上にあり、変換前と変換後で同一の値をとることが確認できる。なお、方位角+180度、-180度の位置においても、2つの方位角が同一の位置を示すため、変換前と変換後で同一の値をとることが言える。よって、第1の実施形態に係る音響メタデータ座標系変換装置1と、音響メタデータ座標系変換装置2は、一意に逆変換できることが言える。
【0081】
(バリエーション)
以上、音響メタデータ座標系変換装置2について説明したが、スピーカ配置情報は、入力されたリスニングルーム情報に矛盾しなければ必ずしも規格に合致した値でなくともよく、配置するスピーカに加えて、仮想的なスピーカを追加することで、矩形領域内における音声オブジェクトの単位角度あたりの移動量を制御することも可能となる。
【0082】
例えば、上記実施例において、(±1,+1,-1)の位置から(±1,+1,+1)の位置までを直線的に移動する音声オブジェクトについて、本発明では図15に示すとおり規格値に合致するように移動することを確認したが、直交座標系では音声オブジェクトが垂直に上昇するように移動するが極座標では、方位角を変えながら移動している。例えば、直交座標系と同様に、極座標系においても方位角を維持しながら移動するようにしたい場合、リスニングルーム基準点の各座標系の対応関係を表11のように上層・下層左前方、右前方における方位角を中層と同じく30度を指定し、22.2chにおけるスピーカ配置情報を表12のように指定すればよく、この場合リスニングルーム壁面は表13に示す10個の矩形領域に分割される。なお、配置を指定しないスピーカについては、スピーカも基準点も存在しない各座標系間の対応関係が規定されていない点と同様に仮想的に方位角を導出する。
【表11】
【表12】
【表13】
【0083】
図21は、スピーカ配置を22.2chとし、リスニングルームの左前方(x,y)=(-1,1)/右前方(x,y)=(1,1)の対応する方位角を高さzによらず±30度とした場合の、上層・中層・下層において音声オブジェクトの直交座標系における方位角で-180度から180度まで1度刻みで座標系変換を行った結果を示す図である。本図のグラフは、変換前の直交座標(x,y)(横軸)と変換後の方位角(縦軸)の関係を示す。
【0084】
図22は、スピーカ配置を22.2chとし、リスニングルームの左前方(x,y)=(-1,1)/右前方(x,y)=(1,1)の対応する方位角を高さzによらず±30度とした場合の、直交座標系におい(-1,+1,-1)の位置から(-1,+1,+1)の位置までを直線的に移動する音声オブジェクト、及び(+1,+1,-1)の位置から(+1,+1,+1)の位置までを直線的に移動する音声オブジェクトについて座標系変換を行った結果を示す図である。本図のグラフは変換後の方位角(横軸)と仰角(縦軸)の関係を示す。
【0085】
図21図22を参照すると、上層・下層の方位角±45度のみ規格値と一致しない結果となるが、本発明においても方位角±30度を維持しながら音声オブジェクトが移動することが確認できる。
【0086】
また、この矩形領域内における音声オブジェクトの単位移動量は、仮想的なスピーカの追加や、式(10)と異なる算出則を採用することでも制御することができ、例えば、定義域を[0,1]、かつ値域が矩形領域端点の方位角で制約される関数(例えば、多項式関数やスプライン関数など)、非特許文献1で用いられるタンジェント則を用いた方法を使用してもよい。
【0087】
(プログラム)
上述した音響メタデータ座標系変換装置1,2として機能させるために、プログラム命令を実行可能なコンピュータを用いることも可能である。ここで、コンピュータは、汎用コンピュータ、専用コンピュータ、ワークステーション、PC(Personal Computer)、電子ノートパッドなどであってもよい。プログラム命令は、必要なタスクを実行するためのプログラムコード、コードセグメントなどであってもよい。
【0088】
コンピュータは、プロセッサと、記憶部と、入力部と、出力部と、通信インターフェースとを備える。プロセッサは、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)、DSP(Digital Signal Processor)、SoC(System on a Chip)などであり、同種又は異種の複数のプロセッサにより構成されてもよい。プロセッサは、記憶部からプログラムを読み出して実行することで、上記各構成の制御及び各種の演算処理を行う。なお、これらの処理内容の少なくとも一部をハードウェアで実現することとしてもよい。入力部は、ユーザの入力操作を受け付けてユーザの操作に基づく情報を取得する入力インターフェースであり、ポインティングデバイス、キーボード、マイクなどである。出力部は、情報を出力する出力インターフェースであり、ディスプレイ、スピーカなどである。通信インターフェースは、外部の装置と通信するためのインターフェースであり、例えばLAN(Local Area Network)インターフェースである。
【0089】
プログラムは、コンピュータが読み取り可能な記録媒体に記録されていてもよい。このような記録媒体を用いれば、プログラムをコンピュータにインストールすることが可能である。ここで、プログラムが記録された記録媒体は、非一過性(non-transitory)の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROM、DVD-ROM、USB(Universal Serial Bus)メモリなどであってもよい。また、このプログラムは、ネットワークを介して外部装置からダウンロードされる形態としてもよい。
【0090】
上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形又は変更が可能である。例えば、実施形態の構成図に記載の複数の構成ブロックを統合したり、1つの構成ブロックを分割したりすることが可能である。
【符号の説明】
【0091】
1,2 音響メタデータ座標系変換装置
11,21 矩形領域規定部
12,22 線分領域規定部
13,23 座標導出部
図1
図2
図3
図4A
図4B
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22