特開2015-95719(P2015-95719A)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本放送協会の特許一覧 ▶ アストロデザイン株式会社の特許一覧

特開2015-95719音像表示装置、音像表示システム、および音像表示方法
<>
  • 特開2015095719-音像表示装置、音像表示システム、および音像表示方法 図000005
  • 特開2015095719-音像表示装置、音像表示システム、および音像表示方法 図000006
  • 特開2015095719-音像表示装置、音像表示システム、および音像表示方法 図000007
  • 特開2015095719-音像表示装置、音像表示システム、および音像表示方法 図000008
  • 特開2015095719-音像表示装置、音像表示システム、および音像表示方法 図000009
  • 特開2015095719-音像表示装置、音像表示システム、および音像表示方法 図000010
  • 特開2015095719-音像表示装置、音像表示システム、および音像表示方法 図000011
  • 特開2015095719-音像表示装置、音像表示システム、および音像表示方法 図000012
  • 特開2015095719-音像表示装置、音像表示システム、および音像表示方法 図000013
  • 特開2015095719-音像表示装置、音像表示システム、および音像表示方法 図000014
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】特開2015-95719(P2015-95719A)
(43)【公開日】2015年5月18日
(54)【発明の名称】音像表示装置、音像表示システム、および音像表示方法
(51)【国際特許分類】
   H04S 7/00 20060101AFI20150421BHJP
【FI】
   H04S7/00 B
【審査請求】未請求
【請求項の数】8
【出願形態】OL
【全頁数】20
(21)【出願番号】特願2013-233284(P2013-233284)
(22)【出願日】2013年11月11日
(71)【出願人】
【識別番号】000004352
【氏名又は名称】日本放送協会
(71)【出願人】
【識別番号】000101330
【氏名又は名称】アストロデザイン株式会社
(74)【代理人】
【識別番号】100147485
【弁理士】
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】100161148
【弁理士】
【氏名又は名称】福尾 誠
(72)【発明者】
【氏名】岡野 充男
(72)【発明者】
【氏名】海老原 豊
(72)【発明者】
【氏名】眞鍋 吉仁
(57)【要約】
【課題】サラウンド再生のように複数チャンネルで再生される音声の音像を視覚的に表現することができる音像表示装置、音像表示システム、および音像表示方法を提供する。
【解決手段】音像表示装置1は、複数のチャンネルのうち2つのチャンネルの音声データに基づいて、その2つのチャンネル間における音声の逆相成分の比率を算出し、この逆相成分の比率に応じて曲率を変化させた曲線であって逆相成分の比率に応じた色の曲線を描画する描画データを出力する。
【選択図】図1
【特許請求の範囲】
【請求項1】
複数のチャンネルのうち2つのチャンネルの音声データに基づいて、当該2つのチャンネル間における音声の逆相成分の比率を算出し、当該逆相成分の比率に応じて曲率を変化させた曲線であって当該逆相成分の比率に応じた色の曲線を描画する描画データを出力する、音像表示装置。
【請求項2】
前記2つのチャンネルの音声データに基づいて、当該2つのチャンネルそれぞれにおける音声のレベルを検出し、当該音声のレベルおよび前記逆相成分の比率に応じて曲率を変化させた前記曲線を描画する描画データを出力する、請求項1に記載の音像表示装置。
【請求項3】
前記2つのチャンネルの音声データに基づいて、当該2つのチャンネルそれぞれにおける音声レベルを検出し、当該2つのチャンネルそれぞれにおける音声レベルを表す線分の長さに対応する2つの座標を両端の点とし、前記逆相成分の比率に対応する座標を制御点とする2次ベジェ曲線を描画する描画データを出力する、請求項2に記載の音像表示装置。
【請求項4】
前記2つのチャンネル間における音声の逆相成分の比率が所定の閾値以上または所定の閾値以下である時は、所定の色の前記曲線を描画する描画データを出力する、請求項1〜3のいずれかに記載の音像表示装置。
【請求項5】
前記2つのチャンネル間における音声の逆相成分の比率が、完全に同相と完全に逆相との間における第2の範囲内にある時は、前記逆相成分の比率に応じて所定の色の間で徐々に変化する色の前記曲線を描画する描画データを出力する、請求項1〜4のいずれかに記載の音像表示装置。
【請求項6】
前記複数のチャンネルのうち低域効果音用チャンネルの音声データに基づいて、当該低域効果音用チャンネルにおける音声のレベルを検出し、当該音声のレベルに応じて半径および色の少なくとも一方を変化させた円形を描画する描画データをさらに出力する、請求項1〜5のいずれかに記載の音像表示装置。
【請求項7】
複数のチャンネルのうち2つのチャンネルの音声データに基づいて、当該2つのチャンネル間における音声の逆相成分の比率を算出し、当該逆相成分の比率に応じて曲率を変化させた曲線であって当該逆相成分の比率に応じた色の曲線を描画する描画データを出力する制御部と、
前記制御部により出力された描画データに基づく曲線を表示する表示部と、
を備える、音像表示システム。
【請求項8】
複数のチャンネルのうち2つのチャンネルの音声データに基づいて、当該2つのチャンネル間における音声の逆相成分の比率を算出するステップと、
前記逆相成分の比率に応じて曲率を変化させた曲線であって当該逆相成分の比率に応じて変化させた色の曲線を描画する描画データを出力するステップと、
を含む、音像表示装置の音像表示方法。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音像表示装置、音像表示システム、および音像表示方法に関するものである。より詳細には、本発明は、複数チャンネルの音声をサラウンド再生する際の音像を視覚的に表示する描画データを出力する音像表示装置、このような音像を表示する音像表示システム、および、そのような音像表示装置の音像表示方法に関するものである。
【背景技術】
【0002】
従来、ステレオ音声の再生においては、オーディオレベルメータ等を使用して、L/R信号それぞれに基づく各チャンネルの音声のレベル管理を行っている。また、位相メータを使用してチャンネル間の位相監視を行うことにより、音の広がりを監視したり、音が逆相になっていないか等を判定したりしている。
【0003】
一方、音声のサラウンド再生においては、上述したような各チャンネルの音声のレベル管理、およびチャンネル間の位相監視を行うことに加え、さらに、平面空間への音の広がり(音像)についても管理する必要がある。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2012−186525号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、音声をサラウンド再生する際の多種多様な情報を収集するために、様々なツールを使用して監視しようとすると、複雑な構成の機器類が必要になる。また、このような情報は、音声の再生に伴って、リアルタイムで動的に監視できるようにするのが望ましい。そこで、このような多種多様な情報を集約するのみならず、視覚に訴える表現により直感的に把握することを可能にする計測ツールがあれば、極めて利便性が高い。
【0006】
したがって、本発明の目的は、サラウンド再生のように複数チャンネルで再生される音声の音像を視覚的に表現することができる音像表示装置、音像表示システム、および音像表示方法を提供することにある。
【課題を解決するための手段】
【0007】
上記目的を達成する第1の観点に係る音像表示装置の発明は、
複数のチャンネルのうち2つのチャンネルの音声データに基づいて、当該2つのチャンネル間における音声の逆相成分の比率を算出し、当該逆相成分の比率に応じて曲率を変化させた曲線であって当該逆相成分の比率に応じた色の曲線を描画する描画データを出力することを特徴とする。
【0008】
また、前記2つのチャンネルの音声データに基づいて、当該2つのチャンネルそれぞれにおける音声のレベルを検出し、当該音声のレベルおよび前記逆相成分の比率に応じて曲率を変化させた前記曲線を描画する描画データを出力してもよい。
【0009】
また、前記2つのチャンネルの音声データに基づいて、当該2つのチャンネルそれぞれにおける音声レベルを検出し、当該2つのチャンネルそれぞれにおける音声レベルを表す線分の長さに対応する2つの座標を両端の点とし、前記逆相成分の比率に対応する座標を制御点とする2次ベジェ曲線を描画する描画データを出力してもよい。
【0010】
また、前記2つのチャンネル間における音声の逆相成分の比率が所定の閾値以上または所定の閾値以下である時は、所定の色の前記曲線を描画する描画データを出力してもよい。
【0011】
また、前記2つのチャンネル間における音声の逆相成分の比率が、完全に同相と完全に逆相との間における第2の範囲内にある時は、前記逆相成分の比率に応じて所定の色の間で徐々に変化する色の前記曲線を描画する描画データを出力してもよい。
【0012】
また、前記複数のチャンネルのうち低域効果音用チャンネルの音声データに基づいて、当該低域効果音用チャンネルにおける音声のレベルを検出し、当該音声のレベルに応じて半径および色の少なくとも一方を変化させた円形を描画する描画データをさらに出力してもよい。
【0013】
上記目的を達成する第2の観点に係る音像表示システムの発明は、
複数のチャンネルのうち2つのチャンネルの音声データに基づいて、当該2つのチャンネル間における音声の逆相成分の比率を算出し、当該逆相成分の比率に応じて曲率を変化させた曲線であって当該逆相成分の比率に応じた色の曲線を描画する描画データを出力する制御部と、
前記制御部により出力された描画データに基づく曲線を表示する表示部と、
を備えることを特徴とする。
【0014】
上記目的を達成する第3の観点に係る音像表示装置の音像表示方法の発明は、
複数のチャンネルのうち2つのチャンネルの音声データに基づいて、当該2つのチャンネル間における音声の逆相成分の比率を算出するステップと、
前記逆相成分の比率に応じて曲率を変化させた曲線であって当該逆相成分の比率に応じて変化させた色の曲線を描画する描画データを出力するステップと、
を含むことを特徴とする。
【発明の効果】
【0015】
本発明によれば、サラウンド再生のように複数チャンネルで再生される音声の音像を視覚的に表現することができる音像表示装置、音像表示システム、および音像表示方法を提供することができる。
【図面の簡単な説明】
【0016】
図1】本発明の実施形態に係る音像表示装置およびシステムの概略構成を説明する機能ブロック図である。
図2】各チャンネルにおける音声のレベル検出から座標変換までを説明する図である。
図3】各チャンネルにおける音声のレベル検出から座標変換までの結果を例示する図である。
図4】各チャンネルにおける音声のレベル検出から座標変換までの結果を合成した図である。
図5】2つのチャンネルにおける音声の相関検出から描画データ出力までを説明する図である。
図6】2つのチャンネルにおける音声の相関検出から描画データ出力までの結果を例示する図である。
図7】2つのチャンネルにおける音声の相関検出から描画データ出力までの結果を合成した図である。
図8】色データ変換処理を説明する図である。
図9】2つのチャンネルにおける音声の相関検出および色データ生成に基づく描画の結果を例示する図である。
図10】2つのチャンネルにおける音声の相関検出および色データ生成に基づく描画の結果を合成した図である。
【発明を実施するための形態】
【0017】
以下、本発明の実施形態について、図面を参照して説明する。
【0018】
図1は、本発明の実施形態に係る音像表示装置およびシステムの概略構成を説明する機能ブロック図である。
【0019】
図1に示すように、本実施形態に係る音像表示装置1は、制御部10、および記憶部20を備えている。制御部10は、複数のチャンネルの音声データが入力されると、当該音声データに対応する描画データを出力する。また、制御部10から出力された描画データは、表示部30に表示することができる。
【0020】
以下、制御部10および記憶部20を含んで本発明に係る音像表示装置1を構成し、さらに表示部30を含んで本発明に係る音像表示システムを構成するものとして説明する。しかしながら、本発明はこのような実施形態に限定されるものではなく、例えば音像表示装置1が自ら表示部を有するような構成としてもよい。
【0021】
制御部10は、例えばプロセッサまたはマイコンなどの任意の処理装置を含んで構成することができる。本実施形態において、制御部10は、各種のデータの入力に基づいて、当該データを解析したり、各種の演算処理を施したりする。制御部10は、このような演算処理の結果を、2次元空間上に描画する描画データとして出力することができる。また、制御部10は、必要に応じて各種の解析結果を記憶部20に記憶させたり、必要に応じて記憶部20に記憶された各種情報を読み出したりすることができる。
【0022】
記憶部20は、任意のメモリ装置を含んで構成することができる。記憶部20は、制御部10が上述したようなデータ解析および各種の演算処理などを行う際のアルゴリズム、およびルックアップテーブル(LUT)のような各種の参照テーブルなども記憶する。
【0023】
表示部30は、例えばLCDまたは有機ELディスプレイなどの任意の表示装置により構成することができる。表示部30は、描画データが入力されると、その表示画面に描画データに基づく表示を行う。この描画データは、表示部30の仕様に応じて、任意の規格のアナログまたはデジタルの出力とすることができる。本実施形態においては、音像を視覚的に把握容易にするような表示を行うため、表示部30はカラー表示可能であることが望ましい。しかしながら、例えばグレースケールなど単色を諧調表示することにより、カラー表示の代用とすることもできる。以下の説明においては、表示部30は、少なくともいくつかの色を用いたカラー表示を行うことができるものとする。
【0024】
本実施形態に係る音像表示装置1は、複数のチャンネルの音声データの入力に基づいて、当該音声データに対応する描画データを出力する。ここで、音像表示装置1が扱う音声データの複数のチャンネル数は特に限定されるものではなく、任意の複数のチャンネルとすることができる。以下の説明においては、例として、一般的に用いられる5.1chサラウンドの場合について述べる。
【0025】
すなわち、以下の説明で用いる5.1chの音声データを再生する際には、次のような基本システムを用いて再生することを想定する。
まず、聴く人の位置(リスニングポジション(O))を中心として、リスニングポジションの前方正面の中央にセンタースピーカ(C)を配置する。
次に、前方正面から左30°の位置に左フロントスピーカ(L)を、また前方正面から右30°の位置に右フロントスピーカ(R)を配置する。
さらに、センタースピーカより左110°方向に左サラウンドスピーカ(Ls)を、またセンタースピーカより右110°方向に右サラウンドスピーカ(Rs)を配置する。
これに低音域専用のサブウーファ(LFE)を加える。
【0026】
次に、本実施形態に係る音像表示装置1において、音声データの入力に基づいて、描画データを出力する際の処理について説明する。
【0027】
まず、5.1chの各チャンネルのレベルを検出することにより、各チャンネルのレベルをオーディオレベルバーとして描画する描画データを出力する際の処理について説明する。
【0028】
図2は、各チャンネルにおける音声のレベル検出処理から座標変換処理までを説明する図である。
【0029】
図2に示す処理が開始すると、制御部10は、音像表示装置1に入力された音声データに基づいて、当該音声データが再生されるチャンネルの音声のレベルを検出する(ステップS11)。ステップS11においては、制御部10は、入力される音声データのビット深度を24bitの数値として、各チャンネルごとにレベルを検出する。このため、5.1chの音声データにおいては、上述したC,L,R,Ls,Rs,LFEの各スピーカによって再生されるそれぞれのチャンネルについて、図2に示す処理を行う。
【0030】
ステップS11では、制御部10は、例えば、音声サンプリングレートを48kHzとし、その音声サンプル数(パラメータN)を16384として、以下の式(1)に示すような二乗平均平方根を用いた数値処理を行うものとする。式(1)においては、あるチャンネルの24bitの音声データをxとして示してある。したがって、xは、パラメータNを総数とする各サンプルにおける24bitの値を表す。制御部10は、このようにしてレベルを検出した結果を、23bitのデータとして出力するものとする。
【0031】
【数1】
【0032】
ステップS11において各チャンネルにおける音声のレベルが検出されたら、制御部10は、当該レベルをdB値に変換する(ステップS12)。ステップS12においては、制御部10は、例えば以下の式(2)に基づいて、23bitのデータを0.0〜−80.0dBの値に変換することができる。なお、式(2)においては、ステップS11において得られた23bitの値をxとして示してある。
20*log10(x/8388607) (2)
【0033】
ステップS12において音声レベルがdB値に変換されたら、制御部10は、この値をXY平面において各チャンネルに対応する座標に変換する(ステップS13)。本実施形態においては、各チャンネルにおける音声を再生するスピーカが配置される位置と、当該チャンネルにおける音声のレベルとの対応関係を、一見して把握し易いように表示部30に表示する。このため、表示部30に表示されるXY平面と、リスニングポジションをとり囲むスピーカの配置とを対応させる。すなわち、上述したC,L,R,Ls,Rsの各スピーカの配置される位置を、表示部30に表示されるXY平面上の位置に対応させる。この際、例えば、表示部30に表示されるXY平面上の原点Oにリスニングポジションを対応させることができる。
【0034】
このようして、本実施形態においては、各チャンネルにおける音声のレベルが、表示部30においてスピーカが配置される方向を示すそれぞれの軸の長さが表すようにする。このため、ステップS13において、制御部10は、ステップS12において算出されたdB値が、表示部30において対応するスピーカの配置される方向を示す線分の原点からの長さを表すように、線分の終点の座標を算出する。
【0035】
図3は、各チャンネルにおける音声のレベル検出処理から座標変換処理までの結果を例示する図である。
【0036】
図3(A)に示すように、ステップS13において、制御部10は、センタースピーカが再生する音声のレベル(dB値)が線分OCの長さに対応するように、座標Cを求める。
また、図3(B)に示すように、制御部10は、左フロントスピーカが再生する音声のレベルが線分OLの長さに対応するように、座標Lを求める。
また、図3(C)に示すように、制御部10は、右フロントスピーカが再生する音声のレベルが線分ORの長さに対応するように、座標Rを求める。
また、図3(D)に示すように、制御部10は、左サラウンドスピーカが再生する音声のレベルが線分OLsの長さに対応するように、座標Lsを求める。
また、図3(E)に示すように、制御部10は、右サラウンドスピーカが再生する音声のレベルが線分ORsの長さに対応するように、座標Rsを求める。
【0037】
また、低音域専用のサブウーファは無指向性であるため、本実施形態において、サブウーファはが再生する音声のレベルは、表示部30においてリスニングポジションを中心とする円形の大きさによって表すようにする。このため、図3(F)に示すように、ステップS13において、制御部10は、サブウーファが再生する音声のレベルが円形の半径に対応するように、座標LFEを求める。
【0038】
このように、ステップS13において各チャンネルに対応する座標データ(LFEの場合は円の半径のデータ)が求まると、制御部10は、各チャンネルのレベルを表す描画データを生成して出力することができる。このようにして出力された描画データに基づいて、表示部30は、各チャンネルのレベルを、各チャンネルの音声を再生するスピーカの方向に対応したオーディオレベルメータとして表示することができる。
【0039】
図4は、各チャンネルにおける音声のレベル検出処理から座標変換処理までの結果を合成した図である。図4においては、上述したC,L,R,Ls,Rs,LFEの各スピーカによって再生されるそれぞれのチャンネルについて図2に示す処理を行った結果を全て合成して示してある。なお、LFEのレベルを表す円形の図形は、その円周のみを表示するようにしてもよいし、円周の内部も含めて円盤全体として表示してもよい。しかしながら、円盤全体として表示する場合、他のチャンネルのレベル表示などが見にくくなるのを防ぐため、例えば半透明の色で他の表示が透過するように表示するのが好適である。このように各チャンネルにおける音声のレベルを表示することにより、各チャンネルにおける音声を再生するスピーカが配置される位置と、当該チャンネルにおける音声のレベルとの対応関係を、一見して容易に把握することができる。このように各チャンネルにおける音声のレベルを表示することで、例えば各チャンネルのピークレベルと当該チャンネルの音声が出力されるスピーカの位置との対応関係を、視覚的に容易に把握することができる。
【0040】
図4に示すような表示を行う際に、あるチャンネルにおける音声のレベルが所定の閾値以上となるような場合、警告を示唆するような色(例えば赤色)に変化させて表示する描画データを出力してもよい。この場合、例えば図4に示す線分および/またはLFEのレベルを示す円形の図形の一部または全部の色を変化させて表示することができる。
【0041】
このように、本実施形態では、制御部10は、複数のチャンネルのうち少なくとも1つの音声データに基づいて、当該少なくとも1つのチャンネルにおける音声のレベルを検出し、当該音声のレベルに応じて長さを変化させた線分を描画する描画データを出力する。
【0042】
また、上述のように、制御部10は、複数のチャンネルのうち低域効果音用チャンネルの音声データに基づいて、当該低域効果音用チャンネルにおける音声のレベルを検出し、当該音声のレベルに応じて半径を変化させた円形を描画する描画データを出力する。この場合、制御部10は、低域効果音用チャンネルにおける音声のレベルが所定の閾値以上である時は、当該音声のレベルに応じて変化させた色の前記円形を描画する描画データを出力してもよい。
【0043】
次に、5.1chのうち2つのチャンネルのレベルを検出することにより、2つのチャンネルにおける音声の相関関係に基づく曲線を描画する描画データを出力する際の処理について説明する。
【0044】
図5は、2つのチャンネルにおける音声の相関検出処理から描画データ出力処理までを説明する図である。
【0045】
以下の説明においては、音声の相関検出処理から描画データ出力処理までを行う2つのチャンネルの音声データを、便宜上、「第1音声データ」および「第2音声データ」と記す。そして、例えば「L−R」のような表記は、図5に示す処理において、第1音声データをチャンネルLの音声データとして、また第2音声データをチャンネルRの音声データとして処理を行うことを意味する。このようにして、L−Rについて図5に示す処理を行うと、これらチャンネルLおよびチャンネルRの2つのチャンネル間における音声の逆相成分の比率に応じた曲線を描画する描画データを出力することができる。
【0046】
図5に示す処理が開始すると、制御部10は、音像表示装置1に入力された音声データに基づいて、複数のチャンネルのうち2つのチャンネルの音声データの相関係数を算出する(ステップS21)。ステップS21においては、ステップS11と同様に、入力される音声データのビット深度を24bitの数値とする。また、ステップS21においては、複数のチャンネルのうち2つのチャンネルの音声データの相関係数を算出する。このため、5.1chの音声データにおいては、L−R,C−L,C−R,L−Ls,R−Rs,Ls−Rsのように、2つのチャンネルについて、それぞれ図5に示す処理を行う。ここで、複数のチャンネルのうち2つのチャンネルとは、スピーカが配置される位置において隣接する2つのチャンネルとするのが好適であるが、例えばCを無視してL−Rの相関を求める場合のように、隣接する2つのチャンネルにはならない場合もある。
【0047】
ステップS21では、制御部10は、例えば、パラメータnを2048として、以下の式(3)に示すような相関計算式を用いた数式処理を行うものとする。式(3)においては、第1音声データ(24bit)をxとして示し、第2音声データ(24bit)をyとして示してある。したがって、x,yは、それぞれ、パラメータnを総数とする各サンプルにおける24bitの値を表す。制御部10は、このようにして算出した結果を、−1〜+1の範囲の相関係数として出力するものとする。
【0048】
【数2】
【0049】
本実施形態において、制御部10が出力する描画データが描画する曲線は2次ベジェ曲線(Bezier Curve)とする。そこで、ステップS21において2つのチャンネルにおける相関係数が算出されたら、制御部10は、以下の式(4)を用いて、当該相関係数から、出力する描画データに基づいて描画される曲線の曲げ係数を算出する(ステップS22)。
128×(相関係数+1)×(補正値) (4)
【0050】
ここで、上記(補正値)とは、例えば、L−R,L−C,R−Cの変換においては0.83とし、L−Ls,R−Rsの変換においては0.90とし、Ls−Rsの変換においては0.68とするのが好適である。この補正値を乗じることにより、描画されるベジェ曲線は、ステップS21で算出した相関係数がゼロの時、近似円になる。また、ハードウェアに実装する際に整数化する必要があるため、式(4)に示すように値を128倍して8bit化するのが好適である。このようにして、制御部10は、ステップS22で算出した結果を8bitのデータとして出力する。
【0051】
ステップS22において曲げ係数が算出されたら、制御部10は、当該曲げ係数ならびに第1および第2音声データの座標に基づいて、ベジェ曲線を生成する(ステップS23)。
【0052】
ステップS23においては、制御部10は、3点の座標に基づいて、2次ベジェ曲線を生成する。ここで、2点の座標として、第1音声データおよび第2音声データから算出した座標データを用いる。この2点の座標データは、図2に示した処理に従って、第1音声データおよび第2音声データから求めたそれぞれの座標データを用いることができる。
【0053】
本実施形態では、これら2点の座標データの他に、上述した曲げ曲線に基づく1点の制御点を用いて、2次ベジェ曲線を生成する。この制御点をQ(x3,y3)とすると、例えば以下のようにして2次ベジェ曲線を生成することができる。
【0054】
XY座標平面上に、原点O(0,0)、第1音声データから求めた座標A(x1,y1)、および第2音声データから求めた座標B(x2,y2)を規定する。また、A(x1,y1)とB(x2,y2)との中点をM(Xm,Ym)とし、前述の相関係数(−1〜+1)をkとする。ここで、k=0の時に、Qを制御点として点A,Bを通るベジェ曲線は近似円となり、−1<k<0のときベジェ曲線の曲率が大きくなり、0<k<+1のときベジェ曲線の曲率が小さくなり、k=+1のときベジェ曲線はABを結ぶ線分となる。
【0055】
制御点Qの座標(x3,y3)は、M(Xm,Ym)を基準にして、以下の式(5)のように求めることができる。ただし、(X*,Y*)は、線分ABに垂直な方向ベクトルを意味する。
(x3,y3)=(Xm,Ym)+k(X*,Y*) (5)
【0056】
式(5)においてk=0とき、(X*,Y*)はA,Bによって一意に決定する。なお、k=0のときに描画される近似円の精度は角AOBに依存して変化する。その整合性をとるため、上述した式(4)においては相関係数に補正値を乗じる。
【0057】
ステップS23においては、以上のようにして、A(x1,y1)、B(x2,y2)、およびQ(x3,y3)の3点の座標が算出されたら、制御部10は、これら3点に基づく2次ベジェ曲線を生成する。この場合、ベジェ曲線の定義に基づいて点と点を結ぶ曲線を生成する。具体的には、値t=0〜1(tは1/1024ステップ)として、以下の式(6)および式(7)を用いて、ベジェ曲線を生成する。
x=x(t)=t^2*x2+2*t*(1−t)*x3+(1−t)^2*x1 (6)
y=y(t)=t^2*y2+2*t*(1−t)*y3+(1−t)^2*x1 (7)
【0058】
ステップ23においてベジェ曲線が生成されたら、制御部10は、生成された曲線をXY平面上に表示する描画データを生成して(ステップS24)出力する。ここで、生成された曲線をカラー表示するために、色データとともに描画データを生成して出力することになるが、曲線の着色については後述する。
【0059】
図6は、2つのチャンネルにおける音声の相関検出から描画データ出力までの結果を例示する図である。
【0060】
図6(A)に示すように、ステップS23において、制御部10は、L−Rの2つのチャンネルについてベジェ曲線LRを生成する。
また、図6(B)に示すように、制御部10は、C−Lの2つのチャンネルについてベジェ曲線CLを生成する。
また、図6(C)に示すように、制御部10は、C−Rの2つのチャンネルについてベジェ曲線CRを生成する。
また、図6(D)に示すように、制御部10は、L−Lsの2つのチャンネルについてベジェ曲線LLsを生成する。
また、図6(E)に示すように、制御部10は、R−Rsの2つのチャンネルについてベジェ曲線RRsを生成する。
また、図6(F)に示すように、制御部10は、Ls−Rsの2つのチャンネルについてベジェ曲線LsRsを生成する。
【0061】
図7は、2つのチャンネルにおける音声の相関検出から描画データ出力までの結果を合成した図である。図7においては、図6に示したようにL−R,C−L,C−R,L−Ls,R−Rs,Ls−Rsのそれぞれ2つのチャンネルについて描画したベジェ曲線を全て合成して示してある。
【0062】
図7において、曲線αは、C−L,C−R,L−Ls,R−Rs,Ls−Rsのそれぞれ2つのチャンネルについて描画したベジェ曲線を全て合成して示してある。また、曲線βは、曲線αにおけるC−LおよびC−Rの代わりに、L−Rを用いて描画したベジェ曲線を全て合成したものである。例えば音楽を再生する際など、Cを含めて音像を表示する場合、C−LおよびC−Rを主として監視を行うため、曲線αのようなベジェ曲線を表示するのが好適である。一方、例えばドラマにて再生される音声などのように、Cには主としてセリフのみが含まれているような場合、Cを考慮せずに、L−Rを主として監視できるようにするため、曲線βのようなベジェ曲線を表示するのが好適である。
【0063】
図7に示すように、曲線αと曲線βとを同時に表示すると紛らわしくなることが懸念されるため、制御部10は、曲線αまたは曲線βのいずれかを選択的に表示可能とする描画データを出力するのが好適である。また、制御部10は、曲線αおよび曲線βを同時に表示する場合には、互いに曲線の太さ、色、線種、表示態様などを変化させることにより、互いに識別可能にして描画データを出力するのが好適である。
【0064】
このように、本実施形態において、制御部10は、複数のチャンネルのうち2つのチャンネルの音声データに基づいて、当該2つのチャンネル間における音声の逆相成分の比率を算出する。そして、制御部10は、当該逆相成分の比率に応じて曲率を変化させた曲線を描画する描画データを出力する。また、上述したように、制御部10は、前記2つのチャンネルの音声データに基づいて、当該2つのチャンネルそれぞれにおける音声のレベルを検出する。そして、制御部10は、当該音声のレベルおよび前記逆相成分の比率に応じて曲率を変化させた前記曲線を描画する描画データを出力するのが好適である。この場合、制御部10は、当該2つのチャンネルそれぞれにおける音声レベルを表す線分の長さに対応する2つの座標を両端の点とし、前記逆相成分の比率に対応する座標を制御点とする2次ベジェ曲線を描画する描画データを出力する。
【0065】
次に、本実施形態に係る音像表示装置1が生成する曲線の着色について説明する。
【0066】
図8は、本実施形態に係る音像表示装置1が行う色データ変換処理を説明する図である。本実施形態においては、図6に示したような各部のベジェ曲線には、それぞれの相関係数に応じた色データを付した状態で、制御部10から出力するのが好適である。以下、このように、ベジェ曲線に色データを付加する処理を説明する。
【0067】
図5において説明したように、制御部10は、ステップ21において2つのチャンネルにおける音声の相関係数を算出した。本実施形態において、制御部10は、このように算出された相関係数に基づいて色データを生成して(ステップS25)、ステップS23において生成された曲線を、ステップS24において着色した描画データを生成して出力する。
【0068】
図5のステップ21において説明したように、制御部10は、−1〜+1の範囲の相関係数を算出する。そこで、制御部10は、当該相関係数に基づいて、図8(A)に示すような色のデータを生成する(ステップS25)。このようにステップS25において相関係数に基づいて色データが生成されると、ステップS23で生成された曲線は、当該色データに基づく着色が施されることになる。
【0069】
図8(A)に示す範囲<A>のように、相関係数が−1付近となるとき、チャンネル間は完全な逆相に近くなる。この場合、制御部10は、警告を示唆するような例えば赤色の色データを生成する。実際の音声の再生においては、チャンネル間が完全な逆相になることは想定し難いため、相関係数が−1に極近くなる範囲で曲線を赤色にするのが好適である。
【0070】
また、図8(A)に示す範囲<D>のように、相関係数が+1付近となるとき、チャンネル間は完全な同相に近くなる。この場合、音の広がりがない状態を意味することになるが、音声表現によっては意図的にこのような音声の再生状態が望まれることもある。このため、相関係数が+1付近である範囲<D>においては、制御部10は、注意を促すために例えば青色の色データを生成する。また、この場合、範囲<D>は、上述した範囲<A>よりは若干広い範囲とするのが好適である。
【0071】
また、図8(A)に示す範囲<C>のように、相関係数が0付近から+1付近までとなるとき、チャンネル間の逆相成分の比率は適度になる。したがって、この場合、制御部10は、他の表示と特に区別のない標準的な色の色データを生成する。ここで、標準的な色とは、例えば黒色の画面においては白色とするなど、他の表示に比べて特に強調されることのないような色とするのが好適である。
【0072】
また、図8(A)に示す範囲<B>のように、相関係数が−1付近から0付近までとなるとき、チャンネル間の逆相成分の比率は比較的高めになる。したがって、この場合、制御部10は、注意喚起のために、他の表示とは区別可能な色の色データを生成する。
【0073】
範囲<B>においては、チャンネル間の逆相成分の比率および当該比率の変化を容易に視覚的に認識できるようにするため、制御部10は、0付近から−1付近までの相関係数の値に応じて異なる色の色データを生成する。すなわち、本実施形態において、制御部10は、相関係数が0付近から−1付近まで変化するにつれて青および赤の成分を減少させて、黄色がかった色から徐々に緑色に変化するような色データを出力する。したがって、本実施形態に係る音像表示装置1によれば、チャンネル間の逆相成分の比率および当該比率の変化を容易に視覚的に認識することを可能にする。図8(A)においては、相関係数が0付近から−1付近まで変化するにつれて出力される色データが徐々に黄色がかった色から徐々に緑色になる様子を概略的に表している。
【0074】
また、このように相関係数が変化するにつれて出力される色データを徐々に変化させる際、当該色の変化をリニアな変化としてしまうと人間の感覚にそぐわないものとなる。したがって、本実施形態では、制御部10は、後述のように、ガンマカーブを変えることにより当該色の変化を調整する。
【0075】
以上のように相関係数から生成すべき色データを算出するには、以下のように規定したLUTを用いることができる。以下、相関係数から生成すべき色データを算出するためのLUTについて説明する。まず、以下のように規定する。
(1)相関係数=−1.0のとき、R(赤)100%、G(緑)0%、B(青)0%で固定する。
(2)相関係数=−0.9〜0のとき、G(緑)100%で固定する。
(3)相関係数=0〜1.0のとき、B(青)100%で固定する。
【0076】
次に、以下のような各値を用意する。すなわち、
(1)閾値Gpは、相関係数=0〜1.0(0.1ステップ)のどこから緑色を減色させるかを設定する(本例では設定値=0.9とする)。
(2)閾値Rpは、相関係数=0〜1.0(0.1ステップ)のどこから赤色を減色させるかを設定する(本例では設定値=0.9とする)。
(3)設定値Gγpは、上記緑色のガンマカーブ(0.05ステップ)を設定する(本例では設定値=3.00とする)。
(4)設定値Rγpは、上記赤色のガンマカーブ(0.05ステップ)を設定する(本例では設定値=3.00とする)。
(5)閾値Bnは、相関係数=0〜−0.9(0.1ステップ)のどこから青色を減色させるかを設定する(本例では設定値=0.0とする)。
(6)閾値Rnは、相関係数=0〜−0.9(0.1ステップ)のどこから赤色を減色させるかを設定する。(本例では設定値=0.0とする)。
(7)設定値Bγnは、上記青色のガンマカーブ(0.05ステップ)を設定する(本例では設定値=0.10とする)。
(8)設定値Rγnは、上記赤色のガンマカーブ(0.05ステップ)を設定する(本例では設定値=1.00とする)。
【0077】
次に、上述のような規定に基づいて緑色(G)を算出する方法の例を説明する。
(1)相関係数=−1.0〜−0.9のとき、
G=255×((1+相関係数)/(1−0.9))とする。
(2)相関係数=−0.9〜閾値Gp(本例では0.9)のとき、
G=255とする。
(3)相関係数=閾値Gp(本例では0.9)〜1.0、かつ、閾値Gp(本例では0.9)<1.0のとき、
G=255×(設定値Gγp(本例では3.00)を指数として(1−相関係数)/(1−閾値Gp(本例では0.9))を基数とした累乗)とする。
【0078】
次に、上述のような規定に基づいて青色(B)を算出する方法の例を説明する。
(1)相関係数=−1.0のとき、
B=0とする。
(2)相関係数=−0.9〜閾値Bn(本例では0.0)、かつ、閾値Bn(本例では0.0)>−0.9のとき、
B=255×(設定値Bγn(本例では0.10)を指数として(1+相関係数)/(1+閾値Bn(本例では0.0))を基数とした累乗)とする。
(3)相関係数=閾値Bn(本例では0.0)〜1.0のとき、
B=255とする。
【0079】
次に、上述のような規定に基づいて赤色(R)を算出する方法の例を説明する。
(1)相関係数=−1.0〜−0.9のとき、
R=255−255×((1+相関係数)/(1−0.9))とする。
(2)相関係数=−0.9〜閾値Rn(本例では0.0)、かつ、閾値Rn(本例では0.0)>−0.9のとき、
R=255×(設定値Rγn(本例で1.00)を指数として(1+相関係数)/(1+閾値Rn(本例では0.0))を基数とした累乗)とする。
(3)相関係数=閾値Rn(本例では0.0)〜閾値Rp(本例では0.9)のとき、
R=255とする。
(4)相関係数=閾値Rn(本例では0.0)〜1.0、かつ、閾値Rn(本例では0.0)<1.0のとき、
R=255×(設定値Rγp(本例では3.00)を指数として(1−相関係数)/(1−閾値Rp(本例では0.9))を基数とした累乗)とする。
【0080】
以上説明したようなLUTに従うことにより、制御部10は、図5のステップS25において、例えばRGB24bitの色データを生成して出力することができる。
【0081】
図8(B)は、上述のようなLUTに従って、相関係数と当該相関係数に基づいて出力される色データの緑色(G)成分との対応を示した図である。また、図8(C)は、上述のようなLUTに従って、相関係数と当該相関係数に基づいて出力される色データの青色(B)成分との対応を示した図である。また、図8(D)は、上述のようなLUTに従って、相関係数と当該相関係数に基づいて出力される色データの赤色(R)成分との対応を示した図である。
【0082】
図9は、2つのチャンネルにおける音声の相関検出および色データ生成に基づく描画の結果を例示する図である。
【0083】
図5において説明したように、制御部10は、ステップS23において2つのチャンネルについてベジェ曲線を生成した(図6参照)。また、図5において説明したように、制御部10は、ステップS25において当該2つのチャンネルについてベジェ曲線の色データを生成した(図8参照)。このように、図5におけるステップS23およびステップS25に示した処理の結果、制御部10は、図9に示すような曲率および色のベジェ曲線の描画データを生成して(ステップS24)出力する。
【0084】
図9は、図6(C)に示したようにC−Rの2つのチャンネルについて生成したベジェ曲線CRの曲率および色を変更した例をいくつか示したものである。
【0085】
図9(A)は、図8(A)に示した相関係数が範囲<A>のときに生成されるベジェ曲線CRの曲率および色を示している。図9(A)に示すように、相関係数が範囲<A>のときには、通常の場合とは異なる色のベジェ曲線が生成されることになり、ユーザに警告を示唆することができる。
【0086】
図9(B)は、図8(A)に示した相関係数が範囲<B>のときに生成されるベジェ曲線CRの曲率および色を示している。図9(B)に示すように、相関係数が範囲<B>のときには、2つのチャンネルの逆相成分の比率に対応する音の広がりのイメージに合わせて曲率が変化したベジェ曲線が生成される。また、相関係数が範囲<B>のときには、相関係数に応じて徐々に変化する色のベジェ曲線が生成されることになり、ユーザに注意を促すことができる。
【0087】
図9(C)は、図8(A)に示した相関係数が範囲<C>のときに生成されるベジェ曲線CRの曲率および色を示している。図9(C)に示すように、相関係数が範囲<C>のときにも、2つのチャンネルの逆相成分の比率に対応する音の広がりのイメージに合わせて曲率が変化したベジェ曲線が生成される。また、相関係数が範囲<C>のときには、逆相成分の比率は適度であるため、他の表示と比べて格別目立つことのない色のベジェ曲線が生成されることになり、あえてユーザに注意を促さないようにできる。
【0088】
図9(D)は、図8(A)に示した相関係数が範囲<D>のときに生成されるベジェ曲線CRの曲率および色を示している。図9(D)に示すように、相関係数が範囲<D>のときには2つのチャンネルがほぼ完全に同相に近くなるため、この場合も通常の場合とは異なる曲率(直線に近い)および色のベジェ曲線が生成されることになり、ユーザに注意を促すことができる。
【0089】
このように、本実施形態において、制御部10は、複数のチャンネルのうち2つのチャンネルの音声データに基づいて、当該2つのチャンネル間における音声の逆相成分の比率を算出する。そして、制御部10は、当該逆相成分の比率に応じた色の曲線を描画する描画データを出力する。
【0090】
また、制御部10は、2つのチャンネル間における音声の逆相成分の比率が第1の閾値以上である時は、警告を示唆する例えば赤などの所定の色の前記曲線を描画する描画データを出力する。また、制御部10は、2つのチャンネル間における音声の逆相成分の比率が第2の閾値以下である時は、例えば青などの所定の色の前記曲線を描画する描画データを出力する。また、制御部10は、2つのチャンネル間における音声の逆相成分の比率が、完全に同相と完全に逆相との間における第1の範囲内にある時は、例えば白などの所定の色の前記曲線を描画する描画データを出力する。また、制御部10は、2つのチャンネル間における音声の逆相成分の比率が、完全に同相と完全に逆相との間における第2の範囲内にある時は、逆相成分の比率に応じて例えば黄色から緑色など所定の色の間で徐々に変化する色の前記曲線を描画する描画データを出力する。
【0091】
図9においては、C−Rの2つのチャンネルについてのみ、曲率および色を設定したベジェ曲線CRを生成したが、本実施形態においては、制御部10は、同様の処理を、他の2つのチャンネルL−R,C−L,L−Ls,R−Rs,Ls−Rsについても行う。このようにして、上述した2つのチャンネルそれぞれについて曲率および色が設定されたベジェ曲線が生成されると、図10に示すような描画を行う描画データが出力される。
【0092】
図10は、2つのチャンネルにおける音声の相関検出および色データ生成に基づく描画の結果を合成した図である。すなわち、図10は、本実施形態に係る音像表示装置1による処理を行うことにより、図4図6図9に示した結果を全て合成した状態を示す図である。本実施形態に係る音像表示装置1は、上述した処理の一部のみの結果を表示部30に表示してもよいが、音像など音響に係る種々の情報を一度に把握できるよう、図10に示すように、上述した処理の全ての結果を同時に表示するのが好適である。
【0093】
図10において、Oはリスニングポジションを表す。また、Cはセンタースピーカの位置を表し、Lは左フロントスピーカの位置を表し、Rは右フロントスピーカの位置を表し、Lsは左サラウンドスピーカの位置を表し、Rsは右サラウンドスピーカの位置を表す。これらの位置は、予め理想的な位置を規定して、固定された表示とするのが好適である。
【0094】
以下、図10において、各符号が表す意味を記す。
Lv(C):センタースピーカCから再生される音声のレベル
Lv(L):左フロントスピーカLから再生される音声のレベル
Lv(R):右フロントスピーカRから再生される音声のレベル
Lv(Ls):左サラウンドスピーカLsから再生される音声のレベル
Lv(Rs):右サラウンドスピーカRsから再生される音声のレベル
Lv(LFE):サブウーファから再生される音声のレベル
B(LR):左フロントスピーカLから再生される音声および右フロントスピーカRから再生される音声に基づくベジェ曲線(センタースピーカCから再生される音声は無視)
B(LC):左フロントスピーカLから再生される音声およびセンタースピーカCから再生される音声に基づくベジェ曲線
B(CR):センタースピーカCから再生される音声および右フロントスピーカRから再生される音声に基づくベジェ曲線
B(LLs):左フロントスピーカLから再生される音声および左サラウンドスピーカLsから再生される音声に基づくベジェ曲線
B(RRs):右フロントスピーカRから再生される音声および右サラウンドスピーカRsから再生される音声に基づくベジェ曲線
B(LsRs):左サラウンドスピーカLsから再生される音声および右サラウンドスピーカRsから再生される音声に基づくベジェ曲線
【0095】
図10に示すLFEは、図3(F)で説明したように無指向性であるため、点0を中心としてレベルに応じて半径を増大させた円形として、例えば半透明にして表示する。この場合、通常の番組における音声としては大き過ぎると思われるレベルから徐々にLFEの表示を色変化させることにより、観測者に注意喚起することができる。また、このようにLFEのレベルが変化するにつれて出力される色データを徐々に変化させる際、当該色の変化をリニアな変化としてしまうと人間の感覚にそぐわないものとなる。したがって、本実施形態では、制御部10は、上述したように、ガンマカーブを変えることにより当該色の変化を調整するのが好適である。
【0096】
このようにして、本実施形態において、LFE信号についても同時に監視できるようにしてもよい。LFEを大音量で再生するとウーファーが歪んで不具合の原因になり得るため、通常LFE信号は小さいレベルで運用されることが多い。したがって、LFEのレベルが大きくなり過ぎる場合は、赤系の色に変化させて注意喚起を促すのが好適である。
【0097】
本発明によれば、複数のスピーカの配置を模した二次元空間上に、ベジェ曲線を用いて音像を表現することができる。本発明においては、このベジェ曲線による図形の大きさが音声全体の大きさを表し、ベジェ曲線による図形の形状が音像の定位感を表す。
【0098】
以上説明したように、本発明によれば、音声をサラウンド再生する際の多種多様な情報を収集する際に、複雑な構成の機器類は必要なくなる。また、このような情報は、本発明によれば、音声の再生に伴って、リアルタイムで動的に監視することができる。さらに、本発明によれば、このような多種多様な情報を集約するのみならず、視覚に訴える表現により一画面で直感的に把握することができ、極めて利便性が高い。
【0099】
以下、本発明による効果について、さらに述べる。
【0100】
本発明によれば、リスニングポジションから各スピーカ配置に向かって各チャンネルのオーディオレベルバーが配置されるため、このレベルバーの振れによって各チャンネルのレベル管理を行うことが可能になる。また、本発明によれば、例えば隣接するような2つのチャンネル間における音声の逆相成分の比率を、ベジェ曲線の曲率および色変化で表現し、各チャンネルのレベル、音像の確認と同時に、位相監視も行うことが可能になる。音響効果として音声にある程度の広がり感を持たせるには逆相成分が必要である。本発明によれば、適正なバランスのサラウンド信号が入力されれば、ベジェ曲線は全体としてほぼ正円のように表示されるため、サラウンド信号全体の適正なバランスをひと目で感覚的に把握することができる。
【0101】
また、本発明によれば、逆相の成分が多くなるにつれて、ベジェ曲線の曲率が高くなるとともに色が変化する。この場合、逆相成分が適正レベルでなくなるまで徐々に色が変化するだけであるが、逆相成分が異常なレベルになると赤い色に変わるため、警告の通知であることを容易に認識することができる。さらに、システムチェックでOSCなどの基準信号によりレベル合わせをする際は、逆相成分がゼロになるはずなので、ベジェ曲線は直線で青色になる。したがって、正しくシステムが構築できたかどうかの判断を容易に下すことができる。
【0102】
本発明を諸図面および実施例に基づき説明してきたが、当業者であれば本開示に基づき種々の変形や修正を行うことが容易であることに注意されたい。したがって、これらの変形および修正は本発明の範囲に含まれることに留意されたい。例えば、各機能部、各手段、各ステップなどに含まれる機能などは論理的に矛盾しないように再配置可能であり、複数の機能部やステップなどを1つに組み合わせたり、あるいは分割したりすることが可能である。また、上述した本発明の実施形態は、それぞれ説明した実施形態に忠実に実施することに限定されるものではなく、適宜、各特徴を組み合わせて実施することもできる。
【0103】
上述した実施形態は、音像表示装置1および音像表示システムの発明として説明した。この場合、本発明による音像表示システムは、上述したような種々の制御を行う制御部10と、制御部10により出力された描画データに基づく曲線を表示する表示部20と、を備えることを特徴とする。
【0104】
また、本発明は、音像表示装置1または音像表示システムにおける音像表示方法とすることもできる。この場合、本発明による音像表示方法は、複数のチャンネルのうち2つのチャンネルの音声データに基づいて、当該2つのチャンネル間における音声の逆相成分の比率を算出するステップと、前記逆相成分の比率に応じて曲率を変化させた曲線であって当該逆相成分の比率に応じて変化させた色の曲線を描画する描画データを出力するステップと、を含むことを特徴とする。
【符号の説明】
【0105】
1 音像表示装置
10 制御部
20 記憶部
30 表示部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10