IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヘアレザンズ アーベーの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-12-15
(54)【発明の名称】音量依存型オーディオ補償
(51)【国際特許分類】
   H04R 3/00 20060101AFI20221208BHJP
   H04S 1/00 20060101ALI20221208BHJP
【FI】
H04R3/00 310
H04S1/00
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2022506113
(86)(22)【出願日】2020-11-12
(85)【翻訳文提出日】2022-03-29
(86)【国際出願番号】 SE2020051086
(87)【国際公開番号】W WO2021096413
(87)【国際公開日】2021-05-20
(31)【優先権主張番号】1951317-5
(32)【優先日】2019-11-15
(33)【優先権主張国・地域又は機関】SE
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.BLUETOOTH
(71)【出願人】
【識別番号】521501130
【氏名又は名称】ヘアレザンズ アーベー
(74)【代理人】
【識別番号】100120891
【弁理士】
【氏名又は名称】林 一好
(74)【代理人】
【識別番号】100165157
【弁理士】
【氏名又は名称】芝 哲央
(74)【代理人】
【識別番号】100205659
【弁理士】
【氏名又は名称】齋藤 拓也
(74)【代理人】
【識別番号】100126000
【弁理士】
【氏名又は名称】岩池 満
(74)【代理人】
【識別番号】100185269
【弁理士】
【氏名又は名称】小菅 一弘
(72)【発明者】
【氏名】フィリップソン ジョン
(72)【発明者】
【氏名】マーティンソン ロジャー
【テーマコード(参考)】
5D162
5D220
【Fターム(参考)】
5D162CA05
5D162CA11
5D162DA22
5D162EA01
5D220AB01
5D220AB08
(57)【要約】
本発明は、少なくとも1つのオーディオスピーカを含むオーディオスピーカアレンジメントにおいてオーディオストリームをリアルタイム処理するための方法100である。方法は、オーディオストリームおよびオーディオストリームに関連する再生音量を受信する110ことと、再生音量および事前に保存された音響伝達データに基づいて、オーディオスピーカの再生音圧レベルを決定する120ことと、を含む。事前に保存された音響伝達データは、再生音量をオーディオスピーカの再生音圧レベルに関連付ける。方法は、決定された再生音圧レベルに関連付けられた振幅補償データに基づいて補償フィルタを生成する130ことと、補償フィルタを使用してオーディオストリームをフィルタリングし140、オーディオストリームに、補償されたオーディオストリームを生成する利得係数を適用することと、をさらに含む。利得係数は、補償フィルタに関わらず、オーディオストリームのトータルオーディオパワーが維持されるように構成される。補償されたオーディオストリームは、オーディオスピーカ21に提供される150。
【選択図】図12
【特許請求の範囲】
【請求項1】
少なくとも1つのオーディオスピーカ(21)を含むオーディオスピーカアレンジメント(20)におけるオーディオストリーム(33)のリアルタイム処理のための方法(100)であって、
オーディオストリーム(33)およびオーディオストリーム(33)に関連する再生音量(15)を受信する(110)ステップと、
再生音量(15)および事前に保存された音響伝達データ(50)に基づいて、オーディオスピーカ(21)の再生音圧レベル(52)を決定する(120)ステップであって、事前に保存された音響伝達データ(50)は、再生音量(15)をオーディオスピーカ(21)の再生音圧レベル(52)に関連付ける、ステップと、
決定された再生音圧レベル(52)に関連付けられた振幅補償データ(330)に基づいて、補償フィルタ(320)を生成する(130)ステップと、
補償フィルタ(320)を使用してオーディオストリーム(33)をフィルタリングする(140)、そしてオーディオストリーム(33)に、補償されたオーディオストリーム(27)を生成する利得係数を適用する、ステップであって、利得係数は、補償フィルタ(320、320’)にかかわらず、オーディオストリーム(33)のトータルオーディオパワーが保持されるように構成される、ステップと、
補償されたオーディオストリーム(27)をオーディオスピーカ(21)に提供する(150)ステップと、
を含む、方法(100)。
【請求項2】
振幅補償データ(330)は、等ラウドネス曲線(300)に基づいている、請求項1に記載の方法(100)。
【請求項3】
振幅補償データ(330)は、いくつかの異なる周波数およびいくつかの異なる再生音量(15)に対する振幅補償値(335)を含む、請求項1または2に記載の方法(100)。
【請求項4】
再生音量(15)とは異なる、更新された再生音量(15’)を受信する(110)ステップと、
更新された再生音量(15’)および事前に保存された音響伝達データ(50)に基づいて、オーディオスピーカ(21)の更新された再生音圧レベル(52’)を決定する(120’)ステップと、
決定された更新された再生音圧レベル(52’)に関連する振幅補償データ(330)に基づいて、更新された補償フィルタ(320)を生成する(130’)ステップと、
更新された補償フィルタ(320)を使用して補償されたオーディオストリーム(27)を生成するために、オーディオストリーム(33)をフィルタリングする(140)ステップと、
更新された再生音量(15’)に同期して、更新された補償フィルタ(320)を使用して補償されたオーディオストリーム(27)をオーディオスピーカ(21)に提供する(150)ステップと、
をさらに含む、請求項1~3のいずれか1項に記載の方法(100)。
【請求項5】
オーディオストリーム(33)は、オーディオフレーム(23)においてフィルタリングされる、請求項1~4のいずれか1項に記載の方法(100)。
【請求項6】
更新された再生音圧レベル(52)を決定する(120’)ステップと、更新された補償フィルタ(320)を生成する(130’)ステップとは、2つの連続するオーディオフレーム(23)のフィルタリングの間の中間時間(Ti)中に実行される、請求項4に従属するときの請求項5に記載の方法(100)。
【請求項7】
補償フィルタ(320)を生成する(130、130’)ステップは、オーディオスピーカアレンジメント(20)のユーザ(40)に関連付けられた聴覚プロファイル(340)に追加的に基づいている、請求項1~6のいずれか1項に記載の方法(100)。
【請求項8】
オーディオストリーム(33)は、チャネル化されたオーディオフォーマットに形成される、請求項1~7のいずれか1項に記載の方法(100)。
【請求項9】
チャネル化されたオーディオフォーマットは、左チャネルオーディオストリーム(33L)と、右チャネルオーディオストリーム(33R)とを含み、補償フィルタ(320)を生成する(130、130’)ステップは、左チャネルオーディオストリーム(33L)のための左補償フィルタ(320)および右チャネルオーディオストリーム(33R)のための右補償フィルタ(320)を生成する(130、130’)ステップをさらに含む、請求項8に記載の方法(100)。
【請求項10】
補償フィルタ(320)は、FIRフィルタのような線形位相応答を有するデジタルフィルタである、請求項1~9のいずれか1項に記載の方法(100)。
【請求項11】
少なくとも1つのオーディオスピーカ(21)と、少なくとも1つのメモリ(700)と、少なくとも1つの外部インターフェース(30)と、前記少なくとも1つのオーディオスピーカ(21)、前記少なくとも1つのメモリ(700)、および前記少なくとも1つの外部インターフェース(30)に動作可能に接続された少なくとも1つのコントローラ(200)とを備えるオーディオスピーカアレンジメント(20)であって、
前記少なくとも1つのコントローラ(200)は、リアルタイムで、
外部インターフェース(30)を介して、オーディオストリーム(33)およびオーディオストリーム(33)に関連する再生音量(15)を受信し(110)、
再生音量(15)および事前に保存された音響伝達データ(50)に基づいて、オーディオスピーカ(21)の再生音圧レベル(52)を決定し(120)、事前に保存された音響伝達データ(50)は、再生音量(15)をオーディオスピーカ(21)の再生音圧レベル(52)に関連付け、
決定された再生音圧レベル(52)に関連付けられた振幅補償データ(330)に基づいて補償フィルタ(320)を生成し(130)、
補償フィルタ(320)を使用してオーディオストリーム(33)をフィルタリングし(140)、そしてオーディオストリーム(33)に、補償されたオーディオストリーム(27)を生成する利得係数を適用し、利得係数は、補償フィルタ(320、320’)にかかわらず、オーディオストリーム(33)のトータルオーディオパワーが保存されるように構成され、
補償されたオーディオストリーム(27)をオーディオスピーカ(21)に提供する(150)、
ように構成されている、オーディオスピーカアレンジメント(20)
【請求項12】
外部インターフェース(30)は、無線インターフェースである、請求項11に記載のオーディオスピーカアレンジメント(20)。
【請求項13】
コントローラ(200)は、請求項2~10のいずれか1項に記載のオーディオストリーム(33)のリアルタイム処理のための方法(100)を実行するようにさらに構成されている、請求項11または12に記載のオーディオスピーカアレンジメント(20)。
【請求項14】
コンピュータプログラム製品(600)であって、コントローラ(200)によって実行されたときに、コントローラ(200)に、
オーディオストリーム(33)およびオーディオストリーム(33)に関連する再生音量(15)を受信し(110)、
再生音量(15)および事前に保存された音響伝達データ(50)に基づいて、オーディオスピーカ(21)の再生音圧レベル(52)を決定し(120)、事前に保存された音響伝達データ(50)は、再生音量(15)をオーディオスピーカ(21)の再生音圧レベル(52)に関連付け、
決定された再生音圧レベル(52)に関連付けられた振幅補償データ(330)に基づいて補償フィルタ(320)を生成し(130)、
補償フィルタ(320)を使用してオーディオストリーム(33)をフィルタリングし(140)、そしてオーディオストリーム(33)に、補償されたオーディオストリーム(27)を生成する利得係数を適用し、利得係数は、補償フィルタ(320、320’)にかかわらず、オーディオストリーム(33)のトータルオーディオパワーが保存されるように構成され、
補償されたオーディオストリーム(27)をオーディオスピーカ(21)に提供する(150)、
ように構成されている、コンピュータプログラム製品(600)。
【請求項15】
コントローラ(200)に、請求項2~10のいずれか1項に記載のオーディオストリーム(33)のリアルタイム処理のための方法(100)を実行させるようにさらに構成されている、請求項14に記載のコンピュータプログラム製品(600)。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、オーディオの補償に関するものであり、より正確には、オーディオスピーカアレンジメントにおいてオーディオストリームを補償するための方法および装置に関する。
【背景技術】
【0002】
1970年代後半にウォークマン(登録商標)などのポータブル電子機器が登場して以来、ポータブルオーディオの利用可能性と品質はますます高まっている。スマートフォンでは、そのような機器のすべてのユーザが、音楽やその他のオーディオコンテンツのほぼ無限の供給にアクセスできる。オーディオコンテンツは、通常、ヘッドフォンやその他のポータブルスピーカを介して体験される。
【0003】
オーディオコンテンツは、特定の方法で聞こえるように意図されている。例えば、コンテンツの作成者とプロデューサは、コンテンツがリスナーにどのように知覚されるべきかについて、ある考えを持っている。スピーカやヘッドフォンについても同じことが言える。これらの製品の設計者は、その製品がオーディオコンテンツをどのように変化させて、例えばブランド特有の音や感覚を作り出すべきかというビジョンを持っている。
【0004】
この問題を解決する1つの方法として、リスナーに聴力検査を実施してもらい、その結果に合わせてオーディオを調整することで、リスニング体験をパーソナライズすることが考えられる。特許文献1では、リスナーの聴覚プロファイルに応じてオーディオ信号をフィルタリングするというコンセプトが示されている。
【0005】
先行技術は、聴覚の閾値、すなわちリスナーに聞こえる最低の音圧に焦点を当てている。しかし、再生されるオーディオは、聴覚の閾値に相当する音量で再生されることはほとんどない。以上のことから、改善の余地があることは明らかである。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】米国特許出願公開第2006215844号
【発明の概要】
【発明が解決しようとする課題】
【0007】
本発明の目的は、先行技術よりも改善され、上述の欠点を解消または少なくとも緩和する新しいタイプのオーディオ補償を提供することである。より具体的には、本発明の目的は、オーディオ信号の事前知識なしに決定され、ストリーミングオーディオに適用可能なオーディオ補償を提供することである。これらの目的は、それに関連する従属請求項に定義された好ましい実施形態を伴う添付の独立請求項に記載された技術によって達成される。
【課題を解決するための手段】
【0008】
本発明の第1の態様によれば、オーディオスピーカアレンジメントにおけるオーディオストリームのリアルタイム処理のための方法が提示される。オーディオスピーカアレンジメント(audio speaker arrangement)は、少なくとも1つのオーディオスピーカを備える。本方法は、オーディオストリームと、そのオーディオストリームに関連する再生音量とを受信することを含む。このことから、オーディオスピーカの再生音圧レベルは、再生音量および事前に保存された音響伝達データに基づいて決定される。事前に保存された音響伝達データ(pre-stored acoustic transfer data)は、再生音量をオーディオスピーカの再生音圧レベルに関連付けている。本方法はさらに、決定された再生音圧レベルに関連付けられた振幅補償データに基づいて補償フィルタを生成し、補償フィルタを使用してオーディオストリームをフィルタリングし、補償されたオーディオストリームを生成するオーディオストリームに利得係数を適用する。利得係数(gain factor)は、補償フィルタに関わらず、オーディオストリームのトータルオーディオパワーが維持されるように構成される。補償されたオーディオストリームは、オーディオスピーカに提供される。
【0009】
本方法の一実施形態では、振幅補償データは、等ラウドネス曲線(equal loudness contour)に基づいている。振幅補償データを等ラウドネスに基づいて行うことで、再生音圧レベルに関係なく、オーディオストリームは同じように知覚される。
【0010】
別の実施形態では、振幅補償データは、いくつかの異なる周波数といくつかの再生音量に対する振幅補償値からなる。周波数依存性を加えることで、再生音圧レベルに関わらず、オーディオストリームは同じように知覚される。
【0011】
追加の実施形態では、本方法は、再生音量とは異なる、更新された再生音量を受信するステップと、更新された再生音量および事前に保存された音響伝達データに基づいて、オーディオスピーカの更新された再生音圧レベルを決定するステップと、をさらに含む。決定された更新された再生音圧レベルに関連する振幅補償データに基づいて、更新された補償フィルタが生成される。オーディオストリームをフィルタリングして、更新された補償フィルタを用いて補償されたオーディオストリームを生成する。補償されたオーディオストリームは、更新された補償フィルタを用いて、更新された再生音量に同期してオーディオスピーカに提供される。再生音量の変更に同期してオーディオストリームを提供できるようにすることで、再生音量が変更されても、音量補償されたオーディオストリームを途切れることなくユーザに提供することができるようになる。
【0012】
一実施形態では、フィルタリングするステップは、オーディオストリームに、補償されたオーディオストリームを生成する利得係数を適用することをさらに含む。利得係数は、更新された補償フィルタに関わらず、オーディオストリームのトータルオーディオパワーが維持されるように構成される。これは、補償フィルタの適用がオーディオストリームに減少または増加の影響を与える可能性があるため、有用である。
【0013】
さらに別の実施形態では、オーディオストリームはオーディオフレームでフィルタリングされる。オーディオストリームをフレームで持つことにより、オーディオストリームをチャンク(chunk)で処理、取り扱い、転送することが可能になる。
【0014】
さらなる実施形態では、更新された再生音圧レベルを決定するステップと、更新された補償フィルタを生成するステップとが、2つの連続するオーディオフレームのフィルタリングの間の中間時間中に実行される。これにより、オーディオストリームの補償を損なうことなく、再生音圧レベルの変化を実質的に瞬時に行うことができる。
【0015】
一実施形態では、補償フィルタを生成するステップは、オーディオスピーカアレンジメントのユーザに関連する聴覚プロファイル(hearing profile)にさらに基づいている。オーディオストリームを聴覚プロファイルにも基づいて処理することで、ユーザのリスニング体験をさらに向上させることができる。
【0016】
別の実施形態では、オーディオストリームは、チャネル化されたオーディオフォーマットで形成される。これは、複数のチャネルからなるオーディオストリームを楽しむ場合に有用であり、例えば、ステレオオーディオストリームまたは他のマルチチャネルオーディオストリームがある。
【0017】
一実施形態では、チャネル化されたオーディオフォーマットは、左チャネルオーディオストリームと右チャネルオーディオストリームからなる。この実施形態では、補償フィルタを生成するステップは、左チャネルオーディオストリームに対して左補償フィルタを生成し、右チャネルオーディオストリームに対して右補償フィルタを生成することをさらに含む。これは、ステレオオーディオストリームを楽しむ場合や、ユーザの聴覚プロファイルが右耳に比べて左耳で異なる場合に有益である。
【0018】
一実施形態では、補償フィルタは、FIRフィルタのような線形位相応答(linear phase response)を有するデジタルフィルタである。FIRフィルタは、正確に線形の位相を持つことができ、常に安定しており、ハードウェアで効率的に実現され、フィルタの起動過渡が有限の持続時間を持つので有益である。
【0019】
本発明の第2の態様では、少なくとも1つのオーディオスピーカと、少なくとも1つのメモリと、少なくとも1つの外部インターフェースと、前記少なくとも1つのオーディオスピーカ、前記少なくとも1つのメモリ、および前記少なくとも1つの外部インターフェースに動作可能に接続された少なくとも1つのコントローラとを備えるオーディオスピーカアレンジメントが導入される。前記少なくとも1つのコントローラは、外部インターフェースを介して、オーディオストリームおよびオーディオストリームに関連する再生音量をリアルタイムで受信し、再生音量および事前に保存された音響伝達データに基づいて、オーディオスピーカの再生音圧レベルを決定するように構成されている。事前に保存された音響伝達データは、再生音量をオーディオスピーカの再生音圧レベルに関連付けている。これは、決定された再生音圧レベルに関連付けられた振幅補償データに基づいて補償フィルタを生成し、補償フィルタを使用してオーディオストリームをフィルタリングし、オーディオストリームに、補償されたオーディオストリームを生成する利得係数を適用するために使用される。利得係数は、補償フィルタにかかわらず、オーディオストリームのトータルオーディオパワーが維持されるように構成されている。補償されたオーディオストリームは、オーディオスピーカに提供される。
【0020】
オーディオスピーカアレンジメントの一実施形態では、外部インターフェースは、無線インターフェースである。無線外部インターフェースを有することで、オーディオスピーカアレンジメントの使い勝手、快適性、柔軟性が向上する。
【0021】
オーディオスピーカアレンジメントの一実施形態では、上で開示したようなオーディオストリームを処理するための方法を実行するように構成されている。
【0022】
第3の態様によると、コンピュータプログラム製品が提示される。コンピュータプログラム製品は、コントローラによって実行されると、コントローラに、リアルタイムで、オーディオストリームと、オーディオストリームに関連付けられた再生音量とを受信させるように構成される。また、コンピュータプログラム製品は、再生音量および事前に保存された音響伝達データに基づいて、オーディオスピーカの再生音圧レベルを決定するように構成される。事前に保存された音響伝達データは、再生音量をオーディオスピーカの再生音圧レベルに関連付けている。これをもとに、再生音圧レベルに関連付けられた振幅補償データに基づいて補償フィルタを生成し、この補償フィルタを用いてオーディオストリームをフィルタリングし、利得係数を適用して補償されたオーディオストリームを生成する。利得係数は、オーディオストリームのトータルオーディオパワーが維持されるように構成される。補償されたオーディオストリームは、オーディオスピーカに提供される。
【0023】
一実施形態では、コンピュータプログラム製品は、コントローラに、上記で開示したオーディオストリームを処理する方法を実行させるようにさらに構成される。
【0024】
本発明の実施形態を以下に説明するが、本発明の概念をどのようにして実践に還元することができるかの非限定的な例を示す添付の図式的な図面を参照している。
【図面の簡単な説明】
【0025】
図1a図1aは、本発明の実施形態によるオーディオ再生システムの図である。
図1b図1bは、本発明の実施形態によるオーディオ再生システムの信号の流れを示すブロック図である。
図2図2は、本発明の実施形態による等ラウドネス曲線のグラフである。
図3図3は、本発明の実施形態による2つの等ラウドネス曲線間のデルタ(delta)のグラフである。
図4図4は、本発明の実施形態によるオーディオストリームの補償の原理を示すブロック図である。
図5a図5aは、本発明の実施形態によるオーディオストリームとそれに関連するタイミングの図である。
図5b図5bは、本発明の実施形態によるオーディオストリームとそれに関連するタイミングの図である。
図5c図5cは、本発明の実施形態によるオーディオストリームとそれに関連するタイミングの図である。
図6図6は、本発明の実施形態による事前に保存された音響伝達データを説明する概略的ブロック図である。
図7図7は、本発明の実施形態による使用中のオーディオスピーカアレンジメントの図である。
図8a図8aは、本発明の実施形態による補償フィルタの例示的なグラフである。
図8b図8bは、本発明の実施形態による補償フィルタの例示的なグラフである。
図9図9は、本発明の実施形態による補償フィルタの生成を示す概略図である。
図10図10は、本発明の実施形態によるオーディオスピーカアレンジメントの概略図である。
図11図11は、本発明の実施形態によるオーディオ処理の概略図である。
図12a図12aは、本発明の実施形態によるオーディオストリームを処理する方法の概略的ブロック図である。
図12b図12bは、本発明の実施形態によるオーディオストリームを処理する方法の概略的ブロック図である。
図13図13は、本発明の実施形態によるコンピュータプログラム製品の図である。
図14図14は、本発明の実施形態によるオーディオスピーカアレンジメントの図である。
図15a図15aは、本発明の実施形態による補償フィルタのグラフである。
図15b図15bは、本発明の実施形態による聴覚プロファイルのグラフである。
【発明を実施するための形態】
【0026】
以下、特定の実施形態について、添付の図面を参照してより詳細に説明する。しかし、本発明は、多くの異なる形態で具現化することができ、本明細書に記載された実施形態に限定されると解釈されるべきではなく、むしろ、これらの実施形態は、本開示が徹底して完全なものとなり、添付の特許請求の範囲で定義されるような本発明の範囲を当業者に十分に伝えるように、例示として提供されるものである。
【0027】
本明細書において、再生システム、再生装置、または再生音量という用語は、受信したオーディオデータを再生するという意味での再生を意味するものである。この用語は、保存されたオーディオまたはメディアの再生という限定的な形での再生を意味するのではなく、例えば、リアルタイムメディア、保存されたメディア、ストリームされたメディア、次第にダウンロードされたメディアなど、あらゆる形態のメディアを包含するものである。これに加えて、補償という用語は、最も広い形態の補償を意味し、本開示では、処理という用語と同義であると見なすことができる。このことは、動作を説明する場合だけでなく、この用語が補償フィルタなどの対象物を説明するために使用される場合にも適用される。
【0028】
図1aには、オーディオ再生システム1が示されている。システム1は、外部インターフェース30を介してオーディオをオーディオスピーカアレンジメント(audio speaker arrangement)20に転送するように構成可能な電子デバイス10を備える。オーディオスピーカアレンジメント20は、オーディオ再生システム1のユーザ40(図7に示す)にオーディオ出力を提供するように配置可能な少なくとも1つのオーディオスピーカ21を備える。典型的には、オーディオスピーカアレンジメント20は、オーディオ出力のステレオ再生を可能にするために、2つのオーディオスピーカ21を備える。
【0029】
オーディオスピーカアレンジメント20は、一実施形態では、一対のヘッドフォン20であり、さらなる実施形態では、一対のワイヤレスヘッドフォン20である。電子デバイス10は、例えば、携帯電話、携帯音楽プレーヤ、タブレット、ノートパソコンなどの携帯電子デバイス10であり得る。
【0030】
電子デバイス10は、外部インターフェース30およびオーディオスピーカアレンジメント20に適した形態であるスピーカアレンジメント20にオーディオを転送する。転送は、デジタルでもアナログでもよく、本開示の概念では、オーディオ情報がどのように表現されるかを意味するものとする。外部インターフェース30は、有線のまたは無線の外部インターフェース30であり得る。外部インターフェース30が有線のインターフェースである場合、電子デバイス10からのオーディオの転送は、スピーカアレンジメント20に応じて、アナログ形式またはデジタル形式のどちらでもよい。外部インターフェース30が無線のインターフェースである場合、電子デバイス10からのオーディオの転送は、典型的にはデジタル形式である。本開示の詳細は、外部インターフェース30の種類に関係なく適用可能であるが、説明のほとんどは、無線のデジタルインターフェースの形態の外部インターフェース30に関するものである。当業者は、本開示を読んだ後、有線のアナログまたはデジタルの外部インターフェース30でも成功するように本発明を変更する方法を理解するであろう。
【0031】
図1aで紹介したオーディオ再生システム1は、オーディオストリーム33を特定の音量でユーザ40に提供するために使用される。図1bを参照して、オーディオストリーム33の流れを、いくつかの定義とともに説明する。オーディオストリーム33は、ある時点で、マスターレベル12と呼ばれるレベルで記録される。このマスターレベル12は、基本的には最初の録音時の利得(gain)である。マスターレベル12は、異なる記録媒体間で実質的に同じであるため、再生音量15を調整することなく、異なるメディアストリームを聴くことが可能となる。
【0032】
オーディオストリーム33は、そのマスターレベル12で、電子機器10に提供される。オーディオストリーム33は、例えば、ストリーミングサービスからのストリームされたメディアにおけるオーディオコンポーネントとして、電子機器10等の記憶装置から取得されて、電子機器10に提供され得る。電子機器10のユーザ40は、オーディオストリーム33を聴く際に、オーディオストリーム33の再生音量15を設定する。この再生音量15の設定は、電子機器10またはオーディオスピーカアレンジメント20のボタンや操作部により再生音量15を調整することによって行われ得る。
【0033】
電子機器10からは、オーディオストリーム33が、外部インターフェース30を介して、オーディオスピーカアレンジメント20に提供される。オーディオストリーム33は、典型的にはマスターレベル12で提供されるので、再生音量15で提供される。電子機器10は、オーディオストリーム33をオーディオスピーカアレンジメント20に提供する前に、オーディオストリーム33のマスターレベル12に変更し得る。オーディオスピーカアレンジメント20は、オーディオストリーム33と再生音量15とを受信し、その2つを用いて、再生音圧レベル52でオーディオスピーカアレンジメント20のユーザ40にオーディオストリームを提供する。再生音圧レベル52は、オーディオ信号33がユーザ40に受信される音圧レベルである。再生音量15は、結果としてオーディオスピーカ21が提供する再生音圧レベル52になる。オーディオストリーム33の再生中に、再生音量15が第1の要因で変更されることがあり、この結果、再生音圧レベル52は、第2の要因で変更される。ただし、再生音圧レベル52は、オーディオスピーカアレンジメント20の種類に依存する。第1の要因と第2の要因との関係は、いかなる種類の線形または非線形の関係でもあり得る。この関係は、1つの電子機器10が、ほとんどの場合、多くの異なるオーディオスピーカアレンジメント20とともに使用される可能性があるので、電子機器10にとっては、概して、未知のものである。再生音圧レベル52は、オーディオ信号がマスタリングされたときに意図されたように知覚されるべきときに重要である。
【0034】
オーディオ信号は、周波数スペクトルからなり、このオーディオ信号の周波数スペクトルは、再生音圧レベル52が異なると、異なるように知覚される。このことは、図2を参照して、異なる音圧レベルでの等ラウドネス曲線(equal loudness contour)300を比較するとわかる。本開示の発明概念によって解決される1つの問題は、再生音圧レベル52に関わらず、オーディオストリーム33が意図された通りに、すなわちマスターレベル12でマスタリングされたときに知覚されるようにすることである。
【0035】
図2には、いくつかの等ラウドネス曲線300が示されている。等ラウドネス曲線300は、音圧レベルの指標(measure)であり、典型的にはdB Sound Pressure Level SPLとしてデシベルで示される。音圧レベルは、典型的には人間にとっての可聴スペクトルである周波数スペクトルにわたって提供される。等ラウドネス曲線300の各点は、1kHzで提示されるあるフォン(phon)の純音(pure tone)と比較して、リスナーが一定のラウドネスを知覚する音圧レベルを表している。フォンは、DIN45631およびISO532で定義されており、本明細書では、50dB SPLの1kHzトーンが50フォンのラウドネスを有し、この信号と同じラウドネスで知覚される他のすべての周波数も50フォンのラウドネスを有することを意味すると定義する。
【0036】
図2は、等ラウドネス300の輪郭(contour)をフォン別にプロットしたものである。図2では、0、20、40、60、80、100フォンについて等ラウドネス曲線300が示されている。図2のラウドネス曲線(loudness contour)300は、ISO 226:213にしたがったラウドネス曲線(loudness contour)300である。これらの輪郭(contour)300は、1933年にHarvey FletcherとWilden A. Munsonによって提供されたFletcher-Munson曲線と比較して補償されている。Fletcher-Munson曲線は、一般的に「等ラウドネス」の概念を最初に記述したものと言われている。もし、音圧レベルがリスナーによるオーディオ信号の周波数スペクトルの知覚に影響を与えないのであれば、図2の輪郭(contour)300間のオフセットは、すべての周波数で同じになる。
【0037】
図3には、20フォンの等ラウドネス曲線300と40フォンとの間のデルタ310が図示されている。見てのとおり、音圧レベルの差310は、予想どおり、破線で図示した1kHzで20dBであるが、1kHzの上下では、予想される20dBとは大きく異なる。この効果により、オーディオ再生は、再生の音圧レベルに応じて、異なる周波数スペクトルを有するように知覚されることになる。
【0038】
本開示の発明者は、洞察に基づく推論と発明的思考の結果、電子機器10からオーディオストリーム33が再生されているときに、再生システム1において上述の効果を補償できることに気付いた。本明細書に示される解決策は、選択された再生音量15に基づいてオーディオストリーム33を補償し、再生音量15が変更されたときに実質的に瞬間的に補償を変更する。
【0039】
図4を参照して、本発明によるオーディオストリーム33の補償の原理を説明する。これらの原理は、図1aで紹介したような再生システム1を参照して説明され、処理ステップの多くは、オーディオスピーカアレンジメント20として参照される装置で実行される。しかし、処理ステップは、電子機器10内で実行されることも、電子機器10とオーディオスピーカアレンジメント20との間で分散して実行されることも、非常によくあることを強調しておく。
【0040】
図4の概略的ブロック図において、電子デバイス10は、外部インターフェース30を介して信号31を通信する。信号31は、オーディオストリーム33と、オーディオストリーム33に関連付けられた制御データ32とを含む。オーディオスピーカアレンジメント20は、外部インターフェース30に適したトランシーバモジュール22を用いて、外部インターフェース30を介して信号31を受信する。例えば、一実施形態において、外部インターフェースがBluetooth low energyインターフェースである場合、トランシーバモジュール22は、Bluetooth low energyトランシーバモジュールであり、一実施形態において、外部インターフェースが有線シリアルインターフェースである場合、トランシーバモジュール22は、有線シリアルトランシーバモジュールである。トランシーバモジュール22は、信号31を受信し、信号31を分析し、その構成要素、例えば、オーディオストリーム33とそれに関連する制御データ32を検出する。なお、検出および分析は、任意の適切な制御回路によって実行されてもよく、この機能は、オーディオスピーカアレンジメント20の他のモジュールにおいて構成されてもよい。制御データ32は、制御モジュール24に伝達され、オーディオストリーム33は、デジタル信号処理(Digital Signal Processing、 DSP)モジュール28に伝達される。
【0041】
制御データ32は、オーディオストリーム33に関連付けられた再生音量15を含み、制御モジュール24は、制御データ32と、再生音量15がオーディオスピーカ21の再生音圧レベル52にどのように変換されるかを記述した事前に保存されている音響伝達データ50(図6に示す)とを備える。事前に保存されている音響伝達データ50については、今後、さらに説明する。制御モジュール24は、再生音量15と事前に保存された音響伝達データ(pre-stored acoustic transfer data)50とを含む入力パラメータに基づいて、補償フィルタ320(図9に示す)を生成する。補償フィルタ320は、一実施形態では、有限インパルス応答(Finite Impulse Response)、FIR、フィルタのデジタルフィルタ係数として表される。補償フィルタ320は、DSP制御信号25としてDSPモジュール28に伝達され得る。補償フィルタ320は、無限インパルス応答(Infinite Impulse Response)、IIR、フィルタなどの任意の種類の適切なフィルタまたはイコライジング機能であり得る。
【0042】
DSPモジュール28は、補償されたオーディオストリーム27をオーディオスピーカ21に提供するために、オーディオストリーム33を補償する際に、制御モジュール24から供給されたデジタルフィルタ係数を適用する機能を備える。DSPモジュール26は、オーディオストリーム33に補償フィルタ320を適用することに加えて、オーディオストリームに関連する他の処理機能、例えば、ノイズキャンセル、サウンドカラーリング、オーディオおよび音楽効果、バスブースト、ステレオワイドニング、3Dサウンドなどを適用するように構成され得る。
【0043】
補償されたオーディオストリーム27がオーディオスピーカ21に供給される前に、それは、典型的には、デジタルの補償されたオーディオストリーム27を、オーディオスピーカ21に供給されるアナログオーディオ信号29に変換するデジタル・アナログ、D/A、変換モジュール28にさらされる。アナログオーディオ信号29は、再生音量15に関連した電圧振幅を有する時変(time variant)オーディオ信号である。アナログオーディオ信号29の電圧振幅は、オーディオスピーカ21の再生音圧レベル52を決定するものである。
【0044】
前述したように、オーディオスピーカアレンジメント20の再生音圧レベル52を制御するために、異なる実装(implementation)が可能である。再生音圧レベル52をどのように制御するかにしたがって、電子機器10のユーザ40による再生音量15の変化の取り扱いが異なり得る。
【0045】
一実施形態では、再生音圧レベル52は、DSPモジュール26による処理の際に、オーディオストリーム33にデジタル利得(digital gain)を適用することにより制御される。再生音量15の変更は、DSPモジュール26によって実行され、更新された補償フィルタ320の適用は、更新された再生音量15’の適用と同期することができる。この同期は、制御モジュール24またはDSPモジュール26によって制御することができる。
【0046】
別の実施形態では、再生音圧レベルは、A/Dモジュール28による処理中に、補償されたオーディオストリーム28にデジタル利得および/またはアナログ利得(analogue gain)を適用することによって制御される。このような実施形態では、図4に破線で示された制御モジュール24によって、更新された利得がA/Dモジュール28に伝達され、更新された補償フィルタ320がDSPモジュール26に伝達される。本実施形態において、制御モジュール24は、更新された補償フィルタ320の適用を、更新された再生音量15’と同期させる役割を担う。
【0047】
再生音量15の更新および、更新された再生音圧レベル52と更新された補償フィルタ320との同期に関する実施形態は、非限定的な例として考慮されるべきである。音量変化により、DSPモジュール26のデジタル利得が変化し、A/Dモジュール28のアナログ利得が変化するような場合には、これらの実施形態を組み合わせることができる。また、DSPモジュール26およびA/Dモジュール28の両方によってデジタル利得を制御することも可能である。
【0048】
図5a~図5cを参照して、信号31の処理についてさらに詳細に説明する。図5aには、外部インターフェース30を介して通信される信号31に含まれるものとして、例示的なオーディオストリーム33が図示されている。オーディオストリーム33は、例示の目的のみのために、時変信号(time variant signal)として図示されている。オーディオストリーム33は、典型的には、データパケットとして形成され、外部インターフェース30のオーディオストリーミング用のチャネルなどで伝送される。
【0049】
図5bにおいて、オーディオストリーム33は、トランシーバモジュール22によってオーディオフレーム23内に受信される。各オーディオフレーム23は、フレーム時間TFのオーディオを表すデータを保持する。一実施形態では、各オーディオフレーム23は、44.1kHzでサンプリングされた512サンプルのオーディオデータを保持しており、これは、約11.6msのフレーム時間TFに相当する。フレームサイズは、システム間で異なる可能性があることに留意すべきである。オーディオフレーム23は、典型的には、外部インターフェース30の転送レートに依存するレートで、外部インターフェース30を介して受信される。外部インターフェース30がオーディオストリーム33の再生の不要な中断を引き起こすことに関連する問題は、オーディオスピーカアレンジメント20がフレームバッファを有することによって軽減されることができる。フレームバッファは、フレーム23をバッファリングし、再生におけるジッタのリスクを低減するように構成されている。フレーム23がフレーム時間TFに実質的に等しいレートで受信されていると仮定すると、たった1つの誤って受信されたフレーム23が、オーディオストリーム33の再生におけるジッタを引き起こす可能性がある。
【0050】
オーディオフレーム23は、DSPモジュール22に提供され、そこで、例えば補償フィルタ320によって処理される。DSPモジュール22による各フレーム23の処理は、処理時間Tpと呼ばれ、処理時間Tpは、フレーム時間TFよりも短い。フレーム時間TFと処理時間Tpとの時間差は、アイドル時間Tiである。アイドル時間Tiの間、DSPモジュールは、典型的には、電力を節約するためにスリープモードになり、この時間Tiは、補償フィルタ320を適用および/または生成および/または更新するために利用することができる。補償フィルタ320の生成は、例えば制御モジュール24およびDSPモジュール26が同じモジュール24、26であるか、または制御モジュール24がDSPモジュール26に制御モジュール24からのパラメータに基づいて補償フィルタ320を生成するように指示する実施形態において適用可能である。フィルタリングされたオーディオフレーム23は、補償されたオーディオストリーム27としてD/Aモジュール28に提供される。補償されたオーディオストリーム27は、典型的には、先に開示されたフレームバッファと同様の方法で、出力バッファにおいてバッファリングされる。出力バッファは、典型的には、D/Aクロックによってクロックされ、出力はオーディオスピーカ21に提供される。D/Aクロックは、典型的には、オーディオデータのサンプルレート、上記実施形態では44.1kHzに関連付けられている。出力バッファは、システム設計パラメータであり、一実施形態では、2つのオーディオフレーム23を保持するように構成されている。
【0051】
補償フィルタ320を生成するために2つの連続したオーディオフレーム23の間のアイドル時間Tiを利用することにより、オーディオスピーカ21の再生音圧レベル52の変化に同期したオーディオストリーム33の再生中に、補償フィルタ320をシームレスかつ実質的に瞬時に更新することが可能である。本明細書に示された教示は、再生音圧レベル52のオーディオストリーム33が、ユーザ40の視点から見て、リアルタイムで変更されるものである。言い換えれば、オーディオスピーカによる更新された再生音量15の受信からアレンジメント20への再生音圧レベル52の変化までにかかる時間は、10msの領域で極めて短い。
【0052】
図6を参照して、事前に保存された音響伝達データ50についてさらに詳しく説明する。再生音量15は、典型的には、電子機器10によって提供され、多くの異なる形態であることができる。再生音量15は、100%が可能な最高の再生音量であるパーセント数であってもよいし、15が最高の再生音量15に対応する、例えば0から15までの離散的なステップであり得る。いずれにしても、再生音量15は設定可能であり、オーディオスピーカ21の再生音圧レベル52と関連していなければならない。再生音量15は、必ずしもオーディオスピーカアレンジメント20の再生音量と直接関係しない。オーディオスピーカアレンジメント20は、電子機器10よりも再生音量のステップが多くても少なくても構わない。ここでは、事前に保存された音響伝達データ50が用いられる。
【0053】
事前に保存された音響伝達データ50は、電子機器10の再生音量15を、オーディオスピーカアレンジメント20の再生音圧レベル52に関連付ける手段を提供する。一例として、オーディオスピーカアレンジメント20が32の音量ステップ(0~31)を許容する機能を備えている場合、これらの音量ステップの各々は、再生音圧レベル52に関連する。電子デバイス10が16の音量ステップ(0~15)を許容する機能を備えている場合、電子デバイス10で中間の音量ステップ、すなわちステップ7を選択すると、オーディオスピーカアレンジメント20において中間の音量ステップ、すなわちステップ15を選択することになる。
【0054】
事前に保存された音響伝達データ50は、多くの異なる方法で形成され得る。それは、オーディオスピーカアレンジメント20の異なる音量ステップに関連付けられた再生音圧レベル52の絶対値を有するルックアップ・テーブルとして形成され得る。あるいは、オーディオスピーカアレンジメント20の1つの音量ステップが、再生音圧レベル52の絶対値に関連付けられたベースライン・音量ステップとして選択されてよく、オーディオスピーカアレンジメントの他の音量ステップが、ベースライン・音量ステップの絶対値に対するデルタ値である再生音圧レベル52に関連付けられてもよい。
【0055】
一実施形態では、事前に保存された音響伝達データ50は、対応する再生音圧レベル52に各々が関連付けられた1つ以上の再生音量15を含む。
【0056】
任意に、事前に保存された音響伝達データ50は、各再生音量15について、複数の再生音圧レベル52を含み得る。複数の再生音圧レベル52は、異なる再生周波数の再生音圧レベルであり得る。一実施形態では、オーディオスピーカアレンジメント20の各再生音量15に1つの再生音圧レベル52が関連付けられており、再生音圧レベル52は、1kHzのテストトーンで決定された再生音圧レベル52である。別の実施形態では、オーディオスピーカアレンジメント20の各再生音量15に1つの再生音圧レベル52が関連付けられており、再生音圧レベル52は、オーディオスピーカ21がホワイトノイズにさらされるときの平均音圧として決定された再生音圧レベル52である。
【0057】
いくつかの実施形態では、事前に保存された音響伝達データ50は、テーブルに配置されている。
【0058】
可能性のある全ての再生音量15を事前に保存された音響伝達データ50にリストアップする必要はない。事前に保存された音響伝達データ50にリストアップされていない再生音量15が選択された場合、リストアップされていない再生音量15の最も下および上に近い再生音量15と、それらに関連する再生音圧レベル52とを補間することによって、関連する再生音圧レベル52を算出してもよい。事前に保存された音響伝達データ50は、あるフォンの等ラウドネス曲線300に関連する再生音量が保存されていてもよい。
【0059】
いくつかの実施形態では、事前に保存された音響伝達データ50は、再生音量15と再生音圧レベル52との間の数学的関係を記述する方程式として表される。事前に保存された音響伝達データ50は、典型的には、オーディオスピーカアレンジメント20の1つのモデルに固有のものである。事前に保存された音響伝達データ50は、オーディオスピーカアレンジメント20の一連のモデルに固有のものであり得る。事前に保存された音響伝達データ50は、オーディオスピーカアレンジメント20の各ユニットに固有のものであり得る。事前に保存された音響伝達データ50は、オーディオスピーカアレンジメント20の製造時にオーディオスピーカアレンジメント20に保存されてもよいし、ファームウェアのアップグレードを通じて、または例えば、オーディオスピーカアレンジメント20のユーザ40が本開示の音量依存補償の使用開始を決定したときに、後からオーディオスピーカアレンジメントに提供されてもよい。
【0060】
事前に保存された音響伝達データ50の生成は、オーディオスピーカアレンジメント20で利用可能な特定の再生音量15で再生音圧レベル52を記録することによって実施され得る。
【0061】
図7を参照して、オーディオスピーカアレンジメント20が一対のヘッドフォン20である実施形態を、事前に保存された音響伝達データ50の生成を説明するために使用する。ヘッドフォン20は、ユーザ40による使用中は、ヘッドフォン20からのオーディオがユーザ40の耳に向かって実質的に直接向かうように装着される。オーディオストリーム33を補償するために使用される再生音圧レベル52は、ユーザ40の耳での音圧レベル52である。つまり、ユーザ40の耳の中や周辺の領域41で記録することが好ましい。ユーザ40の代わりにファントムヘッドを使用することも1つの可能性である。音響記録デバイス、例えばマイクロフォンからなるファントムヘッドは、市場で容易に入手可能である。
【0062】
前節の詳細により、再生音量15に基づいて、オーディオストリーム33を補償することが可能である。提示されたように、音、例えばオーディオは、再生音圧レベル52に応じて異なるように知覚され、異なる再生音圧レベル52に対して異なる補償フィルタ320が使用され得る。図3に提示された20フォンと40フォンとの等ラウドネス曲線300間の違いは、図8aに図示された補償フィルタ320の周波数応答によって補償することができる。1kHzの再生音圧レベル40dB SPLから1kHzの再生音圧レベル20dB SPLに変更する際に、この補償フィルタ320を適用すると、40フォンの等ラウドネス曲線300と20フォンの等ラウドネス曲線300との間の知覚音の差が補償される。この例では、補償フィルタ320は、再生音圧レベル52の20dB低減とともに適用されることを意図している。これは、図8aのデータから、音圧レベル52は、1kHzでは20dB低減されるが、20Hzでは10dB程度しか低減されず、20kHzではさらに低減されることを意味する。このように、事前に保存された音響伝達データ50を有することにより、結果的に、再生音圧レベル52に関わらず、知覚される音圧レベルが全ての周波数で実質的に同じになるように、再生音量15に応じた補償フィルタ320を生成することが可能となる。
【0063】
図8bに示されるように、補償フィルタ320は、1つ以上の振幅補償値335を含む振幅補償データ330として表され得る。振幅補償値335は、周波数ごとの補償を記述する。各々が周波数または周波数の範囲に関連付けられた任意の数の振幅補償値335が存在し得る。
【0064】
図9を参照すると、補償フィルタ320は、事前に保存された音響伝達データ50と再生音量15とから決定される再生音圧レベル52に基づいて生成される。補償フィルタ320は、振幅補償データ330を適用することにより生成され得る。振幅補償データ330は、図8bに示すように、複数の異なる周波数および再生音圧レベル52に対する振幅フィルタリングの差分で構成されていてよい。これらの差分は、振幅補償値335によって表され得る。振幅補償データ330は、基準再生音圧レベルでの基準レベルを含んでいてよい。基準レベルでは、振幅フィルタリングの差分はゼロであり、振幅補償データ330における他の再生音圧レベル52は、基準レベルとの関係で記述される。振幅補償データ330から再生音圧レベル52への一致(match)が欠落している場合、隣接する再生音圧レベル52とそれに関連する振幅補償データ330との間の補間が可能である。振幅補償データ330は、事前に保存された音響伝達データ50の場合と同様に、所与の再生音圧レベル52を補償フィルタ320に変換する数学関数であり得る。
【0065】
一実施形態では、振幅補償データ330は、等ラウドネス曲線300に基づいている。一実施形態では、振幅補償データ330は、60dB SPLの再生音圧レベル52に相当する基準レベルを有している。一実施形態では、振幅補償データ330は、60フォンの等ラウドネス曲線300に相当する基準レベルを有している。
【0066】
補償されたオーディオストリーム27は、補償されていないオーディオストリーム33とは異なる周波数コンテンツを有する。高い周波数が低い周波数よりも増幅されること、またはその逆であることがあり得る。オーディオストリーム33の周波数コンテンツによっては、補償フィルタ320を適用した場合に、再生音圧レベル52が低く知覚されることもあり得る。例えば、補償フィルタ320を適用したオーディオストリーム33の再生を仮定する。再生音量15が増加し、更新された補償フィルタ320’が決定された場合、更新された補償フィルタにより、再生音圧レベル52は実質的に変化しないか、さらに低くなる可能性がある。さらに、再生音量15が、再生音圧レベル52に5dBの増加を与えることを意図していたと仮定する。低周波で5dBの減衰、高周波で0dBの減衰を提供する更新された補償フィルタが適用された場合、再生音圧レベルは高周波で5dB、低周波で0dB増加することになる。今、オーディオストリーム33が低周波でそのオーディオパワーの大半を占めている場合、すなわち低音が非常に重い場合、更新された補償フィルタ320’が適用された状態では、すべての周波数にわたって蓄積されたオーディオパワーが大幅に低下することになる。
【0067】
上述の問題を軽減するために、本発明者らは、マスターレベル12において、平均オーディオストリームの信号周波数コンテンツを推定し、平均オーディオストリームの平均オーディオパワーを推定することが可能であることに気付いた。平均オーディオストリームの周波数コンテンツは、典型的な周波数分布によって表され、これは、平均オーディオストリームとそれに関連する典型的な周波数分布とを計算するために、大量のオーディオストリームを分析することによって提供され得る。このことから、平均オーディオストリームのトータルオーディオパワーが、補償フィルタ320を適用した場合と適用しない場合とで実質的に同じであることを保証する利得係数を生成することができる。利得係数(gain factor)は、補償フィルタ320とともにオーディオストリーム33に適用されてよいし、オーディオストリーム33の処理の他の段階で適用されてもよい。
【0068】
再生音量15に基づいてオーディオストリーム33を補償することに加えて、一実施形態では、ユーザ40の聴覚プロファイル340に関してオーディオストリームを補償し得る。これは、図11に概略的に示されており、補償フィルタ320は、振幅補償データ330とユーザ40の聴覚プロファイル340とに基づいて生成される。聴覚プロファイル340は、任意の種類の適切な聴覚プロファイル340であってよく、ユーザ40の各耳のための別々の聴覚プロファイル340を含んでいてよい。聴覚プロファイル340は、電子デバイス10からオーディオスピーカアレンジメント20に提供され得る。電子デバイス10は、ユーザ40の聴覚検査に基づいて聴覚プロファイル340を生成するように構成されていてよいし、聴覚プロファイルリポジトリから聴覚プロファイル340を取得するように構成されていてもよい。このようなリポジトリは、例えば、クラウドサーバ上でホストされるデータベースであり得る。聴覚プロファイル340は、ユーザ40の各耳に対して異なる補償を示唆する可能性が非常に高くてよい。
【0069】
多くのオーディオスピーカアレンジメント20は、複数のオーディオスピーカ21を含み、複数のオーディオチャネルを有するオーディオストリーム33の再生をサポートする。これから図10を参照して説明するように、本発明はマルチチャネルオーディオシステムにも適用可能である。
【0070】
図10には、デュアルチャネルのオーディオスピーカアレンジメント20が示されている。トランシーバモジュール22によって受信された信号31が複数のチャネルを有するオーディオストリーム33からなる場合、これらのチャネルは識別されることができ、分離されることができ、オーディオスピーカアレンジメント20のオーディオスピーカ21L、21Rの各々に提供されることができる。典型的には、オーディオストリームは、左チャネルオーディオストリーム33Lと右チャネルオーディオストリーム33Rとからなるステレオオーディオストリームである。左チャネルオーディオストリーム33Lは、左オーディオスピーカ21Lを対象としており、右チャネルオーディオストリーム33Rは、右オーディオスピーカ21Rを対象としている。
【0071】
図10において、トランシーバモジュール22は、オーディオストリーム33L、33Rを識別し、左DSPモジュール26Lおよび右DSPモジュール26Rにそれぞれ提供するものとして示されており、この識別は、例えばDSPモジュール26で行われる可能性が非常に高いが、説明のためにトランシーバモジュール22で行われている。オーディオストリーム33L、33Rの各々は、異なる補償フィルタ320にさらされてよく、その理由の1つは、チャネル間のバランスが異なり、その結果、左の再生音量と右の再生音量とが互いに異なることであると考えられる。他の理由としては、オーディオスピーカ21L、21Rの特性が異なり、その結果、事前に保存されている音響伝達データ50が異なることが考えられる。これは、それぞれのオーディオスピーカ52L、52Rに等しいオーディオストリーム33が供給された場合に、左の音圧レベル52Lと右の音圧レベル52Rとが異なることを意味する。ユーザ40の聴覚プロファイル340に関連してこれまで説明したように、ユーザ40に関連したオーディオスピーカアレンジメントの差異にも理由がある。
【0072】
図10を参照して説明したのは、デュアルスピーカ21L、21Rとステレオストリームとに関連したものであるが、さらに多くのオーディオスピーカ21を有するオーディオスピーカアレンジメント20にも同様の理由が適用可能である。これは、例えば、カーステレオシステムやサラウンドシステムの場合であり得る。オーディオストリーム33が、複数のオーディオスピーカ21、21L、21Rに供給されるシングルチャネルのオーディオストリーム33であっても、同様の理由が適用可能である。
【0073】
次に、オーディオストリーム33を処理するための方法100を、図12aを参照して提示する。方法100は、これらの具体的な内容が本開示の他のセクションで提示されているため、方法100の具体的な内容に関する可能なすべての詳細なステップなしに与えられる。それらが、オーディオストリーム33を補償するための方法100にも実装可能であることは、当業者には明らかである。
【0074】
方法100は、オーディオストリーム33と制御データ32とを含む信号31を受信すること110によって開始される。ここで、制御データは、オーディオストリーム33に関連付けられた再生音量15を少なくとも含む。オーディオストリーム33は、前述したように、オプションとして、オーディオフレーム23において受信されてよい。これらのオーディオフレーム23は、受信バッファにバッファリングされてよい。
【0075】
再生音量15に基づいて、方法100は、先に提示したように、事前に保存された音響伝達データ50を用いて、再生音圧レベル52を決定すること120によって進む。先に挙げたように、例えばユーザ40、信号31および/またはオーディオスピーカアレンジメント20に応じて、複数の再生音圧レベル52が決定され得る実施形態がある。
【0076】
決定された再生音圧レベル52は、振幅補償データ330とともに、補償フィルタ320を生成すること130に用いられる。補償フィルタ320の生成130は、ユーザ40の聴覚プロファイル340に基づいていてもよい。振幅補償データ330は、等ラウドネス曲線300に基づいた1つ以上の振幅補償値335を含んでいてよい。
【0077】
生成された130補償フィルタ320は、補償されたオーディオストリーム27をオーディオスピーカ21に提供する150ために、オーディオストリーム33をフィルタリング140するために使用される。
【0078】
提示された方法100は、再生音量15に基づいてオーディオストリームを処理することを可能にする。以前のセクションで提示したように、再生音量15は、再生音圧52の変化の遅延や、補償フィルタ320の更新または変更の遅延を煩わせることなく、ユーザ40によって変更され得る。補償フィルタを更新する方法100は、オーディオストリーム33を補償する方法100と実質的に同じである。図12bを参照すると、再生音圧レベル52が決定される120のと同じ方法で、更新された再生音圧レベル52を決定する120’ために使用される更新された再生音量15’が受信される。補償フィルタ320の生成130と同様に、更新された補償フィルタ320が生成130’される。更新された補償フィルタ320は、本開示の以前のセクションで開示されたようにオーディオストリームに適用され、オーディオストリーム33をフィルタリング40するために使用され、補償されたオーディオストリーム27をオーディオスピーカ21に提供する150。
【0079】
方法100は、好ましくは、オーディオスピーカアレンジメント20によって実行されるが、実施形態では、電子デバイス10によって単独にまたは部分的に実行され得る。
【0080】
図13に図示されているように、方法100は、コンピュータプログラム製品600がデバイス、例えばコントローラ、コンピュータ、DSPなどによって実行されるときに、デバイスが本明細書に開示されているように方法100を実行するように、コンピュータプログラム製品600として実装され得る。
【0081】
コンピュータプログラム製品600の一実施形態では、それがコントローラ200によって実行されると、外部インターフェース30を介してオーディオストリーム33およびオーディオストリーム33に関連する再生音量15を受信するように、コントローラ200にトランシーバモジュール22を制御させように構成される。コンピュータプログラム製品600はさらに、制御モジュール24を制御して、再生音量15と、メモリ700から取得された事前に保存された音響伝達データ50とに基づいて、オーディオスピーカアレンジメント20の再生音圧レベル52を決定し、再生音量15をオーディオスピーカ21の再生音圧レベル52と関連付けるように構成される。さらに、コンピュータプログラム製品600は、制御モジュール24を制御して、決定された再生音圧レベル52に関連付けられた、メモリ700から取得された振幅補償データ330に基づいて補償フィルタ320を生成し、DSPモジュール26を制御して、補償フィルタ320を用いてオーディオストリーム33をフィルタリングし、補償されたオーディオストリーム27を生成するように構成される。コンピュータプログラム製品600はさらに、D/Aモジュール28を制御して、補償されたオーディオストリーム27をオーディオスピーカ21に提供するように構成される。
【0082】
図14には、オーディオスピーカアレンジメント20のブロック図が示されている。オーディオスピーカアレンジメント20は、オーディオスピーカ21と、少なくとも1つのコントローラ200と、1つ以上のメモリ700とを含む。メモリ700は、コントローラ200に構成されていてよいし、コントローラ200の外部に構成されていてもよい。コントローラ200は、トランシーバモジュール22、制御モジュール24、DSPモジュール26および/またはD/Aモジュール28の一部または全部を含んでいてよい。これらのモジュール22、24、26、28は、ソフトウェアモジュールとして実装されてよいし、コントローラ200に内蔵された半導体デバイスとして実装されてよいし、両者の組み合わせとして実装されてもよい。これらは、オーディオスピーカアレンジメント20の独立したコンポーネントとして実装されてもよい。メモリ700は、典型的には、コントローラ700がオーディオストリーム33を補償するための方法100を実行するように構成することができるようなソフトウェア命令とともに、事前に保存された音響伝達データ50および振幅補償データ330を含むであろう。
【0083】
オーディオスピーカアレンジメント20に対する一実施形態は、少なくとも1つのオーディオスピーカ21と、少なくとも1つのコントローラ200と、少なくとも1つのメモリ700とを備えている。前記少なくとも1つのコントローラ200は、トランシーバモジュール22を制御して、外部インターフェース30を介してオーディオストリーム33およびオーディオストリーム33に関連する再生音量15を受信するように構成可能である。コントローラ200はさらに、制御モジュール24を制御して、再生音量15をオーディオスピーカ21の再生音圧レベル52と関連付けるように、再生音量15と、前記少なくとも1つのメモリ700から取得された事前に保存された音響伝達データ50とに基づいて、オーディオスピーカアレンジメント20の再生音圧レベル52を決定するように構成される。コントローラ200はさらに、制御モジュール24を制御して、決定された再生音圧レベル52に関連付けられた、前記少なくとも1つのメモリ700から取得された振幅補償データ330に基づいて、補償フィルタ320を生成するように構成される。コントローラ200はさらに、DSPモジュール26を制御して、補償フィルタ320を用いてオーディオストリーム33をフィルタリングし、補償されたオーディオストリーム27を生成するように構成される。コントローラ200はまた、D/Aモジュール28を制御して、補償されたオーディオストリーム27をオーディオスピーカ21に提供するように構成される。
【0084】
図15aおよび図15bを参照して、振幅補償データ330および聴覚プロファイル340に関するいくつかのさらなる詳細を提示する。これらの詳細は、振幅補償データ330および聴覚プロファイル340の特定の実施形態であり、先に提示されたすべての関連する実施形態に適用可能であるが、当業者は、これらが本開示の範囲を限定するものではないことを理解する。
【0085】
図15aには、異なるフォンに対する振幅補償データ330のグラフが提示されている。振幅補償データ330は、連続線として提示されているが、好ましくは、いくつかの異なる周波数における離散的な振幅補償値335として記述されている。図15aの例では、実線である60フォンのレベルがベースラインである。これは、60フォンに相当する再生音圧レベル52、すなわち1kHzにおける60dB SPLが、図8bを参照して説明したように、すべての周波数において0dBの振幅補償データ330を受けることを意味する。図15aの20、40、80、100フォンのラインは、それぞれのフォンと60フォンのラインとの差として示されている。この例では、フォンは1kHzで測定されており、振幅補償データ330は結果的にこの周波数の全てのフォンに対して0dBとなっている。オーディオストリーム33が60フォンに相当する再生音圧レベル52で楽しまれていると仮定し、ユーザ40が再生音量15を再生音圧レベル52の20dB増加に相当するレベルまで増加させることを決定したとする。このとき、オーディオストリーム33の利得は20dB増加することになるが、これに加えて、図15aの短破線である80フォンラインの周波数依存振幅補償データ330が20dBの利得に加算されることになる。その結果、低周波では30dB程度、1kHzでは20dB程度、4kHzでは19dB程度、高周波では25dB程度の利得が得られることになる。
【0086】
先に紹介したように、音量依存の補償に加えて、聴覚プロファイル340をオーディオストリーム33に適用してもよい。聴覚プロファイル340の一例は、図15bに描かれており、十字で表される右耳と四角で表される左耳の聴力の閾値が、いくつかの異なる周波数について別々に示されている。再生音圧レベル52の20dBの変化に関連して上述した補償に聴覚補償を加えると、左耳では低周波で約35dB、1kHzで約25dB、4kHzで約34dB、高周波で約45dBの利得が得られる。右耳の場合は、低周波で約40dB、1kHzで約35dB、4kHzで約39dB、高周波で約40dBとなる。
【0087】
本開示において発明者らが解決した問題点は、再生音量15から再生音圧レベル52へのマッピング、再生音圧レベル52の変化、補償の変化が実質的に瞬時に行われることである。

図1a
図1b
図2
図3
図4
図5a
図5b
図5c
図6
図7
図8a
図8b
図9
図10
図11
図12a
図12b
図13
図14
図15a
図15b
【国際調査報告】