(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-12-02
(45)【発行日】2022-12-12
(54)【発明の名称】データフォーマット
(51)【国際特許分類】
G10K 15/04 20060101AFI20221205BHJP
H04R 3/00 20060101ALI20221205BHJP
【FI】
G10K15/04 302F
H04R3/00
(21)【出願番号】P 2019551758
(86)(22)【出願日】2017-12-07
(86)【国際出願番号】 GB2017053690
(87)【国際公開番号】W WO2018104744
(87)【国際公開日】2018-06-14
【審査請求日】2020-11-19
(32)【優先日】2016-12-07
(33)【優先権主張国・地域又は機関】GB
【前置審査】
(73)【特許権者】
【識別番号】521428170
【氏名又は名称】ウイーヴ ミュージック インコーポレイテッド
(74)【代理人】
【識別番号】100105924
【氏名又は名称】森下 賢樹
(72)【発明者】
【氏名】カニストラーロ、アラン
(72)【発明者】
【氏名】ダニレイトス、ダニエル
(72)【発明者】
【氏名】フアン、ツィー フランク
(72)【発明者】
【氏名】ローネイ、ニック
(72)【発明者】
【氏名】ラスムッセン、ラース
(72)【発明者】
【氏名】ヴィスヴィキ、ジョージー エロミダ
【審査官】西村 純
(56)【参考文献】
【文献】米国特許出願公開第2006/0107822(US,A1)
【文献】国際公開第2014/003072(WO,A1)
【文献】特開2013-050582(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10K 15/00-15/12
G10H 1/00- 7/12
G11B 27/00-27/36
H04R 1/00-31/00
(57)【特許請求の範囲】
【請求項1】
制御可能なテンポを有するようにアレンジされたオーディオトラックを形成するために使用されるように構成された複数のオーディオコンポーネントを含む適応型メディアファイルを構築するための方法であって、
前記複数のオーディオコンポーネントのうちの第1のオーディオコンポーネントに関連付けられた第1のオーディオデータを用意するステップと、
前記第1のオーディオデータの再生テンポ範囲を設定するステップと、
前記第1のオーディオコンポーネントに関連付けられた第2のオーディオデータを用意するステップと、
前記第2のオーディオデータの再生テンポ範囲を設定するステップであって、前記第2のオーディオデータの前記テンポ範囲が前記第1のオーディオデータの前記テンポ範囲とは異なる、再生テンポ範囲を設定するステップと、
前記第1のオーディオデータ、前記第2のオーディオデータ、および前記それぞれの再生テンポ範囲を関連付けるステップと
を含み、
前記第1のオーディオデータおよび前記第2のオーディオデータは、それぞれ異なるテンポで録音されたオーディオトラックの同じパートの録音を含むことを特徴とする方法。
【請求項2】
前記第1のオーディオデータ、前記第2のオーディオデータ、および前記それぞれの再生テンポ範囲は、ファイル構造内に配置されることによって関連付けられる、請求項1に記載の方法。
【請求項3】
前記第1のオーディオデータ、前記第2のオーディオデータ、およびそれぞれの再生テンポ範囲は、前記第1および第2のオーディオデータに関連付けられたメタデータにおける参照によって関連付けられる、請求項1に記載の方法。
【請求項4】
前記第1のオーディオデータの前記再生テンポ範囲は、前記第1のオーディオデータのメタデータに組み込まれる、請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記第1のオーディオデータの前記再生テンポ範囲は、下側テンポおよび上側テンポを表すデータを提供する、請求項1~4のいずれか一項に記載の方法。
【請求項6】
再生時に、前記第1のオーディオデータは、再生テンポが前記下側テンポより上かつ前記上側テンポよりも下、または前記下側テンポ以上かつ前記上側テンポ以下のいずれかであるときに、前記オーディオ出力の一部として提示されるようにアレンジされる、請求項5に記載の方法。
【請求項7】
前記第1のオーディオデータは、或るテンポを有し、前記下側テンポおよび前記上側テンポを表す前記データは、実際の上側テンポおよび実際の下側テンポ、あるいは前記第1のオーディオデータのテンポを上回る毎分のビート数および下回る毎分のビート数の一方である、請求項5に記載の方法。
【請求項8】
前記第1のオーディオデータの前記テンポ範囲は、前記第1のオーディオデータがタイムストレッチされるべき最大および最小テンポを定める、請求項1~7のいずれか一項に記載の方法。
【請求項9】
前記用意するステップは、音を録音して前記オーディオデータを形成すること、オーディオ制作ツールを使用して前記オーディオデータを生成すること、または前記オーディオデータをインポートすることのうちの1つ以上によって達成される、請求項1~8のいずれか一項に記載の方法。
【請求項10】
前記第1のオーディオデータおよび前記第2のオーディオデータは、第1および第2のオーディオファイルである、あるいは第1および第2のオーディオファイルから導出される、請求項1~9のいずれか一項に記載の方法。
【請求項11】
前記第1のオーディオデータ、前記第2のオーディオデータ、および前記それぞれの再生テンポ範囲を関連付けるステップは、前記適応型メディアファイルに含まれる1つ以上の構成ファイルに基づく、請求項10に記載の方法。
【請求項12】
前記複数のオーディオコンポーネントのうちの前記第1のオーディオコンポーネントに関連付けられた前記第1のオーディオデータは、前記適応型メディアファイル内で特定される、請求項1~11のいずれか一項に記載の方法。
【請求項13】
前記適応型メディアファイルは、オーディオファイルまたはビデオフレームデータと関連のオーディオデータとを含むビデオファイルの一方である、請求項1~12のいずれか一項に記載の方法。
【請求項14】
使用時に請求項1~13のいずれか一項に記載の方法のプロセッサによる実行を可能にするように構成されたコンピュータ可読命令を含んでいるコンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、メディアファイルおよび関連ファイルを構築するための方法に関する。より具体的には、これに限られるわけではないが、異なるテンポでのオーディオの再生を可能にするオーディオファイルタイプが提示される。また、音楽トラックを提示する再生テンポを制御するための方法も説明される。以下の説明に基づいて、多数の他のアプリケーションが明らかになるであろう。
【背景技術】
【0002】
音楽業界においては、多くの定番曲およびヒットした音楽トラックが、リミックスされ、すなわち改変され、異なる曲が作り出されることが多い。たとえメロディの大部分がそのままであっても、リミックスは、通常は、曲の元々のリズムまたはBPM(1分あたりのビート数)を変えて、異なるムードまたは雰囲気を作り出す。曲を、曲にクラブの感覚を与えるために加速させることができ、よりラウンジ風の入力を与えるために減速させることができる。
【0003】
曲または音楽トラックは、一般に、例えば8つのオーディオデータセットなど、いくつかのオーディオデータセットのミキシングの結果であり、各々のオーディオデータセットは、特定の役目(ボーカル1、ボーカル2、ビート、・・・)または楽器(ピアノ、ギター、ハープ、サックス、ベース、・・・)に割り当てられたオーディオチャネルに対応する。各々のオーディオデータセット、したがって音楽トラック自体は、それぞれの再生テンポを特徴とし、そのような再生テンポで提示または再生されるように意図される。再生テンポは、一般に、種々のオーディオデータセットを録音したときの元々のBPMに対応する。オーディオチャネル(より具体的には、割り当てられたオーディオデータセット)は、一般に、音楽編集者によって、聴衆を喜ばせることができる音楽トラックのオリジナルのアレンジを生み出すために改変される。
【0004】
再生テンポの変更は、オリジナルのアレンジに大きな影響を及ぼす可能性があるため、複雑なプロセスである。主な混乱は、通常はアレンジメントのピッチが大きく影響され、曲が耳に「奇妙」に聞こえ、あるいは「質が落ちて」聞こえるようになることである。リミックスは、一般に、再生テンポを変えつつ、依然として耳に心地よい新たなアレンジを生み出すための芸術的および技術的の両方の作業からなる。技術的な作業を支援するために、今日では、オーディオデータセットのタイムストレッチなど、さまざまなツールが利用可能である。タイムストレッチは、オーディオデータセットを、最初に意図されていた元々の再生テンポから、別の再生テンポに関係する修正されたオーディオデータセットに変換することからなる。変換は、再生テンポの差が芸術的アレンジへの影響を減らすようにピッチを制御することを可能にする。
【0005】
タイムストレッチにおける問題は、影響が制御できなくなるまでに許容される再生テンポの範囲が、かなり限られていることである。オリジナルの再生テンポを特定の割合を超えて増減させると、利用可能なツールおよび音楽編集者の芸術的技量では、アレンジメントおよびオリジナルのオーディオサンプルの粗い劣化を補償することが不可能になる。
【0006】
今日でも、音楽トラックの再生テンポを広い値の範囲にわたって変更しつつ、耳で感じられる劣化を抑える方法が、依然として必要とされている。具体的には、そのようなテンポの変更を、聞き手が音楽トラックに耳を傾けている最中に達成することが必要とされている。
【発明の概要】
【0007】
一態様によれば、制御可能なテンポを有するようにアレンジされたオーディオ出力を形成するために使用されるように構成された複数のオーディオコンポーネントを含む適応型メディアファイルを構築するための方法であって、複数のオーディオコンポーネントのうちの第1のオーディオコンポーネントに関連付けられた第1のオーディオデータを用意するステップと、第1のオーディオデータの再生テンポ範囲を設定するステップと、第1のオーディオコンポーネントに関連付けられた第2のオーディオデータを用意するステップと、第1のオーディオデータのテンポ範囲とは異なる第2のオーディオデータの再生テンポ範囲を設定するステップと、第1のオーディオデータ、第2のオーディオデータ、およびそれぞれの再生テンポ範囲を関連付けるステップとを含む、方法が提供される。
【0008】
場合によっては、第1のオーディオデータ、第2のオーディオデータ、およびそれぞれの再生テンポ範囲は、それらをファイル構造内に配置することによって関連付けられる。場合によっては、第1のオーディオデータ、第2のオーディオデータ、およびそれぞれの再生テンポ範囲は、第1および第2のオーディオデータに関連付けられたメタデータにおける参照によって関連付けられる。場合によっては、第1のオーディオデータの再生テンポ範囲は、第1のオーディオデータのメタデータに組み込まれる。
【0009】
場合によっては、第1のオーディオデータの再生テンポ範囲は、下側テンポおよび上側テンポを表すデータを提供する。場合によっては、再生時に、第1のオーディオデータは、再生テンポが下側テンポより上かつ上側テンポよりも下、または下側テンポ以上かつ上側テンポ以下のいずれかであるときに、オーディオ出力の一部として提示されるようにアレンジされる。場合によっては、第1のオーディオデータは、或るテンポを有し、下側テンポおよび上側テンポを表すデータは、実際の上側テンポおよび実際の下側テンポ、あるいは第1のオーディオデータのテンポを上回る毎分のビート数および下回る毎分のビート数の一方である。
【0010】
場合によっては、第1のオーディオデータのテンポ範囲は、第1のオーディオデータがタイムストレッチされるべき最大および最小テンポを定める。場合によっては、用意するステップは、音を録音してオーディオデータを形成すること、オーディオ制作ツールを使用してオーディオデータを生成すること、またはオーディオデータをインポートすることのうちの1つ以上によって達成される。
【0011】
場合によっては、第1のオーディオデータおよび第2のオーディオデータは、第1および第2のオーディオファイルである、あるいは第1および第2のオーディオファイルから導出される。場合によっては、第1のオーディオデータ、第2のオーディオデータ、およびそれぞれの再生テンポ範囲を関連付けるステップは、適応型メディアファイルに含まれる1つ以上の構成ファイルに基づく。場合によっては、複数のオーディオコンポーネントのうちの第1のオーディオコンポーネントに関連付けられた第1のオーディオデータは、適応型メディアファイル内で特定される。場合によっては、適応型メディアファイルは、オーディオファイルまたはビデオフレームデータと関連のオーディオデータとを含むビデオファイルの一方である。
【0012】
さらなる態様によれば、使用時にこの方法のプロセッサによる実行を可能にするように構成されたコンピュータ可読命令を含んでいるコンピュータ可読媒体が提供される。
【0013】
さらなる態様によれば、制御可能なテンポを有するようにアレンジされたオーディオ出力を形成するための複数のオーディオコンポーネントを含むデータを提供するための適応型メディアファイルであって、複数のオーディオコンポーネントのうちの第1のオーディオコンポーネントに関連付けられた第1のオーディオデータと、第1のオーディオデータの再生テンポ範囲と、複数のオーディオコンポーネントのうちの第1のオーディオコンポーネントに関連付けられた第2のオーディオデータと、第2のオーディオデータの再生テンポ範囲とを含んでおり、第2のオーディオデータのテンポ範囲は、第1のオーディオデータのテンポ範囲とは異なり、第1のオーディオデータ、第2のオーディオデータ、およびそれぞれの再生テンポ範囲は、互いに関連付けられている、適応型メディアファイルが提供される。
【0014】
場合によっては、第1のオーディオデータ、第2のオーディオデータ、およびそれぞれの再生テンポ範囲は、ファイル構造内に位置することによって関連付けられている。場合によっては、第1のオーディオデータ、第2のオーディオデータ、およびそれぞれの再生テンポ範囲は、第1および第2のオーディオデータに関連付けられたメタデータにおける参照によって関連付けられている。場合によっては、第1のオーディオデータの再生テンポ範囲は、第1のオーディオデータのメタデータに組み込まれる。
【0015】
場合によっては、第1のオーディオデータの再生テンポ範囲は、下側テンポおよび上側テンポを表すデータを提供する。場合によっては、再生時に、第1のオーディオデータは、再生テンポが下側テンポより上かつ上側テンポよりも下、または下側テンポ以上かつ上側テンポ以下のいずれかであるときに、オーディオ出力の一部として提示されるようにアレンジされる。場合によっては、第1のオーディオデータは、或るテンポを有し、下側テンポおよび上側テンポを表すデータは、実際の上側テンポおよび実際の下側テンポ、第1のオーディオデータのテンポを上回る毎分のビート数および下回る毎分のビート数、あるいはテンポをテンポの上方または下方のいずれかにずらすことができる量のうちの1つである。場合によっては、第1のオーディオデータのテンポ範囲は、第1のオーディオデータがタイムストレッチされるべき最大および最小テンポを定める。
【0016】
場合によっては、第1のオーディオデータおよび第2のオーディオデータは、第1および第2のオーディオファイルである、あるいは第1および第2のオーディオファイルから導出される。場合によっては、互いに関連付けられた第1のオーディオデータ、第2のオーディオデータ、およびそれぞれの再生テンポ範囲は、適応型メディアファイルに含まれる1つ以上の構成ファイルにおいて特定される。場合によっては、複数のオーディオコンポーネントのうちの第1のオーディオコンポーネントに関連付けられた第1のオーディオデータは、適応型メディアファイル内で特定される。場合によっては、適応型メディアファイルは、オーディオファイルまたはビデオフレームデータと関連のオーディオデータとを含むビデオファイルの一方である。
【0017】
本発明の方法によれば、入力された再生テンポに基づいて代替的に使用することができる複数のオーディオデータセットがオーディオチャネルに関連付けられるため、オーディオデータセットについて、使用され得る再生テンポの範囲を縮小することができる。既存の技術では、ユーザは、例えばタイムストレッチ処理を使用して、広い再生テンポの区間にわたって変換を行わなければならない。本発明の技術的解決策によれば、同じオーディオチャネル用に複数のオーディオデータセットを定めることができ、各々のオーディオデータセットが、該当の小さな再生テンポ範囲についてのみ使用される。ユーザによって選択された更新後の再生テンポが別の再生テンポ範囲に入る場合、本発明のオーディオミキシングの技術的解決策は、別のオーディオデータセットの使用を開始させることによって、例えばオーディオデータセットの「過度のタイムストレッチ」を低減する。
【0018】
本発明の方法は、アプリケーションによってモバイルデバイス上に実現される音楽コントローラなどの電子装置を使用して実施され得る。電子装置は、コンピュータでもよく、サウンドミキシングの技術的は、本明細書で説明されるインタフェースを介して制御可能であってよい。本発明の技術的解決策を、オーディオミキシングコントローラ、再生テンポコントローラ、または単にオーディオミキサと称することができる。
【図面の簡単な説明】
【0019】
一構成を、添付の図面を参照することによって、あくまでも例として、さらに詳細に説明する。
【
図1】本発明の方法の構成を実施するように構成された電子装置の概略図である。
【
図2】電子装置、リモート装置、およびオーディオ出力装置を含む本発明の方法の別の構成の概略図である。
【
図3】本発明のオーディオコントローラの別の構成による典型的なグラフィカルユーザインタフェース(GUI)である。
【
図4.1】本発明のオーディオコントローラの別の構成によるGUIの例である。
【
図4.2】本発明のオーディオコントローラの別の構成によるGUIの例である。
【
図4.3】本発明のオーディオコントローラの別の構成によるGUIの例である。
【
図5.1】本発明の方法の種々の構成による本発明のオーディオコントローラによって実行される一般的な動作ステップを示すフロー図である。
【
図5.2】本発明の方法の種々の構成による本発明のオーディオコントローラによって実行される一般的な動作ステップを示すフロー図である。
【
図6】コンピューティングデバイスの一実施例のブロック図を示している。
【発明を実施するための形態】
【0020】
本明細書において、用語「提示」または「レンダリング」は、オーディオデータセット、音楽トラック、オーディオチャネルなどをユーザにとって聴き取り可能にする行為を指す。
【0021】
曲などのオーディオトラックは、一般に、1つ以上のオーディオコンポーネントを含む。各々のオーディオコンポーネントは、例えば異なる楽器、ボーカルなど、オーディオトラックの異なる部分に対応する。オーディオトラックを生成するための適応型メディアファイルの図を、
図3において見ることができ、
図3は、縦方向に延びるバー要素によって表された10個のオーディオコンポーネントを有する適応型メディアファイルを示している。各々のオーディオコンポーネントは、それぞれのオーディオチャネルに対応することができ、あるいは2つ以上のオーディオデータセットからなるオーディオコンポーネントが、2つ以上のオーディオチャネルに広がってもよい。例えば、
図3において、「ピアノ低(Piano low)」のオーディオコンポーネントは、1つのオーディオチャネルに対応し、「ピアノ高(Piano high)」のオーディオコンポーネントは、2つのオーディオチャネルに対応している。トラックの再生テンポは、縦軸に示される。
【0022】
各々のオーディオコンポーネントは、バー要素の異なるセクションによって表される1つ以上のオーディオデータセットを有する。各セクションは、再生テンポ範囲に対応する。すなわち、セクションは、縦方向において重ならず、それぞれ縦方向における第1および第2の境界で区切られている。「ピアノ低」のオーディオチャネルに目を向けると、3つのセクション311、312、および313がそれぞれ再生テンポ範囲60~100bpm、100~170bpm、および170~240bpmに関連付けられており、値はbpmで表されている。「ハープ:シンセ(Harp:Synths)」オーディオチャネルは、再生テンポ範囲80~139bpmおよび139~240bpmにそれぞれ関連付けられた2つのセクション301および302を含んでいる。再生テンポ範囲を、所与のオーディオコンポーネントについて、或るオーディオデータセットを使用することができる再生テンポの範囲と理解することができる。再生テンポ範囲は、隣接していてもよく、すなわち、第1の再生テンポ範囲の最高レベルが第2の再生テンポ範囲の最低レベルに相当してよい。その場合、2つの連続した再生テンポ範囲は、共通の再生テンポ境界を共有する。
【0023】
オーディオデータセットまたは「ステム」と、それらのそれぞれの再生テンポ範囲とを、それらをファイル構造内に配置し、あるいはオーディオデータセットまたはステムに関連付けられたメタデータを参照することによって、関連付けることができる。所与のオーディオデータセットの再生テンポ範囲を、オーディオデータセットのメタデータに組み込むことができる。あるいは、オーディオデータセットが、1つ以上のオーディオファイルに含まれてよく、構成ファイルが、後述されるように、再生テンポ範囲およびデータセット間の移行特性を含むデータセット間の関係などのファイルの関連詳細を定義することができる。
【0024】
より一般的には、音楽トラックを形成する各々のオーディオコンポーネントは、複数のオーディオデータセットに関連付けられ、各々のオーディオデータセット自体が、再生テンポ範囲に関連付けられる。本発明の技術的解決策は、再生テンポを制御して音楽トラックをオーディオ出力装置に提示することを可能にするので、再生テンポの選択が、選択された再生テンポが属する再生テンポ範囲に基づいてオーディオコンポーネントについてどのオーディオデータセットが選択されるかを決定する。再生テンポ範囲を、オーディオコンポーネントについて、或るオーディオデータセットを使用することができる再生テンポの範囲と理解することができる。
【0025】
再生時、選択された再生テンポが或るオーディオデータセットの低い方のテンポを上回り、かつ高い方のテンポを下回る場合、そのオーディオデータセットを、オーディオ出力の一部として提示されるようにアレンジすることができる。あるいは、選択された再生テンポが低い方のテンポ以上、かつ高い方のテンポ以下である場合に、オーディオデータセットをオーディオ出力の一部として提示されるようにアレンジすることができる。
【0026】
オーディオデータセットを録音する際に、ミュージシャンは、必要な数のオーディオデータセットを録音するために、いくつかのテンポで楽器において同じ一連の音符を演奏する。同様に、歌手は、音声オーディオコンポーネントのための複数のオーディオデータセットを定めるために、同じメロディを異なる速度で歌う。
図3の例における異なるテンポは、70、120、および172bpmである。これらの所定の再生テンポ値は、それぞれのオーディオデータセットのいわゆるネイティブ再生テンポに相当する。それらは、オーディオデータセットの録音時に意図されたオーディオデータセットの提示の再生テンポ(例えば、音声、楽器、ビートなどの元々のテンポ)を定める。オーディオデータセットのネイティブ再生テンポは、このオーディオデータセットの再生テンポ範囲に含まれる。
【0027】
オーディオデータセットの再生テンポ範囲を、そのネイティブテンポから計算することができる。例えば、範囲を、オーディオデータセットのネイティブテンポを上回る毎分ビート数およびネイティブテンポを下回る毎分ビート数として定義することができる。第1のオーディオデータのテンポ範囲は、再生時に第1のオーディオデータがタイムストレッチされるべき最大および最小テンポを定めることができる。
【0028】
各々のオーディオデータセットに、複数のオーディオコンポーネントのうちのそれぞれのオーディオコンポーネントを関連付けることができる。これを、適応型メディアファイルにおいて特定することができる。適応型メディアファイルは、オーディオデータセットまたはビデオフレームデータと関連のオーディオデータとを含むビデオファイルのうちの1つであってよい。
【0029】
再生テンポ範囲を、ユーザが、自身が録音を使用したいと望む再生テンポの範囲についての自身の認識に基づいて定義することができる。例えば、ユーザが上述のピアノ低について3つのオーディオデータセットを3つのネイティブ速度70、120、および172BPMで録音する場合、ユーザは、3つのテンポ範囲311、312、および313をそれぞれ関連付ける。ユーザが再生テンポを選択するたびに、本発明の技術的解決策は、各々のオーディオコンポーネントが、選択された再生テンポを含む再生テンポ範囲に対応するオーディオデータセットを選択することを可能にする。その趣旨で、
図3のGUIの左側は、オーディオチャネルのバー要素と同じ方向に延びる追加のバー要素315を示している。この追加のバー要素を、カーソルグラフィック要素316における入力を介して音楽トラックを提示するための再生テンポを設定するためのカーソルバー315と理解することができる。カーソル要素316は、カーソルバー315におけるユーザ選択に対応するBPM値を表示するためのラベルを提示することができる。
図3の例のように120BPMの再生テンポが選択された場合、ピアノ低については範囲312に対応するオーディオデータセットが選択され、ハープについては範囲301のオーディオデータセットが選択され、音楽トラックを提示するためのそれらのそれぞれのオーディオコンポーネントに割り当てられる。
【0030】
縦方向に延びる多数のバー要素ゆえに、選択されたテンポ範囲の読み取りがユーザにとって困難になる可能性があるため、本発明のシステムは、すべての縦方向のバー要素を横切るようにGUIの第2の方向に延びる別のグラフィック要素320を提案する。
図3の例において、縦方向の10個のバー要素が提案されている一方で、BPMレベルは、複数のバー要素を横切って横方向に設定される。しかしながら、ユーザは、カーソル316を動かしてすべてのオーディオチャネルを横方向に横断ステップ再生テンポを選択するときに、どの再生テンポ範囲が選択されたかについて確証を持てない可能性がある。これは、2つのシンセサイザについてのオーディオチャネルのように、グラフィカルバー要素がインタフェースの反対側に位置するオーディオコンポーネントに特に当てはまる。グラフィック要素320は、第1の方向、すなわちカーソルバーおよびバー要素の方向に移動可能であり、その動きは、例えばカーソルバー315における入力によってもたらされる。再生テンポ範囲の選択バーとして理解することができるグラフィック要素320は、オーディオコンポーネントのすべてのバーを横切って横方向に延びる。結果として、ユーザは、どのテンポ範囲が選択されるかについての明確な視覚的表示を得る。
【0031】
本発明のシステムにおいては、さらなるGUIフィードバックが提案される。このGUIフィードバックの例示を、
図4.1~
図4.3に見ることができる。例えばオーディオミキサ装置などの電子装置のGUIを制御するための本発明の技術的解決策において、装置のプロセッサは、カーソルバー415のカーソル416(グラフィック要素)を第1の方向に移動させるためのユーザ入力に応答して、
・カーソル416の新たな位置を決定し、
・各々のバー要素について、グラフィック要素または選択バー420と交差するサブ部分を決定し、
・選択バー420と交差するサブ部分を第1のレンダリング方法を使用してレンダリングすることによって有効であるとマーキングし、
・残りのサブ部分を第1のレンダリング方法とは異なる第2のレンダリング方法を使用してレンダリングすることによって無効であるとマーキングする
ように構成される。
【0032】
異なるレンダリング方法は、以下のように、選択された再生テンポ範囲に関するサブ部分要素を強調することからなってよい。
図4.1のGUIは、オーディオチャネルと同じ数の11個の縦方向のバー要素を有する開始時インタフェースを示している。再生はまだ開始されていないため、再生テンポ範囲は強調されていない。種々のオーディオチャネルのすべてのテンポ範囲が示されており、選択バー420が、カーソルバー415上の147BPMの既定の開始時テンポから示されている。ユーザが、カーソル要素415によって運ばれるラベル上に示されるように112BPMという選択値へとカーソルバー415上でカーソル要素416を下方にスライドさせるための入力をもたらすとき、プロセッサは、どの再生テンポ範囲が各々のオーディオコンポーネントにおいて112BPMという選択された再生テンポに用意されているかをチェックする。
図4.2の図において、これらの再生テンポ範囲に対応するサブ部分要素421は、ここでは無地の形態であるが、あるいは強い色での強調表示であってよい第1のレンダリング方法でレンダリングされる一方で、選択された再生テンポを含まない残りの再生テンポ範囲は、別の第2のレンダリング方法でレンダリングされる。これが、
図4.2においてはサブ部分422などのハッチングされたサブ部分で示されているが、あるいは、淡色表示のサブ部分としてもよい。本発明の方法のさらなる構成においては、テンポ範囲がいかなるオーディオデータセットにも割り当てられていないときにバー要素が不連続性を示すことがあり得るため、バー要素のうちの再生テンポ範囲が定められていない部分も、同じ第2のレンダリング方法でレンダリングすることができる。あるいは、それらを、サブ部分423において見られるように、ユーザによって容易に無視されるように、より狭いハッチングまたはより淡色の表示など、第3のレンダリング方法でレンダリングしてもよい。本発明の異なるレンダリング方法は、どのサブ部分が有効であるか、すなわちオーディオコンポーネントに割り当てられた対応するオーディオデータセットを有するか、およびどのサブパートが無効であるか、すなわち現時点においてユーザが目標とする生成テンポ範囲に対応しない対応するオーディオデータセットを有するかについて、明確なフィードバックをユーザに与えることを可能にする。
【0033】
本発明のGUIの他の構成が
図4.3に示されており、ここでは、選択された再生テンポは、今や148BPMである。このとき、7つのサブ部分が有効として強調表示されており、なぜならば、いくつかの再生テンポ範囲は、選択された再生テンポがそれらの上限よりも大きい値を有するがゆえにもはや有効でないからである。この例では、再生テンポ範囲は、ほとんどのオーディオコンポーネントにおいて連続的であり、ユーザが求めるBPMが大きくなるにつれて、上側の値の範囲が有効になる。
【0034】
この例では、移動可能なグラフィック要素としてカーソルを提案しているが、別の移動可能なグラフィック要素を使用する他の例においても、本発明の教示は有益であろう。さらに、オーディオミキサの文脈における例示は、本発明のGUIについて可能な一用途にすぎない。あるいは、多成分変数についての制御にも本発明の教示は有益であり得る。実際、第1の方向に延びる各々のバー要素が成分の値を表し、バー要素が値の区間を表す1つ以上のサブ部分を含む場合に、本発明のGUIは、選択バーが交差する有効区間の容易な選択を可能にする。値の各々の区間に、例えばファイル、機能、固有の識別子、または値を割り当てることができ、本発明のインタフェースは、他の方法では制御がより複雑になるであろう成分値の多数のバーをインタフェースが含むときに、複数の有効区間についての容易な同時フィードバックを可能にする。
【0035】
オーディオミキサまたはコントローラを実現する電子装置に再び目を向けると、そのような装置の典型的なアセンブリが、
図1に示されている。本発明のオーディオミキサは、ここではタッチ感応インタフェースまたはディスプレイ125を有するモバイルデバイスとして示されている電子装置100上で実現され得る。センサ120などの他の感知要素を、例えば後述される再生テンポなどの入力を定めるために設けることができる。モバイルデバイス100は、本明細書に記載の方法を実行するためにコンピュータプログラムの命令を実行するためのプロセッサ110をさらに備える。モバイルデバイス100は、ネットワークを介して無線または有線でデータを交換するための受信/送信ユニット130をさらに備えることができる。交換されるデータは、オーディオデータまたは本発明のオーディオミキシングの技術的解決策を実施するために必要な他の種類のデータであってよい。さらに、プロセッサ10は、タッチ感応ディスプレイ125またはセンサ130を介して受信した再生テンポに基づいて、複数のオーディオデータセットからオーディオデータセットを選択するための選択ユニット140を制御する。タイムストレッチユニット140を、選択されたオーディオデータセットについて、ネイティブの再生テンポとは異なる受信した再生テンポへのタイムストレッチを必要に応じて実施するために用意することができる。さらに、音楽トラックを提示ユニット170を使用してローカルな出力装置(
図1には示されていないが、スピーカまたはジャック経由など)または遠方のオーディオ出力装置(例えば、
図2のスピーカ230)において提示できるように、それぞれのオーディオコンポーネントに割り当てられた異なるオーディオデータセットをミキシングするために、ミキシングユニットが利用可能である。オーディオコンポーネントを、プロセッサ110にとって対話可能なデバイスのメモリに格納することができる。あるいは、オーディオデータセットは、遠方に格納され、ネットワークを介した電子装置100へのストリーミングおよび受信/送信ユニット130を介した受信を通じて利用可能であってよい。
【0036】
本発明のオーディオミキサは、全体が電子装置100上で実現されても、
図2に示されるようなクライアント/サーバの関係によって可能にされてもよい。実際、
図2は、本発明の技術的解決策の他の例を示している。ユーザインタフェース210を備えるオーディオミキサ200が、音楽トラックの再生テンポを受信するようにアレンジされる。再生テンポを、ユーザインタフェース210を介して受信することができ、あるいは変位のリズムを計算できるように、ジャイロスコープ、加速度計、または位置を測定するためのGPSチップなどの感知ユニットを介して受信することができる。これは、ユーザがモバイルデバイス上で使用可能にされたオーディオミキサまたはコントローラ200を携帯しながらジョギングしている場合であり得る。ユーザの走るペースが、ユーザが接続されたヘッドフォンを通して聞いている音楽の同期および制御のためのリズムを決定する。
【0037】
この構成において、オーディオミキサ200は、再生テンポの入力を取得するだけであり、音楽は、遠方のサーバ220からストリーミングされる。より正確には、オーディオコンポーネントの管理、ならびに関連の再生テンポ範囲および対応するオーディオデータセットの選択は、オーディオデータセットを格納したデータベース(
図2には示さず)へのアクセスも管理する遠方のサーバ220で実行されてよい。オーディオ出力装置は、モバイルデバイスのジャック出力が使用されていないときにサーバまたはオーディオミキサ200にとって対話す可能なスピーカ230として示されている。
【0038】
次に、本発明のオーディオミキシングの方法を、この方法を実行するための種々の動作またはステップのフローチャートを示す
図5に関連して説明する。
【0039】
図5.1は、第1の構成による本発明の方法の典型的なフローチャートである。この方法は、
図1の電子装置100のプロセッサによって実行されてよく、あるいはサーバ410などの遠方の電子装置のプロセッサによって実行されてよい。開始ステップ500において、ひとたび音楽トラックが選択されると、その音楽トラックのための種々のオーディオデータセットが、ユーザ装置100のメモリ120からロードされる。あるいは、オーディオデータセットは、任意の利用可能な標準オーディオフォーマットにて無線でストリーミングされても、遠方のメモリからダウンロードされてもよい。
【0040】
上述のように、各々のオーディオデータセットは、オーディオコンポーネントに対応する。各々のコンポーネントは、楽器、ビート、または1つ以上の声など、音楽トラックの一部に対応する。各々のコンポーネントを、単一のオーディオチャネルに割り当てることができ、あるいはコンポーネントがいくつかのオーディオデータセットからなる場合には、いくつかのチャネルに割り当てることができる。各々のオーディオデータは、再生テンポ範囲に関連付けられている。所与のコンポーネントについて2つ以上のオーディオデータセットがロードされる場合、各々のオーディオデータセットは、異なるテンポ範囲をカバーする。オーディオデータセットは、例えば録音時のテンポなど、提示されるように意図された元々のテンポに対応するネイティブ再生テンポにさらに関連付けられてよい。
【0041】
再生テンポ範囲に関連付けられたオーディオデータセットは、以下ではステムとも呼ばれる。ステムは、
図3において、グラフィカルバー要素の任意のサブ部分に対応する。ユーザは、本発明のオーディオミキサを開始するときに、ステムについてタイムストレッチを有効にするか、あるいは無効にするかを選択することができる。タイムストレッチを無効にすると、再生テンポ範囲において選択された再生テンポが、オーディオデータセットの提示に影響を及ぼすことがない。タイムストレッチは、曲が再生テンポの変更以外では耳にとって「おなじみ」のままであるように、ピッチに過度に影響を及ぼすことなくオーディオ信号の速度または持続時間を変更する処理である。
【0042】
最初に元々の79BPMで録音およびミキシングされ、別のDJによって65BPMというより低い再生テンポでミキシングされ、さらに79BPMという元々のテンポおよび95BPMというより速いテンポで再度ミキシングされた曲を考える。3つの異なる音楽トラックの生成は、提案された再生テンポで元々のアレンジを録音すること、あるいは種々のタイムストレッチ技術または曲を提示することができる再生テンポを変更するための他の技術を使用してミキシングを行うことのいずれかによることができる。曲が他の1ダースのオーディオコンポーネントと共に利用可能である場合、ユーザは、各々のオーディオコンポーネントおよび3つのアレンジの各々について、65、79、および95BPMという3つのそれぞれのネイティブテンポの周囲の変化する振幅の再生テンポ範囲を有する12*3=36個のファイルを生成することができる。このようなオーディオコンポーネントの生成を、
図3のGUIを通じて見ることができる。
【0043】
オーディオコンポーネントは、今や複数のオーディオデータセットおよびそれらのそれぞれの再生テンポ範囲ならびに当初に提示されるように意図されたネイティブ再生テンポに関連付けられる。
【0044】
図5.1の例において、タイムストレッチは実行されていない。これは、例えば、前述のタイムストレッチの選択肢を無効にすることによって達成できる。あるいは、ユーザは、再生テンポの変化に関連するあらゆる副作用を破棄することを単に選択することができる。
【0045】
さらなるステップ510において、プロセッサ110は、例えばランニングの状況において上述した方法のうちの1つにて、音楽トラックを提示するための再生テンポを受信する。ユーザが再生テンポを入力するたびに、本発明の技術的解決策は、各々のオーディオ成分について入力された再生テンポを含む再生テンポ範囲を有するオーディオデータセットの選択を可能にする。次に、ステップ520~550を、第1のオーディオコンポーネントについて一般的に説明する。
【0046】
ステップ520において、プロセッサ110は、オーディオコンポーネントについて、受信した再生テンポを含む再生テンポ範囲を有するオーディオデータのセットが存在するか否かを判定する。存在する場合、さらなるステップ530において、受信した再生テンポを含む再生テンポ範囲に関連付けられたオーディオデータセットが選択される。次のステップ540において、プロセッサは、後のステップ560においてユーザ装置100のオーディオ出力160に音楽トラックを提示するために、選択されたオーディオデータセットを第1のオーディオコンポーネントに割り当てる。
【0047】
音楽トラックは、第1のオーディオコンポーネントと共に複数のオーディオコンポーネントを形成する1つ以上の追加のオーディオコンポーネントを含むため、音楽トラックの提示は、ステップ550において複数のオーディオコンポーネントをミキシングすることを含む。第1のオーディオコンポーネントと同様に、各々のコンポーネントは、少なくとも1つのオーディオデータセットに関連付けられ、各々のオーディオデータセットは、再生テンポ範囲に関連付けられる。第1のコンポーネントと同様に、第1のコンポーネントについてのステップ520~550が、
図5.1に第2のオーディオコンポーネントについてステップ522~552で示されているように、他のコンポーネントについて繰り返される。換言すると、各々の追加のコンポーネントまたは現在のオーディオコンポーネントについて、
・所与のオーディオコンポーネントに関連付けられた複数のオーディオデータセットから、受信した再生テンポを含む再生テンポ範囲に関連付けられたオーディオデータセットを特定および選択するステップと、
・ユーザ装置のオーディオ出力160における音楽トラックの提示のために、選択されたオーディオデータセットを所与のオーディオコンポーネントに割り当てるステップと
が繰り返される。
【0048】
ユーザは、トラック内の任意の位置で再生テンポを変更することができる。ステップ570において新たな再生テンポが受信された(ステップ570に対する答えが「はい」である)場合、プロセスはステップ510に戻り、各々のオーディオコンポーネントの再生テンポ範囲が更新され、したがって必要に応じてオーディオデータセットが変更される。本発明の技術的解決策において、所与のオーディオコンポーネントは、隣接していて共通の再生テンポ境界を共有することができる2つの連続した再生テンポ範囲を含むことができる。入力された再生テンポが速くなることで、この共通の再生テンポ境界を超えると、選択されるオーディオデータセットが変化する。この状況において、再生テンポの更新により、プロセッサ110は、現時点において選択されているオーディオデータセットを「オフ」にし、更新された再生テンポが属する再生テンポ範囲に関連付けられたオーディオデータセットを「オン」にする。
【0049】
図3の例では、再生テンポが120bpmから100bpmに変更されると、「ピアノ高」オーディオコンポーネントの104~171bpmの範囲の部分が停止される。「シンセ&ハープ(Synths & Harp)」オーディオコンポーネントの60~115bpmの範囲の部分が開始される。
【0050】
図3の例における「ピアノ低」のオーディオチャネルの場合のように、新たな再生テンポがオーディオコンポーネントの2つのオーディオデータセット間の共有の境界に位置する場合、プロセッサは、フェードパラメータを使用して2つの隣接する部分の間のクロスフェードを達成する。フェードパラメータは、再生テンポがしきい値bpm値を横切った直後にフェードを開始するか、あるいは次の小節の最初のビートまで開始を遅らせるかを示すパラメータを含む。さらに、フェードパラメータは、どの程度速く、またはゆっくりとフェードを発生させるべきかを指定するパラメータを含む。
【0051】
ステップ570において更新された再生テンポが受信されない(ステップ570に対する答えが「いいえ」である)場合、プロセスは、ステップ560でミキシングされた現在のオーディオデータセットによる音楽トラックの提示を続ける。
【0052】
入力された再生テンポがオーディオデータセットのネイティブなテンポに正確には一致しないが、そのオーディオデータセットのテンポ範囲内にある場合、ユーザは、本発明のオーディオミキシングの開始時にオーディオデータセットのタイムストレッチを有効にすることを選択し得る。タイムストレッチは、曲が再生テンポの変更以外では耳にとって「おなじみ」のままであるように、ピッチに影響を及ぼすことなくオーディオ信号の速度または持続時間を変更する処理である。
図5.1の例のようにタイムストレッチが無効にあれたとき、再生テンポ範囲において選択されて入力された再生テンポが、オーディオデータセットの提示に影響を及ぼすことはない。
【0053】
図5.2は、タイムストレッチがユーザによって有効にされた本発明のオーディオミキシングの技術的解決策の一例を示している。このさらなる構成におけるステップは、
図5.1の割り当てるステップ540および542が、ステップ541および543にそれぞれ置き換えられていることを除いて、
図5.1に示した構成のステップと同様である。
【0054】
ステップ541および543は、所与のオーディオデータセットについて、入力された再生テンポがオーディオデータセットのネイティブな再生テンポと異なる場合に実行されるタイムストレッチ処理をそれぞれ説明する。より正確には、現時点の選択されたオーディオデータセットについて、ユーザ装置100のプロセッサ110は、選択されたオーディオデータセットのタイムストレッチ処理を実行し、タイムストレッチ処理は、選択されたオーディオデータセットを変換して、入力された再生テンポおよび制御されたピッチで提示されるように意図された修正後オーディオデータセットを生成することを含む。次いで、修正後オーディオデータセットが、選択されたオーディオデータセットの代わりに(あるいは、選択されたオーディオデータセットとして)オーディオコンポーネントへの割り当てに使用される。
【0055】
図3の例においては、95bpmの再生テンポにおいて、オーディオミキサは、「ピアノ低(Piano low)」チャネル、第1の「ストリングス(Strings)」チャネル、「ハープ:シンセ(Harp:Synths)」チャネル、および「シンセ&ハープ(Synths & Harp)」チャネルのみを選択する。これらのコンポーネントのオーディオデータセットは、それぞれ70bpm、70bpm、120bpm、および70bpmのネイティブ再生テンポを有する。したがって、オーディオデータセットは、120bpmから95bpmへと下方にストレッチされる「ハープ:シンセ(Harp:Synths)」のオーディオデータセットを除いて、70bpmから95bpmにストレッチされる。
【0056】
ステップ541および543において、オーディオデータセットをそのネイティブ再生テンポからタイムストレッチして、受信した再生テンポで提示されるように意図された修正後オーディオデータセットを生成するために、種々の技術が当業者にとって利用可能である。同様に、音楽トラックのアレンジをさらにもっと耳に心地よいものにするために、
図5.2のミキシングステップ551に関して、多数の技術が利用可能である。これらの技術的解決策は、本明細書の範囲を超える。しかしながら、依然として本発明の技術的解決策において、適切なタイムストレッチにとって大きすぎる可能性がある再生テンポ範囲の影響を制限することによって、改善された再生テンポコントローラがユーザに提案される。
【0057】
選択されたオーディオデータのセットのミキシングを含む
図5.1のミキシングステップ550は、
図5.2のこのさらなる構成において、修正後オーディオデータセットがミキシングされるミキシングステップ551で置き換えられる。ひとたびミキシングされると、修正後オーディオデータセットは、ステップ551において、受信した再生テンポで提示されるように意図された音楽トラックにミキシングされ、本発明の方法は、ステップ560において例えばユーザ装置100のオーディオ出力160において音楽トラックを提示することによって続けられる。
図5.1の構成と同様に、プロセッサは、ステップ570において、新たな再生テンポ値が受信されたかどうかを監視する。
【0058】
新たな再生テンポが受信されない(ステップ570に対する答えが「いいえ」である)場合、本発明の方法はステップ560に進み、オーディオ出力160に音楽を提示するために種々のオーディオコンポーネントをミキシングする。
【0059】
更新された再生テンポが受信された(ステップ570に対する答えが「はい」である)場合、プロセッサ110は、更新された再生テンポを新たな現在の再生テンポとみなす。次いで、すでに説明した
図5.2のステップ510~560が繰り返される。この場合、2つのシナリオが展開される可能性がある。
【0060】
第1のシナリオにおいては、更新された再生テンポが、以前の再生テンポと同じ再生テンポ範囲に含まれるため、選択されたオーディオデータセットを変更する必要がない。代わりに、更新された再生テンポは、タイムストレッチングに影響を及ぼし、修正後オーディオデータセットの更新が必要である。実際、以前の再生テンポと同じ選択されたオーディオデータセットを使用して、更新された再生テンポで提示されるように意図された更新された修正後オーディオデータセットが、以前の修正後オーディオデータセットをタイムストレッチすることによって生成され、オーディオコンポーネントに割り当てられた以前の修正後オーディオデータセットが、更新された修正後オーディオデータセットで置き換えられる。
【0061】
第2のシナリオにおいては、更新された再生テンポが、異なる再生テンポ範囲に含まれるため、選択されたオーディオデータセットを変更する必要がある。これは、更新された生成テンポが、例えば2つの連続した再生テンポ範囲の間の再生テンポ境界を横切ると発生する。したがって、プロセッサ110は、修正後オーディオデータセットをオフにし、新たな再生テンポに対応する再生テンポ範囲を有するオーディオデータセットが存在する場合、新たな再生テンポ範囲に関連付けられたオーディオデータセットをオンにする。これは、更新された再生テンポと新たに選択されたオーディオデータセットのネイティブ再生テンポとの間の差を考慮するために必要とされる可能性があるタイムストレッチを実行する前に行われる。
【0062】
オーディオコンポーネントについてオーディオデータセットの変化が生じるとき、音楽トラックのレンダリングが、例えばオーディオデータセットの突然の変化またはビートの欠落によって影響を受ける可能性がある。この状況に対処するための種々の技術的解決策が、以下に提示される。それらは、タイムストレッチが含まれる場合の
図5.2のオーディオミキシングの技術的解決策の構成に関連して説明されるが、タイムストレッチが使用されず、あるいは無効にされる場合にも使用可能である。
【0063】
更新された再生テンポが、例えば音楽トラックの提示から2分など、第1の瞬間に受信されると仮定する。このとき、オーディオコンポーネントについて更新された修正後オーディオデータセットを使用する音楽トラックの提示は、オーディオデータセットの変更にかかわらずトラックの提示をギャップレスまたは連続的にするために第1の瞬間を考慮する。
【0064】
第1の瞬間は、いつ再生テンポしきい値を横切るかを判断するために使用され、すなわち、しきい値を横切ったオーディオコンポーネント(例えば、
図3の例における区間311および312の間の100bpmの再生テンポにおけるピアノ低のチャネル)について以前のオーディオデータセットをオフにし、代わりに使用される更新された修正後オーディオデータセットをオンにするタイミングを判断するために使用される。
【0065】
本発明の方法のさらなる構成において、ユーザは、以前の修正後オーディオデータセットと更新された修正後オーディオデータセットとの間のクロスフェードを定めることができ、クロスフェードは、第1の瞬間の後に開始される。結果として、移行を和らげるために、以前の修正後オーディオデータセットのオフを、予め設定された継続時間にわたって実行することができる。
【0066】
さらに、更新されて受信された再生テンポがテンポ範囲の変化を引き起こすとき、更新された修正後オーディオデータセットを使用する音楽トラックを、第1の瞬間の後の遅延を使用して提示することができる。遅延を、完了したビートの数に関して定めることができる。音楽トラックの提示の速度を定める再生テンポを、音楽トラックのビート間の時間間隔とみなすことができる。遅延は、以前の再生テンポまたは更新された再生テンポのいずれかを使用して測定される予め設定された完了ビート数の関数であってよい。
【0067】
さらに、1つのオーディオデータセットから別のオーディオデータセットへの移行は、各々のオーディオデータセットに関する音量を制御することができる。再び
図3を参照すると、オーディオデータセットを表す各々のセクションは、横方向に延びる音量曲線に関連付けられている。セクション301または311に目を向けると、セクションの左側が、オーディオデータセットの音量について例えば0という最小値を定める一方で、右側の縁は、例えば1という最大値を定める。セクション301および311から分かるように、例えば区間[0-1]または任意の他の値の範囲に含まれる音量値を、再生テンポ範囲の各々の再生テンポについて定めることができる。音量値は、テンポ範囲にわたって音量曲線を定め、これをオーディオデータセットに対するさらなる制御として使用することができる。それを、再生テンポしきい値におけるオーディオデータセット間の移行の状況において、第1の再生テンポ範囲の上限に近づくにつれて音量を下げ、第2の再生テンポ範囲の下限から離れてより高い生成テンポ値に移動するときに音量を上げることによって、好都合に使用することができる。
【0068】
さらに、音量曲線を、とりわけ第1のオーディオデータセットに隣接する、他のオーディオデータセットが利用可能ではない場合に、第1のオーディオデータセットの再生テンポ範囲の端において第1のオーディオデータセットの音量を下げるために使用することもできる。
【0069】
本発明のオーディオコントローラは、テンポ範囲に制限を受けることなく、かつ特定のテンポでパフォーマンスを低下させることなく、適応的な音楽の生成を可能にし、音楽トラックの再生テンポをリアルタイムでトラックの任意の時点においてユーザ/聞き手に変更させる。本発明のオーディオミキシングの技術的解決策を使用して、聞き手は、熟練者またはリミックスの専門家を必要とせずに、適応的なトラックを任意のテンポでより良く聞こえるようにすることができる。
【0070】
それ自体も興味深いが、この種の適応的な音楽は、特定の活動に特に適する。例えば、モバイルランニングのアプリケーションが、聞き手のランニングの速度に合わせて適応的なトラックのテンポを自動的に調整することができ、あるいはインターバルトレーニングのセッションにおいて運動中の適切な時点で適応的なトラックのテンポを変更することによって聴取者を案内することができる。スキーのアプリケーションが、トラックの速度を、スキーヤーの速度に応じて、丘の頂上では低速かつグラインディング(grinding)にし、スキーヤーがより高速で滑り降りるほどより高速かつより活発にすることができる。ダンスパーティーにおいて、順番に音楽のテンポを制御することで、誰もが自身のビートに合わせて踊ることができる。ダンス教室において、インストラクターが遅いテンポで振り付けを説明し、ダンサーがステップに慣れるにつれて、インストラクターは音楽のスピードを上げるができる。等々。
【0071】
本開示において説明されるように、音楽トラックを適応的にするために、トラックは、ステムの集まりと、それらのステムのアレンジを再生テンポに合わせてどのように変化させるべきかについての説明とで構成される。任意の所与の再生テンポにおいて、アーティストは、再生すべきステムおよび再生すべきでないステム、再生開始時または再生終了時のステムの移行方法、ならびに各々のステムの相対的な音量を制御することができる。この制御は、
図3の典型的なGUI、ならびに例えばステムの再生テンポ範囲、ネイティブ再生テンポ、音量、タイムストレッチが有効であるか否かを変えることによる各々のサブ部分/ステムの特性のさらなる制御を使用して、容易に達成される。
【0072】
オーディオコントローラは、ステムをローカルストレージから単にインポートし、あるいは任意の利用可能な標準オーディオフォーマットにて無線でストリーミングする。
【0073】
図3に見られるように、色付きの各々の箱またはサブ部分は、トラック内の1つのステムを表し、箱は、オーディオコンポーネントに関連付けられたバー要素に縦方向にグループ化されている。
図3の例は、3つのピアノチャネルおよび5つのステムと、3つのストリングチャネルおよび3つのステムと、4つのハープ/ストリングチャネルおよび5つのステムとで構成されている。それぞれのステムは、3つの別々のネイティブテンポ、すなわち70、120、および172bpmのうちの1つで録音されている。
【0074】
各々のステムのテンポしきい値が、そのステムを再生すべき再生テンポ範囲をオーディオコントローラに伝える。ここで、特定の再生速度に関して、本発明のオーディオコントローラは、各々のオーディオコンポーネントについて再生する適切なステムセットを選択し、それぞれをネイティブの速度から再生速度にタイムストレッチし、結果をミキシングして聞き手へと再生する。例えば、(
図4.2のような)再生速度112bpmにおいて、オーディオミキサは、ミッドテンポのステムをすべて選択し、それらをネイティブの120bpmから112bpmの再生テンポにストレッチし、結果をミキシングして再生する。
【0075】
再び
図3に戻ると、再生速度85bpmにおいて、オーディオミキサは、ピアノ低チャネル、第1のストリング、ならびに第1および第2のハープ/シンセサイザのみを選択する。これらのステムは、120bpmから95bpmに下方にストレッチされる第1のハープ/シンセサイザを除いて、70bpmから95bpmにストレッチされる。
【0076】
聞き手は、トラック内の任意の位置で再生速度を変更することができる。ステムのテンポしきい値のうちの1つを横切ると、オーディオコントローラは、必要に応じてそのステムの再生を停止または開始する。すでに説明したように、移行がどのように生じるべきかを、例えばステムのクロスフェードを使用して指定することができる。
【0077】
本発明のオーディオコントローラは、雰囲気/ジャンル/感触/音/などが異なるテンポ範囲において可能な限り異なる場合に最良である適応的なリスニング体験を提供する。考え方は、オリジナルとは異なるテンポでの音楽トラックのリミックスに類似する。一般に、聞き手は、リミックスが単に異なるテンポでの元の再生のように聞こえることを望むのではなく、むしろリミックスについて新たなテンポに適した新たなジャンル/音を選ぶと考えられる。本発明のサウンドミキシングの技術的解決策を使用して、ユーザは、再生テンポの変化が滑らかかつ徐々に音楽トラックの特性全体も変化させるように、所与のオーディオコンポーネントに対して追加のステムを追加し、あるいはさまざまなステムを選択することができる。
【0078】
本発明の技術的解決策によれば、AdeleのHelloのような曲を、ゆっくりとしたテンポにおいては幻想的なバラードのように聞き、中間的な範囲においては陽気なヒップホップのトラックのように聞き、より速いテンポにおいてはEDMスタイルに切り替えることができる。
【0079】
本出願の出願人は、音楽トラックが、本発明の再生テンポ制御の技術的解決策を使用して、例えば60~240bpmおよびそれ以上などのきわめて広いテンポ範囲にわたって良好に聞こえることを見出した。これにより、低いBPMでのウォーキングから、毎分約140ステップでのランニング、典型的には毎分180ステップを保って走る長距離ランナー、および毎分200ステップをはるかに超えて生じる短距離走への移行が可能になる。聞き手にとって他の多数の活動は、これほど極端でないテンポのニーズにて音楽を適応させることを必要とするであろう。
【0080】
上記の説明は、オーディオデータを再生するシステムを論じているが、これらの原理が、オーディオを利用するあらゆるアプリケーションまたはメディアに当てはまることを、理解できるであろう。例えば、ビデオは、全体としてのビデオの構成部分として、ビデオフレームおよびオーディオデータを含む。このアプリケーションを、そのビデオのオーディオ部分に適用することができる。結果として、ランニング、スキー、または他のスポーツに関する有益なアプリケーションの多くを、ユーザがオーディオを聴き、また関連のビジュアルも見ることができるジムの環境において提供することができる。ユーザ入力の変化に応じてオーディオ要素のテンポを変えるという考え方は、ビデオフレームにも適用可能である。
【0081】
この文書を通して提供されるオーディオアプリケーションの例は、音楽に関連している。しかしながら、論じられたアプリケーションを、他の種類のオーディオにも適用できることを、理解できるであろう。例えば、これらの原理は、「左、右、左、右」などのリズムを有するランナーへの可聴指示を含むオーディオトラックに適用可能である。その場合、これらの指示を、テンポに関連する特性に応じて変化させることができる。
【0082】
さらに、電子装置の表示装置上に描かれるユーザインタフェース(UI)を制御するための方法も提供され、UIは、各々が互いに平行に第1の方向に延びており、複数のメディア要素を含んでおり、各メディアコンポーネントが再生動作モードにあるときに出力をもたらすべく組み合わせられるようにアレンジされたメディアコンポーネントと、各々が第1の方向において、複数の第1のメディア要素が再生されることになっている下側および上側の再生テンポを表す第1および第2の端部によって境界付けられている複数のメディアコンポーネントのうちの第1のメディアコンポーネントの複数の第1のメディア要素と、ユーザ入力に応答して第1の方向に移動可能であり、再生動作モードにあるときの複数のメディアコンポーネントの再生テンポを表すグラフィカル要素とを備えており、電子装置のプロセッサが、グラフィカル要素を第1の方向に移動させるためのユーザ入力に応答して、グラフィカル要素の現在位置を判断し、第1のメディアコンポーネントについて、複数の第1のメディア要素のうちでグラフィック要素が第1の方向において第1および第2の端部の間に位置する第1のメディア要素を判断するように構成され、それによって第1のメディア要素が選択され、再生動作モードにあるときに出力用のメディアコンポーネントの組み合わせの一部を形成する。
【0083】
選択されたメディア要素を、強調表示することができる。他のメディアコンポーネントに対応する他のメディア要素であって、グラフィック要素が第1の方向において第1および第2の端部の間に位置する他のメディア要素も、強調表示することができる。グラフィカル要素は、複数のチャネルの各々と交差する第2の方向に延びる少なくとも一部分を有することができる。グラフィカル要素とメディア要素との間の交差は、そのメディア要素が出力用のメディアコンポーネントの組み合わせの一部を形成すべく選択されるという事実を表すことができる。第2の方向は、第1の方向に対して垂直であってよい。
【0084】
このUI制御方法を、本明細書において説明され、特許請求の範囲において定義される本開示の種々の他の態様と組み合わせることができることを、理解できるであろう。
【0085】
上述の装置機能を提供するように構成された電子装置を提供することができる。
【0086】
使用時にプロセッサが上述のUI制御方法を実行することを可能にするように構成されたコンピュータ可読命令を含むコンピュータ可読媒体を提供することができる。
【0087】
図6は、コンピューティングデバイス600の一実施例のブロック図を示しており、コンピューティングデバイス600において、本明細書に記載の方法のうちの任意の1つ以上をコンピューティングデバイスに実行させるための命令一式を実行することができる。別の実施例においては、コンピューティングデバイスを、ローカルエリアネットワーク(LAN)、イントラネット、エクストラネット、またはインターネット内の他のマシンに接続(例えば、ネットワーク接続)することができる。コンピューティングデバイスは、クライアント-サーバネットワーク環境においてはサーバまたはクライアントマシンの役割で動作でき、ピアツーピア(または、分散型)ネットワーク環境においてはピアマシンとして動作することができる。コンピューティングデバイスは、パーソナルコンピュータ(PC)、タブレットコンピュータ、セットトップボックス(STB)、携帯情報端末(PDA)、携帯電話機、ウェブアプライアンス、サーバ、ネットワークルータ、スイッチまたはブリッジ、あるいは行うべき動作を指定する1組の命令(順次またはその他)を実行することができる任意のマシンであってよい。さらに、コンピューティングデバイスが1つだけ示されているが、「コンピューティングデバイス」という用語は、本明細書に記載の方法のうちの任意の1つ以上を実行すべく単独または協働して1組(または、複数組)の命令を実行するマシン(例えば、コンピュータ)の任意の集合も含むように理解されるべきである。
【0088】
典型的なコンピューティングデバイス600は、バス630を介して互いに通信する処理装置602、メインメモリ604(例えば、読み出し専用メモリ(ROM)、フラッシュメモリ、シンクロナスDRAM(SDRAM)またはラムバスDRAM(RDRAM)などのダイナミックランダムアクセスメモリ(DRAM)、スタティックメモリ606(例えば、フラッシュメモリ、スタティックランダムアクセスメモリ(SRAM)など)、および二次メモリ(例えば、データ記憶装置618)を含む。
【0089】
処理装置602は、マイクロプロセッサや中央処理装置などの1つ以上の汎用プロセッサを表す。より具体的には、処理装置602は、複合命令セット演算(CISC)マイクロプロセッサ、縮小命令セット演算(RISC)マイクロプロセッサ、超長命令語(VLIW)マイクロプロセッサ、他の命令セットを実行するプロセッサ、または命令セットの組み合わせを実行するプロセッサであってよい。さらに、処理装置602は、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、デジタル信号プロセッサ(DSP)、ネットワークプロセッサなどの1つ以上の専用処理装置であってもよい。処理装置602は、本明細書で説明した動作およびステップを実行するための処理ロジック(命令622)を実行するように構成される。
【0090】
コンピューティングデバイス600は、ネットワークインタフェースデバイス608をさらに含むことができる。さらに、コンピューティングデバイス600は、ビデオ表示ユニット610(例えば、液晶ディスプレイ(LCD)または陰極線管(CRT))、英数字入力装置612(例えば、キーボードまたはタッチスクリーン)、カーソル制御装置614(例えば、マウスまたはタッチスクリーン)、およびオーディオ装置616(例えば、スピーカ)を含むことができる。
【0091】
データ記憶装置618は、本明細書に記載の方法または機能のうちの任意の1つ以上を具現化する1組以上の命令622を格納する1つ以上の機械可読記憶媒体(または、より具体的には、1つ以上の非一時的なコンピュータ可読記憶媒体)628を含むことができる。また、命令622は、コンピュータシステム600による実行時に、全体または少なくとも一部がメインメモリ604内および/または処理装置602内に存在することができ、メインメモリ604および処理装置602もコンピュータ可読記憶装置を構成する。
【0092】
上述のさまざまな方法を、コンピュータプログラムによって実施することができる。コンピュータプログラムは、上述のさまざまな方法のうちの1つ以上の方法の機能を実行するようにコンピュータに対して指示するように構成されたコンピュータコードを含むことができる。そのような方法を実行するためのコンピュータプログラムおよび/またはコードを、1つ以上のコンピュータ可読媒体、またはより一般的にはコンピュータプログラム製品にて、コンピュータなどの装置に提供することができる。コンピュータ可読媒体は、一時的であっても、非一時的であってもよい。1つ以上のコンピュータ可読媒体は、例えば、電子、磁気、光学、電磁気、赤外線、または半導体システム、あるいは例えばインターネットを介したコードのダウンロードなどのデータ伝送のための伝搬媒体であってよい。あるいは、1つ以上のコンピュータ可読媒体は、半導体または固体メモリ、磁気テープ、リムーバブルなコンピュータディスケット、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、剛体磁気ディスク、ならびにCD-ROM、CD-R/W、またはDVDなどの光ディスクなどの1つ以上の物理的なコンピュータ可読媒体の形態をとることができる。
【0093】
一実施例においては、本明細書で説明されるモジュール、構成要素、および他の特徴を、ディスクリートな構成要素として実現することができ、あるいはASIC、FPGA、DSP、または同様の装置などのハードウェア構成要素の機能に統合することができる。
【0094】
「ハードウェア構成要素」は、特定の動作を実行することができる有形の(例えば、非一時的な)物理的構成要素(例えば、1つ以上のプロセッサの組)であり、特定の物理的方法で構成または配置され得る。ハードウェア構成要素は、特定の動作を実行するように恒久的に構成された専用の回路または論理を含むことができる。ハードウェア構成要素は、フィールドプログラマブルゲートアレイ(FPGA)またはASICなどの専用プロセッサであってよく、あるいはそのような専用プロセッサを含むことができる。また、ハードウェア構成要素は、特定の動作を実行するようにソフトウェアによって一時的に設定されるプログラマブルな論理または回路を含むことができる。
【0095】
したがって、「ハードウェア構成要素」という表現は、特定の方法で動作し、あるいは本明細書に記載の特定の動作を実行するように、物理的に構築され、恒久的に構成(例えば、配線)され、あるいは一時的に設定(例えば、プログラム)され得る有形の実体を包含すると理解されるべきである。
【0096】
さらに、モジュールおよび構成要素を、ハードウェア装置内のファームウェアまたは機能回路として実現することができる。さらに、モジュールおよび構成要素を、ハードウェア装置およびソフトウェア構成要素の任意の組み合わせで実現することができ、あるいはソフトウェア(例えば、機械可読媒体または伝送媒体に格納または別の方法で具現化されたコード)のみにて実現することができる。
【0097】
特に断りのない限り、以下の説明から明らかなように、本明細書の全体を通して、「受信する」、「決定する」、「比較する」、「可能にする」、「維持する」、「特定する」、「選択する」、「割り当てる」などの用語を用いた議論が、コンピュータシステムまたは同様の電子コンピューティングデバイスの動作および処理であって、コンピュータシステムのレジスタおよびメモリにおいて物理的な(電子的な)量として表されるデータを操作し、コンピュータシステムのメモリまたはレジスタあるいは他のそのような情報記憶装置、伝送装置、または表示装置内の物理的な量として同様に表される他のデータに変換する動作および処理を指すことを、理解できるであろう。
【0098】
以上の説明が例示を意図しており、限定を意図していないことを、理解すべきである。以上の説明を検討および理解することで、多数の他の実施例が、当業者にとって明らかであろう。本開示を、特定の典型的な実施例を参照して説明したが、本開示が、説明した実施例に限定されず、むしろ添付の特許請求の範囲の技術的思想および技術的範囲の範囲内で、変更および調整を伴って実施可能であることを、理解できるであろう。したがって、本明細書および図面は、限定の意味ではなく、例示の意味で考慮されるべきである。したがって、本開示の範囲は、添付の特許請求の範囲を参照して、そのような特許請求の範囲に与えられる均等物の全範囲と共に決定されるべきである。