特許6424462 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤマハ株式会社の特許一覧

特許6424462オーディオ信号の時間軸圧縮伸張方法および装置並びにプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6424462

(24)【登録日】2018年11月2日

(45)【発行日】2018年11月21日

(54)【発明の名称】オーディオ信号の時間軸圧縮伸張方法および装置並びにプログラム

(51)【国際特許分類】

G10L 21/047 20130101AFI20181112BHJP

【ＦＩ】

G10L21/047

【請求項の数】5

【全頁数】12

(21)【出願番号】特願2014-103789(P2014-103789)

(22)【出願日】2014年5月19日

(65)【公開番号】特開2015-219420(P2015-219420A)

(43)【公開日】2015年12月7日

【審査請求日】2017年3月24日

(73)【特許権者】

【識別番号】000004075

【氏名又は名称】ヤマハ株式会社

(74)【代理人】

【識別番号】100077539

【弁理士】

【氏名又は名称】飯塚義仁

(74)【代理人】

【識別番号】100125265

【弁理士】

【氏名又は名称】貝塚亮平

(72)【発明者】

【氏名】岡崎雅嗣

【審査官】大野弘

(56)【参考文献】

【文献】特開２００９−２４４７０４（ＪＰ，Ａ）

【文献】特開平１１−３５２９７０（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ１０Ｌ２１／０４７

(57)【特許請求の範囲】

【請求項1】

オーディオ信号の原波形データを時間軸上で分割して断片化しセグメント波形を得る第１ステップと、
各セグメント波形の一部分をカットしあるいは各セグメント波形の終端に原セグメント波形から形成した挿入セグメント波形を加えてつなぎ合わせて第１圧伸波形を得る第２ステップと、
該第１圧伸波形の中の同一長さの２つの時間区間の波形を重複加算して得た波形を該２つの時間区間の波形の間に挿入しあるいは該２つの時間区間の波形と入れ替えて該第１圧伸波形を圧伸し第２の圧伸波形を得る第３ステップと
を有することを特徴とするオーディオ信号の時間軸圧縮伸張方法。

【請求項2】

オーディオ信号の原波形データを時間軸上で分割して断片化しセグメント波形を得る第１手段と、
各セグメント波形の一部分をカットしあるいは各セグメント波形の終端に原セグメント波形から形成した挿入セグメント波形を加えてつなぎ合わせて第１圧伸波形を得る第２手段と、
該第１圧伸波形の中の同一長さの２つの時間区間の波形を重複加算して得た波形を該２つの時間区間の波形の間に挿入しあるいは該２つの時間区間の波形と入れ替えて該第１圧伸波形を圧伸し第２の圧伸波形を得る第３手段と
を有することを特徴とするオーディオ信号の時間軸圧縮伸張装置。

【請求項3】

全体の圧伸率を指示する情報を取得し、該全体の圧伸率を前記第２手段における圧伸率と前記第３手段における圧伸率とに振り分ける際のそれぞれの割合を決定し、第２手段用圧伸率と第３手段用圧伸率とを得る第４手段をさらに有し、
前記第２および第３手段における圧伸率がそれぞれ前記第２手段用圧伸率と第３手段用圧伸率となるように制御されることを特徴とする請求項２記載のオーディオ信号の時間軸圧縮伸張装置。

【請求項4】

前記第４手段は、全体の圧伸率に応じて前記第２手段用圧伸率と第３手段用圧伸率との割合が変化するように該割合を決定することを特徴とする請求項３記載のオーディオ信号の時間軸圧縮伸張装置。

【請求項5】

コンピュータに、
オーディオ信号の原波形データを時間軸上で分割して断片化しセグメント波形を得る手順と、
各セグメント波形の一部分をカットしあるいは各セグメント波形の終端に原セグメント波形から形成した挿入セグメント波形を加えてつなぎ合わせて第１圧伸波形を得る手順と、
該第１圧伸波形の中の同一長さの２つの時間区間の波形を重複加算して得た波形を該２つの時間区間の波形の間に挿入しあるいは該２つの時間区間の波形と入れ替えて該第１圧伸波形を圧伸し第２の圧伸波形を得る手順と
を実行させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

この発明は、原オーディオ信号のピッチや音質を変化させずにテンポを遅くまたは速くするよう原オーディオ信号の時間軸を圧縮または伸張する（「圧伸」と略すことがある）方法およびその装置並びにプログラムに関する。

【背景技術】

【0002】

ピッチや音質を変化させずにオーディオ信号の時間軸を圧伸する技術として、従来より、たとえば下記の特許文献１および特許文献２に記載された技術が知られている。
特許文献１記載の技術は、いわゆるカット・アンド・スプライス（ＣＡＳ）と呼ばれる技術で、原信号を時間軸上で複数の区間に区切り、圧縮時には各区間の終端部分を一定割合でカットし、伸長時には各区間の間に、その直前の区間の信号から生成した信号を挿入してつなぎ合わせる。この文献では、挿入する信号の音量エンベロープを直前の区間の信号のエンベロープに合わせるとともに時間とともに減衰させるようにしている。

【0003】

特許文献２記載の技術は、ＯＬＡ（Overlap and Add: 重複加算)と呼ばれる技術に属し、とくにそのうちの、いわゆるＰＩＣＯＬＡ（Pointer Interval Controlled Overlap and Add）により、原オーディオ信号の波形相関の最も高い隣接した同じ長さの２つの区間を抽出し、これら区間の信号を重複加算し、この重複加算された信号を元の２つの区間と入れ換えて時間圧縮し、あるいは元の２つの区間の間に挿入することで時間伸長するようにし、全体的な時間を短くしたり長くしたりしている。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】特開２００２−１７５０８０号公報（第４〜５頁、図２）

【特許文献2】特開２０００−３２２０９９号公報（第２頁、図５、図６）

【発明の概要】

【発明が解決しようとする課題】

【0005】

しかしながら、特許文献１記載のようなＣＡＳ法では、伸長時に挿入する生成信号の長さは基本的に原オーディオ信号の直前区間の長さを超えることができず、また生成信号は実際にはその区間の音色の安定している後半部分を用いざるを得ないことから、時間軸を２倍程度にする場合には無音部分が生じたりして違和感が増大することとなり、時間軸の大幅な伸長はできない。

【0006】

他方、特許文献２に記載されたようなOＬA法では、時間軸の２倍程度の大幅な伸長も可能であるものの、音量エンベロープの時間的変化も引き伸ばされるため、たとえば原オーディオ信号の音量エンベロープが短い時間で減衰していた場合伸長後は原音とは異なる長い減衰時間を持つ音量エンベロープとなり、原音とは印象がかなり変わってしまうという問題がある。とくに打楽器などの減衰系のオーディオ信号では、時間軸を大きく伸長すると、印象の変化が顕著となる。

【0007】

この発明は、上記に鑑み、カット・アンド・スプライス法とOＬA法とを組み合わせる発想のもとで、時間軸の大幅な伸長をも可能とし、とくに打楽器などの減衰時間が定まっているオーディオ信号を聴取したときの印象をあまり変えることなく時間軸を大きく伸長することができるよう改善し、打楽器、打弦楽器や、ギターなどの弾く楽器など、音量エンベロープがテンポに依存して変化することのない楽器の音響を引き伸ばしたときの聴感上の品質を良好に保つことできる、オーディオ信号の時間軸圧縮伸張方法および装置並びにプログラムを提供することを目的とする。

【課題を解決するための手段】

【0008】

請求項１に記載された本発明によるオーディオ信号の時間軸圧縮伸張方法は、オーディオ信号の原波形データを時間軸上で分割して断片化しセグメント波形を得る第１ステップと、各セグメント波形の一部分をカットしあるいは各セグメント波形の終端に原セグメント波形から形成した挿入セグメント波形を加えてつなぎ合わせて第１圧伸波形を得る第２ステップと、該第１圧伸波形の中の同一長さの２つの時間区間の波形を重複加算して得た波形を該２つの時間区間の波形の間に挿入しあるいは該２つの時間区間の波形と入れ替えて該第１圧伸波形を圧伸し第２の圧伸波形を得る第３ステップとを有することを特徴とする。

【0009】

請求項２に記載された本発明によるオーディオ信号の時間軸圧縮伸張装置は、オーディオ信号の原波形データを時間軸上で分割して断片化しセグメント波形を得る第１手段と、各セグメント波形の一部分をカットしあるいは各セグメント波形の終端に原セグメント波形から形成した挿入セグメント波形を加えてつなぎ合わせて第１圧伸波形を得る第２手段と、該第１圧伸波形の中の同一長さの２つの時間区間の波形を重複加算して得た波形を該２つの時間区間の波形の間に挿入しあるいは該２つの時間区間の波形と入れ替えて該第１圧伸波形を圧伸し第２の圧伸波形を得る第３手段とを有することを特徴とする。

【0010】

請求項３に記載された本発明によるオーディオ信号の時間軸圧縮伸張装置は、上記請求項２に記載された本発明によるオーディオ信号の時間軸圧縮伸張装置の第１から第３手段に加えて、全体の圧伸率を指示する情報を取得し、該全体の圧伸率を第２手段における圧伸率と第３手段における圧伸率とに振り分ける際のそれぞれの割合を決定し第２手段用圧伸率と第３手段用圧伸率と得る第４手段をさらに有し、第２および第３手段における圧伸率がそれぞれこの第２手段用圧伸率と第３手段用圧伸率となるように制御されることが特徴となっている。

【0011】

請求項４に記載された本発明によるオーディオ信号の時間軸圧縮伸張装置は、上記請求項３に記載された本発明によるオーディオ信号の時間軸圧縮伸張装置において、第４手段が前記全体の圧伸率に応じて第２手段用圧伸率と第３手段用圧伸率との割合が変化するように該割合を決定することを特徴とする。

【0012】

請求項５に記載された本発明によるプログラムは、コンピュータに、オーディオ信号の原波形データを時間軸上で分割して断片化しセグメント波形を得る手順と、各セグメント波形の一部分をカットしあるいは各セグメント波形の終端に原セグメント波形から形成した挿入セグメント波形を加えてつなぎ合わせて第１圧伸波形を得る手順と、該第１圧伸波形の中の同一長さの２つの時間区間の波形を重複加算して得た波形を該２つの時間区間の波形の間に挿入しあるいは該２つの時間区間の波形と入れ替えて該第１圧伸波形を圧伸し第２の圧伸波形を得る手順とを実行させるためのプログラムである。

【発明の効果】

【0013】

この発明によれば、オーディオ信号の原波形データを時間軸上で分割して断片化しセグメント波形を得、この各セグメント波形の一部分をカットしあるいは各セグメント波形の終端に原セグメント波形から形成した挿入セグメント波形を加えてつなぎ合わせることにより、いわゆるＣＡＳ法による信号圧伸を行い、そこで得た圧伸波形の中の同一長さの２つの時間区間の波形を重複加算して得た波形を該２つの時間区間の波形の間に挿入しあるいは該２つの時間区間の波形と入れ替えることにより、いわゆるＯＬＡ法による信号圧伸を行うというように、２段構えの構成をとっているため、第１段目のＣＡＳ法による信号圧伸で原音の減衰過程での減衰音についての聴感上の印象を変えることなく伸長でき、さらに第２段目のＯＬＡ法による信号圧伸で、この減衰音についての印象が変わらないように伸長された信号をさらに伸長させることができるので、原音を大幅に伸長させる場合でも、伸長させた音を聴取したときの減衰部分での印象が原音から著しく変化することがなく、違和感のない信号圧伸が可能である。とくに打楽器などの減衰時間が定まっているオーディオ信号を聴取したときの印象をあまり変えることなく時間軸を大きく伸長することができ、打楽器、打弦楽器や、ギターなどの弾く楽器など、音量エンベロープがテンポに依存して変化することのない楽器の音響を引き伸ばしたときの聴感上の品質を良好に保つことできる。

【0014】

また、全体の圧伸率から、第１段目のＣＡＳ法による信号圧伸率と第２段目のＯＬＡ法による信号圧伸率との割合を決定するようにしているため、それぞれの圧伸率を最適に定めることが可能となり、より違和感のない信号圧伸が実現できる。

【0015】

さらに、全体の圧伸率から、第１段目のＣＡＳ法による信号圧伸率と第２段目のＯＬＡ法による信号圧伸率との割合を決定する際に、全体の圧伸率に応じてこの割合が変化するように決定するため、たとえば全体の圧伸率が比較的小さい場合には第１段目のＣＡＳ法による信号圧伸率を高く第２段目のＯＬＡ法による信号圧伸率を低くするようそれらの割合を決め、全体の圧伸率が比較的大きい場合には第１段目のＣＡＳ法による信号圧伸率を高くするとともに第２段目のＯＬＡ法による信号圧伸率も高くしてこの第２段目のＯＬＡ法による信号圧伸率の割合が高まるようそれらの割合を決めるなど、全体の圧伸率の大小に応じたきめ細かな最適な割合決定ができて、違和感のない信号圧伸が可能となる。

【図面の簡単な説明】

【0016】

【図1】この発明の一実施例にかかるオーディオ信号の時間軸圧縮伸張システムのブロック図である。

【図2】図１の実施例における信号処理を説明するためのブロック図である。

【図3】波形データのセグメンテーションを示すタイムチャートであり、同図（Ａ）は原波形データを、同図（Ｂ）はセグメント波形の略図をそれぞれ示す。

【図4】１つのセグメント波形についての処理を説明するための概略波形のタイムチャートであり、同図（Ａ）はセグメント波形を、同図（Ｂ）はＣＡＳ法による処理後の波形を、同図（Ｃ）はＯＬＡ法による処理後の波形をそれぞれ示す。

【図5】全体の圧伸率がどのような割合で分けられるかを示すグラフであり、同図（Ａ）、（Ｂ）は全体の圧伸率に応じて異なる割合で変化する２つの例のそれぞれを示す。

【発明を実施するための形態】

【0017】

以下、この発明の実施の形態について、図面を参照しながら詳細に説明する。

【0018】

図１はこの発明の一実施例にかかるオーディオ信号の時間軸圧縮伸長システムのハードウェア構成を示すものである。このオーディオ信号の時間軸圧縮伸張システムは、汎用パーソナルコンピュータ上で動作するアプリケーションプログラムである信号圧伸処理プログラムおよびドライバ等によって構成されている。

【0019】

この図１に示すように、ＣＰＵ１５、メモリ１６やＨＤＤ（ハードディスク）２１、入力装置１２、ディスプレイ１４、各種インターフェイス１１、２０、２２、演奏操作子１３、ドライブ装置１８等がバス１７を介して接続されている。通信インタフェース１１は、インターネット等の外部ネットワークを介して波形データ等のやりとりを行う。入力装置１２は、キーボード、マウス等から構成されている。演奏操作子１３は、鍵盤および打楽器を模擬するパッド操作子等によって構成されている。ディスプレイ１４はユーザに対して各種情報を表示するものである。

【0020】

ＣＰＵ１５は、後述のプログラムにしたがい各種の演算処理を行うとともにバス１７を介して他のハードウェアを制御する。メモリ１７は、ＲＯＭおよびＲＡＭを含み、ＲＯＭにはイニシャルプログラムローダ等が格納され、ＲＡＭはＣＰＵ１５によって読み書きされる。ドライブ装置１８はＣＤ、ＤＶＤあるいはＭＯ等の記憶媒体１９の読み書きを行う。外部から入力されたオーディオ信号のアナログ波形は波形取込インターフェイスによりサンプリングされてデジタル波形データに変換された後、バス１７を介して出力される。ＨＤＤ２１には、汎用パーソナルコンピュータのオペレーティングシステム、後述する波形編集のアプリケーションプログラム、波形データ等が格納される。波形出力インタフェース２２は、バス１７を介して供給されたデジタル波形データをアナログ波形に変換してアナログオーディオ信号とし、サウンドシステム２３に送って音響を出力させる。

【0021】

このように構成されるシステムにおいて、パーソナルコンピュータの電源が供給されると、メモリ１６のＲＯＭに格納されたイニシャルプログラムローダが実行され、オペレーティングシステムが立上る。このオペレーティングシステムにおいて所定の操作を行うと、実施例にかかる信号圧伸処理プログラムが起動される。この信号圧伸処理プログラムにおいて、ユーザが入力装置１２を介して被処理信号を指定するとともに圧伸率を指示する。

【0022】

さらに図２をも参照して動作説明すると、指定された被処理信号の原波形データが、セグメント波形取得手段３５により時間軸上で分割されて断片化され、多数のオリジナルセグメント波形データと挿入セグメント波形データとが取得されてＨＤＤ２１などに格納される。このオリジナルセグメント波形データと挿入セグメント波形データは、読み出されてＣＡＳ手段３３に取り込まれ、ＣＡＳ法による原波形データの時間軸圧伸処理が行われる。このＣＡＳ処理により圧伸された波形データはＯＬＡ手段３４に送られてＯＬＡ処理を受けて再度時間軸圧伸される。つまり、第１段目はＣＡＳ法による圧伸、第２段目はＯＬＡ法による圧伸というように異なる圧伸法による２段構えの圧伸処理が行われる。

【0023】

１段目のＣＡＳ手段３３による圧伸率と２段目のＯＬＡ手段３４による圧伸率のそれぞれは、ユーザから指示された全体の圧伸率に応じて、それらの割合として決定される。ユーザの指示による全体の圧伸率が圧伸率取得手段３１によって取得されており、割合決定手段３２において、この全体の圧伸率に応じてＣＡＳ手段３３で圧伸する割合とＯＬＡ手段３４で割合とが定められ、これに応じてＣＡＳ手段３３およびＯＬＡ手段３４が圧伸処理する。たとえば全体の圧伸率が１．５倍程度に伸長するというものであった場合には、ＣＡＳ手段３３での圧伸率を１．４倍に、ＯＬＡ手段による圧伸率を１．１倍にするというように割合を決定する（この場合には両者が乗算されるため１．５４倍の伸長になる）。また、全体の圧伸率を２倍とするときは、たとえばＣＡＳ手段３３、ＯＬＡ手段３４とも√２倍とされる（これにより両者の乗算で、全体では２倍の伸長となる）。なお、これら各「手段」は、プログラムにおける処理ステップ（行程）を意味している。

【0024】

以下、さらに詳しく説明する。まず、セグメント波形取得手段３５におけるオリジナルセグメント波形データの取得について説明すると、まず、被処理信号の原波形データにおける音量レベルのピークが検出され、各ピークの出現位置に基づいて、拍子（３拍子、４拍子等）、小節数、テンポ数等が自動的に決定される。そして、この決定結果はユーザが任意の値に修正することもできるようにもされている。なお、この被処理信号の原波形データは、波形取込インターフェイス２０を介して取り込まれた外部からのオーディオ信号の波形データや、通信インターフェイス１１を介して得たオーディオ信号の波形データ、あるいはドライブ装置１８によって得たＣＤ、ＤＶＤ等の記憶媒体１９からのオーディオ信号の波形データ等からユーザによって指定されたものである。

【0025】

つぎに、その決定結果に応じて、セグメント波形取得手段３５では、原波形データの時間軸上での分割処理が行われる。原波形データが図３（Ａ）で示すようなものであった場合、時刻ｔ１、ｔ２、ｔ３、・・・で分割され、その分割結果として、図３（Ｂ）に示すようにセグメント化されたセグメント波形データＳ１、Ｓ２、S3、・・・が得られる。このセグメント波形データをオリジナルセグメント波形データと言うことにする。

【0026】

ここで、分割基準時となる時刻ｔ１、ｔ２、ｔ３、・・・は、「制御ポイント」とも呼ばれ、種々に設定可能であるが、この例ではユーザによって指定される動作モードが単純決定モードであるか解析モードであるかに応じてデフォルトの制御ポイントが自動的に決定されるものとして説明する。

【0027】

「単純決定モード」においては、拍単位に制御ポイントが設定される。例えば、１小節で拍子が３拍子であれば、波形データを３等分する位置に制御ポイントが設定され、また２小節であれば６等分する位置に設定される。他方、「解析モード」においては、波形データの解析結果に基づいて制御ポイントが決定される。具体的には、音量エンベロープの立上がり開始位置、立下がり開始位置、ピッチの変化位置等が検出され、各検出位置に制御ポイントが設定される。以上のように決定されたデフォルトの制御ポイントは、原波形データとともにディスプレイ１４上に、たとえば図３（Ａ）のように表示される。このデフォルトの制御ポイントはユーザによって編集することが可能であり、具体的には、上記ディスプレイ表示画面上で、必要に応じて制御ポイントの追加、削除または移動ができるようになっている。

【0028】

こうしてオリジナルセグメント波形データが取得されると、セグメント波形取得手段３５において、つぎに挿入セグメント波形データが取得される。この挿入セグメント波形データは、基本的には、オリジナルセグメント波形データと同じ長さのものとして取得され、各オリジナルセグメント波形データの間に挿入されるものである。ｉ番目のオリジナルセグメント波形データＳｉの終端に続いてｉ番目の挿入セグメント波形データＲｉが挿入されることになるが、挿入セグメント波形データＲｉとしては、ｉ＋１番目のオリジナルセグメント波形データＳｉ＋１をそのままコピーした波形データ、あるいは、ｉ番目のオリジナルセグメント波形データＳｉを時間軸上で反転した波形データのいずれかが選択される。デフォルト状態では、持続系の音に対しては前者のそのままコピーした波形データが用いられ、パーカッション系の音に対しては後者の反転した波形データが用いられる。

【0029】

これをいま少し説明すると、持続系の音では、ｉ番目のオリジナルセグメント波形データＳｉとｉ＋１番目のオリジナルセグメント波形データＳｉ＋１ではもともと滑らかに連続しており、そのためこれらの間にｉ＋１番目のオリジナルセグメント波形データＳｉ＋１をコピーして得た波形データを挿入セグメント波形データＲｉとして挿入する場合には、ｉ番目のオリジナルセグメント波形データＳｉとの間では滑らかな接続となる。この場合、持続系の音であるため、ｉ＋１番目のオリジナルセグメント波形データＳｉ＋１以外のオリジナルセグメント波形データをコピーして挿入セグメント波形データＲｉとして用いることも可能であるが、持続系の音ではアタックの無い部分（持続系の波形の途中）に制御ポイントが設定されることもあるので、注意を要する。というのは、オリジナルセグメント波形データＳｉとそれに続く挿入セグメント波形データＲｉとの間で位相がずれていると、耳障りなノイズが発生するので、両者間で位相合わせを行う必要が生じ、処理が煩雑になるからである。上述のようにオリジナルセグメント波形データＳｉのつぎのｉ＋１番目のオリジナルセグメント波形データＳｉ＋１を挿入セグメント波形データＲｉとして用いれば、このような問題を回避することができる。

【0030】

ところが、持続系の音において、制御ポイントの直後に次の音のアタックがあった場合にはやや問題がある。この場合、一般的には、ｉ＋１番目のオリジナルセグメントの音のピッチは直前のｉ番目のオリジナルセグメントの音のピッチとは異なることになるため、オリジナルセグメントと挿入セグメントのピッチが異なるという、本来望ましくない事態になるからである。しかし、ここでは、後述のように、挿入セグメント波形データのエンベロープがその直前のオリジナルセグメント波形データから連続して滑らかに減衰していくように制御しており、この望ましくない事態の影響を軽減ないし回避している。すなわち、新たに始まる音のアタック部で音色やピッチが変化すると目立つが、減衰している波形の途中で音色やピッチが変化した場合には、前のアタック部の印象が強いために比較的目立たないものであることに着目した対処をしているからである。

【0031】

一方、パーカッション系の音においては、元々ノイズ的な成分が多いため、オリジナルセグメントＳｉから挿入セグメントＲｉへの接続部で目立ったノイズは発生しないことが多い。しかし、当該オリジナルセグメントＳｉまたは次のオリジナルセグメントＳｉ＋１等をそのまま挿入セグメントＲｉとして用いると、波形の先頭部分のアタックノイズが多少耳障りになる場合がある。そこで、オリジナルセグメントＳｉの波形データを時間軸上で反転した波形データを挿入セグメントＲｉとして用いることにより、このような不具合を解消するようにしている。さらに、オリジナルセグメントＳｉと挿入セグメントＲｉの接続部分をクロスフェードすると、いっそう両者を滑らかに接続することが可能になる。なお、反転した波形データを最後まで読み出すと、該反転波形データの終端部分にアタックノイズが再生され、多少耳障りになることがある。この場合は、反転波形データの途中のポイント（例えば先頭から２／３程度の長さのポイント）において、該反転波形データを折り返して（時間軸上でさらに反転させて）読み出すとよい。

【0032】

なお、挿入セグメントは以上説明したデフォルトのものに限定されるわけではなく、各オリジナルセグメント毎に、ユーザが所望の挿入セグメントを指定して、聴感上で最も好ましいものを選択することができるようになっている。また、挿入セグメントの波形データが選択されると、その波形データの各部のレベルが、該波形データのエンベロープレベルで除算される。これにより、挿入セグメントの波形データは、エンベロープが平坦な波形データに変換される。

【0033】

つぎに、挿入セグメントＲｉのエンベロープ波形が、オリジナルセグメントＳｉのエンベロープ波形曲線に応じて決定される。オリジナルセグメントＳｉのエンベロープ波形は一般に時間関数で表される減衰率（減衰曲線）となっているので、これを算出し、挿入セグメントＲｉのエンベロープレベルの初期値をオリジナルセグメントＳｉの終端レベルに合わせるとともに上記の減衰率（減衰曲線）が維持されるように挿入セグメントＲｉのエンベロープ波形が決定される。これにより、挿入セグメントＲｉのエンベロープ特性が、オリジナルセグメントＳｉに対して自然につながるようになる。

【0034】

ただし、制御ポイントの決定時に単純決定モードが選択された場合等においては、オリジナルセグメントＳｉの終端部においてエンベロープレベルが最大になることもある。この場合には、挿入セグメントＲｉのエンベロープレベルは、オリジナルセグメントＳｉの終端時のレベルに制限するようにしておく。

【0035】

以上のように、各挿入セグメントのエンベロープが決定されると、挿入セグメントＲ１、Ｒ２、Ｒ３、・・・の各々の平坦化波形データに対して、上記決定されたエンベロープが乗算される。これにより、各挿入セグメントの波形データは、この決定されたエンベロープを有するようになる。こうして取得されたオリジナルセグメント波形データと挿入セグメント波形データは、ＨＤＤ２１などに格納されて、読み出しを待つことになる。

【0036】

ここで、前述のように、たとえば、全体の圧伸率が１．５倍程度であったとして、割合決定手段３２によりＣＡＳ手段３３での圧伸率が１．４倍に、ＯＬＡ手段３４での圧伸率が１．１倍に決定されているとしよう。この場合、一つのオリジナルセグメント波形データＳｉに関して図４を参照して説明すると、ＣＡＳ手段３３では、図４（Ａ）に示すようなオリジナルセグメント波形データＳｉをそのまま読み込むとともに、挿入セグメント波形データＲｉを先頭からオリジナルセグメント波形データＳｉの時間長の０．４倍の時間長分だけ読み込み、これらを図４（Ｂ）に示すように、つなぎ合わせて結合する。ここで、結合された波形データは、先に述べたとおり、オリジナルセグメントＳｉと挿入セグメントＲｉのエンベロープがスムーズにつながっており、そのため、原音の減衰曲線が維持されることになり、減衰音についての聴感上の印象の変化がない。そして、このようなつなぎ合わせ結合処理を、すべてのオリジナルセグメント波形データに関して行い、全体として１．４倍に伸長された結合波形データを得る。

【0037】

このＣＡＳ手段３３での処理結果としての結合波形データはつぎにＯＬＡ手段３４においてＯＬＡ法による圧伸処理を受ける。図４（Ｂ）に示すようなＣＡＳ処理後の結合波形データがＯＬＡ法により圧伸され、結合波形データの全体（Ｓｉ＋Ｒｉ）がこの例では図４（Ｃ）に示すように１．１倍に伸長され、この伸長された波形データＯｉが出力波形データとして出力される。

【0038】

ここでは、ＯＬＡ手段３４においてＰＩＣＯＬＡ（Pointer Interval Controlled Overlap and Add）により圧伸が行われる。入力される結合波形データのうちの波形相関の最も高い隣接した同じ長さの２つの小区間が抽出され、これら小区間の波形が重複加算される。時間圧縮する場合は、この重複加算された波形が元の２つの小区間と入れ換えられる。時間伸長する場合は、重複加算された波形が元の２つの小区間の間に挿入される。ここでは後者のように重複加算された波形が元の２つの小区間の間に挿入されることが入力結合波形データの全体（Ｓｉ＋Ｒｉ）に行われて１．１倍に伸長されることになる。そのため、入力結合波形データのエンベロープも引き伸ばされることになるが、大きく引き伸ばされることにはならないため、原音の減衰過程での聴感上の印象の変化を抑えるようにしながら、全体として１．５倍程度の時間軸伸長を実現できる。

【0039】

なお、上記の説明では、便宜上、結合波形データの全体（Ｓｉ＋Ｒｉ）にわたりＰＩＣＯＬＡ処理を行うものとしたが、結合波形データ（Ｓｉ＋Ｒｉ）のうちのアタック部分にはこの処理を施さないようにすることもできる。さらに、ＰＩＣＯＬＡ法による圧伸が行われるものとしたが、波形データを波形周期（ピッチ）と同期した分析窓で互いにオーバーラップした短い断片に分割して処理するＰＳＯＬＡ（Pitch Synchronous Overlap and Add）や、周期パターンを明示的に検出せずに相互相関などに基づく尺度を用いてオーバーラップさせた断片間の接続位置を検出するＳＯＬＡ（Synchronous Overlap and Add）等の他のＯＬＡ法を採用することもできる。

【0040】

全体の圧伸率をどのような割合でＣＡＳ手段３３とＯＬＡ手段３４とに受け持たせるか、つまり割合決定手段３２が全体の圧伸率からどのようにしてＣＡＳ圧伸率とＯＬＡ圧伸率とを決定するか、については、一般的にいうと、全体の伸長率が小さい場合にはＯＬＡによる伸長はほとんどなく主にＣＡＳによる伸長とし、全体の伸長率が増えてくるにつれてＣＡＳによる伸長を頭打ちとしてその代わりにＯＬＡによる伸長割合を増やしていくようにするのが、原音の減衰過程での聴感上の印象の変化を抑えるようにしながら全体の時間軸伸長を大きくすることにとっては望ましい。

【0041】

そのため、具体的には、たとえば図５（Ａ）あるいは図５（Ｂ）のような割合となるように割合決定手段３２が決定するのが好ましい。図５（Ａ）、（Ｂ）では横軸はユーザによる設定の種類Ａ、Ｂ、Ｃ、Ｄ、Ｅを示し、縦軸がＬＯＧスケールで表された全体の圧伸率を示し、設定Ａ、Ｂ、Ｃ、Ｄ、Ｅの順で全体の圧伸率が直線的に大きくなるものとされている。

【0042】

図５（Ａ）では、全体の圧伸率が√２程度までの設定Ａ、Ｂ、Ｃでは、ＣＡＳによる伸長割合がほぼ１００％、ＯＬＡによる伸長割合がほぼ０％と定められる。全体の圧伸率が√２を超えるような設定Ｄ、Ｅ等では、ＣＡＳによる伸長率が√２で横ばいとなり、√２を超える伸長率をＯＬＡが受け持つようにされる。そのため、全体の圧伸率が２の場合には、ＣＡＳによる伸長率とＯＬＡによる伸長率はともに√２となり、全体の圧伸率の５０％ずつの割合となる。

【0043】

図５（Ｂ）では、割合特性は図５（Ａ）のように折れ線状ではなく、曲線になっている。すなわち全体の圧伸率√２を境にＯＬＡによる伸長を加えていくのではなく、全体の圧伸率が１以上になると、全体の圧伸率の増大に連れて少しずつＯＬＡによる伸長割合が増えていく。全体の圧伸率√２以下のように圧伸率が小さい場合には、ＣＡＳによる伸長割合が圧倒的に大きく、ＯＬＡによる伸長割合は非常に小さいが、それでも圧伸率が大きくなるにしたがってＯＬＡによる伸長割合が増えていく。全体の圧伸率が√２を超えるようになるとさらにＯＬＡによる伸長割合が増え、全体の圧伸率が２に近づくと、図５（Ａ）の場合と同様に、ＣＡＳによる伸長率とＯＬＡによる伸長率はともに√２前後となり、全体の圧伸率の５０％ずつの割合となる。

【0044】

なお、上記の実施例は汎用のハードウェアを用いソフトウェア処理によってデジタル・オーディオ信号の時間軸圧伸を行っているが、ＤＳＰ（Digital Signal Processor）や専用ＬＳＩ等のハードウェアによることもできることはもちろんである。また、上記の実施例は単体の装置（スタンドアロンタイプの汎用パーソナルコンピュータ）によって処理を行っているが、複数の装置が連携して処理を行うようにしてもよい。例えば、通信ネットワークを介して相互に通信可能に接続されたサーバとクライアントとが連携して処理を行ったり、あるいは、サーバ側の複数の装置が協調してウェブサービスを提供する所謂クラウドとして処理を行うようにしてもよい。

【符号の説明】

【0045】

１１通信インターフェイス
１２入力装置
１３演奏操作子
１４ディスプレイ
１５ＣＰＵ
１６メモリ（ＲＯＭ、ＲＡＭ）
１７バス
１８ドライブ装置
１９記憶媒体
２０波形取込インターフェイス
２１ＨＤＤ
２２波形出力インターフェイス
２３サウンドシステム
３１圧伸率取得手段
３２割合決定手段
３３ＣＡＳ手段
３４ＯＬＡ手段
３５セグメント波形取得手段

【図1】

【図2】

【図3】

【図4】

【図5】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

特許第6424462号(P6424462)IP Force 特許公報掲載プロジェクト 2022.1.31 β版