特開2023-179125 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本放送協会の特許一覧

特開2023-179125デジタル音声信号同期装置及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023179125

(43)【公開日】2023-12-19

(54)【発明の名称】デジタル音声信号同期装置及びプログラム

(51)【国際特許分類】

G10L 19/00 20130101AFI20231212BHJP

【ＦＩ】

G10L19/00 312G

【審査請求】未請求

【請求項の数】6

【出願形態】ＯＬ

(21)【出願番号】P 2022092224

(22)【出願日】2022-06-07

(71)【出願人】

【識別番号】000004352

【氏名又は名称】日本放送協会

(74)【代理人】

【識別番号】100106002

【弁理士】

【氏名又は名称】正林真之

(74)【代理人】

【識別番号】100120891

【弁理士】

【氏名又は名称】林一好

(72)【発明者】

【氏名】久保弘樹

(72)【発明者】

【氏名】大出訓史

(72)【発明者】

【氏名】西口敏行

(72)【発明者】

【氏名】杉本岳大

(72)【発明者】

【氏名】中山靖茂

(72)【発明者】

【氏名】大久保洋幸

(57)【要約】（修正有）

【課題】異なる同期系で動作している複数のシステムの組み合わせにより構成されている大規模な設備において、一のシステムが非ＰＣＭのデータを含む異なる同期系のデジタル音声信号を受信した場合であっても、ビット単位で前記デジタル音声信号のデータが保持されている状態で、受信したシステムの同期に引き込むことができるデジタル音声信号同期装置及びプログラムを提供する
【解決手段】音声信号同期装置１は、入力されたデジタル音声信号を一時的に格納し、必要に応じてクリア処理を行うバッファ部２と、入力されたデジタル音声信号と同期信号のクロック速度の違いに対応するために前記デジタル音声信号の間引き又は挿入を行うサンプル数調整部３と、バッファ部２から読み出したデジタル音声信号を同期信号に同期して再生する音声信号再生部４と、を備える。
【選択図】図１

【特許請求の範囲】

【請求項1】

デジタル音声信号の同期装置であって、
入力されたデジタル音声信号を一時的に格納し、必要に応じてクリア処理を行うバッファ部と、
前記入力されたデジタル音声信号と同期信号のクロック速度の違いに対応するために前記デジタル音声信号の間引き又は挿入を行うサンプル数調整部と、
前記バッファ部から読み出した前記デジタル音声信号を前記同期信号に同期して再生する音声信号再生部と、
を備えるデジタル音声信号同期装置。

【請求項2】

前記バッファ部は、前記デジタル音声信号に格納された非ＰＣＭデータを一時的に格納する請求項１に記載のデジタル音声信号同期装置。

【請求項3】

前記バッファ部は、前記デジタル音声信号に格納された非ＰＣＭデータのデータバーストを前記デジタル音声信号のデータに基づいて検出し、前記非ＰＣＭデータが入力されていない期間で、前記バッファ部のクリア処理又は読み書きインターバルのリセットを行う請求項２に記載のデジタル音声信号同期装置。

【請求項4】

前記サンプル数調整部は、
入力信号と同期信号のクロック速度の違いによって生じる前記バッファ部のオーバーフロー又はアンダーフローを検出し、非ＰＣＭデータのデータバーストの間の０データ区間で、前記オーバーフローを検出した場合は０データを間引き、前記アンダーフローを検出した場合は０データを挿入することにより、前記デジタル音声信号のサンプル数を調整する請求項２に記載のデジタル音声信号同期装置。

【請求項5】

前記デジタル音声信号に格納された非ＰＣＭデータとＰＣＭデータを区別しその後の処理を分けるために非ＰＣＭデータを判定する非ＰＣＭデータ判定部と、
非ＰＣＭデータから区別されたＰＣＭデータにサンプリングレートコンバート処理を加えることで前記同期信号に同期させるサンプリングレートコンバート部と、
サンプリングレートコンバート処理されたＰＣＭデータに、非ＰＣＭデータの前記バッファ部への一時的な格納によって生じる遅延と同等の遅延を加えることにより、前記ＰＣＭデータと非ＰＣＭデータのタイミングを揃える遅延部と、
をさらに備える請求項２に記載のデジタル音声信号同期装置。

【請求項6】

コンピュータを制御するためのプログラムであって、前記コンピュータを、請求項１から５のいずれか一項に記載のデジタル音声信号同期装置として機能させるためのデジタル音声信号同期プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、異なる同期系で動作している複数のシステムの組み合わせにより構成されている大規模な設備において、一のシステムが異なる同期系のデジタル音声信号を受信した場合であっても、ビット単位で前記デジタル音声信号のデータが保持されている状態で、受信したシステムの同期に引き込むことのできるデジタル音声信号同期装置及びプログラムに関する。

【0002】

始めに、本明細書において用いる略語を解説する。
「ＡＤＭ」は、Audio Definition Modelの略であり、オーディオの技術的特性を記述するための標準化されたメタデータモデルである。「Ｓ－ＡＤＭ」は、Serial Audio Definition Modelの略である。
「ＡＥＳ」は、Audio Engineering Society（オーディオ技術者協会）の略であり、同協会が定めた規格には「ＡＥＳ」が冠される。
「ＩＥＣ」は、International Electrotechnical Commission（国際電気標準会議）の略であり、同会議が定めた規格にも「ＩＥＣ」が冠される。
「ＭＡＤＩ」は、Multichannel Audio Digital Interfaceの略であり、サンプル単位の精度でマルチチャンネルの長距離オーディオ伝送を可能とするインターフェイス技術の規格（ＡＥＳ１０）である。２００１年に拡張された「ＭＡＤＩ－Ｘ（MADI-Extended）」では、チャンネル数は６４チャンネル、サンプリングレートは４８ｋＨｚ±１％のバリピッチがサポートされた。
「ＰＣＭ」は、Pulse Code Modulation（パルス符号変調）の略である。
「ＳＤＩ」は、Serial Digital Interfaceの略である。
「ＳＭＰＴＥ」は、the Society of Motion Picture and Television Engineers（映画テレビ技術者協会）の略であるとともに、同協会が定めた規格に冠される記号でもある。
「ＳＴ」は、Standard（標準、規格）の略である。

【背景技術】

【0003】

オブジェクトベース音響を放送やストリーミングサービスで用いる場合、音声信号と音響メタデータを合わせて伝送する必要がある。その伝送方式の一つとして、シリアル表現された国際標準の音響メタデータ（Ｓ－ＡＤＭ）を、業務用のデジタル音声信号として広く用いられているＡＥＳ３に格納して伝送する方法が国際標準化されており（非特許文献１）、音声信号と音響メタデータをサンプル単位で同期して伝送することが可能である。

【0004】

この伝送方式は、ＡＥＳ３の音声信号を格納する領域に、ＰＣＭではなく符号化された音声信号などの非ＰＣＭのデータを格納して伝送する標準規格（非特許文献２）を元としている。格納されたデータは音声信号と同様に扱って記録・再生・伝送が可能であり、非ＰＣＭデータのために特殊な記録再生機やケーブルを用意する必要がないのが利点である。ただし、格納された非ＰＣＭのデータを正しく復号するためには、当該データが伝送前後においてビット単位で保持されている（欠落がない）必要がある。

【0005】

一方、放送局などの大規模な設備は、中継先から局内のスタジオ、副調整室から主調整室など、多数のシステムの組み合わせにより構成されている。異なる同期系で動作している複数のシステム間でＰＣＭのデジタル音声信号を受け渡しする際には、当該音声信号を受信側のシステムの同期に引き込むためにサンプリングレートコンバータを挿入することが一般的である。ここで、放送局で用いる音声信号のサンプリングレートは基本的に一定値（４８ｋＨｚなど）に統一されているためサンプリングレート自体は変換する必要がなく、音声信号を受信側システムの同期に引き込むことだけが目的であることが多い。

【先行技術文献】

【非特許文献】

【0006】

【非特許文献1】SMPTE ST 2116 Format for Non-PCM Audio and Data in AES3 - Carriage of Metadata of Serial ADM (Audio Definition Model)

【0007】

【非特許文献2】SMPTE ST 337 Format for Non-PCM Audio and Data in an AES3 Serial Digital Audio Interface

【発明の概要】

【発明が解決しようとする課題】

【0008】

オブジェクトベース音響の音響メタデータであるＳ－ＡＤＭをはじめ、符号化された音声信号などの非ＰＣＭデータを放送局などの大規模な設備内で伝送する場合、スタジオ間などで音声信号を受け渡しする際には、ＰＣＭと同様に当該音声信号を受信側の同期に引き込む必要がある。しかし従来のサンプリングレートコンバータは、受信したデジタル音声信号を一度アナログ音声信号（ないしはアナログ音声信号と同等とみなせるほどのハイサンプリングレートのデジタル音声信号）の波形に戻し（オーバーサンプリングし）、当該アナログ音声信号を受信側システムの同期信号を元に適切なサンプリングレートでリサンプリングすることで新しい同期に引き込むため、例えスタジオ間などの送受信（入出力）前後でサンプリングレートが同じ場合であってもデジタル音声信号のビット列は保持されず、Ｓ－ＡＤＭなどの非ＰＣＭのデータが伝送されていた場合にはデータに欠落が生じていた。

【0009】

デジタル音声信号のビット列を保持して異なる同期に引き込むために、最も単純な手段としては、元のデジタル音声信号に遅延を加えて引き込む先の同期信号にタイミングを揃えることが考えられる。しかし一般に、デジタル音声信号の生成に用いる同期信号源は、同じクロック周波数に設定されていたとしても信号源ごとにわずかな誤差が存在し、遅延を加えても正確には同期が取れずノイズを生じる原因となっていた。

【0010】

また、元の非ＰＣＭデータを一時的に復号し、再度符号化してＡＥＳ３に格納しなおすことで、ビット列自体は保持されずとも同内容のデータを受信側システムの同期系に引き込むことは可能だが、設備内の全ての同期装置に復号及び符号化の処理能力が必要となることによる装置のコスト増加の観点や、符号化・復号の繰り返しによる品質劣化の観点からも現実的ではなかった。

【0011】

係る事情を鑑みてなされた本発明の目的は、異なる同期系で動作している複数のシステムの組み合わせにより構成されている大規模な設備において、一のシステムが非ＰＣＭのデータを含む異なる同期系のデジタル音声信号を受信した場合であっても、ビット単位で前記デジタル音声信号のデータが保持されている状態で、受信したシステムの同期に引き込むことができるデジタル音声信号同期装置及びプログラムを提供することにある。

【課題を解決するための手段】

【0012】

本発明に係るデジタル音声信号同期装置は、入力されたデジタル音声信号を一時的に格納し、必要に応じてクリア処理を行うバッファ部と、前記入力されたデジタル音声信号と同期信号のクロック速度の違いに対応するために前記デジタル音声信号の間引き又は挿入を行うサンプル数調整部と、前記バッファ部から読み出した前記デジタル音声信号を前記同期信号に同期して再生する音声信号再生部と、を備える。

【0013】

前記バッファ部が、前記デジタル音声信号に格納された非ＰＣＭデータを一時的に格納するようにしてもよい。

【0014】

前記バッファ部が、前記デジタル音声信号に格納された非ＰＣＭデータのデータバーストを前記デジタル音声信号のデータに基づいて検出し、前記非ＰＣＭデータが入力されていない期間で、前記バッファ部のクリア処理又は読み書きインターバルのリセットを行うようにしてもよい。

【0015】

前記サンプル数調整部が、入力信号と同期信号のクロック速度の違いによって生じる前記バッファ部のオーバーフロー又はアンダーフローを検出し、非ＰＣＭデータのデータバーストの間の０データ区間で、前記オーバーフローを検出した場合は０データを間引き、前記アンダーフローを検出した場合は０データを挿入することにより、前記デジタル音声信号のサンプル数を調整するようにしてもよい。

【0016】

前記デジタル音声信号同期装置が、前記デジタル音声信号に格納された非ＰＣＭデータとＰＣＭデータを区別しその後の処理を分けるために非ＰＣＭデータを判定する非ＰＣＭデータ判定部と、非ＰＣＭデータから区別されたＰＣＭデータにサンプリングレートコンバート処理を加えることで前記同期信号に同期させるサンプリングレートコンバート部と、サンプリングレートコンバート処理されたＰＣＭデータに、非ＰＣＭデータの前記バッファ部への一時的な格納によって生じる遅延と同等の遅延を加えることにより、前記ＰＣＭデータと非ＰＣＭデータのタイミングを揃える遅延部と、をさらに備えるようにしてもよい。

【0017】

また、本発明は、コンピュータを制御するためのプログラムであって、前記コンピュータを、前記デジタル音声信号同期装置として機能させるためのデジタル音声信号同期プログラムであってもよい。

【発明の効果】

【0018】

本発明によれば、異なる同期系で動作している複数のシステムの組み合わせにより構成されている大規模な設備において、一のシステムが非ＰＣＭのデータを含む異なる同期系のデジタル音声信号を受信した場合であっても、データの欠落を防ぎながら、受信したシステムの同期に引き込むことが可能となる。

【図面の簡単な説明】

【0019】

【図1】本発明の音声信号同期装置１の構成例を示す図である。

【図2】本発明の音声信号同期装置１の一の実装例を示す図である。

【図3】本発明の音声信号同期装置１の他の実装例を示す図である。

【図4】本発明の音声信号同期装置１の処理フローチャートである。

【図5】実施例１の構成例を示す図である。

【図6】実施例１の処理フローチャートである。

【図7】ポインタ処理の例を示す図である。

【発明を実施するための形態】

【0020】

以下、図面を参照しながら本発明の実施形態について詳細に説明する。
図１は、本発明の一実施形態に係る音声信号同期装置１の構成例を示すブロック図である。図１に示す音声信号同期装置１は、バッファ部２と、サンプル数調整部３と、音声信号再生部４とを備える。

【0021】

音声信号同期装置１は、入力された非ＰＣＭデータを含むデジタル音声信号をバッファ部２に一時的に格納し、サンプル数調整部３によって入出力のクロック周波数のわずかな誤差に起因するサンプル数のずれを適切に調節したうえで、音声信号再生部４で同期信号に同期させて当該デジタル音声信号を再生する。

【0022】

音声信号同期装置１は、典型的には、同期系のデジタル音声信号を受信する側のシステムにおいて、当該システムの入力部として実装されるものである。この場合、デジタル音声信号の受信側システムにおける受信は当該システムへの入力であることから、受信側システムにおける「受信」は「入力」と同義と考えてよい。同様に、送信側システムにおける「送信」は「出力」と同義と考えてよい。ただし、ここでいう「システム」は、単一の機器である場合もあれば、複数の機器の組み合わせである場合もあることに留意する必要がある。

【0023】

図２は、音声信号同期装置１の一の実装例を示す図であり、図３は、音声信号同期装置１の他の実装例を示す図である。図２は、異なる同期系で動作しているスタジオＡとスタジオＢの組み合わせにより構成されている設備を示しており、図３は、当該設備のスタジオＢ側のみを示している。音声信号同期装置１は、図２の実装例ではデジタル音声信号を受信する側のシステムであるスタジオＢの入力部として実装されており、図３の実装例ではスタジオＢにおける音声卓の入力部として実装されている。ここで、スタジオＡの同期信号発生器Ａが発生する同期信号とスタジオＢの同期信号発生器Ｂが発生する同期信号は同じクロック周波数に設定されているが、わずかな誤差が存在し得るものである。

【0024】

図４は、本発明の一実施形態に係る音声信号同期装置１の処理手順を示すフローチャートの例である。以下、図４のフローを参照しつつ、一つひとつの処理を説明する。

【0025】

本発明の音声信号同期装置１はまず、入力された異なる同期系のデジタル音声信号をバッファ部２に格納する（図４のステップ１０１）。バッファ上でデータの書き込み・読み出しを行うために、処理全体に一定の遅延が生じるが、そのバッファ量は以降の処理に必要な最短のサイズに装置が自動で調節してもよいし、処理の余裕を確保するためにユーザが手動でサイズを決定してもよいし、入力された音声信号が映像に合わせることを前提としている場合には、映像信号の１フレームと同じ時間長になるよう決定してもよい。

【0026】

次に、バッファ部２に格納された非ＰＣＭデータを確認し、一定時間連続した無音区間があるかどうかを判定する（ステップ１０２）。一定の無音区間（例えば数秒間という、非ＰＣＭデータの送信周期に対し比較的長期の区間）を検出できない場合（ステップ１０２で「Ｎｏ」）は、後述するサンプル数調整部３の処理に進む。一定以上の無音区間を検出した場合（ステップ１０２で「Ｙｅｓ」）は、非ＰＣＭデータの伝送が途切れていると判断し、バッファに蓄積されたデータをクリアして（ステップ１０３）、改めて入力されたデータの格納を始める。バッファ部２に蓄積されたデータを随時クリアすることで、入力される音声信号と引き込む先の同期信号のクロック周波数のわずかな誤差が蓄積されることによって生じうるバッファのオーバーフローやアンダーフローを未然に防ぐことができる。非ＰＣＭデータが途切れていなくとも、ユーザが現在バッファに格納されているデータが不要であると判断可能な場合、ユーザの意図的な操作により、強制的にバッファのクリアを行ってもよい。

【0027】

ここで、バッファ部２に蓄積されたデータを全てクリアせず、バッファ上のデータ書き込み位置と読み出し位置を調節することでバッファのクリアの代用としてもよい。例えば、書き込みの速度が読み出しの速度より早い場合に無音区間内で書き込みポインタを巻き戻したり、逆に読み出しの速度が書き込みの速度より早い場合に無音区間内でバッファとは別のＮｕｌｌデータを一時的に読み込ませたりすることでも、書き込みポインタと読み出しポインタの差分を処理開始時と同様に戻し、バッファのオーバーフローやアンダーフローを未然に防ぐことが可能である。この場合のバッファは、先頭と末尾が連結されたリングバッファなど、連続的に読み書きを行ってもバッファを使い果たすことがないものが好ましい。

【0028】

非特許文献２で伝送される非ＰＣＭデータは、その中身が符号化された音声信号やメタデータであるために、対応するＰＣＭデータに比較し一般にデータ量が小さい。そこで非ＰＣＭデータは、ある程度の連続したデジタル音声信号に格納されて伝送される、いわゆるバースト伝送が行われ、次のデータバーストを送信するまでの期間は０データが埋め込まれる。非特許文献２の標準規格では、あるデータバーストから次のデータバーストまでの期間を最大４０９６サンプルに制限しているため、音声信号同期装置の無音区間の判定にそのまま４０９６サンプルを用いてもよいし、非ＰＣＭデータのデータバーストが一定の周期で入力されることが事前にわかっている場合などでは、その周期に合わせた長さを用いてもよいし、非特許文献２の標準規格で規定されるデータバーストの第４音声サンプルに記載されるデータバーストのバイト数のデータ（Ｐｄと呼ばれる）を確認して無音区間を特定してもよい。

【0029】

ステップ１０２で一定期間連続で無音を検出できない場合は、次に、サンプル数調整部３で入力信号と同期信号（出力信号）のクロック速度を比較する（ステップ１０４）。クロック速度を直接的に比較してもよいし、バッファの書き込みポインタ及び読み出しポインタの位置関係の変化により速度差を判断してもよい。本発明の音声信号同期装置では、入力信号と同期信号のサンプリングレートは同じに設定されていることを前提としているが、そのクロック速度のわずかな誤差、及び誤差の蓄積によるバッファのオーバーフロー又はアンダーフローを検出する（ステップ１０５で「オーバーフロー」又は「アンダーフロー」）。バッファ部２で逐次、バッファのクリアが行われていた場合はオーバーフロー又はアンダーフローは未然に防がれていると判断できるが、長時間非ＰＣＭデータが途切れず伝送され続けた場合など、バッファのクリアが行えなかった場合には、オーバーフロー又はアンダーフローへの対処として、サンプル数の調整（ステップ１０６ないし１０８）に進む。

【0030】

具体的には、データバーストの開始点となるデジタル音声信号のデータ（サンプル）を検出し、その直前の埋め込み区間で０データを間引くか、又は０データを挿入する。非特許文献２では、データバーストの開始点を示すため、データバーストの第１サンプルと第２サンプルに、Ｐａ、Ｐｂと呼ばれる特殊なデータを格納する。Ｐａ、Ｐｂは、例えばビット深度が１６ｂｉｔの時のＰａは０ｘＦ８７２、２４ｂｉｔの時は０ｘ９６Ｆ８７２などと、デジタル音声信号のビット深度に応じたサイズのデータが規定されている。加えて、Ｐａ、Ｐｂの直前に４サンプル以上埋め込みの０データを連続させることも合わせて規定されている。Ｐａ、Ｐｂだけの２サンプルだけではＰＣＭの音声信号や符号化されたデータが偶然Ｐａ、Ｐｂと同じビット列となり、データバーストが誤検出される可能性もあったが、直前の４サンプルとあわせた６サンプル（０，０，０，０，Ｐａ，Ｐｂ）をもってデータバーストを検出することで、誤検出の可能性を実用上問題ないレベルまで下げることが可能となっている。

【0031】

バッファ部２で逐次、バッファのクリアが行われていた場合、あるいは入力信号と同期信号のクロック速度が極めて高い精度で一致していた時など、オーバーフロー及びアンダーフローが生じないと判断される場合（ステップ１０５で「それ以外」）にはサンプル数の調整を行わない。

【0032】

ここで、誤差がある程度蓄積しても、オーバーフロー又はアンダーフローが生じないうちはその誤差を許容して０データの間引き又は挿入を行わずに、バッファをクリアできるタイミングを待ってもよいし（バッファクリア優先モード）、誤差の蓄積が音声信号１サンプル分を超えた時点で逐次０データの間引き又は挿入を行ってもよい（サンプル数調整優先モード）。

【0033】

なお、サンプル数調整優先モードにおいて、誤差の蓄積が音声信号１サンプル分を超えた時点で逐次０データの間引き又は挿入を行う場合には、間引き／挿入する０データのサンプル数は当然に１サンプルとなる。

【0034】

これに対して、バッファクリア優先モードでは、オーバーフロー又はアンダーフローが生じないうちは誤差を許容するので基本的には間引き／挿入を行わないが、番組長が極端に長い場合など、バッファがクリアできるタイミングが長時間訪れずにバッファのオーバーフロー又はアンダーフローが生じてしまいそうな範囲まで誤差が蓄積した場合には間引き／挿入、ないし強制的なバッファのクリアを行わざるを得なくなる。間引き／挿入を行う場合、サンプル数調整優先モードと同様に１サンプルを間引き／挿入してもよいし、調整のタイミングを減らすためにまとめて複数サンプルを間引き／挿入してもよい。ただし、定期的に調整可能な０データはＰａ、Ｐｂ前の４サンプル分しか保証されないので、複数サンプルといっても４サンプルが限度であり、バッファクリア優先モードにおいて０データの間引き／挿入を行う場合のサンプル数は１～４サンプルとなる。

【0035】

バッファクリア優先モードでは、バッファがクリアされるタイミングまでは、あるいは誤差の蓄積が進み０データの間引き又は挿入が必要となるタイミングまでは、装置に入力されたデジタル音声信号が完全に保持されるため、本装置を介して音声信号を接続するシステムの動作に関して、より高い安定性が期待できる。一方、サンプル数調整優先モードでは、後述するようにＰＣＭデータと非ＰＣＭデータを別々に扱うときなどに、データバースト単位でＰＣＭデータと非ＰＣＭデータの絶対時刻が合わせられることになり、より高い時間的精度が期待できる。

【0036】

最後に、音声信号再生部４で、サンプル数を調整済みの、又は調整が必要ないと判断された非ＰＣＭデータを、同期信号に同期して再生する（ステップ１１０）。以降一連の処理を、音声信号同期装置１が停止されるまで繰り返す。

【0037】

なお、ＡＥＳ３やＡＥＳ３の拡張であるＭＡＤＩ（ＡＥＳ１０）では、一つの音声ストリームに複数のチャンネルのデータを合わせて伝送可能であり、ＰＣＭデータと非ＰＣＭデータが混在して入力されることが考えられる。その場合、上記の一連の処理をＰＣＭデータにも適応してもよいし、一連の処理を加える前にＰＣＭデータのチャンネルと非ＰＣＭデータのチャンネルを分離し、別々の処理を加えてもよい。後者の場合、例えば非ＰＣＭデータには上記の一連の処理を行い、ＰＣＭデータには従来のサンプリングレートコンバート処理を行い、非ＰＣＭデータの処理によって生じる遅延を加えた上で、それぞれの処理が完了したＰＣＭデータと非ＰＣＭデータをまた一つの音声ストリームとして出力する。

【0038】

ＰＣＭデータの場合、無理にサンプルを挿入又は間引くと、その処理が例え１サンプルだけであったとしても可聴レベルのノイズを生じる可能性がある。バッファ部２でバッファのクリアが行えずに、サンプルの挿入又は間引きが必要な場合には、ＰＣＭデータは従来のサンプリングレートコンバート処理により同期に引き込むことで、ビット列は保持されておらずとも聴感上の問題が生じる可能性を従来のサンプリングレートコンバータと同程度に抑えることが可能である。

【0039】

以下、本発明の実施例について説明する。
（実施例１）
本発明の実施例１として、ＭＡＤＩでオブジェクトベース音響コンテンツのストリームが入力された場合を例にとって説明する。ＭＡＤＩの６４チャンネルのうち、１～６０チャンネルにＰＣＭデータ、６１～６４チャンネルにＳ－ＡＤＭ（非ＰＣＭデータ）が格納されており、データバーストは規格上最大の４０９６サンプルごとに送信されているものとする。バッファ部２での遅延量を、インターレース方式の映像のフレームレート（６０Ｈｚ）に合わせ、１÷３０≒３３ｍｓ（ミリ秒）とする。

【0040】

業務用の音声同期信号発生器（マスタークロックジェネレータ）の多くは発振器にルビジウムを用いられ、高い精度の同期信号を出力する。例えばデジタル音声信号用の同期信号の一種でありＩＥＣ６０９５８－４の中で規定されているＡＥＳ１１のＧｒａｄｅ１では、周波数精度の許容範囲を±１ｐｐｍ（parts per million）以内とすることが定められている。実施例１では規格の範囲内で最大のずれを想定し、入出力信号のクロック周波数を４８ｋＨｚ＋１ｐｐｍ及び４８ｋＨｚ－１ｐｐｍとする。

【0041】

図５は実施例１の構成例を示すブロック図、図６は実施例１の処理フローの例である。図５に示すとおり、実施例１に係る音声信号同期装置１は、バッファ部２、サンプル数調整部３及び音声信号再生部４に加えて、非ＰＣＭデータ判定部５と、遅延部６と、サンプリングレートコンバータ部７とをさらに備える。

【0042】

入力されたＭＡＤＩ信号はまず、非ＰＣＭデータ判定部５によりＰＣＭチャネルか非ＰＣＭチャネルかの判定が行われ（図６のステップ２０１）、非ＰＣＭデータが格納されている６１～６４チャンネルのデータはバッファ部２に、ＰＣＭが格納されている１～６０チャンネルのデータは遅延部６にそれぞれ送られる。

【0043】

ここで、非ＰＣＭデータが格納されているチャンネルの判定に、データバーストの開始を示すＰａ、Ｐｂとその直前の４サンプルとあわせた６サンプル（０，０，０，０，Ｐａ，Ｐｂ）が存在しているかによって装置が自動で処理を切り替えてもよいし、オブジェクトベース音響コンテンツのストリームなどのＰＣＭデータと非ＰＣＭデータが混在して伝送される場合には、Ｓ－ＡＤＭ（非ＰＣＭデータ）を伝送しているチャンネルは事前に決められていることも十分考えられるため、あらかじめユーザが６１～６４チャンネルのみを非ＰＣＭデータと扱うように指定してもよい。

【0044】

６１～６４チャンネルの非ＰＣＭデータについては、バッファ部２でバッファに書き込まれ、読み出しを待つ状態になる（ステップ２０２）。
入出力信号のクロック周波数が４８ｋＨｚ＋１ｐｐｍ及び４８ｋＨｚ－１ｐｐｍであり、そのずれは４８ｋＨｚの２ｐｐｍとなるため、１時間で最大３６００（秒）×４８０００（サンプル／秒）×２×１０^－６≒３４６サンプル（７．２ｍｓ）となる。誤差の蓄積が事前に設定された遅延量３３ｍｓを超えるのに約４．６時間かかる。一般的な放送番組の時間長を考慮すると、誤差が蓄積する前に番組が終了し、Ｓ－ＡＤＭ（非ＰＣＭデータ）を含めオブジェクトベース音響のストリームが一度途切れ、クリアが可能であると考えられる。

【0045】

このように、一般的な番組長を考えると、オブジェクトベース音響ではバッファのクリアが適切に行われ、アンダーフロー又はオーバーフローの対策のために０データの間引き／挿入が必要となるケースは少ないことが想定される。そのため、元のデータを完全に保持することを優先してバッファクリア優先モードを用いてもよいし、サンプルのずれが最小になるよう逐次補正することを優先してサンプル数調整優先モードを用いてもよい。

【0046】

なお、バッファクリア優先モードを用いた場合には、誤差の蓄積に応じてＰＣＭデータとＳ－ＡＤＭ（非ＰＣＭデータ）の時刻にずれが生じる可能性がある。Ｓ－ＡＤＭでは、時刻によってＰＣＭデータにかけあわせるゲインを動的に変えるといった記述が可能であり、時刻ずれによってＰＣＭデータにかけ合わせるゲインに誤差が生じ得るが、その時刻ずれは上記のとおり１時間で約７ｍｓと十分小さい。市販されている業務用のデジタル音声卓には、音声エンジニアが操作したフェーダのゲインを読み取る周期が２０ｍｓと、７ｍｓより数倍大きい製品も存在し、実用上問題にならないと考えられる。

【0047】

バッファクリア優先モードを用いた場合には、０データの間引き／挿入処理は行われず、バッファから読み出されたサンプル（非ＰＣＭデータ）をそのまま入力された同期信号に同期して再生する。サンプル数調整優先モードを用いた場合には、１÷（４８０００×２×１０^－６）≒１０．４２秒ごとに生じる１サンプル分のずれを補正するため、１０．４２÷（４０９６÷４８０００）≒１２２回のデータバーストのうち１回の直前で１サンプル分の０データの間引き又は挿入が行われる。

【0048】

１～６０チャンネルのＰＣＭデータについては、非ＰＣＭデータからは分離されて処理される。
まず、非ＰＣＭデータのバッファによって生じる遅延に合わせるため、ＰＣＭデータについても遅延（ディレイ）処理を加える（ステップ２０３）。そのディレイ値は、非ＰＣＭデータのバッファ部２で自動又は手動で設定された遅延量に合わせて決定する。
その後、従来のサンプリングレートコンバート処理を加える（ステップ２０４）。ここで、１～６０チャンネルのＰＣＭデータについて、実施例１の装置の入出力前後を比較すると、ビット単位の正確性は損なわれるが、聴感上の違いを小さく抑えながら、入力された同期信号に引き込むことが可能である。加えて、ＭＡＤＩなどによる多チャンネル入力が想定される場合、実施例１のようにバッファ部２に格納するのを非ＰＣＭデータだけとすることで、バッファ部２に必要なメモリの量を抑えることができるというメリットもある。

【0049】

以上の処理により、非ＰＣＭデータ及びＰＣＭデータの両方が入力された同期信号に同期している状態になったため、最後にこれらの信号を統合し（ステップ２０５）、再度１～６４チャンネルのＭＡＤＩとして出力する。

【0050】

（実施例２）
本発明の実施例２として、ＳＤＩ信号で映像を伴うオブジェクトベース音響コンテンツのストリームを伝送している場合を例にとって説明する。ＳＤＩ信号を異なる同期系に引き込む際に用いられるフレームシンクロナイザは、入力された映像信号にエンベデッドされている音声信号を分離（デマルチプレックス）し、映像と音声は別々に同期引き込み処理をしたのちに再度統合（マルチプレックス）して出力する。この際、音声信号の同期引き込み処理は、従来のサンプリングレートコンバート処理を行っていることが一般的である。実施例２では、このサンプリングレートコンバート処理を本発明の装置の処理に置き換えることを想定して説明する。

【0051】

映像に合わせることが前提の音声信号であるため、ＳＤＩの１～１５チャンネルにＰＣＭデータ、１６チャンネルにＳ－ＡＤＭ（非ＰＣＭデータ）が格納されており、データバーストは映像のフレームレート（６０Ｈｚ）に合わせて、４８０００÷６０＝８００サンプルごとに送信されているものとする。バッファ部２での遅延量、入力信号と同期信号のクロック速度は実施例１と同じとし、バッファ部２にはリングバッファを用いる。なお、バッファ部２でのデータクリアは、ポインタの調整によって代用する。

【0052】

ブロック図及びフロー図は実施例１と同じである。入力された１６チャンネルの音声信号はまず、非ＰＣＭデータ判定部５により、非ＰＣＭデータが格納されている１６チャンネルのデータはバッファ部２に、ＰＣＭが格納されている１～１５チャンネルのデータは遅延部６にそれぞれ送られる。

【0053】

１６チャンネルの非ＰＣＭデータについては、バッファ部２でバッファに書き込まれ、読み出しを待つ状態になる。入力信号と同期信号のクロック周波数のずれは実施例１と同じであるため、バッファ部２でのデータクリアが可能であると考えられる。

【0054】

ここで、バッファ部２を実際にはクリアをせずとも、リングバッファの書込ポインタと読出ポインタを調整することで代用することができる。図７はポインタの調整の例である。バッファ部２での遅延が１÷６０≒１６．７ｍｓと設定されており、動作開始当初には読出ポインタから書込ポインタに対し８００サンプル分遅らせられている。入力音声信号と同期信号のクロック速度が完全に同一である場合は、動作開始後も読出ポインタと書込ポインタの差分（インターバル）が８００サンプルに保たれるが、クロック速度に差がある場合にはこの差分が徐々に拡大又は縮小する。差分が拡大しているときには、リングバッファをクリア可能となったタイミングで、書込ポインタを読出ポインタ＋８００（インターバル分）に変更する（巻き戻す）ことで、リングバッファをクリアせずとも動作開始当初のインターバルにリセットできる。逆に、差分が縮小しているときには、インターバル分の０（Ｎｕｌｌ）データが格納された補助バッファを別途用意しておき、リングバッファをクリア可能となったタイミングで読出ポインタを補助バッファに移し、補助バッファの読み出しが終わった時点で、読出ポインタをリングバッファがクリア可能となったタイミングでの書込ポインタと同じ値とすることで、リングバッファをクリアせずとも動作開始当初のインターバルにリセットできる。ここで、わかりやすさのために、リングバッファをクリア可能となったタイミングで、書込ポインタをリングバッファの第１インデックスに変更してもよい。

【0055】

実施例１と同様にバッファクリア優先モードとサンプル数調整優先モードの選択によって０データの間引き／挿入処理を行ったうえで、バッファから読み出されたサンプル（非ＰＣＭデータ）を別途入力された同期信号に同期して再生する。

【0056】

１～１５チャンネルのＰＣＭデータについては、実施例１と同様に非ＰＣＭデータからは分離し、遅延処理とサンプリングレートコンバート処理を加える。

【0057】

以上の処理により、非ＰＣＭデータ及びＰＣＭデータの両方が入力された同期信号に同期している状態になったため、最後にこれらの信号を統合し１～１６チャンネルの音声信号とすることで、ＳＤＩ信号にマルチプレックスして出力することが可能となる。

【0058】

本実施形態によれば、異なる同期系で動作している複数のシステムの組み合わせにより構成されている大規模な設備において、一のシステムが非ＰＣＭのデータを含む異なる同期系のデジタル音声信号を受信した場合であっても、非ＰＣＭデータを格納したチャンネルを含むデジタル音声信号を一定量バッファリングし、別途入力された同期信号に同期してバッファリングしたデータを出力することで受信したシステムの同期に引き込むので、データの欠落を防ぎながら、受信したシステムの同期に引き込むことが可能となる。

【0059】

また、非ＰＣＭデータを復号せず、非ＰＣＭデータが格納されたデジタル音声信号のデータに基づいて、バッファのクリアタイミングやサンプル数を調整可能なタイミングを検出することで、復号及び符号化の処理能力を必要とせず、かつ低遅延での処理を実現することが可能となる。

【0060】

上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変形及び変更ができることは当業者に明らかである。したがって、本発明は、上述の実施形態に限るものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。例えば、図４に記載した処理を、図２に示したスタジオや図３に示したデジタル音声卓の入力部や、コンピュータのデジタル音声信号入力ボード（図示せず）の一機能として実装することが可能である。

【0061】

また、上述の本実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本実施形態に記載されたものに限定されるものではない。

【0062】

さらに、上述した音声信号同期装置１として機能させるためにコンピュータを好適に用いることができ、音声信号同期装置１の各機能を実現する処理内容を記述したプログラムをコンピュータの記憶部に格納しておき、該コンピュータのＣＰＵによってこのプログラムを読み出して実行させることで音声信号同期装置１を実現することができる。

【0063】

また、このようなプログラムは、コンピュータ読み取りが可能な媒体に記録されていてもよい。コンピュータ読取可能媒体を用いれば、プログラムをコンピュータにインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取可能媒体は、非一時的な記録媒体であってもよい。非一時的な記録媒体は、特に限定されるものではないが、例えば、ＣＤ－ＲＯＭやＤＶＤ－ＲＯＭなどの記録媒体であってもよい。

【符号の説明】

【0064】

１音声信号同期装置
２バッファ部
３サンプル数調整部
４音声信号再生部
５非ＰＣＭデータ判定部
６遅延部
７サンプリングレートコンバータ部

【図1】