(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023179125
(43)【公開日】2023-12-19
(54)【発明の名称】デジタル音声信号同期装置及びプログラム
(51)【国際特許分類】
G10L 19/00 20130101AFI20231212BHJP
【FI】
G10L19/00 312G
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2022092224
(22)【出願日】2022-06-07
(71)【出願人】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】100106002
【弁理士】
【氏名又は名称】正林 真之
(74)【代理人】
【識別番号】100120891
【弁理士】
【氏名又は名称】林 一好
(72)【発明者】
【氏名】久保 弘樹
(72)【発明者】
【氏名】大出 訓史
(72)【発明者】
【氏名】西口 敏行
(72)【発明者】
【氏名】杉本 岳大
(72)【発明者】
【氏名】中山 靖茂
(72)【発明者】
【氏名】大久保 洋幸
(57)【要約】 (修正有)
【課題】異なる同期系で動作している複数のシステムの組み合わせにより構成されている大規模な設備において、一のシステムが非PCMのデータを含む異なる同期系のデジタル音声信号を受信した場合であっても、ビット単位で前記デジタル音声信号のデータが保持されている状態で、受信したシステムの同期に引き込むことができるデジタル音声信号同期装置及びプログラムを提供する
【解決手段】音声信号同期装置1は、入力されたデジタル音声信号を一時的に格納し、必要に応じてクリア処理を行うバッファ部2と、入力されたデジタル音声信号と同期信号のクロック速度の違いに対応するために前記デジタル音声信号の間引き又は挿入を行うサンプル数調整部3と、バッファ部2から読み出したデジタル音声信号を同期信号に同期して再生する音声信号再生部4と、を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
デジタル音声信号の同期装置であって、
入力されたデジタル音声信号を一時的に格納し、必要に応じてクリア処理を行うバッファ部と、
前記入力されたデジタル音声信号と同期信号のクロック速度の違いに対応するために前記デジタル音声信号の間引き又は挿入を行うサンプル数調整部と、
前記バッファ部から読み出した前記デジタル音声信号を前記同期信号に同期して再生する音声信号再生部と、
を備えるデジタル音声信号同期装置。
【請求項2】
前記バッファ部は、前記デジタル音声信号に格納された非PCMデータを一時的に格納する請求項1に記載のデジタル音声信号同期装置。
【請求項3】
前記バッファ部は、前記デジタル音声信号に格納された非PCMデータのデータバーストを前記デジタル音声信号のデータに基づいて検出し、前記非PCMデータが入力されていない期間で、前記バッファ部のクリア処理又は読み書きインターバルのリセットを行う請求項2に記載のデジタル音声信号同期装置。
【請求項4】
前記サンプル数調整部は、
入力信号と同期信号のクロック速度の違いによって生じる前記バッファ部のオーバーフロー又はアンダーフローを検出し、非PCMデータのデータバーストの間の0データ区間で、前記オーバーフローを検出した場合は0データを間引き、前記アンダーフローを検出した場合は0データを挿入することにより、前記デジタル音声信号のサンプル数を調整する請求項2に記載のデジタル音声信号同期装置。
【請求項5】
前記デジタル音声信号に格納された非PCMデータとPCMデータを区別しその後の処理を分けるために非PCMデータを判定する非PCMデータ判定部と、
非PCMデータから区別されたPCMデータにサンプリングレートコンバート処理を加えることで前記同期信号に同期させるサンプリングレートコンバート部と、
サンプリングレートコンバート処理されたPCMデータに、非PCMデータの前記バッファ部への一時的な格納によって生じる遅延と同等の遅延を加えることにより、前記PCMデータと非PCMデータのタイミングを揃える遅延部と、
をさらに備える請求項2に記載のデジタル音声信号同期装置。
【請求項6】
コンピュータを制御するためのプログラムであって、前記コンピュータを、請求項1から5のいずれか一項に記載のデジタル音声信号同期装置として機能させるためのデジタル音声信号同期プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、異なる同期系で動作している複数のシステムの組み合わせにより構成されている大規模な設備において、一のシステムが異なる同期系のデジタル音声信号を受信した場合であっても、ビット単位で前記デジタル音声信号のデータが保持されている状態で、受信したシステムの同期に引き込むことのできるデジタル音声信号同期装置及びプログラムに関する。
【0002】
始めに、本明細書において用いる略語を解説する。
「ADM」は、Audio Definition Modelの略であり、オーディオの技術的特性を記述するための標準化されたメタデータモデルである。「S-ADM」は、Serial Audio Definition Modelの略である。
「AES」は、Audio Engineering Society(オーディオ技術者協会)の略であり、同協会が定めた規格には「AES」が冠される。
「IEC」は、International Electrotechnical Commission(国際電気標準会議)の略であり、同会議が定めた規格にも「IEC」が冠される。
「MADI」は、Multichannel Audio Digital Interfaceの略であり、サンプル単位の精度でマルチチャンネルの長距離オーディオ伝送を可能とするインターフェイス技術の規格(AES10)である。2001年に拡張された「MADI-X(MADI-Extended)」では、チャンネル数は64チャンネル、サンプリングレートは48kHz±1%のバリピッチがサポートされた。
「PCM」は、Pulse Code Modulation(パルス符号変調)の略である。
「SDI」は、Serial Digital Interfaceの略である。
「SMPTE」は、the Society of Motion Picture and Television Engineers(映画テレビ技術者協会)の略であるとともに、同協会が定めた規格に冠される記号でもある。
「ST」は、Standard(標準、規格)の略である。
【背景技術】
【0003】
オブジェクトベース音響を放送やストリーミングサービスで用いる場合、音声信号と音響メタデータを合わせて伝送する必要がある。その伝送方式の一つとして、シリアル表現された国際標準の音響メタデータ(S-ADM)を、業務用のデジタル音声信号として広く用いられているAES3に格納して伝送する方法が国際標準化されており(非特許文献1)、音声信号と音響メタデータをサンプル単位で同期して伝送することが可能である。
【0004】
この伝送方式は、AES3の音声信号を格納する領域に、PCMではなく符号化された音声信号などの非PCMのデータを格納して伝送する標準規格(非特許文献2)を元としている。格納されたデータは音声信号と同様に扱って記録・再生・伝送が可能であり、非PCMデータのために特殊な記録再生機やケーブルを用意する必要がないのが利点である。ただし、格納された非PCMのデータを正しく復号するためには、当該データが伝送前後においてビット単位で保持されている(欠落がない)必要がある。
【0005】
一方、放送局などの大規模な設備は、中継先から局内のスタジオ、副調整室から主調整室など、多数のシステムの組み合わせにより構成されている。異なる同期系で動作している複数のシステム間でPCMのデジタル音声信号を受け渡しする際には、当該音声信号を受信側のシステムの同期に引き込むためにサンプリングレートコンバータを挿入することが一般的である。ここで、放送局で用いる音声信号のサンプリングレートは基本的に一定値(48kHzなど)に統一されているためサンプリングレート自体は変換する必要がなく、音声信号を受信側システムの同期に引き込むことだけが目的であることが多い。
【先行技術文献】
【非特許文献】
【0006】
【非特許文献1】SMPTE ST 2116 Format for Non-PCM Audio and Data in AES3 - Carriage of Metadata of Serial ADM (Audio Definition Model)
【0007】
【非特許文献2】SMPTE ST 337 Format for Non-PCM Audio and Data in an AES3 Serial Digital Audio Interface
【発明の概要】
【発明が解決しようとする課題】
【0008】
オブジェクトベース音響の音響メタデータであるS-ADMをはじめ、符号化された音声信号などの非PCMデータを放送局などの大規模な設備内で伝送する場合、スタジオ間などで音声信号を受け渡しする際には、PCMと同様に当該音声信号を受信側の同期に引き込む必要がある。しかし従来のサンプリングレートコンバータは、受信したデジタル音声信号を一度アナログ音声信号(ないしはアナログ音声信号と同等とみなせるほどのハイサンプリングレートのデジタル音声信号)の波形に戻し(オーバーサンプリングし)、当該アナログ音声信号を受信側システムの同期信号を元に適切なサンプリングレートでリサンプリングすることで新しい同期に引き込むため、例えスタジオ間などの送受信(入出力)前後でサンプリングレートが同じ場合であってもデジタル音声信号のビット列は保持されず、S-ADMなどの非PCMのデータが伝送されていた場合にはデータに欠落が生じていた。
【0009】
デジタル音声信号のビット列を保持して異なる同期に引き込むために、最も単純な手段としては、元のデジタル音声信号に遅延を加えて引き込む先の同期信号にタイミングを揃えることが考えられる。しかし一般に、デジタル音声信号の生成に用いる同期信号源は、同じクロック周波数に設定されていたとしても信号源ごとにわずかな誤差が存在し、遅延を加えても正確には同期が取れずノイズを生じる原因となっていた。
【0010】
また、元の非PCMデータを一時的に復号し、再度符号化してAES3に格納しなおすことで、ビット列自体は保持されずとも同内容のデータを受信側システムの同期系に引き込むことは可能だが、設備内の全ての同期装置に復号及び符号化の処理能力が必要となることによる装置のコスト増加の観点や、符号化・復号の繰り返しによる品質劣化の観点からも現実的ではなかった。
【0011】
係る事情を鑑みてなされた本発明の目的は、異なる同期系で動作している複数のシステムの組み合わせにより構成されている大規模な設備において、一のシステムが非PCMのデータを含む異なる同期系のデジタル音声信号を受信した場合であっても、ビット単位で前記デジタル音声信号のデータが保持されている状態で、受信したシステムの同期に引き込むことができるデジタル音声信号同期装置及びプログラムを提供することにある。
【課題を解決するための手段】
【0012】
本発明に係るデジタル音声信号同期装置は、入力されたデジタル音声信号を一時的に格納し、必要に応じてクリア処理を行うバッファ部と、前記入力されたデジタル音声信号と同期信号のクロック速度の違いに対応するために前記デジタル音声信号の間引き又は挿入を行うサンプル数調整部と、前記バッファ部から読み出した前記デジタル音声信号を前記同期信号に同期して再生する音声信号再生部と、を備える。
【0013】
前記バッファ部が、前記デジタル音声信号に格納された非PCMデータを一時的に格納するようにしてもよい。
【0014】
前記バッファ部が、前記デジタル音声信号に格納された非PCMデータのデータバーストを前記デジタル音声信号のデータに基づいて検出し、前記非PCMデータが入力されていない期間で、前記バッファ部のクリア処理又は読み書きインターバルのリセットを行うようにしてもよい。
【0015】
前記サンプル数調整部が、入力信号と同期信号のクロック速度の違いによって生じる前記バッファ部のオーバーフロー又はアンダーフローを検出し、非PCMデータのデータバーストの間の0データ区間で、前記オーバーフローを検出した場合は0データを間引き、前記アンダーフローを検出した場合は0データを挿入することにより、前記デジタル音声信号のサンプル数を調整するようにしてもよい。
【0016】
前記デジタル音声信号同期装置が、前記デジタル音声信号に格納された非PCMデータとPCMデータを区別しその後の処理を分けるために非PCMデータを判定する非PCMデータ判定部と、非PCMデータから区別されたPCMデータにサンプリングレートコンバート処理を加えることで前記同期信号に同期させるサンプリングレートコンバート部と、サンプリングレートコンバート処理されたPCMデータに、非PCMデータの前記バッファ部への一時的な格納によって生じる遅延と同等の遅延を加えることにより、前記PCMデータと非PCMデータのタイミングを揃える遅延部と、をさらに備えるようにしてもよい。
【0017】
また、本発明は、コンピュータを制御するためのプログラムであって、前記コンピュータを、前記デジタル音声信号同期装置として機能させるためのデジタル音声信号同期プログラムであってもよい。
【発明の効果】
【0018】
本発明によれば、異なる同期系で動作している複数のシステムの組み合わせにより構成されている大規模な設備において、一のシステムが非PCMのデータを含む異なる同期系のデジタル音声信号を受信した場合であっても、データの欠落を防ぎながら、受信したシステムの同期に引き込むことが可能となる。
【図面の簡単な説明】
【0019】
【
図1】本発明の音声信号同期装置1の構成例を示す図である。
【
図2】本発明の音声信号同期装置1の一の実装例を示す図である。
【
図3】本発明の音声信号同期装置1の他の実装例を示す図である。
【
図4】本発明の音声信号同期装置1の処理フローチャートである。
【発明を実施するための形態】
【0020】
以下、図面を参照しながら本発明の実施形態について詳細に説明する。
図1は、本発明の一実施形態に係る音声信号同期装置1の構成例を示すブロック図である。
図1に示す音声信号同期装置1は、バッファ部2と、サンプル数調整部3と、音声信号再生部4とを備える。
【0021】
音声信号同期装置1は、入力された非PCMデータを含むデジタル音声信号をバッファ部2に一時的に格納し、サンプル数調整部3によって入出力のクロック周波数のわずかな誤差に起因するサンプル数のずれを適切に調節したうえで、音声信号再生部4で同期信号に同期させて当該デジタル音声信号を再生する。
【0022】
音声信号同期装置1は、典型的には、同期系のデジタル音声信号を受信する側のシステムにおいて、当該システムの入力部として実装されるものである。この場合、デジタル音声信号の受信側システムにおける受信は当該システムへの入力であることから、受信側システムにおける「受信」は「入力」と同義と考えてよい。同様に、送信側システムにおける「送信」は「出力」と同義と考えてよい。ただし、ここでいう「システム」は、単一の機器である場合もあれば、複数の機器の組み合わせである場合もあることに留意する必要がある。
【0023】
図2は、音声信号同期装置1の一の実装例を示す図であり、
図3は、音声信号同期装置1の他の実装例を示す図である。
図2は、異なる同期系で動作しているスタジオAとスタジオBの組み合わせにより構成されている設備を示しており、
図3は、当該設備のスタジオB側のみを示している。音声信号同期装置1は、
図2の実装例ではデジタル音声信号を受信する側のシステムであるスタジオBの入力部として実装されており、
図3の実装例ではスタジオBにおける音声卓の入力部として実装されている。ここで、スタジオAの同期信号発生器Aが発生する同期信号とスタジオBの同期信号発生器Bが発生する同期信号は同じクロック周波数に設定されているが、わずかな誤差が存在し得るものである。
【0024】
図4は、本発明の一実施形態に係る音声信号同期装置1の処理手順を示すフローチャートの例である。以下、
図4のフローを参照しつつ、一つひとつの処理を説明する。
【0025】
本発明の音声信号同期装置1はまず、入力された異なる同期系のデジタル音声信号をバッファ部2に格納する(
図4のステップ101)。バッファ上でデータの書き込み・読み出しを行うために、処理全体に一定の遅延が生じるが、そのバッファ量は以降の処理に必要な最短のサイズに装置が自動で調節してもよいし、処理の余裕を確保するためにユーザが手動でサイズを決定してもよいし、入力された音声信号が映像に合わせることを前提としている場合には、映像信号の1フレームと同じ時間長になるよう決定してもよい。
【0026】
次に、バッファ部2に格納された非PCMデータを確認し、一定時間連続した無音区間があるかどうかを判定する(ステップ102)。一定の無音区間(例えば数秒間という、非PCMデータの送信周期に対し比較的長期の区間)を検出できない場合(ステップ102で「No」)は、後述するサンプル数調整部3の処理に進む。一定以上の無音区間を検出した場合(ステップ102で「Yes」)は、非PCMデータの伝送が途切れていると判断し、バッファに蓄積されたデータをクリアして(ステップ103)、改めて入力されたデータの格納を始める。バッファ部2に蓄積されたデータを随時クリアすることで、入力される音声信号と引き込む先の同期信号のクロック周波数のわずかな誤差が蓄積されることによって生じうるバッファのオーバーフローやアンダーフローを未然に防ぐことができる。非PCMデータが途切れていなくとも、ユーザが現在バッファに格納されているデータが不要であると判断可能な場合、ユーザの意図的な操作により、強制的にバッファのクリアを行ってもよい。
【0027】
ここで、バッファ部2に蓄積されたデータを全てクリアせず、バッファ上のデータ書き込み位置と読み出し位置を調節することでバッファのクリアの代用としてもよい。例えば、書き込みの速度が読み出しの速度より早い場合に無音区間内で書き込みポインタを巻き戻したり、逆に読み出しの速度が書き込みの速度より早い場合に無音区間内でバッファとは別のNullデータを一時的に読み込ませたりすることでも、書き込みポインタと読み出しポインタの差分を処理開始時と同様に戻し、バッファのオーバーフローやアンダーフローを未然に防ぐことが可能である。この場合のバッファは、先頭と末尾が連結されたリングバッファなど、連続的に読み書きを行ってもバッファを使い果たすことがないものが好ましい。
【0028】
非特許文献2で伝送される非PCMデータは、その中身が符号化された音声信号やメタデータであるために、対応するPCMデータに比較し一般にデータ量が小さい。そこで非PCMデータは、ある程度の連続したデジタル音声信号に格納されて伝送される、いわゆるバースト伝送が行われ、次のデータバーストを送信するまでの期間は0データが埋め込まれる。非特許文献2の標準規格では、あるデータバーストから次のデータバーストまでの期間を最大4096サンプルに制限しているため、音声信号同期装置の無音区間の判定にそのまま4096サンプルを用いてもよいし、非PCMデータのデータバーストが一定の周期で入力されることが事前にわかっている場合などでは、その周期に合わせた長さを用いてもよいし、非特許文献2の標準規格で規定されるデータバーストの第4音声サンプルに記載されるデータバーストのバイト数のデータ(Pdと呼ばれる)を確認して無音区間を特定してもよい。
【0029】
ステップ102で一定期間連続で無音を検出できない場合は、次に、サンプル数調整部3で入力信号と同期信号(出力信号)のクロック速度を比較する(ステップ104)。クロック速度を直接的に比較してもよいし、バッファの書き込みポインタ及び読み出しポインタの位置関係の変化により速度差を判断してもよい。本発明の音声信号同期装置では、入力信号と同期信号のサンプリングレートは同じに設定されていることを前提としているが、そのクロック速度のわずかな誤差、及び誤差の蓄積によるバッファのオーバーフロー又はアンダーフローを検出する(ステップ105で「オーバーフロー」又は「アンダーフロー」)。バッファ部2で逐次、バッファのクリアが行われていた場合はオーバーフロー又はアンダーフローは未然に防がれていると判断できるが、長時間非PCMデータが途切れず伝送され続けた場合など、バッファのクリアが行えなかった場合には、オーバーフロー又はアンダーフローへの対処として、サンプル数の調整(ステップ106ないし108)に進む。
【0030】
具体的には、データバーストの開始点となるデジタル音声信号のデータ(サンプル)を検出し、その直前の埋め込み区間で0データを間引くか、又は0データを挿入する。非特許文献2では、データバーストの開始点を示すため、データバーストの第1サンプルと第2サンプルに、Pa、Pbと呼ばれる特殊なデータを格納する。Pa、Pbは、例えばビット深度が16bitの時のPaは0xF872、24bitの時は0x96F872などと、デジタル音声信号のビット深度に応じたサイズのデータが規定されている。加えて、Pa、Pbの直前に4サンプル以上埋め込みの0データを連続させることも合わせて規定されている。Pa、Pbだけの2サンプルだけではPCMの音声信号や符号化されたデータが偶然Pa、Pbと同じビット列となり、データバーストが誤検出される可能性もあったが、直前の4サンプルとあわせた6サンプル(0,0,0,0,Pa,Pb)をもってデータバーストを検出することで、誤検出の可能性を実用上問題ないレベルまで下げることが可能となっている。
【0031】
バッファ部2で逐次、バッファのクリアが行われていた場合、あるいは入力信号と同期信号のクロック速度が極めて高い精度で一致していた時など、オーバーフロー及びアンダーフローが生じないと判断される場合(ステップ105で「それ以外」)にはサンプル数の調整を行わない。
【0032】
ここで、誤差がある程度蓄積しても、オーバーフロー又はアンダーフローが生じないうちはその誤差を許容して0データの間引き又は挿入を行わずに、バッファをクリアできるタイミングを待ってもよいし(バッファクリア優先モード)、誤差の蓄積が音声信号1サンプル分を超えた時点で逐次0データの間引き又は挿入を行ってもよい(サンプル数調整優先モード)。
【0033】
なお、サンプル数調整優先モードにおいて、誤差の蓄積が音声信号1サンプル分を超えた時点で逐次0データの間引き又は挿入を行う場合には、間引き/挿入する0データのサンプル数は当然に1サンプルとなる。
【0034】
これに対して、バッファクリア優先モードでは、オーバーフロー又はアンダーフローが生じないうちは誤差を許容するので基本的には間引き/挿入を行わないが、番組長が極端に長い場合など、バッファがクリアできるタイミングが長時間訪れずにバッファのオーバーフロー又はアンダーフローが生じてしまいそうな範囲まで誤差が蓄積した場合には間引き/挿入、ないし強制的なバッファのクリアを行わざるを得なくなる。間引き/挿入を行う場合、サンプル数調整優先モードと同様に1サンプルを間引き/挿入してもよいし、調整のタイミングを減らすためにまとめて複数サンプルを間引き/挿入してもよい。ただし、定期的に調整可能な0データはPa、Pb前の4サンプル分しか保証されないので、複数サンプルといっても4サンプルが限度であり、バッファクリア優先モードにおいて0データの間引き/挿入を行う場合のサンプル数は1~4サンプルとなる。
【0035】
バッファクリア優先モードでは、バッファがクリアされるタイミングまでは、あるいは誤差の蓄積が進み0データの間引き又は挿入が必要となるタイミングまでは、装置に入力されたデジタル音声信号が完全に保持されるため、本装置を介して音声信号を接続するシステムの動作に関して、より高い安定性が期待できる。一方、サンプル数調整優先モードでは、後述するようにPCMデータと非PCMデータを別々に扱うときなどに、データバースト単位でPCMデータと非PCMデータの絶対時刻が合わせられることになり、より高い時間的精度が期待できる。
【0036】
最後に、音声信号再生部4で、サンプル数を調整済みの、又は調整が必要ないと判断された非PCMデータを、同期信号に同期して再生する(ステップ110)。以降一連の処理を、音声信号同期装置1が停止されるまで繰り返す。
【0037】
なお、AES3やAES3の拡張であるMADI(AES10)では、一つの音声ストリームに複数のチャンネルのデータを合わせて伝送可能であり、PCMデータと非PCMデータが混在して入力されることが考えられる。その場合、上記の一連の処理をPCMデータにも適応してもよいし、一連の処理を加える前にPCMデータのチャンネルと非PCMデータのチャンネルを分離し、別々の処理を加えてもよい。後者の場合、例えば非PCMデータには上記の一連の処理を行い、PCMデータには従来のサンプリングレートコンバート処理を行い、非PCMデータの処理によって生じる遅延を加えた上で、それぞれの処理が完了したPCMデータと非PCMデータをまた一つの音声ストリームとして出力する。
【0038】
PCMデータの場合、無理にサンプルを挿入又は間引くと、その処理が例え1サンプルだけであったとしても可聴レベルのノイズを生じる可能性がある。バッファ部2でバッファのクリアが行えずに、サンプルの挿入又は間引きが必要な場合には、PCMデータは従来のサンプリングレートコンバート処理により同期に引き込むことで、ビット列は保持されておらずとも聴感上の問題が生じる可能性を従来のサンプリングレートコンバータと同程度に抑えることが可能である。
【0039】
以下、本発明の実施例について説明する。
(実施例1)
本発明の実施例1として、MADIでオブジェクトベース音響コンテンツのストリームが入力された場合を例にとって説明する。MADIの64チャンネルのうち、1~60チャンネルにPCMデータ、61~64チャンネルにS-ADM(非PCMデータ)が格納されており、データバーストは規格上最大の4096サンプルごとに送信されているものとする。バッファ部2での遅延量を、インターレース方式の映像のフレームレート(60Hz)に合わせ、1÷30≒33ms(ミリ秒)とする。
【0040】
業務用の音声同期信号発生器(マスタークロックジェネレータ)の多くは発振器にルビジウムを用いられ、高い精度の同期信号を出力する。例えばデジタル音声信号用の同期信号の一種でありIEC 60958-4の中で規定されているAES11のGrade 1では、周波数精度の許容範囲を±1ppm(parts per million)以内とすることが定められている。実施例1では規格の範囲内で最大のずれを想定し、入出力信号のクロック周波数を48kHz+1ppm及び48kHz-1ppmとする。
【0041】
図5は実施例1の構成例を示すブロック図、
図6は実施例1の処理フローの例である。
図5に示すとおり、実施例1に係る音声信号同期装置1は、バッファ部2、サンプル数調整部3及び音声信号再生部4に加えて、非PCMデータ判定部5と、遅延部6と、サンプリングレートコンバータ部7とをさらに備える。
【0042】
入力されたMADI信号はまず、非PCMデータ判定部5によりPCMチャネルか非PCMチャネルかの判定が行われ(
図6のステップ201)、非PCMデータが格納されている61~64チャンネルのデータはバッファ部2に、PCMが格納されている1~60チャンネルのデータは遅延部6にそれぞれ送られる。
【0043】
ここで、非PCMデータが格納されているチャンネルの判定に、データバーストの開始を示すPa、Pbとその直前の4サンプルとあわせた6サンプル(0,0,0,0,Pa,Pb)が存在しているかによって装置が自動で処理を切り替えてもよいし、オブジェクトベース音響コンテンツのストリームなどのPCMデータと非PCMデータが混在して伝送される場合には、S-ADM(非PCMデータ)を伝送しているチャンネルは事前に決められていることも十分考えられるため、あらかじめユーザが61~64チャンネルのみを非PCMデータと扱うように指定してもよい。
【0044】
61~64チャンネルの非PCMデータについては、バッファ部2でバッファに書き込まれ、読み出しを待つ状態になる(ステップ202)。
入出力信号のクロック周波数が48kHz+1ppm及び48kHz-1ppmであり、そのずれは48kHzの2ppmとなるため、1時間で最大3600(秒)×48000(サンプル/秒)×2×10-6≒346サンプル(7.2ms)となる。誤差の蓄積が事前に設定された遅延量33msを超えるのに約4.6時間かかる。一般的な放送番組の時間長を考慮すると、誤差が蓄積する前に番組が終了し、S-ADM(非PCMデータ)を含めオブジェクトベース音響のストリームが一度途切れ、クリアが可能であると考えられる。
【0045】
このように、一般的な番組長を考えると、オブジェクトベース音響ではバッファのクリアが適切に行われ、アンダーフロー又はオーバーフローの対策のために0データの間引き/挿入が必要となるケースは少ないことが想定される。そのため、元のデータを完全に保持することを優先してバッファクリア優先モードを用いてもよいし、サンプルのずれが最小になるよう逐次補正することを優先してサンプル数調整優先モードを用いてもよい。
【0046】
なお、バッファクリア優先モードを用いた場合には、誤差の蓄積に応じてPCMデータとS-ADM(非PCMデータ)の時刻にずれが生じる可能性がある。S-ADMでは、時刻によってPCMデータにかけあわせるゲインを動的に変えるといった記述が可能であり、時刻ずれによってPCMデータにかけ合わせるゲインに誤差が生じ得るが、その時刻ずれは上記のとおり1時間で約7msと十分小さい。市販されている業務用のデジタル音声卓には、音声エンジニアが操作したフェーダのゲインを読み取る周期が20msと、7msより数倍大きい製品も存在し、実用上問題にならないと考えられる。
【0047】
バッファクリア優先モードを用いた場合には、0データの間引き/挿入処理は行われず、バッファから読み出されたサンプル(非PCMデータ)をそのまま入力された同期信号に同期して再生する。サンプル数調整優先モードを用いた場合には、1÷(48000×2×10-6)≒10.42秒ごとに生じる1サンプル分のずれを補正するため、10.42÷(4096÷48000)≒122回のデータバーストのうち1回の直前で1サンプル分の0データの間引き又は挿入が行われる。
【0048】
1~60チャンネルのPCMデータについては、非PCMデータからは分離されて処理される。
まず、非PCMデータのバッファによって生じる遅延に合わせるため、PCMデータについても遅延(ディレイ)処理を加える(ステップ203)。そのディレイ値は、非PCMデータのバッファ部2で自動又は手動で設定された遅延量に合わせて決定する。
その後、従来のサンプリングレートコンバート処理を加える(ステップ204)。ここで、1~60チャンネルのPCMデータについて、実施例1の装置の入出力前後を比較すると、ビット単位の正確性は損なわれるが、聴感上の違いを小さく抑えながら、入力された同期信号に引き込むことが可能である。加えて、MADIなどによる多チャンネル入力が想定される場合、実施例1のようにバッファ部2に格納するのを非PCMデータだけとすることで、バッファ部2に必要なメモリの量を抑えることができるというメリットもある。
【0049】
以上の処理により、非PCMデータ及びPCMデータの両方が入力された同期信号に同期している状態になったため、最後にこれらの信号を統合し(ステップ205)、再度1~64チャンネルのMADIとして出力する。
【0050】
(実施例2)
本発明の実施例2として、SDI信号で映像を伴うオブジェクトベース音響コンテンツのストリームを伝送している場合を例にとって説明する。SDI信号を異なる同期系に引き込む際に用いられるフレームシンクロナイザは、入力された映像信号にエンベデッドされている音声信号を分離(デマルチプレックス)し、映像と音声は別々に同期引き込み処理をしたのちに再度統合(マルチプレックス)して出力する。この際、音声信号の同期引き込み処理は、従来のサンプリングレートコンバート処理を行っていることが一般的である。実施例2では、このサンプリングレートコンバート処理を本発明の装置の処理に置き換えることを想定して説明する。
【0051】
映像に合わせることが前提の音声信号であるため、SDIの1~15チャンネルにPCMデータ、16チャンネルにS-ADM(非PCMデータ)が格納されており、データバーストは映像のフレームレート(60Hz)に合わせて、48000÷60=800サンプルごとに送信されているものとする。バッファ部2での遅延量、入力信号と同期信号のクロック速度は実施例1と同じとし、バッファ部2にはリングバッファを用いる。なお、バッファ部2でのデータクリアは、ポインタの調整によって代用する。
【0052】
ブロック図及びフロー図は実施例1と同じである。入力された16チャンネルの音声信号はまず、非PCMデータ判定部5により、非PCMデータが格納されている16チャンネルのデータはバッファ部2に、PCMが格納されている1~15チャンネルのデータは遅延部6にそれぞれ送られる。
【0053】
16チャンネルの非PCMデータについては、バッファ部2でバッファに書き込まれ、読み出しを待つ状態になる。入力信号と同期信号のクロック周波数のずれは実施例1と同じであるため、バッファ部2でのデータクリアが可能であると考えられる。
【0054】
ここで、バッファ部2を実際にはクリアをせずとも、リングバッファの書込ポインタと読出ポインタを調整することで代用することができる。
図7はポインタの調整の例である。バッファ部2での遅延が1÷60≒16.7msと設定されており、動作開始当初には読出ポインタから書込ポインタに対し800サンプル分遅らせられている。入力音声信号と同期信号のクロック速度が完全に同一である場合は、動作開始後も読出ポインタと書込ポインタの差分(インターバル)が800サンプルに保たれるが、クロック速度に差がある場合にはこの差分が徐々に拡大又は縮小する。差分が拡大しているときには、リングバッファをクリア可能となったタイミングで、書込ポインタを読出ポインタ+800(インターバル分)に変更する(巻き戻す)ことで、リングバッファをクリアせずとも動作開始当初のインターバルにリセットできる。逆に、差分が縮小しているときには、インターバル分の0(Null)データが格納された補助バッファを別途用意しておき、リングバッファをクリア可能となったタイミングで読出ポインタを補助バッファに移し、補助バッファの読み出しが終わった時点で、読出ポインタをリングバッファがクリア可能となったタイミングでの書込ポインタと同じ値とすることで、リングバッファをクリアせずとも動作開始当初のインターバルにリセットできる。ここで、わかりやすさのために、リングバッファをクリア可能となったタイミングで、書込ポインタをリングバッファの第1インデックスに変更してもよい。
【0055】
実施例1と同様にバッファクリア優先モードとサンプル数調整優先モードの選択によって0データの間引き/挿入処理を行ったうえで、バッファから読み出されたサンプル(非PCMデータ)を別途入力された同期信号に同期して再生する。
【0056】
1~15チャンネルのPCMデータについては、実施例1と同様に非PCMデータからは分離し、遅延処理とサンプリングレートコンバート処理を加える。
【0057】
以上の処理により、非PCMデータ及びPCMデータの両方が入力された同期信号に同期している状態になったため、最後にこれらの信号を統合し1~16チャンネルの音声信号とすることで、SDI信号にマルチプレックスして出力することが可能となる。
【0058】
本実施形態によれば、異なる同期系で動作している複数のシステムの組み合わせにより構成されている大規模な設備において、一のシステムが非PCMのデータを含む異なる同期系のデジタル音声信号を受信した場合であっても、非PCMデータを格納したチャンネルを含むデジタル音声信号を一定量バッファリングし、別途入力された同期信号に同期してバッファリングしたデータを出力することで受信したシステムの同期に引き込むので、データの欠落を防ぎながら、受信したシステムの同期に引き込むことが可能となる。
【0059】
また、非PCMデータを復号せず、非PCMデータが格納されたデジタル音声信号のデータに基づいて、バッファのクリアタイミングやサンプル数を調整可能なタイミングを検出することで、復号及び符号化の処理能力を必要とせず、かつ低遅延での処理を実現することが可能となる。
【0060】
上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変形及び変更ができることは当業者に明らかである。したがって、本発明は、上述の実施形態に限るものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。例えば、
図4に記載した処理を、
図2に示したスタジオや
図3に示したデジタル音声卓の入力部や、コンピュータのデジタル音声信号入力ボード(図示せず)の一機能として実装することが可能である。
【0061】
また、上述の本実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本実施形態に記載されたものに限定されるものではない。
【0062】
さらに、上述した音声信号同期装置1として機能させるためにコンピュータを好適に用いることができ、音声信号同期装置1の各機能を実現する処理内容を記述したプログラムをコンピュータの記憶部に格納しておき、該コンピュータのCPUによってこのプログラムを読み出して実行させることで音声信号同期装置1を実現することができる。
【0063】
また、このようなプログラムは、コンピュータ読み取りが可能な媒体に記録されていてもよい。コンピュータ読取可能媒体を用いれば、プログラムをコンピュータにインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取可能媒体は、非一時的な記録媒体であってもよい。非一時的な記録媒体は、特に限定されるものではないが、例えば、CD-ROMやDVD-ROMなどの記録媒体であってもよい。
【符号の説明】
【0064】
1 音声信号同期装置
2 バッファ部
3 サンプル数調整部
4 音声信号再生部
5 非PCMデータ判定部
6 遅延部
7 サンプリングレートコンバータ部