(58)【調査した分野】(Int.Cl.,DB名)
前記回路は、前記より長期のデジタル信号品質値の関数としてオフセット値を計算し、かつ該オフセット値を用いて前記適応アナログ対デジタル閾値及び前記適応デジタル対アナログ閾値を調節するように更に構成されることを特徴とする請求項8に記載の無線受信機。
前記回路は、前記デジタル信号品質値をフィルタリングしてより長期のデジタル信号品質値を生成し、かつ該より長期のデジタル信号品質が固定閾値を超えるまで前記出力をアナログからデジタルに混合又は移行することを阻止するように更に構成されることを特徴とする請求項8に記載の無線受信機。
【背景技術】
【0002】
デジタル無線放送技術は、移動式、携帯式、及び固定式受信機にデジタル音声及びデータサービスを配信する。帯域内チャネル上(IBOC)デジタル音声放送(DAB)と呼ばれる1つのタイプのデジタル無線放送は、既存の中間周波数(MF)及び超短波(VHF)無線帯域内で地上送信機を使用する。iBiquity・デジタル・コーポレーションによって開発されたHD Radio(登録商標)技術は、デジタル無線放送及び受信のためのIBOC実施の一例である。
【0003】
全米放送事業者協会(National Association of Broadcasters)及び全米家電協会(Consumer Electronics Association)後援の標準化団体である全米無線システム委員会(National Radio Systems Committee)は、2005年9月にNRSC−5と指定されたIBOC規格を採択した。引用によりその開示が本明細書に組み込まれ
【非特許文献1】は、デジタル音声及び補助的データをAM及びFM放送チャネルで放送するための要件を列挙している。規格及びその参考文献は、RF/送信サブシステム、並びに搬送及びサービス多重化サブシステムについての詳細説明を含む。規格のコピー
【非特許文献2】で入手可能である。iBiquityのHD Radio技術は、NRSC−5 IBOC規格を達成したものである。HD Radio技術に関する更な
【非特許文献3】及び
【非特許文献4】で入手可能である。
【0004】
AM及びFMの両方の帯域内チャネル上(IBOC)混成放送システムは、アナログ変調搬送波及び複数のデジタル変調副搬送波を含むコンポジット信号を利用する。プログラムコンテンツ(例えば、音声)は、アナログ変調搬送波及びデジタル変調副搬送波上で冗長的に送信することができる。アナログ音声は、ダイバーシチ遅延分だけ送信機において遅延される。混成モードを使用すれば、放送事業者は、アナログAM及びFMをより高品質かつよりロバストなデジタル信号と同時に送信し続けることができ、事業者自体及び聴取者が現在の周波数割当てを維持しながらアナログからデジタルに無線を変換することを可能にする。
【0005】
デジタル信号は、受信機でアナログ信号に対して遅延されるので、時間ダイバーシチを用いて短い信号停止の影響を緩和し、かつ高速同調のための瞬間的アナログ音声信号を提供することができる。混成アナログ−デジタルモードで作動するデジタル無線は、初期同調後又はデジタル音声品質が適切な閾値を超える時は常に、アナログ音声出力とデジタル音声出力との間でスムーズに移行するよう試みる「混合」と呼ばれる機能を組み込んでいる。
【0006】
デジタル音声信号がない場合(例えば、チャネルが最初に同調される時)、アナログのAM又はFMバックアップ音声信号が音声出力に供給される。デジタル音声信号が利用可能になると、混合機能は、デジタル音声信号内で混合する間、アナログバックアップ信号をスムーズに減衰して最終的にデジタル音声信号に置き換えるので、移行は、音声プログラムの何らかの継続性を保つ。同様の混合は、デジタル信号を破損するチャネル機能停止中に行われる。この場合に、デジタル破損が音声出力に現れる時に音声が十分にアナログに混合されるように、デジタル信号を減衰することによってアナログ信号が徐々に出力音声信号内に混合される。
【0007】
混合は、典型的に、デジタルカバレージの縁部で及びデジタル波形が破損されたカバレージ輪郭内の他の場所で発生することになる。境界信号条件にある橋の下の移動等、短い機能停止が発生すると、デジタル音声は、アナログ信号で置き換えられる。様々な混合アルゴリズムが既に開発されており、市販のHR Radio受信機に実施されている。既存のアルゴリズムは、対応する音声パケットに対して冗長巡回検査(CRC)を実行することにより、破損したデジタル音声フレームを検出する。CRC結果(1=pass、0=fail)が、約1秒にわたってフィルタリングされ、短期のデジタル信号尺度(DSM)を提供する。デジタル信号が弱い時、この時定数は、修正措置を開始するほど十分に短い。デジタル信号が破損している時、すなわち、フィルタリングされたCRC成功率(DSM)が予め決められた閾値よりも下がる時、出力音声は、デジタルからアナログに混合される。逆に、DSMが、より高い予め決められた閾値を超える時に、出力音声は、アナログからデジタルに混合される。
【0008】
モバイル多経路フェーディング及びシャドーイング時などのカバレージが間欠的な時にアナログとデジタル音声の間の頻繁な混合を低減するために、信号対ノイズ比(SNR)又は信号対ノイズ比値(Cd/No)等の他の信号品質メトリックが利用されてきた。しかし、これは、静的デジタルカバレージエリアを数dBの信号強度の損失に対応する数マイル半径ずつ不要に縮小させることが分かってきた。既存のアルゴリズムはまた、他の混合が最近行われた時にタイマ及び混合履歴を用いて混合を抑制するよう試みるが、デジタル信号品質推定の重要性が軽視される。
【0009】
どのデジタル音声ギャップも埋めることが合理的に見えるかもしれないが、対応するアナログ及びデジタル音声セグメントは必ずしも同じには聞こえないので、これは、一般的に望ましくない。アナログ及びデジタル音声ストリームに対する意図的に異なる音声処理は、混合中の聴取者の体験を低下させる。これに加えて、2つのストリーム間のいずれの時間不整合又はレベル不整合も、それらの間の混合中に音声品質を更に低下させる。音声ストリーム間の異なる処理に起因して完全な整合は明確に定義されず、現実的でもなく、周波数依存の群遅延及びレベル差をもたらす。
【発明を実施するための形態】
【0015】
本明細書に説明する実施形態は、デジタル無線放送信号のデジタル及びアナログ部分の処理に関する。この説明は、HD Radio受信機に対するアナログ及びデジタル音声ストリーム間の混合のためのアルゴリズムを含む。本発明の開示の態様は、例示的HD Radioシステムとの関連で提示するが、本発明の開示は、HD Radioシステムに限定されないこと、及び本明細書の教示は他の形態のデジタル無線放送にも同様に適用可能であることを理解すべきである。
【0016】
本明細書に説明する混合アルゴリズムは、いくつかの方法を組み合わせて混合性能を改善し、デジタル音声可用性を適度に低減して一般的により少ない混合をもたらす。適応アナログ対デジタル及びデジタル対アナログ混合閾値が使用される。適応閾値は、(1)フィルタリングされた信号品質推定(すなわち、より長期の条件を評価するために用いられる巡回冗長検査(CRC)成功率に基づいてフィルタリングされるデジタル信号尺度(DSM))、(2)アナログへの最新の混合がデジタルへの再混合を抑制するためにフィルタリングされたDSMにペナルティを課すこと、及び(3)信号品質の適応関数であるチャネル障害からの回復速度を含むいくつかのパラメータの影響を受ける。
【0017】
上述の混合アルゴリズムはまた、混合のためのアナログバックアップを持たないデジタル音声ストリーム(すなわち、全デジタル信号又はマルチキャストチャネル)にも適合する。この場合に、間欠的な音声セグメントを許容することを犠牲にして、デジタル信号カバレージを増大させる。この場合に、一般的に、無音よりもいくらかむらのあるデジタル音声を許容することが好ましい。アルゴリズムはまた、2つのダイバーシチ受信機の最大比合成(MRC)を使用するシステムと共に良好に機能することも示されている。
【0018】
例示的AM及びFM IBOC DAB送信システムは、デジタル音声及びデータを通常は継続時間が約1秒であるレイヤ1フレームの単位に配置する。一部の送信システムは、固定数の音声フレームを各レイヤ1フレームに割り当てることにより、簡素化かつ強化の両方が行われる。音声フレーム期間とは、音声フレーム内のサンプルをレンダリング、例えば、ユーザに対して音声を再生するために必要な時間の長さである。例えば、音声フレームが1024サンプルを含み、サンプリング期間が22.67μsecの場合、音声フレーム期間は、約23.2ミリ秒になる。スケジューラは、各レイヤ1フレーム内の音声フレームに割り当てる総ビット数を決定する。レイヤ1フレーム期間は、デジタル音声放送システムにおいて予想されるようなフェーディング及び短い機能停止又はノイズバーストの影響を十分に長いインタリーブ時間で緩和することができるので有利である。従って、主要デジタル音声信号は、レイヤ1フレーム単位で処理することができ、音声処理、エラー軽減、及び符号化戦略は、この比較的大きいレイヤ1フレーム時間を付加的なペナルティなく使用することができる。
【0019】
典型的な実施では、無線チャネル上でのIBOC信号の送受信のためにより効果的かつロバストな方法で音声サンプルを音声フレーム内に圧縮するために音声符号器を使用することができる。音声符号器は、各レイヤ1フレームに対してビット割当てを用いて音声フレームを符号化する。レイヤ1フレーム内の残りのビットは、通常、多重データ及びオーバーヘッドによって消費される。Dolby Laboratories、Inc.のCoding Technologiesによって開発されたようなHDC符号器、Advanced Audio Coding(AAC)符号器、MPEG−1 Audio Layer3(MP3)符号器、又はWindows Media Audio(WMA)符号器等のいずれかの適切な音声符号器は、最初に圧縮音声フレームを生成することができる。AAC、MP3、及びWMA等の典型的な不可逆的音声符号化方式は、音声データの圧縮に修正離散コサイン変換(MDCT)を使用する。MDCTベースの方式は、典型的に、音声サンプルを固定サイズのブロックに圧縮する。例えば、AAC符号化では、符号器が、長さ1024サンプルの1つのMDCTブロック、又は128サンプルの8ブロックを使用することができる。従って、例えば、AACコーダを用いる実施では、各音声フレームは、1024音声サンプルの1個のブロックから成ることができ、各レイヤ1フレームは、64個の音声フレームを含むことができる。他の典型的な実施では、各音声フレームは、2048音声サンプルの1個のブロックから成ることができ、各レイヤ1フレームは、32個の音声フレームを含むことができる。サンプルブロックサイズ及びレイヤ1フレーム毎の音声フレームのいずれかの他の適切な組合せを使用することもできる。
【0020】
例示的IBOC DABシステムでは、放送信号は、主要プログラムサービス(MPS)音声、MPSデータ(MPSD)、補充プログラムサービス(SPS)音声、及びSPSデータ(SPSD)を含む。MPS音声は、主要音声プログラミングソースとしての役目をする。混成モードでは、アナログ及びデジタル送信の両方で既存のアナログ無線プログラミングフォーマットを保つ。プログラムサービスデータ(PSD)としても知られるMPSDは、音楽タイトル、アーティスト、アルバム名等の情報を含む。補充プログラムサービスは、PSDだけでなく補完音声コンテンツを含むことができる。放送局情報サービス(SIS)も提供され、これは、コールサイン、絶対時間、GPSに相関する位置、放送局で使用可能なサービスを記述するデータ等の放送局情報を含む。ある一定の実施形態では、AM又はFMスペクトル内の1つのチャネル上で多くのデータサービス又はストリーム及び特定用途向けコンテンツを配信するための能力を含み、放送局が主周波数の補完的又はサブチャネル上で複数のストリームを放送できるようにする最新アプリケーションサービス(AAS)を提供することができる。
【0021】
図1は、IBOC信号を受信するように構成され、混合アルゴリズム機能を含むHD Radio受信機10の最上位機能図である。
【0022】
受信機は、アンテナ14から帯域内チャネル上無線信号を受信するチューナ12を含む。無線信号のアナログ変調搬送波は、AM又はFM復調器16によって復調されてライン18上にアナログ音声ストリームのサンプルを生成する。無線信号のデジタル変調副搬送波は、復調器20によって復調され、脱インタリーブされてFEC復号され(ブロック22)、音声フレームは、脱フォーマッ化トされて(ブロック24)ライン26上にデジタル音声フレームを生成する。以下で議論するように、音声フレームの巡回冗長検査(CRC)が検査されてCRCpass値を決定する。混合アルゴリズム28は、CRCpass値を用いてライン30上に混合制御信号を生成する。HD Radioコーデック(HDC)32は、デジタル音声フレームを復号してライン34上にデジタル音声ストリームのサンプルを生成する。音声混合制御器36は、混合制御信号に従ってアナログ音声ストリーム及びデジタル音声ストリームを混合し、ライン38上に音声出力信号を生成する。
【0023】
アナログ音声ストリームは、アナログ変調されたプログラム内容のサンプルのストリームを含み、デジタル音声ストリームは、デジタル変調されたプログラム内容のサンプルのストリームを含む。
【0024】
以下で説明する混合アルゴリズムの詳細は、使用可能なアナログバックアップ信号を有するHD Radio受信(例えば、混成MPSのケース)に固有である。レイヤ1(L1)フレーム毎に32個の音声フレーム(AF)があり(約1.486秒)、毎秒21.533個の音声フレームを生じると仮定する。コード化された各音声フレームの平均サイズは、その音声ストリームの割り当てられたスループットによって決まる。CRCのpass/failステータスが、各AF毎に決定される。検査した場合は、変数CRCpass=1であり、それ以外は0である。音声フレームが部分的にのみ破損している時には、0と1の間で正規化された「ソフトな」CRCpass値を音声コーデックによって提供することができる。
【0025】
既存の混合アルゴリズムと同様に、CRCpassシーケンスが最初にフィルタリングされ、0から1の間にわたるデジタル信号尺度(DSM)をもたらす。DSMが適応デジタル対アナログ閾値Th_d2aよりも下がる時にアナログへの混合、及び適応アナログ対デジタル閾値Th_a2dを超える時にデジタルへの混合をトリガする。DSMは、比較的長い時定数によるIIRフィルタを用いて更に円滑化される。得られる信号DSMfiltを用いて、適応混合閾値を動的に調節する。本説明で用いるように、適応閾値とは、測定された信号又は計算された作動パラメータに基づいて変更(例えば、調節又は適応)可能な値を有する閾値である。上述の実施形態では、適応閾値Th_a2d及びTh_d2aは、DSMfiltの可変関数であり、DSMfiltが固定の閾値Thresを超える時にのみ変化することができる。これらの適応閾値は、あらゆる音声フレーム毎に頻繁に動的に変更することができる。
【0026】
図2は、実地試験中に記録されるようなアナログへの混合後のこれらの信号の挙動を示している。DSMがTh_d2aよりも下がる時に、混合ラインが1(デジタル)から0(アナログ)に移行する。アナログ音声への混合時に、DSMfiltが、この値に比例する量だけ瞬間的にペナルティを課される(低減される)。これは、直ちにTh_a2dを1に固定し、これにより、デジタル音声への早期の再混合を阻止する(DSMが1を超えることができないので)。DSMfiltが混合後の最下点から固定の閾値Thres=0.9375に上昇するまで、Th_a2dは、1に固定されたままである。次に、DSMがTh_a2dを超える時に、音声が再びデジタルに混合される。
【0027】
図2は、アナログ音声への混合後のデジタル音声回復機構を示している。この機構は、長期信号品質が高くなるまで、デジタル音声への混合を事実上不可能にする。これは、長期デジタル信号品質に関わらず、単純なタイマが満了すると直ちにデジタルへの再混合を可能にする既存の混合アルゴリズムを越える著しい改善点である。アナログへの混合後のデジタル音声回復時間は、40、60、又は90秒に等しいBsecというユーザ定義の設定パラメータによって制御される。一実施形態では、60秒が推奨のデフォルト値である。
【0028】
(例えば、トンネル又は他の妨害物に起因する)アナログにある間の長期信号停止後、DSMfiltが最終的にLimitの値に落ち着くことになる。信号回復時に、DSMfiltがThresを超えるのに少なくともRsec=10秒かかり、これにより、デジタルへの混合を可能にする。これを
図3に示しており、この場合に、Limit=0.9229である。Th_a2dは、DSMfiltがThresを超えるまで、1に固定されたままであることに注意されたい。デジタルへの混合は、DSMfiltがTh_a2dを超えるまで行われない。この場合に、DSMfiltがLimitからThresに上昇するのにかかる時間は、Rsecよりもかなり長く、これは、回復中はデジタル信号品質が不完全であるからである。
【0029】
これらのデジタル音声回復機構の全体的効果は、アナログに費やされる時間がしばしば延長されることである。アナログへの迅速で短い混合は、より長い1回の混合に融合する傾向がある。デジタル音声の可用性が必然的に低減されるが、これは、短時間で連続する複数の混合で音声を「不規則に変化させる」ために通常は好ましい。一般的に、混合事象が十分に分離されない限り、混合数の正味の減少が存在する。
【0030】
図4は、例示的混合アルゴリズムの機能ブロック図である。ライン40上のCRCpass信号が、増幅器42によって増幅されて加算器44に転送される。加算器の出力が、遅延ブロック46によって遅延され、増幅器48によって増幅されて加算器44に返される。これは、50でデジタル信号尺度(DSM)値を生じさせる。DSMは、ブロック52で制限され、増幅器54によって増幅され、加算器56に転送され、この信号がライン58上でペナルティ信号Bpenに加算される。その結果、ライン60上に生じる信号は、加算器62に転送される。加算器62の出力が、遅延ブロック64によって遅延され、増幅器66によって増幅されて加算器62に返される。これは、ライン68上にDSMfilt信号を生成する。DSMfilt信号は、ライン70上のThres及びASBM信号と組み合わせて使用され、ブロック72に示すように、offset及び閾値Th_a2d及びTh_d2aを計算する。Th_a2d及びTh_d2aは、比較器76及び78でDSMに対して比較される。比較器76及び78の出力をフリップフロップ80への入力として用いて、ライン82でstate_dig信号を生成する。state_dig信号がANDゲート84の反転入力に送信され、遅延ブロック86が、ANDゲート84の他方の入力のための遅延されたstate_dig信号を生成し、ライン88上でBlend_d2a信号を生成する。Blend_d2a信号は、遅延クロック90によって遅延され、ライン92上のThres及びBpen_adj信号及び遅延されたDSMfilt信号と組み合わせて使用され、ブロック94に示すようにBpenを計算する。
【0031】
上述の混合アルゴリズムは、以下の9段階にまとめることができる。
【0032】
段階1:パラメータを初期化する。
”独立定数−−−−−−−−−−”
Thres=0.9375;”値が大きくなると、混合及びカバレージが低減される”
Rsec=10;”長期機能停止後のBlend MPS音声回復時間(sec)”
Bsec=60;”d2a混合後のBlend MPS音声回復時間(sec)”
g=0.015625;”1/64は、機能停止への0.5秒未満のd2a応答を招く”gb=0.0009765625;”1/1024長期フィルタ定数”
ASBM=1;アナログ信号混合メトリック;最大1、デジタルのみの場合は最小0
”従属定数−−−−−−−−−−”
Limit=1−(l−Thres)・exp{Rsec・gb・21.533}
Bpen_adj=exp{Bsec・gb・21.533}−2
”初期条件−−−−−−−−−−”
DSM=Thres
DSMfilt=Thres
state_dig=0;”アナログ状態で開始”
Blend_d2a=0
【0033】
各CRCpass入力に対してアルゴリズムループ反復を次に開始する。
【0034】
段階2:DSMを決定する。1次IIRフィルタにCRCpassシーケンスが入力されてDSM信号を生成する。各CRCpass指標n毎にDSMが更新される。これは、デジタル音声品質の表示であり、DSM値(0から1の間)は、有効な音声フレームの一部分に関連する。
DSM=(l−g)・DSM+g・CRCpass
n
【0035】
段階3、4、及び5は、ASBM>0(アナログバックアップを有するMPS音声)の時にのみ混合制御に影響を与える。
【0036】
段階3:Bpenを決定する。デジタルからアナログへの混合直後に、DSMfiltを低減するためにペナルティBpenが適用される(段階4)。このペナルティが、デジタル音声ストリームへの早期の再混合の確率を低下させる。アナログへの混合時の信号品質が悪いほどペナルティは大きくなる。Bsecの値が大きくなると、Bpen_adjの値が大きくなり、次にBpenが大きくなる。
Bpen=Blend_d2a・[Thres−1−Bpen_adj・(1−DSMfilt)]
【0037】
段階4:DSMfiltを決定する。DSM信号自体がIIRフィルタリングされてDSMfilt信号を生成する。これは、動的な混合閾値を調節するために用いられるデジタル音声品質のより長期の表示である。Limitの値は、初期化定数Rsecによって決まる。信号条件が悪い場合、DSMfiltは、混合が発生しない場合にLimitに落ち着くことになる。DSMfiltは、混合ペナルティBpenが評価された後にのみLimitよりも下がることができる。
DSMfilt=(1−gb)・DSMfilt+gb・max{Limit,DSM}+Bpen
【0038】
段階5:offsetを決定する。offset値は、適応閾値Th_a2d及びTh_d2aを決定するためにDSMfiltの関数として計算される。この適応処理は、より長期のデジタル信号品質(DSMfilt)が良好であり、かつデジタル信号の選択が好ましい時に、両方の閾値を低下させる効果がある。アナログバックアップを持たない信号(例えば、全デジタル波形又はマルチキャストチャネル)の場合は、ASBM=0、及び閾値Th_a2d及びTh_d2aは、単にThresの固定関数である。
offset=max{0,1−Thres−(1−DSMfilt)・ASBM}
【0039】
段階6:Th_a2dを決定する。Th_a2dは、より長期のデジタル信号品質が悪化した時に(DSMfilt<Thres)、offset=0に強制することによって1に固定される。この場合に、DSMが決して1を超えることができないので、デジタル音声への移行を開始することができない。DSMfiltがThresを超えると、デジタル移行閾値が低下され、offset>0となる。DSMfilt=1の時に、Th_a2dがThresの最小値に達する。
Th_a2d=1−offset
【0040】
段階7:Th_d2aを決定する。Th_a2dと同様に、Th_d2a閾値も、より長期の信号品質DSMfiltがThresを超えて改善する時に低下される。DSMfiltが低下すると、この閾値は、0.875の最大値に引き上げられて、アナログ音声への移行の可能性を高くする。DSMfilt=1及びThres=0.9375の時に、Th_d2aが0.75の最小値に達する。
Th_d2a=0.875−2・offset
【0041】
段階8:state_digを決定する。state_dig信号は、混合アルゴリズムがデジタル音声経路を選択するか又はアナログ音声経路を選択するかを示すものである。DSMがTh_a2dを超えるか又はTh_d2aよりも下がる時に、適切な移行が開始される。以前の状態は、state_dig_prevとして保存される。
【数1】
【0042】
段階9:Blend_d2aを決定する。デジタルからアナログへの混合は、現在及び以前の音声状態を観測することによって示される。Blend_d2aは、反復時にのみ1に設定され、state_digがデジタルからアナログに変化する。これを用いて、混合ペナルティBpenのDSMfiltへの適用を可能にする。
Blend_d2a=(1−state_dig)・state_dig_prev
【0043】
上述の混合アルゴリズムのための疑似コードの例は以下の通りである。
”混合アルゴリズム”
”パラメータを初期化する”
Thres=0.9375;”値が大きくなると、混合及びカバレージが低減される”
Rsec=10;”長期機能停止後のBlend MPS音声回復時間(sec)”
Bsec=60;”d2a混合後のBlend MPS音声回復時間(sec)”
g=0.015625;”1/64は、機能停止への0.5秒未満のd2a応答を招く”
gb=0.0009765625;”1/1024長期フィルタ定数”
Limit=1−(l−Thres)・exp{Rsec・gb・21.533}
Bpen_adj=exp{Bsec・gb・21.533}−2
DSM=Thres
DSMfilt=Thres
ASBM=1;アナログ信号混合メトリック;最大1、デジタルのみの場合は最小0
state_dig=0;”アナログ状態で開始”
Blend_d2a=0
”−−−−−−−−−−−−−−−−−−−−−−−−−−−−−”
n=1の場合;”CRCを伴う音声フレームのシーケンス”
DSM=(l−g)・DSM+g・CRCpass
n
Bpen=Blend_d2a・[Thres−1−Bpen_adj・(1−DSMfilt)]
DSMfilt=(1−gb)・DSMfilt+gb・max{Limit,DSM}+Bpen
offset=max{0,1−Thres−(1−DSMfilt)・ASBM}
Th_a2d=1−offset
Th_d2a=0.875−2・offset
state_dig_prev=state_dig
DSM>Th_a2dの場合、state_dig=1
DSM<Th_d2aの場合、state_dig=0
Blend_d2a=(1−state_dig)・state_dig_prev
【0044】
次に、パラメータThres、Rsec、Bsec、及びASBMの推奨の初期値について説明する。
【0045】
Thres:このパラメータは、正のoffsetを生成するであろうDSMfiltの最小値を示す。DSMfilt>Thresの時、アナログ対デジタル閾値Th_a2dは、1よりも下がることができ、良好な信号条件でデジタルへの混合を可能にする。
【0046】
Rsec:長期IIRフィルタへのDSM入力は、値がLimitよりも下がらないように制限される。この制限により、長期信号停止後にデジタル信号品質が改善する時の音声回復時間が短縮される。この回復時間の継続時間は、初期化定数Rsecによって決まる。最大デジタル信号品質(DSM=1)では、デジタル音声に混合するのにRsec秒かかる(これは、DSMfiltがLimitからThresまで上昇するのにかかる時間である)。
【0047】
Bsec:Bpenは、アナログへの混合が発生する時に、DSMfiltに瞬間的低減を課すペナルティである。これは、早期の混合を抑制するために、アナログの時間を増やす。Bpenの値は、(混合後のデジタル信号回復時間を示す)初期化定数Bsecにより、及びアナログへの混合時のDSMfiltのレベルによって決まる。アナログへの混合が発生する時にDSMfilt=Thresであり、かつ混合後のデジタル信号品質が完璧である場合、音声は、Bsec秒内にデジタルに再び混合されることになる。
【0048】
ASBM:アナログ信号混合メトリック(ASBM)は、デジタル機能停止中にアナログバックアップ音声が混合に使用可能である場合に(例えば、混成MPS音声)1に設定される。ASBMはまた、コア/強化モードで使用される時にも強化音声ストリームに対して1に設定される。他の全てのデジタルオンリー音声ストリーム(例えば、オールデジタル波形及びマルチキャストチャネル)に関しては0に設定され、DSMfiltのより長期の混合抑制効果を無効にして混合閾値を固定する。本明細書では、ASBMを2進値として説明するが、将来的な目的のために0から1の間の変数として使用することができる。
【0049】
次に、デジタル機能停止後のデジタル音声回復について考える(ASBM=1の場合)。
【0050】
初期化定数Rsecは、長期デジタル信号停止後の最小デジタル音声回復時間を表す。Rsecによって制御されるLimitの値は、Thresを超えることはできない。Limitの値が低くなると、デジタル音声回復時間が増大するが、Limit=Thresの時は、回復時間はゼロに近い。
【0051】
長期デジタル信号停止後に、DSMfiltはLimitに接近する。デジタル信号が回復すると、DSMfiltがLimitから増大して最終的にRsec秒でThresに達し、完璧なデジタル信号と仮定される。アナログからデジタル音声への移行は、DSMfiltがThresを超えた後にのみ可能にされ、これは、Th_a2dが1よりも下がるようにoffsetが調節される時である。
【0052】
より低いLimitの利点は、デジタル停止後に信号品質が改善するので、デジタル音声の間欠的な回復を阻止する試みにおいてアナログからデジタル音声への移行を遅らせることである。代わりに、デジタル音声への移行は、デジタル信号がデジタル音声回復時間中に完全に強くなった後にのみ可能にされる。次に、デジタル音声回復時間(Rsec)及びThresの関数としてのLimitの導出について説明する。
【0053】
デジタル音声回復中に、DSMfiltの増加する値は、音声フレーム指標k及びIIRフィルタ利得gbの関数として計算することができ、DSMfilt=Limitから開始される。DSMfiltのためのIIRフィルタの離散応答は、連続指数関数として近似される。
DSMfilt(k)=1−(l−Limit)・exp{−k・gb}
【0054】
DSMfiltの値がThresと交差すると、適応アナログ対デジタル閾値調節(offset)がTh_a2dを1未満に低下させるのでアナログからデジタル音声への移行が有効にされる。デジタル回復時間は、Rsec=k
thres・Tafであり、この場合のk
thresは、DSMfiltがThres_a2dと交差する時のk番目の音声フレームである。
【0055】
DSMfiltをThresに設定して音声フレーム時間Taf(0.046秒)に対する音声フレーム指標の適切なスケーリングを用いてkの値を求めることにより、Rsec、Limit、及びThresの間の関係を見出すことができる。
【数2】
【0056】
Limitの値は、最初にThres及びRsecを選択して、次にLimitの値を求めることによって見出される。
Limit=1−(1−Thres)・exp{Rsec・gb/Taf}
【0057】
図5は、Limitの固定の初期化値がThres及びRsecの関数として決定されることを示している。
【0058】
次に、アナログへの混合後のデジタル音声回復について考える(ASBM=1の場合)。
【0059】
初期化定数Bsecは、アナログへの混合後のデジタル音声回復時間であり、混合の直前にはDSMfilt=Thresであると仮定され、混合後は完璧なデジタル信号である。DSMfiltの値は、デジタルからアナログ音声への混合後に、Bpenだけ減少される。DSMfiltの減少量は、混合時のDSMfiltの値及び定数Bpen_adjによって決まる。
Bpen=Blend_d2a・[Thres−1−Bpen_adj・(1―DSMfilt)]
【0060】
Bpen_adjの固定値は、初期化時に決定され、かつBsecの関数である。
【0061】
次に、Bpen_adj表現の例示的導出について説明する。
【0062】
混合回復時間Bsecは、混合ペナルティの直後のDSMfilt=Thres+Bpenの値がRsec表現内のLimitの代わりに入ることは除いて、Rsecと同じ方法で導出される。
【数3】
【0063】
Bpenの解析値に関して解くと、
【数4】
【0064】
固定の初期化値Bpen_adjは、Bpenの解析的かつアルゴリズム的表現を等化し、次に、Bsecの関数としてBpen_adjの値を求めることによって見出され、DSMfilt=Thresの時に最悪のケースであると仮定する。
【数5】
【0065】
Bpen_adjの固定の初期化値は、Bsecの関数として決定される。Bpen_adjの値は、
図6にBsecの関数として示されている。
【0066】
次に、音声フレームエラー率(FER)解析について考える(ASBM=1の場合)。以下の議論では、上述の混合アルゴリズムのFER性能が既存の混合アルゴリズムに対して比較される。
【0067】
DSM=DSMfiltの時に、定常状態均衡時の改善された混合アルゴリズムに関してFER範囲を計算することができる。デジタル音声選択中の最も高い定常状態FER_upper値は、DSMfilt=DSMの時にDSM=Th_d2aに設定し、FER_upper=1−DSMと認識することによって見出される。
DSM=0.875−2・offset=0.875−2・(DSM−Thres)
【数6】
Thres=0.9375の時に、FER_upper=0.08333
【0068】
アナログ音声選択中の最も低い定常状態FER_lower値は、DSMfilt=DSMの時にDSM=Th_a2dに設定することによって解かれる。
DSM=1−offset=1−(DSM−Thres)=1+Thres−DSM
【数7】
Thres=0.9375の時に、FER_lower=0.03125
【0069】
改善された混合アルゴリズムのためのThres、FER_upper、及びFER_lowerの間の関係を
図7に示す。
【0070】
既存の混合アルゴリズムのためのFER_upper及びFER_lowerは、定常状態均衡時と同じ方法で解かれる。この解析の詳細については、便宜上、ここでは省略する。定常状態表現は以下の通りである。
Thres=(1−FER)[Thres・Ga_r+(1−Ga_r)]+FER(Thres・Ga_f)
この場合のGa_rは、上昇するDSM IIR利得であり、Ga_fは、下降するDSM IIR利得であり、Thresは、低い又は高いFER値に応じてTh_a2d又はTh_d2aのいずれかである。
【0072】
表2は、既存の混合アルゴリズムの混合閾値レベル(Q1からQ4)の関数としてのFER_upper及びFER_lowerを示している。Q1は、破損デジタル音声フレームが最も少ない最高の音声品質を表す。これは、間欠的なデジタルカバレージ期間中に、より多くのミュート(又はアナログへの混合)を通じて達成される。Q4は、最も低いデジタル音声品質をもたらすが、デジタルカバレージは広くなる。Q3は、アナログ音声バックアップを有する混成信号のための通常デフォルトレベルである。
【0073】
(表2)
表2:既存の混合アルゴリズムのための混合閾値Qの関数としてのFER
【0074】
図8のプロットは、改善された混合アルゴリズムのFER_upper及びFFER_lower値を既存の混合アルゴリズムと比較している。Q1からQ4にある既存の混合のFER値は、改善された混合アルゴリズムに対応するThres値に描画されたポイント(記号)として表されている。
【0075】
図8では、デフォルトThres=0.9375を有する改善された混合アルゴリズムのためのFER閾値は、Q2とQ3の間にあるが、よりQ2に近い。改善された混合アルゴリズムのためのFER_upperでは、既存の混合音声品質Q1及びQ2に関して、Thresが1を超える必要があることに注意されたい。これは、改善された混合アルゴリズムでは達成することができず、Th_d2aの調節を行ってこれに対処することができる(推奨しない)。
FER_lower(0.9375)=0.03125、FER_upper(0.9375)=0.08333
【0076】
Q3において既存の混合に対応する混合FER閾値は、約Thres=0.84にほぼ対応すると考えられる。
【0077】
ここで、推奨のデフォルトパラメータ値について説明する。
【0078】
アナログバックアップ音声を有する混成HD Radio波形の場合、又はコア/強化モードの強化音声ストリームの場合に、
ASBM=1、Thres=0.9375、Rsec=10、Bsec=60
【0079】
アナログバックアップ音声を持たないデジタルのみの音声ストリーム(非強化)(例えば、全デジタル波形又はマルチキャストチャネル)の場合に、
ASBM=0、Thres=0.688、(Rsec及びBsecが実質的に無効にされるので、これらの値は任意である)
【0080】
これに加えて、推奨はしないが、FM SPSマルチキャスト(例えば、HD2)音声FER性能は、変数th_d2aが0.575の値に固定される場合に既存の混合アルゴリズムの性能と同等にすることができる。これに加えて、Bsecを60から40に短縮してデジタル音声の可用性及び混合数を増大し、又は90に拡大してデジタル音声の可用性を犠牲にして混合数を更に減少させることができる。
【0082】
(表1)
表1:推奨のデフォルトパラメータ値
【0083】
上記の説明から、無線受信機内でデジタル音声放送信号を処理する方法は、デジタル音声放送信号を受信する段階と、デジタル音声放送信号を復調してアナログ音声ストリーム及びデジタル音声ストリームを生成する段階と、デジタル音声ストリームに対するデジタル信号品質値を決定する段階と、デジタル信号品質値が適応アナログ対デジタル閾値を超える時に、無線受信機の出力をアナログ音声ストリームからデジタル音声ストリームに混合する段階と、デジタル信号品質値が適応デジタル対アナログ閾値よりも下がる時に、無線受信機の出力をデジタル音声ストリームからアナログ音声ストリームに混合する段階とによって実施することができることは明らかであり、適応デジタル対アナログ閾値は、適応アナログ対デジタル閾値よりも低い。
【0084】
上述の実施形態では、チャネル障害からの回復速度は、信号品質の適応関数として決定される。
【0085】
上述の実施形態では、デジタル信号品質値DSM(すなわち、第1デジタル信号品質値)自体をIIRフィルタリングして、より長期のデジタル信号品質値DSMfilt(すなわち、第2デジタル信号品質値)を生成することができる。デジタル音声品質のこのより長期の表示を用いて適応混合閾値を調節する。デジタルからアナログへの混合直後に、DSMfiltを低減するためにペナルティBpenが適用される。このペナルティは、デジタル音声ストリームへの早期の再混合の確率を低下させる。適応閾値Th_a2d及びTh_d2aを決定するために、DSMfiltの関数としてオフセット値が計算される。この適応処理は、より長期のデジタル信号品質(DSMfilt)が良好であり、かつデジタル信号の選択が好ましい時に、両方の閾値を低下させる効果を有する。初期化定数Rsecは、長期デジタル信号停止後の最小デジタル音声回復時間を表す。初期化定数Bsecは、アナログへの混合後のデジタル音声回復時間であり、混合直前はDSMfilt=Thresであり、混合後は完璧なデジタル信号であると仮定される。長期信号品質が良好である時、Thresを超えるようにDSMfiltを上昇させ、アナログ対デジタル閾値Th_a2dは1未満に低減され、DSMがTh_a2dを超える時にデジタルへの再混合を可能にする。
【0086】
図4に示す機能は、例えば、本明細書に説明する機能を実行するようにプログラムされた又は他の方法で構成された1又はそれ以上のプロセッサを用いて無線受信機の回路に実施することができる。上述の方法を実施するために、他のハードウェア実施形態及びソフトウェア実施形態、及びこれらの組合せも使用することができる。
【0087】
上述の混合アルゴリズムを用いて、(アナログ復調器からの)時間多様性アナログ音声ストリームでデジタル信号停止を埋めることができる。アナログ音声を維持することは、一般的に、短い間欠的なデジタル音声バーストを許容するよりも好ましい。アルゴリズムは、デジタル音声のギャップを埋めるように試みる一方で、これを行うための混合事象の数を最小限にする。これは、デジタル音声カバレージを最大にすることはないが、聴取者によって知覚される音声品質が改善される。アルゴリズムは、FM及びAMの両方のIBOCシステムに適用可能である。
【0088】
好ましい実施形態に関して本発明を説明したが、当業者には以下の特許請求の範囲によって定義されるような本発明の範囲から逸脱することなく上述の実施形態に様々な変更を加えることができることは明らかであろう。