IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アルインコ株式会社の特許一覧 ▶ アルインコ・エレクトロニクス・ベトナム・カンパニー・リミテッドの特許一覧

特開2023-65096デジタル無線送信装置及びデジタル無線通信システム
<>
  • 特開-デジタル無線送信装置及びデジタル無線通信システム 図1
  • 特開-デジタル無線送信装置及びデジタル無線通信システム 図2
  • 特開-デジタル無線送信装置及びデジタル無線通信システム 図3
  • 特開-デジタル無線送信装置及びデジタル無線通信システム 図4
  • 特開-デジタル無線送信装置及びデジタル無線通信システム 図5
  • 特開-デジタル無線送信装置及びデジタル無線通信システム 図6
  • 特開-デジタル無線送信装置及びデジタル無線通信システム 図7
  • 特開-デジタル無線送信装置及びデジタル無線通信システム 図8
  • 特開-デジタル無線送信装置及びデジタル無線通信システム 図9
  • 特開-デジタル無線送信装置及びデジタル無線通信システム 図10
  • 特開-デジタル無線送信装置及びデジタル無線通信システム 図11
  • 特開-デジタル無線送信装置及びデジタル無線通信システム 図12
  • 特開-デジタル無線送信装置及びデジタル無線通信システム 図13
  • 特開-デジタル無線送信装置及びデジタル無線通信システム 図14
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023065096
(43)【公開日】2023-05-12
(54)【発明の名称】デジタル無線送信装置及びデジタル無線通信システム
(51)【国際特許分類】
   G10L 21/0208 20130101AFI20230502BHJP
   G10L 25/30 20130101ALI20230502BHJP
   G10L 19/00 20130101ALI20230502BHJP
【FI】
G10L21/0208 100Z
G10L25/30
G10L19/00 100
【審査請求】有
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2021175700
(22)【出願日】2021-10-27
(11)【特許番号】
(45)【特許公報発行日】2022-05-19
(71)【出願人】
【識別番号】000101662
【氏名又は名称】アルインコ株式会社
(71)【出願人】
【識別番号】521471431
【氏名又は名称】アルインコ・エレクトロニクス・ベトナム・カンパニー・リミテッド
【氏名又は名称原語表記】ALINCO ELECTRONICS VIETNAM CO.,LTD.
(74)【代理人】
【識別番号】100101454
【弁理士】
【氏名又は名称】山田 卓二
(74)【代理人】
【識別番号】100135703
【弁理士】
【氏名又は名称】岡部 英隆
(72)【発明者】
【氏名】玉田 賀久
(72)【発明者】
【氏名】日▲高▼ 耕二
(72)【発明者】
【氏名】國分 二郎
(72)【発明者】
【氏名】ヴォー・ミン・ニュット
【テーマコード(参考)】
5K052
【Fターム(参考)】
5K052AA01
5K052BB01
5K052FF12
(57)【要約】
【課題】「予め記録した非音声データとAD変換による非音声信号の音源パターン解析処理を行ってから非音声コードを生成」などの複雑な信号処理を行う必要がなく、戸別局において異音となったチャイム音を除去して、音声信号のみを出力する。
【解決手段】デジタル無線送信装置は、音声信号及び非音声信号を含む低周波信号を、デジタル変調器により所定の音声圧縮方式を用いてデジタル変調して無線送信する。デジタル無線送信装置は、音声信号及び非音声信号を含む低周波信号からノイズをキャンセルするように音声信号処理を行ってデジタル変調器に出力するノイズキャンセル部を備える。ノイズキャンセル部は、人間の音声の特徴パラメータを用いて、入力される音声信号からノイズを含む非音声期間であるか否かを判定する深層学習モデル部を学習して、学習された深層学習モデル部を構成して備える音声信号処理部を備える。
【選択図】図1
【特許請求の範囲】
【請求項1】
音声信号及び非音声信号を含む低周波信号を、デジタル変調器により所定の音声圧縮方式を用いてデジタル変調して無線送信するデジタル無線送信装置において、
前記音声信号及び非音声信号を含む低周波信号からノイズをキャンセルするように音声信号処理を行って前記デジタル変調器に出力するノイズキャンセル部を備え、
前記ノイズキャンセル部は、
人間の音声の特徴パラメータを用いて、入力される音声信号からノイズを含む非音声期間であるか否かを判定する深層学習モデル部を学習して、学習された前記深層学習モデル部を構成して備える音声信号処理部を備え、
前記音声信号処理部は、前記学習された深層学習モデル部を用いて、ノイズキャンセル処理を行い、
前記音声信号処理部は、前記学習された深層学習モデル部の前記判定に基づいて、入力される音声信号からノイズを含む非音声期間を通過させないようにノイズキャンセル処理を行って、前記ノイズキャンセル処理後の音声信号を出力する、
デジタル無線送信装置。
【請求項2】
前記深層学習モデル部は、人間の音声の特徴パラメータを入力とし、入力される音声信号からノイズを含む非音声期間であるか否かを判定する判定結果を出力とする、所定のニューラルネットワークにより構成される、
請求項1に記載のデジタル無線送信装置。
【請求項3】
前記デジタル無線送信装置は、地域防災無線システムの中継局に設けられる、
請求項1又は2に記載のデジタル無線送信装置。
【請求項4】
前記音声信号及び非音声信号を含む低周波信号は、第1のデジタル無線受信装置により受信されて復調されたものである、
請求項3に記載のデジタル無線送信装置。
【請求項5】
前記音声信号及び非音声信号を含む低周波信号は、音源再生出力装置により出力されたものである、
請求項1又は2に記載のデジタル無線送信装置。
【請求項6】
請求項1~5のうちのいずれか1つに記載のデジタル無線送信装置と、
地域防災無線システムの戸別局に設けられた第2のデジタル無線受信装置であって、前記デジタル無線送信装置により送信された無線信号を音声信号にデジタル復調して出力する前記第2のデジタル無線受信装置と、
を備えるデジタル無線通信システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、例えば地域防災無線システムなどに用いるデジタル無線送信装置及びデジタル無線通信システムに関する。
【背景技術】
【0002】
地震、津波などの地域防災のために、市町村庁舎内に設けられる統制局と、小高い丘や山などに設けられる複数の中継局と、各戸に設けられる複数の戸別局とから構成される地域防災無線システムが実用化されている(例えば、特許文献1及び2参照。)。
【0003】
上記地域防災無線システムにおいては、一斉、グループ、個別など聴者選択呼出方式により通達を行う同報設備における放送は、音声音源(放送者の肉声や音声ガイダンスなどの疑似音声)と非音声音源(放送開始通知用チャイム音、放送終了通知用チャイム音、緊急通知用サイレン音、設備点検用音楽音源など)を組み合わせた内容で構成されており、非音声音源は放送開始、放送終了、緊急性など内容を確実に聴者へ伝えることを目的にチャイムの音階やサイレンパターンに意味付けがされている。
【0004】
上記地域防災無線システムでは、統制局から中継局へは16値QAM方式を用いて音声及び非音声をデジタル変調して無線送信し、中継局から戸別局へはAMBE音声圧縮方式及び4値FSK方式を用いて音声及び非音声を狭帯域デジタル変調して無線送信している(例えば、非特許文献1及び2参照。)。
【0005】
図12は、特許文献1又は2に開示された地域防災無線システムの構成例及びその動作を示すブロック図である。図12において、従来例に係る地域防災無線システムは、統制局1と、中継局2と、戸別局3とを備えて構成される。ここで、統制局1は、アンテナ12Aを有するデジタル無線送信装置12を含む。中継局2は、アンテナ21Aを有するデジタル無線受信装置21と、アンテナ22Aを有するデジタル無線送信装置22とを含む。戸別局3は、アンテナ31Aを有するデジタル無線受信装置31と、スピーカ32とを含む。
【0006】
しかしながら、上記地域防災無線システムでは、中継局2から戸別局3へはAMBE音声圧縮方式及び4値FSK方式を用いて音声及び非音声を狭帯域デジタル変調して無線送信しているために、音声については戸別局3において正しく復調できるが、非音声については正しく復調できず異音として出力されて戸別局3の住民は放送内容を理解することができないという問題点があった。
【0007】
前記問題点を解決するために、上記地域防災無線システムなどのデジタル無線通信システムにおいて、戸別局3で非音声についても正しく出力できるデジタル無線送信装置等が特許文献3に開示されている。
【0008】
特許文献3において開示された従来例に係るデジタル無線送信装置において、音源解析回路は低周波信号のデジタルデータを所定の信号解析処理の演算を行うことにより時系列信号解析パターンを演算し、スペクトルパターンと格納した複数の種類の非音声コード信号の時系列信号解析パターンとを比較して非音声信号の種類を判別して判別した非音声信号の種類を示す非音声コード信号を発生する。信号処理回路は低周波信号を所定の遅延時間だけ遅延させた後、デジタルデータにAD変換して音声圧縮方式を用いて符号化して音声信号のデジタルデータを出力する。スイッチは非音声コード信号が発生されていないとき音声信号のデジタルデータを選択し、非音声コード信号が発生されているとき非音声コードに対応するデジタルデータを選択しこれらが無線送信される。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】特開2000-224058号公報
【特許文献2】特開2002-135849号公報
【特許文献3】特許第5980713号公報
【非特許文献】
【0010】
【非特許文献1】一般社団法人電波産業会、「デジタル簡易無線局の無線設備-標準規格」,ARIB STD-T98,1.4版,平成26年12月26日改定,[令和3年10月27日検索],インターネット<URL:http://www.arib.or.jp/english/html/overview/doc/1-STD-T98v1_3.pdf>
【非特許文献2】DVSI社、「AMBE方式ボコーダ・チップ」,INTERNIX NEWSLETTER,No.93,p.26,[平成25年4月5日検索],インターネット<URL:http://www.internix.co.jp/products/dvsi/pdf/nl93_dvsi.pdf>
【発明の概要】
【発明が解決しようとする課題】
【0011】
すなわち、中継局2のデジタル無線送信装置22では予め記録した非音声データとA/D変換による非音声信号の音源パターン解析処理を行ってから非音声コードを生成し、音声信号と非音声コードを狭帯域デジタル変調して伝送する。次いで、戸別局3のデジタル無線受信装置31では、音声信号はそのまま鳴動させ、予め記録した非音声信号データから非音声コードに該当する非音声信号を選択して鳴動させることで、前記問題点を解決できる。
【0012】
しかし、非音声信号の種類は行政、自治体によって異なるため、導入先ごとの対応音源を個別に格納しなければならない。そして手続き上、音源のデータを入手すること自体も容易でないため、この対策方法を搭載した機器は導入も容易でない。
【0013】
本発明の目的は以上の問題点を解決し、従来例のように、「予め記録した非音声データとAD変換による非音声信号の音源パターン解析処理を行ってから非音声コードを生成」などの複雑な信号処理を行う必要がなく、戸別局において異音となったチャイム音を除去して、音声信号のみを出力することができるデジタル無線送信装置及びデジタル無線通信システムを提供することにある。
【課題を解決するための手段】
【0014】
本発明の一態様に係るデジタル無線送信装置は、
音声信号及び非音声信号を含む低周波信号を、デジタル変調器により所定の音声圧縮方式を用いてデジタル変調して無線送信するデジタル無線送信装置において、
前記音声信号及び非音声信号を含む低周波信号からノイズをキャンセルするように音声信号処理を行って前記デジタル変調器に出力するノイズキャンセル部を備え、
前記ノイズキャンセル部は、
人間の音声の特徴パラメータを用いて、入力される音声信号からノイズを含む非音声期間であるか否かを判定する深層学習モデル部を学習して、学習された前記深層学習モデル部を構成して備える音声信号処理部を備え、
前記音声信号処理部は、前記学習された深層学習モデル部を用いて、ノイズキャンセル処理を行い、
前記音声信号処理部は、前記学習された深層学習モデル部の前記判定に基づいて、入力される音声信号からノイズを含む非音声期間を通過させないようにノイズキャンセル処理を行って、前記ノイズキャンセル処理後の音声信号を出力する。
【発明の効果】
【0015】
従って、本発明に係るデジタル無線送信装置等によれば、深層学習モデルを有するノイズキャンセル部を用いてチャイム音などの非音声信号を除去し、防災無線再送信での音声信号のみの再送信をすることができる。従って、従来例のように、「予め記録した非音声データとAD変換による非音声信号の音源パターン解析処理を行ってから非音声コードを生成」などの複雑な信号処理を行う必要がないので、極めて簡単な構成となるとともに、戸別局において異音となったチャイム音を除去して、音声信号のみを出力することができる。
【図面の簡単な説明】
【0016】
図1】本発明の実施形態1に係る地域防災無線システムの構成例を示すブロック図である。
図2図1のノイズキャンセル部23の詳細構成例を示すブロック図である。
図3図2の深層学習モデル部135の詳細構成例を示すブロック図である。
図4図1の中継局2Bのデジタル無線送信装置22Bの構成を示すブロック図である。
図5図1の戸別局3Bのデジタル無線受信装置31Bの構成を示すブロック図である。
図6】比較例に係る地域防災無線システムの構成を示すブロック図である。
図7図6の中継局2のデジタル無線送信装置22の構成を示すブロック図である。
図8図7の音源解析回路41の構成を示すブロック図である。
図9図6の戸別局3のデジタル無線受信装置31の構成を示すブロック図である。
図10図6の地域防災無線システムの防災放送の内容に対する信号処理を示すタイミングチャートである。
図11】本発明の実施形態2に係る地域防災無線システムの構成例を示すブロック図である。
図12】従来例に係る地域防災無線システムの構成例及びその動作を示すブロック図である。
図13】実施形態1に係る地域防災無線システムの構成例及びその動作を示すブロック図である。
図14】実施形態2に係る地域防災無線システムの構成例及びその動作を示すブロック図である。
【発明を実施するための形態】
【0017】
以下、本発明に係る実施形態及び変形例について図面を参照して説明する。なお、同一又は同様の構成要素については同一の符号を付している。
【0018】
(比較例)
まず、図6図10を参照して、特許文献3において開示された比較例に係る地域防災無線システムの構成について以下に説明する。
【0019】
図6は比較例に係る地域防災無線システムの構成を示すブロック図である。図6において、地域防災無線システムは、市町村庁舎内に設けられる統制局1と、小高い丘や山などに設けられる複数の中継局2と、各戸に設けられる複数の戸別局3とから構成される。統制局1は、統制操作装置11と、デジタル無線送信装置12と、マイクロホン13と、複数のスイッチ14とを備えて構成される。ここで、マイクロホン13から入力される音声はマイクロホン13により音声信号に変換された後、統制操作装置11内の音声増幅器15により増幅されて加算器16に出力される。14は例えば上記音声信号を放送する内容の前後において発生させるための非音声信号を選択するための複数のスイッチであり、表1に示すように、例えば9種類の非音声信号のうちのいずれか1つを選択して1つのスイッチ14を押下することにより非音声信号発生器17は対応する非音声信号を発生して加算器16に出力する。
【0020】
【表1】
【0021】
加算器16は入力される2つの低周波信号を加算してデジタル無線送信装置12に出力する。デジタル無線送信装置12は入力される低周波信号を例えば16値QAM方式でデジタル変調しかつ電力増幅して、無線信号をアンテナ12Aから中継局2に向けて送信する。
【0022】
中継局2は、アンテナ21Aを有するデジタル無線受信装置21と、アンテナ22Aを有するデジタル無線送信装置22とを備えて構成される。デジタル無線受信装置21はアンテナ21Aにより統制局1から受信した無線信号を受信してデジタル復調して低周波信号に変換した後、デジタル無線送信装置22に出力する。デジタル無線送信装置22は、入力される低周波信号を例えばAMBE音声圧縮方式及び4値FSK方式を用いて狭帯域デジタル変調しかつ電力増幅して無線信号をアンテナ22Aから戸別局3に送信する。ただし、受信した無線信号の低周波信号のうち非音声については、図7及び図8を参照して詳細後述するように対応する非音声コードに変換して送信することを特徴としている。
【0023】
戸別局3は、アンテナ31Aを有するデジタル無線受信装置31と、スピーカ32とを備えて構成される。デジタル無線受信装置31はアンテナ31Aにより中継局2から受信した無線信号を受信して復調してスピーカ32に出力する。ただし、受信した無線信号の低周波信号のうち非音声信号については、図9を参照して詳細後述するように対応する非音声コードを非音声信号に変換して出力することを特徴としている。
【0024】
図7図6の中継局2のデジタル無線送信装置22の構成を示すブロック図であり、図8図7の音源解析回路41の構成を示すブロック図である。図7において、デジタル無線送信装置22は、音源解析回路41と、遅延回路42と、AD変換器43と、音声エンコーダ44と、非音声コード発生器45と、スイッチ46と、狭帯域デジタル変調器47と、電力増幅器48と、アンテナ22Aとを備えて構成される。ここで、遅延回路42と、AD変換器43と、音声エンコーダ44とにより音声信号の信号処理回路49を構成する。
【0025】
図7において、デジタル無線受信装置21から出力される低周波信号は音源解析回路41及び遅延回路42に入力される。音源解析回路41は入力される低周波信号が音声信号であるか所定の非音声信号であるかを判別して所定の非音声コード信号を出力する。
【0026】
ここで、音源解析回路41は、図8に示すように、AD変換器51と、FFT演算器52と、非音声比較判別器53と、非音声コードスペクトルパターンメモリ54とを備えて構成される。図8において、低周波信号はAD変換器51によりデジタルデータにAD変換された後、FFT演算器52により高速フーリエ変換(FFT)処理が行われて上記デジタルデータはスペクトルパターン(時間経過に対するスペクトルパターン、すなわち時系列スペクトルパターンをいう。)に変換されて非音声比較判別器53に出力される。非音声コードスペクトルパターンメモリ54には、例えば表1に示す9種類の非音声コードに係る非音声信号のスペクトルパターンが格納され、非音声比較判別器53は入力される受信したスペクトルパターンを、上記格納したスペクトルパターンとパターンマッチングにより比較することにより、受信した非音声信号が例えば9種類のうちのどの非音声コードに対応するかを判別し、判別結果の非音声コードを示す非音声コード信号を出力する。なお、受信したデジタルデータが音声信号である場合は、非音声コード信号を出力しない。
【0027】
図7に戻り説明すると、音源解析回路41からの非音声コード信号は非音声コード発生器45及びスイッチ46に出力される。スイッチ46は、非音声コード信号が入力されるときは接点b側に切り替わる一方、入力されないときは接点a側に切り替わる。また、非音声コード発生器45は入力される非音声コード信号に応答して当該非音声コード信号により示される非音声コードを発生して出力する。
【0028】
図7において、遅延回路42は入力される低周波信号を、上記音源解析回路41の信号処理でかかる時間からAD変換器43及び音声エンコーダ44での処理時間を減算した所定の遅延時間(例えば3秒)だけ遅延した後、AD変換器43に出力する。AD変換器43は入力される遅延された低周波信号を音声のデジタルデータに変換した後、音声エンコーダ44に出力する。音声エンコーダ44は入力される音声のデジタルデータを例えばAMBE音声圧縮方式で符号化して符号化後のデジタルデータをスイッチ46の接点a側を介して狭帯域デジタル変調器47に出力する。従って、スイッチ46からは、非音声コード信号がスイッチ46に入力されていないときは、音声エンコーダ44からの音声のデジタルデータが出力される一方、非音声コード信号がスイッチ46に入力されているときは、非音声コード発生器45からの非音声コード(デジタルデータ)が出力される。狭帯域デジタル変調器47は、入力されるデジタルデータに従って所定の搬送波を、例えば4値FSK方式で狭帯域デジタル変調して、変調後の変調信号を所定の無線信号に高域周波数変換した後、電力増幅器48で電力増幅し、当該無線信号をアンテナ22Aから送信する。
【0029】
図9図6の戸別局3のデジタル無線受信装置31の構成を示すブロック図である。図9において、デジタル無線受信装置31は、アンテナ31Aと、高周波低雑音増幅器61と、狭帯域デジタル復調器62と、非音声コード判別器63と、音声デコーダ64と、非音声信号発生器65と、スイッチ66と、低周波増幅器67と、スピーカ32とを備えて構成される。
【0030】
図9において、アンテナ31Aにより受信された無線信号は高周波低雑音増幅器61により低雑音増幅された後、狭帯域デジタル復調器62によりデジタルデータに復調され、非音声コード判別器63と音声デコーダ64に出力される。非音声コード判別器63はデジタルデータから非音声コードを抽出して取り出して非音声コードを示す非音声コード信号を発生してスイッチ66及び非音声信号発生器65に出力する。音声デコーダ64は入力される音声のデジタルデータを信号処理する信号処理回路であって、例えばAMBE音声圧縮方式に対応するAMBE音声伸張方式で復号化して復号化後の音声の低周波信号、すなわち音声信号をスイッチ66の接点a側を介して低周波増幅器67に出力する。一方、非音声信号発生器65は、入力される非音声コード信号に応答して当該非音声コード信号により示される非音声コードに対応する非音声の低周波信号、すなわち非音声信号を発生してスイッチ66の接点b側を介して低周波増幅器67に出力する。従って、スイッチ66からは、非音声コード信号がスイッチ66に入力されていないときは、音声デコーダ64からの音声信号が出力される一方、非音声コード信号がスイッチ66に入力されているときは、非音声信号発生器65からの非音声コードに対応する非音声信号が出力される。低周波増幅器67は入力される低周波信号を増幅してスピーカ32から出力する。
【0031】
図10図6の地域防災無線システムの防災放送の内容に対する信号処理を示すタイミングチャートである。以上のように構成された地域防災無線システムの動作について図10を参照して以下に説明する。なお、本比較例においては、音声信号と非音声信号とは時間的に重ならないように放送されるものとし、音声信号と非音声信号とは順次放送されて送信されかつ受信される。
【0032】
図10において、まず、防災放送では、チャイム音又はサイレン音などの非音声が放送される。このとき、本システムでは、中継局2から戸別局3に対して非音声信号に代えて非音声コードを送信し、戸別局3では非音声コードを対応する非音声の低周波信号に変換してスピーカ32から出力する。次いで、上記非音声に続いて音声で放送される。この場合は、従来と同様に中継局2から戸別局3に対して音声信号で狭帯域デジタル変調された無線信号を送信し、戸別局3では無線信号を復調して音声の低周波信号に変換してスピーカ32から出力する。さらに、チャイム音又はサイレン音などの非音声信号が放送される。このとき、中継局2から戸別局3に対して非音声信号に代えて非音声コードを送信し、戸別局3では非音声コードを対応する非音声信号に変換してスピーカ32から出力する。
【0033】
以上説明したように、比較例によれば、中継局2から戸別局3に対して、非音声信号に代えて非音声コードを送信し、戸別局3では非音声コードを対応する非音声信号に変換してスピーカ32から出力するので、例えばAMBE音声圧縮方式を用いた狭帯域デジタル変調方式であっても、異音ではない正しい非音声の音がスピーカ32から出力され、戸別局3の住民は放送内容を理解することができる。
【0034】
以上のように構成された比較例に係る防災無線システムでは、従来技術において説明したように、以下の問題点があった。
(1)非音声信号の種類は行政、自治体によって異なるため、導入先ごとの対応音源を個別に格納しなければならない。
(2)そして手続き上、音源のデータを入手すること自体も容易でないため、この対策方法を搭載した機器は導入も容易でない。
【0035】
これらの問題点を解決するために、本発明者らは、以下の実施形態1及び2に係る防災無線システムを発明したものである。
【0036】
(実施形態1)
図1は本発明の実施形態1に係る地域防災無線システムの構成例を示すブロック図である。図1の地域防災無線システムは、図6の地域防災無線システムに比較して以下の点が異なる。
(1)中継局2に代えて中継局2Bを備える。中継局2Bでは、デジタル無線送信装置22に代えてデジタル無線送信装置22Bを備えるとともに、デジタル無線受信装置21とデジタル無線送信装置22Bとの間においてノイズキャンセル部23をさらに備える。
(2)戸別局3に代えて戸別局3Bを備える。戸別局3Bでは、デジタル無線受信装置31に代えて、デジタル無線受信装置31Bを備える。
以下、相違点について説明する。
【0037】
図1において、デジタル無線受信装置21から出力される音声信号及び非音声信号はノイズキャンセル部23に入力される。ノイズキャンセル部23は、後述する深層学習モデル部135(図2及び図3)を用いて音声期間と、ノイズを含む非音声期間とを区別して、非音声期間を通過させないようにノイズキャンセル処理を行って、音声以外のノイズを除去する処理を行った後、処理後の音声信号をデジタル無線送信装置22Bに出力する。
【0038】
デジタル無線送信装置22Bは、入力される音声信号(低周波信号)を例えばAMBE音声圧縮方式及び4値FSK方式を用いて狭帯域デジタル変調しかつ電力増幅して無線信号をアンテナ22Aから戸別局3Bに送信する。ただし、受信した無線信号の低周波信号のうち非音声信号については、図2及び図3を参照して詳細後述するように、ノイズキャンセル部23により除去されて送信することを特徴としている。
【0039】
戸別局3Bは、アンテナ31Aを有するデジタル無線受信装置31Bと、スピーカ32とを備えて構成される。デジタル無線受信装置31Bはアンテナ31Aにより中継局2Bから送信した無線信号を受信して復調してスピーカ32に出力する。ただし、受信した無線信号の低周波信号のうち非音声信号については、図2及び図3を参照して詳細後述するように、ノイズキャンセル部23により除去されて送信されるので、スピーカ32から出力されないことを特徴としている。
【0040】
図2図1のノイズキャンセル部23の詳細構成例を示すブロック図である。ここで、図2を参照して、深層学習モデル部135を用いた図1のノイズキャンセル部23の構成及び動作について以下に説明する。
【0041】
ここで、「音素」という用語は、特定の言語において1つの単語を他の単語から区別する音の単位を意味し、「振動レート」という用語は、各秒におけるデジタル化された振動データの0と1の間の移動の数を意味し、「振動計数値(VC)」という用語は、各フレーム内のデジタル化された振動データの値の合計を意味する。また、「振動パターン」とは、時間軸に沿った所定のフレーム数ごとに算出された振動数の総和のデータ分布を意味する。深層学習モデル部135では、異なる振動パターン、すなわち異なる振動計数値の総和(VS値)のデータ分布の違いを考慮して、ノイズキャンセル処理を行っており、振動レートは振動計数値に類似しているが、振動レートが大きいほど、振動計数値も大きくなる。
【0042】
音声信号の振幅と振動レートは共に観測可能である。ノイズキャンセル部23の特徴は、音声信号の振幅と振動率に応じて音声イベントを検出することである。また、別の特徴は、デジタル化された振動データの振動計数値の総和を、あらかじめ定義されたフレーム数分だけ計測することで、音声と、非音声/無音を区別することである。もう一つの特徴は、入力される音声信号データのストリームをその振動パターンによって異なる音素に分類することである。別の特徴は、下流の処理部をトリガするように、入力される音声信号データストリームから最初の起動音素を正しく区別することであり、それによって、処理部を含む計算システムの電力消費等の計算コストを節約することである。
【0043】
図2において、ノイズキャンセル部23は音声イベント検出を用いてノイズキャンセル処理を行うものであって、音声信号前置処理部138と、AD変換器139と、音声信号処理部130とを備えて構成される。ここで、音声信号前置処理部138は、アナログ音声信号に対して、ハイパスフィルタリング、ローパスフィルタリング、増幅又はそれらの組み合わせ等を含む、音声信号前置処理を行って、処理後のアナログ音声信号をAD変換器139に出力する。すなわち、音声信号前置処理部138は、デジタル無線受信装置21からの音声信号及び非音声信号に対して、人間の音声信号の所定のレベル範囲であって、所定の帯域幅のみを通過させる。次いで、AD変換器139は、所定の基準電圧Vref及び許容電圧Vadm(<Vref)に従って、アナログ音声信号をデジタル音声信号にAD変換して音声信号処理部130の入力インターフェース136に出力する。
【0044】
本実施形態において、AD変換器139において、基準電圧Vrefよりも小さい許容電圧Vadmは、基準電圧Vrefと組み合わせて、第1のしきい値電圧Vth1(=Vref+Vadm))及び第2のしきい値電圧Vth2(=Vref-Vadm)を形成するために使用され、AD変換器139は、第1のしきい値電圧Vth1及び第2のしきい値電圧Vth2に基づいて、第1のしきい値電圧Vth1以上又は第2のしきい値電圧Vth2以下のノイズに対してAD変換を実行せず、その間の音声信号に対してAD変換を実行することで、入力されるアナログ音声信号のノイズ及び干渉を除去することができる。ここで、例えばVref=1.0V,Vadm=0.01Vとすると、静かな環境では振動データの振動数が少なく,音声環境では振動データの振動数が多いことが理解できる。なお、本実施形態において、「フレームサイズ」とは、各フレーム内のデジタル化された振動データに対応するサンプリングポイントの数を意味し、「音素ウィンドウTw」とは、各音素の音声特徴量を収集するための時間を意味する。好ましい実施形態では、各フレームの継続時間Tfは例えば0.1~1ミリ秒(ms)であり、音素ウィンドウTwは例えば約0.3秒である。さらに好ましい実施形態では、各フレーム内のデジタル化された振動データに対応するサンプリングポイントの数は例えば1~16の範囲である。
【0045】
音声信号を分析する場合、ほとんどの音声信号は短期間で安定しているので、通常、短期分析の方法が採用される。例えば、AD変換器139で使用されるサンプリング周波数fsが16000であり、各フレームの時間継続期間Tfが1msであると仮定すると、フレームサイズはfs×1/1000=16サンプルポイントとなる。
【0046】
図2において、音声信号処理部130は例えばコンピュータデバイスで構成され、
(1)ノイズキャンセルなどの所定の音声信号処理を実行するCPU(Central Processing Unit)131と、
(2)CPU131の基本処理を実行するオペレーティングシステム及び前記音声信号処理のプログラム、並びに当該プログラムを実行するために必要なデータ等を格納するROM(Read Only Memory)132と、
(3)CPU131の基本処理を実行するオペレーティングシステム及び前記音声信号処理のプログラムの実行時に、処理中のデータ等を格納するRAM(Read Access Memory)133と、
(4)前記音声信号処理を実行するために必要な後述する設定データ等を格納する不揮発性のEEPROM(Electrically Erasable Programmable Memory)134と、
(5)例えばニューラルネットワークなどで構成され、人間の音声信号データに基づいて深層学習されて入力される音声信号データに対して、ノイズを除去して実質的に音声信号のみを抽出して出力する深層学習モデル部135と、
(6)AD変換器139から入力される音声信号データを、後段の信号仕様値に変換するための所定の信号変換処理を行ってCPU131に出力する入力インターフェース136と、
(7)深層学習モデル部135によりノイズが除去された音声信号データを、後段の信号仕様値に変換するための所定の信号変換処理を行ってデジタル無線送信装置22Bに出力する出力インターフェース137と、
を備えて構成される。
【0047】
ここで、EEPROM134は例えば、一連の振動計数値VC、振動計数値の総和VS、振動計数値の総和VSf、振動計数値の総和VSp(後述する)、及びすべての特徴ベクトルの音声特徴値を記憶する。なお、EEPROM134は外部メモリなどの記憶装置であってもよい。ここで、x個のフレームの振動計数値VCを加算して、時点Tjにおける現在のフレームの振動計数値の総和VSを得る。x個のフレームには現在のフレームが含まれる。一実施形態では、CPU131は、時点Tjにおける現在のフレームの振動計数値VCと、その直前(x-1)個のフレームの振動計数値の総和VSpとを加算して、時点Tjにおけるx個のフレームの振動計数値の総和VS(=VC+VSp)を得る。
【0048】
なお、変形例では、CPU131は、時点Tjにおける現在のフレームの振動計数値VC、その直後のy個のフレームの振動計数値の総和VSf、及びその直前の(x-y-1)個のフレームの振動計数値の総和VSpを加算して、時点Tjにおけるx個のフレームの振動計数値の総和VS(=VC+VSf+VSp)を得るが、yはゼロ以上である。CPU131は、VS、VSf及びVSpの値をEEPROM134に格納する。好ましい実施形態では、x個のフレーム(音素ウィンドウTw)の継続時間(x×Tf)は、約0.3秒である。さらに好ましい実施形態では、x個のフレームのデジタル化された振動データに対応するサンプリングポイントの数は、x~16xの範囲にある。
【0049】
一般的に、音声信号データについては、同じ音素では振動計数値VCの振動パターンが類似しているが、異なる音素ではVS値の振動パターンが全く異なる。従って、振動計数値VCの振動パターンを利用して、音素を区別することができる。特に、例えば鶏又は猫の鳴き声と、人間の音声とは、振動計数値VCの周波数分布に関して全く異なり、人間の音声の振動計数値VCのほとんどは40以下に分布していることが既知である。
【0050】
学習フェーズにおいて、音声信号処理部130のCPU131は、まず、所定の音声信号データ収集方法を複数回実行して、複数の音素に対する複数の特徴ベクトルを収集し、複数の特徴ベクトルに対応するラベルを付加して、複数のラベル付き学習例を形成する。その後、起動音素を含む異なる音素に対する複数のラベル付き学習例を、深層学習モデル部135の学習に適用する。最後に、学習された深層学習モデル部135(音声信号データの予測モデルを構成する)を作成して、入力される音声信号データのストリームが起動音素を含むかどうかを分類する。音声信号処理部130の起動音素として、所定の音素が指定されている場合、深層学習モデル部135は、少なくとも当該指定された音素を含む異なる音素についての複数のラベル付き学習例で学習される。
【0051】
すなわち、学習段階では、ラベル付けされた学習例のセットを使用して深層学習モデル部135を学習し、それによって深層学習モデル部135が、ラベル付けされた学習例の各フレームの3つの音声特徴量(例えば、(VSj,TDj,TGj))に基づいて、j=0~299の間で、所定の起動音素を認識するようにする。学習段階の終わりに、学習された深層学習モデル部135は、当該起動音素に対応する学習されたスコアを提供し、学習されたスコアは、次に、入力される音声信号データのストリームをランタイムで分類するための基準として使用される。なお、VSj,TDj,TGjは以下のように定義される。
(1)VSj:フレームjの振動計数値の総和(VS値);
(2)TDj:フレームjにおいて、ゼロではない振動計数値の総和(VS値)の時間期間;及び
(3)TGj;フレームjにおける、ゼロではない振動計数値の総和(VS値)間の時間ギャップ(時間隙間)。
【0052】
深層学習モデル部135を学習するために、教師付き学習に関連する様々な機械学習技術を使用することができ、例えば、サポートベクターマシン(SVM)法、ランダムフォレスト法、畳み込みニューラルネットワーク法などを利用できる。教師付き学習では、複数のラベル付けされた学習例を使用して関数計算部(すなわち、深層学習モデル部135)が作成され、その各例は、入力特徴ベクトルとラベル付けされた出力からなる。学習されたとき、深層学習モデル部135は、対応するスコア又は予測値を生成するために、新しいラベルのない例に適用することができる。
【0053】
図3図2の深層学習モデル部135の詳細構成例を示すブロック図である。
【0054】
深層学習モデル部135は、例えば、図3に示すように、ニューラルネットワークを用いて実装される。ここで、ニューラルネットワークは、1つの入力層141と、少なくとも1つであり好ましくは複数の中間層142と、1つの出力層143を含む。入力層141には3つの入力ニューロン151,152,153があり、各入力ニューロン151,152,153は、特徴ベクトルの各フレームの3つのオーディオ特徴値(すなわち、VSj,TDj,TGj)に対応する。また、中間層142は、各入力ニューロン151,152,153に関連する重み係数と各ニューロンのバイアス係数を有するニューロン161~174で構成される。学習フェーズのサイクルを通じて中間層142の各ニューロン161~174の重み係数とバイアス係数を変更することにより,ニューラルネットワークを学習して,所定の種類の入力に対する予測値を報告するようにすることができる。さらに、出力層143は、音素に対応する1つの予測値(具体的には、音声期間であるか、ノイズを含む非音声期間であるかを示す)を提供する1つの出力ニューロン181を含む。
【0055】
以上説明したように、ノイズキャンセル部23において、深層学習モデル部135は、人間の音声の特徴パラメータを用いて学習され、入力される音声信号からノイズを含む非音声期間であるか否かを判定する。そして、音声信号処理部130のCPU131は、深層学習モデル部135の前記判定に基づいて、入力される音声信号からノイズを含む非音声期間を通過させないようにノイズキャンセル処理を行って、前記ノイズキャンセル処理後の音声信号を出力する。ここで、深層学習モデル部135は、人間の音声の特徴パラメータを入力とし、入力される音声信号からノイズを含む非音声期間であるか否かを判定する判定結果を出力とする、図3のニューラルネットワークにより構成される。
【0056】
図4図1の中継局2Bのデジタル無線送信装置22Bの構成を示すブロック図である。図4のデジタル無線送信装置22Bは、図7のデジタル無線送信装置22に比較して、以下の点が異なる。
(1)音源解析回路41、遅延回路42、非音声コード発生器45、及びスイッチ46が削除される。すなわち、デジタル無線送信装置22Bは、AD変換器43と、音声エンコーダ44と、狭帯域デジタル変調器47と、電力増幅器と、アンテナ22Aとを備えて構成される。
以下、相違点について説明する。
【0057】
図4において、デジタル無線受信装置21からノイズキャンセル部23を介して出力される低周波信号はAD変換器43に入力される。AD変換器43は入力される低周波信号を音声のデジタルデータに変換した後、音声エンコーダ44に出力する。音声エンコーダ44は入力される音声のデジタルデータを例えばAMBE音声圧縮方式で符号化して符号化後のデジタルデータを狭帯域デジタル変調器47に出力する。狭帯域デジタル変調器47は、入力されるデジタルデータに従って所定の搬送波を、例えば4値FSK方式で狭帯域デジタル変調して、変調後の変調信号を所定の無線信号に高域周波数変換した後、電力増幅器48で電力増幅し、当該無線信号をアンテナ22Aから送信する。
【0058】
図5図1の戸別局3Bのデジタル無線受信装置31Bの構成を示すブロック図である。図5のデジタル無線受信装置31Bは、図9のデジタル無線受信装置31に比較して以下の点が異なる。
(1)非音声コード判別器63、非音声信号発生器65,及びスイッチ66が削除される。すなわち、デジタル無線受信装置31Bは、アンテナ31Aと、高周波低雑音増幅器61と、狭帯域デジタル復調器62と、音声デコーダ64と、低周波増幅器67と、スピーカ32とを備えて構成される。
【0059】
図5において、アンテナ31Aにより受信された無線信号は高周波低雑音増幅器61により低雑音増幅された後、狭帯域デジタル復調器62によりデジタルデータに復調され、音声デコーダ64に出力される。音声デコーダ64は入力される音声のデジタルデータを信号処理する信号処理回路であって、例えばAMBE音声圧縮方式に対応するAMBE音声伸張方式で復号化して復号化後の音声の低周波信号を低周波増幅器67に出力する。そして、低周波増幅器67は入力される低周波信号を増幅してスピーカ32から出力する。
【0060】
図13は実施形態1に係る地域防災無線システムの構成例及びその動作を示すブロック図である。
【0061】
図13に示すように、中継局2Bのデジタル無線受信装置21からの音声信号と非音声信号を、深層学習モデル部135(図2)を用いたノイズキャンセル部23(人間の音声の特徴パラメータを入力とし、入力される音声信号からノイズを含む非音声期間であるか否かを判定する判定結果を出力する)を通すことにより、異音の原因となるチャイム音などの非音声信号をフィルタリングした後、デジタル無線送信装置22Bにより狭帯域デジタル変調して送信し、戸別局3Bのデジタル無線受信装置31Bではこれを受信することで非音声は鳴動されず、音声のみが鳴動される。これにより非音声の伝送はできなくなるが、異音の発生を防ぐことや本来重要である正常な音声の認識も容易となる。さらに、行政、自治体ごとの音声データ入手、音声データ格納、非音声信号の音源解析回路41(図7)及び非音声コード発生器45(図7)なども必要無くなるため、導入までのハードルは大幅に下がる、という特有の効果を有する。
【0062】
以上のように構成された、実施形態1に係る防災無線システムによれば、前記問題点を解決するため、深層学習モデル部135(図2)を有するノイズキャンセル部23を用いてチャイム音などの非音声信号を除去し、防災無線再送信での音声信号のみの再送信することができる。従って、従来例のように、「予め記録した非音声データとAD変換による非音声信号の音源パターン解析処理を行ってから非音声コードを生成」などの複雑な信号処理を行う必要がないので、極めて簡単な構成となるとともに、戸別局において異音となったチャイム音を除去して、音声信号のみを出力することができる。
【0063】
(実施形態2)
図11は本発明の実施形態2に係る地域防災無線システムの構成例を示すブロック図である。図11の地域防災無線システムは、図1の実施形態1に係る地域防災無線システムに比較して以下の点が異なる。
(1)統制局又は中継局において、デジタル無線受信装置21を備えず、音源再生出力装置24及びデジタル無線再送信装置2Cが設けられる。
(2)デジタル無線再送信装置2Cは、音源入力部21Cと、ノイズキャンセル部23と、デジタル無線送信装置22Bとを備える。
以下、相違点について説明する。
【0064】
図11において、音源再生出力装置24は音源再生出力部25を備え、音源再生出力部25は例えば音源データを予め記憶するメモリ25mを有し、例えば非音声信号(チャイム音など)及び音声信号を含む防災放送の音源を再生してその信号を音源入力部21Cに出力する。音源入力部21Cは音源再生出力部25とのインターフェース回路であって、入力される信号を所定の信号変換を実行した後、ノイズキャンセル部23に出力する。以下の動作は、実施形態1と同様である。
【0065】
図14図11の実施形態2に係る地域防災無線システムの構成例及びその動作を示すブロック図である。
【0066】
実施形態1では防災無線の受信された音声信号及び非音声信号をノイズキャンセル部23に通して狭帯域デジタル変調して送信していた。これに対して、実施形態2では、デジタル無線受信装置21を備えず、音源入力部21Cを備えたデジタル無線再送信装置2Cに置き換えたことを特徴としている。すなわち、音源入力部21Cから入力された音声信号と非音声信号を深層学習モデル部135(図2)を用いたノイズキャンセル部23(人間の音声の特徴パラメータを入力とし、入力される音声信号からノイズを含む非音声期間であるか否かを判定する判定結果を出力する)を通すことにより、異音の原因となる非音声信号をフィルタリングしてデジタル無線送信装置22Bで狭帯域デジタル変調して送信し、戸別局3Bのデジタル無線受信装置31Bではこれを受信することで非音声は鳴動されず、音声のみが出力される。
【0067】
これにより、防災無線に限らず音源再生出力装置24(例えばチャイム音とアナウンス音声が鳴動する放送システムによる音源再生出力装置など)から出力される非音声信号の伝送はできなくなるが、異音の発生を防ぐことや本来重要である正常な音声の認識も容易となる。さらにシステムを導入する際もすでに導入済みの音源再生出力装置24の仕様及び設定の変更や改造することなく、戸別局3Bのデジタル無線受信装置31Bで音声受信することができ、導入までのハードルは大幅に下がる。
【0068】
(変形例)
以上の実施形態1及び2においては、地域防災無線システムについて説明しているが、本発明はこれに限らず、種々の無線システムに適用することができる。
【産業上の利用可能性】
【0069】
以上詳述したように、本発明に係るデジタル無線送信装置等によれば、深層学習モデルを有するノイズキャンセル部を用いてチャイム音などの非音声信号を除去し、防災無線再送信での音声信号のみの再送信することができる。従って、従来例のように、「予め記録した非音声データとAD変換による非音声信号の音源パターン解析処理を行ってから非音声コードを生成」などの複雑な信号処理を行う必要がないので、極めて簡単な構成となるとともに、戸別局において異音となったチャイム音を除去して、音声信号のみを出力することができる。
【符号の説明】
【0070】
1 統制局
2,2B 中継局
2C デジタル無線再送信装置
3,3B 戸別局
11 統制操作装置
12 デジタル無線送信装置
12A アンテナ
13 マイクロホン
14 スイッチ
15 音声増幅器
16 加算器
17 非音声信号発生器
21 デジタル無線受信装置
21A アンテナ
21C 音源入力部
22,22B デジタル無線送信装置
22A アンテナ
23 ノイズキャンセル部
24 音源再生出力装置
25 音源再生出力部
25m メモリ
31,31B デジタル無線受信装置
31A アンテナ
32 スピーカ
41 音源解析回路
42 遅延回路
43 AD変換器
44 音声エンコーダ
45 非音声コード発生器
46 スイッチ
47 狭帯域デジタル変調器
48 電力増幅器
49 信号処理回路
51 AD変換器
52 FFT演算器
53 非音声比較判別器
54 非音声コードスペクトルパターンメモリ
61 高周波低雑音増幅器
62 狭帯域デジタル復調器
63 非音声コード判別器
64 音声デコーダ
65 非音声信号発生器
66 スイッチ
67 低周波増幅器
130 音声信号処理部
131 CPU
132 ROM
133 RAM
134 EEPROM
135 深層学習モデル部
136 入力インターフェース
137 出力インターフェース
138 音声信号前置処理部
139 AD変換器
141 入力層
142 中間層
143 出力層
151~181 ニューロン
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
【手続補正書】
【提出日】2022-02-03
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
音声信号及び非音声信号を含む低周波信号を、デジタル変調器により所定の音声圧縮方式を用いてデジタル変調して無線送信するデジタル無線送信装置において、
前記デジタル無線送信装置は、地域防災無線システムの中継局に設けられるものであり、
前記デジタル無線送信装置は、
前記音声信号及び非音声信号を含む低周波信号からノイズをキャンセルするように音声信号処理を行って前記デジタル変調器に出力するノイズキャンセル部を備え、
前記ノイズキャンセル部は、
人間の音声の特徴パラメータを用いて、入力される音声信号からノイズを含む非音声期間であるか否かを判定する深層学習モデル部を学習して、学習された前記深層学習モデル部を構成して備える音声信号処理部を備え、
前記音声信号処理部は、前記学習された深層学習モデル部を用いて、ノイズキャンセル処理を行い、
前記音声信号処理部は、前記学習された深層学習モデル部の前記判定に基づいて、入力される音声信号からノイズを含む非音声期間を通過させないようにノイズキャンセル処理を行って、前記ノイズキャンセル処理後の音声信号を出力する、
デジタル無線送信装置。
【請求項2】
前記深層学習モデル部は、人間の音声の特徴パラメータを入力とし、入力される音声信号からノイズを含む非音声期間であるか否かを判定する判定結果を出力とする、所定のニューラルネットワークにより構成される、
請求項1に記載のデジタル無線送信装置。
【請求項3】
前記音声信号及び非音声信号を含む低周波信号は、第1のデジタル無線受信装置により受信されて復調されたものである、
請求項に記載のデジタル無線送信装置。
【請求項4】
前記音声信号及び非音声信号を含む低周波信号は、音源再生出力装置により出力されたものである、
請求項1又は2に記載のデジタル無線送信装置。
【請求項5】
請求項1~のうちのいずれか1つに記載のデジタル無線送信装置と、
地域防災無線システムの戸別局に設けられた第2のデジタル無線受信装置であって、前記デジタル無線送信装置により送信された無線信号を音声信号にデジタル復調して出力する前記第2のデジタル無線受信装置と、
を備えるデジタル無線通信システム。
【手続補正2】
【補正対象書類名】図面
【補正対象項目名】図4
【補正方法】変更
【補正の内容】
図4