特許第6772889号(P6772889)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 沖電気工業株式会社の特許一覧

<>
  • 特許6772889-言語明瞭化装置及び拡声放送システム 図000002
  • 特許6772889-言語明瞭化装置及び拡声放送システム 図000003
  • 特許6772889-言語明瞭化装置及び拡声放送システム 図000004
  • 特許6772889-言語明瞭化装置及び拡声放送システム 図000005
  • 特許6772889-言語明瞭化装置及び拡声放送システム 図000006
  • 特許6772889-言語明瞭化装置及び拡声放送システム 図000007
  • 特許6772889-言語明瞭化装置及び拡声放送システム 図000008
  • 特許6772889-言語明瞭化装置及び拡声放送システム 図000009
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6772889
(24)【登録日】2020年10月5日
(45)【発行日】2020年10月21日
(54)【発明の名称】言語明瞭化装置及び拡声放送システム
(51)【国際特許分類】
   G10L 21/007 20130101AFI20201012BHJP
   G10L 21/0364 20130101ALI20201012BHJP
【FI】
   G10L21/007
   G10L21/0364
【請求項の数】4
【全頁数】15
(21)【出願番号】特願2017-31763(P2017-31763)
(22)【出願日】2017年2月23日
(65)【公開番号】特開2018-136472(P2018-136472A)
(43)【公開日】2018年8月30日
【審査請求日】2019年11月15日
(73)【特許権者】
【識別番号】000000295
【氏名又は名称】沖電気工業株式会社
(74)【代理人】
【識別番号】100140958
【弁理士】
【氏名又は名称】伊藤 学
(74)【代理人】
【識別番号】100137888
【弁理士】
【氏名又は名称】大山 夏子
(74)【代理人】
【識別番号】100190942
【弁理士】
【氏名又は名称】風間 竜司
(72)【発明者】
【氏名】橋本 博至
(72)【発明者】
【氏名】犬飼 修
(72)【発明者】
【氏名】宮本 達弥
【審査官】 山下 剛史
(56)【参考文献】
【文献】 特開平9−81192(JP,A)
【文献】 特開2016−110050(JP,A)
【文献】 特開平3−212698(JP,A)
【文献】 米国特許出願公開第2014/0025374(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 21/00−25/93
H04H 20/00、60/00
(57)【特許請求の範囲】
【請求項1】
所定時間毎に音声信号を分割し、分割された音声信号毎に基音を抽出する基音抽出部と、
フォルマントの特徴に基づいて生成されたフィルタを予め記憶し、前記基音および前記分割された音声信号の音程により前記フィルタの適用周波数を決定し、前記分割された音声信号に対して前記フィルタを適用するフィルタ処理部と、
前記フィルタ処理部によって処理された音声信号における所定の周波数帯域を強調するマキシマイズ処理部と、を備えた、
言語明瞭化装置。
【請求項2】
前記フィルタ処理部は、前記基音の周波数以上の周波数を、前記適用周波数として決定する、
請求項1に記載の言語明瞭化装置。
【請求項3】
前記フィルタはくし型フィルタである、
請求項1または2のいずれか1項に記載の言語明瞭化装置。
【請求項4】
拡声放送について子局装置を制御する親局装置と、前記拡声放送を行う前記子局装置と、前記拡声放送の音声を明瞭化する言語明瞭化装置と、を備える拡声放送システムであって、
前記言語明瞭化装置は、
所定時間毎に音声信号を分割し、分割された音声信号毎に基音を抽出する基音抽出部と、
フォルマントの特徴に基づいて生成されたフィルタを予め記憶し、前記基音および前記分割された音声信号の音程により前記フィルタの適用周波数を決定し、前記分割された音声信号に対して前記フィルタを適用するフィルタ処理部と、
前記フィルタ処理部によって処理された音声信号における所定の周波数帯域を強調するマキシマイズ処理部と、を備え、
前記親局装置は、
前記子局装置に対して前記音声信号を含む信号を送信する送信部を備え、
前記子局装置は、
前記信号を受信する受信部と、
前記信号に基づいて前記拡声放送を制御する鳴動制御部と、を備える、
拡声放送システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、言語明瞭化装置及び拡声放送システムに関する。
【背景技術】
【0002】
防災行政無線システム等の各種拡声放送システムにおいては、大別すると、拡声器を用いて拡声放送を行う子局と、放送内容に関する情報を子局に伝送する親局とが存在する。ここで、例えば、子局が屋外に設置されている場合等においては、劣悪な外部環境(騒音(交通騒音、生活騒音等)によってユーザが拡声放送を聞き取りづらい場合がある。
【0003】
このような事象に対応するために、拡声放送を明瞭化する技術については様々な研究が行われている。例えば、以下の特許文献1には、防災行政無線システム等にて、フォルマントを強調することで明瞭化を実現する技術が開示されている。また、特許文献2には、音声を音素毎に分けて、音声を強調する必要性を判断して予め記憶されたデータを用いて音声を修正する技術が開示されている。また、特許文献3には、音韻毎に設定されたフォルマントのフィルタバンクを用いて、フォルマントを強調する技術が開示されている。さらに、特許文献4には、予め用意された、フォルマントを強調するためのフィルタのデータベースを用いてフォルマントを強調する技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2015−161911号公報
【特許文献2】特開2008−70564号公報
【特許文献3】特開2004−4952号公報
【特許文献4】特開2003−271200号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、既存技術によっては言語明瞭化の処理負荷が高くなりやすいという問題があった。例えば、特許文献1の技術においては、スペクトルの包絡線に基づくスペクトル・シェーピング処理でフォルマントを抽出、雑音中の音声の知覚にさして影響を与えない調波を間引く処理で周囲雑音の録音を行って、間引かれた調波のエネルギーを他の重要な成分に再配分する処理が行われるが、処理負荷が高い。そのため、高性能な装置が求められたり、処理遅延が発生したりする可能性があった。
【0006】
そこで、本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、言語明瞭化の処理負荷をより低減させることが可能な、新規かつ改良された言語明瞭化装置及び拡声放送システムを提供することにある。
【課題を解決するための手段】
【0007】
上記課題を解決するために、本発明のある観点によれば、所定時間毎に音声信号を分割し、分割された音声信号毎に基音を抽出する基音抽出部と、フォルマントの特徴に基づいて生成されたフィルタを予め記憶し、前記基音および前記分割された音声信号の音程により前記フィルタの適用周波数を決定し、前記分割された音声信号に対して前記フィルタを適用するフィルタ処理部と、前記フィルタ処理部によって処理された音声信号における所定の周波数帯域を強調するマキシマイズ処理部と、を備えた、言語明瞭化装置が提供される。
【0008】
前記フィルタ処理部は、前記基音の周波数以上の周波数を、前記適用周波数として決定してもよい。
【0009】
前記フィルタはくし型フィルタであってもよい。
【0010】
また、上記課題を解決するために、本発明の別の観点によれば、拡声放送について子局装置を制御する親局装置と、前記拡声放送を行う前記子局装置と、前記拡声放送の音声を明瞭化する言語明瞭化装置と、を備える拡声放送システムであって、前記言語明瞭化装置は、所定時間毎に音声信号を分割し、分割された音声信号毎に基音を抽出する基音抽出部と、フォルマントの特徴に基づいて生成されたフィルタを予め記憶し、前記基音および前記分割された音声信号の音程により前記フィルタの適用周波数を決定し、前記分割された音声信号に対して前記フィルタを適用するフィルタ処理部と、前記フィルタ処理部によって処理された音声信号における所定の周波数帯域を強調するマキシマイズ処理部と、を備え、前記親局装置は、前記子局装置に対して前記音声信号を含む信号を送信する送信部を備え、前記子局装置は、前記信号を受信する受信部と、前記信号に基づいて前記拡声放送を制御する鳴動制御部と、を備える、拡声放送システムが提供される。
【発明の効果】
【0011】
以上説明したように本発明によれば、言語明瞭化の処理負荷をより低減させることを可能にする。
【図面の簡単な説明】
【0012】
図1】本実施形態に係る拡声放送システムの構成を示す図である。
図2】本実施形態に係る言語明瞭化装置の機能構成を示すブロック図である。
図3】本実施形態に係る言語明瞭化装置の処理部の機能構成を示すブロック図である。
図4】フィルタが適用される周波数の推移の一例を示す図である。
図5】本実施形態に係る親局の機能構成を示すブロック図である。
図6】本実施形態に係る子局の機能構成を示すブロック図である。
図7】本実施形態に係る言語明瞭化装置による言語明瞭化処理の動作を示すシーケンス図である。
図8】本実施形態に係る言語明瞭化装置のハードウェア構成を示すブロック図である。
【発明を実施するための形態】
【0013】
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0014】
<1.背景>
上記のとおり、拡声放送を明瞭化する技術については様々な研究が行われている。例えば、特許文献1には、防災行政無線システム等にて、フォルマントを強調することで明瞭化を実現する技術が開示されている。特許文献1には、主に2つの技術によって音声明瞭化が実現されている。1つは、スペクトルの包絡線に基づくスペクトル・シェーピングによる雑音特性への音声の適応技術である。もう1つは雑音中の音声の知覚にさして影響を与えない調波を間引き、間引かれた調波のエネルギーを他の重要な成分に再配分する技術である。
【0015】
しかし、スペクトル包絡線の抽出処理によってフォルマントを導き出したり、雑音中の音声の知覚にさして影響を与えない調波を間引き、間引かれた調波のエネルギーを残された調波に再分配したりする処理に要する負荷は大きい。また、本技術においては、音声を雑音特性に適応させるにあたり、放送が行われる周辺で集音された雑音が明瞭化の処理に用いられている。しかし、拡声放送システムの放送エリアが広域であり、放送される地点毎の雑音特性が互いに異なる場合には、一か所だけで集音された雑音が明瞭化の処理に用いられると、音声が各地点の雑音特性に十分適応することができない。また、仮に、放送される地点毎の雑音が用いられて明瞭化の処理が行われる場合には、処理に要する負荷がさらに大きくなる。
【0016】
本件の発明者は上記事情に鑑み、本発明に想到するに至った。本発明の一実施形態に係る言語明瞭化装置は、フォルマントの特徴に基づいて生成されたフィルタ特性をテンプレート化して予め記憶しておく。そして、言語明瞭化装置は、放送される音声信号を所定時間毎に分割し、分割された音声信号の基音を抽出(基音の定義については後述する)し、当該基音に基づいてフィルタの適用周波数を決定する。これによって、言語明瞭化装置は、明瞭化の処理負荷をより低減させることができる。
【0017】
以降では、主に、「2.本実施形態に係る拡声放送システムの概要」「3.各装置の機能構成」「4.言語明瞭化装置の動作」「5.言語明瞭化装置のハードウェア構成」という順番で本実施形態について詳細に説明していく。
【0018】
<2.本実施形態に係る拡声放送システムの概要>
上記では、本発明の背景について説明した。続いて、本発明の一実施形態に係る拡声放送システムの概要について説明する。
【0019】
(2−1.拡声放送システムの構成)
まず、図1を参照して、本実施形態に係る拡声放送システムの構成について説明する。図1は、本実施形態に係る拡声放送システムの構成を示す図である。図1に示すように、本実施形態に係る拡声放送システムは、言語明瞭化装置100と、操作卓200と、親局300と、子局400と、を備える。親局300は、無線通信に用いるアンテナ310を備え、子局400は、無線通信に用いるアンテナ410と、拡声放送に用いる拡声器420と、を備える。以降で各機能について説明する。
【0020】
(言語明瞭化装置100)
言語明瞭化装置100は、拡声放送に用いられる音声信号に対して各種処理を行うことで、放送される音声の明瞭化を実現する。より具体的に説明すると、言語明瞭化装置100は、拡声放送の実施者がマイク等(図示なし)を用いて入力した音声信号に対して、基音抽出処理、フィルタ処理またはマキシマイズ処理等を行い、処理後の音声信号を後述する操作卓200へ提供する。言語明瞭化装置100による処理の詳細については後述する。
【0021】
(操作卓200)
操作卓200は、拡声放送における各種設定が行われる装置である。より具体的に説明すると、操作卓200は、拡声放送の実施者によって、放送の対象となる各子局400、放送の際の設定等が入力される。操作卓200は、各種設定に関する情報および言語明瞭化装置100から提供された音声信号を後述する親局300に提供する。
【0022】
(親局300)
親局300は、拡声放送に用いられる情報を無線信号として送信する。より具体的に説明すると、親局300は、操作卓200から入力された情報に基づいて無線信号を生成し、アンテナ310を用いて、当該無線信号を中継局(図示なし)または各子局400へ送信する。親局300が送信する無線信号は複数種類あるとする。例えば、親局300は、拡声放送を指示する信号、放送内容が含まれる信号、拡声放送の終了を指示する信号等を子局400に送信してもよい。なお、これらの信号はあくまで一例であり、拡声放送の種類もしくは方式によって送信される信号は適宜変更される。
【0023】
(子局400)
子局400は、拡声放送を行う装置である。より具体的に説明すると、子局400は、アンテナ410を用いて親局300または中継局から無線信号を受信し、当該信号に含まれる情報を用いて拡声放送を行う。例えば、子局400は、無線信号に含まれる情報に基づいて自局が放送の対象であるか否かを判定し、自局が放送の対象である場合、信号に含まれる動作設定を反映させた状態で、拡声器420を用いて拡声放送を行う。本明細書では、子局400が道路または公園等に設置される固定局である場合を一例として説明するが、子局400の種類は任意である。
【0024】
(2−2.拡声放送システムの機能概要)
上記では、本実施形態に係る拡声放送システムの構成について説明した。続いて、本実施形態に係る拡声放送システムの機能概要について説明する。
【0025】
本実施形態に係る拡声放送システムの言語明瞭化装置100は、まず、フォルマントの特徴に基づいて生成されたフィルタ特性をテンプレート化して記憶しておく。以下、本明細書では記憶されたフィルタ特性のテンプレートのことをフィルタとして記載する。当該フィルタの種類は任意である。本明細書では、当該フィルタがくし型フィルタである場合を想定して記載する。そして、言語明瞭化装置100は、拡声放送の実施者によって音声信号が入力された場合、当該音声信号を所定の時間毎に分割し、分割された音声信号を解析することで基音を抽出する。ここで、基音とは、音声信号が複数の正弦波の合成によって表される場合において、最も低い周波数の音を指す。なお、音声信号が分割される間隔である所定の時間とは任意の時間を指すが、本明細書では、例えば、音声信号が分割される間隔が数十[ms]であることを想定している。
【0026】
そして、言語明瞭化装置100は、基音の周波数以上の周波数に対して、予め記憶しておいたフィルタを適用する。これによって、言語明瞭化装置100は、当該分割された音声信号について、言語として強調すべき重要な周波数帯域の成分を残した上で、ノイズ等の重要性の低い周波数帯域の成分を除去することができる。
【0027】
また、基本的に、基音は音程によって変化するため、言語明瞭化装置100は、分割された音声信号毎に、それぞれの音程に応じてフィルタを適用する周波数を決定する(実質的には、基音に応じてフィルタを適用する周波数を決定することと同義)。これによって、言語明瞭化装置100は、音程が刻々と変化するような音声信号に対しても適切に対応することができる。
【0028】
その後、言語明瞭化装置100は、フィルタを適用した後の音声信号における所定の帯域成分を増幅する処理を行う。フィルタの適用によって重要性の低い周波数帯域の成分が除去されることで音声信号の振幅が減少する(換言すると、音響エネルギーが減少する)ため、言語明瞭化装置100、その減少分だけ音声信号の増幅を行うことができる。
【0029】
上記の処理が行われた音声信号を用いて子局400が拡声放送を行うことによって、本実施形態に係る拡声放送システムは、劣悪な外部環境(騒音(交通騒音、生活騒音等)、降雨、暴風雨、暴風雪、台風、落雷等)においてもユーザが聞き取りやすい拡声放送を実現することができる。また、音程に基づいてフィルタを適用する処理(実質的には、基音に基づいてフィルタを適用する処理と同義)は、特許文献1による処理(スペクトル包絡線の抽出処理等)よりも負荷が低いため、本実施形態に係る拡声放送システムは、言語明瞭化に要する処理の負荷をより低減させることができる。
【0030】
また、雑音のスペクトルは一定ではないが、言語明瞭化装置100が分割された音声信号毎にフィルタの適用周波数を適度に変更することによって、雑音のスペクトル成分にマスクされにくくなり、雑音下での言語明瞭化が可能となる。
【0031】
また、言語明瞭化装置100は、拡声放送に用いられる信号の送信元(操作卓200または親局300等)側に備えられればよく、子局400側に備えられなくてもよい。これによって、言語明瞭化装置100の設置、調整、保守または運用等に要するリソースが削減される。
【0032】
<3.各装置の機能構成>
上記では、本実施形態に係る拡声放送システムの機能概要について説明した。続いて、各装置の機能構成について説明する。
【0033】
(言語明瞭化装置100の機能構成)
まず、図2および図3を参照して、本実施形態に係る言語明瞭化装置100の機能構成について説明する。図2は、本実施形態に係る言語明瞭化装置100の機能構成を示すブロック図である。図2に示すように、本実施形態に係る言語明瞭化装置100は、切替部110と、処理部120と、を備える。また、図3は、本実施形態に係る言語明瞭化装置100の処理部120の機能構成を示すブロック図である。図3に示すように、本実施形態に係る処理部120は、前処理部121と、基音抽出部122と、フィルタ処理部123と、マキシマイズ処理部124と、を備える。以降で各機能構成について説明する。
【0034】
(切替部110)
切替部110は、音声信号に対して言語明瞭化装置100による処理(以降、便宜的に「言語明瞭化処理」と呼称する)を行うか否かの切り替えを行う。より具体的に説明すると、切替部110は、音声信号および切替制御信号を外部装置から受信した場合、切替制御信号を解析して言語明瞭化処理が要求されていると判断した場合には、受信した音声信号を処理部120に順次提供し、言語明瞭化処理が要求されていないと判断した場合には言語明瞭化装置100を介すことなく音声信号を操作卓200へ順次提供する。なお、切替部110が切替制御信号を外部装置から受信するのではなく、拡声放送の実施者が言語明瞭化装置100に備えられる入力部(図示なし。ボタン、スイッチ、タッチパネル等)を操作することによって、切替部110が切替制御信号を自ら生成してもよい。
【0035】
(処理部120)
処理部120は、音声信号に対して言語明瞭化処理を行う。上記のとおり、処理部120は、前処理部121と、基音抽出部122と、フィルタ処理部123と、マキシマイズ処理部124と、を備える。以降で処理部120の各機能構成について説明する。
【0036】
(前処理部121)
前処理部121は、音声信号に対して各種処理を行うことで、後工程における処理の円滑化を実現する。各種処理には、任意の信号処理が含まれる。例えば、前処理部121は、音声信号に対して増幅処理、平滑化処理または整形処理等を行う。前処理部121は、各種処理を行った音声信号を後述する基音抽出部122およびフィルタ処理部123に提供する。なお、前処理部121は、基音抽出部122またはフィルタ処理部123からのフィードバックを受けて各種処理を実施し直したり、各種処理に用いられるパラメータを変更したりしてもよい。
【0037】
(基音抽出部122)
基音抽出部122は、音声信号の基音を抽出する。より具体的に説明すると、基音抽出部122は、前処理部121によって各種処理が施された音声信号を分割し、当該信号を解析することによって、分割された音声信号毎に基音を抽出する。そして、基音抽出部122は、分割された音声信号毎の基音に関する情報を制御信号として後述するフィルタ処理部123に提供する。
【0038】
(フィルタ処理部123)
フィルタ処理部123は、音声信号にフィルタを適用する処理(以降、便宜的に「フィルタ処理」と呼称する)を行う。より具体的に説明すると、フィルタ処理部123は、フォルマントの特徴に基づいて生成されたフィルタを予め記憶しておき、前処理部121から音声信号を提供された場合、基音抽出部122から提供される制御信号に基づいて、基音の周波数以上の周波数に対してフィルタを適用する。
【0039】
ここで、図4を参照して、フィルタ処理について説明する。図4は、フィルタが適用される周波数の推移の一例を示す図である。まず、基音抽出部122が時点1(例えば、音声信号の入力が開始された時点)における音声信号を解析し、基音を抽出する。そして、フィルタ処理部123は、図4Aに示すように、基音の周波数F0以上の周波数に対してフィルタを適用する。そして、基音抽出部122は、時点1の直後に分割した時点2における音声信号を解析する。時点1における音声信号の音程と時点2における音声信号の音程は互いに異なるため、時点1における基音と時点2における基音は互いに異なる。基音抽出部122は、時点2における音声信号の基音を抽出し、図4Bに示すように、フィルタ処理部123は基音の周波数F0+α以上の周波数に対してフィルタを適用する。その後、基音抽出部122およびフィルタ処理部123は、時点3における音声信号に対して同様の処理を行うことで、図4Cに示すように、基音の周波数F0−β以上の周波数に対してフィルタを適用する。
【0040】
このように、フィルタ処理部123は、基音に応じてフィルタが適用される周波数を刻々と変更していくことで、音程が刻々と変化するような音声信号に対しても適切に対応することができる。フィルタ処理部123は、フィルタ処理を行った音声信号をマキシマイズ処理部124に提供する。
【0041】
(マキシマイズ処理部124)
マキシマイズ処理部124は、音声信号に対して増幅処理(以降、便宜的に「マキシマイズ処理」と呼称する)を行う。より具体的に説明すると、前段のフィルタ処理によって音声信号の振幅が減少するため、マキシマイズ処理部124は、その減少分だけ、音声の認識に重要な周波数帯域の成分を増幅するマキシマイズ処理を行う。
【0042】
(親局300の機能構成)
上記では、言語明瞭化装置100の機能構成について説明した。続いて、図5を参照して、親局300の機能構成について説明する。図5は、本実施形態に係る親局300の機能構成を示すブロック図である。
【0043】
図5に示すように、親局300は、有線通信部320と、生成部330と、無線通信部340と、制御部350と、を備える。また、無線通信部340はアンテナ310を備える。以降で各機能構成について説明する。
【0044】
(有線通信部320)
有線通信部320は、拡声放送に用いられる情報を操作卓200から受信する有線ネットワークへのインタフェースである。より具体的に説明すると、拡声放送の実施者が、操作卓200を用いて、放送の対象となる各子局400、放送の際の設定等を入力すると、有線通信部320は、これらの情報を操作卓200から受信し、後述する生成部330に提供する。
【0045】
(生成部330)
生成部330は、有線通信部320によって受信された情報に基づいて各種信号を生成する。より具体的に説明すると、生成部330は、拡声放送を指示する信号、放送内容が含まれる信号、拡声放送の終了を指示する信号等を生成し、これらの信号を後述する無線通信部340に提供する。
【0046】
(無線通信部340)
無線通信部340は、子局400へ無線信号を送信する送信部として機能する。具体的には、無線通信部340は、生成部330から提供される各種信号をアンテナ310により無線信号に変換して送信する。
【0047】
(制御部350)
制御部350は、親局300における各種処理を統括的に制御する。例えば、制御部350は、操作卓200から拡声放送に用いられる各種情報が提供された場合に、各機能構成を制御することで、拡声放送に用いられる情報を含む信号を子局400へ送信させる。
【0048】
(子局400の機能構成)
上記では、親局300の機能構成について説明した。続いて、図6を参照して、子局400の機能構成について説明する。図6は、本実施形態に係る子局400の機能構成を示すブロック図である。
【0049】
図6に示すように、子局400は、無線通信部430と、制御部440と、鳴動制御部450と、を備える。また、無線通信部430はアンテナ410を備え、鳴動制御部450は拡声器420を備える。以降で各機能構成について説明する。
【0050】
(無線通信部430)
無線通信部430は、親局300からの無線信号を受信する受信部として機能する。より具体的に説明すると、無線通信部430は、親局300から送信された無線信号をアンテナ410によって受信し、当該信号に対して復調処理または復号処理を行うことで拡声放送に用いられる情報を取得する。無線通信部430は、当該情報を後述する制御部440に提供する。
【0051】
(制御部440)
制御部440は、子局400における各種処理を統括的に制御する。例えば、制御部440は、無線通信部430から提供される情報を鳴動制御部450に提供することによって拡声放送を実現する。なお、制御部440は、無線通信部430から提供される情報に対して各種処理を行ったり、当該情報に基づいて鳴動制御部450を制御するための信号を生成することで鳴動制御部450を制御したりしてもよい。
【0052】
(鳴動制御部450)
鳴動制御部450は、拡声放送に関する制御を行う。より具体的に説明すると、鳴動制御部450は、制御部440から提供される情報に基づいて拡声器420を制御することによって拡声放送を実現する。
【0053】
<4.言語明瞭化装置の動作>
上記では、各装置の機能構成について説明した。続いて、図7を参照して、言語明瞭化処理の動作について説明する。図7は、本実施形態に係る言語明瞭化装置100による言語明瞭化処理の動作を示すシーケンス図である。
【0054】
ステップS1000では、前処理部121が順次入力される音声信号に対して各種処理(増幅処理、平滑化処理または整形処理等)を行う。ステップS1004では、前処理部121が、各種処理を施した音声信号を基音抽出部122に順次提供し、ステップS1008では、前処理部121が、当該音声信号をフィルタ処理部123に順次提供する。ステップS1012では、基音抽出部122が所定の時間毎に音声信号を分割し、ステップS1016では、基音抽出部122が分割後の音声信号毎に基音を抽出する。ステップS1020では、基音抽出部122が、分割された音声信号毎の基音に関する情報を含む制御信号を生成し、当該信号をフィルタ処理部123に提供する。
【0055】
ステップS1024では、フィルタ処理部123が、当該制御信号に基づいて基音の周波数以上の周波数に対してフィルタを適用することで分割された音声信号に対してフィルタ処理を行う。ステップS1028では、フィルタ処理部123が、フィルタ処理を行った後の音声信号をマキシマイズ処理部124に提供する。ステップS1032では、マキシマイズ処理部124が音声信号に対して所定の帯域成分を増幅するマキシマイズ処理を行う。その後、マキシマイズ処理部124は、マキシマイズ処理を行った後の音声信号を操作卓200に提供する。
【0056】
以上が、言語明瞭化装置100による言語明瞭化処理の動作である。なお、図7に示した動作は、音声信号が入力される限り継続して行われる。また、図7に示した動作は、並行的に行われてもよい。例えば、前処理部121による前処理(ステップS1000)、基音抽出部122による音声信号の分割(ステップS1012)もしくは基音の抽出処理(ステップS1016)、フィルタ処理部123によるフィルタ処理(ステップS1024)、またはマキシマイズ処理部124によるマキシマイズ処理(ステップS1032)は並行的に行われてもよい。これによって、言語明瞭化装置100に入力された音声信号が順次円滑に処理され得るため、音声が遅れたり途切れたりすることなく拡声放送が実施され得る。なお、上記で説明した動作はあくまで一例であるため、適宜され得る。
【0057】
<5.言語明瞭化装置のハードウェア構成>
以上、言語明瞭化処理の動作について説明について説明した。続いて、図8を参照して、本実施形態に係る言語明瞭化装置100のハードウェア構成について説明する。
【0058】
図8は、本実施形態に係る言語明瞭化装置100のハードウェア構成を示すブロック図であり、言語明瞭化装置100は、図8に示す情報処理装置900によって具現される。情報処理装置900は、CPU(Central Processing Unit)901と、ROM(Read Only Memory)902と、RAM(Random Access Memory)903と、ホストバス904と、ブリッジ905と、外部バス906と、インタフェース907と、入力装置908と、出力装置909と、ストレージ装置910と、通信装置911と、を備える。
【0059】
CPU901は、演算処理装置および制御装置として機能し、各種プログラムに従って情報処理装置900内の動作全般を制御する。また、CPU901は、マイクロプロセッサであってもよい。ROM902は、CPU901が使用するプログラムや演算パラメータ等を記憶する。RAM903は、CPU901の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一時記憶する。これらはCPUバス等から構成されるホストバス904により相互に接続されている。言語明瞭化装置100の切替部110、処理部120、前処理部121、基音抽出部122、フィルタ処理部123またはマキシマイズ処理部124は、CPU901によって具現され得る。
【0060】
ホストバス904は、ブリッジ905を介して、PCI(Peripheral Component Interconnect/Interface)バス等の外部バス906に接続されている。なお、必ずしもホストバス904、ブリッジ905および外部バス906を分離構成する必要はなく、1つのバスにこれらの機能を実装してもよい。
【0061】
入力装置908は、マウス、キーボード、タッチパネル、ボタン、マイクロフォン、スイッチおよびレバー等ユーザが情報を入力するための入力手段と、ユーザによる入力に基づいて入力信号を生成し、CPU901に出力する入力制御回路等から構成されている。情報処理装置900を操作するユーザは、この入力装置908を操作することにより、情報処理装置900に対して各種のデータを入力したり処理動作を指示したりすることができる。
【0062】
出力装置909は、例えば、CRT(Cathode Ray Tube)ディスプレイ装置、液晶ディスプレイ(LCD)装置、OLED(Organic Light Emitting Diode)装置、ランプ等の表示装置およびスピーカ等の音声出力装置を含む。
【0063】
ストレージ装置910は、データ格納用の装置である。ストレージ装置910は、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置および記憶媒体に記録されたデータを削除する削除装置等を含んでもよい。ストレージ装置910は、例えば、フラッシュメモリで構成される。このストレージ装置910は、フラッシュメモリを駆動し、CPU901が実行するプログラムや各種データを格納してもよい。
【0064】
通信装置911は、例えば、ネットワークに接続するための通信デバイス等で構成された通信インタフェースである。また、通信装置911は、無線LAN(Local Area Network)対応通信装置であっても、有線による通信を行うワイヤー通信装置であってもよい。
【0065】
<6.むすび>
以上の説明のように、本実施形態にかかる言語明瞭化装置100は、所定時間毎に音声信号を分割し、分割された音声信号毎に基音を抽出し、基音の周波数以上の周波数に対して、予め記憶しておいたフィルタを適用する。これによって、言語明瞭化装置100は、当該分割された各音声信号について、言語として強調すべき重要な周波数帯域の成分を残した上で、ノイズ等の重要性の低い周波数帯域の成分を除去することができるため、音程が刻々と変化するような音声信号に対しても適切に対応することができる。
【0066】
なお、雑音のスペクトルは一定ではないが、言語明瞭化装置100が分割された音声信号毎にフィルタの適用周波数を適度に変更することによって、雑音のスペクトル成分にマスクされにくくなり、雑音下での言語明瞭化が可能となる。
【0067】
そして、子局400が言語明瞭化処理後の音声信号を用いて拡声放送を行うことによって、本実施形態に係る拡声放送システムは、劣悪な外部環境(騒音(交通騒音、生活騒音等)、降雨、暴風雨、暴風雪、台風、落雷等)においてもユーザが聞き取りやすい拡声放送を実現することができる。また、音程に基づいてフィルタを適用する処理(実質的には、基音に基づいてフィルタを適用する処理と同義)は、特許文献1による処理よりも負荷が低いため、本実施形態に係る拡声放送システムは、言語明瞭化に要する処理の負荷をより低減させることができる。
【0068】
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
【0069】
例えば、各装置の機能構成は適宜外部装置に備えられてもよい。例えば、言語明瞭化装置100の切替部110、前処理部121、基音抽出部122、フィルタ処理部123、マキシマイズ処理部124のそれぞれは、適宜外部装置に備えられてもよい。
【0070】
また、各装置の位置関係、または連携の態様は適宜変更され得る。例えば、言語明瞭化装置100は、拡声放送の信号の送信元(操作卓200または親局300等)側ではなく、子局400側に備えられてもよい。これによって、拡声放送の実施者は、言語明瞭化処理のパラメータ、フィルタの種類等を子局400毎に変更することができるため、各子局400が設置されている場所における雑音の発生状況に応じた言語明瞭化を実現することができる。また、言語明瞭化装置100が有する機能は、操作卓200、親局300または子局400のうち、いずれかの装置が有していてもよい。
【0071】
また、上記における通信方式は適宜変更されてもよい。例えば、親局300と子局400は、無線通信ではなく有線通信を行ってもよいし、言語明瞭化装置100、操作卓200または親局300は、有線通信ではなく無線通信を行ってもよい。
【符号の説明】
【0072】
100 言語明瞭化装置
110 切替部
120 処理部
121 前処理部
122 基音抽出部
123 フィルタ処理部
124 マキシマイズ処理部
200 操作卓
300 親局
310 アンテナ
320 有線通信部
330 生成部
340 無線通信部
350 制御部
400 子局
410 アンテナ
420 拡声器
430 無線通信部
440 制御部
450 鳴動制御部
図1
図2
図3
図4
図5
図6
図7
図8