IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通テン株式会社の特許一覧

<>
  • 特許-音声信号処理装置及び音声信号処理方法 図1
  • 特許-音声信号処理装置及び音声信号処理方法 図2
  • 特許-音声信号処理装置及び音声信号処理方法 図3
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-02
(45)【発行日】2024-09-10
(54)【発明の名称】音声信号処理装置及び音声信号処理方法
(51)【国際特許分類】
   G10L 19/00 20130101AFI20240903BHJP
【FI】
G10L19/00 312G
【請求項の数】 4
(21)【出願番号】P 2021558578
(86)(22)【出願日】2020-10-12
(86)【国際出願番号】 JP2020038530
(87)【国際公開番号】W WO2022079776
(87)【国際公開日】2022-04-21
【審査請求日】2023-10-11
(73)【特許権者】
【識別番号】000237592
【氏名又は名称】株式会社デンソーテン
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】谷口 優次
(72)【発明者】
【氏名】日下部 雄一
(72)【発明者】
【氏名】山野 祐樹
【審査官】浜岸 広明
(56)【参考文献】
【文献】特開2012-108254(JP,A)
【文献】特開2018-160872(JP,A)
【文献】国際公開第2007/063625(WO,A1)
【文献】特開2000-347822(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 19/00
G10L 15/28
G10L 25/48
(57)【特許請求の範囲】
【請求項1】
それぞれが複数のグループのいずれかに属し、供給された音声信号を用いて所定の処理を行う複数の音声信号処理部と、
互いにバッファサイズが異なり、それぞれが前記グループのいずれかに対応付けられた複数のバッファであって、蓄積した音声信号を、対応付けられたグループに属する前記音声信号処理部に供給する複数のバッファと、
を有し、
前記複数のグループのうちの少なくとも1つには、2以上の音声信号処理部が属し、
前記複数のバッファのうち、前記2以上の音声信号処理部が属するグループに対応付けられたバッファは、前記2以上の音声信号処理部に音声信号を供給する
ことを特徴とする音声信号処理装置。
【請求項2】
前記音声信号処理部は、処理に要する音声信号のサイズごとに分けられたグループのいずれかに属し、
前記バッファは、対応付けられたグループに属する前記音声信号処理部が処理に要する音声信号のサイズと同一のバッファサイズであることを特徴とする請求項1に記載の音声信号処理装置。
【請求項3】
前記2以上の音声信号処理部は、供給された音声信号に対して、互いに異なる処理を行う請求項1又は2に記載の音声信号処理装置。
【請求項4】
それぞれが複数のグループのいずれかに属する複数の音声信号処理部と、
互いにバッファサイズが異なり、それぞれが前記グループのいずれかに対応付けられた複数のバッファと、
を有する音声信号処理装置によって実行される音声信号処理方法であって、
前記バッファが、蓄積した音声信号を、対応付けられたグループに属する前記音声信号処理部に供給する供給工程と、
前記音声信号処理部が、供給された音声信号を用いて所定の処理を行う音声信号処理工程と、
を含み、
前記複数のグループのうちの少なくとも1つには、2以上の音声信号処理部が属し、
前記供給工程において、前記複数のバッファのうち、前記2以上の音声信号処理部が属するグループに対応付けられたバッファは、前記2以上の音声信号処理部に音声信号を供給する
ことを特徴とする音声信号処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声信号処理装置及び音声信号処理方法に関する。
【背景技術】
【0002】
近年、コストダウンの観点から、音声処理ソリューション(ECNC:Echo Canceller/Noise Canceller、ICC:In-Car Communication等)が、Hard DSPからSoft ipに置き換えられている。
【0003】
Soft ipを使用する場合、音声信号処理に関する機能を実行する各処理部の前後にはバッファが必要になる。一方で、音声信号がバッファを通過する時間が各機能の性能劣化につながる。
【0004】
また、従来、複数のデータをバッファリングする際に、1つのRAM(Random Access Memory)を必要に応じて複数の領域に分割することで、回路全体の効率化を図る技術が知られている(例えば、特許文献1を参照)。
【先行技術文献】
【特許文献】
【0005】
【文献】特開2001-175591号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、従来の技術では、音声信号処理に関する機能を実行する複数の処理部を備えた装置の処理効率を向上させることができない場合がある。
【0007】
本発明は、上記に鑑みてなされたものであって、音声信号処理に関する機能を実行する複数の処理部を備えた装置の処理効率を向上させることを目的とする。
【課題を解決するための手段】
【0008】
上述した課題を解決し、目的を達成するために、本発明に係る音声信号処理装置は、複数の音声信号処理部と、複数のバッファとを有する。複数の音声信号処理部は、それぞれが複数のグループのいずれかに属し、供給された音声信号を用いて所定の処理を行う。複数のバッファは、互いにバッファサイズが異なり、それぞれがグループのいずれかに対応付けられた複数のバッファであって、蓄積した音声信号を、対応付けられたグループに属する音声信号処理部に供給する。
【発明の効果】
【0009】
本発明によれば、音声信号処理に関する機能を実行する複数の処理部を備えた装置の処理効率を向上させることができる。
【図面の簡単な説明】
【0010】
図1図1は、従来の音声信号処理装置の構成を示す図である。
図2図2は、実施形態に係る音声信号処理装置の構成例を示す図である。
図3図3は、実施形態に係る音声信号処理装置が実行する処理の手順を示すフローチャートである。
【発明を実施するための形態】
【0011】
以下、添付図面を参照して、本願の開示する音声信号処理装置及び音声信号処理方法の実施形態を詳細に説明する。なお、以下に示す実施形態により本発明が限定されるものではない。
【0012】
まず、図1を用いて、従来の音声信号処理装置の構成について説明する。図1は、従来の音声信号処理装置の構成を示す図である。
【0013】
図1に示すように、音声信号処理装置1aは、複数の音声信号処理部(符号81、82、83、84)と、複数の音声信号処理部の前に設けられた1つのバッファ(蓄積部80)とを有する。さらに、各音声処理部の後には、バッファが設けられている。
【0014】
図1の例では、バッファに蓄積した音声信号を各処理部に供給する処理の頻度が高くなるため、CPU(Central Processing Unit)負荷が増大する。実施形態の目的の1つは、このようなCPU負荷の増大を抑止することである。
【0015】
図2は、実施形態に係る音声信号処理装置の構成例を示す図である。例えば、音声信号処理装置1は、複数の機能を持つ多機能カーオーディオである。
【0016】
図2に示すように、音声信号処理装置1は、マイク10、DSP20(Audio DSP)、ドライバ30(Sound Driver)を有する。
【0017】
DSP20は、音声の増幅及びチューニングを行う。また、ドライバ30は、サンプリングレートの変換を行う。
【0018】
また、音声信号処理装置1は、蓄積部41、蓄積部42及び蓄積部43を有する。各蓄積部は、音声信号を一時的に蓄積するバッファとして機能する。
【0019】
蓄積部41のバッファサイズは1024frameである。また、蓄積部42のバッファサイズは256frameである。また、蓄積部43のバッファサイズは32frameである。ここでは、音声信号の量をこのようにframe数で表現するものとする。
【0020】
さらに、音声信号処理装置1は、音声信号処理部411、音声信号処理部421、音声信号処理部422及び音声信号処理部431を有する。
【0021】
図2の例では、音声信号処理部411は、Drive Recorderとして機能し、処理を実行するために、1024frameの音声信号を必要とする。
【0022】
また、音声信号処理部421は、VR(Voice Recognition)として機能し、処理を実行するために、256frameの音声信号を必要とする。
【0023】
また、音声信号処理部422は、HF(Hands Free)& Mobile VRとして機能し、処理を実行するために、256frameの音声信号を必要とする。
【0024】
また、音声信号処理部431は、ICCとして機能し、処理を実行するために、32frameの音声信号を必要とする。
【0025】
さらに、各音声信号処理部は、処理を実行した結果得られた音声信号等を、後段の機能に受け渡す。また、各音声信号処理部は、それぞれ独立したCPUを有する。
【0026】
音声信号処理部は、処理に必要な音声信号のサイズごとにグループに分類される。また、各グループには、処理に必要な音声信号のサイズと同じバッファサイズの蓄積部が対応付けられる。
【0027】
例えば、処理に1024frameの音声信号を必要とする第1のグループには、音声信号処理部411が属し、蓄積部41が対応付けられる。
【0028】
また、例えば、処理に256frameの音声信号を必要とする第2のグループには、音声信号処理部421及び音声信号処理部422が属し、蓄積部42が対応付けられる。
【0029】
また、例えば、処理に32frameの音声信号を必要とする第3のグループには、音声信号処理部431が属し、蓄積部43が対応付けられる。
【0030】
このように、各音声信号処理部は、処理に要する音声信号のサイズごとに分けられたグループのいずれかに属する。また、各蓄積部は、対応付けられたグループに属する音声信号処理部が処理に要する音声信号のサイズと同一のバッファサイズである。
【0031】
これにより、音声信号がバッファを通過する時間を短縮し、さらにCPUの処理負荷を低減することができる。
【0032】
このように、音声信号処理装置1は、それぞれが複数のグループのいずれかに属する複数の音声信号処理部と、互いにバッファサイズが異なり、それぞれが前記グループのいずれかに対応付けられた複数の蓄積部(バッファ)と、を有する。
【0033】
実施形態に係る音声信号処理方法では、複数の蓄積部(バッファ)が、蓄積した音声信号を、対応付けられたグループに属する音声信号処理部に供給する。
【0034】
また、実施形態に係る音声信号処理方法では、複数の音声信号処理部が、供給された音声信号を用いて所定の処理を行う。
【0035】
このように、音声信号処理部のグループに合ったバッファサイズのバッファが音声信号を供給するので、実施形態によれば、音声信号処理に関する機能を実行する複数の処理部を備えた装置の処理効率を向上させることができる。
【0036】
図3は、実施形態に係る音声信号処理装置が実行する処理の手順を示すフローチャートである。図3に示すように、まず、音声信号処理装置1は、マイク10から入力された音声信号を、バッファ(蓄積部)に蓄積する(ステップS101)。
【0037】
図2の例では、音声信号は、蓄積部41、蓄積部42及び蓄積部43に同時に蓄積されていく。
【0038】
ここで、音声信号処理装置1は、各バッファにおいて、音声信号が処理に要するサイズまで蓄積されていない間は(ステップS102:No)、音声信号の蓄積を続ける(ステップS101)。
【0039】
各蓄積部は、自身のバッファサイズと同等のサイズの音声信号を処理に要する音声信号処理部と対応付けられている。このため、音声信号が処理に要するサイズは、対応付けられた各蓄積部のバッファサイズに等しい。
【0040】
例えば、蓄積部41については、1024frameの音声信号が蓄積されると、ステップS102においてYesと判定される。
【0041】
また、例えば、蓄積部42については、256frameの音声信号が蓄積されると、ステップS102においてYesと判定される。
【0042】
また、例えば、蓄積部43については、32frameの音声信号が蓄積されると、ステップS102においてYesと判定される。
【0043】
音声信号処理装置1は、各バッファにおいて、音声信号が処理に要するサイズまで蓄積されると(ステップS102:Yes)、蓄積した音声信号を音声信号処理部に供給する(ステップS103)。
【0044】
上述してきたように、実施形態に係る音声信号処理装置1は、複数の音声信号処理部と、複数のバッファ(蓄積部)とを有する。複数の音声信号処理部は、それぞれが複数のグループのいずれかに属し、供給された音声信号を用いて所定の処理を行う。複数のバッファは、互いにバッファサイズが異なり、それぞれがグループのいずれかに対応付けられた複数のバッファであって、蓄積した音声信号を、対応付けられたグループに属する音声信号処理部に供給する。このように、処理に要する音声信号のサイズに合ったバッファを用意することで、各音声信号処理部が音声信号の蓄積を待機する時間を削減することができる。このため、本実施形態によれば、音声信号処理に関する機能を実行する複数の処理部を備えた装置の処理効率を向上させることができる。
【0045】
ここで、多機能カーオーディオにおいて、音声信号が各処理部を通過する時間が長くなると、機能ごとの認証要件を満たせず、製品価値が減少又は消失する場合がある。
【0046】
本実施形態の音声信号処理装置1を多機能オーディオに適用することで、製品価値の減少及び消失を抑止することができる。
【0047】
本実施形態の音声信号処理装置1は、図1に示す従来の音声信号処理装置1aに対し、余分なバッファの削減、最適なバッファサイズのバッファの配置といった部品最適化を行ったものであるということもできる。
【0048】
そこで、従来の音声信号処理装置1aと比較しつつ、本実施形態の音声信号処理装置1の具体的な効果について説明する。
【0049】
また、ここでは一例として、バッファに32frameの音声信号を蓄積するには、1.33msの時間と1%のCPU使用率が必要であるものとする。
【0050】
図1に示すように、従来の音声信号処理装置1aにおいては、バッファサイズが32frameの蓄積部80とは別に、各音声信号処理部に、処理に要する音声信号のサイズと同じバッファサイズのバッファが備えられている。
【0051】
Drive Recorderとして機能する音声信号処理部81には、バッファサイズが1024frameのバッファが備えられている。
【0052】
音声信号処理部81が、バッファサイズが1024frameのバッファに音声信号を蓄積するのに対し、実施形態の音声信号処理部411には、蓄積部41から1024frameの音声信号が供給される。
【0053】
このため、(1024frame/32frame)×1%=32%より、本実施形態によれば、Drive Recorderを実行するCPUの処理負荷が32%削減されるということができる。
【0054】
また、VRとして機能する音声信号処理部82及びHF& Mobile VRとして機能する音声信号処理部83には、それぞれバッファサイズが256frameのバッファが備えられている。
【0055】
音声信号処理部82及び音声信号処理部83が、それぞれバッファサイズが256frameのバッファに音声信号を蓄積するのに対し、実施形態の音声信号処理部421及び音声信号処理部422には、蓄積部42から256frameの音声信号が供給される。
【0056】
このため、(256frame/32frame)×1%=8%より、本実施形態によれば、VR又はHF& Mobile VRを実行するCPUの処理負荷が8%削減されるということができる。
【0057】
さらに、(256frame/32frame)×1.33ms=10.64msより、本実施形態によれば、VR又はHF& Mobile VRを実行する際の遅延時間が10.64ms削減されるということができる。
【0058】
また、ICCとして機能する音声信号処理部84には、バッファサイズが32frameのバッファが備えられている。
【0059】
音声信号処理部8483が、32frameのバッファに音声信号を蓄積するのに対し、実施形態の音声信号処理部431には、蓄積部43から32frameの音声信号が供給される。
【0060】
このため、(32frame/32frame)×1.33ms=1.33msより、本実施形態によれば、ICCを実行する際の遅延時間が1.33ms削減されるということができる。
【0061】
さらなる効果や変形例は、当業者によって容易に導き出すことができる。このため、本発明のより広範な態様は、以上のように表しかつ記述した特定の詳細及び代表的な実施形態に限定されるものではない。したがって、添付の請求の範囲及びその均等物によって定義される総括的な発明の概念の精神又は範囲から逸脱することなく、様々な変更が可能である。
【符号の説明】
【0062】
1、1a 音声信号処理装置
10 マイク
20 DSP
30 ドライバ
41、42、43、80 蓄積部
81、82、83、84、411、421、422、431 音声信号処理部
図1
図2
図3