IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ パナソニックIPマネジメント株式会社の特許一覧

特開2024-173432ノイズ解析装置、ノイズ解析方法及びプログラム
<>
  • 特開-ノイズ解析装置、ノイズ解析方法及びプログラム 図1
  • 特開-ノイズ解析装置、ノイズ解析方法及びプログラム 図2
  • 特開-ノイズ解析装置、ノイズ解析方法及びプログラム 図3A
  • 特開-ノイズ解析装置、ノイズ解析方法及びプログラム 図3B
  • 特開-ノイズ解析装置、ノイズ解析方法及びプログラム 図3C
  • 特開-ノイズ解析装置、ノイズ解析方法及びプログラム 図4
  • 特開-ノイズ解析装置、ノイズ解析方法及びプログラム 図5
  • 特開-ノイズ解析装置、ノイズ解析方法及びプログラム 図6A
  • 特開-ノイズ解析装置、ノイズ解析方法及びプログラム 図6B
  • 特開-ノイズ解析装置、ノイズ解析方法及びプログラム 図7
  • 特開-ノイズ解析装置、ノイズ解析方法及びプログラム 図8
  • 特開-ノイズ解析装置、ノイズ解析方法及びプログラム 図9
  • 特開-ノイズ解析装置、ノイズ解析方法及びプログラム 図10
  • 特開-ノイズ解析装置、ノイズ解析方法及びプログラム 図11
  • 特開-ノイズ解析装置、ノイズ解析方法及びプログラム 図12
  • 特開-ノイズ解析装置、ノイズ解析方法及びプログラム 図13
  • 特開-ノイズ解析装置、ノイズ解析方法及びプログラム 図14
  • 特開-ノイズ解析装置、ノイズ解析方法及びプログラム 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024173432
(43)【公開日】2024-12-12
(54)【発明の名称】ノイズ解析装置、ノイズ解析方法及びプログラム
(51)【国際特許分類】
   G10L 25/48 20130101AFI20241205BHJP
   G10L 21/028 20130101ALI20241205BHJP
   G10L 25/84 20130101ALI20241205BHJP
   G10L 17/00 20130101ALI20241205BHJP
【FI】
G10L25/48 100
G10L21/028 Z
G10L25/84
G10L17/00 200C
【審査請求】未請求
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2023091844
(22)【出願日】2023-06-02
(71)【出願人】
【識別番号】314012076
【氏名又は名称】パナソニックIPマネジメント株式会社
(74)【代理人】
【識別番号】110002000
【氏名又は名称】弁理士法人栄光事務所
(72)【発明者】
【氏名】藤井 亮太
(57)【要約】      (修正有)
【課題】ユーザによる特定の処理実行中に混入したノイズがどの程度存在しているかを明示的に報知するノイズ解析装置、ノイズ解析方法及びプログラムを提供する。
【解決手段】ネットワークを介して相互にデータ通信可能に接続された複数の音処理装置を少なくとも含む通話システムにおいて、音処理装置10は、収音デバイスにより収音された入力音信号をノイズ音信号と非ノイズ音信号とに分離する音分析部13と、非ノイズ音信号の音量を解析する音A音量解析部14と、ノイズ音信号の音量を解析する音B音量解析部15と、非ノイズ音信号の音量の解析結果である第1解析結果とノイズ音信号の音量の解析結果である第2解析結果とをディスプレイに視覚的かつ対比的に表示する制御部17と、を備える。
【選択図】図2
【特許請求の範囲】
【請求項1】
収音デバイスにより収音された入力音信号をノイズ音信号と非ノイズ音信号とに分離する音分析部と、
前記非ノイズ音信号の音量を解析する第1解析部と、
前記ノイズ音信号の音量を解析する第2解析部と、
前記非ノイズ音信号の音量の解析結果である第1解析結果と、前記ノイズ音信号の音量の解析結果である第2解析結果とをディスプレイに視覚的かつ対比的に表示する表示制御部と、を備える、
ノイズ解析装置。
【請求項2】
前記入力音信号は、ユーザが前記収音デバイスを装着して発話した時の通話音声信号と、前記発話時に発生しているノイズ音信号とを含む、
請求項1に記載のノイズ解析装置。
【請求項3】
前記第1解析結果と前記第2解析結果とを比較する比較部、を更に備え、
前記比較部は、前記第2解析結果の示す前記ノイズ音信号の音量が前記第1解析結果の示す前記非ノイズ音信号の音量と所定係数値との積以上である場合に、前記非ノイズ音信号の音量を前記第1解析結果より小さく補正する、
請求項1に記載のノイズ解析装置。
【請求項4】
前記第1解析結果と前記第2解析結果とを比較する比較部、を更に備え、
前記比較部は、前記第1解析結果の示す前記非ノイズ音信号の音量が第1閾値以上であってかつ直前に解析された前記第2解析結果の示す前記ノイズ音信号の音量が前記第1閾値以上である場合に、前記非ノイズ音信号の音量を前記第1解析結果より小さく補正する、
請求項1に記載のノイズ解析装置。
【請求項5】
前記表示制御部は、前記第1解析結果及び前記第2解析結果のそれぞれを所定範囲内の値に正規化処理する、
請求項1に記載のノイズ解析装置。
【請求項6】
前記表示制御部は、前記正規化処理の結果としてゼロを最小値、X(X:0≦X≦1)以上を最大値として表示する、
請求項5に記載のノイズ解析装置。
【請求項7】
前記第2解析結果の示す前記ノイズ音信号の音量が第2閾値以上となる期間が一定期間以上となるか否かを判定する制御部、を更に備え、
前記制御部は、前記ノイズ音信号の音量が前記第2閾値以上となる期間が前記一定期間以上となると判定した場合に、ノイズ音の発生を知らせる旨のメッセージを前記ディスプレイに表示する、
請求項1に記載のノイズ解析装置。
【請求項8】
前記入力音信号における有音区間と前記入力音信号における定常雑音区間とを区別可能に判定する判定部と、
前記定常雑音区間における定常雑音信号の音量を解析する第3解析部と、を更に備え、
前記表示制御部は、前記非ノイズ音信号の音量の解析結果である第1解析結果と、前記ノイズ音信号の音量の解析結果である第2解析結果と前記定常雑音信号の音量の解析結果である第3解析結果との加算結果とを前記ディスプレイに視覚的かつ対比的に表示する、
請求項1に記載のノイズ解析装置。
【請求項9】
前記入力音信号は、ユーザが声紋認証用に前記収音デバイスに向かって発話した時の発話音声信号と、前記発話時に発生しているノイズ音信号とを含む、
請求項1に記載のノイズ解析装置。
【請求項10】
前記第2解析結果が示す前記ノイズ音信号の音量が第3閾値以上となるか否かを判定する制御部、を更に備え、
前記制御部は、前記ノイズ音信号の音量が前記第3閾値以上となると判定した場合に、前記声紋認証の処理を中断する又は前記声紋認証用の前記発話音声信号のレベルをゼロに変換する、
請求項9に記載のノイズ解析装置。
【請求項11】
ノイズ解析装置により実行されるノイズ解析方法であって、
収音デバイスにより収音された入力音信号をノイズ音信号と非ノイズ音信号とに分離するステップと、
前記非ノイズ音信号の音量を解析するステップと、
前記ノイズ音信号の音量を解析するステップと、
前記非ノイズ音信号の音量の解析結果である第1解析結果と、前記ノイズ音信号の音量の解析結果である第2解析結果とをディスプレイに視覚的かつ対比的に表示するステップと、を有する、
ノイズ解析方法。
【請求項12】
コンピュータであるノイズ解析装置に、
収音デバイスにより収音された入力音信号をノイズ音信号と非ノイズ音信号とに分離するステップと、
前記非ノイズ音信号の音量を解析するステップと、
前記ノイズ音信号の音量を解析するステップと、
前記非ノイズ音信号の音量の解析結果である第1解析結果と、前記ノイズ音信号の音量の解析結果である第2解析結果とをディスプレイに視覚的かつ対比的に表示するステップと、を実現させるための、
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、ノイズ解析装置、ノイズ解析方法及びプログラムに関する。
【背景技術】
【0002】
特許文献1には、入力音声信号の音声部分と非音声部分を判定し、音声部分における音声レベルを算出し、非音声部分における雑音レベルを算出し、音声レベルと雑音レベルから入力音声信号のSN比を算出し、音声レベルと雑音レベルとSN比と予め設定されている目標音量レベルから入力音声信号の増幅率を算出し、入力音声信号を増幅率で増幅して出力する自動音量制御装置が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2009-171208号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
近年ではリモート通話が増えており、在宅勤務中でもリモート通話を行う機会が増えている。しかし在宅勤務中にリモート通話を行うと、その通話音声の中に話者の周囲の生活雑音等のノイズが混入することが少なくなく、その場合には通話相手にもノイズを送ることになり、会話或いは会議の支障となり得るという問題点が存在する。また、混入したノイズがどのくらい通話相手に伝わっているかをリモート通話の話者が明確に知る有効な手段が存在していない。特許文献1は定常的なノイズは抑えることができるが突発的なノイズは抑えられずに通話相手に伝わることになる。また近年の人工知能を用いたノイズ除去であってもどのような種類のノイズを除去することができるかユーザが把握することは困難である。例えばリモート通話の話者の近くで赤ちゃんが泣いていて、リモート通話の通話相手に対して赤ちゃんの泣き声がどの程度のノイズとして伝わっているかを把握することはできなかった。特許文献1にも、上述した混入した生活雑音等のノイズがどのくらい通話相手に対して伝わっているのかを話者が明確に知る有効な手段は開示されていない。
【0005】
本開示は、上述した従来の事情に鑑みて案出され、ユーザによる特定の処理実行中に混入したノイズがどの程度存在しているかを明示的に報知するノイズ解析装置、ノイズ解析方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本開示は、収音デバイスにより収音された入力音信号をノイズ音信号と非ノイズ音信号とに分離する音分析部と、前記非ノイズ音信号の音量を解析する第1解析部と、前記ノイズ音信号の音量を解析する第2解析部と、前記非ノイズ音信号の音量の解析結果である第1解析結果と、前記ノイズ音信号の音量の解析結果である第2解析結果とをディスプレイに視覚的かつ対比的に表示する表示制御部と、を備える、ノイズ解析装置を提供する。
【0007】
また、本開示は、ノイズ解析装置により実行されるノイズ解析方法であって、収音デバイスにより収音された入力音信号をノイズ音信号と非ノイズ音信号とに分離するステップと、前記非ノイズ音信号の音量を解析するステップと、前記ノイズ音信号の音量を解析するステップと、前記非ノイズ音信号の音量の解析結果である第1解析結果と、前記ノイズ音信号の音量の解析結果である第2解析結果とをディスプレイに視覚的かつ対比的に表示するステップと、を有する、ノイズ解析方法を提供する。
【0008】
また、本開示は、コンピュータであるノイズ解析装置に、収音デバイスにより収音された入力音信号をノイズ音信号と非ノイズ音信号とに分離するステップと、前記非ノイズ音信号の音量を解析するステップと、前記ノイズ音信号の音量を解析するステップと、前記非ノイズ音信号の音量の解析結果である第1解析結果と、前記ノイズ音信号の音量の解析結果である第2解析結果とをディスプレイに視覚的かつ対比的に表示するステップと、を実現させるための、プログラムを提供する。
【発明の効果】
【0009】
本開示によれば、ユーザによる特定の処理実行中に混入したノイズがどの程度存在しているかを明示的に報知できる。
【図面の簡単な説明】
【0010】
図1】実施の形態1に係る通話システムのシステム構成例を示す図
図2図1の音処理装置のハードウェア構成例を示すブロック図
図3A】表示領域内に表示される音声メータ、ノイズメータの第1表示例を示す図
図3B】表示領域内に表示される音声メータ、ノイズメータの第2表示例を示す図
図3C】表示領域内に表示される音声メータ、ノイズメータの第3表示例を示す図
図4】実施の形態1に係る音処理装置の動作手順例を時系列に示すフローチャート
図5図4のステップSt2の音分析の詳細な動作手順例を時系列に示すフローチャート
図6A図4のステップSt5の音量比較補正処理の詳細な第1動作手順例を時系列に示すフローチャート
図6B図4のステップSt5の音量比較補正処理の詳細な第2動作手順例を時系列に示すフローチャート
図7図4のステップSt6の音量表示処理の詳細な動作手順例を時系列に示すフローチャート
図8図4のステップSt7の信号処理用のパラメータ算出の詳細な動作手順例を時系列に示すフローチャート
図9】実施の形態2に係る声紋認証システムのシステム構成例を示す図
図10図9の音処理装置のハードウェア構成例を示すブロック図
図11】実施の形態2に係る図4のステップSt7の声紋認証用のパラメータ算出の詳細な動作手順例を時系列に示すフローチャート
図12】実施の形態1の変形例1に係る音処理装置のハードウェア構成例を示すブロック図
図13】実施の形態1の変形例1に係る音処理装置の動作手順例を時系列に示すフローチャート
図14】実施の形態1の変形例2に係る音処理装置のハードウェア構成例を示すブロック図
図15】実施の形態1の変形例2に係る音処理装置の動作手順例を時系列に示すフローチャート
【発明を実施するための形態】
【0011】
以下、適宜図面を参照しながら、本開示に係るノイズ解析装置、ノイズ解析方法及びプログラムを具体的に開示した実施の形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になることを避け、当業者の理解を容易にするためである。なお、添付図面及び以下の説明は、当業者が本開示を十分に理解するために提供されるものであり、これらにより特許請求の範囲に記載の主題を限定することは意図されていない。
【0012】
<実施の形態1>
実施の形態1では、本開示に係るノイズ解析装置の一実施態様として、複数人がネットワークを介してデータ通信可能に接続された音処理装置とヘッドセットとをそれぞれ用いて行うリモート通話を支援する通話システムを例示する(図1参照)。
【0013】
まず、図1を参照して、実施の形態1に係る通話システム100のシステム構成例について説明する。図1は、実施の形態1に係る通話システム100のシステム構成例を示す図である。通話システム100は、ネットワークNW1を介して相互にデータ通信可能に接続された音処理装置10、20、30、40を少なくとも含む。音処理装置10、20、30、40のそれぞれに対応するように、リモート通話用のヘッドセットHS1、HS2、HS3、HS4、及び、表示用のディスプレイDP1、DP2、DP3、DP4が接続されている。ヘッドセットHS1、HS2、HS3、HS4は、それぞれユーザSP1、SP2、SP3、SP4により使用される。
【0014】
ネットワークNW1は、有線ネットワーク、無線ネットワーク、或いは有線ネットワーク及び無線ネットワークの組み合わせ、のいずれでもよい。有線ネットワークは、例えば有線Local Area Network(LAN)、或いは、有線Wide Area Network(WAN)等でよい。無線ネットワークは、例えば無線LAN、無線WAN、或いは、セルラー無線通信等でよい。
【0015】
以下、説明を簡単にするために、リモート通話の話者であるユーザSP1を中心として、ユーザSP1が使用するヘッドセットHS1により収音したユーザSP1の発話音声及びユーザSP1の周囲のノイズ音のそれぞれの音量を視覚的かつ対比的に表示する音処理装置10の構成及び動作を主に説明する。ユーザSP1がリモート通話の話者である場合、他のユーザSP2、SP3、SP4はそれぞれ通話相手となる。
【0016】
音処理装置10は、本開示に係るノイズ解析装置の一例であり、ユーザSP1の発話音声の音量と周囲のノイズ音の音量とを、視覚的かつ対比的にディスプレイDP1の一部の表示領域AR1に表示する(図3A図3B図3C参照)。なお、音処理装置10の構成及び動作の説明は、他の音処理装置20、30、40の一部或いは全部に同様に適用しても構わない。
【0017】
ヘッドセットHS1は、周知のヘッドセットの構成と同一でよく、マイク及びスピーカを備える。ヘッドセットHS1は、リモート通話中のユーザSP1の発話音声をマイクにおいて収音したり、通話相手であるユーザSP2、SP3、SP4のうち少なくとも1人の発話音声をスピーカから出力したりする。ヘッドセットHS1のマイクにより収音された音には、ユーザSP1の発話音声だけでなく、ユーザSP1の周囲に存在している生活雑音等のノイズ音が含まれる。ここでいう生活雑音とは、例えばユーザSP1の周囲に赤ちゃんが泣いている場合の泣き声、インターホンの鳴動音若しくは電話機の着信音のように周囲において突発的に生じた音、定常的に発生している音量の小さい雑音等が含まれる。
【0018】
ディスプレイDP1は、例えば液晶ディスプレイ或いは有機Electroluminescence(EL)ディプレイであり、音処理装置10からの表示用のデータ信号を入力し、そのデータ信号に対応する画像等を表示する。ディスプレイDP1は、例えばユーザSP1の発話音声の音量と周囲のノイズ音の音量とを、視覚的かつ対比的に表示領域AR1内に表示する(図3A図3B図3C参照)。表示領域AR1は、ユーザSP1が目につきやすい位置の一例として、ディスプレイDP1の画像/映像の表示領域全体のうち右下端部の矩形状領域としている。但し、表示領域AR1の位置は、ユーザSP1が目につきやすい位置であれば、前述した右下端部に限定されなくてもよい。
【0019】
次に、図2を参照して、図1の音処理装置10のハードウェア構成例について説明する。図2は、図1の音処理装置10のハードウェア構成例を示すブロック図である。音処理装置10は、ヘッドセットHS1及びディスプレイDP1のそれぞれにデータ信号の入出力が可能に接続されている。音処理装置10は、汎用的なコンピュータ装置であり、例えばパーソナルコンピュータ、スマートフォン、タブレット端末、或いは、サーバコンピュータであってよい。音処理装置10は、プロセッサPRC1と、メモリ11と、をハードウェア構成として少なくとも含む。なお、音処理装置10は、ユーザSP1の操作を受け付けるマウス等の入力デバイスも更に含む構成としてよい。
【0020】
プロセッサPRC1は、音処理装置10の全体的な動作を司るコントローラとして機能し、音処理装置10の各部の動作を統括するための制御処理、音処理装置10の各部との間のデータ信号/制御信号の入出力処理、データ信号/制御信号の演算処理及びデータ信号/制御信号の記憶処理を行う。プロセッサPRC1は、例えばCentral Processing Unit(CPU)、Digital Signal Processor(DSP)、Field Programmable Gate Array(FPGA)、或いは、Graphical Processing Unit(GPU)により構成されてよい。プロセッサPRC1は、メモリ11と協働しながら、ヘッドセットHS1により収音された音信号(以下、「入力音信号」と便宜的に称する場合がある)を入力し、この入力音信号に対して各種の信号処理を施す。
【0021】
メモリ11は、少なくともRead Only Memory(ROM)及びRandom Access Memory(RAM)を備える。ROMは、プロセッサPRC1が実行する各種の処理を規定するプログラムとそのプログラムの実行に必要となるデータとを関連付けて保存している。RAMは、プロセッサPRC1が取得或いは生成したデータ若しくは情報を一時的に保存する。メモリ11は、プロセッサPRC1による処理の実行中に適宜参照される。
【0022】
ここで、プロセッサPRC1が機能的に実行する処理の実行主体の構成例を詳述する。プロセッサPRC1は、音信号入力IF12と、音分析部13と、音A音量解析部14と、音B音量解析部15と、音量比較補正部16と、制御部17と、信号処理部18と、送信部19と、を機能的に備える。
【0023】
音信号入力IF12は、ヘッドセットHS1との間のインターフェース(Interface:IF)としての機能を備え、ヘッドセットHS1により収音された入力音信号を入力して音分析部13及び信号処理部18のそれぞれに送る。以下の説明において、音信号入力IF12には、音処理装置10の電源ONの間、ヘッドセットHS1により収音された入力音信号が周期的、断続的、或いは、定常的に入力され続ける。
【0024】
音分析部13は、音信号入力IF12からの入力音信号を少なくとも2種類の音信号(具体的には、音Aと音B)に分離し、音A信号(非ノイズ音信号の一例)を音A音量解析部14に送り、音B信号(ノイズ音信号の一例)を音B音量解析部15に送る。ここで、音Aとは、入力音信号に含まれる音の中でユーザSP1が発話した発話音声の部分の音を示す。つまり、音Aは、リモート通話の話者であるユーザSP1が発話したことによって通話相手であるユーザSP2、SP3、SP4に送り届けられると想定される通話音声の音を示す。一方、音Bとは、入力音信号に含まれる音の中でユーザSP1が発話した発話音声以外のノイズ音を示す。つまり、音Bは、ユーザSP2、SP3、SP4に送り届けられる音Aに混じる不要なノイズ音であって、ユーザSP2、SP3、SP4がユーザSP1の発話音声を聞き取る際の支障となり得る音である。音分析部13の処理の詳細については、図5を参照して後述する。
【0025】
音A音量解析部14は、第1解析部の一例であり、音分析部13からの音A信号を入力し、その入力された音A信号の音量を解析する。音A音量解析部14は、例えば音A信号の波形の平均パワー、最大振幅、或いは、特定の周波数帯におけるパワーを参照して音A信号の音量を解析する。また、音A音量解析部14は、入力された音A信号の波形を時間方向に平滑化した上で、音A信号の波形の平均パワー、最大振幅、或いは、特定の周波数帯におけるパワーを参照して音A信号の音量を解析してもよい。音A音量解析部14は、音A信号の音量の解析結果(第1解析結果)を音量比較補正部16に送る。
【0026】
音B音量解析部15は、第2解析部の一例であり、音分析部13からの音B信号を入力し、その入力された音B信号の音量を解析する。音B音量解析部15は、例えば音B信号の波形の平均パワー、最大振幅、或いは、特定の周波数帯におけるパワーを参照して音B信号の音量を解析する。また、音B音量解析部15は、入力された音B信号の波形を時間方向に平滑化した上で、音B信号の波形の平均パワー、最大振幅、或いは、特定の周波数帯におけるパワーを参照して音B信号の音量を解析してもよい。音B音量解析部15は、音B信号の音量の解析結果(第2解析結果)を音量比較補正部16に送る。
【0027】
音量比較補正部16は、音A音量解析部14からの第1解析結果と音B音量解析部15からの第2解析結果とを入力して比較する。音量比較補正部16は、第1解析結果及び第2解析結果が特定の第1条件を満たす場合に、音A信号の音量を音A音量解析部14により解析された音量の値より小さくなるよう補正してもよく(図6A図6B参照)、この場合に音A信号の補正後音量を信号処理部18に通知する。音量比較補正部16は、比較の結果、音A信号及び音B信号のそれぞれの音量を視覚的かつ対比的に表示するための表示用のデータ信号を生成し(図7参照)、音A信号及び音B信号の各音量を視覚的かつ対比的にディスプレイDP1の表示領域AR1に表示する。また、音量比較補正部16は、第2解析結果を取得する度にその第2解析結果を制御部17に送る。音量比較補正部16の処理の詳細については、図6A図6B及び図7のそれぞれを参照して後述する。
【0028】
制御部17は、音量比較補正部16から入力した第2解析結果が特定の第2条件を満たすか否かを判定する(図8参照)。制御部17は、第2解析結果が特定の第2条件を満たすと判定した場合に、所定のメッセージ(後述参照)のデータ信号を生成してディスプレイDP1内の画像/映像の表示領域全体の中で表示領域AR1以外の領域に表示する。制御部17の処理の詳細については、図8を参照して後述する。
【0029】
信号処理部18は、音信号入力IF12からの入力音信号に所定の信号処理を施して送信部19に送る。信号処理部18は、音量比較補正部16から音A信号の補正後音量の通知を受けた場合、音信号入力IF12からの入力音信号の音量を音A信号の補正後音量にまで下げるように減衰処理して送信部19に送る。
【0030】
送信部19は、信号処理部18からの減衰処理されていない入力音信号或いは減衰処理後の入力音信号を、ノイズ音が混じった通話音声信号としてネットワークNW1を介して他の音処理装置20、30、40のそれぞれに送信する。なお、送信部19は、プロセッサPRC1の一部を構成するものとして図示しているが、プロセッサPRC1とは別体で設けられてもよい。
【0031】
次に、図3A図3Cを参照して、表示領域AR1内に表示される音声メータ、ノイズメータの表示例について説明する。図3Aは、表示領域内に表示される音声メータ、ノイズメータの第1表示例を示す図である。図3Bは、表示領域内に表示される音声メータ、ノイズメータの第2表示例を示す図である。図3Cは、表示領域内に表示される音声メータ、ノイズメータの第3表示例を示す図である。
【0032】
図3Aに示すように、表示領域AR1には、音A信号の音量の解析結果である第1解析結果に相当する音声メータV1と、音B信号の音量の解析結果である第2解析結果に相当するノイズメータN1と、が視覚的かつ対比的に表示される。音声メータV1は、1つの表示枠Wk1内に表示され、音A信号の音量の大小に合わせた目盛り(表示バー)の個数によって音量の大きさを示す。同様に、ノイズメータN1は、1つの表示枠Wk2内に表示され、音B信号の音量の大小に合わせた目盛り(表示バー)の個数によって音量の大きさを示す。図3Aの表示例では、音声メータV1の目盛り(表示バー)がノイズメータN1の目盛り(表示バー)よりも多いため、話者であるユーザSP1の発話音声がノイズ音よりも勝って収音されていることが分かる。また、ユーザSP1は、自分の発話音声の大きさ(つまり音声メータV1の目盛り)と比較してノイズメータN1の目盛りが示すノイズ音が混じっていることを視覚的かつ対比的に認識することができる。
【0033】
図3Bに示すように、表示領域AR1には、音A信号の音量の解析結果である第1解析結果に相当する音声メータV2と、音B信号の音量の解析結果である第2解析結果に相当するノイズメータN2と、1つの表示枠Wk3内において視覚的かつ対比的に表示される。音声メータV2は、同一の表示枠Wk3内に表示され、音A信号の音量の大小に合わせた目盛り(表示バー)の個数によって音量の大きさを示す。同様に、ノイズメータN2は、同一の表示枠Wk3内に表示され、音B信号の音量の大小に合わせた目盛り(表示バー)の個数によって音量の大きさを示す。図3Bの表示例では、音声メータV2の目盛り(表示バー)がノイズメータN2の目盛り(表示バー)よりも少ないため、話者であるユーザSP1の発話音声よりも周囲のノイズ音が勝って収音されていることが分かる。また、ユーザSP1は、自分の発話音声の大きさ(つまり音声メータV2の目盛り)と比較してノイズメータN2の目盛りが示すノイズ音が多く混じっていることを視覚的かつ対比的に認識することができる。
【0034】
図3Cに示すように、表示領域AR1には、音A信号の音量の解析結果である第1解析結果に相当する音声メータV3と、音B信号の音量の解析結果である第2解析結果に相当するノイズメータN3と、円グラフ形式で視覚的かつ対比的に表示される。音声メータV3及びノイズメータN3のそれぞれのゼロ(原点)は点線I1により定義される。つまり、点線I1の位置をゼロ点として、音A信号の音量が音声メータV3によって円グラフ形式で示され、かつ、音B信号の音量がノイズメータN3によって円グラフ形式で示されている。図3Cの表示例では、音声メータV3の円弧長(表示バーの長さ)がノイズメータN3の円弧長(表示バーの長さ)よりも長いため、話者であるユーザSP1の発話音声がノイズ音よりも勝って収音されていることが分かる。また、ユーザSP1は、自分の発話音声の大きさ(つまり音声メータV3の円弧長)と比較してノイズメータN3の円弧長(表示バーの長さ)が示すノイズ音が混じっていることを視覚的かつ対比的に認識することができる。
【0035】
次に、図4図8を参照して、実施の形態1に係る音処理装置10の動作手順例について説明する。図4は、実施の形態1に係る音処理装置10の動作手順例を時系列に示すフローチャートである。図5は、図4のステップSt2の音分析の詳細な動作手順例を時系列に示すフローチャートである。図6Aは、図4のステップSt5の音量比較補正処理の詳細な第1動作手順例を時系列に示すフローチャートである。図6Bは、図4のステップSt5の音量比較補正処理の詳細な第2動作手順例を時系列に示すフローチャートである。図7は、図4のステップSt6の音量表示処理の詳細な動作手順例を時系列に示すフローチャートである。図8は、図4のステップSt7の信号処理用のパラメータ算出の詳細な動作手順例を時系列に示すフローチャートである。
【0036】
まず、図4を参照して、実施の形態1に係る音処理装置10の全体的な動作手順例を説明する。図4に示す各処理は、主にプロセッサPRC1(図2参照)によって実行される。
【0037】
図4において、プロセッサPRC1は、ヘッドセットHS1から入力されてくる入力音信号を音信号入力IF12において一定期間分保持する(ステップSt1)。一定期間は、例えば1秒、5秒、10秒等である。プロセッサPRC1は、ステップSt1で保持した一定期間分の入力音信号を用いて、その入力音信号に音分析を施し、入力音信号を音分析部13において音A信号と音B信号とに分離して出力する(ステップSt2)。ステップSt2の音分析の詳細な動作手順例については、図5を参照して後述する。
【0038】
プロセッサPRC1は、ステップSt2で得られた音A信号を用いて、音A信号の音量を音A音量解析部14において解析する(ステップSt3)。プロセッサPRC1は、ステップSt2で得られた音B信号を用いて、音B信号の音量を音B音量解析部15において解析する(ステップSt4)。プロセッサPRC1は、ステップSt3での解析により得られた音A信号の音量の解析結果(第1解析結果)とステップSt4での解析により得られた音B信号の音量の解析結果(第2解析結果)とを音量比較補正部16において入力して比較する(ステップSt5)。ステップSt5の音量比較補正処理の詳細な動作手順例については、図6A及び図6Bのそれぞれを参照して後述する。
【0039】
プロセッサPRC1は、ステップSt3での解析により得られた音A信号の音量の解析結果(第1解析結果)或いはステップSt5での補正後の出力と、ステップSt4での解析により得られた音B信号の音量の解析結果(第2解析結果)或いはステップSt5での補正後の出力とを用いて、音量表示処理(図7参照)を行うことにより、音A信号及び音B信号のそれぞれの音量を視覚的かつ対比的に表示するための表示用のデータ信号を生成する(ステップSt6)。ステップSt6の音量表示処理の詳細な動作手順例については、図7を参照して後述する。
【0040】
プロセッサPRC1は、ステップSt6の音量表示処理の後、ステップSt4での解析により得られた音B信号の音量の解析結果(第2解析結果)を用いて、信号処理用のパラメータの算出処理を行う(ステップSt7)。ステップSt7の算出処理の詳細な動作手順例については、図8を参照して後述する。
【0041】
ステップSt7の後、ユーザSP1の入力操作によりリモート通話の終了が指示された場合には(ステップSt8、YES)、図4に示すプロセッサPRC1の処理は終了する。一方、ユーザSP1の入力操作によりリモート通話の終了が指示されていない場合には(ステップSt8、NO)、プロセッサPRC1の処理はステップSt1に戻る。つまり、ユーザSP1の入力操作によりリモート通話の終了が指示されるまで、プロセッサPRC1は、ステップSt1~ステップSt8までの一連の処理を繰り返し実行する。
【0042】
次に、図5を参照して、図4のステップSt2の音分析の詳細な動作手順例を説明する。図5に示す各処理は、主にプロセッサPRC1(図2参照)の音分析部13によって実行される。
【0043】
図5において、音分析部13は、ステップSt1で保持した一定期間分の入力音信号を用いて、その入力音信号の1つ以上の特徴量を抽出する(ステップSt2-1)。音分析部13は、特徴量の抽出として、例えばFast Fourier Transform(FFT:高速フーリエ変換)の処理を行ったり、Mel Frequency Cepstral Coefficient(MFCC:メル周波数ケプストラム係数)を得るための各種解析を行ったりする。なお、音分析部13が行う特徴量を抽出するための解析の種類は特に問わない。
【0044】
音分析部13は、ステップSt2-1で抽出した入力音信号の1つ以上の特徴量と、メモリ11に事前保存されている登録特徴量(例えば音Aの種類に応じて予め登録された音の特徴量)とを比較し、その登録特徴量に近づくように入力音信号をフィルタ等で変換することにより音A信号を出力する(ステップSt2-2)。音分析部13は、ステップSt2-1で抽出した入力音信号の1つ以上の特徴量と、メモリ11に事前登録されている他の登録特徴量(例えば音Bの種類に応じて予め登録された音の特徴量)を用いて、ステップSt2-2と同様にして、その他の登録特徴量に近づくように入力音信号をフィルタ等で変換することにより音B信号を出力する(ステップSt2-3)。これにより、音分析部13は、ステップSt1で保持した一定期間分の入力音信号から音A信号と音B信号とを分離して抽出できる。
【0045】
なお、音分析部13は、一定期間分の入力音信号から音A信号と音B信号とを抽出することができれば、メモリ11に事前保存されている登録特徴量との比較に基づくフィルタ等での変換手法を必ず使用しなくても構わない。例えば、音分析部13は、予め決められたルールに従って一定期間分の入力音信号を音A信号に変換加工するとともに入力音信号を音B信号に変換加工してもよい。また、音分析部13は、ニューラルネットワーク等を用いて、一定期間分の入力音信号を入力して2つ以上の音信号(例えば音A信号、音B信号)を出力しても構わない。また、ステップSt2-2及びステップSt2-3において、音分析部13は、音A信号及び音B信号の出力に関して、音信号の波形を出力する態様以外に、各音信号の特徴量を出力してもよいし、その音信号の音量が参照可能となるパラメータを出力しても構わない。
【0046】
次に、図6Aを参照して、図6AのステップSt5の音量比較補正処理の詳細な動作手順例を説明する。図6Aに示す各処理は、主にプロセッサPRC1(図2参照)の音量比較補正部16によって実行される。
【0047】
図6Aにおいて、音量比較補正部16は、音A信号の音量の解析結果(第1解析結果)と音B信号の音量の解析結果(第2解析結果)を比較し、「B≧k*A?」の式(特定の第1条件の一例)を満たすか否かを判定する(ステップSt5-1)。*は掛け算の演算子であり、以下同様である。つまり、音量比較補正部16は、「音B信号の音量」が「音A信号の音量のk倍値」以上であるか否か(言い換えると、ノイズ音がユーザSP1の発話音声である目的音と同等かそれ以上であるか否か)を判定する。kは定数であり、例えばk=1或いはk=0.5である。「B<k*A」であると判定された場合には(ステップSt5-1、NO)、図6Aの音量比較補正部16の処理は終了する。つまり、この場合には、音量比較補正部16は、音A信号の音量の解析結果(第1解析結果)と音B信号の音量の解析結果(第2解析結果)とを補正せずにそのまま音量表示処理に使用する。
【0048】
一方、音量比較補正部16は、「B≧k*A」であると判定した場合には(ステップSt5-1、YES)、係数値m(例えば0.5或いは0.25)を用いて、ステップSt3での解析により得られた音A信号の音量より小さくなるように音A信号の音量を補正する(ステップSt5-2)。つまり、音量比較補正部16は、ステップSt3での解析により得られた音A信号の音量をAとした場合、ステップSt5-2において音A信号の音量をm*Aと演算する。周囲のノイズ音がユーザSP1の発話音声である目的音と同等かそれ以上である場合には、リモート通話の通話相手にとって目的音が聞こえにくい状況であると推察される。これにより、音量比較補正部16は、ステップSt5-2のように音A信号の音量を小さく補正することにより、ユーザSP1のリモート通話の現在の状況をユーザSP1に正確に理解させることができる。ステップSt5-2の後、図6Aの音量比較補正部16の処理は終了する。
【0049】
次に、図6Bを参照して、図6BのステップSt5の音量比較補正処理の詳細な動作手順例を説明する。図6Bに示す各処理は、主にプロセッサPRC1(図2参照)の音量比較補正部16によって実行される。
【0050】
図6Bにおいて、音量比較補正部16は、音A信号の音量の解析結果(第1解析結果)がメモリ11に予め保存されている一定の音量値(第1閾値の一例)以上であるか否かを判定する(ステップSt5-11)。音A信号の音量が一定の音量値未満であると判定された場合には(ステップSt5-11、NO)、図6Bの音量比較補正部16の処理は終了する。つまり、この場合には、音量比較補正部16は、音A信号の音量の解析結果(第1解析結果)と音B信号の音量の解析結果(第2解析結果)とを補正せずにそのまま音量表示処理に使用する。
【0051】
一方、音量比較補正部16は、音A信号の音量が一定の音量値以上であると判定した場合には(ステップSt5-11、YES)、前回の一定期間分の入力音信号から抽出された音B信号が一定の音量値(第1閾値の一例)以上であるか否かを判定する(ステップSt5-12)。前回の一定期間分の入力音信号から抽出された音B信号の音量が一定の音量値未満であると判定された場合には(ステップSt5-12、NO)、図6Bの音量比較補正部16の処理は終了する。
【0052】
一方、音量比較補正部16は、前回の一定期間分の入力音信号から抽出された音B信号の音量が一定の音量値以上であると判定した場合には(ステップSt5-12、YES)、係数値n(例えば0或いは0.01)を用いて、ステップSt3での解析により得られた音A信号の音量より小さくなるように音A信号の音量を補正する(ステップSt5-13)。つまり、音量比較補正部16は、ステップSt3での解析により得られた音A信号の音量をAとした場合、ステップSt5-13において音A信号の音量をn*Aと演算する。音分析部13による音A、音Bへの分離の精度について実際は完璧に高いわけではない。本来、音分析部13は、音B信号を音分析の処理結果として音A信号として出力する場合がある。また傾向としてこういった出力間違いは短時間で行うことに起因することもあり、音A(又は音B)を出力している時に音B(又は音A)と間違えることも多い。これを踏まえて、音量比較補正部16は、瞬間的な音A、音Bの出力値を図6Bの処理によって補正又は無効にすることにより、出力間違いをユーザSP1に知らせないようにすることができる。なお、図6BのステップSt5-11、St5-12、St5-13の各処理において、音Aを音Bへ、音Bを音Aへ、音Aを音Bへそれぞれ置き換える処理を行っても構わない。
【0053】
次に、図7を参照して、図4のステップSt6の音量表示処理の詳細な動作手順例を説明する。図7に示す各処理は、主にプロセッサPRC1(図2参照)の音量比較補正部16によって実行される。
【0054】
図7において、音量比較補正部16は、音A信号の音量の補正(図6A又は図6B参照)後或いは補正していない解析結果(第1解析結果)と、音B信号の音量の補正(図6A又は図6B参照)後或いは補正していない解析結果(第2解析結果)を用いて、音A信号及び音B信号のそれぞれのレベル(音量)を所定の対数に変換する(ステップSt6-1)。音量比較補正部16は、ステップSt6-1での音A信号及び音B信号の各音量の変換後の値を用いて、所定範囲内の値(例えば0~1.0の値)になるように正規化処理する(ステップSt6-2)。音量比較補正部16は、ステップSt6-2で正規化処理した音A信号及び音B信号の各音量の出力値を平滑化する(ステップSt6-3)。
【0055】
音量比較補正部16は、ステップSt6-3で平滑化した音A信号及び音B信号の各音量の出力値を、表示バー(図3A図3C参照)の最小値を0(ゼロ)かつ最大値をX(X:0≦X≦1となる定数)に結び付けて視覚的かつ対比的に表示するための表示用のデータ信号(図3A図3C参照)を生成する(ステップSt6-4)。例えばX=0.5とした場合、音量比較補正部16は、音量の出力値が0.5以上となる値を最大値とする表示用のデータ信号(最大の個数の表示バー)を生成する。一方、例えばX=0.5とした場合、音量比較補正部16は、音量の出力値が0.4となる個数の表示バーを生成する。ユーザSP1は、入力音信号のうち自分が発話した分の発話音声が最大であるかどうかではなく、リモート通話の通話相手に十分自分の発話音声が伝わる音量であるかどうかを知ることができればよい。このため、音量比較補正部16は、目安値となるX(上述参照)を導入することにより、表示バーの分解能を最大限に活かすことができる。
【0056】
次に、図8を参照して、図4のステップSt7のパラメータの算出処理の詳細な動作手順例を説明する。図8に示す各処理は、主にプロセッサPRC1(図2参照)の制御部17によって実行される。
【0057】
図8において、制御部17は、特定の第2条件(「B≧bY?」)を満たすか否か、つまり図4のステップSt4で解析された音B信号の音量がメモリ11に事前登録されている一定値(第2閾値の一例)以上であるか否かを判定する(ステップSt7-1)。この一定値は、例えばリモート通話中に通話相手(つまり、ユーザSP2、SP3、SP4)が話者であるユーザSP1の発話音声の聞き取りに支障が生じる程度のノイズ音の音量(レベル)を示す。制御部17は、音B信号の音量が一定値(第2閾値の一例)以上であると判定した場合(ステップSt7-1、YES)、カウンタcをインクリメント(つまり、カウンタcを所定値iだけ加算する処理)する(ステップSt7-2)。これにより、カウンタc←c+iとなる。所定値iは定数値であり、例えば2である。
【0058】
一方、制御部17は、音B信号の音量が一定値(第2閾値の一例)未満であると判定した場合(ステップSt7-1、NO)、カウンタcをデクリメント(つまり、カウンタcを所定値iだけ減算する処理)する(ステップSt7-3)。これにより、カウンタc←c-iとなる。
【0059】
制御部17は、ステップSt7-2或いはステップSt7-3の後、その時点のカウンタcの値がメモリ11に事前登録されている一定値Z以上であるか否かを判定する(ステップSt7-4)。カウンタcの値が一定値Z未満であると判定された場合には(ステップSt7-4、NO)、図8の制御部17の処理は終了する。つまり、制御部17は、音B信号の音量が一定値bY以上となる期間が一定期間続かないようであれば、ステップSt7-5のメッセージ表示処理を行うことなく、図8の処理を終了する。
【0060】
一方、制御部17は、カウンタcの値が一定値Z以上であると判定した場合には(ステップSt7-4、YES)、所定のメッセージ(例えば「ノイズ発生により支障が出ています」)をディスプレイDP1に表示するメッセージ表示処理を実行する(ステップSt7-5)。これにより、制御部17は、音B信号の音量が一定値bY以上となる期間が一定期間続いているので、ステップSt7-5のメッセージ表示処理を行うことによりリモート通話の話者であるユーザSP1に周囲のノイズ音が発生している状況を注意喚起して知らせたり、その状況の改善を促すことができたりする。
【0061】
以上により、実施の形態1に係る通話システム100では、音処理装置10は、収音デバイス(例えばヘッドセットHS1)により収音された入力音信号をノイズ音信号と非ノイズ音信号とに分離し、非ノイズ音信号の音量を解析し、ノイズ音信号の音量を解析する。音処理装置10は、非ノイズ音信号の音量の解析結果である第1解析結果とノイズ音信号の音量の解析結果である第2解析結果とをディスプレイDP1に視覚的かつ対比的に表示する。これにより、音処理装置10は、リモート通話の話者であるユーザSP1による特定の処理実行中(例えば通話中)に混入した、ユーザSP1の周囲のノイズ音がどの程度存在しているかを明示的に報知できる。したがって、ユーザSP1は、自ら発話している環境下で周囲のノイズ音がリモート通話の継続の支障になっているか否かを簡易かつ定量的に把握することができ、その状況の改善(例えばノイズ音源の低減或いは移動)を行えたり、通話相手に対して自らの周囲状況の連絡を行えたりできる。
【0062】
<実施の形態2>
実施の形態2では、本開示に係るノイズ解析装置の一実施態様として、話者がドア開閉許否を判定するために話者の発話音声を用いて認証する声紋認証システムを例示する(図9参照)。なお、実施の形態2の説明において、実施の形態1の構成及び動作と同一の構成及び動作については同一の符号を付与して説明を簡略化或いは省略し、異なる内容について説明する。
【0063】
まず、図9を参照して、実施の形態2に係る声紋認証システム100Aのシステム構成例について説明する。図9は、実施の形態2に係る声紋認証システム100Aのシステム構成例を示す図である。声紋認証システム100Aは、ネットワークNW1を介して相互にデータ通信可能に接続された音処理装置10Aを少なくとも含む。音処理装置10Aには表示用のディスプレイDP1が接続されている。音処理装置10Aには、話者であるユーザSP1の発話音声を収音する収音デバイスMC1(図10参照)が設けられている。
【0064】
ドア開閉用制御装置DRC1は、ネットワークNW1と接続されており、店舗或いは施設等の所定位置に取り付けられている少なくとも1つのドアDR1の開閉を声紋認証サーバ50からの処理結果に基づいて制御する。具体的には、ドア開閉用制御装置DRC1は、声紋認証サーバ50から声紋認証の成功の旨の情報を取得した場合にはドアDR1を開ける制御を行う。一方、ドア開閉用制御装置DRC1は、声紋認証サーバ50から声紋認証の失敗の旨の情報を取得した場合にはドアDR1を開けないで閉じたままに維持する制御を行う。
【0065】
声紋認証サーバ50は、ネットワークNW1と接続されており、音処理装置10Aから送られたユーザSP1の発話音声信号を受信すると、その発話音声信号と所定の声紋認証データベース(図示略)とを用いてその発話音声信号に対応する音声がユーザSP1の音声であるか否かを声紋認証する。声紋認証サーバ50は、声紋認証として、例えば音処理装置10Aから送られた発話音声信号に含まれる音声の特徴量と、声紋認証データベースに事前登録されているユーザSP1の音声の特徴量とが同一であると判定した場合にのみ、声紋認証が成功した旨の情報をドア開閉用制御装置DRC1及び音処理装置10Aのうち少なくとも1つに返送する。また、声紋認証サーバ50は、声紋認証として、例えば音処理装置10Aから送られた発話音声信号に含まれる音声の特徴量と、声紋認証データベースに事前登録されているユーザSP1の音声の特徴量とが非類似であると判定した場合、声紋認証が失敗した旨の情報をドア開閉用制御装置DRC1及び音処理装置10Aのうち少なくとも1つに返送する。
【0066】
次に、図10を参照して、図9の音処理装置10Aのハードウェア構成例について説明する。図10は、図9の音処理装置のハードウェア構成例を示すブロック図である。音処理装置10Aは、汎用的なコンピュータ装置であり、例えばパーソナルコンピュータ、スマートフォン、タブレット端末、或いは、サーバコンピュータであってよい。音処理装置10Aは、収音デバイスMC1と、プロセッサPRC1Aと、メモリ11と、をハードウェア構成として少なくとも含む。なお、音処理装置10Aは、ユーザSP1の操作を受け付けるマウス等の入力デバイスも更に含む構成としてよい。また、ディスプレイDP1は、音処理装置10Aの一部として含まれても構わない。
【0067】
収音デバイスMC1は、例えば周知のマイクロホンであり、ユーザSP1の発話音声を収音してプロセッサPRC1Aに送る。この発話音声の信号(入力音信号)は、音分析部13及び声紋認証部18Aのそれぞれに入力される。
【0068】
ここで、プロセッサPRC1Aが機能的に実行する処理の実行主体の構成例を詳述する。プロセッサPRC1Aは、音分析部13と、音A音量解析部14と、音B音量解析部15と、音量比較補正部16と、制御部17Aと、声紋認証部18Aと、認証制御部19Aと、を機能的に備える。
【0069】
制御部17Aは、音量比較補正部16から入力した第2解析結果が特定の第3条件を満たすか否かを判定する(図8参照)。制御部17は、第2解析結果が特定の第3条件を満たすと判定した場合に、ユーザSP1の発話音声に相当する音A信号を声紋認証に使用しない旨の情報を生成するか、或いは音A信号の音量(レベル)をゼロに変換する処理を行う。制御部17Aは、ユーザSP1の発話音声に相当する音A信号を声紋認証に使用しない旨の情報を声紋認証部18Aに送る、或いは、音A信号の音量(レベル)をゼロに変換する処理後の音A信号を声紋認証部18Aに送る。制御部17Aは、制御部17Aの処理の詳細については、図11を参照して後述する。
【0070】
声紋認証部18Aは、制御部17Aから音A信号を声紋認証に使用しない旨の情報或いは音量(レベル)のゼロへの変換後の音A信号を取得した場合、音A信号を用いた声紋認証をしないと判定する。一方、声紋認証部18Aは、制御部17Aから音A信号を声紋認証に使用しない旨の情報或いは音量(レベル)のゼロへの変換後の音A信号を取得しない場合には、収音デバイスMC1からの入力音信号を声紋認証用の信号として認証制御部19Aに送る。
【0071】
認証制御部19Aは、声紋認証部18Aからの信号をユーザSP1の声紋認証用の発話音声信号としてネットワークNW1を介して声紋認証サーバ50に送る。認証制御部19Aは、声紋認証サーバ50から声紋認証が成功した旨の情報を受信した場合には、その旨をディスプレイDP1に表示する。なお、認証制御部19Aは、声紋認証サーバ50から声紋認証が成功した旨の情報を受信した場合には、ドアDR1を開くようにドア開閉用制御装置DRC1に送ってもよい。一方で、認証制御部19Aは、声紋認証サーバ50から声紋認証が失敗した旨の情報を受信した場合には、その旨をディスプレイDP1に表示する。
【0072】
実施の形態2において、音処理装置10Aは、実施の形態1に係る音処理装置10の動作手順に対応する図4図5図6A図6B図7の各処理を実行するのに加え、図11の処理も実行する。ここで、図11を参照して、図4のステップSt7のパラメータの算出処理の他の詳細な動作手順例を説明する。図11は、実施の形態2に係る図4のステップSt7の声紋認証用のパラメータ算出の詳細な動作手順例を時系列に示すフローチャートである。図11に示す各処理は、主にプロセッサPRC1(図2参照)の制御部17Aによって実行される。
【0073】
図11において、制御部17Aは、特定の第3条件(「B≧bZ?」)を満たすか否か、つまり図4のステップSt4で解析された音B信号の音量がメモリ11に事前登録されている一定値(第3閾値の一例)以上であるか否かを判定する(ステップSt7-11)。この一定値は、例えば話者であるユーザSP1の発話音声が声紋認証処理を実行する際に認証の成否に影響を与える程度のノイズ音の音量(レベル)を示す。制御部17Aは、音B信号の音量が一定値(第3閾値の一例)以上であると判定した場合(ステップSt7-11、YES)、声紋認証を行わない旨の情報を生成する、或いは声紋認証用の音A信号の音量(レベル)をゼロに変換する(ステップSt7-12)。つまり、制御部17Aは、音B信号の音量が一定値bZ以上となっていれば、その状況は声紋認証に適さないため、声紋認証に適さない音A信号を生成するか或いは声紋認証を実行しないこととし、図11の処理を終了する。
【0074】
一方、音B信号の音量が一定値(第2閾値の一例)未満であると判定された場合(ステップSt7-11、NO)、図11の制御部17Aの処理は終了する。つまり、この状況では声紋認証を行うのに適する環境であると想定されるので、制御部17Aは、収音デバイスMC1からの入力音信号(言い換えると、音A信号)を声紋認証に使用する旨を声紋認証部18Aに指示する。これにより、図11の処理を終了する。
【0075】
以上により、実施の形態2に係る声紋認証システム100Aでは、音処理装置10Aは、収音デバイスMC1により収音された入力音信号をノイズ音信号と非ノイズ音信号とに分離し、非ノイズ音信号の音量を解析し、ノイズ音信号の音量を解析する。音処理装置10Aは、非ノイズ音信号の音量の解析結果である第1解析結果とノイズ音信号の音量の解析結果である第2解析結果とをディスプレイDP1に視覚的かつ対比的に表示する。また、音処理装置10Aは、ノイズ音信号の音量が一定値よりも大きい場合には、声紋認証の処理に適さない環境であると想定されるので声紋認証の実行を中止する。これにより、音処理装置10Aは、声紋認証の対象者であるユーザSP1による特定の処理実行中(例えば声紋認証のための通話中)に混入した、ユーザSP1の周囲のノイズ音がどの程度存在しているかを明示的に報知できる。したがって、ユーザSP1は、自ら発話している環境下で周囲のノイズ音が声紋認証の実行の支障になっているか否かを簡易かつ定量的に把握することができ、その状況の改善(例えばノイズ音源の低減或いは移動)を行えたり、声紋認証を静かな環境下の中で適正に行えたりすることが可能となる。
【0076】
<実施の形態1の変形例1>
実施の形態1の変形例1では、本開示に係るノイズ解析装置の一実施態様として、複数人がネットワークを介してデータ通信可能に接続された音処理装置とヘッドセットとをそれぞれ用いて行うリモート通話を支援する通話システムを例示し(図12参照)、音処理装置がノイズ音を積極的に除去する例を説明する。なお、実施の形態1の変形例1の説明において、実施の形態1の構成及び動作と同一の構成及び動作については同一の符号を付与して説明を簡略化或いは省略し、異なる内容について説明する。
【0077】
実施の形態1の変形例1に係る通話システムの構成例は図1に示す実施の形態1に係る通話システム100と同一である。
【0078】
次に、図12を参照して、実施の形態1の変形例1に係る通話システムの音処理装置10Bのハードウェア構成例について説明する。図12は、実施の形態1の変形例1に係る音処理装置10Bのハードウェア構成例を示すブロック図である。音処理装置10Bは、汎用的なコンピュータ装置であり、例えばパーソナルコンピュータ、スマートフォン、タブレット端末、或いは、サーバコンピュータであってよい。音処理装置10Bは、プロセッサPRC1Bと、メモリ11と、をハードウェア構成として少なくとも含む。なお、音処理装置10Bは、ユーザSP1の操作を受け付けるマウス等の入力デバイスも更に含む構成としてよい。
【0079】
ここで、プロセッサPRC1Bが機能的に実行する処理の実行主体の構成例を詳述する。プロセッサPRC1Bは、音信号入力IF12と、ノイズ除去部13Bと、ノイズ除去後音音量解析部14Bと、除去音音量解析部15Bと、音量比較補正部16と、制御部17と、信号処理部18と、送信部19と、を機能的に備える。
【0080】
ノイズ除去部13Bは、音信号入力IF12からの入力音信号に含まれるノイズ音を除去する処理を行うことにより、入力音信号を少なくとも2種類の音信号(具体的には、音Aと音B)に分離し、ノイズ除去後音信号(非ノイズ音信号の一例)をノイズ除去後音音量解析部14Bに送り、ノイズ音信号(ノイズ音信号の一例)を除去音音量解析部15Bに送る。実施の形態1の変形例1において、音Aとは、入力音信号に含まれる音の中でユーザSP1が発話した発話音声の部分の音を示し、ノイズ除去部13Bによりノイズ音が除去された入力音信号を示す。つまり、音Aは、リモート通話の話者であるユーザSP1が発話したことによって通話相手であるユーザSP2、SP3、SP4に送り届けられると想定される通話音声の音を示す。一方、音Bとは、入力音信号に含まれる音の中でユーザSP1が発話した発話音声以外のノイズ音を示し、ノイズ除去部13Bにより除去されるノイズ音を示す。つまり、音Bは、ユーザSP2、SP3、SP4に送り届けられる音Aに混じる不要なノイズ音であって、ユーザSP2、SP3、SP4がユーザSP1の発話音声を聞き取る際の支障となり得る音である。
【0081】
ノイズ除去後音音量解析部14Bは、第1解析部の一例であり、ノイズ除去部13Bからのノイズ除去後音信号を入力し、その入力されたノイズ除去後音信号の音量を解析する。ノイズ除去後音音量解析部14Bは、例えばノイズ除去後音信号の波形の平均パワー、最大振幅、或いは、特定の周波数帯におけるパワーを参照してノイズ除去後音信号の音量を解析する。また、ノイズ除去後音音量解析部14Bは、入力された音A信号の波形を時間方向に平滑化した上で、音A信号の波形の平均パワー、最大振幅、或いは、特定の周波数帯におけるパワーを参照して音A信号の音量を解析してもよい。ノイズ除去後音音量解析部14Bは、音A信号の音量の解析結果(第1解析結果)を音量比較補正部16に送る。
【0082】
除去音音量解析部15Bは、第2解析部の一例であり、ノイズ除去部13Bからの音B信号を入力し、その入力された音B信号の音量を解析する。除去音音量解析部15Bは、例えば音B信号の波形の平均パワー、最大振幅、或いは、特定の周波数帯におけるパワーを参照して音B信号の音量を解析する。また、除去音音量解析部15Bは、入力された音B信号の波形を時間方向に平滑化した上で、音B信号の波形の平均パワー、最大振幅、或いは、特定の周波数帯におけるパワーを参照して音B信号の音量を解析してもよい。除去音音量解析部15Bは、音B信号の音量の解析結果(第2解析結果)を音量比較補正部16に送る。
【0083】
次に、図13図6A図8を参照して、実施の形態1の変形例1に係る音処理装置10Bの動作手順例について説明する。図13は、実施の形態1の変形例1に係る音処理装置10Bの動作手順例を時系列に示すフローチャートである。図6A図8のそれぞれに示す各処理は実施の形態1において説明したので、ここでは説明を割愛する。
【0084】
図13を参照して、実施の形態1の変形例1に係る音処理装置10Bの全体的な動作手順例を説明する。図13に示す各処理は、主にプロセッサPRC1(図2参照)によって実行される。
【0085】
図13において、プロセッサPRC1Bは、ヘッドセットHS1から入力されてくる入力音信号を音信号入力IF12において一定期間分保持する(ステップSt1)。一定期間は、例えば1秒、5秒、10秒等である。プロセッサPRC1Bは、ステップSt1で保持した一定期間分の入力音信号を用いて、その入力音信号に含まれるノイズ音を除去するためのノイズ音除去処理を施し、入力音信号をノイズ除去部13Bにおいて音A信号と音B信号とに分離して出力する(ステップSt11)。
【0086】
プロセッサPRC1Bは、ステップSt11で得られた音A信号を用いて、音A信号の音量をノイズ除去後音音量解析部14Bにおいて解析する(ステップSt3B)。プロセッサPRC1Bは、ステップSt11で得られた音B信号を用いて、音B信号の音量を除去音音量解析部15Bにおいて解析する(ステップSt4B)。プロセッサPRC1Bは、ステップSt3Bでの解析により得られた音A信号の音量の解析結果(第1解析結果)とステップSt4Bでの解析により得られた音B信号の音量の解析結果(第2解析結果)とを音量比較補正部16において入力して比較する(ステップSt5)。ステップSt5の音量比較補正処理の詳細な動作手順例については、図6A及び図6Bのそれぞれを参照して説明したのでここでは説明を割愛する。
【0087】
プロセッサPRC1Bは、ステップSt3Bでの解析により得られた音A信号の音量の解析結果(第1解析結果)或いはステップSt5での補正後の出力と、ステップSt4Bでの解析により得られた音B信号の音量の解析結果(第2解析結果)或いはステップSt5での補正後の出力とを用いて、音量表示処理(図7参照)を行うことにより、音A信号及び音B信号のそれぞれの音量を視覚的かつ対比的に表示するための表示用のデータ信号を生成する(ステップSt6)。ステップSt6の音量表示処理の詳細な動作手順例については、図7を参照して説明したのでここでは説明を割愛する。
【0088】
プロセッサPRC1Bは、ステップSt6の音量表示処理の後、ステップSt4Bでの解析により得られた音B信号の音量の解析結果(第2解析結果)を用いて、信号処理用のパラメータの算出処理を行う(ステップSt7)。ステップSt7の算出処理の詳細な動作手順例については、図8を参照して説明したのでここでは説明を割愛する。
【0089】
ステップSt7の後、ユーザSP1の入力操作によりリモート通話の終了が指示された場合には(ステップSt8、YES)、図13に示すプロセッサPRC1Bの処理は終了する。一方、ユーザSP1の入力操作によりリモート通話の終了が指示されていない場合には(ステップSt8、NO)、プロセッサPRC1Bの処理はステップSt1に戻る。つまり、ユーザSP1の入力操作によりリモート通話の終了が指示されるまで、プロセッサPRC1Bは、ステップSt1~ステップSt8までの一連の処理を繰り返し実行する。
【0090】
以上により、実施の形態1の変形例1に係る通話システム100では、音処理装置10Bは、収音デバイス(例えばヘッドセットHS1)により収音された入力音信号をノイズ音除去処理によってノイズ音信号と非ノイズ音信号とに分離し、非ノイズ音信号の音量を解析し、ノイズ音信号の音量を解析する。音処理装置10Bは、非ノイズ音信号の音量の解析結果である第1解析結果とノイズ音信号の音量の解析結果である第2解析結果とをディスプレイDP1に視覚的かつ対比的に表示する。これにより、音処理装置10Bは、リモート通話の話者であるユーザSP1による特定の処理実行中(例えば通話中)に混入した、ユーザSP1の周囲のノイズ音がどの程度存在しているかを明示的に報知できる。したがって、ユーザSP1は、自ら発話している環境下で周囲のノイズ音がリモート通話の継続の支障になっているか否かを簡易かつ定量的に把握することができ、その状況の改善(例えばノイズ音源の低減或いは移動)を行えたり、通話相手に対して自らの周囲状況の連絡を行えたりできる。
【0091】
<実施の形態1の変形例2>
実施の形態1の変形例2では、本開示に係るノイズ解析装置の一実施態様として、複数人がネットワークを介してデータ通信可能に接続された音処理装置とヘッドセットとをそれぞれ用いて行うリモート通話を支援する通話システムを例示し(図14参照)、音処理装置が入力音信号における有音区間及び無音区間を区別可能に分離する例を説明する。なお、実施の形態1の変形例2の説明において、実施の形態1の構成及び動作と同一の構成及び動作については同一の符号を付与して説明を簡略化或いは省略し、異なる内容について説明する。
【0092】
実施の形態1の変形例2に係る通話システムの構成例は図1に示す実施の形態1に係る通話システム100と同一である。
【0093】
次に、図14を参照して、実施の形態1の変形例2に係る通話システムの音処理装置10Cのハードウェア構成例について説明する。図14は、実施の形態1の変形例2に係る音処理装置10Cのハードウェア構成例を示すブロック図である。音処理装置10Cは、汎用的なコンピュータ装置であり、例えばパーソナルコンピュータ、スマートフォン、タブレット端末、或いは、サーバコンピュータであってよい。音処理装置10Cは、プロセッサPRC1Cと、メモリ11と、をハードウェア構成として少なくとも含む。なお、音処理装置10Cは、ユーザSP1の操作を受け付けるマウス等の入力デバイスも更に含む構成としてよい。
【0094】
ここで、プロセッサPRC1Cが機能的に実行する処理の実行主体の構成例を詳述する。プロセッサPRC1Cは、音信号入力IF12と、VAD処理部Vaと、無音区間音量解析部Vbと、音分析部13と、音A音量解析部14と、音B音量解析部15と、音量比較補正部16と、制御部17と、信号処理部18と、送信部19と、を機能的に備える。
【0095】
VAD処理部Vaは、音信号入力IF12からの入力音信号を有音区間と無音区間とに区別可能に分離する。ここでいう有音区間とは、話者であるユーザSP1が発話した時の発話音声が出現する区間である。無音区間とは、突発的に生じた音量(レベル)の大きなノイズ音とは異なり定常的に発生しているホワイトノイズ等の定常雑音が出現する或いは出現している区間である。VAD処理部Vaは、入力音信号に含まれる有音区間の信号を音A信号及び音B信号を含む信号として音分析部13に送り、入力音信号に含まれる無音区間の信号を無音区間音量解析部Vbに送る。
【0096】
無音区間音量解析部Vbは、第3解析部の一例であり、VAD処理部Vaからの無音区間の入力音信号(無音区間信号)を入力し、その入力された無音区間信号の音量を解析する。無音区間音量解析部Vbは、例えば無音区間信号の波形の平均パワー、最大振幅、或いは、特定の周波数帯におけるパワーを参照して無音区間信号の音量を解析する。また、無音区間音量解析部Vbは、入力された無音区間信号の波形を時間方向に平滑化した上で、無音区間信号の波形の平均パワー、最大振幅、或いは、特定の周波数帯におけるパワーを参照して無音区間信号の音量を解析してもよい。無音区間音量解析部Vbは、無音区間信号の音量の解析結果(第3解析結果)を音量比較補正部16に送る。
【0097】
次に、図15図6A図8を参照して、実施の形態1の変形例2に係る音処理装置10Cの動作手順例について説明する。図15は、実施の形態1の変形例2に係る音処理装置10Cの動作手順例を時系列に示すフローチャートである。図6A図8のそれぞれに示す各処理は実施の形態1において説明したので、ここでは説明を割愛する。
【0098】
図15を参照して、実施の形態1の変形例2に係る音処理装置10Cの全体的な動作手順例を説明する。図15に示す各処理は、主にプロセッサPRC1(図2参照)によって実行される。
【0099】
図15において、プロセッサPRC1Cは、ヘッドセットHS1から入力されてくる入力音信号を音信号入力IF12において一定期間分保持する(ステップSt1)。一定期間は、例えば1秒、5秒、10秒等である。プロセッサPRC1Cは、ステップSt1で保持した一定期間分の入力音信号を用いて、その入力音信号を有音区間と無音区間とに分離する(ステップSt21)。プロセッサPRC1Cは、入力音信号に無音区間が存在したと判定した場合には(ステップSt21、NO)、その無音区間の入力音信号である無音区間信号の音量を解析する(ステップSt22)。この無音区間信号の音量の解析結果はステップSt5において参照、使用される。
【0100】
一方、プロセッサPRC1Cは、入力音信号に有音区間が存在したと判定した場合には(ステップSt21、YES)、その有音区間の入力音信号である有音区間信号を用いて、その有音区間信号に音分析を施し、有音区間信号を音分析部13において音A信号と音B信号とに分離して出力する(ステップSt2)。ステップSt2の音分析の詳細な動作手順例については、図5を参照して説明したのでここでは割愛する。
【0101】
プロセッサPRC1Cは、ステップSt2で得られた音A信号を用いて、音A信号の音量を音A音量解析部14において解析する(ステップSt3)。プロセッサPRC1Cは、ステップSt2で得られた音B信号を用いて、音B信号の音量を音B音量解析部15において解析する(ステップSt4)。プロセッサPRC1Cは、ステップSt3での解析により得られた音A信号の音量の解析結果(第1解析結果)とステップSt4での解析により得られた音B信号の音量の解析結果(第2解析結果)とを音量比較補正部16において入力して比較する(ステップSt5)。ステップSt5の音量比較補正処理の詳細な動作手順例については、図6A及び図6Bのそれぞれを参照して説明したのでここでは説明を割愛する。なお、音量比較補正処理は、ステップSt4で得られた第2解析結果だけでなく、ステップSt22で得られた無音区間信号の音量解析結果(第3解析結果)も加味(例えば加算)した上で実行されてよい。
【0102】
プロセッサPRC1Cは、ステップSt3での解析により得られた音A信号の音量の解析結果(第1解析結果)或いはステップSt5での補正後の出力と、ステップSt4での解析により得られた音B信号の音量の解析結果(第2解析結果)或いはステップSt5での補正後の出力とを用いて、音量表示処理(図7参照)を行うことにより、音A信号及び音B信号のそれぞれの音量を視覚的かつ対比的に表示するための表示用のデータ信号を生成する(ステップSt6)。ステップSt6の音量表示処理の詳細な動作手順例については、図7を参照して説明したのでここでは説明を割愛する。
【0103】
プロセッサPRC1Cは、ステップSt6の音量表示処理の後、ステップSt4での解析により得られた音B信号の音量の解析結果(第2解析結果)を用いて、信号処理用のパラメータの算出処理を行う(ステップSt7)。ステップSt7の算出処理の詳細な動作手順例については、図8を参照して説明したのでここでは説明を割愛する。
【0104】
ステップSt7の後、ユーザSP1の入力操作によりリモート通話の終了が指示された場合には(ステップSt8、YES)、図15に示すプロセッサPRC1Cの処理は終了する。一方、ユーザSP1の入力操作によりリモート通話の終了が指示されていない場合には(ステップSt8、NO)、プロセッサPRC1Cの処理はステップSt1に戻る。つまり、ユーザSP1の入力操作によりリモート通話の終了が指示されるまで、プロセッサPRC1Cは、ステップSt1~ステップSt8までの一連の処理を繰り返し実行する。
【0105】
以上により、実施の形態1の変形例2に係る通話システム100では、音処理装置10Cは、収音デバイス(例えばヘッドセットHS1)により収音された入力音信号をVAD処理によってまず有音区間信号と無音区間信号とに分離し、その上で有音区間信号をノイズ音信号と非ノイズ音信号とに分離し、非ノイズ音信号の音量を解析し、ノイズ音信号の音量を解析し、無音区間信号の音量を解析する。音処理装置10Cは、非ノイズ音信号の音量の解析結果である第1解析結果と、ノイズ音信号の音量の解析結果である第2解析結果及び無音区間信号の音量の解析結果である第3解析結果の加算結果とをディスプレイDP1に視覚的かつ対比的に表示する。これにより、音処理装置10Cは、リモート通話の話者であるユーザSP1による特定の処理実行中(例えば通話中)に混入した、ユーザSP1の周囲のノイズ音が定常雑音なり突発的ノイズ音なりでどの程度存在しているかを明示的に報知できる。したがって、ユーザSP1は、自ら発話している環境下で周囲のノイズ音がリモート通話の継続の支障になっているか否かを簡易かつ定量的に把握することができ、その状況の改善(例えばノイズ音源の低減或いは移動)を行えたり、通話相手に対して自らの周囲状況の連絡を行えたりできる。
【0106】
<本開示の技術について>
以上説明したように、本開示には以下に示す技術思想が開示されている。
【0107】
<技術1>
収音デバイス(ヘッドセットHS1、収音デバイスMC1)により収音された入力音信号をノイズ音信号と非ノイズ音信号とに分離する音分析部(音分析部13)と、
前記非ノイズ音信号の音量を解析する第1解析部(音A音量解析部14)と、
前記ノイズ音信号の音量を解析する第2解析部(音B音量解析部15)と、
前記非ノイズ音信号の音量の解析結果である第1解析結果と、前記ノイズ音信号の音量の解析結果である第2解析結果とをディスプレイ(ディスプレイDP1)に視覚的かつ対比的に表示する表示制御部(音量比較補正部16)と、を備える、
ノイズ解析装置。
これにより、ノイズ解析装置は、リモート通話の話者であるユーザによる特定の処理実行中(例えば通話中)に混入した、ユーザの周囲のノイズ音がどの程度存在しているかを明示的に報知できる。
【0108】
<技術2>
前記入力音信号は、ユーザが前記収音デバイスを装着して発話した時の通話音声信号と、前記発話時に発生しているノイズ音信号とを含む、
技術1に記載のノイズ解析装置。
これにより、ノイズ解析装置は、ユーザのリモート通話等のシーンにおいて、ユーザがヘッドセットHS1等の収音デバイスを装着して発話した時の通話音量信号と、その周囲で発生しているノイズ音信号とのそれぞれでどの程度の音量が発生しているかを視覚的かつ対比的に提示できる。
【0109】
<技術3>
前記第1解析結果と前記第2解析結果とを比較する比較部(音量比較補正部16)、を更に備え、
前記比較部は、前記第2解析結果の示す前記ノイズ音信号の音量が前記第1解析結果の示す前記非ノイズ音信号の音量と所定係数値(例えばk、k=1、k=0.5)との積以上である場合に、前記非ノイズ音信号の音量を前記第1解析結果より小さく補正する、
技術1又は技術2に記載のノイズ解析装置。
これにより、ノイズ解析装置は、周囲のノイズ音がユーザの発話音声である目的音と同等かそれ以上であるため、リモート通話の通話相手にとって目的音が聞こえにくい状況であることをユーザに正確に理解させることができる。
【0110】
<技術4>
前記第1解析結果と前記第2解析結果とを比較する比較部(音量比較補正部16)、を更に備え、
前記比較部は、前記第1解析結果の示す前記非ノイズ音信号の音量が第1閾値以上であってかつ直前に解析された前記第2解析結果の示すノイズ音信号の音量が前記第1閾値以上である場合に、前記非ノイズ音信号の音量を前記第1解析結果より小さく補正する、
技術1~3のうちいずれか一項に記載のノイズ解析装置。
これにより、ノイズ解析装置は、度々起き得る瞬間的な音A、音Bの出力間違いをユーザに知らせないようにすることができる。
【0111】
<技術5>
前記表示制御部は、前記第1解析結果及び前記第2解析結果のそれぞれを所定範囲内の値に正規化処理する、
技術1~4のうちいずれか一項に記載のノイズ解析装置。
これにより、ノイズ解析装置は、音A信号、音B信号のそれぞれが所定範囲内の値で表示することができ、連続的な表示の実現を可能にできる。
【0112】
<技術6>
前記表示制御部は、前記正規化処理の結果としてゼロを最小値、X(X:0≦X≦1)以上を最大値として表示する、
技術5に記載のノイズ解析装置。
これにより、ノイズ解析装置は、リモート通話の通話相手に十分自分の発話音声が伝わる音量であるかどうかをユーザに知らせることができ、目安値となるXを導入することにより、表示バーの分解能を最大限に活かすことができる。
【0113】
<技術7>
前記第2解析結果の示す前記ノイズ音信号の音量が第2閾値以上となる期間が一定期間以上となるか否かを判定する制御部(制御部17)、を更に備え、
前記制御部は、前記ノイズ音信号の音量が前記第2閾値以上となる期間が前記一定期間以上となると判定した場合に、ノイズ音の発生を知らせる旨のメッセージを前記ディスプレイに表示する、
技術1~6のうちいずれか一項に記載のノイズ解析装置。
これにより、ノイズ解析装置は、リモート通話の話者であるユーザに周囲のノイズ音が発生している状況を注意喚起して知らせたり、その状況の改善を促すことができたりする。
【0114】
<技術8>
前記入力音信号における有音区間と前記入力音信号における定常雑音区間(無音区間)とを区別可能に判定する判定部(VAD処理部Va)と、
前記定常雑音区間における定常雑音信号の音量を解析する第3解析部(無音区間音量解析部Vb)と、を更に備え、
前記表示制御部は、前記非ノイズ音信号の音量の解析結果である第1解析結果と、前記ノイズ音信号の音量の解析結果である第2解析結果と前記定常雑音信号の音量の解析結果である第3解析結果との加算結果とを前記ディスプレイに視覚的かつ対比的に表示する、
技術1~7のうちいずれか一項に記載のノイズ解析装置。
これにより、ノイズ解析装置は、リモート通話の話者であるユーザによる特定の処理実行中(例えば通話中)に混入した、ユーザの周囲のノイズ音が定常雑音なり突発的ノイズ音なりでどの程度存在しているかを明示的に報知できる。
【0115】
<技術9>
前記入力音信号は、ユーザが声紋認証用に前記収音デバイスに向かって発話した時の発話音声信号と、前記発話時に発生しているノイズ音信号とを含む、
技術1~8のうちいずれか一項に記載のノイズ解析装置。
これにより、ノイズ解析装置は、声紋認証の対象者であるユーザSP1による特定の処理実行中(例えば声紋認証のための通話中)に混入した、ユーザSP1の周囲のノイズ音がどの程度存在しているかを明示的に報知できる。
【0116】
<技術10>
前記第2解析結果が示す前記ノイズ音信号の音量が第3閾値以上となるか否かを判定する制御部(制御部17A)、を更に備え、
前記制御部は、前記ノイズ音信号の音量が前記第3閾値以上となると判定した場合に、前記声紋認証の処理を中断する又は前記声紋認証用の前記発話音声信号のレベルをゼロに変換する、
技術9に記載のノイズ解析装置。
これにより、ノイズ解析装置は、現在の状況が声紋認証に適さないことを判定できるため、無駄に声紋認証を実行することを抑制できる。
【0117】
<技術11>
ノイズ解析装置により実行されるノイズ解析方法であって、
収音デバイスにより収音された入力音信号をノイズ音信号と非ノイズ音信号とに分離するステップと、
前記非ノイズ音信号の音量を解析するステップと、
前記ノイズ音信号の音量を解析するステップと、
前記非ノイズ音信号の音量の解析結果である第1解析結果と、前記ノイズ音信号の音量の解析結果である第2解析結果とをディスプレイに視覚的かつ対比的に表示するステップと、を有する、
ノイズ解析方法。
これにより、ノイズ解析装置は、リモート通話の話者であるユーザによる特定の処理実行中(例えば通話中)に混入した、ユーザの周囲のノイズ音がどの程度存在しているかを明示的に報知できる。
【0118】
<技術12>
コンピュータであるノイズ解析装置に、
収音デバイスにより収音された入力音信号をノイズ音信号と非ノイズ音信号とに分離するステップと、
前記非ノイズ音信号の音量を解析するステップと、
前記ノイズ音信号の音量を解析するステップと、
前記非ノイズ音信号の音量の解析結果である第1解析結果と、前記ノイズ音信号の音量の解析結果である第2解析結果とをディスプレイに視覚的かつ対比的に表示するステップと、を実現させるための、
プログラム。
これにより、ノイズ解析装置は、リモート通話の話者であるユーザによる特定の処理実行中(例えば通話中)に混入した、ユーザの周囲のノイズ音がどの程度存在しているかを明示的に報知できる。
【0119】
以上、添付図面を参照しながら各種の実施の形態について説明したが、本開示はかかる例に限定されない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例、修正例、置換例、付加例、削除例、均等例に想到し得ることは明らかであり、それらについても本開示の技術的範囲に属すると了解される。また、発明の趣旨を逸脱しない範囲において、上述した各種の実施の形態における各構成要素を任意に組み合わせてもよい。
【産業上の利用可能性】
【0120】
本開示は、ユーザによる特定の処理実行中に混入したノイズがどの程度存在しているかを明示的に報知するノイズ解析装置、ノイズ解析方法及びプログラムとして有用である。
【符号の説明】
【0121】
10 音処理装置
10A 音処理装置
11 メモリ
12 音信号入力IF
13 音分析部
13B ノイズ除去部
14 音A音量解析部
14B ノイズ除去後音音量解析部
15 音B音量解析部
15B 除去音音量解析部
16 音量比較補正部
17、17A 制御部
18 信号処理部
19 送信部
50 声紋認証サーバ
100 通話システム
100A 声紋認証システム
DP1 ディスプレイ
MC1 収音デバイス
NW1 ネットワーク
PRC1、PRC1A、PRC1B、PRC1C プロセッサ
SP1、SP2、SP3、SP4 ユーザ
Va VAD処理部
Vb 無音区間音量解析部
図1
図2
図3A
図3B
図3C
図4
図5
図6A
図6B
図7
図8
図9
図10
図11
図12
図13
図14
図15