IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ シャープ株式会社の特許一覧

<>
  • 特開-音声処理システム及び音声処理方法 図1
  • 特開-音声処理システム及び音声処理方法 図2
  • 特開-音声処理システム及び音声処理方法 図3
  • 特開-音声処理システム及び音声処理方法 図4
  • 特開-音声処理システム及び音声処理方法 図5
  • 特開-音声処理システム及び音声処理方法 図6
  • 特開-音声処理システム及び音声処理方法 図7
  • 特開-音声処理システム及び音声処理方法 図8
  • 特開-音声処理システム及び音声処理方法 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022181437
(43)【公開日】2022-12-08
(54)【発明の名称】音声処理システム及び音声処理方法
(51)【国際特許分類】
   G10L 21/0264 20130101AFI20221201BHJP
   G10L 17/00 20130101ALI20221201BHJP
【FI】
G10L21/0264 Z
G10L17/00 200Z
【審査請求】未請求
【請求項の数】16
【出願形態】OL
(21)【出願番号】P 2021088380
(22)【出願日】2021-05-26
(71)【出願人】
【識別番号】000005049
【氏名又は名称】シャープ株式会社
(74)【代理人】
【識別番号】100167302
【弁理士】
【氏名又は名称】種村 一幸
(74)【代理人】
【識別番号】100135817
【弁理士】
【氏名又は名称】華山 浩伸
(72)【発明者】
【氏名】杉森 文亮
(72)【発明者】
【氏名】西尾 達也
(57)【要約】
【課題】ユーザーに装着されるウェアラブル型のマイクスピーカー装置の利便性を向上させることが可能な音声処理システム及び音声処理方法を提供する。
【解決手段】音声処理システムは、マイクスピーカー装置に搭載されたマイクにより集音される音声データを取得する第1取得処理部と、前記マイクスピーカー装置に搭載された認証情報取得部により取得される、当該マイクスピーカー装置を装着した装着者の認証情報を取得する第2取得処理部と、前記第2取得処理部により取得される前記認証情報に基づいて、前記第1取得処理部により取得される前記音声データに関する所定の処理を実行する制御処理部と、を備える。
【選択図】図1
【特許請求の範囲】
【請求項1】
ユーザーに装着されるウェアラブル型のマイクスピーカー装置を介して当該ユーザーの発話音声の音声データを送受信する音声処理システムであって、
前記マイクスピーカー装置に搭載されたマイクにより集音される前記音声データを取得する第1取得処理部と、
前記マイクスピーカー装置に搭載された認証情報取得部により取得される、当該マイクスピーカー装置を装着した装着者の認証情報を取得する第2取得処理部と、
前記第2取得処理部により取得される前記認証情報に基づいて、前記第1取得処理部により取得される前記音声データに関する所定の処理を実行する制御処理部と、
を備える音声処理システム。
【請求項2】
前記第2取得処理部により取得される前記認証情報に基づいて、前記装着者を識別する識別処理部をさらに備え、
前記制御処理部は、前記第1取得処理部により取得される前記音声データの発話音声が、前記識別処理部により識別される前記装着者の発話音声と一致する場合に、当該音声データを出力する、
請求項1に記載の音声処理システム。
【請求項3】
前記制御処理部は、前記第1取得処理部により取得される前記音声データの発話音声が、前記識別処理部により識別される前記装着者の発話音声と一致しない場合に、当該音声データを破棄する、
請求項2に記載の音声処理システム。
【請求項4】
前記認証情報取得部は、前記装着者の指紋を読み取る読取部であり、
前記第2取得処理部は、前記装着者の指紋情報を取得する、
請求項1から請求項3のいずれか1項に記載の音声処理システム。
【請求項5】
前記認証情報取得部は、前記装着者の顔の少なくとも一部を撮像する撮像部であり、
前記第2取得処理部は、前記装着者の顔の少なくとも一部の顔画像を取得する、
請求項1から請求項3のいずれか1項に記載の音声処理システム。
【請求項6】
前記撮像部は、前記装着者の耳及び口の少なくともいずれかを撮像する、
請求項5に記載の音声処理システム。
【請求項7】
前記マイクスピーカー装置は、本体が上面視で環状の構造を有するとともに装着者から見て前方側に開口部を有し、当該開口部側に前記マイクを有し、当該マイクよりも装着者の後方側にスピーカーを有し、
前記認証情報取得部は、前記マイクスピーカー装置において、前記マイクと前記スピーカーとの間、かつ前記本体に配置されている、
請求項4から請求項6のいずれか1項に記載の音声処理システム。
【請求項8】
前記認証情報取得部は、前記装着者の発話音声を集音する前記マイクであり、
前記第2取得処理部は、前記装着者の発話音声を取得する、
請求項1から請求項3のいずれか1項に記載の音声処理システム。
【請求項9】
前記第2取得処理部により取得される前記認証情報に基づいて、前記装着者を識別する識別処理部をさらに備え、
前記識別処理部は、ユーザーごとに当該ユーザーの識別情報と当該ユーザーの音声情報と当該ユーザーの認証情報とを関連付けて記憶する記憶部を参照して、前記第2取得処理部により取得される前記認証情報に関連付けられた前記識別情報により前記装着者を識別する、
請求項1から請求項8のいずれか1項に記載の音声処理システム。
【請求項10】
前記第2取得処理部が前記記憶部に記憶されていない装着者の前記認証情報を取得した場合に、当該認証情報と、前記第1取得処理部が受信した当該装着者の前記音声データの前記音声情報と、当該装着者の識別情報とを関連付けて前記記憶部に記憶する、
請求項9に記載の音声処理システム。
【請求項11】
前記第2取得処理部により取得される前記認証情報に基づいて、前記装着者を識別する識別処理部をさらに備え、
前記第1取得処理部により取得される前記音声データの発話音声が、前記識別処理部により識別される前記装着者の発話音声と一致するか否かを判定する判定処理部をさらに備える、
請求項1から請求項10のいずれか1項に記載の音声処理システム。
【請求項12】
前記第2取得処理部により取得される前記認証情報に基づいて、前記装着者を識別する識別処理部をさらに備え、
前記マイクスピーカー装置は、スピーカーの音量及び前記マイクのゲインのそれぞれの設定値を記憶しており、
前記スピーカーの音量及び前記マイクのゲインのそれぞれの設定値を、前記識別処理部により識別される前記装着者に対応する設定値に設定する設定処理部をさらに備える、
請求項1から請求項11のいずれか1項に記載の音声処理システム。
【請求項13】
前記マイクスピーカー装置は、前記マイクが集音する音声データを録音する機能を備え、
前記設定処理部は、前記第1取得処理部により取得される前記音声データの発話音声が、前記識別処理部により識別される前記装着者の発話音声と一致しない場合に、前記マイクのゲインを、前記発話音声が前記装着者の発話音声と一致する場合に設定されるゲインよりも高い設定値に設定する、
請求項12に記載の音声処理システム。
【請求項14】
前記マイクスピーカー装置は、前記第1取得処理部と、前記第2取得処理部と、前記第2取得処理部により取得される前記認証情報に基づいて前記装着者を識別する識別処理部と、前記制御処理部とを備える、
請求項1から請求項13のいずれか1項に記載の音声処理システム。
【請求項15】
前記マイクスピーカー装置は、ネックバンド型の形状を有する、
請求項1から請求項14のいずれか1項に記載の音声処理システム。
【請求項16】
ユーザーに装着されるウェアラブル型のマイクスピーカー装置を介して当該ユーザーの発話音声の音声データを送受信する音声処理方法であって、
一又は複数のプロセッサーが、
前記マイクスピーカー装置に搭載されたマイクにより集音される前記音声データを取得する第1取得ステップと、
前記マイクスピーカー装置に搭載された認証情報取得部により取得される、当該マイクスピーカー装置を装着した装着者の認証情報を取得する第2取得ステップと、
前記第2取得ステップにおいて取得される前記認証情報に基づいて、前記第1取得ステップにおいて取得される前記音声データに関する所定の処理を実行する制御ステップと、
を実行する音声処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、マイクスピーカー装置の音声の送受信を行う音声処理システム及び音声処理方法に関する。
【背景技術】
【0002】
従来、ユーザーの発話音声の音声データを送受信することが可能な音声処理システムが知られている。
【0003】
例えば特許文献1には、入力された音声情報に対し、識別処理が容易となるような前段処理を行い、前記前段処理された音声情報に所定の加工を施し、第1の情報に基づいてタスク処理を行い、前記タスク処理の評価が十分でない場合に前記第1の情報を修正し、前記評価が十分になるまで一連の処理を繰り返すことで最適化するシステムが開示されている。
【0004】
また特許文献2には、入力された音声信号を送信可能な信号へ変換して送信を行う送信部と、特定者の音声情報を記憶する外部記憶媒体と、入力された音声信号と前記外部記憶媒体に記憶された音声情報を用いて入力が特定者からであるか否かを検出する話者認識部と、前記話者認識部による検出結果に基づき前記送信部による送信出力を制御する主CPUとを備えるシステムが開示されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2020-42292号公報
【特許文献2】特開2000-101690号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
ところで、マイク及びスピーカーを備え、ユーザーの首周りに装着可能なウェアラブル型のマイクスピーカー装置が知られている。このマイクスピーカー装置は、装着者の発話音声を取得して他のマイクスピーカー装置に送信したり、他のマイクスピーカー装置から受信した音声を当該装着者に向けて出力したりすることができる。ここで、前記マイクスピーカー装置は、装着者の近くにいる他のユーザーの発話音声などの周囲の雑音を取得した場合に、当該雑音の音声を他のマイクスピーカー装置に送信してしまう場合がある。このため、他のユーザーが不快に感じたり、前記マイクスピーカー装置を利用した会話がスムーズに行われなかったりするなど、マイクスピーカー装置の利便性が低下する問題が生じる。
【0007】
本発明の目的は、ユーザーに装着されるウェアラブル型のマイクスピーカー装置の利便性を向上させることが可能な音声処理システム及び音声処理方法を提供することにある。
【課題を解決するための手段】
【0008】
本発明の一の態様に係る音声処理システムは、ユーザーに装着されるウェアラブル型のマイクスピーカー装置を介して当該ユーザーの発話音声の音声データを送受信する音声処理システムであって、前記マイクスピーカー装置に搭載されたマイクにより集音される前記音声データを取得する第1取得処理部と、前記マイクスピーカー装置に搭載された認証情報取得部により取得される、当該マイクスピーカー装置を装着した装着者の認証情報を取得する第2取得処理部と、前記第2取得処理部により取得される前記認証情報に基づいて、前記第1取得処理部により取得される前記音声データに関する所定の処理を実行する制御処理部と、を備えるシステムである。
【0009】
本発明の他の態様に係る音声処理方法は、ユーザーに装着されるウェアラブル型のマイクスピーカー装置を介して当該ユーザーの発話音声の音声データを送受信する音声処理方法であって、一又は複数のプロセッサーが、前記マイクスピーカー装置に搭載されたマイクにより集音される前記音声データを取得する第1取得ステップと、前記マイクスピーカー装置に搭載された認証情報取得部により取得される、当該マイクスピーカー装置を装着した装着者の認証情報を取得する第2取得ステップと、前記第2取得ステップにおいて取得される前記認証情報に基づいて、前記第1取得ステップにおいて取得される前記音声データに関する所定の処理を実行する制御ステップと、を実行する方法である。
【発明の効果】
【0010】
本発明によれば、ユーザーに装着されるウェアラブル型のマイクスピーカー装置の利便性を向上させることが可能である。
【図面の簡単な説明】
【0011】
図1図1は、本発明の実施形態に係る会議システムの構成を示す図である。
図2図2は、本発明の実施形態に係る会議システムの適用例を示す図である。
図3図3は、本発明の実施形態に係るマイクスピーカー装置の構成を示す外観図である。
図4図4は、本発明の実施形態に係る会議システムで利用される会議情報の一例を示す図である。
図5図5は、本発明の実施形態に係る会議システムで利用されるユーザー情報の一例を示す図である。
図6図6は、本発明の実施形態に係る会議システムで利用される設定情報の一例を示す図である。
図7図7は、本発明の実施形態に係る会議システムにおける音声データの出力例を示す図である。
図8図8は、本発明の実施形態に係る会議システムにおいて実行される会議支援処理の手順の一例を説明するためのフローチャートである。
図9図9は、本発明の実施形態に係るマイクスピーカー装置の他の構成を示す外観図である。
【発明を実施するための形態】
【0012】
以下、添付図面を参照しながら、本発明の実施形態について説明する。なお、以下の実施形態は、本発明を具体化した一例であって、本発明の技術的範囲を限定する性格を有さない。
【0013】
本発明に係る音声処理システムは、例えば2つの拠点(例えば会議室R1,R2)において複数のユーザーがそれぞれマイクスピーカー装置を使用して会議(オンライン会議など)を行うケースに適用することができる。前記マイクスピーカー装置は、例えばネックバンド型の形状を有し、各ユーザーは、前記マイクスピーカー装置を自身の首に装着して前記会議に参加する。各ユーザーは、前記マイクスピーカー装置のスピーカーから出力される音声を聞き取ることができ、また自身が発話した音声を前記マイクスピーカー装置のマイクに集音させて他の前記マイクスピーカー装置に送信させることができる。なお、本発明に係る音声処理システムは、1つの拠点において複数のユーザーがそれぞれマイクスピーカー装置を使用して会議を行うケースにも適用することができる。また本発明に係る音声処理システムは、一人のユーザーがマイクスピーカー装置を使用して自身の音声を認識させたり、自身の発話内容を他の言語に翻訳させたりするケースにも適用することができる。以下では、本発明に係る音声処理システムの一例として、会議システムの実施形態について説明する。
【0014】
[会議システム100]
図1は、本発明の実施形態に係る会議システムの構成を示す図である。会議システム100は、音声処理装置1と複数のマイクスピーカー装置2と会議サーバー3とを含んでいる。マイクスピーカー装置2は、マイク24及びスピーカー25を搭載する音響機器である。なお、マイクスピーカー装置2は、例えばAIスピーカー、スマートスピーカなどの機能を備えてもよい。会議システム100は、複数のユーザーのそれぞれが自身に装着するウェアラブル型のマイクスピーカー装置2を複数含み、複数のマイクスピーカー装置2の間でユーザーの発話音声の音声データを送受信するシステムである。会議システム100は、本発明の音声処理システムの一例である。
【0015】
会議サーバー3は、前記オンライン会議を実現する会議アプリケーションを実行する。また、会議サーバー3は、会議情報D1を管理する。音声処理装置1は、各マイクスピーカー装置2を制御して、会議が開始されると各マイクスピーカー装置2との間で音声を送受信する処理を実行する。なお、マイクスピーカー装置2単体が本発明の音声処理システムを構成してもよいし、音声処理装置1単体が本発明の音声処理システムを構成してもよい。
【0016】
本実施形態では、図2に示すオンライン会議を例に挙げて説明する。オンライン会議の参加者であるユーザーA~DのうちユーザーA,Bは会議室R1に位置しており、ユーザーC,Dは会議室R2に位置している。ユーザーA~Dは、それぞれマイクスピーカー装置2A~2Dを首に装着して会議に参加する。また、会議室R1には音声処理装置1a及びディスプレイDP1が設置されており、会議室R2には音声処理装置1b及びディスプレイDP2が設置されている。ディスプレイDP1,DP2は、それぞれの画面が共有されており、例えば会議資料を表示する。音声処理装置1a及びディスプレイDP1と、音声処理装置1b及びディスプレイDP2とは、通信網N1(例えばインターネット)に接続された会議サーバー3を介してデータ通信可能に構成されている。音声処理装置1a,1bは、同一の機能を有する情報処理装置(例えばパーソナルコンピューター)である。以下では、音声処理装置1a,1bにおいて共通の説明する場合は、「音声処理装置1」と称す。
【0017】
また、本実施形態では、会議室R1に、会議に参加しないユーザーE,Fが含まれているものとする。ユーザーE,Fは、マイクスピーカー装置2を所持していない。
【0018】
会議サーバー3は、通信網N1に接続されており、会議室R1,R2の音声データをマイクスピーカー装置2及び音声処理装置1a,1bを介して送受信する。例えば音声処理装置1aは、ユーザーAの発話音声の音声データをマイクスピーカー装置2Aから取得すると、当該音声データを会議サーバー3に送信する。会議サーバー3は、音声処理装置1aから取得した前記音声データを音声処理装置1a,1bに送信する。音声処理装置1aは、会議サーバー3から取得した前記音声データをユーザーBのマイクスピーカー装置2Bに送信してユーザーAの発話音声を出力(放音)させる。同様に、音声処理装置1bは、会議サーバー3から取得した前記音声データをユーザーC,Dのマイクスピーカー装置2C,2Dのそれぞれに送信してユーザーAの発話音声を出力(放音)させる。また、会議サーバー3は、ユーザーの操作を受け付けて会議資料などをディスプレイDP1,DP2に表示させる。このようにして、会議サーバー3は、オンライン会議を実現する。
【0019】
また、会議サーバー3には、オンライン会議に関する会議情報D1などのデータが記憶される。図4には、会議情報D1の一例を示している。図4に示すように、会議情報D1には、会議ごとに、会議の識別情報(会議ID)、会議の開催場所、会議の開始日時及び終了日時、会議の参加者、会議に使用する資料の各情報が含まれる。会議ID「M001」には、図2に示すオンライン会議に対応する情報が登録されている。例えば前記オンライン会議の主催者は、自身の端末(パーソナルコンピューター)を使用して会議情報D1を事前に登録する。会議サーバー3は、クラウドサーバーで構成されてもよい。
【0020】
[マイクスピーカー装置2]
図3には、マイクスピーカー装置2の外観の一例を示している。図1及び図3に示すように、マイクスピーカー装置2は、制御部21、記憶部22、指紋センサー23、マイク24、スピーカー25、通信部26、電源27、接続ボタン28などを備える。マイクスピーカー装置2は、例えばユーザーの首に装着可能なネックバンド型のウェアラブル機器である。マイクスピーカー装置2は、ユーザーの音声をマイク24を介して取得したり、当該ユーザーに対してスピーカー25から音声を出力したりする。マイクスピーカー装置2は、各種情報を表示する表示部を備えてもよい。
【0021】
図3に示すように、マイクスピーカー装置2の本体29は、上面視で環状の構造を有するとともに装着者から見て前方側に開口部291を有している。換言すれば、マイクスピーカー装置2は、マイクスピーカー装置2を装着したユーザーから見て左右のアームを備え、U字状に形成されている。
【0022】
マイク24は、ユーザーの発話音声を集音し易いように、マイクスピーカー装置2の先端側に配置されている。マイク24は、マイクスピーカー装置2に内蔵されたマイク用基板(不図示)に接続されている。マイク24は、左右のアームの一方側に設けられてもよいし、左右のアームの両方に設けられてもよい。
【0023】
スピーカー25には、マイクスピーカー装置2を装着したユーザーから見て左側のアームに配置されるスピーカー25Lと右側のアームに配置されるスピーカー25Rとが含まれる。スピーカー25L,25Rは、ユーザーが出力音を聞き取り易いように、マイクスピーカー装置2のアームの中央付近に配置されている。スピーカー25L,25Rは、マイクスピーカー装置2に内蔵されたスピーカー用基板(不図示)に接続されている。
【0024】
前記マイク用基板は、音声データを音声処理装置1に送信するためのトランスミッター基板であり、前記通信部に含まれる。また、前記スピーカー用基板は、音声処理装置1から音声データを受信するためのレシーバー基板であり、前記通信部に含まれる。
【0025】
指紋センサー23は、マイクスピーカー装置2の装着者の指紋を読み取るセンサーである。指紋センサー23は、例えば図3に示すように、マイクスピーカー装置2において、マイク24とスピーカー25(例えばスピーカー25L)との間に配置されていることが好ましく、さらに、本体29の内側に配置されていることが好ましい。また、指紋センサー23は、マイク24よりも先端側に配置されてもよいし、本体29の上側又は外側に配置されてもよい。このように、指紋センサー23は、装着者がマイクスピーカー装置2のアームを握り易い位置に配置されている。このため、ユーザーは、指紋を読み取らせる際に指紋センサー23の位置を直感的に把握することができるため認証処理を迅速に行うことができる。また指紋センサー23を本体29の内側に配置することにより、ユーザーは親指を指紋センサー23にタッチし易くなるため親指の指紋を容易に読み取らせることができる。また、指紋センサー23は、ユーザーが配置位置を指で確認し易い形状(例えば、凹凸形状、指の形状など)に形成されていることが好ましい。これにより、ユーザーは指紋センサー23の位置を指の感覚により容易に把握することができる。指紋センサー23は、本発明の認証情報取得部の一例である。また、指紋情報は、本発明の認証情報の一例である。なお、本発明の認証情報取得部は、カメラで構成され、カメラが指紋を撮像してもよい。指紋センサー23は、読み取った指紋情報を制御部21に送信する。制御部21は、前記指紋情報に基づいて認証処理を実行して認証結果を通知する。
【0026】
通信部26は、マイクスピーカー装置2を無線で音声処理装置1との間で所定の通信プロトコルに従ったデータ通信を実行するための通信インターフェースである。具体的には、通信部26は、例えばBluetooth方式(Bluetooth;登録商標)によりマイクスピーカー装置2と接続して通信を行う。例えば、ユーザーが電源27をオン状態にした後に接続ボタン28を押下すると、通信部26は、ペアリング処理を実行してマイクスピーカー装置2を音声処理装置1に接続する。なお、マイクスピーカー装置2と音声処理装置1との間に送信機が配置され、当該送信機がマイクスピーカー装置2とペアリング(Bluetooth接続)し、当該送信機と音声処理装置1とがインターネットを介して接続されてもよい。
【0027】
記憶部22は、各種の情報を記憶するHDD(Hard Disk Drive)又はSSD(Solid State Drive)などの不揮発性の記憶部である。具体的には、記憶部22には、マイクスピーカー装置2を使用するユーザーのユーザー情報D2などのデータが記憶される。
【0028】
図5には、ユーザー情報D2の一例を示している。図5に示すように、ユーザー情報D2には、ユーザーごとに、「ユーザーID」、「音声情報」、「指紋情報」などの情報が含まれる。前記ユーザーIDは、ユーザーの識別情報である。前記音声情報は、ユーザーを識別可能な声の特徴を示す情報(例えば声紋情報)である。前記指紋情報は、ユーザーを識別可能な指紋の情報である。前記音声情報及び前記指紋情報は、本発明の認証情報の一例である。
【0029】
例えば、各ユーザーは、マイクスピーカー装置2を使用する前に、マイクスピーカー装置2において、自身の声と指紋とを登録する操作を行う。具体的には、ユーザーは、マイクスピーカー装置2のユーザー登録ボタン(不図示)を押した後、所定のワード又は任意のワードを一定時間発話する。これにより、制御部21は、ユーザーの発話音声から声の特徴の音声情報を取得する。続いて、制御部21が指紋の登録を促すアナウンスを流すと、ユーザーは、指紋センサー23に指をタッチする。これにより、制御部21は、ユーザーの指紋情報を取得する。制御部21は、取得した音声情報及び指紋情報と、任意に設定したユーザーIDとを互いに関連付けてユーザー情報D2に登録する。
【0030】
各ユーザーが前記登録操作を行うことにより、マイクスピーカー装置2の記憶部22には、予め複数のユーザーのユーザー情報D2が登録される。また、マイクスピーカー装置2ごとにユーザーが前記登録操作を行ってユーザー情報D2をそれぞれの記憶部22に登録してもよいし、ユーザー情報D2のデータが、複数のマイクスピーカー装置2のそれぞれに転送されてそれぞれの記憶部22に記憶されてもよい。
【0031】
また、記憶部22には、制御部21に後述の会議支援処理(図8参照)を実行させるための会議支援プログラムなどの制御プログラムが記憶されている。例えば、前記会議支援プログラムは、CD又はDVDなどのコンピュータ読取可能な記録媒体に非一時的に記録され、マイクスピーカー装置2が備えるCDドライブ又はDVDドライブなどの読取装置(不図示)で読み取られて記憶部22に記憶されてもよい。
【0032】
制御部21は、CPU、ROM、及びRAMなどの制御機器を有する。前記CPUは、各種の演算処理を実行するプロセッサーである。前記ROMは、前記CPUに各種の演算処理を実行させるためのBIOS及びOSなどの制御プログラムが予め記憶される不揮発性の記憶部である。前記RAMは、各種の情報を記憶する揮発性又は不揮発性の記憶部であり、前記CPUが実行する各種の処理の一時記憶メモリー(作業領域)として使用される。そして、制御部21は、前記ROM又は記憶部22に予め記憶された各種の制御プログラムを前記CPUで実行することによりマイクスピーカー装置2を制御する。
【0033】
ところで、マイクスピーカー装置2は、装着者の近くにいる他のユーザーの発話音声などの周囲の雑音を取得した場合に、当該雑音の音声を他のマイクスピーカー装置2に送信してしまう場合がある。このため、他のユーザーが不快に感じたり、マイクスピーカー装置2を利用した会話がスムーズに行われなかったりするなど、マイクスピーカー装置2の利便性が低下する問題が生じる。これに対して、本実施形態に係るマイクスピーカー装置2によれば、以下に示すように、マイクスピーカー装置2の利便性を向上させることが可能である。
【0034】
具体的には、制御部21は、図1に示すように、設定処理部211、第1取得処理部212、第2取得処理部213、識別処理部214、判定処理部215、出力処理部216などの各種の処理部を含む。なお、制御部21は、前記CPUで前記制御プログラムに従った各種の処理を実行することによって前記各種の処理部として機能する。また、一部又は全部の前記処理部が電子回路で構成されていてもよい。なお、前記制御プログラムは、複数のプロセッサーを前記処理部として機能させるためのプログラムであってもよい。
【0035】
設定処理部211は、マイクスピーカー装置2に関する設定を行う。具体的には、設定処理部211は、マイクスピーカー装置2が音声処理装置1に接続(ペアリング)されると、ユーザーの操作に応じて、音量及びマイクゲインを設定する。設定処理部211は、本発明の設定処理部の一例である。
【0036】
他の実施形態として、設定処理部211は、ユーザーの認証情報に基づいて、音量、マイクゲイン、イコライザーなどを自動的に設定してもよい。この場合、例えば記憶部22に、設定情報D3が記憶されてもよい。図6には、設定情報D3の一例を示している。
【0037】
図6に示すように、設定情報D3には、ユーザーごとに、「ユーザーID」、「音量情報」、「ゲイン情報」、「イコライザー情報」などの情報が含まれる。前記ユーザーIDは、ユーザーの識別情報である。前記音量情報は、スピーカー25から出力される音の音量(ボリューム)を示す設定値の情報である。前記ゲイン情報は、マイク24のゲインを示す設定値の情報である。前記イコライザー情報は、音声信号の周波数特性に関する情報である。
【0038】
例えば、各ユーザーは、マイクスピーカー装置2において、前記音声情報及び前記指紋情報を登録した後、自身の好みの音量とマイクゲインと周波数特性とを登録する操作を行う。具体的には、ユーザーは、マイクスピーカー装置2のユーザー登録ボタン(不図示)を押して、マイクスピーカー装置2に設けられている操作スイッチを操作して好みの音量、マイクゲイン、及び周波数特性を調整する。制御部21は、前記音量、前記マイクゲイン、及び周波数特性の設定値を取得すると、指紋情報に関連付けられた前記ユーザーIDを関連付けて設定情報D3に登録する。なお、制御部21は、前記音声情報及び前記指紋情報に関連付けられたユーザーID(図5参照)を、設定情報D3(図6参照)のユーザーIDに対応付けて登録する。
【0039】
設定処理部211は、マイクスピーカー装置2が音声処理装置1に接続(ペアリング)され、ユーザーの指紋又は音声を取得すると、当該指紋又は音声に関連付けられたユーザーID(図5参照)に基づいて、設定情報D3を参照して当該ユーザーに対応する音量、マイクゲイン、及び周波数特性を設定する。
【0040】
第1取得処理部212は、マイクスピーカー装置2に搭載されたマイク24により集音される音声データを取得する。例えば会議室R1において、ユーザーAのマイクスピーカー装置2の第1取得処理部212は、マイク24が集音したユーザーAの発話音声の音声データを取得する。また、会議室R1においてユーザーE,Fが会話している場合に、ユーザーAのマイクスピーカー装置2の第1取得処理部212は、マイク24が集音したユーザーE,Fの発話音声の音声データを取得する。このように、第1取得処理部212は、マイク24の集音範囲に含まれるユーザーの発話音声又は他の音源が発する音を取得する。第1取得処理部212は、本発明の第1取得処理部の一例である。
【0041】
第2取得処理部213は、マイクスピーカー装置2に搭載された指紋センサー23により取得される、マイクスピーカー装置2を装着した装着者の認証情報(指紋情報)を取得する。例えば、ユーザーAは、マイクスピーカー装置2を装着して音声処理装置1に接続(ペアリング)させた後に指紋センサー23に指をタッチする。指紋センサー23がユーザーAの指紋を読み取ると、第2取得処理部213がユーザーAの指紋情報Faを取得する。第2取得処理部213は、本発明の第2取得処理部の一例である。
【0042】
識別処理部214は、第2取得処理部213により取得される指紋情報に基づいて、マイクスピーカー装置2の装着者を識別(認証)する。具体的には、識別処理部214は、ユーザーごとに当該ユーザーの識別情報(ユーザーID)と当該ユーザーの音声情報と当該ユーザーの指紋情報とを関連付けて記憶するユーザー情報D2(図5参照)を参照して、第2取得処理部213により取得される指紋情報に関連付けられたユーザーIDにより装着者を識別する。識別処理部214は、本発明の識別処理部の一例である。
【0043】
例えば、ユーザーAがマイクスピーカー装置2Aを装着して指紋センサー23に指をタッチした場合、当該マイクスピーカー装置2Aの識別処理部214は、指紋センサー23からユーザーAの指紋情報Faを取得する。識別処理部214は、ユーザー情報D2(図5参照)を参照して、指紋情報Faに関連付けられたユーザーID「0001」を特定(識別)する。なお、ユーザーID「0001」は、ユーザーAに対応する。
【0044】
また例えば、ユーザーBがマイクスピーカー装置2Bを装着して指紋センサー23に指をタッチした場合、当該マイクスピーカー装置B2の識別処理部214は、指紋センサー23からユーザーBの指紋情報Fbを取得する。識別処理部214は、ユーザー情報D2(図5参照)を参照して、指紋情報Fbに関連付けられたユーザーID「0002」を特定(識別)する。なお、ユーザーID「0002」は、ユーザーBに対応する。
【0045】
ここで、第2取得処理部213が取得した指紋情報がユーザー情報D2(図2参照)に登録されていない場合、識別処理部214は装着者を識別することができない。この場合、制御部21は、第2取得処理部213が取得した指紋情報をユーザー情報D2に登録する処理を実行する。また制御部21は、前記指紋情報の登録に加えて、ユーザーの音声情報の登録処理を実行する。これにより、マイクスピーカー装置2において事前にユーザー情報D2を登録していないユーザーがマイクスピーカー装置2を装着して使用する場合には、ユーザーはその時点で登録操作を行って前記音声情報及び前記指紋情報を登録することができる。
【0046】
判定処理部215は、第1取得処理部212により取得される音声データの発話音声が、識別処理部214により識別される装着者の発話音声と一致するか否かを判定する。例えば、識別処理部214が装着者の指紋情報からユーザーID「0001」を特定した場合に、判定処理部215は、第1取得処理部212が取得した装着者の音声データの音声情報が、当該ユーザーID「0001」に関連付けられた音声情報Vaと一致するか否かを判定する。判定処理部215は、本発明の判定処理部の一例である。
【0047】
なお、判定処理部215は、周知の音声認識技術により前記判定処理(声認証)を実行する。例えば、判定処理部215は、隠れマルコフモデル、パターンマッチング、ニューラルネットワーク、決定木などの技術を用いて前記声認証を実行する。
【0048】
また、判定処理部215は、前記音声認識の学習済みモデルを利用して前記声認証を実行してもよい。前記学習済みモデルは、例えばマイクスピーカー装置2で生成されて記憶部22に記憶されてもよい。例えばマイクスピーカー装置2の制御部21は、各ユーザーの音声情報を学習用データとして機械学習を行うことにより前記学習済みモデルを生成する。また、制御部21は、マイクスピーカー装置2を装着したユーザーが正面を向いて発話した音声情報、左側を向いて発話した音声情報、右側を向いて発話した音声情報を学習用データとして機械学習を行うことにより前記学習済みモデルを生成してもよい。
【0049】
他の実施形態として、前記学習済みモデルは、例えば音声処理装置1又はクラウドサーバーで生成されてマイクスピーカー装置2に記憶されてもよい。例えばクラウドサーバーは、各ユーザーの音声情報をマイクスピーカー装置2を介して取得し、当該音声情報を学習用データとして機械学習を行うことにより前記学習済みモデルを生成する。クラウドサーバーは、生成した学習済みモデルをマイクスピーカー装置2に送信する。
【0050】
出力処理部216は、判定処理部215の判定結果に基づいて、第1取得処理部212により取得される音声データの出力可否を決定する。具体的には、出力処理部216は、第1取得処理部212により取得される音声データの発話音声が、識別処理部214により識別される装着者の発話音声と一致する場合に当該音声データを出力する。一方、出力処理部216は、第1取得処理部212により取得される音声データの発話音声が、識別処理部214により識別される装着者の発話音声と一致しない場合に当該音声データを出力しない。また、この場合、出力処理部216は、前記音声データを破棄してもよい。出力処理部216は、本発明の制御処理部の一例である。
【0051】
上記の例では、識別処理部214が装着者の指紋情報FaからユーザーID「0001」を特定した場合に、第1取得処理部212が取得した装着者の音声データの音声情報が、当該ユーザーID「0001」に関連付けられた音声情報Vaと一致する場合に、出力処理部216は、当該音声データを音声処理装置1aに出力する。また例えば、識別処理部214が装着者の指紋情報FaからユーザーID「0001」を特定した場合に、第1取得処理部212が取得した装着者の音声データの音声情報が、当該ユーザーID「0001」に関連付けられた音声情報Vaと一致しない場合に、出力処理部216は、当該音声データを音声処理装置1aに出力しない。
【0052】
このように、制御部21は、マイク24を介して取得した発話音声の音声情報(音声の特徴)が、指紋情報により識別された装着者に対応する音声情報に一致する場合にのみ当該発話音声の音声データを音声処理装置1aに出力する。すなわち、制御部21は、音声のフィルタ処理を実行する。このため、例えば図7に示すように、ユーザーAがマイクスピーカー装置2Aを装着している場合において、マイクスピーカー装置2Aが、ユーザーAの発話音声V1と、ユーザーBの発話音声V2と、ユーザーEの発話音声V3と、ユーザーFの発話音声V4とを取得した場合に、マイクスピーカー装置2Aは、装着者であるユーザーAの発話音声V1の音声データのみを音声処理装置1aに出力し、他のユーザーB,E,Fの発話音声V2,V3,V4の音声データをカットする。この場合、音声処理装置1aは発話音声V1の音声データを取得すると当該音声データを会議サーバー3に送信し、会議サーバー3は当該音声データを取得すると当該音声データを会議室R2の音声処理装置1bに送信する。音声処理装置1bは、会議サーバー3から前記音声データを取得するとマイクスピーカー装置2C,2Dに送信し、マイクスピーカー装置2C,2Dは、当該音声データを取得するとスピーカー25から当該音声データに対応するユーザーAの発話音声V1を出力する。これにより、会議室R2のユーザーC,Dは、会議室R1の他のユーザーB,E,Fの発話内容が耳に入ることなく、ユーザーAの発話内容のみをクリアに聞き取ることができる。
【0053】
[音声処理装置1]
図1に示すように、音声処理装置1は、制御部11、記憶部12、操作表示部13、通信部14などを備える情報処理装置である。なお、音声処理装置1は、1台のコンピュータに限らず、複数台のコンピュータが協働して動作するコンピュータシステムであってもよい。音声処理装置1は、パーソナルコンピューター、スマートフォンなどであってもよい。
【0054】
通信部14は、音声処理装置1を有線又は無線で通信網N2に接続し、通信網N2を介してマイクスピーカー装置2、ディスプレイDP1,DP2などの外部機器との間で所定の通信プロトコルに従ったデータ通信を実行するための通信部である。例えば、通信部14は、Bluetooth方式によるペアリング処理を実行して、マイクスピーカー装置2と接続する。また、通信部14は、オンライン会議を行う場合に、通信網N1(例えばインターネット)に接続して複数拠点(会議室R1,R2)間のデータ通信を行う。
【0055】
操作表示部13は、各種の情報を表示する液晶ディスプレイ又は有機ELディスプレイのような表示部と、操作を受け付けるマウス、キーボード、又はタッチパネルのような操作部とを備えるユーザーインターフェースである。
【0056】
記憶部12は、各種の情報を記憶するHDD(Hard Disk Drive)又はSSD(Solid State Drive)などの不揮発性の記憶部である。また、記憶部12には、制御部11に後述の会議支援処理(図8参照)を実行させるための会議支援プログラムなどの制御プログラムが記憶されている。例えば、前記会議支援プログラムは、CD又はDVDなどのコンピュータ読取可能な記録媒体に非一時的に記録され、音声処理装置1が備えるCDドライブ又はDVDドライブなどの読取装置(不図示)で読み取られて記憶部12に記憶されてもよい。
【0057】
制御部11は、CPU、ROM、及びRAMなどの制御機器を有する。前記CPUは、各種の演算処理を実行するプロセッサーである。前記ROMは、前記CPUに各種の演算処理を実行させるためのBIOS及びOSなどの制御プログラムが予め記憶される不揮発性の記憶部である。前記RAMは、各種の情報を記憶する揮発性又は不揮発性の記憶部であり、前記CPUが実行する各種の処理の一時記憶メモリー(作業領域)として使用される。そして、制御部11は、前記ROM又は記憶部12に予め記憶された各種の制御プログラムを前記CPUで実行することにより音声処理装置1を制御する。
【0058】
例えば、会議室R1に設置された音声処理装置1aの制御部11は、会議室R1のマイクスピーカー装置2との接続(ペアリング)を確立し、マイクスピーカー装置2との間で音声データの送受信を行う。同様に、会議室R2に設置された音声処理装置1bの制御部11は、会議室R2のマイクスピーカー装置2との接続(ペアリング)を確立し、マイクスピーカー装置2との間で音声データの送受信を行う。また、音声処理装置1aの制御部11は、前記音声データを取得すると会議サーバー3に送信し、音声処理装置1bの制御部11は、前記音声データを取得すると会議サーバー3に送信する。
【0059】
他の実施形態として、音声処理装置1の記憶部12に、ユーザー情報D2(図5参照)及び設定情報D3(図6参照)が記憶されてもよい。また、音声処理装置1の制御部11は、マイクスピーカー装置2に含まれる識別処理部214及び判定処理部215(図1参照)の機能を備えてもよい。この場合、制御部11は、マイクスピーカー装置2から認証情報(指紋情報)を取得して装着者を識別し、マイクスピーカー装置2から取得した音声データの発話音声が、識別した前記装着者の発話音声であるか否かを判定してもよい。
【0060】
[会議支援処理]
以下、図8を参照しつつ、マイクスピーカー装置2の制御部21によって実行される会議支援処理の手順の一例について説明する。なお、本発明は、前記会議支援処理に含まれる一又は複数のステップを実行する会議支援方法(本発明の音声処理方法)の発明として捉えることができる。また、ここで説明する前記会議支援処理に含まれる一又は複数のステップが適宜省略されてもよい。また、前記会議支援処理における各ステップは、同様の作用効果を生じる範囲で実行順序が異なってもよい。さらに、ここではマイクスピーカー装置2の制御部21が前記会議支援処理における各ステップを実行する場合を例に挙げて説明するが、他の実施形態では、一又は複数のプロセッサーが前記会議支援処理における各ステップを分散して実行してもよい。
【0061】
ここでは、会議室R1に含まれる特定の1台のマイクスピーカー装置2において実行される前記会議支援処理について説明する。
【0062】
先ず、ステップS11において、マイクスピーカー装置2の制御部21は、当該マイクスピーカー装置2を音声処理装置1aに接続する。例えば、会議に参加するユーザーが自身に装着したマイクスピーカー装置2の接続ボタン28を押下すると、制御部21は、音声処理装置1aとの間でBluetooth方式によるペアリング処理を実行して、マイクスピーカー装置2を音声処理装置1aに接続する。
【0063】
次にステップS12において、制御部21は、マイクスピーカー装置2の装着者の認証情報を取得する。例えば、ユーザーAがマイクスピーカー装置2Aの指紋センサー23に指をタッチすると、制御部21は、ユーザーAの指紋情報Faを取得する。ステップS12は、本発明の第2取得ステップの一例である。
【0064】
次にステップS13において、制御部21は、マイクスピーカー装置2の装着者を識別できたか否かを判定する。例えばステップS12において制御部21が取得したユーザーAの指紋情報Faがユーザー情報D2(図5参照)に登録されている場合に(S13:Yes)、制御部21は、マイクスピーカー装置2の装着者をユーザーID「0001」(ユーザーA)と識別する。その後処理はステップS14に移行する。
【0065】
これに対して、ステップS12において制御部21が取得した装着者の前記指紋情報がユーザー情報D2に登録されていない場合には(S13:No)、処理はステップS131に移行して、制御部21は、前記指紋情報をユーザー情報D2に新規登録する。またこの場合、制御部21は、さらに装着者の音声を取得して音声情報を前記指紋情報に関連付け、さらにユーザーIDを設定してユーザー情報D2に登録する。その後処理はステップS14に移行する。ステップS13は、本発明の識別ステップの一例である。
【0066】
ステップS14において、制御部21は、マイクスピーカー装置2の装着者が発話する発話音声の音声データを取得したか否かを判定する。制御部21が前記音声データを取得した場合(S14:Yes)、処理はステップS15に移行する。一方、制御部21が前記音声データを取得しない場合(S14:No)、処理はステップS17に移行する。ステップS14は、本発明の第1取得ステップの一例である。
【0067】
ステップS15において、制御部21は、ステップS14において取得した前記音声データの発話音声が装着者の発話音声と一致するか否かを判定する。例えば、制御部21は、取得した前記音声データの音声情報が、識別したユーザーID「0001」に関連付けられた音声情報Vaと一致するか否かを判定する。制御部21が取得した前記音声データの音声情報が音声情報Vaと一致する場合(S15:Yes)、処理はステップS16に移行する。一方、制御部21が取得した前記音声データの音声情報が音声情報Vaと一致しない場合(S15:No)、処理はステップS151に移行する。
【0068】
ステップS151では、制御部21は、ステップS14において取得した前記音声データを破棄する。例えば、制御部21は、取得した前記音声データの音声情報が音声情報Vcであり、ユーザーID「0001」に関連付けられた音声情報Vaと一致しない場合に、当該音声データを音声処理装置1aに出力しないで破棄する。
【0069】
ステップS16では、制御部21は、ステップS14において取得した前記音声データを音声処理装置1aに出力する。例えば、制御部21は、取得した前記音声データの音声情報が音声情報Vaであり、ユーザーID「0001」に関連付けられた音声情報Vaと一致する場合に、当該音声データを音声処理装置1aに出力する。ステップS16は、本発明の制御ステップの一例である。
【0070】
次にステップS17において、制御部11は、会議が終了したか否かを判定する。例えば、ユーザーが前記オンライン会議の終了操作を行うことにより前記オンライン会議が終了する。前記オンライン会議が終了すると(S17:Yes)、制御部11は、前記会議支援処理を終了する。一方、前記オンライン会議が終了しない場合(S17:No)、処理はステップS14に移行する。制御部21は、前記オンライン会議が終了するまで上述の処理を繰り返す。
【0071】
以上のように、会議システム100は、ユーザーに装着されるウェアラブル型のマイクスピーカー装置2を介して当該ユーザーの発話音声の音声データを送受信するシステムである。会議システム100は、マイクスピーカー装置2に搭載されたマイク24により集音される前記音声データを取得する。また会議システム100は、マイクスピーカー装置2に搭載された認証情報取得部(例えば指紋センサー23)により取得される、マイクスピーカー装置2を装着した装着者の認証情報(例えば指紋情報)を取得し、取得した前記認証情報に基づいて前記装着者を識別する。また会議システム100は、取得した前記音声データの発話音声が、識別した装着者の発話音声である場合に当該音声データを出力し、取得した前記音声データの発話音声が、識別した前記装着者の発話音声でない場合に当該音声データを出力しない。
【0072】
上記構成によれば、マイクスピーカー装置2が取得した前記音声データの発話音声が、マイクスピーカー装置2の装着者の発話音声と一致する場合に、当該音声データが出力されるため、マイクスピーカー装置2の装着者の発話音声を相手側のマイクスピーカー装置2に送信することができる。また、マイクスピーカー装置2が取得した前記音声データの発話音声が、マイクスピーカー装置2の装着者の発話音声と一致しない場合に、当該音声データを破棄することにより、マイクスピーカー装置2の装着者以外の発話音声が相手側のマイクスピーカー装置2から出力されることを防ぐことができる。これにより、会議の相手側のユーザーが不快に感じたり、会話がスムーズに行われなかったりする問題を解消することができる。よって、マイクスピーカー装置2の利便性を向上させることが可能となる。
【0073】
本発明は上述の実施形態に限定されない。以下、本発明の他の実施形態について説明する。
【0074】
上述の実施形態では、本発明の認証情報の一例として指紋情報を挙げたが、本発明の認証情報は指紋情報に限定されない。他の実施形態として、本発明の認証情報は、装着者の顔の少なくとも一部の顔情報であってもよい。この場合、本発明の認証情報取得部は、装着者の顔を撮像するカメラ30(撮像部)で構成されてもよい。例えば、カメラ30は、装着者の耳及び口の少なくともいずれかを撮像する。図9に示すように、カメラ30は、マイクスピーカー装置2において、マイク24とスピーカー25(例えばスピーカー25L)との間、かつ本体29の内側に配置される。またカメラ30は、装着者の耳及び口の両方が画角に収まるように、カメラレンズが斜め上方に向くようにアームに配置される。この場合、第2取得処理部213は、装着者の顔の少なくとも一部の顔画像を取得する。なお、装着者がマスクを着用している場合に、制御部21は、口を撮像する際にマスクを外すように音声案内してもよい。また、装着者の髪の毛で耳を認証できない場合に、制御部21は、髪をかき上げるように音声案内してもよい。制御部21は、周知の認証技術を利用して、カメラ30が撮像した耳又は口の画像から装着者を識別する。例えば、制御部21は、マイクスピーカー装置2の装着者の耳の画像から抽出した耳の形状と、予め登録されたユーザーごとの耳の形状とを照合して、装着者を識別する。例えば、制御部21は、マイクスピーカー装置2の装着者の口の画像から抽出した唇の形状、唇の動きと、予め登録されたユーザーごとの唇の形状、唇の動きとを照合して、装着者を識別する。
【0075】
また、カメラ30には、レンズを覆う開閉式(跳ね上げ式)のカバー30cが設けられてもよい。ユーザーがカバー30cを指で押すことにより、カバー30cが開きカメラ30のレンズが露出される(図9参照)。
【0076】
また他の実施形態として、本発明の認証情報は、装着者の脈(静脈)、網膜、声(声紋)などの生体情報であってもよい。これらの生体情報は、各種センサー、カメラなどにより取得することが可能である。
【0077】
例えば制御部21は、マイクスピーカー装置2の装着者の音声を取得し、当該音声に基づいてマイクスピーカー装置2の装着者を識別してもよい。制御部21は、ユーザーが正面を向いて発話した音声、左側を向いて発話した音声、右側を向いて発話した音声のそれぞれについて、装着者を識別する処理(認証処理)を実行してもよい。この場合、マイク24は、本発明の認証情報取得部の一例である。これにより、制御部21は、マイクスピーカー装置2を装着したユーザーが正面を向いて発話した音声情報と、左側を向いて発話した音声情報と、右側を向いて発話した音声情報とに基づいて生成した学習済みモデルを利用することにより、正確に装着者を識別することができる。
【0078】
また他の実施形態として、マイクスピーカー装置2は、マイク24が集音する音声データを録音する機能を備え、設定処理部211は、第1取得処理部212により取得される音声データの発話音声が、識別処理部214により識別される装着者の発話音声と一致しない場合に、マイクゲインを、前記発話音声が前記装着者の発話音声と一致する場合に設定されるゲインよりも高い設定値に設定してもよい。一般的に、マイクスピーカー装置2の装着者が他のユーザーと対話する場合、マイク24が集音する音声のうち装着者の発話音声(マイクゲイン)は大きくなり、対話相手の発話音声は小さくなる。この点、上記構成によれば、対話相手の発話音声のマイクゲインを高くすることにより、対話相手の発話音声も確実に録音することができる。
【0079】
本発明の音声処理システムは、会議システムに限定されない。他の実施形態として、本発明の音声処理システムは、音声認識システム、翻訳システムなどに適用されてもよい。具体的には、音声処理装置1は、マイクスピーカー装置2から前記音声データを取得すると、前記音声データの音声を第1言語から第2言語に翻訳する翻訳サービスを提供してもよい。
【0080】
なお、本発明の音声処理システムは、マイクスピーカー装置2単体が本発明の音声処理システムを構成してもよいし、音声処理装置1単体が本発明の音声処理システムを構成してもよいし、マイクスピーカー装置2及び音声処理装置1の組み合わせにより構成されてもよい。
【0081】
また、本発明の音声処理システムは、ユーザーの認証情報に基づいて、音声データに関する所定の処理を実行する。前記所定の処理には、上述したように、取得された音声データの発話音声が装着者の発話音声と一致する場合に当該音声データを出力する処理が含まれる。また、前記所定の処理には、マイク、ユーザーの認証情報に基づいて音量、マイクゲイン、イコライザーを設定(調整)する処理、マイク24が集音する音声データを録音する処理、音声を翻訳する処理などが含まれる。
【0082】
尚、本発明の音声処理システムは、各請求項に記載された発明の範囲において、以上に示された各実施形態を自由に組み合わせること、或いは各実施形態を適宜、変形又は一部を省略することによって構成されることも可能である。
【符号の説明】
【0083】
1 :音声処理装置
2 :マイクスピーカー装置
3 :会議サーバー
23 :指紋センサー
24 :マイク
25 :スピーカー
100 :会議システム
211 :設定処理部
212 :第1取得処理部
213 :第2取得処理部
214 :識別処理部
215 :判定処理部
216 :出力処理部
図1
図2
図3
図4
図5
図6
図7
図8
図9