(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-02-07
(45)【発行日】2024-02-16
(54)【発明の名称】音声認識装置
(51)【国際特許分類】
G10L 15/28 20130101AFI20240208BHJP
G10L 15/22 20060101ALI20240208BHJP
G10L 15/00 20130101ALI20240208BHJP
H04R 3/00 20060101ALI20240208BHJP
【FI】
G10L15/28 400
G10L15/22 460Z
G10L15/00 200C
H04R3/00 320
(21)【出願番号】P 2019179273
(22)【出願日】2019-09-30
【審査請求日】2022-09-28
(31)【優先権主張番号】P 2019049070
(32)【優先日】2019-03-15
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】519094709
【氏名又は名称】坂西 優
(74)【代理人】
【識別番号】100099623
【氏名又は名称】奥山 尚一
(74)【代理人】
【氏名又は名称】松島 鉄男
(74)【代理人】
【識別番号】100125380
【氏名又は名称】中村 綾子
(74)【代理人】
【識別番号】100142996
【氏名又は名称】森本 聡二
(74)【代理人】
【識別番号】100166268
【氏名又は名称】田中 祐
(74)【代理人】
【識別番号】100170379
【氏名又は名称】徳本 浩一
(74)【代理人】
【氏名又は名称】有原 幸一
(72)【発明者】
【氏名】坂西 優
【審査官】中村 天真
(56)【参考文献】
【文献】国際公開第2016/117421(WO,A1)
【文献】特開2009-295236(JP,A)
【文献】中国実用新案第204145550(CN,U)
【文献】特開2011-248140(JP,A)
【文献】特開2015-069600(JP,A)
【文献】特開2018-085091(JP,A)
【文献】特開2008-051882(JP,A)
【文献】特開2004-294945(JP,A)
【文献】国際公開第2007/099908(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 15/00-17/26
H04R 1/00- 3/14
(57)【特許請求の範囲】
【請求項1】
音声認識装置であって、
複数のマイクロフォンと、
前記音声認識装置が静止状態にあるか否かを判定するセンサと、
前記センサによる判定結果に応じて複数の前記マイクロフォンの各々をオン状態とするかオフ状態とするかを制御するマイクロフォン制御部と、
オン状態にある少なくとも1つの前記マイクロフォンに入力された音声を認識する音声認識部と
を備え、
前記音声認識装置の左側面部と右側面部と上面部とに前記マイクロフォンが配置され
、
前記音声認識装置が静止状態にあると前記センサが判定した場合、前記マイクロフォン制御部は、複数の前記マイクロフォンの全てをオン状態とし、
前記音声認識装置が静止状態にないと前記センサが判定した場合、前記マイクロフォン制御部は、前記上面部に配置されたマイクロフォンをオン状態とし、前記左側面部及び前記右側面部に配置されたマイクロフォンをオフ状態とする、
音声認識装置。
【請求項2】
前記音声認識装置の外形が、略四角錐の4枚の錐体面と、前記略四角錐の底面と、前記底面に平行な平面とによって囲まれる略四角錐台である、請求項1に記載の音声認識装置。
【請求項3】
前記音声認識部による音声認識結果を表示する表示部をさらに備える請求項1
又は2に記載の音声認識装置。
【請求項4】
前記音声認識部により第1の言語として認識された音声を、前記第1の言語とは異なる第2の言語へ翻訳する翻訳部をさらに備え、
前記表示部にはさらに、前記翻訳部による翻訳結果が表示される、
請求項
3に記載の音声認識装置。
【請求項5】
前記表示部の左側の領域に、前記音声認識部による音声認識結果が表示され、
前記表示部の右側の領域に、前記翻訳部による翻訳結果が表示される、
請求項
4に記載の音声認識装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は音声認識装置に関する。
【背景技術】
【0002】
音声認識技術の発展に伴い、音声認識機能を備えた装置の需要が高まりつつある。特許文献1には、2つのディスプレイを備えた同時通訳装置が記載されている。同文献において、同時通訳装置が机、テーブル等の静止体に置かれた状態で使用される様子が図示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明は、音声認識の対象となる会話が行われる状況に合わせて効率的に使用可能な音声認識装置を提供することを目的とする。
【課題を解決するための手段】
【0005】
上記の目的を達成するため、本発明に係る音声認識装置は、複数のマイクロフォンと、前記音声認識装置が静止状態にあるか否かを判定するセンサと、前記センサによる判定結果に応じて複数の前記マイクロフォンの各々をオン状態とするかオフ状態とするかを制御するマイクロフォン制御部と、オン状態にある少なくとも1つの前記マイクロフォンに入力された音声を認識する音声認識部とを備え、前記音声認識装置の左側面部と右側面部と上面部とに前記マイクロフォンが配置されている。前記音声認識装置が静止状態にあると前記センサが判定した場合、前記マイクロフォン制御部は、複数の前記マイクロフォンの全てをオン状態とし、前記音声認識装置が静止状態にないと前記センサが判定した場合、前記マイクロフォン制御部は、前記上面部に配置されたマイクロフォンをオン状態とし、前記左側面部及び前記右側面部に配置されたマイクロフォンをオフ状態とする。
【発明の効果】
【0006】
本発明によれば、音声認識の対象となる会話が行われる状況に合わせて効率的に使用可能な音声認識装置を提供することができる。
【図面の簡単な説明】
【0007】
【
図8】音声認識装置を手で持った状態で使用する場合を示す説明図である。
【
図9】音声認識装置を手で持った状態で使用する場合を示す別の説明図である。
【
図10】音声認識装置を置いた状態で使用する場合を示す説明図である。
【
図11】音声認識装置を置いた状態で使用する場合を示す別の説明図である。
【
図12】別の実施形態に係る音声認識装置の正面図である。
【
図13】別の実施形態に係る音声認識装置の背面図である。
【
図14】別の実施形態に係る音声認識装置の左側面図である。
【
図15】別の実施形態に係る音声認識装置の右側面図である。
【
図16】別の実施形態に係る音声認識装置の平面図である。
【
図17】別の実施形態に係る音声認識装置の底面図である。
【
図18】さらに別の実施形態に係る音声認識装置の正面図である。
【
図19】さらに別の実施形態に係る音声認識装置の背面図である。
【
図20】さらに別の実施形態に係る音声認識装置の左側面図である。
【
図21】さらに別の実施形態に係る音声認識装置の右側面図である。
【
図22】さらに別の実施形態に係る音声認識装置の平面図である。
【
図23】さらに別の実施形態に係る音声認識装置の底面図である。
【
図24】さらに別の実施形態に係る音声認識装置の斜視図である。
【
図25】さらに別の実施形態に係る音声認識装置の斜視図である。
【発明を実施するための形態】
【0008】
以下、図面を参照しながら本発明の実施形態について説明する。ただし、本発明は、以下の実施形態によって限定されるものではない。
【0009】
図1~
図6に示すように、音声認識装置1の外形は略三角柱である。この略三角柱は、略三角形である2つの面と、略矩形である3つの面とを有する略五面体である。略矩形である3つの面の短辺部が、略三角形である2つの面の辺部でもある。略矩形である上記3つの面のうち、ある1つの面を正面部と呼び、符号11により示す。正面部11には、音声認識装置1のユーザが視認する表示部Dが配置されている。
【0010】
正面部11の2本の長辺部11a及び11bが水平となるようにし、かつ一方の長辺11aが他方の長辺11bの真上に位置するようにして、音声認識装置1を正面から水平に見た状態を考える。この状態で、左右にある略三角形の面をそれぞれ左側面部13、右側面部14と呼び、正面部11と長辺部11aを共有する略矩形の面を上面部15と呼び、正面部11と長辺部11bを共有する略矩形の面を下面部16と呼ぶ。
【0011】
音声認識装置1の正面部11、上面部15及び下面部16が略矩形であるとともに、正面部11の長辺部11a及び11bの長さに比べて、左側面部13及び右側面部14の各辺部の長さは短い。つまり、音声認識装置1は左右方向に細長い形状である。
【0012】
また、正面部11と左側面部13とのなす角αは、鋭角である(
図5)。同様に、正面部11と右側面部14とのなす角も鋭角である。さらに、上面部15と下面部16とが共有する辺部12と左側面部13とのなす角βは、鈍角である。同様に、辺部12と右側面部14とのなす角も鈍角である。
【0013】
音声認識装置1は、持ち運びが容易であり、かつ手で持った状態でも使用可能な程度にハンディーなサイズである。一例として、正面部11の左右方向の長さは120ミリメートルであり、長辺部11aと長辺部11bとの間隔は30ミリメートルであり、奥行き(正面部11から辺部12までの長さ)は15ミリメートルである。
【0014】
図5に示すように、上面部15には第1マイクロフォンM1が配置されている。
図3に示すように、左側面部13には第2マイクロフォンM2が配置されている。
図4に示すように、右側面部14には第3マイクロフォンM3が配置されている。音声認識装置1を正面から水平に見たときに、正面部11において、表示部Dの下方には第4マイクロフォンM4が配置されている。
【0015】
第1マイクロフォンM1、第2マイクロフォンM2、第3マイクロフォンM3及び第4マイクロフォンM4は、いずれも、各マイクロフォンの前方に指向性を有する指向性マイクロフォンである。指向性マイクロフォンは、無指向性マイクロフォンに比べて、当該指向性マイクロフォンの正面であれば、より遠く離れて位置する発話者の音声を捉えることができる。各マイクロフォンは、オン状態であるときに、入力された音声を電気信号に変換する。各マイクロフォンをオン状態とするのか、オフ状態とするのかの制御については後述する。
【0016】
図7に示すように、音声認識装置1は、音声認識部21と翻訳部22とセンサ23とマイクロフォン制御部24とをさらに有している。ただし、後述するように、翻訳部22は必須の要素ではない。
【0017】
音声認識部21は、第1から第4のマイクロフォンM1~M4のうち、オン状態にある少なくとも1つのマイクロフォンから電気信号を受け取り、音声認識を行う。音声認識部21により、上記電気信号が第1の言語として認識される。この音声認識結果は、表示部Dに文字列として表示される。
【0018】
翻訳部22は、音声認識部21により第1の言語として認識された音声を、第1の言語とは異なる第2の言語へ翻訳する。この翻訳は翻訳エンジンにより行われる。翻訳エンジンは、音声認識装置1の内部に組み込まれているか、または音声認識装置1の外部にあって翻訳部22と通信できるように設けられている。翻訳部22による翻訳結果は、表示部Dに文字列として表示される。
【0019】
加速度センサ23は、音声認識装置1の加速度を測定し、測定された加速度に基づいて音声認識装置1が静止状態にあるか否かを判定する。音声認識装置1が机、テーブルなどの静止体に置かれて静止している場合、加速度センサ23は、測定された加速度に基づいて、音声認識装置1は静止状態にあると判定する。これに対し、音声認識装置1のユーザが当該音声認識装置1を手に持っているなどして音声認識装置1が静止していない場合、加速度センサ23は、測定された加速度に基づいて、音声認識装置1は静止状態にないと判定する。
【0020】
マイクロフォン制御部24は、加速度センサ23の判定結果によって、各マイクロフォンをオン状態とするか、オフ状態とするかを制御する。加速度センサ23により音声認識装置1が静止状態にあると判定された場合、第1から第4の全てのマイクロフォンM1~M4がオン状態となるように制御される。他方、音声認識装置1が静止状態にないと判定された場合、第1マイクロフォンM1がオン状態となり、かつ第2から第4のマイクロフォンM2~M4がオフ状態となるように制御される。
【0021】
音声認識装置1は、そのコンピュータハードウェア構成として、図示はしていないが、プロセッサと、外部のコンピュータとの通信が可能なインタフェース装置と、音声認識装置1のユーザが入力のために使用する入力装置と、記憶装置とをさらに備えている。
【0022】
図8及び
図9に、音声認識装置1のユーザP1が音声認識装置1を手に持った状態で、話者P2と向かい合って会話する様子を示す。ユーザP1が音声認識装置1を手に持っていることから、加速度センサ23により、音声認識装置1は静止状態にないと判定される。その結果、マイクロフォン制御部24により第1マイクロフォンM1がオン状態となり、かつ第2から第4のマイクロフォンM2~M4がオフ状態となるように制御される。第1マイクロフォンM1が音声を取得できる領域を符号S1として示す。
【0023】
ユーザP1が、自身にとって表示部Dが視認しやすいように音声認識装置1をユーザP1側に傾けると、上面部15が話者P2とほぼ向かい合うことになる。その結果、第1マイクロフォンM1が音声を取得できる領域S1が上面部15から話者P2に向かって広がりを有することになる。
【0024】
話者P2が発した音声は、オン状態にある第1マイクロフォンM1に入力され、音声認識部21により第1の言語(本例では英語)として認識される。認識結果は、表示部Dの左側の領域に表示される(
図8)。音声認識部21により認識された音声は、翻訳部22により第2の言語(本例では日本語)へ翻訳される。翻訳結果は、表示部Dの右側の領域に表示される(
図8)。
【0025】
このように、音声認識装置1の外形が略三角柱であることから、ユーザP1が自身にとって表示部Dが視認しやすいように音声認識装置1を傾けると同時に、領域S1が話者P2に向かって広がりを有することとなって話者P2が発した音声を効率的に取得できる。また、ユーザP1にとって話者P2の方向も見やすいため、ユーザP1は、音声認識装置1を使用しながら話者P2との間で自然に会話をすることができる。
【0026】
また、音声認識装置1は左右方向に細長い形状であり、使用時に音声認識装置1の左右方向(長手方向)が、ユーザP1と話者P2とが向かい合う方向に対して垂直となるようにユーザP1が音声認識装置1を手に持つことになる。そのため、音声認識装置1の長手方向が、ユーザP1と話者P2とが向かい合う方向と平行となる場合に比べて、音声認識装置1の使用による話者P2への圧迫感を低減することができる。
【0027】
なお、
図8及び
図9に示すようにユーザP1が音声認識装置1を手に持った状態で、ユーザP1により音声認識装置1に対して特定の操作がされたときに、第4マイクロフォンM4がオン状態となるように制御されてもよい。あるいは、上記特定の操作がされたかどうかに関わらず、第1マイクロフォンM1及び第4マイクロフォンM4がオン状態となるように制御されてもよい。
【0028】
オン状態にある第4マイクロフォンM4により、ユーザP1が発した音声が捉えられ、音声認識部21により認識することができる。さらには、その認識結果を翻訳部22により別の言語へと翻訳することができる。翻訳結果は表示部Dに表示され、ユーザP1が視認することができる。ユーザP1は翻訳結果を見ながらその内容を発話することができる。
【0029】
図10及び
図11に、音声認識装置1のユーザP1が、静止体としてのテーブル9の上に音声認識装置1を置いた状態で話者P3~P5と会話する様子を示す。音声認識装置1は、下面部16がテーブル9との接触面となるようにしてテーブル9の上に置かれる。ユーザP1及び話者P3~P5はいずれも着席している。話者P3は、ユーザP1の右隣りに座っており、話者P4はユーザP1とテーブル9を挟んで向かい合って座っており、話者P5は話者P3とテーブル9を挟んで向かい合って座っている。
【0030】
音声認識装置1はテーブル9の上に置かれていることから、加速度センサ23により、音声認識装置1は静止状態にあると判定される。その結果、マイクロフォン制御部24により第1から第4の全てのマイクロフォンM1~M4がオン状態となるように制御される。第1マイクロフォンM1が音声を取得できる領域S1に加え、第2から第4のマイクロフォンM2~M4が音声を取得できる領域をそれぞれS2~S4として示す。
【0031】
下面部16がテーブル9との接触面となるようにして音声認識装置1がテーブル9の上に置かれると、音声認識装置1の外形が略三角柱であることから、ユーザP1にとって表示部Dが視認しやすい状態となる。さらに、第1マイクロフォンM1が配置された上面部15が話者P4及びP5の方向を向き、第3マイクロフォンM3が配置された右側面部14が話者P3及びP5の方向を向くこととなる。
【0032】
そのため、第1マイクロフォンM1により音声が取得可能な領域S1が話者P4及びP5に向かって広がりを有することになるとともに、第3マイクロフォンM3により音声が取得可能な領域S3が話者P3及びP5に向かって広がりを有することになる。
【0033】
話者P3が発した音声は、第3マイクロフォンM3に入力され、音声認識部21により認識される。話者P4が発した音声は、第1マイクロフォンM1に入力され、音声認識部21により認識される。話者P5が発した音声は、第1マイクロフォンM1及び第3マイクロフォンM3の少なくとも一方に入力され、音声認識部21により認識される。ユーザP1が自身の前に音声認識装置1を置いたままの状態で、音声認識装置1は話者P3~P5の発する音声を効率的に取得することができる。
【0034】
また、ユーザP1にとって話者P3~P5の方も見やすい。つまり、ユーザP1は、音声認識装置1を使用しながら話者P3~P5との間で自然に会話をすることができる。
。
【0035】
なお、第4マイクロフォンM4は、ユーザP1により音声認識装置1に対して特定の操作がされたときにオン状態となるように制御されてもよい。
【0036】
以上のように、音声認識装置1を用いて、会話が行われる状況に合わせて、音声認識装置1を手に持った場合でも、音声認識装置1をテーブル9、机等の静止体に置いた場合でも、それに応じて複数のマイクロフォンの各々のオン・オフが制御される。音声認識装置1は、オン状態とされたマイクロフォンにより話者の音声を効率的に取得できる。同時に、音声認識結果と翻訳結果とがユーザにとって表示部Dを通して視認しやすい。
【0037】
[その他]
音声認識装置1の外形が略三角柱である例を示したが、直方体など別の形状であってもよい。また、加速度センサに限られず、音声認識装置1が静止状態にあるか否かを判定できるセンサ手段が音声認識装置1に設けられていればよい。
【0038】
音声認識装置1は、翻訳部22を備えていなくてもよい。この場合、音声認識装置1は入力された音声を言語として認識し、その認識結果を音声認識装置1内の記憶装置に記憶することができる。あるいは、音声認識結果は、表示部Dに表示されてもよいし、音声認識装置1の外部にある別の装置に送られてもよい。この音声認識結果は、議事録などの記録の材料として用いることができ、その会話、会議の生産性の解析材料として用いることもできる。
【0039】
音声認識装置1は、手で持った状態でも使用可能な程度に小型・軽量であり、かつ複数の指向性マイクロフォンを備えている。複数の指向性マイクロフォンにより、対象となる会話、会議の参加者が音声認識装置から比較的離れた位置にいたとしても、その参加者の発する音声を捉えて認識することができる。つまり、対象となる会話、会議の参加者全員の音声を捉えて認識できる可能性が高まる。
【0040】
上記実施形態について改めて以下に説明する。
[その1]
音声認識装置1は、複数のマイクロフォンと、前記音声認識装置が静止状態にあるか否かを判定するセンサ23と、前記センサによる判定結果に応じて複数の前記マイクロフォンの各々をオン状態とするかオフ状態とするかを制御するマイクロフォン制御部24と、オン状態にある少なくとも1つの前記マイクロフォンに入力された音声を認識する音声認識部21とを備える。
【0041】
これにより、音声認識装置の状態に合わせて各マイクロフォンのオン・オフが制御される。その結果、音声認識の対象となる音声を効率的に取得することができる。
【0042】
[その2]
音声認識装置1の外形が、略三角形である2つの面と略矩形である3つの面とを有する略三角柱であり、前記略三角形である2つの面(左側面部13及び右側面部14)の各々と、前記略矩形である3つの面(正面部11、上面部15及び下面部16)のうち2つの面(正面部11及び上面部15)の各々とに、マイクロフォンが配置されている。
【0043】
これにより、音声認識装置のユーザが会話をする相手である話者に向かって各マイクロフォンの音声取得可能領域が広がりを有することとなる可能性が高まる。これは、音声の効率的な取得につながる。
【0044】
[その3]
音声認識装置が静止状態にあると前記センサが判定した場合、前記マイクロフォン制御部は、複数の前記マイクロフォンの全てをオン状態とする。また、音声認識装置が静止状態にないと前記センサが判定した場合、前記マイクロフォン制御部は、前記略矩形である3つの面のうち2つの面(正面部11及び上面部15)の各々に配置されたマイクロフォンをオン状態とし、前記略三角形である2つの面(左側面部13及び右側面部14)の各々に配置されたマイクロフォンをオフ状態とする。
【0045】
これにより、音声認識装置が静止状態にある場合と静止状態にない場合との双方において、音声を効率的に取得できる可能性が高まる。
【0046】
[その4]
音声認識装置1は、音声認識部21による音声認識結果を表示する表示部Dをさらに備える。これにより、音声認識装置のユーザは、表示部Dを通して音声認識結果を視認することができる。
【0047】
[その5]
音声認識装置1は、音声認識部21により第1の言語として認識された音声を、前記第1の言語とは異なる第2の言語へ翻訳する翻訳部22をさらに備える。表示部Dにはさらに、翻訳部による翻訳結果が表示される。これにより、音声認識結果が、認識された言語とは別の言語へ翻訳され、その翻訳結果を、表示部Dを通してユーザが視認することができる。
【0048】
以下、音声認識装置の別の例について説明する。
【0049】
図12~
図17に、外形が略四角錐台状である音声認識装置1Aを示す。四角錐台とは、四角錐を底面に平行な平面で2つに切り、元の四角錐の頭頂点を含む部分を除いた立体図形である。言い換えれば、四角錐台は、四角錐の4枚の錐体面と、四角錐の底面と、該底面に平行な平面とによって囲まれる立体図形である。
【0050】
音声認識装置1Aの外形を形成する2つの平行な平面部のうち、表面積が大きい一方の平面部を正面部と呼び、符号11Aにより示す。また、表面積が小さい他方の平面部を背面部と呼び、符号12Aにより示す。正面部11A及び背面部12Aはいずれも略長方形である。正面部11Aには、音声認識装置1Aのユーザが視認する表示部Dが配置されている。
【0051】
正面部11Aの2本の長辺部11a1及び11b1が水平となるようにし、かつ一方の長辺11a1が他方の長辺11b1よりも上方に位置するようにして、音声認識装置1Aを正面から水平に見た状態を考える。この状態で、4つの錐体面部のうち、左側に位置する錐体面部を音声認識装置1Aの左側面部と呼び、符号13Aにより示すとともに、右側に位置する錐体面部を音声認識装置1Aの右側面部と呼び、符号14Aにより示す。同じ状態で、上側に位置する錐体面部を音声認識装置1Aの上面部と呼び、符号15Aにより示すとともに、下側に位置する錐体面部を音声認識装置1Aの下面部と呼び、符号16Aにより示す。
【0052】
音声認識装置1Aの正面部11A及び背面部12Aが略長方形であるとともに、正面部11Aの長辺部11a1及び11b1の長さに比べて、正面部11Aから背面部12Aまでの長さは短い。つまり、音声認識装置1Aは左右方向に細長い形状である。
【0053】
上面部15Aに第1マイクロフォンM1が配置されている。左側面部13Aに第2マイクロフォンM2が配置され、右側面部14Aに第3マイクロフォンM3が配置されている。さらに、正面部11Aにおいて、表示部Dの下方には第4マイクロフォンM4が配置されている。
【0054】
図18~
図25に、外形が略四角錐台状である別の音声認識装置1Bを示す。
【0055】
音声認識装置1Bの外形を形成する2つの平行な平面部のうち、表面積が大きい一方の平面部を正面部と呼び、符号11Bにより示す。また、表面積が小さい他方の平面部を背面部と呼び、符号12Bにより示す。正面部11B及び背面部12Bはいずれも略長方形である。正面部11Bには、音声認識装置1Bのユーザが視認する表示部Dが配置されている。
【0056】
正面部11Aの2本の長辺部11a2及び11b2が水平となるようにし、かつ一方の長辺11a2が他方の長辺11b2よりも上方に位置するようにして、音声認識装置1Bを正面から水平に見た状態を考える。この状態で、4つの錐体面部のうち、左側に位置する錐体面部を音声認識装置1Aの左側面部と呼び、符号13Bにより示すとともに、右側に位置する錐体面部を音声認識装置1Bの右側面部と呼び、符号14Bにより示す。同じ状態で、上側に位置する錐体面部を音声認識装置1Bの上面部と呼び、符号15Bにより示すとともに、下側に位置する錐体面部を音声認識装置1Bの下面部と呼び、符号16Bにより示す。
【0057】
音声認識装置1Bの正面部11B及び背面部12Bが略長方形であるとともに、正面部11Bの長辺部11a2及び11b2の長さに比べて、正面部11Bから背面部12Bまでの長さは短い。つまり、音声認識装置1Bは左右方向に細長い形状である。
【0058】
上面部15Bに第1マイクロフォンM1が配置されている。左側面部13Bに第2マイクロフォンM2が配置され、右側面部14Bに第3マイクロフォンM3が配置されている。さらに、正面部11Bには、表示部Dの下方には第4マイクロフォンM4が配置されている。
【0059】
以上のような、外形が略四角錐台状の音声認識装置についても、外形が略三角柱状の音声認識装置と同様、音声認識の対象となる会話が行われる状況に合わせて効率的に使用することができる。略三角柱を含む五面体を外形とする音声認識装置と、略四角錐台を含む六面体を外形とする音声認識装置とについても同様の効果が得られる。
【0060】
本発明の特定の実施形態について説明したが、本発明はこのような実施形態に限定されず、本発明の技術的思想に基づく種々の変更は本発明の概念に含まれる。
【符号の説明】
【0061】
1 音声認識装置
11 正面部、13 左側面部、14 右側面部、15 上面部、16 下面部
D 表示部(ディスプレイ)、M1~M4 マイクロフォン
21 音声認識部、22 翻訳部、23 センサ、24 マイクロフォン制御部