特許7432177 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 坂西　優の特許一覧

特許7432177音声認識装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-02-07

(45)【発行日】2024-02-16

(54)【発明の名称】音声認識装置

(51)【国際特許分類】

G10L 15/28 20130101AFI20240208BHJP

G10L 15/22 20060101ALI20240208BHJP

G10L 15/00 20130101ALI20240208BHJP

H04R 3/00 20060101ALI20240208BHJP

【ＦＩ】

G10L15/28 400

G10L15/22 460Z

G10L15/00 200C

H04R3/00 320

【請求項の数】 5

(21)【出願番号】P 2019179273

(22)【出願日】2019-09-30

(65)【公開番号】P2020154281

(43)【公開日】2020-09-24

【審査請求日】2022-09-28

(31)【優先権主張番号】P 2019049070

(32)【優先日】2019-03-15

(33)【優先権主張国・地域又は機関】JP

(73)【特許権者】

【識別番号】519094709

【氏名又は名称】坂西優

(74)【代理人】

【識別番号】100099623

【弁理士】

【氏名又は名称】奥山尚一

(74)【代理人】

【氏名又は名称】松島鉄男

(74)【代理人】

【識別番号】100125380

【弁理士】

【氏名又は名称】中村綾子

(74)【代理人】

【識別番号】100142996

【弁理士】

【氏名又は名称】森本聡二

(74)【代理人】

【識別番号】100166268

【弁理士】

【氏名又は名称】田中祐

(74)【代理人】

【識別番号】100170379

【弁理士】

【氏名又は名称】徳本浩一

(74)【代理人】

【氏名又は名称】有原幸一

(72)【発明者】

【氏名】坂西優

【審査官】中村天真

(56)【参考文献】

【文献】国際公開第２０１６／１１７４２１（ＷＯ，Ａ１）

【文献】特開２００９－２９５２３６（ＪＰ，Ａ）

【文献】中国実用新案第２０４１４５５５０（ＣＮ，Ｕ）

【文献】特開２０１１－２４８１４０（ＪＰ，Ａ）

【文献】特開２０１５－０６９６００（ＪＰ，Ａ）

【文献】特開２０１８－０８５０９１（ＪＰ，Ａ）

【文献】特開２００８－０５１８８２（ＪＰ，Ａ）

【文献】特開２００４－２９４９４５（ＪＰ，Ａ）

【文献】国際公開第２００７／０９９９０８（ＷＯ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ１０Ｌ１５／００－１７／２６

Ｈ０４Ｒ１／００－３／１４

(57)【特許請求の範囲】

【請求項1】

音声認識装置であって、
複数のマイクロフォンと、
前記音声認識装置が静止状態にあるか否かを判定するセンサと、
前記センサによる判定結果に応じて複数の前記マイクロフォンの各々をオン状態とするかオフ状態とするかを制御するマイクロフォン制御部と、
オン状態にある少なくとも１つの前記マイクロフォンに入力された音声を認識する音声認識部と
を備え、
前記音声認識装置の左側面部と右側面部と上面部とに前記マイクロフォンが配置され、
前記音声認識装置が静止状態にあると前記センサが判定した場合、前記マイクロフォン制御部は、複数の前記マイクロフォンの全てをオン状態とし、
前記音声認識装置が静止状態にないと前記センサが判定した場合、前記マイクロフォン制御部は、前記上面部に配置されたマイクロフォンをオン状態とし、前記左側面部及び前記右側面部に配置されたマイクロフォンをオフ状態とする、
音声認識装置。

【請求項2】

前記音声認識装置の外形が、略四角錐の４枚の錐体面と、前記略四角錐の底面と、前記底面に平行な平面とによって囲まれる略四角錐台である、請求項１に記載の音声認識装置。

【請求項3】

前記音声認識部による音声認識結果を表示する表示部をさらに備える請求項１又は２に記載の音声認識装置。

【請求項4】

前記音声認識部により第１の言語として認識された音声を、前記第１の言語とは異なる第２の言語へ翻訳する翻訳部をさらに備え、
前記表示部にはさらに、前記翻訳部による翻訳結果が表示される、
請求項３に記載の音声認識装置。

【請求項5】

前記表示部の左側の領域に、前記音声認識部による音声認識結果が表示され、
前記表示部の右側の領域に、前記翻訳部による翻訳結果が表示される、
請求項４に記載の音声認識装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は音声認識装置に関する。

【背景技術】

【0002】

音声認識技術の発展に伴い、音声認識機能を備えた装置の需要が高まりつつある。特許文献１には、２つのディスプレイを備えた同時通訳装置が記載されている。同文献において、同時通訳装置が机、テーブル等の静止体に置かれた状態で使用される様子が図示されている。

【先行技術文献】

【特許文献】

【0003】

【文献】特開２０１８－１９５２７６号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

本発明は、音声認識の対象となる会話が行われる状況に合わせて効率的に使用可能な音声認識装置を提供することを目的とする。

【課題を解決するための手段】

【0005】

上記の目的を達成するため、本発明に係る音声認識装置は、複数のマイクロフォンと、前記音声認識装置が静止状態にあるか否かを判定するセンサと、前記センサによる判定結果に応じて複数の前記マイクロフォンの各々をオン状態とするかオフ状態とするかを制御するマイクロフォン制御部と、オン状態にある少なくとも１つの前記マイクロフォンに入力された音声を認識する音声認識部とを備え、前記音声認識装置の左側面部と右側面部と上面部とに前記マイクロフォンが配置されている。前記音声認識装置が静止状態にあると前記センサが判定した場合、前記マイクロフォン制御部は、複数の前記マイクロフォンの全てをオン状態とし、前記音声認識装置が静止状態にないと前記センサが判定した場合、前記マイクロフォン制御部は、前記上面部に配置されたマイクロフォンをオン状態とし、前記左側面部及び前記右側面部に配置されたマイクロフォンをオフ状態とする。

【発明の効果】

【0006】

本発明によれば、音声認識の対象となる会話が行われる状況に合わせて効率的に使用可能な音声認識装置を提供することができる。

【図面の簡単な説明】

【0007】

【図1】音声認識装置の正面図である。

【図2】音声認識装置の背面図である。

【図3】音声認識装置の左側面図である。

【図4】音声認識装置の右側面図である。

【図5】音声認識装置の平面図である。

【図6】音声認識装置の底面図である。

【図7】音声認識装置の機能ブロック図である。

【図8】音声認識装置を手で持った状態で使用する場合を示す説明図である。

【図9】音声認識装置を手で持った状態で使用する場合を示す別の説明図である。

【図10】音声認識装置を置いた状態で使用する場合を示す説明図である。

【図11】音声認識装置を置いた状態で使用する場合を示す別の説明図である。

【図12】別の実施形態に係る音声認識装置の正面図である。

【図13】別の実施形態に係る音声認識装置の背面図である。

【図14】別の実施形態に係る音声認識装置の左側面図である。

【図15】別の実施形態に係る音声認識装置の右側面図である。

【図16】別の実施形態に係る音声認識装置の平面図である。

【図17】別の実施形態に係る音声認識装置の底面図である。

【図18】さらに別の実施形態に係る音声認識装置の正面図である。

【図19】さらに別の実施形態に係る音声認識装置の背面図である。

【図20】さらに別の実施形態に係る音声認識装置の左側面図である。

【図21】さらに別の実施形態に係る音声認識装置の右側面図である。

【図22】さらに別の実施形態に係る音声認識装置の平面図である。

【図23】さらに別の実施形態に係る音声認識装置の底面図である。

【図24】さらに別の実施形態に係る音声認識装置の斜視図である。

【図25】さらに別の実施形態に係る音声認識装置の斜視図である。

【発明を実施するための形態】

【0008】

以下、図面を参照しながら本発明の実施形態について説明する。ただし、本発明は、以下の実施形態によって限定されるものではない。

【0009】

図１～図６に示すように、音声認識装置１の外形は略三角柱である。この略三角柱は、略三角形である２つの面と、略矩形である３つの面とを有する略五面体である。略矩形である３つの面の短辺部が、略三角形である２つの面の辺部でもある。略矩形である上記３つの面のうち、ある１つの面を正面部と呼び、符号１１により示す。正面部１１には、音声認識装置１のユーザが視認する表示部Ｄが配置されている。

【0010】

正面部１１の２本の長辺部１１ａ及び１１ｂが水平となるようにし、かつ一方の長辺１１ａが他方の長辺１１ｂの真上に位置するようにして、音声認識装置１を正面から水平に見た状態を考える。この状態で、左右にある略三角形の面をそれぞれ左側面部１３、右側面部１４と呼び、正面部１１と長辺部１１ａを共有する略矩形の面を上面部１５と呼び、正面部１１と長辺部１１ｂを共有する略矩形の面を下面部１６と呼ぶ。

【0011】

音声認識装置１の正面部１１、上面部１５及び下面部１６が略矩形であるとともに、正面部１１の長辺部１１ａ及び１１ｂの長さに比べて、左側面部１３及び右側面部１４の各辺部の長さは短い。つまり、音声認識装置１は左右方向に細長い形状である。

【0012】

また、正面部１１と左側面部１３とのなす角αは、鋭角である（図５）。同様に、正面部１１と右側面部１４とのなす角も鋭角である。さらに、上面部１５と下面部１６とが共有する辺部１２と左側面部１３とのなす角βは、鈍角である。同様に、辺部１２と右側面部１４とのなす角も鈍角である。

【0013】

音声認識装置１は、持ち運びが容易であり、かつ手で持った状態でも使用可能な程度にハンディーなサイズである。一例として、正面部１１の左右方向の長さは１２０ミリメートルであり、長辺部１１ａと長辺部１１ｂとの間隔は３０ミリメートルであり、奥行き（正面部１１から辺部１２までの長さ）は１５ミリメートルである。

【0014】

図５に示すように、上面部１５には第１マイクロフォンＭ１が配置されている。図３に示すように、左側面部１３には第２マイクロフォンＭ２が配置されている。図４に示すように、右側面部１４には第３マイクロフォンＭ３が配置されている。音声認識装置１を正面から水平に見たときに、正面部１１において、表示部Ｄの下方には第４マイクロフォンＭ４が配置されている。

【0015】

第１マイクロフォンＭ１、第２マイクロフォンＭ２、第３マイクロフォンＭ３及び第４マイクロフォンＭ４は、いずれも、各マイクロフォンの前方に指向性を有する指向性マイクロフォンである。指向性マイクロフォンは、無指向性マイクロフォンに比べて、当該指向性マイクロフォンの正面であれば、より遠く離れて位置する発話者の音声を捉えることができる。各マイクロフォンは、オン状態であるときに、入力された音声を電気信号に変換する。各マイクロフォンをオン状態とするのか、オフ状態とするのかの制御については後述する。

【0016】

図７に示すように、音声認識装置１は、音声認識部２１と翻訳部２２とセンサ２３とマイクロフォン制御部２４とをさらに有している。ただし、後述するように、翻訳部２２は必須の要素ではない。

【0017】

音声認識部２１は、第１から第４のマイクロフォンＭ１～Ｍ４のうち、オン状態にある少なくとも１つのマイクロフォンから電気信号を受け取り、音声認識を行う。音声認識部２１により、上記電気信号が第１の言語として認識される。この音声認識結果は、表示部Ｄに文字列として表示される。

【0018】

翻訳部２２は、音声認識部２１により第１の言語として認識された音声を、第１の言語とは異なる第２の言語へ翻訳する。この翻訳は翻訳エンジンにより行われる。翻訳エンジンは、音声認識装置１の内部に組み込まれているか、または音声認識装置１の外部にあって翻訳部２２と通信できるように設けられている。翻訳部２２による翻訳結果は、表示部Ｄに文字列として表示される。

【0019】

加速度センサ２３は、音声認識装置１の加速度を測定し、測定された加速度に基づいて音声認識装置１が静止状態にあるか否かを判定する。音声認識装置１が机、テーブルなどの静止体に置かれて静止している場合、加速度センサ２３は、測定された加速度に基づいて、音声認識装置１は静止状態にあると判定する。これに対し、音声認識装置１のユーザが当該音声認識装置１を手に持っているなどして音声認識装置１が静止していない場合、加速度センサ２３は、測定された加速度に基づいて、音声認識装置１は静止状態にないと判定する。

【0020】

マイクロフォン制御部２４は、加速度センサ２３の判定結果によって、各マイクロフォンをオン状態とするか、オフ状態とするかを制御する。加速度センサ２３により音声認識装置１が静止状態にあると判定された場合、第１から第４の全てのマイクロフォンＭ１～Ｍ４がオン状態となるように制御される。他方、音声認識装置１が静止状態にないと判定された場合、第１マイクロフォンＭ１がオン状態となり、かつ第２から第４のマイクロフォンＭ２～Ｍ４がオフ状態となるように制御される。

【0021】

音声認識装置１は、そのコンピュータハードウェア構成として、図示はしていないが、プロセッサと、外部のコンピュータとの通信が可能なインタフェース装置と、音声認識装置１のユーザが入力のために使用する入力装置と、記憶装置とをさらに備えている。

【0022】

図８及び図９に、音声認識装置１のユーザＰ１が音声認識装置１を手に持った状態で、話者Ｐ２と向かい合って会話する様子を示す。ユーザＰ１が音声認識装置１を手に持っていることから、加速度センサ２３により、音声認識装置１は静止状態にないと判定される。その結果、マイクロフォン制御部２４により第１マイクロフォンＭ１がオン状態となり、かつ第２から第４のマイクロフォンＭ２～Ｍ４がオフ状態となるように制御される。第１マイクロフォンＭ１が音声を取得できる領域を符号Ｓ１として示す。

【0023】

ユーザＰ１が、自身にとって表示部Ｄが視認しやすいように音声認識装置１をユーザＰ１側に傾けると、上面部１５が話者Ｐ２とほぼ向かい合うことになる。その結果、第１マイクロフォンＭ１が音声を取得できる領域Ｓ１が上面部１５から話者Ｐ２に向かって広がりを有することになる。

【0024】

話者Ｐ２が発した音声は、オン状態にある第１マイクロフォンＭ１に入力され、音声認識部２１により第１の言語（本例では英語）として認識される。認識結果は、表示部Ｄの左側の領域に表示される（図８）。音声認識部２１により認識された音声は、翻訳部２２により第２の言語（本例では日本語）へ翻訳される。翻訳結果は、表示部Ｄの右側の領域に表示される（図８）。

【0025】

このように、音声認識装置１の外形が略三角柱であることから、ユーザＰ１が自身にとって表示部Ｄが視認しやすいように音声認識装置１を傾けると同時に、領域Ｓ１が話者Ｐ２に向かって広がりを有することとなって話者Ｐ２が発した音声を効率的に取得できる。また、ユーザＰ１にとって話者Ｐ２の方向も見やすいため、ユーザＰ１は、音声認識装置１を使用しながら話者Ｐ２との間で自然に会話をすることができる。

【0026】

また、音声認識装置１は左右方向に細長い形状であり、使用時に音声認識装置１の左右方向（長手方向）が、ユーザＰ１と話者Ｐ２とが向かい合う方向に対して垂直となるようにユーザＰ１が音声認識装置１を手に持つことになる。そのため、音声認識装置１の長手方向が、ユーザＰ１と話者Ｐ２とが向かい合う方向と平行となる場合に比べて、音声認識装置１の使用による話者Ｐ２への圧迫感を低減することができる。

【0027】

なお、図８及び図９に示すようにユーザＰ１が音声認識装置１を手に持った状態で、ユーザＰ１により音声認識装置１に対して特定の操作がされたときに、第４マイクロフォンＭ４がオン状態となるように制御されてもよい。あるいは、上記特定の操作がされたかどうかに関わらず、第１マイクロフォンＭ１及び第４マイクロフォンＭ４がオン状態となるように制御されてもよい。

【0028】

オン状態にある第４マイクロフォンＭ４により、ユーザＰ１が発した音声が捉えられ、音声認識部２１により認識することができる。さらには、その認識結果を翻訳部２２により別の言語へと翻訳することができる。翻訳結果は表示部Ｄに表示され、ユーザＰ１が視認することができる。ユーザＰ１は翻訳結果を見ながらその内容を発話することができる。

【0029】

図１０及び図１１に、音声認識装置１のユーザＰ１が、静止体としてのテーブル９の上に音声認識装置１を置いた状態で話者Ｐ３～Ｐ５と会話する様子を示す。音声認識装置１は、下面部１６がテーブル９との接触面となるようにしてテーブル９の上に置かれる。ユーザＰ１及び話者Ｐ３～Ｐ５はいずれも着席している。話者Ｐ３は、ユーザＰ１の右隣りに座っており、話者Ｐ４はユーザＰ１とテーブル９を挟んで向かい合って座っており、話者Ｐ５は話者Ｐ３とテーブル９を挟んで向かい合って座っている。

【0030】

音声認識装置１はテーブル９の上に置かれていることから、加速度センサ２３により、音声認識装置１は静止状態にあると判定される。その結果、マイクロフォン制御部２４により第１から第４の全てのマイクロフォンＭ１～Ｍ４がオン状態となるように制御される。第１マイクロフォンＭ１が音声を取得できる領域Ｓ１に加え、第２から第４のマイクロフォンＭ２～Ｍ４が音声を取得できる領域をそれぞれＳ２～Ｓ４として示す。

【0031】

下面部１６がテーブル９との接触面となるようにして音声認識装置１がテーブル９の上に置かれると、音声認識装置１の外形が略三角柱であることから、ユーザＰ１にとって表示部Ｄが視認しやすい状態となる。さらに、第１マイクロフォンＭ１が配置された上面部１５が話者Ｐ４及びＰ５の方向を向き、第３マイクロフォンＭ３が配置された右側面部１４が話者Ｐ３及びＰ５の方向を向くこととなる。

【0032】

そのため、第１マイクロフォンＭ１により音声が取得可能な領域Ｓ１が話者Ｐ４及びＰ５に向かって広がりを有することになるとともに、第３マイクロフォンＭ３により音声が取得可能な領域Ｓ３が話者Ｐ３及びＰ５に向かって広がりを有することになる。

【0033】

話者Ｐ３が発した音声は、第３マイクロフォンＭ３に入力され、音声認識部２１により認識される。話者Ｐ４が発した音声は、第１マイクロフォンＭ１に入力され、音声認識部２１により認識される。話者Ｐ５が発した音声は、第１マイクロフォンＭ１及び第３マイクロフォンＭ３の少なくとも一方に入力され、音声認識部２１により認識される。ユーザＰ１が自身の前に音声認識装置１を置いたままの状態で、音声認識装置１は話者Ｐ３～Ｐ５の発する音声を効率的に取得することができる。

【0034】

また、ユーザＰ１にとって話者Ｐ３～Ｐ５の方も見やすい。つまり、ユーザＰ１は、音声認識装置１を使用しながら話者Ｐ３～Ｐ５との間で自然に会話をすることができる。
。

【0035】

なお、第４マイクロフォンＭ４は、ユーザＰ１により音声認識装置１に対して特定の操作がされたときにオン状態となるように制御されてもよい。

【0036】

以上のように、音声認識装置１を用いて、会話が行われる状況に合わせて、音声認識装置１を手に持った場合でも、音声認識装置１をテーブル９、机等の静止体に置いた場合でも、それに応じて複数のマイクロフォンの各々のオン・オフが制御される。音声認識装置１は、オン状態とされたマイクロフォンにより話者の音声を効率的に取得できる。同時に、音声認識結果と翻訳結果とがユーザにとって表示部Ｄを通して視認しやすい。

【0037】

［その他］
音声認識装置１の外形が略三角柱である例を示したが、直方体など別の形状であってもよい。また、加速度センサに限られず、音声認識装置１が静止状態にあるか否かを判定できるセンサ手段が音声認識装置１に設けられていればよい。

【0038】

音声認識装置１は、翻訳部２２を備えていなくてもよい。この場合、音声認識装置１は入力された音声を言語として認識し、その認識結果を音声認識装置１内の記憶装置に記憶することができる。あるいは、音声認識結果は、表示部Ｄに表示されてもよいし、音声認識装置１の外部にある別の装置に送られてもよい。この音声認識結果は、議事録などの記録の材料として用いることができ、その会話、会議の生産性の解析材料として用いることもできる。

【0039】

音声認識装置１は、手で持った状態でも使用可能な程度に小型・軽量であり、かつ複数の指向性マイクロフォンを備えている。複数の指向性マイクロフォンにより、対象となる会話、会議の参加者が音声認識装置から比較的離れた位置にいたとしても、その参加者の発する音声を捉えて認識することができる。つまり、対象となる会話、会議の参加者全員の音声を捉えて認識できる可能性が高まる。

【0040】

上記実施形態について改めて以下に説明する。
［その１］
音声認識装置１は、複数のマイクロフォンと、前記音声認識装置が静止状態にあるか否かを判定するセンサ２３と、前記センサによる判定結果に応じて複数の前記マイクロフォンの各々をオン状態とするかオフ状態とするかを制御するマイクロフォン制御部２４と、オン状態にある少なくとも１つの前記マイクロフォンに入力された音声を認識する音声認識部２１とを備える。

【0041】

これにより、音声認識装置の状態に合わせて各マイクロフォンのオン・オフが制御される。その結果、音声認識の対象となる音声を効率的に取得することができる。

【0042】

［その２］
音声認識装置１の外形が、略三角形である２つの面と略矩形である３つの面とを有する略三角柱であり、前記略三角形である２つの面（左側面部１３及び右側面部１４）の各々と、前記略矩形である３つの面（正面部１１、上面部１５及び下面部１６）のうち２つの面（正面部１１及び上面部１５）の各々とに、マイクロフォンが配置されている。

【0043】

これにより、音声認識装置のユーザが会話をする相手である話者に向かって各マイクロフォンの音声取得可能領域が広がりを有することとなる可能性が高まる。これは、音声の効率的な取得につながる。

【0044】

［その３］
音声認識装置が静止状態にあると前記センサが判定した場合、前記マイクロフォン制御部は、複数の前記マイクロフォンの全てをオン状態とする。また、音声認識装置が静止状態にないと前記センサが判定した場合、前記マイクロフォン制御部は、前記略矩形である３つの面のうち２つの面（正面部１１及び上面部１５）の各々に配置されたマイクロフォンをオン状態とし、前記略三角形である２つの面（左側面部１３及び右側面部１４）の各々に配置されたマイクロフォンをオフ状態とする。

【0045】

これにより、音声認識装置が静止状態にある場合と静止状態にない場合との双方において、音声を効率的に取得できる可能性が高まる。

【0046】

［その４］
音声認識装置１は、音声認識部２１による音声認識結果を表示する表示部Ｄをさらに備える。これにより、音声認識装置のユーザは、表示部Ｄを通して音声認識結果を視認することができる。

【0047】

［その５］
音声認識装置１は、音声認識部２１により第１の言語として認識された音声を、前記第１の言語とは異なる第２の言語へ翻訳する翻訳部２２をさらに備える。表示部Ｄにはさらに、翻訳部による翻訳結果が表示される。これにより、音声認識結果が、認識された言語とは別の言語へ翻訳され、その翻訳結果を、表示部Ｄを通してユーザが視認することができる。

【0048】

以下、音声認識装置の別の例について説明する。

【0049】

図１２～図１７に、外形が略四角錐台状である音声認識装置１Ａを示す。四角錐台とは、四角錐を底面に平行な平面で２つに切り、元の四角錐の頭頂点を含む部分を除いた立体図形である。言い換えれば、四角錐台は、四角錐の４枚の錐体面と、四角錐の底面と、該底面に平行な平面とによって囲まれる立体図形である。

【0050】

音声認識装置１Ａの外形を形成する２つの平行な平面部のうち、表面積が大きい一方の平面部を正面部と呼び、符号１１Ａにより示す。また、表面積が小さい他方の平面部を背面部と呼び、符号１２Ａにより示す。正面部１１Ａ及び背面部１２Ａはいずれも略長方形である。正面部１１Ａには、音声認識装置１Ａのユーザが視認する表示部Ｄが配置されている。

【0051】

正面部１１Ａの２本の長辺部１１ａ_１及び１１ｂ_１が水平となるようにし、かつ一方の長辺１１ａ_１が他方の長辺１１ｂ_１よりも上方に位置するようにして、音声認識装置１Ａを正面から水平に見た状態を考える。この状態で、４つの錐体面部のうち、左側に位置する錐体面部を音声認識装置１Ａの左側面部と呼び、符号１３Ａにより示すとともに、右側に位置する錐体面部を音声認識装置１Ａの右側面部と呼び、符号１４Ａにより示す。同じ状態で、上側に位置する錐体面部を音声認識装置１Ａの上面部と呼び、符号１５Ａにより示すとともに、下側に位置する錐体面部を音声認識装置１Ａの下面部と呼び、符号１６Ａにより示す。

【0052】

音声認識装置１Ａの正面部１１Ａ及び背面部１２Ａが略長方形であるとともに、正面部１１Ａの長辺部１１ａ_１及び１１ｂ_１の長さに比べて、正面部１１Ａから背面部１２Ａまでの長さは短い。つまり、音声認識装置１Ａは左右方向に細長い形状である。

【0053】

上面部１５Ａに第１マイクロフォンＭ１が配置されている。左側面部１３Ａに第２マイクロフォンＭ２が配置され、右側面部１４Ａに第３マイクロフォンＭ３が配置されている。さらに、正面部１１Ａにおいて、表示部Ｄの下方には第４マイクロフォンＭ４が配置されている。

【0054】

図１８～図２５に、外形が略四角錐台状である別の音声認識装置１Ｂを示す。

【0055】

音声認識装置１Ｂの外形を形成する２つの平行な平面部のうち、表面積が大きい一方の平面部を正面部と呼び、符号１１Ｂにより示す。また、表面積が小さい他方の平面部を背面部と呼び、符号１２Ｂにより示す。正面部１１Ｂ及び背面部１２Ｂはいずれも略長方形である。正面部１１Ｂには、音声認識装置１Ｂのユーザが視認する表示部Ｄが配置されている。

【0056】

正面部１１Ａの２本の長辺部１１ａ_２及び１１ｂ_２が水平となるようにし、かつ一方の長辺１１ａ_２が他方の長辺１１ｂ_２よりも上方に位置するようにして、音声認識装置１Ｂを正面から水平に見た状態を考える。この状態で、４つの錐体面部のうち、左側に位置する錐体面部を音声認識装置１Ａの左側面部と呼び、符号１３Ｂにより示すとともに、右側に位置する錐体面部を音声認識装置１Ｂの右側面部と呼び、符号１４Ｂにより示す。同じ状態で、上側に位置する錐体面部を音声認識装置１Ｂの上面部と呼び、符号１５Ｂにより示すとともに、下側に位置する錐体面部を音声認識装置１Ｂの下面部と呼び、符号１６Ｂにより示す。

【0057】

音声認識装置１Ｂの正面部１１Ｂ及び背面部１２Ｂが略長方形であるとともに、正面部１１Ｂの長辺部１１ａ_２及び１１ｂ_２の長さに比べて、正面部１１Ｂから背面部１２Ｂまでの長さは短い。つまり、音声認識装置１Ｂは左右方向に細長い形状である。

【0058】

上面部１５Ｂに第１マイクロフォンＭ１が配置されている。左側面部１３Ｂに第２マイクロフォンＭ２が配置され、右側面部１４Ｂに第３マイクロフォンＭ３が配置されている。さらに、正面部１１Ｂには、表示部Ｄの下方には第４マイクロフォンＭ４が配置されている。

【0059】

以上のような、外形が略四角錐台状の音声認識装置についても、外形が略三角柱状の音声認識装置と同様、音声認識の対象となる会話が行われる状況に合わせて効率的に使用することができる。略三角柱を含む五面体を外形とする音声認識装置と、略四角錐台を含む六面体を外形とする音声認識装置とについても同様の効果が得られる。

【0060】

本発明の特定の実施形態について説明したが、本発明はこのような実施形態に限定されず、本発明の技術的思想に基づく種々の変更は本発明の概念に含まれる。

【符号の説明】

【0061】

１音声認識装置
１１正面部、１３左側面部、１４右側面部、１５上面部、１６下面部
Ｄ表示部（ディスプレイ）、Ｍ１～Ｍ４マイクロフォン
２１音声認識部、２２翻訳部、２３センサ、２４マイクロフォン制御部

【図1】