特開2022-169658 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ パイオニア株式会社の特許一覧

特開2022-169658入出力装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2022169658

(43)【公開日】2022-11-09

(54)【発明の名称】入出力装置

(51)【国際特許分類】

G10L 13/10 20130101AFI20221101BHJP

G10L 13/00 20060101ALI20221101BHJP

G10L 25/21 20130101ALI20221101BHJP

G10L 25/51 20130101ALI20221101BHJP

G10L 15/22 20060101ALI20221101BHJP

G06F 3/16 20060101ALI20221101BHJP

【ＦＩ】

G10L13/10 114

G10L13/00 100M

G10L25/21

G10L25/51

G10L15/22 300Z

G06F3/16 650

G06F3/16 620

【審査請求】有

【請求項の数】1

【出願形態】ＯＬ

(21)【出願番号】P 2022130132

(22)【出願日】2022-08-17

(62)【分割の表示】P 2020164445の分割

【原出願日】2013-04-02

(71)【出願人】

【識別番号】000005016

【氏名又は名称】パイオニア株式会社

(74)【代理人】

【識別番号】100134832

【弁理士】

【氏名又は名称】瀧野文雄

(74)【代理人】

【識別番号】100165308

【弁理士】

【氏名又は名称】津田俊明

(74)【代理人】

【識別番号】100115048

【弁理士】

【氏名又は名称】福田康弘

(72)【発明者】

【氏名】外山貴嗣

(72)【発明者】

【氏名】猪谷浩和

(72)【発明者】

【氏名】松本正陽

(72)【発明者】

【氏名】田辺正史

(57)【要約】

【課題】入力に対する応答を周囲の状況に応じて変化させて出力することができる入出力装置を提供する。
【解決手段】音声認識装置１において、マイク２から出力された音声信号のレベルをレベルチェック部３１が検出し、ユースケース判断部３３が、検出された音声信号レベルが予め定められた音声信号レベルより小さいか否か判断する。そして、検出された音声信号レベルが予め定められた音声信号レベルより小さい場合は、スピーカから出力される音を小さくするとともに表示デバイスの輝度を低下させる。
【選択図】図１

【特許請求の範囲】

【請求項1】

発話した入力音声を音声認識手段に出力する第１出力手段と、
前記音声認識手段からの応答を出力する第２出力手段と、
前記入力音声の入力音声レベル及び所定の音声レベルを比較する音声レベル比較手段と、
前記音声レベル比較手段で比較した前記入力音声レベルが前記所定の音声レベルよりも小さい場合、前記応答を抑制した出力に前記第２出力手段を制御する制御手段と、
を備えることを特徴とする入出力装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、発話した音声を認識する音声認識装置等に用いる入出力装置に関する。

【背景技術】

【0002】

近年、車載機器や携帯機器等において、ボタン等の操作が不要で、音声のみで簡単に操作できるようにするため、音声認識装置（音声認識機能）が内蔵されているものが多い。

【0003】

この種の音声認識装置においては、入力音声に対して、入力音声に対応する処理結果を音声情報や画像等の表示情報で応答として出力したり、入力を受け付けた旨や認識結果等の応答を音声情報や表示情報で出力したりする。このような応答の方法は、発話者の周囲の状況を考慮せずに、例えば、一定の音声レベルや一定の輝度など必ず決められた方式で行われていた。

【0004】

音声認識装置で発話者の周囲の状況を考慮して動作する方法としては、特許文献１に記載の方法が一例として挙げられる。特許文献１に記載の音声認識装置は、携帯型情報端末装置の使用状態に応じて入力した音声レベルを適切なレベルに増幅し、認識率低下の防止を可能としている。

【先行技術文献】

【特許文献】

【0005】

【特許文献1】特許第４２９９７６８号公報

【発明の概要】

【発明が解決しようとする課題】

【0006】

従来の音声認識装置では、発話者の周囲の状況を考慮せずに、必ず決められた方式で応答するので、発話者が周囲の人間に応答の内容を、聞かれたくない、又は、見られたくない、といった場合には対応できず音声認識装置の利用を控えるしかなかった。そのため、そのような状況ではボタン等による操作を行わなければならず不便に感じるという問題があった。

【0007】

特許文献１に記載された音声認識装置は、あくまで認識率低下を防止するために、入力音声レベルを制御するものであり、上述したような音声認識装置からの応答については何ら考慮されていない。

【0008】

そこで、本発明は、上述した問題に鑑み、例えば、入力に対する応答を周囲の状況に応じて変化させて出力することができる入出力装置を提供することを課題とする。

【課題を解決するための手段】

【0009】

上記課題を解決するために、請求項１に記載の発明は、音声を出力する音声出力部と、
画像を表示する表示部と、ユーザの発話音声を音声信号として音声認識手段に出力する発話音声信号出力部と、前記音声認識手段の認識結果に応じた応答情報を取得する応答情報取得部と、前記音声信号の音声レベルが所定の音声レベルよりも小さい場合には、前記応答情報に基づく音声を前記音声出力部により出力させず、且つ前記応答情報に基づく画像を前記表示部により表示させる制御部と、を備えることを特徴としている。

【0010】

請求項４に記載の発明は、音声出力部と表示部を備える入出力装置が実行する入出力方法であって、ユーザの発話音声を音声信号として音声認識手段に出力する発話音声信号出力工程と、前記音声認識手段の認識結果に応じた応答情報を取得する応答情報取得工程と、前記音声信号の音声レベルが所定の音声レベルよりも小さい場合には、前記応答情報に基づく音声を前記音声出力部により出力させず、且つ前記応答情報に基づく画像を前記表示部により表示させる制御工程と、を含むことを特徴としている。

【0011】

請求項５に記載の発明は、音声出力部と表示部を備える入出力装置のコンピュータにより実行される入出力プログラムであって、前記コンピュータを、ユーザの発話音声を音声信号として音声認識手段に出力する発話音声信号出力部と、前記音声認識手段の認識結果に応じた応答情報を取得する応答情報取得部と、前記音声信号の音声レベルが所定の音声レベルよりも小さい場合には、前記応答情報に基づく音声を前記音声出力部により出力させず、且つ前記応答情報に基づく画像を前記表示部により表示させる制御部と、して機能させることを特徴としている。

【0012】

請求項６に記載の発明は、請求項５に記載の入出力プログラムを格納したことを特徴としている。

【図面の簡単な説明】

【0013】

【図1】本発明の第１の実施例にかかる入出力装置の構成図である。

【図2】図１に示された入出力装置の動作のフローチャートである。

【図3】本発明の第２の実施例にかかる入出力装置の構成図である。

【図4】図２に示された入出力装置の動作のフローチャートである。

【図5】本発明の他の実施例にかかる入出力装置の構成図である。

【図6】本発明の他の実施例にかかる入出力装置の構成図である。

【発明を実施するための形態】

【0014】

以下、本発明の一実施形態にかかる入出力装置を説明する。本発明の一実施形態にかかる入出力装置は、発話した入力音声を集音する第１集音手段と、第１集音手段が集音した入力音声を音声認識手段に出力する第１出力手段と、音声認識手段からの応答を取得する応答取得手段と、応答取得手段が取得した応答を出力する第２出力手段と、を有している。そして、第１集音手段が集音した入力音声の音声レベルである入力音声レベルを検出し、その入力音声レベルを予め定めた所定の音声レベルと比較する音声レベル比較手段と、音声レベル比較手段が比較した入力音声レベルが所定の音声レベルよりも小さい場合に、周囲から応答が認識しにくくなるように第２出力手段の出力を変化させる制御手段と、を更に有している。このようにすることにより、入力音声の音声レベルが小さい場合は、音声認識の応答を周囲に聞かれたくない、又は、見られたくないと判断して第２出力手段の出力を周囲から認識しにくくなるように変化させることができる。したがって、入力に対する応答を周囲の状況に応じて変化させて出力することができる。

【0015】

また、第２出力手段は、応答を音として出力する音声出力手段を有し、制御手段は、音声レベル比較手段が比較した結果が、所定の音声レベルよりも小さい場合に、音声出力手段から出力される音を小さくしてもよい。このようにすることにより、音声認識の応答を周囲に聞かれたくない場合にスピーカ等の音声出力手段から出力される音を小さくすることができる。

【0016】

また、第２出力手段は、応答を画像として表示する表示手段を更に有し、制御手段は、音声レベル比較手段が比較した結果が、所定の音声レベルよりも小さい場合に、表示手段の表示を停止させるとともに、音声出力手段から出力される音を小さくしてもよい。このようにすることにより、音声出力手段と表示手段の双方を有する際には、表示手段の表示を止めてスピーカ等の音声出力手段から出力される音を小さくして出力することができる。

【0017】

また、第２出力手段は、応答を音として外部音声出力手段から出力させるための出力インタフェースを更に有し、制御手段は、音声レベル比較手段が比較した結果が、所定の音声レベルよりも小さい場合に、出力インタフェースのみに応答を出力させるようにしてもよい。このようにすることにより、音声認識の応答を周囲に聞かれたくない場合に、イヤホンなどの外部音声出力手段のみから音を出力させることができる。

【0018】

また、第２出力手段は、応答を画像として表示する表示手段を有し、制御手段は、音声レベル比較手段が比較した結果が、所定の音声レベルよりも小さい場合に、画像が周囲から認識しにくくなるように表示手段の表示を変化させるようにしてもよい。このようにすることにより、音声認識の応答を周囲に見られたくない場合に、例えば、液晶ディスプレイ等の表示手段の輝度や視認角度などを変化させることができる。

【0019】

また、第２出力手段は、応答を音として出力する音声出力手段を更に有し、制御手段は、音声レベル比較手段が比較した結果が、所定の音声レベルよりも小さい場合に、音声出力手段の出力を停止させるとともに、画像が周囲から認識しにくくなるように表示手段の表示を変化させてもよい。このようにすることにより、音声出力手段と表示手段の双方を有する際には、音声出力手段からの音の出力を止めて表示装置の表示を認識しにくくすることができる。

【0020】

また、本発明の一実施形態にかかる入出力装置は、発話した入力音声を集音する第１集音手段と、入力音声以外の周囲音を集音する第２集音手段と、第１集音手段が集音した入力音声を音声認識手段に出力する第１出力手段と、第２集音手段が集音した周囲音の音声レベルである周囲音レベルを検出する周囲音レベル検出手段と、音声認識手段からの応答を取得する応答取得手段と、応答取得手段が取得した応答を出力する第２出力手段と、を有している。そして、第１集音手段が集音した入力音声の音声レベルである入力音声レベルを検出し、その入力音声レベルと周囲音レベル検出手段が検出した周囲音レベルとの比を算出する比算出手段と、比算出手段が算出した比が予め定めた所定の値よりも小さい場合に、周囲から応答が認識しにくくなるように第２出力手段の出力を変化させる制御手段と、とを更に有している。このようにすることにより、発話者の周囲の状況を入力音声と周囲音との比から判断することができる。つまり、発話した入力音声レベルと周囲音レベルの比（Ｓ／Ｎ比）が小さい場合は周囲に人が多い状況であって小さい声で発話していると判断できるので、音声認識の応答を周囲に聞かれたくない、又は、見られたくないとして出力手段の出力を変化させることができる。

【0021】

また、本発明の一実施形態にかかる入出力方法は、発話した入力音声に対して音声認識手段からの応答を出力する入出力装置における入出力方法であって、入力音声を集音する第１集音手段が集音した音声の音声レベルである入力音声レベルを検出し、その入力音声レベルを予め定めた所定の音声レベルと比較する音声レベル比較工程と、音声レベル比較工程で比較した入力音声レベルが所定の音声レベルよりも小さい場合に、周囲から音声認識手段の応答が認識しにくくなるように、応答の出力を変化させる制御工程と、を含んでいる。このようにすることにより、入力音声の音声レベルが小さい場合は、音声認識の応答を周囲に聞かれたくない、又は、見られたくないと判断して応答の出力を変化させることができる。したがって、入力に対する応答を周囲の状況に応じて変化させて出力することができる。

【0022】

また、上述した入出力方法をコンピュータにより実行させる入出力プログラムとして構成してもよい。このようにすることにより、コンピュータを利用して、入力音声の音声レベルが小さい場合は、音声認識の応答を周囲に聞かれたくない、又は、見られたくないと判断して応答の出力を変化させることができる。したがって、入力に対する応答を周囲の状況に応じて変化させて出力することができる。

【0023】

また、上述した音声認識プログラムをコンピュータ読み取り可能な記録媒体に格納してもよい。このようにすることにより、当該プログラムを機器に組み込む以外に単体でも流通させることができ、バージョンアップ等も容易に行える。

【0024】

また、本発明の一実施形態にかかる入出力方法は、発話した入力音声に対して音声認識手段からの応答を出力する入出力装置における入出力方法であって、入力音声を集音する第１集音手段が集音した音声の音声レベルである入力音声レベルを検出し、入力音声以外の周囲音を集音する第２集音手段が集音した周囲音の音声レベルである周囲音レベルを検出し、入力音声レベルと周囲音レベルとの比を算出する比算出工程と、比算出工程で比較した比が予め定めた所定の値よりも小さい場合に、周囲から音声認識手段の応答が認識しにくくなるように、応答の出力を変化させる制御工程と、を含んでいる。このようにすることにより、発話者の周囲の状況を入力音声と周囲音との比から判断することができる。つまり、発話した入力音声レベルと周囲音レベルの比（Ｓ／Ｎ比）が小さい場合は周囲に人が多い状況であって小さい声で発話していると判断できるので、音声認識の応答を周囲に聞かれたくない、又は、見られたくないとして出力手段の出力を変化させることができる。

【0025】

また、上述した入出力方法をコンピュータにより実行させる入出力プログラムとして構成してもよい。このようにすることにより、コンピュータを利用して、Ｓ／Ｎ比が小さい場合は、音声認識の応答を周囲に聞かれたくない、又は、見られたくないと判断して応答の出力を変化させることができる。したがって、入力に対する応答を周囲の状況に応じて変化させて出力することができる。

【0026】

【実施例0027】

本発明の第１の実施例にかかる入出力装置を有する音声認識装置を図１および図２を参照して説明する。音声認識装置１は図１に示すように、マイク２と、制御装置３と、外部出力装置４と、を有している。

【0028】

第１集音手段としてのマイク２は、ユーザが発話した音声（入力音声）を集音して電気信号に変換し音声信号として制御装置３に出力する。

【0029】

制御装置３は、レベルチェック部３１と、音声認識エンジン部３２と、ユースケース判断部３３と、を有している。制御装置３は、例えばマイクロコンピュータ（マイコン）やデジタルシグナルプロセッサ（ＤＳＰ）、あるいはＡＳＩＣ（Application Specific Integrated Circuit）などで構成されている。

【0030】

第１出力手段、音声レベル比較手段としてのレベルチェック部３１は、マイク２から入力された音声信号を音声認識エンジン部３２に出力する。即ち、第１集音手段が集音した入力音声を音声認識手段に出力する。レベルチェック部３１は、マイク２から入力された音声信号のレベルを検出して入力音声レベルとしてユースケース判断部３３に出力する。即ち、第１集音手段が集音した入力音声の音声レベルである入力音声レベルを検出する。なお、本明細書における音声信号のレベルとは対象とする音の大きさを示し、例えば、音声信号の振幅の最大値や平均値などを示している。

【0031】

音声認識エンジン部３２は、レベルチェック部３１から入力された音声信号をデジタル信号に変換し音声認識処理を行う（レベルチェック部３１でデジタル信号に変換してもよい）。音声認識処理は、統計的手法、動的時間伸縮法、隠れマルコフモデルなど公知の方法を用いればよく特に限定されない。音声認識エンジン部３２は、音声認識処理の結果に関する応答を外部出力装置４に出力する。音声認識処理の結果に関する応答とは、発話された音声内容に対する回答にかかる音声情報や表示情報に限らず、当該音声を認識したことを示す音声情報や表示情報、または当該音声を認識出来なかったことを示す音声情報や表示情報、あるいは次の命令等の入力を促す音声情報や表示情報等も含む。

【0032】

また、音声認識エンジン部３２は、音声認識した結果、図示しない他の処理装置等に対する命令であった場合は当該他の処理装置に対して命令を出力する。なお、この他の処理装置は、音声認識装置１と一体的に構成されているものに限らず、着脱自在またはネットワーク等を介して無線または有線で通信するようになっていてもよい。図１に示した構成の場合は、制御装置３に音声認識エンジン部３２が含まれているので、音声認識エンジン部３２が、音声認識手段と音声認識手段からの応答を取得する応答取得手段とを兼ねる。

【0033】

音声レベル比較手段、制御手段としてのユースケース判断部３３は、レベルチェック部３１で検出した入力音声レベルが、予め定めた所定の音声信号レベル（予め定めた所定の音声レベル）よりも小さい場合は、周囲に音声認識の応答を聞かれたくない、又は、見られたくない状況を示すモードであるプライベートモードと判断し、外部出力装置４に対して当該プライベートモードに対応した出力に変化させるよう制御信号を出力する。即ち、入力音声レベルを予め定めた所定の音声レベルと比較している。そして、音声レベル比較手段が比較した入力音声レベルが所定の音声レベルよりも小さい場合に、周囲から応答が認識しにくくなるように第２出力手段の出力を変化させている。

【0034】

なお、入力音声レベルが小さいと音声認識エンジン部３２における認識率が低下する可能性があるため、予め定めた所定の音声信号レベルは、音声認識エンジン部３２における認識率が低下しない範囲で定めることが望ましい。あるいは、特許文献１に記載された処理など周囲の雑音の影響を少なくするような処理を施した上で音声認識処理を行うようにしても良い。

【0035】

なお、図１では、制御装置３は、レベルチェック部３１と、音声認識エンジン部３２と、ユースケース判断部３３が一体的に構成されているが、それに限らない。例えば、それぞれ個別の部品（マイコン、ＤＳＰ、ＡＳＩＣ等）で構成されていてもよい。

【0036】

第２出力手段としての外部出力装置４は、音声出力手段としての音声出力部４１と、表示手段としての表示部４２と、を有している。音声出力部４１は、音声認識エンジン部３２から出力された音声認識処理の結果に関する応答のうち、音声情報で入力された応答を音声として出力するスピーカと、スピーカに出力する音量を制御するアンプ等を有している。表示部４２は、音声認識エンジン部３２から出力された音声認識処理の結果に関する応答のうち、表示情報で入力された応答を画像（テキストのみの情報も含む）として表示する液晶ディスプレイや有機ＥＬ（Electro Luminescence）ディスプレイ等の表示デバイスと、その表示デバイスの表示を制御するドライバ回路等を有している。即ち、外部出力装置４は、応答取得手段が取得した応答を出力する。

【0037】

そして、ユースケース判断部３３がプライベートモードと判断して出力を変化させるような制御信号が入力されると、音声出力部４１は、スピーカから出力される音が小さくなるようにアンプ等が増幅率を変化させる。即ち、音声レベル比較手段が比較した結果が、所定の音声レベルよりも小さい場合に、音声出力手段から出力される音を小さくする。また、表示部４２は、表示デバイスの輝度を低下させるようにドライバ回路が制御する。即ち、音声レベル比較手段が比較した結果が、所定の音声レベルよりも小さい場合に、画像が周囲から認識しにくくなるように表示手段の表示を変化させる。

【0038】

上述した説明から明らかなように、マイク２、レベルチェック部３１、ユースケース判断部３３、外部出力装置４で、本発明の第１の実施例にかかる入出力装置１０を構成する。

【0039】

次に、上述した構成の入出力装置１０の動作を図２のフローチャートを参照して説明する。図２に示したフローチャートは制御装置３で実行される。

【0040】

まず、ステップＳ１１において、入力音声の音声信号がマイク２からレベルチェック部３１に入力されてステップＳ１２に進む。

【0041】

次に、ステップＳ１２において、レベルチェック部３１が、マイク２から入力された入力音声の音声信号の入力音声レベルを検出してユースケース判断部３３に出力し、ステップＳ１３に進む。

【0042】

次に、ステップＳ１３において、ユースケース判断部３３が、レベルチェック部３１で検出した入力音声レベルと、予め定めた所定の音声信号レベルと、を比較し、所定の音声信号レベルより小さい場合（ＹＥＳの場合）はステップＳ１４に進み、所定の音声信号レベル以上の場合（ＮＯの場合）はステップＳ１５に進む。即ち、ステップＳ１２とＳ１３で、音声レベル比較工程として機能する。

【0043】

次に、ステップＳ１４において、ステップＳ１３で所定の音声信号レベルより小さいと判断されたので、ユースケース判断部３３が、プライベートモードとして外部出力装置４の出力を周囲から認識しにくくなるように変化させる（出力制御）。具体的には上述したように、音声出力部４１は、スピーカから出力される音がデフォルトの音量よりも小さくなるようにアンプ等に増幅率を変化させ、表示部４２は、表示デバイスの輝度をデフォルトの輝度よりも低下させるようにドライバ回路に制御させる。即ち、本ステップは制御工程として機能する。ここで、デフォルトの音量、輝度とは音声認識装置１が初期状態の音量、輝度とする。

【0044】

一方、ステップＳ１５においては、ステップＳ１３で所定のレベル以上と判断されたので、ユースケース判断部３３が、通常モードとしてデフォルトの音量および輝度とする。つまり、本ステップ実行前がデフォルトの音量および輝度であった場合は、そのまま変化させない。本ステップ実行前がデフォルトの音量および輝度よりも低下させていた場合は、デフォルトの音量および輝度に戻す。

【0045】

本実施例によれば、音声認識装置１において、マイク２から出力された入力音声レベルをレベルチェック部３１が検出し、ユースケース判断部３３が、検出された入力音声レベルが予め定められた所定の音声信号レベルより小さいか否か判断する。そして、入力音声レベルが予め定められた所定の音声信号レベルより小さい場合は、スピーカから出力される音を小さくするとともに表示デバイスの輝度を低下させる。このようにすることにより、入力音声レベルが小さい場合は、音声認識の応答を周囲に聞かれたくない、又は、見られたくない状況と判断して音を小さくしたり、輝度を低下させることができる。したがって、入力に対する応答を周囲の状況に応じて変化させて出力することができる。

【実施例0046】

次に、本発明の第２の実施例にかかる音声認識装置１を図３および図４を参照して説明する。なお、前述した第１の実施例と同一部分には、同一符号を付して説明を省略する。

【0047】

本実施例にかかる入出力装置１０は、図１に示した音声認識装置１に対してマイク５が追加されている。第２集音手段としてのマイク５は、ユーザが発話する音声を集音するのではなく、音声認識装置１の周囲の音（周囲音）を集音する。即ち、発話した入力音声以外の周囲音を集音する。

【0048】

マイク５で集音された周囲音はレベルチェック部３１でレベルを検出し、その音声信号のレベル（周囲音レベル）をユースケース判断部３３に出力する。即ち、レベルチェック部３１が、第２集音手段が集音した周囲音の音声レベルである周囲音レベルを検出する周囲音レベル検出手段として機能する。

【0049】

ユースケース判断部３３は、レベルチェック部３１で検出されたマイク２が集音した入力音声レベルと周囲音レベルとの比（Ｓ／Ｎ比）を算出する。ここで、本実施例におけるＳ／Ｎ比は、入力音声レベルを周囲音レベルで除算した値（入力音声レベル／周囲音レベル）である。そして、算出されたＳ／Ｎ比が予め定めた所定の値より小さい場合は、プライベートモードと判断し、外部出力装置４に対してプライベートモードに対応した出力に変化させるよう制御信号を出力する。即ち、ユースケース判断部３３が比算出手段として機能する。

【0050】

つまり、Ｓ／Ｎ比が小さい場合は、ユーザの発話に対して周囲音が相対的に大きいことを意味するので、周囲に人が多くいる状況において小声で発話していると推測することができる。したがって、Ｓ／Ｎ比が小さい場合は周囲に音声認識エンジン部３２の応答を聞かれたくない、又は、見られたくない状況と判断してプライベートモードの動作を行わせる。なお、プライベートモード時の外部出力装置４の動作は第１の実施例と同様である。即ち、スピーカから出力される音を小さくし、表示デバイスに表示される画像が周囲から認識しにくくなるように輝度を低下させる。

【0051】

次に、本実施例における音声認識装置１の動作を図４のフローチャートを参照して説明する。図４に示したフローチャートは制御装置３で実行される。

【0052】

まず、ステップＳ２１において、音声信号がマイク２とマイク５からレベルチェック部３１に入力されてステップＳ１２に進む。

【0053】

次に、ステップＳ２２において、レベルチェック部３１が、マイク２から入力された音声信号の入力音声レベルを検出し、マイク５から入力された音声信号の周囲音レベルを検出して、それぞれユースケース判断部３３に出力し、ステップＳ２３に進む。

【0054】

次に、ステップＳ２３において、ユースケース判断部３３が、レベルチェック部３１で検出した入力音声レベルと周囲音レベルとの比（Ｓ／Ｎ比）を算出し、Ｓ／Ｎ比が所定の値より小さい場合（ＹＥＳの場合）はステップＳ２４に進み、所定の値以上の場合（ＮＯの場合）はステップＳ２５に進む。即ち、ステップＳ２２とＳ２３で、比算出工程として機能する。

【0055】

ステップＳ２４とステップＳ２５は図２のステップＳ１４とステップＳ１５と同様である。

【0056】

本実施例によれば、音声認識装置１において、入力音声レベルとマイク５から出力された周囲音のレベル（周囲音レベル）をレベルチェック部３１が検出し、ユースケース判断部３３が、入力音声レベルと周囲音レベルの比（Ｓ／Ｎ比）が予め定めた所定の値より小さいか否か判断する。そして、Ｓ／Ｎ比が予め定めた所定の値より小さい場合は、例えばスピーカから出力される音を小さくするとともに表示デバイスの輝度を低下させる。このようにすることにより、Ｓ／Ｎ比が小さい場合は、音声認識の応答を周囲に聞かれたくない、又は、見られたくないと判断して音を小さくしたり、輝度を低下させることができる。したがって、入力に対する応答を周囲の状況に応じて変化させることができる。

【0057】

なお、上述した２つの実施例では、表示部４２が有する表示デバイスの輝度を低下させることで表示される画像が周囲から認識しにくくなるようにしていたが、それに限らず、例えば、表示デバイスの視認角度を狭くするようにしてもよい。この場合は、例えば液晶素子に電圧を印加することで液晶の配向状態を変化させるなどとして偏光方向を変化させるフィルタ等を表示デバイスの表面に設ければよい。

【0058】

また、上述した２つの実施例では、音声出力部４１と表示部４２の双方の制御を変化させていたが、いずれか一方のみであってもよい。

【0059】

また、上述した２の実施例のように、スピーカ（音声出力部４１）と表示デバイス（表示部４２）の双方を有している場合において、プライベートモードと判断された際は、表示デバイスの表示を停止し（画面を消し）、スピーカが出力する音を小さくするようにしてもよい。または、逆に、スピーカからの音の出力を停止し、表示デバイスの輝度を低下させたり視認角度を狭くするようにしてもよい。即ち、音声出力手段と表示手段の双方を有している場合は、一方の動作を停止させることも周囲から応答が認識しにくくなるように出力を変化させることに含まれる。

【0060】

また、音声認識エンジン部３２は、図１や図３に示したような制御装置３に含む形態に限らず、例えば、ネットワーク等を介して無線または有線で通信する外部サーバ等に設けられていてもよい。その一例を図５に示す。図５では、制御装置３に通信部３４が設けられている。通信部３４は、レベルチェック部３１から入力された音声信号をインターネット３０に接続されたサーバ２０内に設けられた音声認識エンジン部２１に出力する。そして、通信部３４は、音声認識エンジン部２１から入力された応答を外部出力装置４や他の処理装置等に出力する。図５に示した場合においては、通信部３４が第１出力手段および応答取得手段として機能する。

【0061】

また、図６に示したように、イヤホンやヘッドホンなどの外部音声出力手段６を接続するための端子や外部音声出力手段６とＢｌｕｅｔｏｏｔｈ（登録商標）などで無線通信をするための回路やアンテナ等の出力インタフェース４３を有している場合がある。

【0062】

図６に示した出力インタフェース４３は、音声出力部４１と切替スイッチ４４で切替可能となっている。つまり、イヤホンやヘッドホンが接続された場合は、切替スイッチ４４を出力インタフェース４３側に切り替えて音声出力部のスピーカからは音が出力されないようになっている。

【0063】

図６に示した出力インタフェース４３を有している場合において、プライベートモードと判断された際は、表示デバイスの表示を停止し、出力インタフェースのみから音声認識エンジン部３２の応答にかかる音（音声信号）を出力するようにしてもよい。このようにすることにより、音声認識の応答を周囲に見られたくない場合に、イヤホンやヘッドホンなどの外部音声出力手段から音のみを出力させることができる。

【0064】

また、レベルチェック部３１と、ユースケース判断部３３をマイコン等のコンピュータで構成し、図２や図４に示したフローチャートをコンピュータプログラムとすれば、入出力プログラムとして構成することができる。

【0065】

また、本発明は上記実施例に限定されるものではない。即ち、当業者は、従来公知の知見に従い、本発明の骨子を逸脱しない範囲で種々変形して実施することができる。かかる変形によってもなお本発明の入出力装置の構成を具備する限り、勿論、本発明の範疇に含まれるものである。

IP Force 特許公報掲載プロジェクト 2022.1.31 β版