IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ パイオニア株式会社の特許一覧

<>
  • 特開-入出力装置 図1
  • 特開-入出力装置 図2
  • 特開-入出力装置 図3
  • 特開-入出力装置 図4
  • 特開-入出力装置 図5
  • 特開-入出力装置 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022169658
(43)【公開日】2022-11-09
(54)【発明の名称】入出力装置
(51)【国際特許分類】
   G10L 13/10 20130101AFI20221101BHJP
   G10L 13/00 20060101ALI20221101BHJP
   G10L 25/21 20130101ALI20221101BHJP
   G10L 25/51 20130101ALI20221101BHJP
   G10L 15/22 20060101ALI20221101BHJP
   G06F 3/16 20060101ALI20221101BHJP
【FI】
G10L13/10 114
G10L13/00 100M
G10L25/21
G10L25/51
G10L15/22 300Z
G06F3/16 650
G06F3/16 620
【審査請求】有
【請求項の数】1
【出願形態】OL
(21)【出願番号】P 2022130132
(22)【出願日】2022-08-17
(62)【分割の表示】P 2020164445の分割
【原出願日】2013-04-02
(71)【出願人】
【識別番号】000005016
【氏名又は名称】パイオニア株式会社
(74)【代理人】
【識別番号】100134832
【弁理士】
【氏名又は名称】瀧野 文雄
(74)【代理人】
【識別番号】100165308
【弁理士】
【氏名又は名称】津田 俊明
(74)【代理人】
【識別番号】100115048
【弁理士】
【氏名又は名称】福田 康弘
(72)【発明者】
【氏名】外山 貴嗣
(72)【発明者】
【氏名】猪谷 浩和
(72)【発明者】
【氏名】松本 正陽
(72)【発明者】
【氏名】田辺 正史
(57)【要約】
【課題】入力に対する応答を周囲の状況に応じて変化させて出力することができる入出力装置を提供する。
【解決手段】音声認識装置1において、マイク2から出力された音声信号のレベルをレベルチェック部31が検出し、ユースケース判断部33が、検出された音声信号レベルが予め定められた音声信号レベルより小さいか否か判断する。そして、検出された音声信号レベルが予め定められた音声信号レベルより小さい場合は、スピーカから出力される音を小さくするとともに表示デバイスの輝度を低下させる。
【選択図】図1
【特許請求の範囲】
【請求項1】
発話した入力音声を音声認識手段に出力する第1出力手段と、
前記音声認識手段からの応答を出力する第2出力手段と、
前記入力音声の入力音声レベル及び所定の音声レベルを比較する音声レベル比較手段と、
前記音声レベル比較手段で比較した前記入力音声レベルが前記所定の音声レベルよりも小さい場合、前記応答を抑制した出力に前記第2出力手段を制御する制御手段と、
を備えることを特徴とする入出力装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、発話した音声を認識する音声認識装置等に用いる入出力装置に関する。
【背景技術】
【0002】
近年、車載機器や携帯機器等において、ボタン等の操作が不要で、音声のみで簡単に操作できるようにするため、音声認識装置(音声認識機能)が内蔵されているものが多い。
【0003】
この種の音声認識装置においては、入力音声に対して、入力音声に対応する処理結果を音声情報や画像等の表示情報で応答として出力したり、入力を受け付けた旨や認識結果等の応答を音声情報や表示情報で出力したりする。このような応答の方法は、発話者の周囲の状況を考慮せずに、例えば、一定の音声レベルや一定の輝度など必ず決められた方式で行われていた。
【0004】
音声認識装置で発話者の周囲の状況を考慮して動作する方法としては、特許文献1に記載の方法が一例として挙げられる。特許文献1に記載の音声認識装置は、携帯型情報端末装置の使用状態に応じて入力した音声レベルを適切なレベルに増幅し、認識率低下の防止を可能としている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特許第4299768号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
従来の音声認識装置では、発話者の周囲の状況を考慮せずに、必ず決められた方式で応答するので、発話者が周囲の人間に応答の内容を、聞かれたくない、又は、見られたくない、といった場合には対応できず音声認識装置の利用を控えるしかなかった。そのため、そのような状況ではボタン等による操作を行わなければならず不便に感じるという問題があった。
【0007】
特許文献1に記載された音声認識装置は、あくまで認識率低下を防止するために、入力音声レベルを制御するものであり、上述したような音声認識装置からの応答については何ら考慮されていない。
【0008】
そこで、本発明は、上述した問題に鑑み、例えば、入力に対する応答を周囲の状況に応じて変化させて出力することができる入出力装置を提供することを課題とする。
【課題を解決するための手段】
【0009】
上記課題を解決するために、請求項1に記載の発明は、音声を出力する音声出力部と、
画像を表示する表示部と、ユーザの発話音声を音声信号として音声認識手段に出力する発話音声信号出力部と、前記音声認識手段の認識結果に応じた応答情報を取得する応答情報取得部と、前記音声信号の音声レベルが所定の音声レベルよりも小さい場合には、前記応答情報に基づく音声を前記音声出力部により出力させず、且つ前記応答情報に基づく画像を前記表示部により表示させる制御部と、を備えることを特徴としている。
【0010】
請求項4に記載の発明は、音声出力部と表示部を備える入出力装置が実行する入出力方法であって、ユーザの発話音声を音声信号として音声認識手段に出力する発話音声信号出力工程と、前記音声認識手段の認識結果に応じた応答情報を取得する応答情報取得工程と、前記音声信号の音声レベルが所定の音声レベルよりも小さい場合には、前記応答情報に基づく音声を前記音声出力部により出力させず、且つ前記応答情報に基づく画像を前記表示部により表示させる制御工程と、を含むことを特徴としている。
【0011】
請求項5に記載の発明は、音声出力部と表示部を備える入出力装置のコンピュータにより実行される入出力プログラムであって、前記コンピュータを、ユーザの発話音声を音声信号として音声認識手段に出力する発話音声信号出力部と、前記音声認識手段の認識結果に応じた応答情報を取得する応答情報取得部と、前記音声信号の音声レベルが所定の音声レベルよりも小さい場合には、前記応答情報に基づく音声を前記音声出力部により出力させず、且つ前記応答情報に基づく画像を前記表示部により表示させる制御部と、して機能させることを特徴としている。
【0012】
請求項6に記載の発明は、請求項5に記載の入出力プログラムを格納したことを特徴としている。
【図面の簡単な説明】
【0013】
図1】本発明の第1の実施例にかかる入出力装置の構成図である。
図2図1に示された入出力装置の動作のフローチャートである。
図3】本発明の第2の実施例にかかる入出力装置の構成図である。
図4図2に示された入出力装置の動作のフローチャートである。
図5】本発明の他の実施例にかかる入出力装置の構成図である。
図6】本発明の他の実施例にかかる入出力装置の構成図である。
【発明を実施するための形態】
【0014】
以下、本発明の一実施形態にかかる入出力装置を説明する。本発明の一実施形態にかかる入出力装置は、発話した入力音声を集音する第1集音手段と、第1集音手段が集音した入力音声を音声認識手段に出力する第1出力手段と、音声認識手段からの応答を取得する応答取得手段と、応答取得手段が取得した応答を出力する第2出力手段と、を有している。そして、第1集音手段が集音した入力音声の音声レベルである入力音声レベルを検出し、その入力音声レベルを予め定めた所定の音声レベルと比較する音声レベル比較手段と、音声レベル比較手段が比較した入力音声レベルが所定の音声レベルよりも小さい場合に、周囲から応答が認識しにくくなるように第2出力手段の出力を変化させる制御手段と、を更に有している。このようにすることにより、入力音声の音声レベルが小さい場合は、音声認識の応答を周囲に聞かれたくない、又は、見られたくないと判断して第2出力手段の出力を周囲から認識しにくくなるように変化させることができる。したがって、入力に対する応答を周囲の状況に応じて変化させて出力することができる。
【0015】
また、第2出力手段は、応答を音として出力する音声出力手段を有し、制御手段は、音声レベル比較手段が比較した結果が、所定の音声レベルよりも小さい場合に、音声出力手段から出力される音を小さくしてもよい。このようにすることにより、音声認識の応答を周囲に聞かれたくない場合にスピーカ等の音声出力手段から出力される音を小さくすることができる。
【0016】
また、第2出力手段は、応答を画像として表示する表示手段を更に有し、制御手段は、音声レベル比較手段が比較した結果が、所定の音声レベルよりも小さい場合に、表示手段の表示を停止させるとともに、音声出力手段から出力される音を小さくしてもよい。このようにすることにより、音声出力手段と表示手段の双方を有する際には、表示手段の表示を止めてスピーカ等の音声出力手段から出力される音を小さくして出力することができる。
【0017】
また、第2出力手段は、応答を音として外部音声出力手段から出力させるための出力インタフェースを更に有し、制御手段は、音声レベル比較手段が比較した結果が、所定の音声レベルよりも小さい場合に、出力インタフェースのみに応答を出力させるようにしてもよい。このようにすることにより、音声認識の応答を周囲に聞かれたくない場合に、イヤホンなどの外部音声出力手段のみから音を出力させることができる。
【0018】
また、第2出力手段は、応答を画像として表示する表示手段を有し、制御手段は、音声レベル比較手段が比較した結果が、所定の音声レベルよりも小さい場合に、画像が周囲から認識しにくくなるように表示手段の表示を変化させるようにしてもよい。このようにすることにより、音声認識の応答を周囲に見られたくない場合に、例えば、液晶ディスプレイ等の表示手段の輝度や視認角度などを変化させることができる。
【0019】
また、第2出力手段は、応答を音として出力する音声出力手段を更に有し、制御手段は、音声レベル比較手段が比較した結果が、所定の音声レベルよりも小さい場合に、音声出力手段の出力を停止させるとともに、画像が周囲から認識しにくくなるように表示手段の表示を変化させてもよい。このようにすることにより、音声出力手段と表示手段の双方を有する際には、音声出力手段からの音の出力を止めて表示装置の表示を認識しにくくすることができる。
【0020】
また、本発明の一実施形態にかかる入出力装置は、発話した入力音声を集音する第1集音手段と、入力音声以外の周囲音を集音する第2集音手段と、第1集音手段が集音した入力音声を音声認識手段に出力する第1出力手段と、第2集音手段が集音した周囲音の音声レベルである周囲音レベルを検出する周囲音レベル検出手段と、音声認識手段からの応答を取得する応答取得手段と、応答取得手段が取得した応答を出力する第2出力手段と、を有している。そして、第1集音手段が集音した入力音声の音声レベルである入力音声レベルを検出し、その入力音声レベルと周囲音レベル検出手段が検出した周囲音レベルとの比を算出する比算出手段と、比算出手段が算出した比が予め定めた所定の値よりも小さい場合に、周囲から応答が認識しにくくなるように第2出力手段の出力を変化させる制御手段と、とを更に有している。このようにすることにより、発話者の周囲の状況を入力音声と周囲音との比から判断することができる。つまり、発話した入力音声レベルと周囲音レベルの比(S/N比)が小さい場合は周囲に人が多い状況であって小さい声で発話していると判断できるので、音声認識の応答を周囲に聞かれたくない、又は、見られたくないとして出力手段の出力を変化させることができる。
【0021】
また、本発明の一実施形態にかかる入出力方法は、発話した入力音声に対して音声認識手段からの応答を出力する入出力装置における入出力方法であって、入力音声を集音する第1集音手段が集音した音声の音声レベルである入力音声レベルを検出し、その入力音声レベルを予め定めた所定の音声レベルと比較する音声レベル比較工程と、音声レベル比較工程で比較した入力音声レベルが所定の音声レベルよりも小さい場合に、周囲から音声認識手段の応答が認識しにくくなるように、応答の出力を変化させる制御工程と、を含んでいる。このようにすることにより、入力音声の音声レベルが小さい場合は、音声認識の応答を周囲に聞かれたくない、又は、見られたくないと判断して応答の出力を変化させることができる。したがって、入力に対する応答を周囲の状況に応じて変化させて出力することができる。
【0022】
また、上述した入出力方法をコンピュータにより実行させる入出力プログラムとして構成してもよい。このようにすることにより、コンピュータを利用して、入力音声の音声レベルが小さい場合は、音声認識の応答を周囲に聞かれたくない、又は、見られたくないと判断して応答の出力を変化させることができる。したがって、入力に対する応答を周囲の状況に応じて変化させて出力することができる。
【0023】
また、上述した音声認識プログラムをコンピュータ読み取り可能な記録媒体に格納してもよい。このようにすることにより、当該プログラムを機器に組み込む以外に単体でも流通させることができ、バージョンアップ等も容易に行える。
【0024】
また、本発明の一実施形態にかかる入出力方法は、発話した入力音声に対して音声認識手段からの応答を出力する入出力装置における入出力方法であって、入力音声を集音する第1集音手段が集音した音声の音声レベルである入力音声レベルを検出し、入力音声以外の周囲音を集音する第2集音手段が集音した周囲音の音声レベルである周囲音レベルを検出し、入力音声レベルと周囲音レベルとの比を算出する比算出工程と、比算出工程で比較した比が予め定めた所定の値よりも小さい場合に、周囲から音声認識手段の応答が認識しにくくなるように、応答の出力を変化させる制御工程と、を含んでいる。このようにすることにより、発話者の周囲の状況を入力音声と周囲音との比から判断することができる。つまり、発話した入力音声レベルと周囲音レベルの比(S/N比)が小さい場合は周囲に人が多い状況であって小さい声で発話していると判断できるので、音声認識の応答を周囲に聞かれたくない、又は、見られたくないとして出力手段の出力を変化させることができる。
【0025】
また、上述した入出力方法をコンピュータにより実行させる入出力プログラムとして構成してもよい。このようにすることにより、コンピュータを利用して、S/N比が小さい場合は、音声認識の応答を周囲に聞かれたくない、又は、見られたくないと判断して応答の出力を変化させることができる。したがって、入力に対する応答を周囲の状況に応じて変化させて出力することができる。
【0026】
また、上述した音声認識プログラムをコンピュータ読み取り可能な記録媒体に格納してもよい。このようにすることにより、当該プログラムを機器に組み込む以外に単体でも流通させることができ、バージョンアップ等も容易に行える。
【実施例0027】
本発明の第1の実施例にかかる入出力装置を有する音声認識装置を図1および図2を参照して説明する。音声認識装置1は図1に示すように、マイク2と、制御装置3と、外部出力装置4と、を有している。
【0028】
第1集音手段としてのマイク2は、ユーザが発話した音声(入力音声)を集音して電気信号に変換し音声信号として制御装置3に出力する。
【0029】
制御装置3は、レベルチェック部31と、音声認識エンジン部32と、ユースケース判断部33と、を有している。制御装置3は、例えばマイクロコンピュータ(マイコン)やデジタルシグナルプロセッサ(DSP)、あるいはASIC(Application Specific Integrated Circuit)などで構成されている。
【0030】
第1出力手段、音声レベル比較手段としてのレベルチェック部31は、マイク2から入力された音声信号を音声認識エンジン部32に出力する。即ち、第1集音手段が集音した入力音声を音声認識手段に出力する。レベルチェック部31は、マイク2から入力された音声信号のレベルを検出して入力音声レベルとしてユースケース判断部33に出力する。即ち、第1集音手段が集音した入力音声の音声レベルである入力音声レベルを検出する。なお、本明細書における音声信号のレベルとは対象とする音の大きさを示し、例えば、音声信号の振幅の最大値や平均値などを示している。
【0031】
音声認識エンジン部32は、レベルチェック部31から入力された音声信号をデジタル信号に変換し音声認識処理を行う(レベルチェック部31でデジタル信号に変換してもよい)。音声認識処理は、統計的手法、動的時間伸縮法、隠れマルコフモデルなど公知の方法を用いればよく特に限定されない。音声認識エンジン部32は、音声認識処理の結果に関する応答を外部出力装置4に出力する。音声認識処理の結果に関する応答とは、発話された音声内容に対する回答にかかる音声情報や表示情報に限らず、当該音声を認識したことを示す音声情報や表示情報、または当該音声を認識出来なかったことを示す音声情報や表示情報、あるいは次の命令等の入力を促す音声情報や表示情報等も含む。
【0032】
また、音声認識エンジン部32は、音声認識した結果、図示しない他の処理装置等に対する命令であった場合は当該他の処理装置に対して命令を出力する。なお、この他の処理装置は、音声認識装置1と一体的に構成されているものに限らず、着脱自在またはネットワーク等を介して無線または有線で通信するようになっていてもよい。図1に示した構成の場合は、制御装置3に音声認識エンジン部32が含まれているので、音声認識エンジン部32が、音声認識手段と音声認識手段からの応答を取得する応答取得手段とを兼ねる。
【0033】
音声レベル比較手段、制御手段としてのユースケース判断部33は、レベルチェック部31で検出した入力音声レベルが、予め定めた所定の音声信号レベル(予め定めた所定の音声レベル)よりも小さい場合は、周囲に音声認識の応答を聞かれたくない、又は、見られたくない状況を示すモードであるプライベートモードと判断し、外部出力装置4に対して当該プライベートモードに対応した出力に変化させるよう制御信号を出力する。即ち、入力音声レベルを予め定めた所定の音声レベルと比較している。そして、音声レベル比較手段が比較した入力音声レベルが所定の音声レベルよりも小さい場合に、周囲から応答が認識しにくくなるように第2出力手段の出力を変化させている。
【0034】
なお、入力音声レベルが小さいと音声認識エンジン部32における認識率が低下する可能性があるため、予め定めた所定の音声信号レベルは、音声認識エンジン部32における認識率が低下しない範囲で定めることが望ましい。あるいは、特許文献1に記載された処理など周囲の雑音の影響を少なくするような処理を施した上で音声認識処理を行うようにしても良い。
【0035】
なお、図1では、制御装置3は、レベルチェック部31と、音声認識エンジン部32と、ユースケース判断部33が一体的に構成されているが、それに限らない。例えば、それぞれ個別の部品(マイコン、DSP、ASIC等)で構成されていてもよい。
【0036】
第2出力手段としての外部出力装置4は、音声出力手段としての音声出力部41と、表示手段としての表示部42と、を有している。音声出力部41は、音声認識エンジン部32から出力された音声認識処理の結果に関する応答のうち、音声情報で入力された応答を音声として出力するスピーカと、スピーカに出力する音量を制御するアンプ等を有している。表示部42は、音声認識エンジン部32から出力された音声認識処理の結果に関する応答のうち、表示情報で入力された応答を画像(テキストのみの情報も含む)として表示する液晶ディスプレイや有機EL(Electro Luminescence)ディスプレイ等の表示デバイスと、その表示デバイスの表示を制御するドライバ回路等を有している。即ち、外部出力装置4は、応答取得手段が取得した応答を出力する。
【0037】
そして、ユースケース判断部33がプライベートモードと判断して出力を変化させるような制御信号が入力されると、音声出力部41は、スピーカから出力される音が小さくなるようにアンプ等が増幅率を変化させる。即ち、音声レベル比較手段が比較した結果が、所定の音声レベルよりも小さい場合に、音声出力手段から出力される音を小さくする。また、表示部42は、表示デバイスの輝度を低下させるようにドライバ回路が制御する。即ち、音声レベル比較手段が比較した結果が、所定の音声レベルよりも小さい場合に、画像が周囲から認識しにくくなるように表示手段の表示を変化させる。
【0038】
上述した説明から明らかなように、マイク2、レベルチェック部31、ユースケース判断部33、外部出力装置4で、本発明の第1の実施例にかかる入出力装置10を構成する。
【0039】
次に、上述した構成の入出力装置10の動作を図2のフローチャートを参照して説明する。図2に示したフローチャートは制御装置3で実行される。
【0040】
まず、ステップS11において、入力音声の音声信号がマイク2からレベルチェック部31に入力されてステップS12に進む。
【0041】
次に、ステップS12において、レベルチェック部31が、マイク2から入力された入力音声の音声信号の入力音声レベルを検出してユースケース判断部33に出力し、ステップS13に進む。
【0042】
次に、ステップS13において、ユースケース判断部33が、レベルチェック部31で検出した入力音声レベルと、予め定めた所定の音声信号レベルと、を比較し、所定の音声信号レベルより小さい場合(YESの場合)はステップS14に進み、所定の音声信号レベル以上の場合(NOの場合)はステップS15に進む。即ち、ステップS12とS13で、音声レベル比較工程として機能する。
【0043】
次に、ステップS14において、ステップS13で所定の音声信号レベルより小さいと判断されたので、ユースケース判断部33が、プライベートモードとして外部出力装置4の出力を周囲から認識しにくくなるように変化させる(出力制御)。具体的には上述したように、音声出力部41は、スピーカから出力される音がデフォルトの音量よりも小さくなるようにアンプ等に増幅率を変化させ、表示部42は、表示デバイスの輝度をデフォルトの輝度よりも低下させるようにドライバ回路に制御させる。即ち、本ステップは制御工程として機能する。ここで、デフォルトの音量、輝度とは音声認識装置1が初期状態の音量、輝度とする。
【0044】
一方、ステップS15においては、ステップS13で所定のレベル以上と判断されたので、ユースケース判断部33が、通常モードとしてデフォルトの音量および輝度とする。つまり、本ステップ実行前がデフォルトの音量および輝度であった場合は、そのまま変化させない。本ステップ実行前がデフォルトの音量および輝度よりも低下させていた場合は、デフォルトの音量および輝度に戻す。
【0045】
本実施例によれば、音声認識装置1において、マイク2から出力された入力音声レベルをレベルチェック部31が検出し、ユースケース判断部33が、検出された入力音声レベルが予め定められた所定の音声信号レベルより小さいか否か判断する。そして、入力音声レベルが予め定められた所定の音声信号レベルより小さい場合は、スピーカから出力される音を小さくするとともに表示デバイスの輝度を低下させる。このようにすることにより、入力音声レベルが小さい場合は、音声認識の応答を周囲に聞かれたくない、又は、見られたくない状況と判断して音を小さくしたり、輝度を低下させることができる。したがって、入力に対する応答を周囲の状況に応じて変化させて出力することができる。
【実施例0046】
次に、本発明の第2の実施例にかかる音声認識装置1を図3および図4を参照して説明する。なお、前述した第1の実施例と同一部分には、同一符号を付して説明を省略する。
【0047】
本実施例にかかる入出力装置10は、図1に示した音声認識装置1に対してマイク5が追加されている。第2集音手段としてのマイク5は、ユーザが発話する音声を集音するのではなく、音声認識装置1の周囲の音(周囲音)を集音する。即ち、発話した入力音声以外の周囲音を集音する。
【0048】
マイク5で集音された周囲音はレベルチェック部31でレベルを検出し、その音声信号のレベル(周囲音レベル)をユースケース判断部33に出力する。即ち、レベルチェック部31が、第2集音手段が集音した周囲音の音声レベルである周囲音レベルを検出する周囲音レベル検出手段として機能する。
【0049】
ユースケース判断部33は、レベルチェック部31で検出されたマイク2が集音した入力音声レベルと周囲音レベルとの比(S/N比)を算出する。ここで、本実施例におけるS/N比は、入力音声レベルを周囲音レベルで除算した値(入力音声レベル/周囲音レベル)である。そして、算出されたS/N比が予め定めた所定の値より小さい場合は、プライベートモードと判断し、外部出力装置4に対してプライベートモードに対応した出力に変化させるよう制御信号を出力する。即ち、ユースケース判断部33が比算出手段として機能する。
【0050】
つまり、S/N比が小さい場合は、ユーザの発話に対して周囲音が相対的に大きいことを意味するので、周囲に人が多くいる状況において小声で発話していると推測することができる。したがって、S/N比が小さい場合は周囲に音声認識エンジン部32の応答を聞かれたくない、又は、見られたくない状況と判断してプライベートモードの動作を行わせる。なお、プライベートモード時の外部出力装置4の動作は第1の実施例と同様である。即ち、スピーカから出力される音を小さくし、表示デバイスに表示される画像が周囲から認識しにくくなるように輝度を低下させる。
【0051】
次に、本実施例における音声認識装置1の動作を図4のフローチャートを参照して説明する。図4に示したフローチャートは制御装置3で実行される。
【0052】
まず、ステップS21において、音声信号がマイク2とマイク5からレベルチェック部31に入力されてステップS12に進む。
【0053】
次に、ステップS22において、レベルチェック部31が、マイク2から入力された音声信号の入力音声レベルを検出し、マイク5から入力された音声信号の周囲音レベルを検出して、それぞれユースケース判断部33に出力し、ステップS23に進む。
【0054】
次に、ステップS23において、ユースケース判断部33が、レベルチェック部31で検出した入力音声レベルと周囲音レベルとの比(S/N比)を算出し、S/N比が所定の値より小さい場合(YESの場合)はステップS24に進み、所定の値以上の場合(NOの場合)はステップS25に進む。即ち、ステップS22とS23で、比算出工程として機能する。
【0055】
ステップS24とステップS25は図2のステップS14とステップS15と同様である。
【0056】
本実施例によれば、音声認識装置1において、入力音声レベルとマイク5から出力された周囲音のレベル(周囲音レベル)をレベルチェック部31が検出し、ユースケース判断部33が、入力音声レベルと周囲音レベルの比(S/N比)が予め定めた所定の値より小さいか否か判断する。そして、S/N比が予め定めた所定の値より小さい場合は、例えばスピーカから出力される音を小さくするとともに表示デバイスの輝度を低下させる。このようにすることにより、S/N比が小さい場合は、音声認識の応答を周囲に聞かれたくない、又は、見られたくないと判断して音を小さくしたり、輝度を低下させることができる。したがって、入力に対する応答を周囲の状況に応じて変化させることができる。
【0057】
なお、上述した2つの実施例では、表示部42が有する表示デバイスの輝度を低下させることで表示される画像が周囲から認識しにくくなるようにしていたが、それに限らず、例えば、表示デバイスの視認角度を狭くするようにしてもよい。この場合は、例えば液晶素子に電圧を印加することで液晶の配向状態を変化させるなどとして偏光方向を変化させるフィルタ等を表示デバイスの表面に設ければよい。
【0058】
また、上述した2つの実施例では、音声出力部41と表示部42の双方の制御を変化させていたが、いずれか一方のみであってもよい。
【0059】
また、上述した2の実施例のように、スピーカ(音声出力部41)と表示デバイス(表示部42)の双方を有している場合において、プライベートモードと判断された際は、表示デバイスの表示を停止し(画面を消し)、スピーカが出力する音を小さくするようにしてもよい。または、逆に、スピーカからの音の出力を停止し、表示デバイスの輝度を低下させたり視認角度を狭くするようにしてもよい。即ち、音声出力手段と表示手段の双方を有している場合は、一方の動作を停止させることも周囲から応答が認識しにくくなるように出力を変化させることに含まれる。
【0060】
また、音声認識エンジン部32は、図1図3に示したような制御装置3に含む形態に限らず、例えば、ネットワーク等を介して無線または有線で通信する外部サーバ等に設けられていてもよい。その一例を図5に示す。図5では、制御装置3に通信部34が設けられている。通信部34は、レベルチェック部31から入力された音声信号をインターネット30に接続されたサーバ20内に設けられた音声認識エンジン部21に出力する。そして、通信部34は、音声認識エンジン部21から入力された応答を外部出力装置4や他の処理装置等に出力する。図5に示した場合においては、通信部34が第1出力手段および応答取得手段として機能する。
【0061】
また、図6に示したように、イヤホンやヘッドホンなどの外部音声出力手段6を接続するための端子や外部音声出力手段6とBluetooth(登録商標)などで無線通信をするための回路やアンテナ等の出力インタフェース43を有している場合がある。
【0062】
図6に示した出力インタフェース43は、音声出力部41と切替スイッチ44で切替可能となっている。つまり、イヤホンやヘッドホンが接続された場合は、切替スイッチ44を出力インタフェース43側に切り替えて音声出力部のスピーカからは音が出力されないようになっている。
【0063】
図6に示した出力インタフェース43を有している場合において、プライベートモードと判断された際は、表示デバイスの表示を停止し、出力インタフェースのみから音声認識エンジン部32の応答にかかる音(音声信号)を出力するようにしてもよい。このようにすることにより、音声認識の応答を周囲に見られたくない場合に、イヤホンやヘッドホンなどの外部音声出力手段から音のみを出力させることができる。
【0064】
また、レベルチェック部31と、ユースケース判断部33をマイコン等のコンピュータで構成し、図2図4に示したフローチャートをコンピュータプログラムとすれば、入出力プログラムとして構成することができる。
【0065】
また、本発明は上記実施例に限定されるものではない。即ち、当業者は、従来公知の知見に従い、本発明の骨子を逸脱しない範囲で種々変形して実施することができる。かかる変形によってもなお本発明の入出力装置の構成を具備する限り、勿論、本発明の範疇に含まれるものである。
【符号の説明】
【0066】
2 マイク(第1集音手段)
31 レベルチェック部(第1出力手段、音声レベル比較手段、周囲音レベル検出手段)
32 音声認識エンジン部(応答取得手段)
33 ユースケース判断部(音声レベル比較手段、制御手段、比算出手段)
4 外部出力装置(第2出力手段)
41 音声出力部(第2出力手段、音声出力手段)
42 表示部(第2出力手段、表示手段)
5 マイク(第2集音手段)
6 外部音声出力手段
10 入出力装置
S12 レベルチェック(音声レベル比較工程)
S13 所定の音声信号レベルより小(音声レベル比較工程)
S14 プライベートモード(制御工程)
S22 レベルチェック(比算出工程)
S23 所定の値より小(比算出工程)
S24 プライベートモード(制御工程)
図1
図2
図3
図4
図5
図6