IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ パイオニア株式会社の特許一覧

特開2023-50044情報処理装置、情報処理方法、プログラムおよび記録媒体
<>
  • 特開-情報処理装置、情報処理方法、プログラムおよび記録媒体 図1
  • 特開-情報処理装置、情報処理方法、プログラムおよび記録媒体 図2
  • 特開-情報処理装置、情報処理方法、プログラムおよび記録媒体 図3
  • 特開-情報処理装置、情報処理方法、プログラムおよび記録媒体 図4
  • 特開-情報処理装置、情報処理方法、プログラムおよび記録媒体 図5
  • 特開-情報処理装置、情報処理方法、プログラムおよび記録媒体 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023050044
(43)【公開日】2023-04-10
(54)【発明の名称】情報処理装置、情報処理方法、プログラムおよび記録媒体
(51)【国際特許分類】
   G10L 15/20 20060101AFI20230403BHJP
   G10L 15/10 20060101ALI20230403BHJP
   G10L 15/30 20130101ALI20230403BHJP
【FI】
G10L15/20 200Z
G10L15/10 200W
G10L15/30
G10L15/20 353
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2021160197
(22)【出願日】2021-09-29
(71)【出願人】
【識別番号】000005016
【氏名又は名称】パイオニア株式会社
(74)【代理人】
【識別番号】100122426
【弁理士】
【氏名又は名称】加藤 清志
(72)【発明者】
【氏名】三ツ井 哲也
(72)【発明者】
【氏名】田上 宣昭
(72)【発明者】
【氏名】河内 洋人
(57)【要約】      (修正有)
【課題】ユーザが移動している場合でもウェイクワードを検出しやすくする情報処理装置、情報処理方法、プログラム及び記録媒体を提供する。
【解決手段】情報処理装置1は、ユーザの移動情報に基づいてユーザがウェイクワードを発しやすい状況にあるか否かを判定する移動状況検出部120と、ユーザがウェイクワードを発しやすい状況にあると移動状況検出部120が判定した場合には、ウェイクワードを検出する閾値を変更することによりウェイクワードを検出しやすくしてユーザが発話した音声からウェイクワードを検出するウェイクワード検出部140と、を備える。
【選択図】図1
【特許請求の範囲】
【請求項1】
ユーザの移動情報に基づいて、ユーザがウェイクワードを発しやすい状況にあるか否かを判定する移動状況検出部と、
前記ユーザが前記ウェイクワードを発しやすい状況にあると前記移動状況検出部が判定した場合には、前記ウェイクワードを検出しやすくして、前記ユーザが発話した音声から前記ウェイクワードを検出するウェイクワード検出部と、
を備えることを特徴とする情報処理装置。
【請求項2】
前記移動状況検出部は、前記ユーザの移動速度の変化が少ない場合には、前記ユーザが前記ウェイクワードを発しやすい状況にあると判定することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記ウェイクワード検出部は、前記ウェイクワードを検出する閾値を変更することにより、前記ウェイクワードを検出しやすくすることを特徴とする請求項1または2に記載の情報処理装置。
【請求項4】
クラウド上のサーバとデータの送受信を行う通信部をさらに備え、
前記移動状況検出部が前記ウェイクワードを発しやすい状況にあると判定した場合には、前記ウェイクワード検出部は、前記通信部を介して前記サーバに前記ユーザが発話した音声データを送信し、前記サーバにおける判定に基づいて、前記ウェイクワードの検出を行うことを特徴とする請求項1または2に記載の情報処理装置。
【請求項5】
移動状況検出部と、ウェイクワード検出部と、を備えた、情報処理装置の情報処理方法であって、
前記移動状況検出部が、ユーザの移動情報に基づいて、ユーザがウェイクワードを発しやすい状況にあるか否かを判定する第1の工程と、
前記移動状況検出部が、前記ユーザが前記ウェイクワードを発しやすい状況にあると判定した場合には、前記ウェイクワード検出部は、前記ウェイクワードを検出しやすくして、前記ユーザが発話した音声から前記ウェイクワードを検出する第2の工程と、
を備える情報処理方法。
【請求項6】
移動状況検出部と、ウェイクワード検出部と、を備えた、情報処理装置の情報処理方法をコンピュータに実行させるためのプログラムであって、
前記移動状況検出部が、ユーザの移動情報に基づいて、ユーザがウェイクワードを発しやすい状況にあるか否かを判定する第1の工程と、
前記移動状況検出部が、前記ユーザが前記ウェイクワードを発しやすい状況にあると判定した場合には、前記ウェイクワード検出部は、前記ウェイクワードを検出しやすくして、前記ユーザが発話した音声から前記ウェイクワードを検出する第2の工程と、
を備える情報処理方法をコンピュータに実行させるためのプログラム。
【請求項7】
移動状況検出部と、ウェイクワード検出部と、を備えた、情報処理装置の情報処理方法をコンピュータに実行させるためのプログラムを記録したコンピュータが読み取り可能な非一過性の記録媒体であって、
前記移動状況検出部が、ユーザの移動情報に基づいて、ユーザがウェイクワードを発しやすい状況にあるか否かを判定する第1の工程と、
前記移動状況検出部が、前記ユーザが前記ウェイクワードを発しやすい状況にあると判定した場合には、前記ウェイクワード検出部は、前記ウェイクワードを検出しやすくして、前記ユーザが発話した音声から前記ウェイクワードを検出する第2の工程と、
を備える情報処理方法をコンピュータに実行させるためのプログラムを記録した非一過性の記録媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、プログラムおよび記録媒体に関する。
【背景技術】
【0002】
近年、ユーザがウェイクワード(ウェイクアップワードあるいはホットワードともいう)を発話することにより音声アシスタントを起動させる機能を有するスマートフォン、スマートスピーカなどの機器が普及しつつある。
この種の機器は、騒音や雑音などが含まれている環境下で動作させると、ウェイクワードを正しく検出できないことがあるため、例えば、複数の機器を連携させて雑音のレベルなどを適切に推定し、ウェイクワードを検出する技術が開示されている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2021-15202号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上述した特許文献1に記載の技術においては、所定の固定された空間における雑音を推定していることにより、例えば、ユーザが機器を保有して移動している場合やユーザが車両で移動している場合には、ウェイクワードの検出ができない可能性があるという課題が一例としてあげられる。
【0005】
そこで、本発明は、上述の一例としてあげられた課題に鑑みてなされたものであって、ユーザが移動している場合でもウェイクワードを検出しやすくする情報処理装置、情報処理方法、プログラムおよび記録媒体を提供することを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するために、請求項1に記載の発明は、ユーザの移動情報に基づいて、ユーザがウェイクワードを発しやすい状況にあるか否かを判定する移動状況検出部と、前記ユーザが前記ウェイクワードを発しやすい状況にあると前記移動状況検出部が判定した場合には、前記ウェイクワードを検出しやすくして、前記ユーザが発話した音声から前記ウェイクワードを検出するウェイクワード検出部と、を備えることを特徴とする情報処理装置である。
【0007】
また、請求項5に記載の発明は、移動状況検出部と、ウェイクワード検出部と、を備えた、情報処理装置の情報処理方法であって、前記移動状況検出部が、ユーザの移動情報に基づいて、ユーザがウェイクワードを発しやすい状況にあるか否かを判定する第1の工程と、前記移動状況検出部が、前記ユーザが前記ウェイクワードを発しやすい状況にあると判定した場合には、前記ウェイクワード検出部は、前記ウェイクワードを検出しやすくして、前記ユーザが発話した音声から前記ウェイクワードを検出する第2の工程と、を備える情報処理方法である。
【0008】
また、請求項6に記載の発明は、移動状況検出部と、ウェイクワード検出部と、を備えた、情報処理装置の情報処理方法をコンピュータに実行させるためのプログラムであって、前記移動状況検出部が、ユーザの移動情報に基づいて、ユーザがウェイクワードを発しやすい状況にあるか否かを判定する第1の工程と、前記移動状況検出部が、前記ユーザが前記ウェイクワードを発しやすい状況にあると判定した場合には、前記ウェイクワード検出部は、前記ウェイクワードを検出しやすくして、前記ユーザが発話した音声から前記ウェイクワードを検出する第2の工程と、を備える情報処理方法をコンピュータに実行させるためのプログラムである。
【0009】
また、請求項7に記載の発明は、移動状況検出部と、ウェイクワード検出部と、を備えた、情報処理装置の情報処理方法をコンピュータに実行させるためのプログラムを記録したコンピュータが読み取り可能な非一過性の記録媒体であって、前記移動状況検出部が、ユーザの移動情報に基づいて、ユーザがウェイクワードを発しやすい状況にあるか否かを判定する第1の工程と、前記移動状況検出部が、前記ユーザが前記ウェイクワードを発しやすい状況にあると判定した場合には、前記ウェイクワード検出部は、前記ウェイクワードを検出しやすくして、前記ユーザが発話した音声から前記ウェイクワードを検出する第2の工程と、を備える情報処理方法をコンピュータに実行させるためのプログラムを記録した非一過性の記録媒体である。
【図面の簡単な説明】
【0010】
図1】実施例1に係る情報処理装置の構成を示す図である。
図2】実施例1に係る情報処理装置の処理フローを示す図である。
図3】実施例1に係る情報処理装置の速度の判定処理フローを示す図である。
図4】実施例2に係る情報処理装置の構成を示す図である。
図5】実施例2に係る情報処理装置の処理フローを示す図である。
図6】実施例2に係る情報処理装置の速度の判定処理フローを示す図である。
【発明を実施するための形態】
【0011】
実施形態に係る情報処理装置は、移動状況検出部と、ウェイクワード検出部と、を含んで構成されている。
移動状況検出部は、ユーザの移動情報に基づいて、ユーザがウェイクワードを発しやすい状況にあるか否かを判定する。
例えば、移動状況検出部は、ユーザの移動速度の変化が少ない場合には、ユーザは安定して移動していることにより、ウェイクワードを発しやすい状況にあると判定する。
また、ウェイクワード検出部は、ユーザがウェイクワードを発しやすい状況にあると移動状況検出部が判定した場合には、ウェイクワードを検出しやすくして、ユーザが発話した音声からウェイクワードを検出する。
例えば、ウェイクワード検出部は、ウェイクワードを検出する閾値を変更することによりウェイクワードを検出しやすくして、ユーザが発話した音声からウェイクワードを検出する。
つまり、移動状況検出部が、ユーザが安定した移動をしている状況であると判定した場合には、ウェイクワード検出部は、ウェイクワードを検出する閾値を低くすることにより、ウェイクワードを検出しやすくする。
そのため、ウェイクワード検出部は、ユーザが移動している場合でもウェイクワードを検出しやすくすることができる。
【0012】
<実施例1>
図1~3を用いて、本実施例に係る情報処理装置1について説明する。
【0013】
<情報処理装置1の構成>
図1に示すように、情報処理装置1は、移動情報取得部110と、移動状況検出部120と、音声取得部130と、ウェイクワード検出部140と、を含んで構成されている。
【0014】
移動情報取得部110は、ユーザの移動情報を取得する。
具体的には、移動情報取得部110は、例えば、速度センサにより構成され、ユーザの移動速度を取得する。
【0015】
また、移動情報取得部110は、ナビゲーション装置、GPS(Global-Positioning System)受信機などから現在位置を取得し、移動速度を算出してもよい。
移動情報取得部110は、速度情報を一定の時間間隔で取得し、後述する移動状況検出部120に送信する。
【0016】
移動状況検出部120は、ユーザの移動情報に基づいて、ユーザがウェイクワードを発しやすい状況にあるか否かを判定する。
具体的には、移動状況検出部120は、移動情報取得部110から受信したユーザの移動情報を参照し、ユーザの移動速度の変化が少ない場合に、ユーザがウェイクワードを発しやすい状況にあると判定する。
【0017】
より具体的には、移動状況検出部120は、移動情報取得部110から連続的に速度情報を取得し、例えば、移動速度の変化が5%以内の変化であることを確認した場合には、移動状況検出部120は、速度変化が少ないと判断し、ユーザがウェイクワードを発しやすい状況にあると判定する。
移動状況検出部120は、判定した結果を後述するウェイクワード検出部140に送信する。
【0018】
音声取得部130は、ユーザが発話した音声を、例えば、音声取得部130に接続されたマイクロフォンなどにより取得し、図示しない記憶部に格納する。
音声取得部130は、ユーザが発話した音声が記憶部に格納された旨を、後述するウェイクワード検出部140に送信する。
【0019】
ウェイクワード検出部140は、ユーザがウェイクワードを発しやすい状況にあると移動状況検出部120が判定した場合には、ウェイクワードを検出しやすくして、ユーザが発話した音声からウェイクワードを検出する。
【0020】
ここで、ウェイクワードの検出には、例えば、ウェイクワードの認識率が用いられる。
ウェイクワードの認識率は、例えば、ユーザが発話した音声から取得された単語が、図示しない記憶部に予め格納されている比較用ウェイクワードと、どれだけ一致したかを示した値である。
ウェイクワード検出部140は、ユーザが発話した音声から認識率を算出し、算出された認識率と、ウェイクワードを検出するために設定されている所定の閾値と、を比較する。
そして、ウェイクワード検出部140は、算出された認識率が所定の閾値以上であった場合には、ユーザが発話した音声をウェイクワードと検出する。
【0021】
また、ウェイクワード検出部140は、ユーザがウェイクワードを発しやすい状況にあるか否かに基づいて閾値を変更し、ウェイクワードを検出しやすくする。
具体的には、ウェイクワード検出部140は、ユーザがウェイクワードを発しにくい旨の情報を受信した場合には、例えば、閾値を80%に設定する。
一方で、ウェイクワード検出部140は、ユーザがウェイクワードを発しやすい状況にある旨の情報を受信した場合には、例えば、閾値を50%に設定する。
この場合には、ユーザがウェイクワードを発しにくい旨の情報を受信している場合と比較し、ウェイクワード検出部140は、ウェイクワードを検出しやすくなる。
【0022】
<情報処理装置1の処理>
図2図3を用いて、情報処理装置1の処理について説明する。
【0023】
図2に示すように、ウェイクワード検出部140は、判定処理Aを開始させる(ステップS110)。
【0024】
図3に示すように、移動情報取得部110は、速度センサなどから速度情報を取得し、速度情報を移動状況検出部120に送信する(ステップS510)。
【0025】
移動状況検出部120は、移動情報取得部110から受信した速度情報に基づいて、速度変化が少ないか否かを判定する(ステップS520)。
【0026】
移動状況検出部120は、速度変化が大きい旨の判定をした場合には(ステップS520の「NO」)、ウェイクワードを発しにくいと判定し、判定した結果をウェイクワード検出部140に送信し(ステップS530)、処理をステップS540に移行させる。
【0027】
ウェイクワード検出部140は、閾値THに、例えば、80%を設定し、判定処理Aを終了させる(ステップS540)。
閾値THは、後述するステップS140で認識率との比較に用いる。
【0028】
一方で、移動状況検出部120は、速度変化が少ない旨の判定をした場合には(ステップS520の「YES」)、ウェイクワードを発しやすいと判定し、判定した結果をウェイクワード検出部140に送信する(ステップS550)。
【0029】
ウェイクワード検出部140は、閾値THに、例えば、50%を設定し、判定処理Aを終了させる(ステップS560)。
つまり、判定処理A(ステップS110)では、ユーザがウェイクワードを発しやすい状況にあるか否かを判定し、当該判定結果に基づいて、閾値THの値を決定する処理が実行される。
【0030】
図2に示すように、ウェイクワード検出部140は、ユーザが発話したか否かの判定を行う(ステップS120)。
ウェイクワード検出部140は、音声取得部130から、ユーザが発話した音声が記憶部に格納された旨の情報を受信した場合には、ユーザが発話したと判定する。
【0031】
ウェイクワード検出部140は、ユーザが発話していない旨の判定をした場合には(ステップS120の「NO」)、処理をステップS110に戻す。
【0032】
一方で、ウェイクワード検出部140は、ユーザが発話している旨の判定をした場合には(ステップS120の「YES」)、ユーザが発話した音声と、記憶部に格納されている比較用ウェイクワードとを比較し、ウェイクワードの認識率を算出する(ステップS130)。
【0033】
ウェイクワード検出部140は、算出された認識率が、ステップS110にて設定された閾値TH以上であるか否かを判定する(ステップS140)。
【0034】
ウェイクワード検出部140は、算出された認識率が、閾値TH未満である場合には(ステップS140の「NO」)、処理をステップS110に戻す(ステップS140)。
【0035】
一方で、ウェイクワード検出部140は、算出された認識率が、閾値TH以上である場合には(ステップS140の「YES」)、ユーザが発話した音声をウェイクワードと検出し、処理を終了させる(ステップS150)。
【0036】
本実施例に係る情報処理装置1は、移動状況検出部120と、ウェイクワード検出部140と、を含んで構成されている。
移動状況検出部120は、ユーザの移動情報に基づいて、ユーザがウェイクワードを発しやすい状況にあるか否かを判定し、ユーザの移動速度の変化が少ない場合には、移動状況検出部120は、ユーザがウェイクワードを発しやすい状況にあると判定する。
また、ウェイクワード検出部140は、ユーザがウェイクワードを発しやすい状況にあると移動状況検出部120が判定した場合には、ウェイクワードを検出しやすくして、ユーザが発話した音声からウェイクワードを検出する。
つまり、移動状況検出部120が、ユーザが安定した移動をしている状況であると判定した場合には、ウェイクワード検出部140は、ウェイクワードを検出しやすくしてウェイクワードを検出する。
そのため、ユーザが移動している場合でもウェイクワードを検出しやすくすることができる。
【0037】
また、本実施例に係る情報処理装置1は、ウェイクワード検出部140は、ユーザがウェイクワードを発しやすい状況にあると移動状況検出部120が判定した場合には、ウェイクワードを検出する閾値を変更することによりウェイクワードを検出しやすくする。
つまり、ウェイクワード検出部140は、ユーザがウェイクワードを発しやすい状況にあると移動状況検出部120が判定した場合には、算出された認識率と比較する閾値を、低く変更することによりウェイクワードを検出しやすくする。
そのため、ユーザが移動している場合でもウェイクワードを検出しやすくできる。
【0038】
<実施例2>
図4図6を用いて、本実施例に係る情報処理装置1Aについて説明する。
【0039】
<情報処理装置1Aの構成>
図4に示すように、情報処理装置1Aは、移動情報取得部110と、移動状況検出部120と、音声取得部130と、ウェイクワード検出部140Aと、通信部210と、を含んで構成されている。
なお、実施例1と同一の符号を付す構成要素については、同様の機能を有することから、その詳細な説明は省略する。
【0040】
ウェイクワード検出部140Aは、移動状況検出部120がウェイクワードを発しやすい状況にあると判定した場合には、後述する通信部210を介して後述するサーバ900にユーザが発話した音声データを送信し、サーバ900における判定に基づいて、ウェイクワードを検出する。
【0041】
ウェイクワード検出部140Aは、ユーザが発話した音声から認識率を算出し、算出された認識率と、ウェイクワードを検出するために設定されている所定の閾値と、を比較する。
そして、算出された認識率が設定された閾値以上であった場合には、ウェイクワード検出部140Aは、ユーザが発話した音声をウェイクワードと検出する。
具体的には、ウェイクワード検出部140Aは、例えば、閾値に80%を設定し、算出された認識率が閾値以上の場合には、ユーザが発話した音声をウェイクワードと検出する。
一方で、ウェイクワード検出部140Aは、算出された認識率が設定された閾値未満であった場合には、後述するサーバ900にユーザが発話した音声を送信する。
ウェイクワード検出部140Aは、サーバ900から、ユーザが発話した音声をウェイクワードと検出した旨の情報を受信した場合には、ユーザが発話した音声をウェイクワードと検出する。
【0042】
なお、ウェイクワード検出部140Aと、サーバ900との間の通信は、例えば、インターネットに接続可能な通信モジュールなどで構成された通信部210を介して行われる。
【0043】
サーバ900は、クラウド上のサーバであって、ウェイクワード検出部140Aよりもウェイクワードの検出精度の高い、高性能な音声認識処理を備えている。
そのため、サーバ900は、ウェイクワード検出部140Aで算出される認識率と比較し、より高い認識率を算出する能力を有している。
【0044】
サーバ900は、ウェイクワード検出部140Aから送信された、ユーザが発話した音声から認識率の算出を行い、ウェイクワードを検出するための閾値(サーバ閾値)に基づいて、ウェイクワードを検出する。
サーバ900は、算出された認識率がサーバ閾値以上の場合には、ユーザが発話した音声がウェイクワードである旨の情報をウェイクワード検出部140Aに送信する。
【0045】
<情報処理装置1Aの処理>
図5図6を用いて、情報処理装置1Aの処理について説明する。
【0046】
図5に示すように、ウェイクワード検出部140Aは、判定処理Bを開始させる(ステップS210)。
【0047】
図6に示すように、移動情報取得部110は、速度センサなどから速度情報を取得し、速度情報を移動状況検出部120に送信する(ステップS610)。
【0048】
移動状況検出部120は、移動情報取得部110から受信した速度情報に基づいて、速度変化が少ないか否かを判定する(ステップS620)。
【0049】
移動状況検出部120が、速度変化が大きい旨の判定をした場合には(ステップS620の「NO」)、ウェイクワードを発しにくいと判定し、判定した結果をウェイクワード検出部140Aに送信し、判定処理Bを終了させる(ステップS630)。
【0050】
一方で、移動状況検出部120が、速度変化が少ない旨の判定をした場合には(ステップS620の「YES」)、ウェイクワードを発しやすいと判定し、判定した結果をウェイクワード検出部140Aに送信し、判定処理Bを終了させる(ステップS640)。
つまり、判定処理B(ステップS210)では、ユーザがウェイクワードを発しやすい状況にあるか否かを判定する処理が実行される。
【0051】
図5に示すように、ウェイクワード検出部140Aは、ユーザが発話したか否かの判定を行う(ステップS220)。
【0052】
ウェイクワード検出部140Aは、ユーザが発話していない旨の判定をした場合には(ステップS220の「NO」)、処理をステップS210に戻す。
【0053】
一方で、ウェイクワード検出部140Aは、ユーザが発話している旨の判定をした場合には(ステップS220の「YES」)、ユーザが発話した音声と、比較用ウェイクワードとを比較し、ウェイクワードの認識率を算出する(ステップS230)。
【0054】
ウェイクワード検出部140Aは、算出された認識率が、例えば、閾値80%以上か否かを判定する(ステップS240)。
【0055】
ウェイクワード検出部140Aは、算出された認識率が、閾値80%以上である場合には(ステップS240の「YES」)、ユーザが発話した音声をウェイクワードと検出し、処理を終了させる。(ステップS290)
【0056】
一方で、ウェイクワード検出部140Aは、算出された認識率が、閾値80%未満である場合には(ステップS240の「NO」)、処理をステップS250に移行させる。
【0057】
ウェイクワード検出部140Aは、ウェイクワードを発しやすい状況にあるか否かを判定処理Bに基づいて判定する。(ステップS250)。
【0058】
ウェイクワード検出部140Aは、ステップS210の判定結果がウェイクワードを発しにくい旨の判定である場合には(ステップS250の「NO」)、処理をステップS210に戻す。
【0059】
一方で、ウェイクワード検出部140Aは、ステップS210の判定結果がウェイクワードを発しやすい旨の判定である場合には(ステップS250の「YES」)、処理をステップS260に移行させる。
【0060】
ウェイクワード検出部140Aは、算出された認識率が、例えば、閾値50%以上であるか否かを確認する(ステップS260)。
ウェイクワード検出部140Aは、算出された認識率が、閾値50%未満である場合には(ステップS260の「NO」)、処理をステップS210に戻す。
認識率が閾値50%未満の場合には、サーバ900でもウェイクワードを認識することが困難であるため、サーバ900にユーザが発話した音声を送信しないようにしている。
【0061】
一方で、ウェイクワード検出部140Aは、算出された認識率が、閾値50%以上である場合には(ステップS260の「YES」)、ユーザが発話した音声を、通信部210を介してサーバ900に送信し、処理をステップS270に移行させる。
【0062】
サーバ900は、ウェイクワード検出部140Aから送信されたユーザが発話した音声の認識率を算出する。(ステップS270)。
【0063】
サーバ900は、算出された認識率と、サーバ閾値とを比較し、算出された認識率がサーバ閾値未満である場合には、認識率はサーバ閾値未満である旨の情報をウェイクワード検出部140Aに送信する。
一方で、サーバ900は、算出された認識率がサーバ閾値以上である場合には、認識率はサーバ閾値以上である旨の情報をウェイクワード検出部140Aに送信する(ステップS280)。
【0064】
ウェイクワード検出部140Aは、サーバ900から、算出された認識率がサーバ閾値未満である旨の情報を受信した場合には(ステップS280の「NO」)、処理をステップS210に戻す。
一方で、ウェイクワード検出部140Aは、サーバ900から、算出された認識率がサーバ閾値以上である旨の情報を受信した場合には(ステップS280の「YES」)、ユーザが発話した音声をウェイクワードと検出し、処理を終了させる(ステップS290)。
【0065】
本実施例に係る情報処理装置1Aは、移動状況検出部120と、ウェイクワード検出部140Aと、通信部210と、を含んで構成されている。
移動状況検出部120が、ユーザがウェイクワードを発しやすい状況であると判定した場合には、ウェイクワード検出部140Aは、通信部210を介して、ユーザが発話した音声をサーバ900に送信する。
サーバ900は、サーバ900に備えている検出精度の高い高性能な音声認識処理にてウェイクワードの検出を行い、検出結果をウェイクワード検出部140Aに送信する。
そして、ウェイクワード検出部140Aは、サーバ900から送信された検出結果に基づきウェイクワードの検出を行う。
つまり、ウェイクワード検出部140Aは、サーバ900にて実施された検出精度の高い高性能な音声認識処理による検出結果に基づき、ウェイクワードの検出を行う。
そのため、ユーザが移動している場合でもウェイクワードを検出しやすくすることができる。
【0066】
<その他の実施例>
上述した情報処理装置1、1Aにおいて、ユーザが歩行移動など、車両から速度情報を取得できない場合には、スマートフォンなどから現在位置情報を取得することにより速度を算出し、速度情報に基づいて、ユーザがウェイクワードを発しやすい状況にあるか否かを判定してもよい。
これにより、ユーザが歩行移動している場合でも、ウェイクワードを検出しやすくすることができる。
【0067】
また、上述した情報処理装置1、1Aにおいて、移動状況検出部120は、速度情報に基づいて、ユーザがウェイクワードを発しやすい状況にあるか否かを判定したが、加速度に基づいて判定してもよい。
つまり、移動状況検出部120は、加速度情報に基づきユーザの速度変化を判断し、速度変化が少ない場合には、移動状況検出部120は、ユーザがウェイクワードを発しやすい状況にあると判定する。
そのため、ユーザが移動している場合でもウェイクワードを検出しやすくすることができる。
【0068】
また、上述した情報処理装置1、1Aにおいて、移動状況検出部120は、速度情報に基づいて、ユーザがウェイクワードを発しやすい状況にあるか否かを判定したが、生体情報である心拍数、呼吸数に基づいて判定してもよい。
具体的には、ユーザが装着するスマートウォッチなどから心拍数、心拍変動、呼吸数などの生体情報を取得する。
「心拍数が早くない」、「心拍変動がない」、あるいは「呼吸が早くない」場合には、ユーザが緊張状態にないため、ユーザがウェイクワードを発しやすい状況にあると判定してもよい。
つまり、移動状況検出部120が、生体情報に基づいてユーザが緊張していないと判定した場合には、移動状況検出部120は、ユーザがウェイクワードを発しやすい状況にあると判定する。
そのため、ユーザが移動中であっても緊張していない場合には、ウェイクワードを検出しやすくすることができる。
【0069】
以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計なども含まれる。
【符号の説明】
【0070】
1;情報処理装置
1A;情報処理装置
110;移動情報取得部
120;移動状況検出部
140;ウェイクワード検出部
140A;ウェイクワード検出部
210;通信部
900;サーバ
図1
図2
図3
図4
図5
図6