(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-08-05
(45)【発行日】2024-08-14
(54)【発明の名称】対話サービス装置及び対話システム制御方法
(51)【国際特許分類】
B60R 16/02 20060101AFI20240806BHJP
G01C 21/36 20060101ALI20240806BHJP
G10L 15/00 20130101ALI20240806BHJP
G10L 15/32 20130101ALI20240806BHJP
【FI】
B60R16/02 655A
G01C21/36
G10L15/00 200J
G10L15/32 220Z
(21)【出願番号】P 2023525292
(86)(22)【出願日】2021-06-03
(86)【国際出願番号】 JP2021021236
(87)【国際公開番号】W WO2022254669
(87)【国際公開日】2022-12-08
【審査請求日】2023-11-29
(73)【特許権者】
【識別番号】000003997
【氏名又は名称】日産自動車株式会社
(74)【代理人】
【識別番号】110000486
【氏名又は名称】弁理士法人とこしえ特許事務所
(72)【発明者】
【氏名】田▲崎▼ 克
(72)【発明者】
【氏名】曽根崎 詠二
(72)【発明者】
【氏名】松本 達矢
【審査官】菅 和幸
(56)【参考文献】
【文献】特開2020-147214(JP,A)
【文献】特開2020-106997(JP,A)
【文献】特開2020-152298(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
B60R 16/02
G01C 21/36
G10L 15/00
G10L 15/32
(57)【特許請求の範囲】
【請求項1】
車両の乗員の音声を認識して、サービスを提供する対話サービス装置であって、
前記乗員の音声を認識する機能を有し、前記乗員と対話して前記サービスを提供する対話システムを制御する対話システム制御部と、
前記対話システムを起動させる起動
部を備え、
前記対話システムは、
車内通信経路を通じて制御指令を車載機器に出力し、第1音声認識エンジンを有する第1対話システムと、前記第1音声認識エンジンとは異なる第2音声認識エンジンを有する第2対話システムを含み、
前記起動部は、
前記車両のハンドルスイッチの操作により前記対話システムに起動指令を出力する第1インターフェイスと、前記乗員により発せられるウェイクアップワードにより前記対話システムに起動指令を出力する第2インターフェイスを有し、
前記第1インターフェイスは、前記第1対話システム及び前記第2対話システムのいずれか一方のシステムに前記起動指令を送信し、
前記第2インターフェイスは、前記第1対話システムに前記起動指令を送信し、
前記ウェイクアップワードが前記第1対話システムの起動に割り当てられている場合には、前記第2対話システムはウェイクアップワードで起動できず
、
前記ハンドルスイッチにより起動させる対話システムは、ユーザ設定により前記第1対話システム及び前記第2対話システムから排他的に選択可能であり、
前記ウェイクアップワードにより起動させる対話システムは、第1対話システムに固定化されている対話サービス装置。
【請求項2】
車両の乗員の音声を認識して、サービスを提供する対話サービス装置であって、
前記乗員の音声を認識する機能を有し、前記乗員と対話して前記サービスを提供する対話システムを制御する対話システム制御部と、
前記対話システムを起動させる起動部と、
車外と通信可能な通信部を備え、
前記対話システムは、
車内通信経路を通じて制御指令を車載機器に出力し、第1音声認識エンジンを有する第1対話システムと、前記第1音声認識エンジンとは異なる第2音声認識エンジンを有する第2対話システムを含み、
前記起動部は、
前記車両のハンドルスイッチの操作により前記対話システムに起動指令を出力する第1インターフェイスと、前記乗員により発せられるウェイクアップワードにより前記対話システムに起動指令を出力する第2インターフェイスを有し、
前記第1インターフェイスは、前記第1対話システム及び前記第2対話システムのいずれか一方のシステムに前記起動指令を送信し、
前記第2インターフェイスは、前記第1対話システム及び前記第2対話システムのいずれか一方のシステムに前記起動指令を送信し、
前記ウェイクアップワードが前記第1対話システムの起動に割り当てられている場合には、前記第2対話システムはウェイクアップワードで起動できず、
前記第1対話システムは、前記通信部と前記対話システムとの間を接続する通信経路以外の前記車内通信経路を通じて前記制御指令を前記車載機器に出力し、
前記第2対話システムは、前記通信部と前記対話システムとの間を接続する前記通信経路以外の前記車内通信経路を通じて前記制御指令を前記車載機器に出力せず、
初期設定では、前記ウェイクアップワードは前記第1対話システムの起動に割り当てられている対話サービス装置。
【請求項3】
車両の乗員の音声を認識して、サービスを提供する対話サービス装置であって、
前記乗員の音声を認識する機能を有し、前記乗員と対話して前記サービスを提供する対話システムを制御する対話システム制御部と、
前記対話システムを起動させる起動部と、
車外と通信可能な通信部を備え、
前記対話システムは、
車内通信経路を通じて制御指令を車載機器に出力し、第1音声認識エンジンを有する第1対話システムと、前記第1音声認識エンジンとは異なる第2音声認識エンジンを有する第2対話システムを含み、
前記起動部は、
前記車両のハンドルスイッチの操作により前記対話システムに起動指令を出力する第1インターフェイスと、前記乗員により発せられるウェイクアップワードにより前記対話システムに起動指令を出力する第2インターフェイスを有し、
前記第1インターフェイスは、前記第1対話システム及び前記第2対話システムのいずれか一方のシステムに前記起動指令を送信し、
前記第2インターフェイスは、前記第1対話システム及び前記第2対話システムのいずれか一方のシステムに前記起動指令を送信し、
前記ウェイクアップワードが前記第1対話システムの起動に割り当てられている場合には、前記第2対話システムはウェイクアップワードで起動できず、
前記第1対話システムは、前記通信部と前記対話システムとの間を接続する通信経路以外の前記車内通信経路を通じて前記制御指令を前記車載機器に出力し、
前記第2対話システムは、前記通信部と前記対話システムとの間を接続する前記通信経路以外の前記車内通信経路を通じて前記制御指令を前記車載機器に出力せず、
前記第1インターフェイス及び前記第2インターフェイスによる起動指令の送信先は、前記第1対話システムを用いた対話により変更できる対話サービス装置。
【請求項4】
請求項1~3のいずれか一項に記載の対話サービス装置であって、
前記第1音声認識エンジンは、前記車両に設けられ、
前記第2音声認識エンジンは、前記車両の外部に設けられている対話サービス装置。
【請求項5】
請求項1~4のいずれか一項に記載の対話サービス装置であって、
前記第1インターフェイスは、前記第1対話システムに前記起動指令を送信する対話サービス装置。
【請求項6】
請求項1又は3に記載の対話サービス装置であって、
前記起動部は、前記乗員の操作に基づき、前記起動指令の送信先を、前記第1対話システム及び前記第2対話システムのいずれか一方のシステムに設定し、
初期設定では、前記第2対話システムが前記起動指令の送信先に設定されている対話サービス装置。
【請求項7】
請求項1又は3に記載の対話サービス装置であって、
前記起動部は、前記乗員の操作に基づき、前記起動指令の送信先を、前記第1対話システム及び前記第2対話システムのいずれか一方のシステムに設定し、
初期設定では、前記第1対話システムが前記起動指令の送信先に設定されている対話サービス装置。
【請求項8】
請求項1~3のいずれか一項に記載の対話サービス装置であって、
前記起動部は、前記乗員の操作に基づき、前記第1インターフェイスによる前記起動指令の送信先を、前記第1対話システム及び前記第2対話システムのいずれか一方のシステムに設定する対話サービス装置。
【請求項9】
請求項2に記載の対話サービス装置であって、
前記起動部は、前記対話システム制御部により認識された前記音声に基づき、前記第1インターフェイスによる前記起動指令の送信先を前記第1対話システム及び前記第2対話システムのいずれか一方のシステムに設定する対話サービス装置。
【請求項10】
請求項1~9のいずれか一項に記載の対話サービス装置であって、
前記対話システム制御部は、前記起動指令の送信先が変更された場合には、変更内容を前記乗員に音声で出力する対話サービス装置。
【請求項11】
請求項1~9のいずれか一項に記載の対話サービス装置であって、
前記車両に設けられたタッチパネル式ディスプレイの表示画面を制御する表示制御部を備え、
前記表示画面は、前記第1対話システムを起動するためのタッチ操作を有効にする第1アイコンと、前記第2対話システムを起動するためのタッチ操作を有効にする第2アイコンとを含む対話サービス装置。
【請求項12】
請求項1~11のいずれか一項に記載の対話サービス装置であって、
前記対話システム制御部は、前記車載機器に含まれる空調機器、ウィンドー、バックドア、サンルーフ、スライドドアのいずれか1つを制御するコントロールユニットに対して、前記制御指令を出力する対話サービス装置。
【請求項13】
車両の乗員と音声を認識して、サービスを提供する対話システムを制御する対話システム制御方法であって、
前記車両のハンドルスイッチの操作に基づき、第1インターフェイスから対話システムに起動指令を送信し、
乗員の音声を認識する音声認識処理を行い、
前記音声認識処理により認識されたウェイクアップワードに基づき、第2インターフェイスから前記対話システムに前記起動指令を送信し、
起動された前記対話システムにより、前記乗員と対話して前記サービスを提供し、
前記対話システムは、
車内通信経路を通じて制御指令を車載機器に出力し、第1音声認識エンジンを有する第1対話システムと、前記第1音声認識エンジンとは異なる第2音声認識エンジンを有する第2対話システムを含み、
前記第1インターフェイスから前記起動指令を送信する場合には、前記第1対話システム及び前記第2対話システムのいずれか一方のシステムに前記起動指令を送信し、
前記第2インターフェイスから前記起動指令を送信する場合には、前記第1対話システムに前記起動指令を送信し、
前記ウェイクアップワードが前記第1対話システムの起動に割り当てられている場合には、前記第2対話システムはウェイクアップワードで起動できず
、
前記ハンドルスイッチにより起動させる対話システムは、ユーザ設定により前記第1対話システム及び前記第2対話システムから排他的に選択可能であり、
前記ウェイクアップワードにより起動させる対話システムは、第1対話システムに固定化されている対話システム制御方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、対話サービス装置及び対話システム制御方法に関するものである。
【背景技術】
【0002】
車両の乗員の発話に応じて、応答を含むサービスを提供するエージェント装置が知られている(例えば特許文献1)。このエージェント装置は、乗員の発話に含まれる要求を認識し、認識された要求を複数のエージェント機能部に出力し、複数のエージェント機能部のそれぞれによってなされた結果に基づいて、複数のエージェント機能部のうち、乗員の発話に対する応答を行うエージェント機能部を選択する。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上記従来のエージェント装置において、乗員の音声を認識する音声認識システムを複数用いた場合には、設定したウェイクアップワードで各システムを区別して起動しようとすると、ユーザがウェイクアップワードを使い分ける必要があるため、混同するおそれがある。
【0005】
本発明が解決しようとする課題は、ウェイクアップワードを混同するような事態を回避できる対話サービス装置及び対話システム制御方法を提供することである。
【課題を解決するための手段】
【0006】
本発明は、車両のハンドルスイッチの操作により対話システムに起動指令を出力する第1インターフェイスと、乗員により発せられるウェイクアップワードにより対話システムに起動指令を出力する第2インターフェイスを有し、第1インターフェイスは、対話システムに含まれる、第1対話システム及び第2対話システムのいずれか一方のシステムに起動指令を送信し、第2インターフェイスは、第1対話システム及び第2対話システムのいずれか一方のシステムに起動指令を送信することによって、上記課題を解決する。
【発明の効果】
【0007】
本発明によれば、ウェイクアップワードを混同するような事態を回避できる。
【図面の簡単な説明】
【0008】
【
図1】
図1は、本発明の一実施の形態に係る対話サービスシステムを示すブロック図である。
【
図2】
図2は、
図1のディスプレイを備えたダッシュボードの正面図である。
【
図3A】
図3Aは、ハンドルスイッチの操作及びウェイクアップワードと、対話システムの起動の切り替えとの関係を説明するための表である。
【
図3B】
図3Bは、変形例における、ハンドルスイッチの操作及びウェイクアップワードと、対話システムの起動の切り替えとの関係を説明するための表である。
【
図4】
図4は、
図1のディスプレイの表示画面を示す図である。
【
図5】
図5は、
図1のディスプレイの表示画面を示す図である。
【
図6】
図6は、
図1のディスプレイの表示画面を示す図である。
【
図7】
図7は、
図1のディスプレイの表示画面を示す図である。
【
図8】
図8は、
図1のディスプレイの表示画面を示す図である。
【
図9】
図9は、アニメーション「音声検知状態」の時間推移を説明するためのアニメーション画像とグラフである。
【
図10】
図10は、アニメーションの時間推移を説明するためのアニメーション画像とグラフである。
【
図11】
図11は、アニメーションの画像構成と、画面遷移時時の選択されるインデックスを説明するための概念図である。
【
図19】
図19は、
図1の対話システムにおける対話のモデルフローを表す表である。
【
図20】
図20は、
図1の対話システムにおける対話のモデルフローを表す表である。
【
図22】
図22は、
図1の対話システムにおける対話のモデルフローを表す表である。
【
図23】
図23は、
図1の対話システムにおける対話のモデルフローを表す表である。
【
図24】
図24は、
図1の対話システムにおける対話のモデルフローを表す表である。
【
図25】
図25は、
図1の対話システムにおける対話のモデルフローを表す表である。
【発明を実施するための形態】
【0009】
以下、本発明に係る対話サービスシステムの一実施の形態を図面に基づいて説明する。
図1は、本発明の一実施の形態に係る対話サービスシステムを示すブロック図である。対話サービスシステムは、車両に搭載されたシステムであって、ディスプレイ10と、通信機20と、ハンドルスイッチ30と、ECU40と、コントローラ100を備えている。本実施形態に係る対話サービスシステムは、音声処理機能を用いて乗員と対話して、乗員にサービスを提供するシステムと、ディスプレイの表示画面を制御するシステムを含んでいる。
【0010】
ディスプレイ10は、タッチパネル式のディスプレイであり、車両に搭載されている。タッチパネル式のディスプレイ10は、感圧センサを備え、接触操作時にディスプレイ10に与えられた押圧力を抵抗値や電圧などから測定することで、ユーザによるタッチ操作を検知する。感圧センサの機構は特に限定されず、出願時に知られた方法を適宜に用いることができる。またタッチパネルは、感圧式に限らず、静電式等、他の方式でもよい。
図2は、タッチパネルを備えたダッシュボード付近の正面図である。
図2に示すように、ディスプレイ10は、ダッシュボードの正面部分のディスプレイ(センタディスプレイ)であり、運転席と助手席の間に配置されている。ディスプレイ10は、運転席に座った状態の乗員と助手席に座った状態の乗員がそれぞれ触れることができる位置に設けられている。また、ディスプレイ10は、必ずしもドライバーと助手席乗員の両乗員が触れる位置に配置する必要は無く、例えばドライバーのみが触れることが可能な位置に配置されてもよい。またディスプレイ10は、ダッシュボードに限らず、例えば後部座席の乗員が触れる位置に配置されてもよい。
【0011】
乗員は指又は指に代わる操作機器により、ディスプレイ10に触れるタッチ操作により、メニュー画面からアイコン、ボタン等を選択すると、ディスプレイ10の画面表示が遷移する。なお、以下の説明では、主に指を使ったタッチ操作について説明するが、本実施形態は指の代わりに操作機器を使ったタッチ操作でもよい。タッチ操作は、ディスプレイ10に表示されるアイコンやボタンに指を触れる、又は、アイコンやボタンに指を近づけるような、指を使ったジェスチャにより実行されるポインティング操作である。タッチ操作は、タップ(画面を1回タッチする)、ダブルタップ(画面を2回タッチする)、ロングタップ(画面を長押しする)、スワイプ(画面に触れた指を画面上でそのままスライドさせる(指をなぞる))、フリック(画面に触れた指を、画面上で素早く弾くように動かす)、ピンチイン/ピンチアウト(2本の指で画面に触れて、2本の指を近づける/遠ざける)等である。タッチ操作は、画面上の1点又は複数点に指を触れる第1ジェスチャに限らず、画面に触れた状態で指の接触点を移動させる第2ジェスチャを含んでいてもよい。また、タッチ操作は、表示画面に直接触れなくてもよく、指等を表示画面に近づける、いわゆるホバリングでもよい。なお、タッチ操作の操作方法は、これらに限らず他の方法でもよい。
【0012】
通信機20は、車外のサーバ2と通信可能な通信装置である。通信機20は、コントローラ100とサーバ2との間で信号を送受信する。ハンドルスイッチ(ステアリングスイッチ)30は、対話システムを立ち上げる(起動する)ためのスイッチであり、
図2に示すようにハンドルに設けられている。乗員(ドライバー)は、対話システムによりサービスの提供を受けたい場合には、ハンドルスイッチ30を操作して、対話システムを起動させる。後述するように、対話システムは、車両1に設けられた音声認識エンジンを主に用いて音声処理を行い、サービスを提供する第1対話システム112と、サーバ2に含まれる音声認識エンジンを主に用いて音声処理を行い、サーバ2から乗員に対してサービスを提供する第2対話システム32を含んでいる。そして、ハンドルスイッチ30には、どちらの一方の対話システムを起動させるか割り当てられており、ハンドルスイッチ30の操作により、第1対話システム及び第2対話システムのいずれか一方のシステムが起動する。なお、通信機20が本発明の「通信部」に相当する。
【0013】
ECU40は、空調機器41、サンルーフ42等の制御対象を制御するコントロールユニットであって、CAN通信網で制御対象及びコントローラ100を制御する。ECU40は、1つに限らず、多数のコントロールユニットであり、制御対象ごとにECU40が接続されている。
【0014】
コントローラ100は、ハードウェア及びソフトウェアを備えたコンピュータにより構成され、プログラムを格納したメモリと、このメモリに格納されたプログラムを実行するCPU等を有している。また、コントローラ100は、機能ブロックとして、対話システム制御部110、起動部120、及び表示制御部130を有しており、対話システム制御部110、起動部120、及び表示制御部130の各機能を実現するためのプログラムがメモリに記憶されている。そして、コントローラ100に含まれるコンピュータがプログラムを実行することで、機能ブロックの各機能を実現する。またコントローラ100は、ディスプレイ10、通信機20、ハンドルスイッチ30、及びECU40とCAN通信網等で接続されている。コントローラ100は、対話システム制御部110、起動部120、及び表示制御部130に限らず、例えばオーディオシステムを制御する機能等、車室内の各種システムを制御するための制御ブロックを有しており、他の車載機器を制御する。なお、コントローラ100を有する装置が、本発明の「対話サービス装置」に相当する。
【0015】
対話システム制御部110は、乗員の音声を認識する機能を有し、対話システムを制御する。対話システム制御部110は、音声認識部111と、第1対話システム112を有している。音声認識部111は、乗員の音声入力を検知し、第1対話システム112に含まれる音声認識エンジンを用いて、検知された音声に対する音声処理により音声を認識する。第1対話システム112が起動されている状態で、乗員は、車内のマイクに対して声を発すると、音声認識部11は入力された音声を検知する。音声検知は、音声入力が始まり、音声入力が終わってから所定時間経過するまで実行される。例えば、乗員が、「エアコン(エアーコンディショナー)の温度を25℃に設定」のようなメッセージを発生した場合には、音声認識部11が、メッセージの初めから終わりまでの音声を検知し、メッセージの終わりから所定時間の無音期間を経て、音声検知を終了する。音声認識部11は、検知した音声に対して、音声認識エンジンを用いて音声処理を行うことで音声を認識する。
【0016】
また音声認識部111は、対話システムを起動させるためのウェイクアップワードを認識した場合には、後述する第2インターフェイス122に、ウェイクアップワードを認識したことを示す制御信号を出力する。ウェイクアップワードは、例えば「Hello ○○(車メーカの名称、対話システムの相性等)」のような呼びかけメッセージであり、予め決められている。なお、ウェイクアップワードは乗員の設定により変更されてもよい。
【0017】
第1対話システム112は、車載用音声処理システムであり、主に車載機器との連携を目的としており、音声認識エンジンを利用して、乗員とコントローラ100間で対話を行い、対話内容に応じたサービスを乗員に提供する。第1対話システム112は、空調機器41、サンルーフ42、ナビゲーションシステム、オーディオシステム、ハンズフリーシステム等の車載機器を連携するためにECU40に接続されている。第1対話システム112は、各種ECUと通信を行うための通信機能を搭載している。例えば、乗員が、空調機器41の温度設定を変更する旨を対話システムに発話した場合には、音声認識部111が音声処理を行い、音声認識部111で認識された音声データに基づき、制御対象となる空調機器41を特定した上で、制御指令を生成し、車内通信経路(CAN通信網)を通じてECU40に制御指令を出力する。なお、第1対話システム112からECU40を介して空調機器41等の車載機器に制御信号を送る場合に、制御信号が通る車内通信経路は、コントローラ100と通信機20間を接続する通信経路は含まれない。ECU40は、制御指令に応じて空調機器41を制御し、空調機器41の設定温度を変更する。これにより、第1対話システム112は対話を通じて乗員にサービスを提供する。第1対話システム112で提供されるサービスは、空調機器41の設定に限らず、空調機器41の風向調整、風量調整等でもよい。また他のサービスの例では、ナビゲーションシステムによる経路案内、オーディオシステムの設定、ハンズフリーシステムによる電話操作や電話番号検索、ショートメッセージサービス(SMS)、サンルーフ42、ウィンドー、バックドア、スライドドアなどの開閉操作等の車載機器の操作等である。
【0018】
一方、サーバ2に含まれる第2対話システム32は、外部の音声認識エンジンを用いて、音声処理を行うシステムであり、車両1がサーバ2に接続し外部の情報にアクセスして、サービスを乗員に提供する。第2対話システム32で提供されるサービスは、インターネットを利用したショッピング、自宅の家電機器の遠隔操作等、多種多様なサービスである。第2対話システム32は、第1対話システム112と異なり、車載機器との連携を目的としていていない。また、第1対話システム112と第2対話システム32の違いについて、第1対話システムと第2対話システムは別々の対話システムであり、第1対話システムは、車内通信経路を通じて制御指令を車載機器し、音声認識エンジン(本発明の「第1音声認識エンジン」に相当)を有しており、第2対話システムは、第1対話システムに含まれる音声認識エンジンとは異なる音声認識エンジン(本発明の「第2音声認識エンジン」に相当)を有している。また、別の観点で、第1対話システム112と第2対話システム32の違いは、第1対話システム112は車内通信経路を通じて制御指令を車載機器に入力又は出力するが、第2対話システム32は、車内通信経路を通じて制御指令を、通信機20以外の車載機器に入力及び出力しないシステムとしてもよい。さらに別の観点として、第1対話システム112と第2対話システム32の違いは、第1対話システムは、通信機20と第1対話システム112との間を接続する通信経路以外の車内通信経路を通じて制御指令を前記車載機器に出力し、通信機20と第1対話システム112との間を接続する通信経路以外の車内通信経路を通じて制御指令を出力しないシステムでもよい。
【0019】
音声認識部111は、第2対話システム32を用いて乗員と対話を行う場合には、乗員の音声入力を検知し、検知した音声データを、通信機20を介してサーバ2に送信する。サーバ2の第2対話システム32は、入力され音声データに対して音声処理を行い、処理結果を車両1に送信する。音声認識部111は、車載スピーカからの音声出力又はディスプレイ10の表示画面で、第2対話システム32による処理結果を出力する。
【0020】
第1対話システム112は、車内のECU40に限らず、車両外部のサーバ2と接続してもよい。例えば、第1対話システム112は、車外のサーバ2と接続して、車外の音声認識エンジンを用いて、音声認識処理を行ってもよい。例えば、店舗の名称などの情報は数多くあるため、車載の音声認識エンジンよりも車外の音声認識エンジンを用いた方がよい場合がある。このような場合には、第1対話システム112は、車外の音声認識エンジンを用いて、音声認識処理を行う。
【0021】
起動部120は、第1対話システム112と第2対話システム32を起動させるための機能ブロックであり、第1インターフェイス121及び第2インターフェイス122を有している。第1インターフェイス121は、ハンドルスイッチ30の操作により対話システムに起動指令を送信する、つまり、第1インターフェイス121は、ハンドルスイッチ30と第1対話システム112の間と、ハンドルスイッチ30と第2対話システム32の間をそれぞれ接続する接続部となる。第1インターフェイス121は、第1対話システム112及び第2対話システム32のいずれか一方のシステムに起動指令を送信する。第1インターフェイス121は、第1対話システム112及び第2対話システム32の両方に、同時に制御指令を送信することはない。第1インターフェイス121による制御指令の送信先は、乗員の設定、及び/又は工場出荷時の初期設定で決められる。ハンドルスイッチ30が第1対話システム112の起動に割り当てられている場合には、第1インターフェイス121は、ハンドルスイッチ30の操作による操作指令を受信したときに、第1対話システム112に起動指令を送信する。ハンドルスイッチ30が第2対話システム32の起動に割り当てられている場合には、第2インターフェイス122は、第2対話システム32に起動指令を送信する。なお、第2対話システム32の起動指令は、車両1とサーバ2との間の通信可能な状態にして、車両1に対して、サーバ2の対話システムを利用できる状態にするための指令である。
【0022】
第2インターフェイス122は、ウェイクアップワードにより対話システムに起動指令を送信する。第2インターフェイス122は、音声認識部111と対話システムの間の接続部である。第2インターフェイス122は、第1対話システム112及び第2対話システム32のいずれか一方のシステムに起動指令を送信する。第1インターフェイス121は、第1対話システム112及び第2対話システム32の両方に対して、同時に制御指令を送信することはない。
図1の例では、第2インターフェイス122は、第1対話システム112に起動指令を送信する。第2インターフェイス122による制御指令の送信先は、工場出荷時の初期設定で決められる。
図1の例では、ウェイクアップワードは第1対話システム112の起動に割り当てられているため、第2インターフェイス122は、音声認識部111によりウェイクアップワードを認識した場合には、第1対話システム112に起動指令を送信する。つまり、第1対話システム112に含まれる音声認識エンジンは、少なくともウェイクアップワードを認識できる状態で待機しており、第2インターフェイス122は、音声認識部111によりウェイクアップワードを認識した場合には、第1対話システム112に起動指令を送信し、第1対話システム112は、ウェイクアップワード以外の様々なワードが認識できるように、音声認識エンジンを立ち上げる。なお、ウェイクアップワードが第2対話システム32の起動に割り当てられている場合、第2インターフェイス122は、第2対話システム32に起動指令を送信する。
【0023】
また、起動部120は、乗員の操作に基づき起動指令の送信先を、第1対話システム112及び第2対話システム32のいずれか一方のシステムに設定する。起動指令の送信先を設定するための乗員の操作は、ディスプレイ10のタッチ操作、ハンドルスイッチ30以外のスイッチ操作などである。例えば、ディスプレイ10のタッチ操作の例では、コントローラ100は、ディスプレイ10に、対話システムの設定画面を表示し、乗員は、表示された設定画面から、第1対話システム112と第2対話システム32のいずれか一方のシステムを選択するための選択メニューにタッチし、選択メニュー上で利用したい対話システムを選択する。起動部120は、ディスプレイ10のタッチ操作により選択された対話システムに起動信号を送信するために、第1インターフェイス121の起動信号の送信先を設定する。例えば、乗員が、ディスプレイ10のタッチ操作で、ハンドルスイッチ30の操作時に起動させる対象システムを第1対話システム112から第2対話システム32に変更した場合には、起動部120は、第1インターフェイス121による起動信号の送信先を、第2対話システム32に設定する。これにより、乗員は、好みに応じて、ハンドルスイッチ30の操作時に起動させる対話システムを、第1対話システム112及び第2対話システム32から選択できる。
【0024】
また、対話システムを用いた乗員との対話により、対話システムの設定を変えることができる場合には、起動部120は、対話システム制御部110により認識された音声に基づき、第1インターフェイス121による起動指令の送信先を第1対話システム112及び第2対話システム32のいずれか一方のシステムに設定してもよい。例えば、乗員が第1対話システム112により、コントローラ100と対話している状態で、乗員がハンドルスイッチ30の割り当てを、第1対話システム112から第2対話システム32に変更したい旨を発したとする。対話システム制御部110は、乗員の音声を認識し、起動部120に対して、ハンドルスイッチ30を第2対話システム32の起動に割り当てための制御指令を送信する。起動部120は、制御指令に基づき、第1インターフェイス121による起動信号の送信先を、第2対話システム32に設定する。これにより、乗員は、対話しシステムを利用した対話で、ハンドルスイッチ30の操作時に起動させる対象システムを、第1対話システム112及び第2対話システム32か選択できる。
【0025】
本実施形態では、ハンドルスイッチ30の操作により起動できる対話システムは、乗員により、第1対話システム112と第2対話システム32のいずれか一方のシステムを選択できるようにしたが、ウェイクアップワードにより起動できる対話システムは、第1対話システム112に固定化されている。第1対話システム112は、主に車載機器との連携を目的としているため、第2対話システム32よりも利用頻度が高い。そのため、ウェイクアップワードによる起動を第1対話システム112に固定化することで、乗員の利便性を高めることができる。また、ハンドルスイッチ30の割り当ては乗員により選択できるようにしているため、対話システムの選択自由度も確保できる。
【0026】
図3Aは、第1/第2対話システムの起動を切り替えることができるか否かを説明するための表である。
図3Aに示すように、本実施形態に係る対話サービスシステムでは、「ウェイクアップワード」は、第1対話システム112を起動でき、第2対話システム32を起動できない。「ハンドルスイッチ」は、ユーザの設定により、第1対話システム112と第2対話システム32のいずれか一方のシステムを起動できる。つまり、ハンドルスイッチ30による対話システムの起動は、排他的に選択可能である。なお、ハンドルスイッチ30が第1対話システム112に割り当てられている場合には、第2対話システム32は、ハンドルスイッチ30の操作及びウェイクアップワードにより起動できないが、第2対話システム32は、例えばディスプレイ10に表示されるメニュー画面上での選択、又は、ハンドルスイッチ30以外のスイッチ操作により起動可能である。
【0027】
図3Bは、本実施形態の変形例に係る対話サービスシステムにおいて、第1/第2対話システムの起動との相関性を説明するための表です。変形例に係る対話サービスシステムにおいて、ウェイクアップワードにより起動できる対話システムは、ユーザ設定により排他的に選択可能である。起動部120は、ウェイクアップワードを認識した時の起動指令の送信先を、第1対話システム112及び第2対話システム32のいずれか一方のシステムに設定する。乗員は、ディスプレイ10のタッチ操作、ハンドルスイッチ30以外のスイッチ操作、対話システムを用いたコントローラ100との対話により、起動させる対話システムを、第1対話システム112及び第2対話システム32から選択できる。これにより、ウェイクアップワードを発した時に、複数の対話システムが立ち上がる事態を回避し、ユーザの好みに応じて、ハンドルスイッチ30の操作時に起動させる対話システムを、第1対話システム112及び第2対話システム32から選択できる。
【0028】
また、対話システムには、システムの起動に関する独自規格を有する場合がある。独自規格は、「特定の対話システムを起動できる状態の時には、他の対話システムはオフ状態(無効化状態)にしなければならない」等である。このような規格をもつ対話システムを第1対話システム112に用いた場合には、本実施形態にように、ユーザ設定によりハンドルスイッチ30の割り当てを変更可能とし、または排他的に対話システムを選択できるようにすればよい。また、ウェイクアップワードによる対話システムの起動を、ユーザ設定により変更可能にする場合には、変形例のように、ユーザ設定によりウェイクアップワードによる起動の割り当てを変更可能とし、または排他的に対話システムを選択できるようにすればよい。すなわち、第1対話システムの規格により、第1対話システム112と第2対話システム32は排他的に起動させる必要がある。そのため、本実施形態のように、ハンドルスイッチ30の割り当て及びウェイクアップワードによる起動の割り当てを、ユーザ設定で変更可能にすることで、対話システムの規格を遵守しつつ、対話システムの選択の自由度も確保できる。
【0029】
なお本実施形態において、乗員の操作又は対話システムを用いた乗員との対話により、第1インターフェイス121及び/又は第2インターフェイス122による起動指令の送信先が変更された場合には、対話システム制御部110は、変更内容を乗員に音声で出力してもよい。
【0030】
表示制御部130は、ディスプレイ10の表示画面を制御する。また表示制御部130は、ディスプレイによりタッチ操作を検知した場合には、表示画面上におけるタッチ操作の位置やタッチ操作の種類に応じた操作指令を受け入れる。表示制御部130は、対話システムを操作するための操作画面、対話システムの設定画面、対話システムから提供される情報を表示する画面等をディスプレイ10に表示させる。また、表示制御部130は、ディスプレイ10のタッチ操作により受け入れた操作指令を、対話システム制御部110及び起動部120に出力する。
【0031】
対話システム制御部110による対話システムの制御と、表示制御部130による表示画面の制御は、アプリケーション(ソフトウェア)で関連付けられている。対話システム制御部110による対話システムの動作状態はディスプレイ10に表示される。また対話システムによる対話に応じて、表示制御部130はディスプレイ10の表示画面を制御する。乗客が、対話システムを通じてコントローラ100と対話を進めると、対話システム制御部110は、対話の内容に応じた制御指令を表示制御部130に送信し、表示制御部130は制御指令に応じてディスプレイ10の表示画面を遷移させる。
【0032】
次に、
図4を参照し、コントローラ100の制御方法と、ディスプレイ10の表示画面について説明する。
図4は、ディスプレイ10の表示画面であって、対話サービスシステムを含めた全体システムのトップ画面を示す。
【0033】
乗員がディスプレイ10のメインスイッチをオンにすると、表示制御部130はディスプレイ10にトップ画面を表示する。
図4に示すように、トップ画面は、ナビゲーションシステム、音楽、第1対話システム112、及び第2対話システム32を選択するためのメニュー画面である。各メニュー画面には、内容を表すアイコンが含まれており、例えば、第1対話システム112のメニュー画像は第1アイコン101を含み、第2対話システム32のメニュー画像は第2アイコン102を含む。第1アイコン101は、第1対話システム112を起動させるためのタッチ操作を有効にするアイコンであり、第2アイコン102は、第2対話システム32を起動させるためのタッチ操作を有効にするアイコンである。乗員が第1アイコン101をタッチした場合には、起動部120は第1対話システム112に起動信号を送信する。乗員が第2アイコン102をタッチした場合には、起動部120は第2対話システム32に起動信号を送信する。これにより、ディスプレイ10のタッチ操作で、第1対話システム112と第2対話システム32を排他的に選択できる。
【0034】
次に、第1対話システム112の動作状態に応じて表示される表示画面について説明する。
図5~
図8は、第1対話システム112の各動作状態に対して、ディスプレイ10に表示される表示画面を表している。
図4に示すトップ画面において、乗員が第1アイコン101又は第1アイコン101の周囲をタッチすると、表示制御部130は
図5に示す画面を表示させる。第1対話システム112の動作状態は、「初期状態」、「音声受付可能状態」、「音声検知状態」、「音声処理状態」の4つの状態がある。初期状態は、起動信号に基づき音声認識エンジンが起動して、音声を検知できる状態になるまでの状態である。音声認識部111は、初期状態では、音声処理を行う前の初期化処理を行う。初期化処理が完了すると、第1対話システム112の動作状態は、初期状態から、音声受付可能状態になる。音声受付可能状態は、音声を受付可能な状態であり、乗員が声を発していない状態を示している。音声検知状態は、音声を受付可能な状態であり、乗員が声を発し、その声を検知している状態である。つまり、音声検知可能な状態で、声が入力されていない場合には、第1対話システム112の動作状態は音声入力受付状態となり、声が入力されている場合には、第1対話システム112の動作状態は音声検知状態となる。そして、音声検知状態が終わり所定時間経過すると、第1対話システム112の動作状態は、音声処理状態になる。音声処理状態は、音声認識エンジンにより音声処理を行っている状態である。
【0035】
図5~
図8の表示画面は、対話システムを通じたサービスにおけるメイン画像を表しており、対話システムの動作状態を示す動作状態画像を含んでいる。動作状態画像は、乗員に対して、対話システムがどのような状態(ステータス)であるかを画像で表したものであり、テキスト、アニメーション、図柄などに相当する。本実施形態では、メインメッセージ50及び/又はアニメーション70が、動作状態画像に相当する。
【0036】
図5は、第1対話システム112の動作状態が「初期状態」である場合に、ディスプレイ10に表示される表示画面を示している。
図5に示すように、「初期状態」の表示画面は、メインメッセージ50、サンプルメッセージ60、及びアニメーション70を含んでいる。メインメッセージ50は、第1対話システム112から乗員に向けたメッセージであって、乗員に音声入力を促す表記である。乗員はメインメッセージ50を確認することで、対話システムが起動されたことを確認できる。すなわち、メインメッセージ50は、対話システムが起動されたことを示す動作状態画像に相当する。サンプルメッセージ60は、第1対話システム112を利用するために、乗員が発すべき音声の例文を表しており、コマンド61と設定値62を含んでいる。コマンド61は、対話システムを通じて乗員が受けたいサービスの動作や状態を表す単語であって、乗員から対話システムに対する操作指令を表す。設定値62は、サービスの対象を表す語句であって、数値や名称等の名詞で表される。例えば、サンプルメッセージ60の第2行目のメッセージ「Play station AAA Radio」のうち、「Play」がコマンドを、「station AAA Radio」が設定値を示す。コ
マンド「Play」はオーディオシステムを操作することを示しており、「station AAA Radio」はオーディオシステムで再生する対象(ラジオ局の名称)を示している。なお、サン
プルメッセージ60は、機能ボタンを兼ねており、例えば乗員が3段目のメッセージ「Enter Number」をタッチした場合には、電話番号を入力するための画面に遷移する。
【0037】
アニメーション70は、所定の機能におけるステータスを周期的な動きで表した画像である。
図5の例では、所定の機能は対話システムにおる音声検知処理機能に相当し、ステータスは対話システムの動作状態に相当する。周期的な動きは、波形の動きで表される。つまり、アニメーション70には、第1対話システム112の4つ動作状態を表すために、4つのアニメーション71~74がある。つまり、第1対話システム112による音声処理の進み具合を、4つのアニメーション71~74で表している。アニメーション70は、波の形、波の色、波の大きさ等により、アニメーションをみた乗員が見てわかるように動作状態毎に区別されている。そして、コントローラ100は、乗員の音声入力に応じて、アニメーション70を動作させることで、音声処理の進み具合をディスプレイ10の表示画面に表示させる。
図5のアニメーション71は「初期状態」を表している。アニメーション71は、灰色の波形であり、振幅が小さめの波である。アニメーション70は、メインメッセージ50とサンプルメッセージ60との間の位置に表示される。なお、対話システムの動作状態を示す動作状態画像は、メインメッセージ50及びアニメーション70の少なくともいずれか一方の画像を含めばよい。後述する
図6~8に示すメイン画面においても、同様に、動作状態画像は、メインメッセージ50及びアニメーション70の少なくともいずれか一方の画像を含めばよい。
【0038】
図6は、第1対話システム112の動作状態が「音声受付可能状態」である場合に、ディスプレイ10に表示される表示画面を示している。
図6に示すように、「音声受付可能状態」の表示画面は、メインメッセージ50、サンプルメッセージ60、及びアニメーション70を含んでいる。メインメッセージ50及びサンプルメッセージ60の表示位置、表示画像は
図5と同様である。
図6のアニメーション72は「音声受付可能状態」を表している。アニメーション72は青色の波形であり、アニメーション72の振幅はアニメーション71の波の振幅よりも大きい。「音声受付可能状態」を表示中に、音声が検知された場合には、ディスプレイ10の表示画面は
図7の画面に切り替わる。「音声受付可能状態」を表示に、音声が検知されない場合には、ディスプレイ10の表示画面は
図6の状態で維持される。
【0039】
図7は、第1対話システム112の動作状態が「音声検知状態」である場合に、ディスプレイ10に表示される表示画面を示している。
図7に示すように、「音声検知状態」の表示画面は、メインメッセージ50、サンプルメッセージ60、及びアニメーション70を含んでいる。メインメッセージ50及びサンプルメッセージ60の表示位置、表示画像は
図5及び
図6と同様である。
図7のアニメーション73は「音声検知状態」を表している。アニメーション73は青色の波形であり、アニメーション73の波の振幅はアニメーション72の波の振幅よりも大きい。アニメーション73の波の振幅を、アニメーション72の波の振幅より大きくすることで、乗員は表示画面から、音声が検知されたことを確認できる。
【0040】
なお、表示制御部130は、検知した音声の音量の大きさに応じて、アニメーション73の振幅を変えてもよい。例えば、検知した音声の音量が大きいほど、アニメーション73の振幅が大きくなるように、表示制御部130は、音声入力に応じて、アニメーション73の振幅を制御する。乗員は、声を発しながら、アニメーション73の振幅の動きを見ることで、音声認識システムで声が検知されることを表示画面から確認できる。またアニメーション73は、複数の波を重ねたアニメーションとし、動きに躍動感をもたせてもよい。
【0041】
図8は第1対話システム112の動作状態が「音声処理状態」である場合に、ディスプレイ10に表示される表示画面を示している。
図8に示すように、「音声処理状態」の表示画面は、メインメッセージ50、サンプルメッセージ60、及びアニメーション70を含んでいる。メインメッセージ50及びサンプルメッセージ60の表示位置、表示画像は
図5~
図7と同様である。
図8のアニメーション74は「音声処理状態」を表している。アニメーション74は、赤、白、緑の波形であり、波をエリアに色で分けている。たとえば、ある時間では、アニメーション74は、
図8の紙面上で左から右に、赤、白、緑の順で表示される。そして、波の振幅、色分けされた部分が、時間経過に伴い変化する。アニメーション74の振幅はアニメーション73の波の振幅よりも小さい。乗員は、波の色が「青」から「赤・白・緑」に変わったことを見ることで、音声処理が始まったことを表示画面から確認できる。アニメーション74は、複数の波を重ねたアニメーションとし、動きに躍動感をもたせてもよい。またアニメーション74に限らず、アニメーション71~73も複数の波を重ねたものとしてもよい。
【0042】
また、アニメーション74に付与された色の数は3色であり、アニメーション71~73に付与された色の数よりも多い。これにより、乗員は、アニメーション70の表示形態から、第1対話システム112の動作状態が「音声処理状態」であることと、第1対話システム112の動作状態が「音声処理状態」以外の状態であることを、より明確に判別できる。なお、本実施形態では、音声処理機能の動作状態に合わせて、アニメーション40を4種類にしたが、アニメーションの種類は4種類に限らず、2、3、又は5種類以上でもよい。また、アニメーションで表示される動きは、波に限らず、例えば模様変化や、棒状のグラフの高低の変化等でもよく、少なくとも周期性があればよい。
【0043】
図9は、「音声検知状態」を表すアニメーション73の時間推移を説明するためのグラフである。アニメーション73は1周期(2π)で波の形を変える。アニメーション73で示される波は、周期的な動きの特徴点を含んでいる。特徴点は、波の腹/節の位置、波の頂点の位置、又は、色の変化点等により表される。特徴点は、他のアニメーション71、72、74との間で対応をとるために指標となる点である。
図9において、(а)は時間(0)におけるアニメーション73を表し、(b)、(c)、及び(d)は、時間(π/2、π、3π/2)におけるアニメーション73を表している。
図9の左側は、表示画面に表示される波の画像である。
図9の右側は、アニメーション73の波形に含まれる特徴点の動きを、概念的に表したものである。特徴点の動きは、例えば、波の形状、色、色彩、座標等の変化を波(周期関数)で表し、その波を重ねた定在波により表してもよい。例えば、アニメーション73を表す波の中心点(位置=λ)における特徴点は、時間(0、π、2π・・・)でゼロになり、時間(π/2、5π/2、9π/2・・・・)で最大となり、時間(3π/2、7π/2、11π/2・・・・)で最小となる。つまりアニメーション73の周期的な動きに合わせて、特徴点も同じ周期で動くことになる。なお、特徴点の変化は、必ずしも乗員が視覚で確認できるような動きや色で表される必要は無く、演算上で算出される点としてもよい。
【0044】
図10は、周期の中である時点における、アニメーション71~74の静止画像と、各アニメーション71~74における特徴点の関係性を説明するためのグラフである。
図10において、(а)は、アニメーション71の静止画像を表しており、(b)~(d)はアニメーション72~74の静止画像を表している。(e)はアニメーション71~74における特徴点のグラフである。アニメーション71~74は、周期における同時刻であっても、波の形状、波の色等は、それぞれのアニメーションに応じて異なっている。アニメーション71~74は同一周期である。例えば、時間(π/2)の時の、アニメーション71の波形とアニメーション72の波形は異なる色、異なる形状である。その一方で、アニメーション71~74の周期的な動きの特徴点は、周期における同時刻であれば同じ波形で表される。
【0045】
次に、アニメーション71~74を表示するための画像構成と、ディスプレイ10の画面遷移について
図11を用いて説明する。
図11は、アニメーション71~74を表示するための画像構成と、画面遷移の前後で再生される静止画像を説明するための概念図である。
図11において、第1、第2表示画面は、第1対話システム112の各動作状態に応じた表示される表示画面であって、第1表示画面は遷移前の画面を示し、第2表示画面は遷移後の画面を示す。例えば、第1対話システム112の動作状態が「初期状態」から「音声受付可能状態」に切り替わり、ディスプレイ10の表示画面が遷移した場合には、第1表示画面は「初期状態」の表示画面に相当し、第2表示画面は「音声受付可能状態」の表示画面に相当する。
【0046】
アニメーション71~74は、複数の静止画像の連続再生により表示される。アニメーション71~74を表示する画像は60枚の静止画像で構成されており、それぞれの画像には0から59までのインデックスが付与されている。静止画像の枚数は、アニメーション71~74毎で同数である。インデックスは静止画像の識別子であり、また再生順序を表している。インデックスは、周期的な動きの特徴点がアニメーション71~74に含まれる画像間で対応するように、インデックスが静止画像に付与されている。例えば、
図10の例では、アニメーション71~74の静止画像は、周期の中で同時刻の画像を表しているため、同じインデックスが付与される。言い換えると、アニメーション71~74間で静止画像を比較した場合に、特徴点が対応している静止画像には同じインデックスが付与されている。
【0047】
表示制御部130は、アニメーション71~74を表示させる際には、1秒間に30枚の静止画像を再生させる再生レートで、画像をディスプレイ10に送る。つまり、1枚あたりの静止画像のタイムスロット(表示間隔)は20msecとなる。表示制御部130は、インデックスが付与された順番で静止画像の再生を開始する。このように、本実施形態では、複数の静止画像の再生で、アニメーション71~74を表示しているため、CPUの処理負荷を軽減できる。また、第1表示画面から第2表示画面に遷移する画面遷移を実行する場合には、表示制御部130は、画面遷移の直前の静止画像である遷移前画像まで表示して、遷移前画像に付与された第1インデックスに対応する第2インデックスを選択する。そして、表示制御部130は、選択された第2インデックスから第2静止画像の再生を開始する。
【0048】
図11の例では、表示制御部130は、第1対話システム112の「初期状態」をアニメーション71で表示するために、インデックス「♯0」が付与された静止画像から画像再生を開始する。そして、インデックス「♯9」が付与された静止画像を表示している状態で、第1対話システム112の動作状態が「初期状態」から「音声受付可能状態」に遷移したとする。表示制御部130は、アニメーション72を表示するための60枚の静止画像の中から、遷移前の静止画像に付与されていたインデックスと同じ「♯9」のインデックスを付与した静止画像を選択する。表示制御部130は、遷移前静止画像のタイムスロットを経過までは、遷移前の静止画像をディスプレイ10に表示させて、遷移前静止画像のタイムスロットを経過した時点で、選択されたインデックス「♯9」から、アニメーション72を表示するための画像再生を開始する。つまり、表示制御部130は、画面遷移を実行する場合には、アニメーション71で表示される周期的な動きの特徴点と、アニメーション72で表示される周期的な動きの特徴点が連続性を保つように、インデックスを選択し、選択されたインデックスから静止画像の再生を開始する。
【0049】
ところで、第1対話システム112の動作状態が変わり、ディスプレイ10の表示画面が遷移した場合に、画面遷移したタイミングで、最初のインデックス「♯0」から静止画像の再生を行った場合には、波の動きが途中で途切れたような表示になってしまい、アニメーションの動きが途切れたように見えてしまう。つまり、
図11の例では、第1表示画面から第2表示画面に遷るタイミングで、インデックスを引き継がずに、再生順序をリセットすると、遷移前後の静止画像間で特徴点が対応しないため、アニメーションが不自然な演出になってしまう。
【0050】
本実施形態では、周期的な動きの特徴点がアニメーション71~74毎に含まれる画像間で対応するようにインデックスを付与して、画面遷移の時には、インデックスを引き継いで静止画像を再生している。これにより、アニメーションの演出方法は変わっても、アニメーションの表示の連続性を保つことができるため、画面遷移の前後でアニメーションを自然な演出にすることができる。また、本実施形態では、画面遷移の時には、遷移前の静止画像をディスプレイ10に表示させた状態を維持し、遷移前静止画像のタイムスロットを経過した時点で、第2表示画面に切り替える。これにより、アニメーションの連続性を保つことができる。
【0051】
次に、第1対話システム112による音声認識処理が正常に完了した後の表示画面について、説明する。
図12は、第1対話システム112がPOIに関する音声を認識した後の、ディスプレイ10の表示画面を表している。例えば、第1対話システム112を起動させた後に、ディスプレイ10が
図6の表示画面を表示している状態で、乗員がPOIに関する音声として「Coffee Shop」と発したとする。音声認識部111は、音声「Coffee Shop」を検知して、音声認識処理を実行する。音声認識処理が正常に完了すると、対話システム制御部110は、音声入力されたPOI(Point of Interst)に関するワードから、乗員が現在地に近い「Coffee Shop」を探していると判断し、POIに関する案内画像80と、現在地周辺の地
図90をディスプレイ10に表示させるように、表示制御部130に制御指令を出力する。
図12に示すように、案内画像80は、音声認識の結果を表す文字列81と、POI情報82を含んでいる。文字列81は、第1対話システム112で認識された音声の文字列である。
図12の例では「Coffee Shop」が表示される。これにより、乗員は、どのような音声がシステムで認識されたのか確認できる。POI情報82は、現在地付近のPOIの名称、現在地からの距離など、POIに関する情報を示している。
【0052】
文字列81が表示された
図12の表示画面の状態から、所定時間を経過すると、ディスプレイ10の表示画面は、
図13の画面に遷る。第1対話システム112は、音声「Coffee Shop」に基づく音声認識処理を終えると、再び音声の受付が可能な状態になる。ディスプレイ10の表示画面では、「音声受付可能状態」を表すアニメーション72が文字列81を表示していた位置に表示される。つまり、乗員は、「Coffee Shop」の文字列81が表示された位置に、アニメーション72の表示をみることで、「Coffee Shop」の次の音声を発すればよいことを確認できる。
【0053】
乗員は、
図13の表示画面の状態から、例えばPOI情報82に含まれる店名等を読み上げると、第1対話システム112は乗員の音声を検知する。
図14に示すように、ディスプレイ10の表示画面は、音声検知に共に、アニメーション70の表示が「音声検知状態」を表すアニメーション73となる。その後、音声検知を終えて音声処理状態になると、
図15に示すように、アニメーション70の表示が「音声処理状態」を表すアニメーション74となる。これにより、乗員は、POIの案内情報や地図情報を見ながら、第1対話システムの処理状況をディスプレイ10の表示で確認できる。
【0054】
図14の表示画面の状態から、音声処理が正常に完了しない場合には、第1対話システム112は、音声認識に失敗した旨を示す制御信号を表示制御部130に出力する。表示制御部130は、
図14の表示画面でアニメーション73の位置に、灰色の波形のアニメーション71を表示する。これにより、乗員は、音声認識に失敗したことを、ディスプレイ10の表示で確認できる。なお、音声認識に失敗した場合には、乗員に対して発話を促すために「もう1度音声を入力してください」のような音声を出力してもよい。
【0055】
上記のように、本実施形態において、表示制御部130は、第1対話システム112のステータスに応じて表示画面を切り替えている。つまり、表示制御部130は、
図5~
図8に示すような、メインメッセージ50及びサンプルメッセージを表示する画像(本発明の「第1情報表示画像」に相当)含んだ画面と、
図12~
図15に示すような、POIに関する情報及び地図情報を表示する画像(本発明の「第2情報表示画像」に相当)を含む画面とを切り替えて、ディスプレイ10に表示させる。このとき、各表示画面には、アニメーション70の画像が含まれている。そして、遷移前画面(
図5~
図8に示す表示画面に相当)と、遷移後画面(
図12~
図15に示す表示画面に相当)とを比較すると、遷移前画像に含まれるアニメーション70の表示、遷移後画像に含まれるアニメーション70の表示は、位置と大きさの点で異なっている。これにより、第1対話システム112を用いた情報提示と、第1対話システム112の動作状態の表示を両立させることができる。
【0056】
次に、第1対話システム112の「音声受付可能状態」から、音声処理が正常に完了しない場合の、ディスプレイ10の表示画面の遷移について説明する。音声処理が正常に完了しない場合とは、「音声受付可能状態」の状態で所定時間経過した場合である。例えば、ディスプレイ10の表示画面が
図6の画面になった後、乗員が発話しない場合には、音声認識部111は音声を検知しない。このような状態が所定時間継続した場合には、音声認識部111は、音声処理が正常に完了しないと判定する。また、音声処理が正常に完了しない場合には、音声処理に異常が生じた場合も含まれる。音声認識部111は、検知した音声に対して音声認識処理を実行する。そして、音声認識部111は、入力された音声が解析できない場合や、解析された音声に対して該当するコマンド61がない場合には、音声処理の異常と判定する。このような音声処理の異常判定の場合も、音声処理が正常に完了しない場合に該当する。
【0057】
上記のとおり、第1対話システム112が「音声受付可能状態」である場合に、ディスプレイ10は、
図6に示すような、メイン画面を表示している。そして、音声処理が正常に完了しないと判定した場合には、ディスプレイ10の表示画面は、
図16に示す画面となる。
図16は、「音声受付可能状態」から、音声処理が正常に完了しない場合の、ディスプレイ10の表示画面を示している。
【0058】
表示制御部130は、音声処理が正常に完了しない場合には、
図16に示すようなカテゴリ画面が表示される。カテゴリ画面は、コマンドをグルーピングしたカテゴリ画像を含んでいる。カテゴリ画像は、複数のコマンドをグルーピングした上で、グループ名をテキストやアイコンで表したものである。カテゴリ画像は、カテゴリの名称201及びカテゴリのアイコン202を含んでいる。例えば、コマンドの一例として「電話をかける(call
and/or dial)」、「リダイヤル(redial)」、「telephone」等、電話に関する複数のコ
マンドを、1つのカテゴリ「Phone」でグルーピングしている。また、カテゴリの名称2
01の隣には、カテゴリのアイコン202が表示される。コマンド61のグルーピングは、電話に限らず、ナビゲーションやオーディオなどがあり、グルーピングしたカテゴリの名称及びアイコンがカテゴリ画面に含まれる。また、カテゴリの名称201を含む画像及びアイコン202は、タッチ操作を有効にする領域を表している。つまり、カテゴリの名称201を含む画像及びアイコン202は、乗員に対してカテゴリを選択させるためのボタン機能を兼ねている。例えば、乗員が、カテゴリ「Phone」の名称201を含む画像、
又は、カテゴリ「Phone」のアイコンをタッチした場合には、表示制御部130は、表示
画面を、カテゴリ画面から後述するリスト画面に遷移させる。なお、メイン画面に表示されるカテゴリ画像は、名称201及びアイコン202の少なくとも一方の画像を含めばよい。
【0059】
カテゴリ画面は、カテゴリの名称201及びアイコン202の他に、メインメッセージ50とアニメーション70を含んでいる。アニメーション70は、「音声検知状態」を表すアニメーション72である。音声認識部111による音声認識処理は、カテゴリ画面を表示している時も有効に機能しており、乗員は、アニメーション72の表示から、第1対話システム112の動作状態が「音声受付可能状態」であることを確認できる。
【0060】
乗員は、第1対話システムを操作するための音声を把握していない場合に、カテゴリの名称201及びアイコン202の表示から、対話システムを進めることができる。またノイズ等により音声を正常に処理できない場合でも、ボタン機能を兼ねたカテゴリ画像(アイコン)を表示させることで、乗員は対話システムを操作できる。またボタン機能を兼ねたカテゴリ画像は、利用頻度の高いものが表示されるため、利便性も向上する。さらに、カテゴリ画面はメインメッセージ50とアニメーション72を含んでいるため、乗員はコントローラ100との対話でシステムを進めれることを画面表示から確認できる。
【0061】
なお、乗員によるカテゴリ及び/又はリストの選択は、音声入力でもよく、その他スイッチ操作でもよい。すなわち、コントローラ100は、カテゴリ画面がディスプレイ10に表示された状態で、乗員の音声、乗員によるディスプレイ10のタッチ操作、及び、乗員によるスイッチ操作のいずれか1つに基づき、カテゴリの選択の有無を判定すればよい。
【0062】
カテゴリ画面において、ユーザがカテゴリを選択した場合には、表示制御部130は、
図17に示すようなリスト画面をディスプレイ10に表示させる。
図17は、ディスプレイ10に表示されるリスト画面を示している。
【0063】
リスト画面は、グルーピングされたコマンドを含んだ画像であって、複数のコマンドを有したリスト300を含んでいる。リスト300は、複数の構文310を有しており、構文310は少なくともコマンド61を有しており、コマンドの他に、サンプルテキスト311を有している。リスト画面は、アニメーション70を含んでいない。構文310は、コマンド61と設定値62の組み合わせをテキストで表示したものである。サンプルテキスト311は、コマンドに続く、設定値62の任意テキストを表しており、構文310に割り当てられる文字列及び数字列のいずれか一方の情報を示す。例えば、リスト中の最上段の構文は、コマンド「Call」とサンプルテキスト「<Name>」で構成されている。「<Name>」はコマンドの後に、人名や店舗名等の設定値62が入ることを表している。乗員が、リスト中の構文310の表示をタッチした場合には、リスト300の右側に、サンプルテキスト311に入る設定値62の例が表示される。さらに、乗員が、リスト中の構文310の表示をダブルタップ等でタッチすると、
図18に示すようなサンプルテキスト311に入る設定リストが表示される。例えば、
図17の表示画面において、リスト中の最上段の構文「Call <Name>」が選択された場合には、
図18に示すような、構文310に割り
当てられる文字列及び数字列のいずれか一方の情報が表示される。乗員は、
図18のリスト画面において、番号表示をタッチすることで、コマンド61と、構文310に割り当てられるサンプルを選択できる。
図18の例では、リスト中の最上段の構文「Call <Name>
」が選択された場合に、コントローラ100は、リスト中のタッチされた番号に電話をかけてもよく、又は、電話をかける旨の通知をディスプレイ10に表示させてもよい。
【0064】
次に、対話システムにおける対話のモデルフローの例を説明する。
図19、20、22~25は、乗員が発する音声に対して、コントローラ100が返答する返答メッセージを表している。
図19、20、22~25において、「Customer」は乗員により発せられるメッセージ例を示しており、「INI」は対話システムにより発生されるメッセージ例を示
している。なお、
図19、20、22~25は一例にすぎず、対話システムは他のモデルフローの下でも対話を実行する。
【0065】
図19は、空調機器41の温度設定に関する対話のモデルフローである。例えば乗員が「ヘイ ○○」と発した場合に、コントローラ100は「コマンドを音声入力するか選択して下さい」という日本語メッセージを機械音で発する。
図19のモデルフローは、例えば
図6の表示画面がディスプレイ10に表示されている状態で、
図19の「Customer」の欄に示すメッセージを発することで、対話システムが進み、空調機器41の設定温度を変更できる。
【0066】
図20は、POI検索に関する対話のモデルフローである。例えば、乗員がウェイクアップワードを発して正常に音声が処理されると、コントローラ100はメッセージ「コマンドを音声入力するか選択して下さい」を返答する。次に、乗員は、お店のジャンルなどPOIを特定できるワードを含んだメッセージ「目的地近くのカフェへ行きたい」を発する。コントローラ100は、このメッセージを認識した後、ナビゲーションシステムを用いて検索を行い、メッセージ「表示されたリストから項目番号を音声入力するか、別のタブを選択してください」と返答する。このときディスプレイ10には、
図21に示す表示画面が表示される。コントローラ100は、POIに関する案内画像80をディスプレイ10に表示させる。コントローラ100は、地図も併せて表示してもよい。案内画像80は、「音声受付可能状態」を表すアニメーション72と、検索結果から得られたPOI情報82を含んでいる。POI情報には、項目番号が付与されている。乗員は、項目番号を発することで、POIを選択できる。
図21の例で、乗員が「イチ」と発することで、POI「AAA」が選択される。コントローラ100は、乗員が発した音声「イチ」を復唱した上で、次の選択用メッセージ「目的地を変更しますか」等を返答する。
【0067】
図22は目的地設定に関する対話のモデルフローである。
図23は、音声再生に関する対話のモデルフローである。
図24はSMS(ショートメッセージ)送信に関する対話のモデルフローである。
図25はSMS(ショートメッセージ)送受信に関する対話のモデルフローである。
【0068】
上記のように本実施形態において、コントローラ100は、乗員の音声を認識する機能を有し、乗員と対話してサービスを提供する対話システムを制御する対話システム制御部111と、対話システムを起動させる起動部120とを備え、起動部120は、ハンドルスイッチ30の操作により対話システムに起動指令を出力する第1インターフェイス121と、乗員により発せられるウェイクアップワードにより対話システムに起動指令を出力する第2インターフェイス122を有し、第1インターフェイス121は、第1対話システム112及び第2対話システム32のいずれか一方のシステムに起動指令を送信し、第2インターフェイス122は、第1対話システム112及び第2対話システム32のいずれか一方のシステムに起動指令を送信する。これにより、乗員がウェイクアップワードを混同するような事態を回避できる。
【0069】
また本実施形態において、コントローラ100で実行され対話システム制御方法は、ハンドルスイッチ30の操作に基づき、第1インターフェイス121から対話システムに起動指令を送信し、乗員の音声を認識する音声認識処理を行い、ウェイクアップワードに基づき第2インターフェイス122から対話システムに起動指令を送信し、起動された対話システムにより、乗員と対話して前記サービスを提供する。そして、対話システム制御方法は、第1インターフェイス121から起動指令を送信する場合には、第1対話システム112及び第2対話システム32のいずれか一方のシステムに起動指令を送信し、第2インターフェイス122から起動指令を送信する場合には、第1対話システム112及び第2対話システム32のいずれか一方のシステムに起動指令を送信する。これにより、乗員がウェイクアップワードを混同するような事態を回避できる。
【0070】
また本実施形態において、起動部120は、乗員の操作に基づき起動指令の送信先を、第1対話システム112及び第2対話システム32のいずれか一方のシステムに設定し、初期設定では第2対話システム32が起動指令の送信先に設定されている。これにより、第2対話サービスを混乱なく起動できる。また、初期設定で、第1インターフェイス121及び第2インターフェイス122による起動指令の送信先を両方とも、第2対話システム32にすることで、より第2対話サービスを混乱なく起動できる。
【0071】
また本実施形態において、起動部120は、乗員の操作に基づき起動指令の送信先を、第1対話システム112及び第2対話システム32のいずれか一方のシステムに設定し、初期設定では、第1対話システム112が起動指令の送信先に設定されている。これにより、重要な第1対話システム112を確実に起動できる。また、初期設定で、第1インターフェイス121及び第2インターフェイス122による起動指令の送信先を両方とも、第1対話システム112にすることで、重要な第1対話システム112をより確実に起動できる。
【0072】
なお、本実施形態において、通信機20は、コントローラ100の一部とし、音声認識部111と通信機20の間の通信経路は、車内通信経路ではなく、音声認識部111内の通信経路としてもよい。また、第2対話システム32は、音声認識エンジン(本発明の「第2音声認識エンジン」に相当)を用いて、音声処理を行ってもよい。
【0073】
なお、以上説明した実施形態は、本発明の理解を容易にするために記載されたものであって、本発明を限定するために記載されたものではない。したがって、上記の実施形態に開示された各要素は、本発明の技術的範囲に属する全ての設計変更や均等物をも含む趣旨である。
【符号の説明】
【0074】
1 車両
2 サーバ
20 通信機
30 ハンドルスイッチ
32 第2対話システム
70 アニメーション
100 コントローラ
110 対話システム制御部
111 音声認識部
112 第1対話システム
120 起動部
121 第1インターフェイス
122 第2インターフェイス
130 表示制御部