(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-12-16
(45)【発行日】2024-12-24
(54)【発明の名称】対象案内制御装置、対象案内制御方法、およびプログラム
(51)【国際特許分類】
G01C 21/36 20060101AFI20241217BHJP
【FI】
G01C21/36
(21)【出願番号】P 2019144180
(22)【出願日】2019-08-06
【審査請求日】2022-06-27
【審判番号】
【審判請求日】2024-04-19
(73)【特許権者】
【識別番号】000002299
【氏名又は名称】清水建設株式会社
(74)【代理人】
【識別番号】100149548
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100161506
【氏名又は名称】川渕 健一
(74)【代理人】
【識別番号】100161207
【氏名又は名称】西澤 和純
(72)【発明者】
【氏名】坪内 優
(72)【発明者】
【氏名】松本 隆史
【合議体】
【審判長】相崎 裕恒
【審判官】梶尾 誠哉
【審判官】伏本 正典
(56)【参考文献】
【文献】特開2017-90615(JP,A)
【文献】特開2001-330450(JP,A)
【文献】特開2005-24313(JP,A)
【文献】特開2006-90790(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G01C21/36
(57)【特許請求の範囲】
【請求項1】
車両に乗車しているユーザの音声と前記ユーザが案内を求める対象である案内対象を指定する前記ユーザのポーズが撮像された車内撮像画像と前記車両の周囲の撮像画像とに基づき、前記ユーザが指定した案内対象の候補を検出する検出部と、
前記車両の位置情報に基づき前記車両の周囲の空間情報における前記車両の位置と向きを特定し、特定した前記車両の向きを基準に前記空間情報における前記案内対象の方向を特定し、特定した前記方向に基づいて前記候補から
一義的に前記案内対象を決定できるか否かを判定し、決定できた場合は、前記案内対象を特定
し、前記案内対象を決定できなかった場合は、前記ユーザに前記案内対象を絞りこむための発話を促すことによって前記ユーザから発話された音声を前記検出部に供給する特定部と、
特定した前記案内対象と対応する前記空間情報に基づき、前記案内対象に関する出力情報を出力させる出力制御部と、
を備える、対象案内制御装置。
【請求項2】
前記検出部は、前記撮像画像を分析することで前記案内対象の候補群を検出し、前記音声を分析して検出する前記案内対象に関連する自然言語と、前記車内撮像画像に含まれる前記ユーザのポーズを分析して検出する前記方向とに基づき、前記候補群の中から前記方向に存在する前記候補を検出する、請求項1に記載の対象案内制御装置。
【請求項3】
前記出力制御部は、特定した前記案内対象のメタデータを前記空間情報から取得し、前記メタデータに基づき前記出力情報を生成する、請求項1または2に記載の対象案内制御装置。
【請求項4】
車両に乗車しているユーザの音声と前記ユーザが案内を求める対象である案内対象を指定する前記ユーザのポーズが撮像された車内撮像画像と前記車両の周囲の撮像画像とに基づき、前記ユーザが指定した案内対象の候補を検出することと、
前記車両の位置情報に基づき前記車両の周囲の空間情報における前記車両の位置と向きを特定し、特定した前記車両の向きを基準に前記空間情報における前記案内対象の方向を特定し、特定した前記方向に基づいて前記候補から
一義的に前記案内対象を決定できるか否かを判定し、決定できた場合は、前記案内対象を特定
し、前記案内対象を決定できなかった場合は、前記ユーザに前記案内対象を絞りこむための発話を促すことによって前記ユーザから発話された音声を前記検出部に供給することと、
特定した前記案内対象と対応する前記空間情報に基づき、前記案内対象に関する出力情報を出力させることと、
を含む、プロセッサにより実行される対象案内制御方法。
【請求項5】
コンピュータを、
車両に乗車しているユーザの音声と前記ユーザが案内を求める対象である案内対象を指定する前記ユーザのポーズが撮像された車内撮像画像と前記車両の周囲の撮像画像とに基づき、前記ユーザが指定した案内対象の候補を検出する検出部と、
前記車両の位置情報に基づき前記車両の周囲の空間情報における前記車両の位置と向きを特定し、特定した前記車両の向きを基準に前記空間情報における前記案内対象の方向を特定し、特定した前記方向に基づいて前記候補から
一義的に前記案内対象を決定できるか否かを判定し、決定できた場合は、前記案内対象を特定
し、前記案内対象を決定できなかった場合は、前記ユーザに前記案内対象を絞りこむための発話を促すことによって前記ユーザから発話された音声を前記検出部に供給する特定部と、
特定した前記案内対象と対応する前記空間情報に基づき、前記案内対象に関する出力情報を出力させる出力制御部と、
として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、対象案内制御装置、対象案内制御方法、およびプログラムに関する。
【背景技術】
【0002】
従来、車両において経路案内や周囲の施設の案内等を行うガイドシステムが普及している。当該ガイドシステムが搭載されたカーナビゲーション装置は、自動車等の車両における経路案内によく用いられている。また、当該ガイドシステムは、観光客に対する観光案内にも用いられている。
【0003】
例えば、下記特許文献1には、車内にバスガイド等の案内者がいなくても、観光客に対して観光案内を自動で行うことが可能なガイドシステムが開示されている。当該技術では、車外を撮像可能に設けられた撮像装置が観光案内の対象を撮像した場合、あらかじめ用意された音声データに基づく音声出力により観光案内が行われる。
【0004】
また、近年では、スマートフォンの普及に伴い、スマートフォンで経路案内や周囲の施設の案内が可能なアプリケーションが普及している。そのため、カーナビゲーション装置がスマートフォンで代用されることもある。さらに、音声認識技術の発展に伴い、音声により制御可能なスピーカ型の音声インタフェース装置(例えばスマートスピーカ)も普及してきている。そのため、将来的に、カーナビゲーション装置がスマートスピーカに置き換わり、ユーザの音声入力に基づき、スマートスピーカが経路案内や車両の周囲の施設の案内等を行う可能性がある。
【先行技術文献】
【特許文献】
【0005】
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、従来のスマートスピーカが移動している車両の車内に設けられた場合、当該スマートスピーカは、車内の情報を取得することはできるが、車外の情報を取得することは困難である。例えば、ユーザが車外のランドマーク等を「あの建物は何?」等のランドマークの名称を特定しない方法で案内の対象として指定した場合、スマートスピーカは、ユーザから案内の要求があったことは認識し得る。しかしながら、ユーザが車外のどのランドマークを案内の対象として指定したかをスマートスピーカが認識することは困難である。そのため、スマートスピーカは、ユーザが指定したランドマークを正しく認識することが難しいため、誤った案内を行う可能性がある。
【0007】
上述の課題を鑑み、本発明の目的は、車両に乗車しているユーザが案内を求める対象として指定した案内対象に関する案内の精度を向上することが可能な対象案内制御装置、対象案内制御方法、およびプログラムを提供することにある。
【課題を解決するための手段】
【0008】
上述の課題を解決するために、本発明の一態様に係る対象案内制御装置は、車両に乗車しているユーザの音声と前記ユーザが案内を求める対象である案内対象を指定する前記ユーザのポーズが撮像された車内撮像画像と前記車両の周囲の撮像画像とに基づき、前記ユーザが指定した案内対象の候補を検出する検出部と、前記車両の位置情報に基づき前記車両の周囲の空間情報における前記車両の位置と向きを特定し、特定した前記車両の向きを基準に前記空間情報における前記案内対象の方向を特定し、特定した前記方向に基づいて前記候補から一義的に前記案内対象を決定できるか否かを判定し、決定できた場合は、前記案内対象を特定し、前記案内対象を決定できなかった場合は、前記ユーザに前記案内対象を絞りこむための発話を促すことによって前記ユーザから発話された音声を前記検出部に供給する特定部と、特定した前記案内対象と対応する前記空間情報に基づき、前記案内対象に関する出力情報を出力させる出力制御部と、を備える。
【0009】
本発明の一態様に係る対象案内制御方法は、車両に乗車しているユーザの音声と前記ユーザが案内を求める対象である案内対象を指定する前記ユーザのポーズが撮像された車内撮像画像と前記車両の周囲の撮像画像とに基づき、前記ユーザが指定した案内対象の候補を検出することと、前記車両の位置情報に基づき前記車両の周囲の空間情報における前記車両の位置と向きを特定し、特定した前記車両の向きを基準に前記空間情報における前記案内対象の方向を特定し、特定した前記方向に基づいて前記候補から一義的に前記案内対象を決定できるか否かを判定し、決定できた場合は、前記案内対象を特定し、前記案内対象を決定できなかった場合は、前記ユーザに前記案内対象を絞りこむための発話を促すことによって前記ユーザから発話された音声を前記検出部に供給することと、特定した前記案内対象と対応する前記空間情報に基づき、前記案内対象に関する出力情報を出力させることと、を含み、プロセッサにより実行される。
【0010】
本発明の一態様に係るプログラムは、コンピュータを、車両に乗車しているユーザの音声と前記ユーザが案内を求める対象である案内対象を指定する前記ユーザのポーズが撮像された車内撮像画像と前記車両の周囲の撮像画像とに基づき、前記ユーザが指定した案内対象の候補を検出する検出部と、前記車両の位置情報に基づき前記車両の周囲の空間情報における前記車両の位置と向きを特定し、特定した前記車両の向きを基準に前記空間情報における前記案内対象の方向を特定し、特定した前記方向に基づいて前記候補から一義的に前記案内対象を決定できるか否かを判定し、決定できた場合は、前記案内対象を特定し、前記案内対象を決定できなかった場合は、前記ユーザに前記案内対象を絞りこむための発話を促すことによって前記ユーザから発話された音声を前記検出部に供給する特定部と、特定した前記案内対象と対応する前記空間情報に基づき、前記案内対象に関する出力情報を出力させる出力制御部と、として機能させる。
【発明の効果】
【0011】
本発明によれば、車両に乗車しているユーザが案内を求める対象として指定した案内対象に関する案内の精度を向上することができる。
【図面の簡単な説明】
【0012】
【
図1】本発明の実施形態に係る対象案内制御システムの概要を示す図である。
【
図2】同実施形態に係る対象案内制御システムの構成例を示すブロック図である。
【
図3】同実施形態に係る案内対象の候補の検出の例の説明図である。
【
図4】同実施形態に係る車両の位置情報と3次元地図との対応付けの例の説明図である。
【
図5】同実施形態に係る対象案内制御システムにおける処理の流れを示すフローチャートである。
【
図6】同実施形態に係る案内対象特定処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0013】
以下、図面を参照しながら本発明の実施形態について詳しく説明する。
図1は、本発明の実施形態に係る対象案内制御システム1の概要を示す図である。対象案内制御システム1は、
図1に示す対象案内制御装置10、車両20、およびネットワーク30で構成される。
【0014】
対象案内制御装置10は、車両20のユーザ40が案内を求める対象として指定した案内対象に関する案内の制御(以下、「案内制御」とも称される)を行う装置である。対象案内制御装置10は、例えば、サーバ装置等のコンピュータにより実現される。
【0015】
対象案内制御装置10は、
図1に示すように、ネットワーク30を介して車両20と接続されており、車両20と情報の送受信が可能である。本実施形態に係る対象案内制御装置10は、ネットワーク30を介して車両20から受信した情報に基づき、案内制御を行う。また、対象案内制御装置10は、ネットワーク30を介して、案内制御に関する情報を車両20へ送信する。
【0016】
車両20は、搭乗者(例えばユーザ40)を乗せて移動する移動体である。本実施形態に係る車両20は、一例として、自動運転車で実現されるものとする。車両20が自動運転車である場合、ユーザ40は、必ずしも運転する必要はない。車両20は、非自動運転車であってもよい。
【0017】
車両20には、各種情報を取得するためのセンサ装置が設けられている。例えば、
図1に示すように、マイク212、車内カメラ214a、車内カメラ214b、車内カメラ214c、車外カメラ216a、車外カメラ216b、およびスピーカ242が車両20に設けられる。マイク212は、車両20の車内で生じた音声を取得可能に設けられる。車内カメラ214a~214c(以下、「車内カメラ214」とも称される)は、車両20の車内の様子を撮像可能に設けられる。例えば、車内カメラ214は、
図1に示すように、それぞれ車両20の上部前方、上部中央、上部後方に設けられ、各々の位置から車両20の車内を撮像して撮像画像(静止画像または動画像)を取得する。車外カメラ216aおよび車外カメラ216b(以下、「車外カメラ216」とも称される)は、車両20の車外の様子を撮像可能に設けられる。例えば、車外カメラ216は、
図1に示すように、それぞれ車両20の前方と後方に設けられ、各々の位置から車両20の車外を撮像する。なお、車両20に設けられるセンサ装置の種類、数、および位置は、
図1に示す例に限定されない。
【0018】
車両20には、出力情報を出力するための出力装置も設けられている。例えば、
図1に示すように、スピーカ242が車両20に設けられる。スピーカ242は、出力情報として案内対象に関する情報(以下、「案内情報」とも称される)を車両20の車内に向けて出力可能に設けられる。なお、車両20に設けられる出力装置の種類、数、および位置は、
図1に示す例に限定されない。また、出力装置は、ユーザ40が有する端末であってもよい。ユーザ40が有する端末は、例えば、スマートフォン、タブレット端末、ヒアラブル端末等である。
【0019】
案内対象は、車両20の周囲に存在するランドマークの内、ユーザ40が指定したランドマークである。
図1に示すように、車両20の周囲にはランドマークとしてビル50とビル51がある。進行方向が矢印22の方向である車両20の車内にいるユーザ40から見て、ビル50はユーザ40の右前方にあり、ビル51はユーザ40の左前方にある。なお、ランドマークはビルに限定されない。
案内情報は、案内対象の紹介情報、案内対象までの経路情報等を含む。
【0020】
図1では、ユーザ40は、吹き出し42に示されるように「右前のビル」と発話し、音声により案内対象を指定している。同時に、ユーザ40は、指で矢印44の方向(ユーザ40から見て右前方)を指す動作により案内対象を指定している。これより、
図1における案内対象はビル50と特定される。なお、ユーザ40は、案内対象を指定する際に、質問形式の発話を行ってもよい。例えば、ユーザ40は、「右前のビルは何?」と発話してもよい。
【0021】
このような案内対象を特定する処理(以下、「案内対象特定処理」とも称される)は、車両20にて取得される音声や、ユーザ40が案内対象を指定する動作に基づき、対象案内制御装置10により行われる。ユーザ40が案内対象を指定する動作は、例えば、指で指す動作、棒状の物(例えば指示棒、ペンなど)で指す動作、腕全体で指す動作などである。また、対象案内制御装置10は、ユーザ40の顔の向きや視線の方向を示す情報も用いて、案内対象特定処理を行ってもよい。なお、案内対象特定処理の詳細は後述される。
【0022】
なお、対象案内制御装置10は、その構成要素の一部または全部を、車両20に備えることが可能な装置として実現されてもよい。車両20に備えられた対象案内制御装置10の構成要素は、車両20が備える各装置と情報の送受信が可能になるように、各装置と有線または無線により接続され得る。一方、車両20に備えられなかった対象案内制御装置10の構成要素は、例えばサーバ装置等により実現され、ネットワーク30を介して、車両20に備えられた対象案内制御装置10の構成要素や、車両20が備える各装置と連携を行い得る。
【0023】
以上、本実施形態の概要について説明した。続いて、本実施形態に係る対象案内制御システム1の構成例について説明する。
図2は、本実施形態に係る対象案内制御システム1の構成例を示すブロック図である。なお、以下では、対象案内制御装置10の構成要素の全部が車両20には備えられず、サーバ装置等により実現される場合の対象案内制御システム1の構成例について説明する。
【0024】
(車両20の構成例)
図2に示すように、車両20は、取得部210、通信部220、制御部230、および案内情報出力部240を備える。
【0025】
(取得部210)
取得部210は、各種情報を取得する機能を有する。当該機能は、多様なセンサ装置により実現され得る。本実施形態に係る取得部210は、例えば、上述したマイク212、車内カメラ214、車外カメラ216等のセンサ装置を備える。また、取得部210は、車両20の位置情報を取得するセンサ装置を備えてもよい。一例として、取得部210は、GPS(Global Positioning System)を備える。これらのセンサ装置によるセンシング情報の取得後、取得部210は、センシング情報を通信部220へ出力する。
【0026】
なお、取得部210が備えるセンサ装置はかかる例に限定されない。例えば、取得部210は、車両20の車内外の様子を示す情報を取得するセンサ装置として、LiDAR(Laser Imaging Detection and Ranging)等の測距センサを備えてもよい。
【0027】
(通信部220)
通信部220は、外部装置と通信を行う機能を有する。通信部220は、外部装置との通信にて受信する情報を制御部230へ出力する。一例として、通信部220は、ネットワーク30を介して対象案内制御装置10から受信した案内情報を、制御部230へ出力する。また、通信部220は、取得部210から入力される情報を対象案内制御装置10へ送信する。一例として、通信部220は、取得部210から入力されるセンシング情報を、ネットワーク30を介して対象案内制御装置10へ送信する。
【0028】
(制御部230)
制御部230は、車両20の動作全般を制御する機能を有する。制御部230は、例えば、車両20がハードウェアとして備えるCPU(Central Processing Unit)にプログラムを実行させることによって実現される。例えば、制御部230は、取得部210が有する各センサ装置の動作を制御する。また、制御部230は、通信部220から入力される案内情報の案内情報出力部240への出力を制御する。また、車両20が自動運転車である場合、制御部230は、車両20の自動運転を制御する。
【0029】
(案内情報出力部240)
案内情報出力部240は、案内情報の出力を行う機能を有する。案内情報は、例えば、制御部230から入力され、多様な出力装置により出力され得る。例えば、案内情報出力部240がスピーカ等の音声出力装置を備える場合、案内情報出力部240は、音声に変換された案内情報をスピーカから出力する。また、案内情報出力部240がディスプレイ等の表示装置を備える場合、案内情報出力部240は、画像に変換された案内情報をディスプレイに表示する。
【0030】
(対象案内制御装置10の構成例)
図2に示すように、対象案内制御装置10は、通信部110、制御部120、および記憶部130を備える。
【0031】
(通信部110)
通信部110は、外部装置と通信を行う機能を有する。通信部110は、外部装置との通信にて受信する情報を制御部120へ出力する。一例として、通信部110は、ネットワーク30を介して車両20から受信したセンシング情報を、制御部120へ出力する。また、通信部110は、制御部120から入力される情報を車両20へ送信する。一例として、通信部110は、制御部120から入力される案内情報を、ネットワーク30を介して車両20へ送信する。
【0032】
(制御部120)
制御部120は、対象案内制御装置10の動作全般を制御する機能を有する。制御部120は、例えば、対象案内制御装置10がハードウェアとして備えるCPUにプログラムを実行させることによって実現される。当該機能を実現するために、制御部120は、検出部122、特定部124、および出力制御部126を備える。
【0033】
(検出部122)
検出部122は、案内対象の候補を検出する機能を有する。例えば、検出部122は、車両20に乗車しているユーザ40の音声とユーザ40が案内対象を指定する動作と車両20の周囲の撮像画像とに基づき、案内対象の候補を検出する。具体的に、検出部122は、撮像画像を分析することで案内対象の候補群を検出し、音声を分析して検出する案内対象に関連する自然言語と、ユーザ40の動作を分析して検出する方向とに基づき、候補群の中から方向に存在する候補を検出する。
【0034】
ここで、
図3を参照しながら、案内対象の候補の検出の例について説明する。
図3は、本実施形態に係る案内対象の候補の検出の例の説明図である。まず、検出部122は、車両20のマイク212が取得する音声を分析することで、音声から自然言語を検出する。検出した自然言語から、ユーザ40が案内を求めていることを示すボイスコマンドが検出された場合、検出部122は、さらに音声を分析し、案内対象に関する自然言語を検出する。例えば、検出部122は、吹き出し42に示す「右前のビル」という音声を案内対象に関連する自然言語として検出する。
図3に示す例では、ユーザ40は車両20の進行方向である矢印22の方向を向いているため、検出部122は、検出した自然言語から車両20の右前にあるビル50をユーザ40が指していることを検出できる。
【0035】
さらに、検出部122は、車両20の車内カメラ214が取得する車内の撮像画像に写るユーザ40のポーズを分析することで、ユーザ40が矢印44の方向を指していることを検出する。また、検出部122は、車両20の車外カメラ216が取得する車外の撮像画像に写る車外風景を分析することで、
図3に示すビル50とビル51を案内対象の候補群として検出する。以上の検出結果より、検出部122は、候補群の中から、車両20の右前かつ矢印44の方向にあるビル50を案内対象の候補として検出する。
【0036】
以上説明したように、検出部122は、移動している車両20の車内のユーザ40の音声とユーザ40の動作に基づき、車両20の車外風景から検出された案内対象の候補群とユーザ40が指定した案内対象とを結び付けることができる。かかる構成により、検出部122は、移動している車両20の車外のランドマークを案内対象の候補として検出することができる。また、検出部122は、案内対象の候補の検出時に、車両20の車内のユーザ40の音声とユーザ40の動作の両方を用いるため、案内対象の候補の検出の精度を向上することができる。なお、検出部122は、候補群の中から、1つの案内対象の候補を検出してもよいし、複数の案内対象の候補を検出してもよい。
【0037】
(特定部124)
特定部124は、検出部122が検出した案内対象の候補から、ユーザ40が指定した案内対象を特定する機能を有する。例えば、特定部124は、車両20の位置情報に基づき車両20の周囲の空間情報における車両20の位置と向きを特定し、特定した車両20の向きを基準に空間情報における案内対象の方向を特定し、特定した方向に基づいて案内対象の候補から案内対象を特定する。本実施形態に係る車両20の周囲の空間情報は、例えば、車両20の周囲の3次元地図、3次元地図上のランドマークのメタデータ等を含むランドマーク情報等である。なお、空間情報は、かかる例に限定されない。
【0038】
ここで、
図4を参照しながら、車両20の位置情報と3次元地図との対応付けについて説明する。
図4は、本実施形態に係る車両20の位置情報と3次元地図との対応付けの例の説明図である。
図4に示すように、3次元地
図60は、ビル50、ビル51、および山52等のランドマークの3次元データを有するものとする。
【0039】
まず、特定部124は、車両20のGPSが取得する位置情報から3次元地図における車両20の位置と向きを特定し、車両20を3次元地図上にマッピングする。車両20の向きは、例えば、ジャイロセンサのセンシング情報や車両20の移動履歴等に基づき特定されてもよい。次いで、特定部124は、3次元地図上にて、矢印22が示す車両20の向きを基準に、ユーザ40が指定した案内対象の方向を特定する。そして、特定部124は、案内対象の候補から、特定した方向(矢印44)に存在する候補であるビル50を案内対象として特定する。
【0040】
以上説明したように、特定部124は、車両20の位置情報と3次元地図に基づき、検出部122が検出した案内対象の候補から、ユーザ40が指定した案内対象を3次元地図上で一義的に特定することができる。かかる構成により、特定部124は、検出部122が1つの案内対象の候補を検出した場合には、案内対象であることの確度を高めることができる。また、特定部124は、検出部122が複数の案内対象の候補を検出した場合には、案内対象を絞り込むことができる。これにより、案内対象の特定精度が向上するため、ユーザ40が指定した案内対象に関する案内の精度も向上することが可能となる。
【0041】
(出力制御部126)
出力制御部126は、車両20における出力を制御する機能を有する。例えば、出力制御部126は、特定した案内対象と対応する空間情報に基づき、案内対象に関する出力情報を車両20の出力装置に出力させる。具体的に、まず、出力制御部126は、特定した案内対象のメタデータをランドマーク情報から取得し、メタデータに基づき案内情報を生成する。そして、出力制御部126は、生成した案内情報を通信部110に車両20へ送信させ、車両20の出力装置に案内情報を出力させる。
【0042】
案内対象がビルである場合、メタデータは、例えば、ビルの名称、住所、フロア数、各フロアのテナント情報等である。出力制御部126は、これらのメタデータに基づき、例えば、「あのビルはAAAビルです。」という紹介文を紹介情報として生成する。そして、出力制御部126は、車両20の出力装置に応じて、出力装置に紹介情報を出力させる。例えば、出力装置が音声出力装置である場合、出力制御部126は、紹介文を音声に変換して音声出力装置に出力させる。また、出力装置が表示装置である場合、出力制御部126は、紹介文を画像に変換して表示装置に出力させる。かかる構成により、ユーザ40に対して、案内対象の特定後に取得するランドマーク情報に基づき、特定した案内対象や取得したランドマーク情報に応じた柔軟な案内を行うことができる。
【0043】
案内情報の生成時、出力制御部126は、車両20やユーザ40の状況、ユーザ40のプロファイル情報に応じて、案内情報を生成してもよい。車両20の状況は、例えば、車両20の位置、向き、速度、移動経路等である。ユーザ40の状況は、例えば、ユーザ40の姿勢、車内におけるユーザ40の位置等である。ユーザ40のプロファイル情報は、例えば、ユーザ40の名前、性別、身長、体重、趣味、対象案内制御システムの使用履歴等である。出力制御部126は、ユーザ40のプロファイル情報に基づき、例えば、「あのビルはAAAビルです。ビルの中には、以前にご案内したBBBカフェがあります。」という紹介文を紹介情報として生成する。かかる構成により、ユーザ40に対して、車両20やユーザ40の状況、ユーザ40のプロファイル情報に応じた柔軟な案内を行うことができる。
【0044】
(記憶部130)
記憶部130は、各種情報を記憶する機能を有する。記憶部130は、記憶媒体、例えば、HDD(Hard Disk Drive)、フラッシュメモリ、EEPROM(Electrically Erasable Programmable Read Only Memory)、RAM(Random Access read/write Memory)、ROM(Read Only Memory)、またはこれらの記憶媒体の任意の組み合わせによって構成される。記憶部130は、例えば、不揮発性メモリを用いることができる。
【0045】
記憶部130、例えば、3次元地図やランドマーク情報等の車両20の周囲の空間情報を記憶する。また、記憶部130は、車両20の取得部210が取得したセンシング情報、対象案内制御装置10の特定部124が案内対象として特定したランドマーク、出力制御部126が生成した出力情報、ユーザ40のプロファイル情報等を記憶してもよい。
【0046】
以上、対象案内制御装置10の構成要素の全部が車両20には備えられずサーバ装置等により実現される場合の対象案内制御システム1の構成例について説明した。なお、対象案内制御システム1の構成例はかかる例に限定されない。例えば、対象案内制御装置10の構成要素の全部が車両20に備えられる場合、外部装置と通信を行う機能を有する構成要素として、通信部110または通信部220の少なくとも一方が車両20に設けられればよい。
【0047】
(対象案内制御システム1における処理の流れ)
続いて、本実施形態に係る対象案内制御システム1における処理の流れについて説明する。
図5は、本実施形態に係る対象案内制御システム1における処理の流れを示すフローチャートである。なお、以下では、対象案内制御装置10の構成要素の全部が車両20には備えられず、サーバ装置等により実現される場合の対象案内制御システム1における処理の流れの例について説明する。
【0048】
まず、車両20のマイク212は、車両20の車内における音声を取得する(S102)。マイク212が取得した音声は、ネットワーク30を介して対象案内制御装置10へ送信される。マイク212が音声を取得すると、車両20の制御部230は、車両20の車内カメラ214をオンにする(S104)。また、制御部230は、車両20の車外カメラ216もオンにする(S106)。
【0049】
次いで、ユーザ40が発話すると(S108)、マイク212がユーザ40の発話を含む音声を取得し、当該音声がネットワーク30を介して対象案内制御装置10へ送信される。次いで、対象案内制御装置10の制御部120は、案内を求めるボイスコマンドが受信した音声に含まれるか否かを判定する(S110)。音声にボイスコマンドが含まれない場合(S110/NO)、対象案内制御システム1は、音声にボイスコマンドが含まれるまでS108とS110の処理を行う。音声にボイスコマンドが含まれる場合(S110/YES)、制御部120は、案内対象特定処理を行う(S112)。なお、案内対象特定処理の詳細は後述される。
【0050】
案内対象特定処理後、制御部120は、案内対象として特定したランドマークを記録する(S114)。次いで、制御部120は、ランドマークのメタデータを3次元地図から取得する(S116)。次いで、制御部120は、車両20やユーザ40の状況とユーザ40のプロファイル情報に応じて紹介文を生成する(S118)。紹介文の生成後、制御部120は、紹介文を音声に変換し、変換した音声を車両20のスピーカ242に出力させることで、紹介文の読み上げを行う(S120)。紹介文の読み上げ後、制御部120は、次の対話があるか否かを判定する(S122)。次の対話がある場合(S122/YES)、制御部120は、S110から処理を繰り返す。次の対話がない場合(S122/NO)、制御部120は、次に音声が取得されるまで処理を終了する。
【0051】
(案内対象特定処理の流れ)
続いて、S112の案内対象特定処理の詳細について説明する。
図6は、本実施形態に係る案内対象特定処理の流れを示すフローチャートである。
【0052】
まず、制御部120は、音声に含まれる自然言語を分析する(S202)。次いで、制御部120は、車両20からネットワーク30を介して受信する車内カメラ214の撮像画像に写るユーザ40のポーズを分析する(S204)。次いで、制御部120は、車両20からネットワーク30を介して受信する車外カメラ216の撮像画像に写る車外風景を分析する(S206)。
【0053】
自然言語、ポーズ、および車外風景の分析後、制御部120は、案内対象を検出できたか否かを判定する(S208)。案内対象を検出できなかった場合(S208/NO)、制御部120は、ユーザ40に対して再度発話を促す(S220)。
【0054】
案内対象を検出できた場合(S208/YES)、制御部120は、車両20の位置と向きを取得する(S210)。次いで、制御部120は、車両20の位置と向きを3次元地図と対応付ける(S212)。次いで、制御部120は、ユーザ40のポーズの向きを車両20の向きと対応付ける(S214)。次いで、制御部120は、車両20の車外風景が写った撮像画像を3次元地図と対応付ける(S216)。
【0055】
各対応付け後、制御部120は、案内対象が3次元地図上で一義的に決定できるか否かを判定する(S218)。案内対象を一義的に決定できなかった場合(S218/NO)、制御部120は、ユーザ40に対して、案内対象を絞り込むための発話を促す(S222)。案内対象を一義的に決定できた場合(S218/YES)、制御部120は、案内対象特定処理を終了する。
【0056】
以上、対象案内制御装置10の構成要素の全部が車両20には備えられず、サーバ装置等により実現される場合の対象案内制御システム1における処理の流れの例について説明した。なお、対象案内制御システム1における処理の流れはかかる例に限定されない。例えば、対象案内制御装置10の構成要素の全部が車両20に備えられる場合、対象案内制御システム1は、ネットワーク30を介さずに処理を行い得る。
【0057】
以上説明したように、本実施形態に係る対象案内制御装置10は、移動している車両20の車内のユーザ40の音声とユーザ40の動作に基づき、車両20の車外風景から検出された案内対象の候補群とユーザ40が指定した案内対象とを結び付ける。これにより、対象案内制御装置10は、移動している車両20の車外のランドマークを案内対象の候補として検出することができる。
また、本実施形態に係る対象案内制御装置10は、車両20の車内のユーザ40の音声とユーザ40の動作の両方を用いて案内対象の候補を検出する。これにより、対象案内制御装置10は、案内対象の検出の精度を向上することができる。
また、本実施形態に係る対象案内制御装置10は、車両20の位置情報と3次元地図に基づき、3次元地図上で案内対象を一義的に特定する。これにより、対象案内制御装置10は、案内対象の特定の精度を向上し、さらに、ユーザ40が指定した案内対象に関する案内の精度も向上することができる。
したがって、本実施形態に係る対象案内制御装置10は、車両20に乗車しているユーザ40が案内を求める対象として指定した案内対象に関する案内の精度を向上することができる。
【0058】
(変形例)
以上、本発明の実施形態について説明した。続いて、本発明の実施形態の変形例について説明する。なお、以下に説明する各変形例は、単独で本発明の実施形態に適用されてもよいし、組み合わせで本発明の実施形態に適用されてもよい。また、各変形例は、本発明の実施形態で説明した構成に代えて適用されてもよいし、本発明の各実施形態で説明した構成に対して追加的に適用されてもよい。
【0059】
(第1の変形例)
上述した実施形態では、対象案内制御装置10がユーザ40に指定された案内対象に関する案内の制御を行う例について説明したが、かかる例に限定されない。車両20の周囲にユーザ40が興味を持ちそうなランドマークがある場合、対象案内制御装置10は、ユーザ40からの指定がなくても当該ランドマークを案内対象として案内の制御を行ってもよい。ユーザ40が興味を持ちそうなランドマークは、例えば、車両20の位置情報やユーザ40のプロファイル情報等に基づき検出される。かかる構成により、ユーザ40に対して、ユーザ40に応じた柔軟な案内を行うことができる。
【0060】
(第2の変形例)
上述した実施形態では、対象案内制御装置10が車両20の出力装置に案内情報を出力させる例について説明したが、かかる例に限定されない。例えば、検出部122が検出した自然言語から、ユーザ40が経路変更を求めていることを示すボイスコマンドが検出された場合、案内情報は車両20の制御部230に対して出力されてもよい。この時、制御部230には、変更後の経路を示す経路情報が案内情報として入力される。そして、制御部230は、入力された経路情報に基づき、車両20が変更後の経路に沿って移動するように、車両20の自動運転を制御する。
【0061】
(第3の変形例)
上述した実施形態では、出力制御部126がメタデータに基づき案内情報を生成する例について説明したが、係る例に限定されない。出力制御部126は、ウェブサービスから案内対象に関する情報を取得し、取得した情報に基づき案内情報を生成してもよい。
【0062】
以上、本発明の実施形態の変形例について説明した。なお、上述した実施形態における対象案内制御装置10をコンピュータで実現するようにしてもよい。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよく、FPGA(Field Programmable Gate Array)等のプログラマブルロジックデバイスを用いて実現されるものであってもよい。
【0063】
以上、図面を参照してこの発明の実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
【符号の説明】
【0064】
1…対象案内制御システム、10…対象案内制御装置、20…車両、30…ネットワーク、110…通信部、120…制御部、122…検出部、124…特定部、126…出力制御部、130…記憶部、210…取得部、212…マイク、214…車内カメラ、216…車外カメラ、220…通信部、230…制御部、240…案内情報出力部