IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ セコム株式会社の特許一覧

<>
  • 特許-対話型案内装置 図1
  • 特許-対話型案内装置 図2
  • 特許-対話型案内装置 図3
  • 特許-対話型案内装置 図4
  • 特許-対話型案内装置 図5
  • 特許-対話型案内装置 図6
  • 特許-対話型案内装置 図7
  • 特許-対話型案内装置 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-10-18
(45)【発行日】2024-10-28
(54)【発明の名称】対話型案内装置
(51)【国際特許分類】
   G10L 15/22 20060101AFI20241021BHJP
   G10L 13/00 20060101ALI20241021BHJP
   G06F 3/16 20060101ALI20241021BHJP
   G06F 3/01 20060101ALI20241021BHJP
【FI】
G10L15/22 300Z
G10L13/00 100M
G10L13/00 100S
G06F3/16 650
G06F3/01 510
【請求項の数】 2
(21)【出願番号】P 2020161400
(22)【出願日】2020-09-25
(65)【公開番号】P2022054294
(43)【公開日】2022-04-06
【審査請求日】2023-07-20
(73)【特許権者】
【識別番号】000108085
【氏名又は名称】セコム株式会社
(74)【代理人】
【識別番号】100099759
【弁理士】
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【弁理士】
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100114018
【弁理士】
【氏名又は名称】南山 知広
(74)【代理人】
【識別番号】100180806
【弁理士】
【氏名又は名称】三浦 剛
(74)【代理人】
【氏名又は名称】阿形 直起
(72)【発明者】
【氏名】荒井 和教
(72)【発明者】
【氏名】小関 遼
(72)【発明者】
【氏名】今田 翔平
(72)【発明者】
【氏名】青木 秀行
【審査官】土井 悠生
(56)【参考文献】
【文献】特開2019-53351(JP,A)
【文献】特開2004-328181(JP,A)
【文献】特開2016-076007(JP,A)
【文献】国際公開第2019/026395(WO,A1)
【文献】国際公開第2019/138651(WO,A1)
【文献】特開2019-079345(JP,A)
【文献】特開2015-069102(JP,A)
【文献】特開2015-076040(JP,A)
【文献】特開2012-216007(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 13/00-99/00
G06F 3/16
G06F 3/01
(57)【特許請求の範囲】
【請求項1】
キャラクタの画像を表示する表示部と、
所定空間内の人物を検知する検知部と、
前記キャラクタによる発話を音声として出力するとともに、前記検知された人物による発話を音声入力として受付ける音声入出力部と、
前記音声入出力部及び前記表示部を制御して、前記キャラクタに前記検知された人物と対話させることにより、前記人物に対する応対をする応対部と、を有し、
前記応対部は、前記応対において、前記人物による発話が継続していない場合は、前記人物に対する案内情報を前記キャラクタによる発話として前記音声入出力部から出力するとともに、前記案内情報を補足する文字情報として、前記案内情報に関連し且つ前記案内情報の案内対象とは異なる案内対象に関する関連情報、又は、前記案内情報を詳細にした詳細情報を前記表示部に表示し、前記人物による発話が継続している場合は、前記キャラクタの発話による前記案内情報の出力をせず、前記案内情報に対応する文字情報を前記表示部に表示する
ことを特徴とする対話型案内装置。
【請求項2】
複数の応対シナリオを記憶する記憶部と、
前記人物による発話に基づいて、前記複数の応対シナリオのうちから前記人物に対する応対シナリオを選択する選択部と、をさらに有し、
前記応対部は、前記応対において、前記選択された応対シナリオに基づいて前記案内情報を音声出力するとともに前記文字情報を表示する、
請求項1に記載の対話型案内装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、対話型案内装置に関する。
【背景技術】
【0002】
従来、オフィスビルや商業施設、病院等の施設の警備及び利用者に対する案内のために、施設の入口に警備員を配置することがなされている。また、特許文献1に記載されているように、警備員の画像を表示する表示機能と、監視室との通話機能とを有することにより、警備員を配置することなく施設の警備及び利用者に対する案内を実現する警備装置が提案されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特許第6259890号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に記載されている警備装置においては、利用者との音声による対話により案内がなされる。ここで、音声による対話では、多くの情報を利用者に伝えようとすると冗長になり、一方、情報を厳選すると利用者が必要とする情報を提供できないおそれがある。また、音声に代えて図画や写真を表示することで同時に多くの情報を利用者に提供することは可能となるが、対話によるコミュニケーションの中で自然に情報を伝達することができなくなってしまう。そこで、このような装置において、音声対話による案内を基本としつつ、利用者に対する案内を円滑にすることが求められていた。
【0005】
本発明は、上述の課題を解決するためになされたものであり、利用者に対する案内を円滑にすることを可能とする対話型案内装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明に係る対話型案内装置は、キャラクタの画像を表示する表示部と、所定空間内の人物を検知する検知部と、キャラクタによる発話を音声として出力するとともに、検知された人物による発話を音声入力として受付ける音声入出力部と、音声入出力部及び表示部を制御して、キャラクタに検知された人物と対話させることにより、人物に対する応対をする応対部と、を有し、応対部は、応対において、人物に対する案内情報をキャラクタによる発話として出力するとともに、案内情報を補足する文字情報を表示する、ことを特徴とする。
【0007】
また、本発明に係る対話型案内装置は、複数の応対シナリオを記憶する記憶部と、人物による発話に基づいて、複数の応対シナリオのうちから人物に対する応対シナリオを選択する選択部と、をさらに有し、応対部は、応対において、選択された応対シナリオに基づいて案内情報を音声出力するとともに文字情報を表示する、ことが好ましい。
【0008】
また、本発明に係る対話型案内装置において、応対部は、文字情報として、案内情報に関連し且つ案内情報の案内対象とは異なる案内対象に関する関連情報を表示する、ことが好ましい。
【0009】
また、本発明に係る対話型案内装置において、応対部は、文字情報として、案内情報を詳細にした詳細情報を表示する、ことが好ましい。
【0010】
本発明に係る対話型案内装置は、キャラクタの画像を表示する表示部と、所定空間内の人物を検知する検知部と、キャラクタによる発話を音声として出力するとともに、検知された人物による発話を音声入力として受付ける音声入出力部と、音声入出力部及び表示部を制御して、キャラクタに検知された人物と対話させることにより、人物に対する応対をする応対部と、を有し、応対部は、応対において、人物による発話が継続していない場合には人物に対する案内情報をキャラクタによる発話として音声入出力部から出力し、人物による発話が継続している場合には人物に対する案内情報に対応する文字情報をテキストで表示する、ことを特徴とする。
【発明の効果】
【0011】
本発明に係る対話型案内装置は、利用者に対する案内を円滑にすることを可能とする。
【図面の簡単な説明】
【0012】
図1】案内装置1の正面図である。
図2】案内装置1の概略構成の一例を示す図である。
図3】応対シナリオテーブル151のデータ構造の一例を示す図である。
図4】案内処理の流れの一例を示すフロー図である。
図5】応対処理の流れの一例を示すフロー図である。
図6】文字情報について説明するための図である。
図7】応対シナリオテーブル151aのデータ構造の一例を示す図である。
図8】第2応対処理の流れの一例を示すフロー図である。
【発明を実施するための形態】
【0013】
以下、図面を参照しつつ本発明の種々の実施形態について説明する。本発明の技術的範囲はこれらの実施形態には限定されず、特許請求の範囲に記載された発明及びその均等物に及ぶ点に留意されたい。
【0014】
図1は、案内装置1の正面図であり、図2は、案内装置1の概略構成の一例を示す図である。案内装置1は、オフィスビル、商業施設又は病院等の施設の入口付近に配置される。案内装置1は、警備員を模したキャラクタの画像を表示して、キャラクタに目配せ等の監視動作をさせることにより施設の警備をする。また、案内装置1は、あらかじめ設定された応対シナリオに従って、キャラクタに施設に来訪した利用者と対話させることにより、利用者に対する案内をする。そのために、案内装置1は、表示部11、測距部12、撮像部13、音声入出力部14、記憶部15及び処理部16を有する。
【0015】
表示部11は、画像を表示するための構成であり、例えば液晶ディスプレイ又は有機EL(Electro-Luminescence)ディスプレイ等を備える。表示部11は、処理部16から供給された画像データに基づいて画像を表示する。
【0016】
表示部11は、案内装置1の前面に設けられ、キャラクタCの画像を表示する。キャラクタCは、例えば警備員を模したキャラクタであるが、このような例に限られず施設のマスコットキャラクタ等の任意のキャラクタでよい。
【0017】
測距部12は、案内装置1の周囲の対象物までの距離を測定するための構成であり、例えばTOF(Time of Flight)方式のレーザ測距センサを備える。測距部12は、測定範囲内の各方向にパルス変調されたレーザ光を照射し、その反射光を検出するまでの時間に基づいて各方向の反射点までの距離を算出する。測距部12は、レーザ光が照射された方向と算出された距離とに基づいて、各画素に距離情報が関連付けられた距離画像のデータを生成し、処理部16に供給する。
【0018】
撮像部13は、画像を撮像するための構成であり、例えばカメラを備える。撮像部13は、光学レンズ等を用いて撮像範囲内の被写体からの光線を集束することにより結像した被写体像に対応する撮像画像の画像信号を生成し、所定の形式の画像データに変換して処理部16に供給する。
【0019】
測距部12及び撮像部13は、案内装置1の前面上部に設けられる。測距部12の測定範囲及び撮像部13の撮像範囲は、何れも案内装置1の前方を含むように設定される。また、測距部12によって生成される距離画像データの各画素と、撮像部13によって生成される画像データの各画素との対応関係は、後述する記憶部15にあらかじめデータとして記憶される。
【0020】
音声入出力部14は、音声入力を受付けるとともに音声を出力するための構成であり、例えばマイク及びスピーカを備える。音声入出力部14は、受付けた音声入力をデジタルデータである音声信号に変換して処理部16に供給するとともに、処理部16から供給された音声信号を音声として出力する。
【0021】
音声入出力部14は、案内装置1の前面の、キャラクタCの顔の高さに設けられることが好ましいが、このような例に限られず、案内装置1の任意の位置に設けられてよい。
【0022】
記憶部15は、プログラム及びデータを記憶するための構成であり、例えば、半導体メモリを備える。記憶部15は、処理部16による処理に用いられるオペレーティングシステムプログラム、ドライバプログラム、アプリケーションプログラム、データ等を記憶する。プログラムは、CD(Compact Disc)-ROM(Read Only Memory)等のコンピュータ読み取り可能且つ非一時的な可搬型記憶媒体から、セットアッププログラム等を用いて記憶部15にインストールされる。記憶部15は、データとして応対シナリオテーブル151を記憶する。
【0023】
処理部16は、案内装置1の動作を統括的に制御する構成であり、一又は複数個のプロセッサ及びその周辺回路を備える。処理部16は、例えば、CPU(Central Processing Unit)、LSI(Large Scale Integration)又はASIC(Application Specific Integrated Circuit)等を備える。処理部16は、GPU(Graphics Processing Unit)、DSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)等を備えてもよい。処理部16は、記憶部15に記憶されているプログラムに基づいて案内装置1の処理が適切に実行されるように案内装置1の各構成の動作を制御するとともに、処理を実行する。
【0024】
処理部16は、監視部161、検知部162、応対部163及び選択部164をその機能ブロックとして備える。これらの各部は、処理部16が実行するプログラムによって実現される機能モジュールである。これらの各部は、ファームウェアとして処理部16に実装されてもよい。
【0025】
図3は、応対シナリオに関する情報を管理する応対シナリオテーブル151のデータ構造の一例を示す図である。応対シナリオテーブル151は、シナリオID、説明、キーワード、案内情報及び文字情報を相互に関連付けて記憶する。
【0026】
シナリオIDは、各応対シナリオを識別する情報である。説明は、各応対シナリオの概要を示す情報である。キーワードは、各応対シナリオに関連する単語であり、利用者に対する応対シナリオを選択するために参照される。案内情報は、利用者に対する応対において、キャラクタCの発話として出力される情報である。文字情報は、利用者に対する応対において、表示部11に表示される情報である。案内情報及び文字情報は、何れも利用者に対する案内のために提示される情報である。
【0027】
文字情報は、案内情報を補足する情報であり、例えば、案内情報に関連し且つ案内情報の案内対象とは異なる案内対象に関する関連情報、又は、案内情報を詳細にした詳細情報である。図3に示す例では、シナリオID「001」の応対シナリオは「お手洗の案内」に関するシナリオである。この応対シナリオには、案内情報として「お手洗はドアを出て左手にあります。」が記憶されており、その案内対象は「(通常の)お手洗」である。また、文字情報として、関連情報にあたる「多機能トイレは一つ上のフロアにあります。」が記憶されているとともに、詳細情報にあたる「お手洗はドアを出て左手に20メートル進んだところにあります。」が記憶されている。関連情報の案内対象は「(通常の)お手洗」とは異なる「多機能トイレ」である。このように、案内において複数の案内対象が回答として想定される場合に、案内情報の案内対象とは異なる案内対象に関する回答を関連情報として記憶する。例えば、代表的な回答を案内情報として記憶し、他の回答を関連情報として記憶する。
【0028】
また、シナリオID「002」の応対シナリオは「打合せの取次ぎ」に関するシナリオである。この応対シナリオには、案内情報として「○階の○○会議室へお進みください。」が記憶されているとともに、文字情報として、詳細情報にあたる「○階へは左手のエレベータよりお進み頂き、○○会議室はエレベータを降りて正面にあります。」が記憶されている。このように、文字情報として、関連情報及び詳細情報の少なくとも一方が記憶される。
【0029】
なお、応対シナリオにおける案内情報には、案内情報を完成させるために必要となる情報を得るための質問(予備案内情報)があわせて記憶されてもよい。例えば、「打合せの取次ぎ」に関するシナリオにおいては、利用者の氏名や訪問先の情報等が案内する内容の決定に必要となる。そこで、各シナリオIDに基づく案内を実行する際に必要となる情報についても予め記憶しておき、後述する案内処理において、案内装置1は当該情報が得られていない場合に予備案内情報を出力して、当該情報を取得すると各シナリオIDに基づく案内を実行する。このように、シナリオID「001」のように応対シナリオと案内情報とが固定されている場合と、シナリオID「002」のように状況によって案内情報が変動する場合とがある。前者ではシナリオが選択されると案内情報が決定され、後者ではシナリオが選択され、且つ、案内情報を完成させるために必要となる情報が取得されることで案内情報が決定される。
【0030】
応対シナリオテーブル151のデータは、案内装置1の管理者によってあらかじめ設定される。応対シナリオテーブル151のデータのうち、案内情報又は文字情報は、機械学習等により生成されてもよい。
【0031】
図4は、案内装置1によって実行される案内処理の流れの一例である。案内処理は、表示部11にキャラクタCが表示された状態において実行される。案内処理は、記憶部15に記憶されたプログラムに基づいて処理部16が案内装置1の各構成と協働することにより実現される。
【0032】
まず、監視部161は、監視処理を実行する(S101)。監視処理は、表示部11に表示されたキャラクタCに監視動作をさせる処理である。監視動作は、キャラクタCが利用者の方向に視線を向ける動作である。
【0033】
監視部161は、撮像画像に基づいてキャラクタCに監視動作をさせる。例えば、監視部161は、撮像部13から撮像画像を取得し、撮像画像における人物領域を特定する。人物領域の特定は、撮像画像の画素値から抽出した特徴量に基づいてなされてもよく、画像と人物領域との関係をあらかじめ学習された学習済みモデルを用いてなされてもよい。特徴量は、例えばHOG(Histograms of Oriented Gradients)特徴量である。学習済みモデルは、例えばYOLO(You Only Look Once)又はSSD(Single Shot Detector)である。監視部161は、キャラクタCに、特定した人物領域に対応する方向に視線を向ける動作をさせるように表示部11を制御することにより、監視動作をさせる。
【0034】
監視部161は、距離画像に基づいてキャラクタCに監視動作をさせてもよい。例えば、監視部161は、測距部12から距離画像を取得し、距離画像における人物領域を特定する。人物領域の特定は、距離画像が示す対象物の3次元形状から抽出した特徴量に基づいてなされてもよく、距離画像と人物領域との関係をあらかじめ学習された学習済みモデルを用いてなされてもよい。監視部161は、キャラクタCに、特定した人物領域に対応する方向に視線を向ける動作をさせるように表示部11を制御することにより、監視動作をさせる。
【0035】
監視部161は、撮像画像と距離画像との両方に基づいてキャラクタCに監視動作をさせてもよい。例えば、監視部161は、撮像画像における人物領域を特定し、距離画像において、特定した人物領域に対応する画素に関連付けられた距離情報を取得することにより、案内装置1と利用者との距離を特定する。監視部161は、特定した距離が所定距離以下である場合に、キャラクタCに、特定した人物領域に対応する方向に視線を向ける動作をさせる。
【0036】
撮像画像又は距離画像において複数の人物領域が特定された場合、監視部161は、キャラクタCに、それらの人物領域に対応する方向に順次視線を向けさせてもよく、案内装置1との距離が小さい利用者の方向に優先して視線を向けさせてもよい。
【0037】
監視部161は、順次取得された複数の撮像画像及び距離画像に基づいてキャラクタCに監視動作をさせてもよい。例えば、監視部161は、複数の撮像画像においてそれぞれ人物領域を特定する。監視部161は、複数の撮像画像の間で、特定した人物領域の位置及び大きさ並びに人物領域内の画素の画素値等に基づいて同一の利用者に対応する蓋然性が高い人物領域を関連付けることで、利用者をトラッキングする。監視部161は、トラッキングしている利用者が案内装置1に対して接近しているか否かを複数の距離画像に基づいて判定し、案内装置1に接近していると判定した場合に、キャラクタCに利用者の方向に視線を向ける動作をさせる。
【0038】
監視部161は、監視動作として、キャラクタCに視線だけでなく体全体を向けるような動作をさせてもよい。また、監視部161は音声入出力部14をさらに制御して、監視動作として、キャラクタCに利用者に対するあいさつをさせてもよい。監視部161は、監視動作として、キャラクタCが施設の警備をしているように見せるための他の任意の動作及び発話をさせてもよい。
【0039】
続いて、検知部162は、所定空間内の利用者を検知する(S102)。所定空間は、応対すべき利用者がいる空間であり、例えば、案内装置1の前方であり且つ案内装置1との距離が所定距離(例えば、2メートル)以下の空間である。所定空間は、案内装置1と離隔した空間(例えば、案内装置1との距離が1メートル以上3メートル以下の空間)でもよい。
【0040】
検知部162は、上述したように、撮像画像における人物領域を特定する。人物領域が特定されない場合、検知部162は、所定空間内の利用者が検知されなかったと判定する。
【0041】
人物領域が特定された場合、検知部162は、上述したように、距離画像に基づいて、案内装置1と特定した人物領域に対応する利用者との距離を特定する。検知部162は、特定した人物領域の方向及び利用者との距離に基づいて、利用者の位置を特定する。検知部162は、利用者の位置が所定空間内である場合、所定空間内の利用者が検知されたと判定し、利用者の位置が所定空間外である場合、所定空間内の利用者が検知されなかったと判定する。
【0042】
利用者が検知された場合(S102-Yes)、応対部163は、音声入出力部14及び表示部11を制御して、キャラクタCに利用者と対話させることにより、利用者に対する応対をする応対処理を実行する(S103)。応対処理の詳細は後述する。利用者が検知されなかった場合(S102-No)、又は、応対処理が終了した場合、監視部161は監視処理を再開する(S101)。
【0043】
図5は、応対処理の流れの一例を示すフロー図である。
【0044】
まず、選択部164は、利用者による発話に基づいて、検知された利用者に対する応対シナリオを選択する(S201)。例えば、選択部164は、検知された利用者による、音声入出力部14に対する発話を音声信号として取得する。選択部164は、公知の音声認識技術を用いて取得した音声信号を文字情報に変換し、形態素解析等をすることにより利用者の発話に含まれる単語を取得する。選択部164は、応対シナリオテーブル151を参照し、取得した単語がキーワードとして関連付けられている応対シナリオを選択する。
【0045】
応対シナリオの選択方法は上述した例に限られない。応対シナリオは、利用者の発話に対応する文字情報と応対シナリオとの関係をあらかじめ学習されたニューラルネットワーク等の学習済みモデルを用いて選択されてもよい。
【0046】
ここで、案内情報を完成させるために必要となる情報が得られていない場合、選択部164は当該情報に関する質問(予備案内情報)をキャラクタCによる発話として音声入出力部14から出力する。例えば、シナリオID「002」の応対シナリオが選択された場合において、「利用者の氏名」又は「訪問先の情報」等が得られていない場合、選択部164は、「お客様のお名前と訪問先をお知らせください。」と音声出力する。そして、選択部164は利用者から得られた情報に基づいて案内情報を決定する。例えば、案内装置1は、記憶部15に打合せの情報(利用者、打合せ場所等)に関するリストを予め記憶しておき、選択部164は、利用者から得られた情報とリストとを照合して、案内する打合せ場所を決定する。これにより、利用者ごとに案内情報が異なる場合においても、利用者に応じた案内を行える。
【0047】
続いて、応対部163は、案内情報をキャラクタCによる発話として音声入出力部14から出力するとともに、案内情報を補足する文字情報を表示部11に表示する(S202)。例えば、応対部163は、選択した応対シナリオに関連付けられた案内情報及び関連情報を取得する。応対部163は、取得した案内情報を音声信号に変換して、キャラクタCの発話として音声入出力部14から出力するとともに、取得した関連情報を表示部11に表示する。なお、応対部163は、関連情報に代えて詳細情報を表示してもよい。
【0048】
図6は、表示部11に表示される文字情報について説明するための図である。図6に示す例では、文字情報111は、表示部11の上部に表示されている。なお、文字情報111の表示態様はこのような例に限られない。例えば、文字情報111は、表示部11の任意の位置に表示されてもよく、吹出し等を用いて、キャラクタCが発話しているような態様で表示されてもよい。
【0049】
以上説明したように、案内装置1は、所定空間内の利用者に対する応対において、利用者に対する案内情報をキャラクタCによる発話として出力するとともに、案内情報を補足する文字情報を表示する。これにより、案内装置1は、利用者に対する案内を円滑にすることを可能とする。すなわち、案内情報を補足する関連情報や詳細情報をキャラクタCの発話として出力した場合、利用者はそれらすべての情報を聞き取るまで待機しなければならない。これに対し、案内装置1は、関連情報や詳細情報を文字情報として表示することにより、対話によるコミュニケーションを実現しつつ利用者が待機する時間を短縮し、円滑な案内を実現する。
【0050】
また、案内装置1は、利用者による発話に基づいて複数の応対シナリオのうちから利用者に対する応対シナリオを選択し、選択された応対シナリオに基づいて案内情報を出力するとともに文字情報を表示する。これにより、案内装置1は、利用者が求める事項についての案内を円滑にすることができる。
【0051】
また、案内装置1は、案内情報として、文字情報を簡略化した情報を出力する。詳細な情報は発話により出力するよりも文字情報として表示した方が理解されやすいため、これにより、利用者が案内を理解しやすくなり、円滑な案内が実現する。
【0052】
上述した説明では、S201において案内装置1が応対シナリオを選択するものとしたが、このような例に限られず、案内装置1は応対シナリオを選択しなくてもよい。例えば、案内装置1は、応対処理において、所定空間内に検知された利用者に対して「受付は右手にあります。」等の一般的な案内情報を発話として出力するとともに、その案内情報を補足する関連情報又は詳細情報を文字情報として表示してもよい。
【0053】
また、案内装置1は、熱画像カメラ等の利用者の体温を測定する構成を有してもよい。この場合、案内装置1は、応対処理において、所定空間内に検知された利用者が所定以上の体温(例えば、37.5度以上)であると判定されると、「発熱の疑いがあります。検査エリアにお進みください」等の案内情報を発話として出力するとともに、この案内情報を詳細に補足する詳細情報、すなわち、「左手にあるパーテーションが検査エリアです」等を文字情報として表示してもよい。
【0054】
上述した説明では、一つの文字情報が表示されるものとしたが、このような例に限られず、応対部163は、S202において、選択した応対シナリオに関連付けられた関連情報又は詳細情報である複数の文字情報をそれぞれ表示部11に表示してもよい。
【0055】
また、応対部163は、利用者の属性に基づいて、複数の文字情報のうちの何れかの文字情報を選択して表示部11に表示してもよい。この場合、応対シナリオテーブル151において、複数の文字情報に、その文字情報が対象とする利用者の属性があらかじめ関連付けられる。例えば、利用者の属性が男性、女性、子供連れ等である場合には、男性用トイレを案内する文字情報には「男性」の属性が関連付けられ、多機能トイレを案内する文字情報には「子供連れ」の属性が関連付けられる。
【0056】
応対部163は、S202において、撮像部13から取得される撮像画像に基づいて利用者の属性を特定する。属性は、例えば、撮像画像の画素値から抽出した特徴量に基づいて特定されてもよく、画像と属性との関係をあらかじめ学習された学習済みモデルを用いて特定されてもよい。また、属性は、測距部12から取得される距離画像又は音声入出力部14から取得される音声信号に基づいて特定されてもよい。
【0057】
応対部163は、応対シナリオテーブル151を参照して、特定した属性が関連付けられた文字情報を選択する。応対部163は、選択した応対シナリオに関連付けられた案内情報を発話として出力するとともに、選択した文字情報を表示する。このようにすることで、案内装置1は、利用者の属性に適した案内を円滑にすることを可能とする。
【0058】
上述した説明では、案内装置1は、応対処理の終了後にS101に戻り監視処理を実行するものとしたが、S102に戻り所定空間内の利用者を検知するものとしてもよい。これにより、案内装置1は、所定空間内に複数の利用者がいる場合や、特定の利用者が続けて案内を希望する場合等に案内を円滑にすることを可能とする。
【0059】
上述した説明では、応対部163は、S103の応対処理において案内情報をキャラクタCによる発話として出力するとともに、案内情報を補足する文字情報を表示するものとしたが、このような例に限られない。応対部163は、利用者の発話に基づいてキャラクタCが発話する内容が特定されたとき(例えば、応対シナリオを選択したときや案内情報が決定されたとき)、利用者による発話が継続していない場合には案内情報をキャラクタCによる発話として出力し、利用者による発話が継続している場合にはキャラクタCによる発話を行わずに案内情報に対応するテキストを文字情報として表示するようにしてもよい。
【0060】
この場合、記憶部15は、応対シナリオテーブル151aを記憶する。また、応対部163は、S103において、後述する第2応対処理を実行する。
【0061】
図7は、応対シナリオテーブル151aのデータ構造の一例を示す図である。応対シナリオテーブル151aは、シナリオID、説明、キーワード及び案内情報を相互に関連付けて記憶する。すなわち、応対シナリオテーブル151aは、文字情報を記憶しなくてもよい点で図3の応対シナリオテーブル151と相違する。
【0062】
図8は、第2応対処理の流れの一例を示すフロー図である。
【0063】
まず、選択部164は、S201と同様にして、検知された利用者に対する応対シナリオを選択する(S301)。
【0064】
続いて、応対部163は、利用者による発話が継続しているか否かを判定する(S302)。例えば、応対部163は、音声入出力部14に対する音声入力が継続している、又は、音声入力の中断が所定時間(例えば、3秒)未満である場合に、利用者による発話が継続していると判定し、中断が所定時間以上である場合に発話が継続していないと判定する。なお、音声入力が継続しているとは、音声入出力部14が供給する音声信号が示す音声入力の音量が連続して所定値以上であることをいい、音声入力が中断しているとは、音声入力の音量が所定値未満となっていることをいう。
【0065】
利用者による発話が継続していると判定された場合(S302-Yes)、応対部163は、選択した応対シナリオに関連付けられた案内情報に対応する文字情報をテキストで表示部11に表示し(S303)、応対処理を終了する。発話が継続していないと判定された場合(S302-No)、応対部163は、選択した応対シナリオに関連付けられた案内情報をキャラクタCによる発話として音声入出力部14から出力し(S304)、応対処理を終了する。
【0066】
なお、案内情報を文字情報として表示部11に表示した段階では応対処理を終了せず、利用者の発話が継続していないと判定されると、案内情報をキャラクタCの発話として音声入出力部14から出力して、応対処理を終了してもよい。これにより、案内情報を速やかに伝えつつ、音声対話によるコミュニケーションを行える。
【0067】
このようにすることで、案内装置1は、利用者の発話を遮ることなく利用者に対し案内情報を提示することができるため、利用者に対する案内を円滑にすることを可能とする。
【0068】
上述した説明では、S303で表示される文字情報とS304で出力される案内情報は同一の情報であったが、このような例に限られず、両者は異なる情報でもよい。例えば、S303で表示される文字情報は、S304で表示される案内情報の関連情報又は詳細情報でもよい。
【0069】
また、案内情報を完成させるために必要となる情報が不足している場合、案内装置1が当該情報についての回答を求める質問である予備案内情報(例えば、「お客様のお名前と訪問先をお知らせください。」)を文字情報として表示することが好適である。これにより、利用者の発話を遮ることなく、案内にあたって必要な情報を得ることができるため、利用者に対する案内を円滑にすることが可能となる。
【0070】
なお、文字情報を表示部11に表示するものとして説明したが、これに限られるものではない。例えば、プロジェクター等の投影装置を設けて、選択された文字情報を壁面や床等に投影して表示してもよい。
【0071】
また、案内装置1が、利用者が案内装置1に接近したタイミングで音声の入力を受け付けている状態であることを利用者に示すようにしてもよい。例えば、監視処理から応対処理に切り替わると周囲の環境音や音声集音状態を示すアイコンや集音レベルを示す模式的な波形等を表示部11に表示する。或いは、音声認識に関するアイコンを常時表示しておき、応対処理に切り替わると音声の入力を受け付けている状態であることを示すようにアイコンの表示を変化させてもよい。これにより、利用者は自身が案内装置1に認識されたことを把握できるとともに、キャラクタCが音声の入力を受け付けていることも把握できるため、自然に話しかけることができるようになる。
【0072】
当業者は、本発明の精神および範囲から外れることなく、様々な変更、置換及び修正をこれに加えることが可能であることを理解されたい。例えば、上述した各部の処理は、本発明の範囲において、適宜に異なる順序で実行されてもよい。また、上述した実施形態及び変形例は、本発明の範囲において、適宜に組み合わせて実施されてもよい。
【符号の説明】
【0073】
1 案内装置
11 表示部
12 測距部
13 撮像部
14 音声入出力部
15 記憶部
161 監視部
162 検知部
163 応対部
164 選択部
図1
図2
図3
図4
図5
図6
図7
図8