IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

<>
  • -対話システム、端末及びプログラム 図1
  • -対話システム、端末及びプログラム 図2
  • -対話システム、端末及びプログラム 図3
  • -対話システム、端末及びプログラム 図4
  • -対話システム、端末及びプログラム 図5
  • -対話システム、端末及びプログラム 図6
  • -対話システム、端末及びプログラム 図7
  • -対話システム、端末及びプログラム 図8
  • -対話システム、端末及びプログラム 図9
  • -対話システム、端末及びプログラム 図10
  • -対話システム、端末及びプログラム 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025108914
(43)【公開日】2025-07-24
(54)【発明の名称】対話システム、端末及びプログラム
(51)【国際特許分類】
   H04M 3/50 20060101AFI20250716BHJP
   H04M 3/51 20060101ALI20250716BHJP
   G10L 13/00 20060101ALI20250716BHJP
   G10L 15/22 20060101ALI20250716BHJP
   G06F 3/16 20060101ALI20250716BHJP
   G06F 3/01 20060101ALI20250716BHJP
【FI】
H04M3/50 A
H04M3/51
G10L13/00 100M
G10L15/22 300Z
G06F3/16 650
G06F3/16 690
G06F3/01 510
【審査請求】未請求
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2024002450
(22)【出願日】2024-01-11
(71)【出願人】
【識別番号】000002897
【氏名又は名称】大日本印刷株式会社
(74)【代理人】
【識別番号】100106002
【弁理士】
【氏名又は名称】正林 真之
(74)【代理人】
【識別番号】100165157
【弁理士】
【氏名又は名称】芝 哲央
(74)【代理人】
【識別番号】100120891
【弁理士】
【氏名又は名称】林 一好
(72)【発明者】
【氏名】伊藤 直之
(72)【発明者】
【氏名】松葉 靖寿
【テーマコード(参考)】
5E555
5K201
【Fターム(参考)】
5E555AA46
5E555AA47
5E555BA02
5E555BB23
5E555BC04
5E555CA45
5E555CA47
5E555CB82
5E555DA23
5E555DB32
5E555DC85
5E555EA03
5E555EA23
5E555FA00
5K201BA13
5K201CA01
5K201CC04
5K201DC05
5K201EC06
5K201ED04
(57)【要約】
【課題】移動中であっても対話を継続して行うことを可能にした対話システム、端末及びプログラムを提供する。
【解決手段】対話システム100は、移動中のユーザP1が用いる端末1が、対話サーバ4との間の通信状況を確認し、通信状況の確認結果に応じて、ユーザP1との対話を特定の知識を有する知識部を用いて行うローカル対話部による処理と、ユーザP1との対話を対話サーバ4を介し複数の文書及び対話内容を学習した言語モデル6aを用いて行うリモート対話部による処理とを切り替え、ローカル対話部による処理からリモート対話部による処理に切り替えた場合に、ユーザP1及びユーザP1が対話をする相手方との間の対話内容である対話履歴データを記憶する端末履歴記憶部の対話履歴データを対話サーバ4に送信し、対話サーバ4が、端末1から受信した対話履歴データを、対話履歴データを端末識別情報に対応付けて記憶するサーバ履歴記憶部に登録する。
【選択図】図1
【特許請求の範囲】
【請求項1】
移動中のユーザが用いる端末と、サーバとを備えた対話システムであって、
前記端末は、
特定の知識を有する知識部と、
前記ユーザと、前記ユーザが対話をする相手方との間の対話内容である対話履歴データを記憶するローカル履歴記憶部と、
前記ユーザとの対話を前記知識部を用いて行うローカル対話手段と、
前記ユーザとの対話を前記サーバを介し複数の文書及び対話内容を学習した言語モデルを用いて行うリモート対話手段と、
前記サーバとの間の通信状況を確認する通信状況確認手段と、
前記通信状況確認手段による通信状況の確認結果に応じて、前記ローカル対話手段による処理と、前記リモート対話手段による処理とを切り替える対話切替手段と、
前記対話切替手段が前記ローカル対話手段による処理から前記リモート対話手段による処理に切り替えた場合に、前記ローカル履歴記憶部の前記対話履歴データを前記サーバに送信する履歴送信手段と、
を備え、
前記サーバは、
前記対話履歴データを、前記ユーザに対応付けて記憶するサーバ履歴記憶部と、
前記端末から受信した前記対話履歴データを、前記サーバ履歴記憶部に登録する履歴登録手段と、
を備える、対話システム。
【請求項2】
請求項1に記載の対話システムにおいて、
前記端末の前記履歴送信手段は、少なくとも前記ローカル対話手段による処理の間に生じた前記対話履歴データを、前記サーバに送信する、対話システム。
【請求項3】
請求項1に記載の対話システムにおいて、
前記端末の前記対話切替手段は、前記リモート対話手段による処理中において前記サーバから一定期間内に前記対話の応答である返答データを受信しない場合には、前記ローカル対話手段による処理に切り替える、対話システム。
【請求項4】
請求項1に記載の対話システムにおいて、
前記サーバは、
前記端末から前記ユーザの発話データを受信する発話受信手段と、
前記発話受信手段が受信した前記発話データと、前記サーバ履歴記憶部に記憶された前記ユーザの前記対話履歴データとを前記言語モデルに入力し、前記言語モデルが出力した返答データを、前記端末に送信する対話処理手段と、
を備える、対話システム。
【請求項5】
請求項4に記載の対話システムにおいて、
前記端末は、
位置情報を所定の時間間隔で取得する位置取得手段と、
前記リモート対話手段による処理の間に前記位置取得手段が取得した前記位置情報を、前記サーバに送信する位置送信手段と、
を備え、
前記サーバは、前記位置情報を前記端末から受信する位置受信手段を備え、
前記サーバの前記対話処理手段は、前記位置受信手段が受信した前記位置情報をさらに前記言語モデルに入力する、対話システム。
【請求項6】
請求項1に記載の対話システムにおいて、
前記サーバは、
前記端末から前記ユーザの発話データを受信する発話受信手段と、
前記発話受信手段が受信した前記発話データと、前記サーバ履歴記憶部に記憶された前記ユーザの前記対話履歴データとを、相手方端末に出力する情報出力手段と、
前記相手方端末から送信された返答データを、前記端末に送信する返答送信手段と、
を備える、対話システム。
【請求項7】
請求項6に記載の対話システムにおいて、
前記端末は、
位置情報を所定の時間間隔で取得する位置取得手段と、
前記リモート対話手段による処理の間に前記位置取得手段が取得した前記位置情報を、前記サーバに送信する位置送信手段と、
を備え、
前記サーバは、
前記位置情報を前記端末から受信する位置受信手段を備え、
前記サーバの前記情報出力手段は、前記位置受信手段が受信した前記位置情報をさらに前記相手方端末に出力する、対話システム。
【請求項8】
請求項4から請求項7までのいずれかに記載の対話システムにおいて、
前記発話データ及び前記返答データは、音声データであり、
前記端末は、
前記発話データを取得する音声入力部と、
前記返答データを出力する音声出力部と、
を備える、対話システム。
【請求項9】
請求項8に記載の対話システムにおいて、
前記端末は、
前記相手方に対応したキャラクタを出力する表示部と、
前記相手方の返答に対応して前記キャラクタを動作させるキャラクタ処理手段と、
を備える、対話システム。
【請求項10】
サーバを介してユーザと対話を行う、前記ユーザが用いる端末であって、
特定の知識を有する知識部と、
前記ユーザと、前記ユーザが対話をする相手方との間の対話内容である対話履歴データを記憶するローカル履歴記憶部と、
前記ユーザとの対話を前記知識部を用いて行うローカル対話手段と、
前記ユーザとの対話を前記サーバを介し複数の文書及び対話内容を学習した言語モデルを用いて行うリモート対話手段と、
前記サーバとの間の通信状況を確認する通信状況確認手段と、
前記通信状況確認手段による通信状況の確認結果に応じて、前記ローカル対話手段による処理と、前記リモート対話手段による処理とを切り替える対話切替手段と、
前記対話切替手段が前記ローカル対話手段による処理から前記リモート対話手段による処理に切り替えた場合に、前記ローカル履歴記憶部の前記対話履歴データを前記サーバに送信する履歴送信手段と、
を備える、端末。
【請求項11】
サーバを介してユーザと対話を行う、前記ユーザが用いるコンピュータが、
特定の知識を有する知識部と、
前記ユーザと、前記ユーザが対話をする相手方との間の対話内容である対話履歴データを記憶するローカル履歴記憶部と、
を備え、
前記コンピュータを、
前記ユーザとの対話を前記知識部を用いて行うローカル対話手段と、
前記ユーザとの対話を前記サーバを介し複数の文書及び対話内容を学習した言語モデルを用いて行うリモート対話手段と、
前記サーバとの間の通信状況を確認する通信状況確認手段と、
前記通信状況確認手段による通信状況の確認結果に応じて、前記ローカル対話手段による処理と、前記リモート対話手段による処理とを切り替える対話切替手段と、
前記対話切替手段が前記ローカル対話手段による処理から前記リモート対話手段による処理に切り替えた場合に、前記ローカル履歴記憶部の前記対話履歴データを前記サーバに送信する履歴送信手段と、
して機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、対話システム、端末及びプログラムに関する。
【背景技術】
【0002】
従来、観光バスによるツアーでは、観光バスに乗車した添乗員が、例えば、車窓から見える景色について車中で案内をすることが行われている。現在では、ツアーが多様化しており、オンラインによる仮想的なツアーを参加者に提供するようなサービスも出てきている(例えば、特許文献1参照)。
このように、多様なサービスが提供されている現状においても、従来と同様に、現地に足を運んで観光をしたいと思う参加者のニーズは多い。しかし、人材不足等により添乗員等のガイドを確保できない状況が生じることがある。そのような場合に、例えば、乗り物の位置に応じたコンテンツを提供する技術を用いることが可能である(例えば、特許文献2参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2021-190126号公報
【特許文献2】特開2022-58312号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献2に記載の乗り物の位置に応じたコンテンツでは、一方的なコンテンツの表示にすぎず、満足度が低くなってしまう。そこで、対話ができるシステムが望まれるが、移動中であっても対話が継続できる仕組みが求められる。
【0005】
そこで、本発明は、移動中であっても対話を継続して行うことを可能にした対話システム、端末及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明は、以下のような解決手段により、前記課題を解決する。
第1の発明は、移動中のユーザが用いる端末と、サーバとを備えた対話システムであって、前記端末は、特定の知識を有する知識部と、前記ユーザと、前記ユーザが対話をする相手方との間の対話内容である対話履歴データを記憶するローカル履歴記憶部と、前記ユーザとの対話を前記知識部を用いて行うローカル対話手段と、前記ユーザとの対話を前記サーバを介し複数の文書及び対話内容を学習した言語モデルを用いて行うリモート対話手段と、前記サーバとの間の通信状況を確認する通信状況確認手段と、前記通信状況確認手段による通信状況の確認結果に応じて、前記ローカル対話手段による処理と、前記リモート対話手段による処理とを切り替える対話切替手段と、前記対話切替手段が前記ローカル対話手段による処理から前記リモート対話手段による処理に切り替えた場合に、前記ローカル履歴記憶部の前記対話履歴データを前記サーバに送信する履歴送信手段と、を備え、前記サーバは、前記対話履歴データを、前記ユーザに対応付けて記憶するサーバ履歴記憶部と、前記端末から受信した前記対話履歴データを、前記サーバ履歴記憶部に登録する履歴登録手段と、を備える、対話システムである。
第2の発明は、第1の発明の対話システムにおいて、前記端末の前記履歴送信手段は、少なくとも前記ローカル対話手段による処理の間に生じた前記対話履歴データを、前記サーバに送信する、対話システムである。
第3の発明は、第1の発明又は第2の発明の対話システムにおいて、前記端末の前記対話切替手段は、前記リモート対話手段による処理中において前記サーバから一定期間内に前記対話の応答である返答データを受信しない場合には、前記ローカル対話手段による処理に切り替える、対話システムである。
第4の発明は、第1の発明から第3の発明までのいずれかの対話システムにおいて、前記サーバは、前記端末から前記ユーザの発話データを受信する発話受信手段と、前記発話受信手段が受信した前記発話データと、前記サーバ履歴記憶部に記憶された前記ユーザの前記対話履歴データとを前記言語モデルに入力し、前記言語モデルが出力した返答データを、前記端末に送信する対話処理手段と、を備える、対話システムである。
第5の発明は、第4の発明の対話システムにおいて、前記端末は、位置情報を所定の時間間隔で取得する位置取得手段と、前記リモート対話手段による処理の間に前記位置取得手段が取得した前記位置情報を、前記サーバに送信する位置送信手段と、を備え、前記サーバは、前記位置情報を前記端末から受信する位置受信手段を備え、前記サーバの前記対話処理手段は、前記位置受信手段が受信した前記位置情報をさらに前記言語モデルに入力する、対話システムである。
第6の発明は、第1の発明から第3の発明までのいずれかの対話システムにおいて、前記サーバは、前記端末から前記ユーザの発話データを受信する発話受信手段と、前記発話受信手段が受信した前記発話データと、前記サーバ履歴記憶部に記憶された前記ユーザの前記対話履歴データとを、相手方端末に出力する情報出力手段と、前記相手方端末から送信された返答データを、前記端末に送信する返答送信手段と、を備える、対話システムである。
第7の発明は、第6の発明の対話システムにおいて、前記端末は、位置情報を所定の時間間隔で取得する位置取得手段と、前記リモート対話手段による処理の間に前記位置取得手段が取得した前記位置情報を、前記サーバに送信する位置送信手段と、を備え、前記サーバは、前記位置情報を前記端末から受信する位置受信手段を備え、前記サーバの前記情報出力手段は、前記位置受信手段が受信した前記位置情報をさらに前記相手方端末に出力する、対話システムである。
第8の発明は、第4の発明から第7の発明までのいずれかの対話システムにおいて、前記発話データ及び前記返答データは、音声データであり、前記端末は、前記発話データを取得する音声入力部と、前記返答データを出力する音声出力部と、を備える、対話システムである。
第9の発明は、第1の発明から第8の発明までのいずれかの対話システムにおいて、前記端末は、前記相手方に対応したキャラクタを出力する表示部と、前記相手方の返答に対応して前記キャラクタを動作させるキャラクタ処理手段と、を備える、対話システムである。
第10の発明は、サーバを介してユーザと対話を行う、前記ユーザが用いる端末であって、特定の知識を有する知識部と、前記ユーザと、前記ユーザが対話をする相手方との間の対話内容である対話履歴データを記憶するローカル履歴記憶部と、前記ユーザとの対話を前記知識部を用いて行うローカル対話手段と、前記ユーザとの対話を前記サーバを介し複数の文書及び対話内容を学習した言語モデルを用いて行うリモート対話手段と、前記サーバとの間の通信状況を確認する通信状況確認手段と、前記通信状況確認手段による通信状況の確認結果に応じて、前記ローカル対話手段による処理と、前記リモート対話手段による処理とを切り替える対話切替手段と、前記対話切替手段が前記ローカル対話手段による処理から前記リモート対話手段による処理に切り替えた場合に、前記ローカル履歴記憶部の前記対話履歴データを前記サーバに送信する履歴送信手段と、を備える、端末である。
第11の発明は、サーバを介してユーザと対話を行う、前記ユーザが用いるコンピュータが、特定の知識を有する知識部と、前記ユーザと、前記ユーザが対話をする相手方との間の対話内容である対話履歴データを記憶するローカル履歴記憶部と、を備え、前記コンピュータを、前記ユーザとの対話を前記知識部を用いて行うローカル対話手段と、前記ユーザとの対話を前記サーバを介し複数の文書及び対話内容を学習した言語モデルを用いて行うリモート対話手段と、前記サーバとの間の通信状況を確認する通信状況確認手段と、前記通信状況確認手段による通信状況の確認結果に応じて、前記ローカル対話手段による処理と、前記リモート対話手段による処理とを切り替える対話切替手段と、前記対話切替手段が前記ローカル対話手段による処理から前記リモート対話手段による処理に切り替えた場合に、前記ローカル履歴記憶部の前記対話履歴データを前記サーバに送信する履歴送信手段と、して機能させるためのプログラムである。
【発明の効果】
【0007】
本発明によれば、移動中であっても対話を継続して行うことを可能にした対話システム、端末及びプログラムを提供することができる。
【図面の簡単な説明】
【0008】
図1】第1実施形態に係る対話システムの全体構成図である。
図2】第1実施形態に係る端末の機能ブロック図である。
図3】第1実施形態に係る対話サーバの機能ブロック図である。
図4】第1実施形態に係る対話システムにおける対話例を示す図である。
図5】第1実施形態に係る対話システムにおける対話と履歴との関係を説明するための図である。
図6】第1実施形態に係る端末の対話処理を示すフローチャートである。
図7】第1実施形態に係る端末のローカル処理を示すフローチャートである。
図8】第1実施形態に係る対話サーバのサーバ処理を示すフローチャートである。
図9】第2実施形態に係る対話システムの全体構成図である。
図10】第2実施形態に係る対話サーバ及びオペレータ端末の機能ブロック図である。
図11】第2実施形態に係る対話サーバのサーバ処理を示すフローチャートである。
【発明を実施するための形態】
【0009】
以下、本発明を実施するための形態について、図を参照しながら説明する。なお、これは、あくまでも一例であって、本発明の技術的範囲は、これに限られるものではない。
(第1実施形態)
<対話システム100の全体構成>
図1は、第1実施形態に係る対話システム100の全体構成図である。
図2は、第1実施形態に係る端末1の機能ブロック図である。
図3は、第1実施形態に係る対話サーバ4の機能ブロック図である。
図1に示す対話システム100は、端末1と、対話サーバ4(サーバ)と、言語モデルサーバ6(言語モデル)とを備える。端末1と、対話サーバ4と、言語モデルサーバ6とは、通信ネットワークN及び基地局Rを介して通信可能に接続されている。
【0010】
対話システム100は、例えば、バスの車内SP1に設置された端末1を用いて、ユーザP1が、仮想の相手と対話を行うことを可能にしたバーチャルガイドのシステムである。端末1のディスプレイ27(表示部)には、対話を行う仮想の相手として、例えば、バスガイドを模した仮想のキャラクタが表示される。そして、対話システム100では、端末1が通信ネットワークNに接続されている状態において、対話サーバ4が、言語モデルサーバ6を用いて、バスの位置に応じた案内を端末1に出力させ、また、ユーザP1の発話に対する返答をも行う。他方、端末1が通信ネットワークNに接続されていない状態になった場合においては、端末1が、ユーザP1の発話に対する返答を行う。
【0011】
このように、対話システム100は、端末1の移動中において、通信状態にかかわらずに対話を継続して行うことを可能にしたシステムである。
以下において、対話システム100を、バスの車内SP1で利用することを想定して説明するが、これに限定されるものではない。また、以降の説明において、発話する乗客をユーザP1として説明する。ユーザP1は、1人の特定した乗客に限定されるものではない。
【0012】
<端末1>
端末1は、例えば、バスの車内SP1に設置され、ユーザP1をはじめとするバスに乗車中の乗客が用いる装置である。図1では、ディスプレイ27が車内SP1の天井に設置され、複数の乗客が1つのディスプレイ27を見ることができるものであり、端末1が1以上のディスプレイ27を備えるものを例に説明する。しかし、端末1は、これに限定されるものではない。例えば、車内SP1にスクリーンを取り付けて、ディスプレイ27に代わってスクリーンに映像を映し出す態様のものであってもよい。また、車内SP1の各座席にディスプレイが備え付けられたものであってもよい。さらに、端末1は、各乗客が所持するスマートフォンやタブレット等の携帯端末であってもよいし、スマートグラスであってもよい。さらにまた、端末1は、例えば、一般的なパーソナルコンピュータ(PC)等であってもよい。
【0013】
図2に示すように、端末1は、制御部10と、記憶部20と、マイク25(音声入力部)と、スピーカ26(音声出力部)と、ディスプレイ27と、GPS(Global Positioning System)受信部28と、通信インタフェース部29とを備える。
制御部10は、端末1の全体を制御するCPU(中央処理装置)である。制御部10は、記憶部20に記憶されているOS(オペレーティングシステム)や、各種のアプリケーションプログラムを適宜読み出して実行することにより、上述したハードウェアと協働し、各種機能を実行する。
【0014】
制御部10を説明する前に、記憶部20を説明する。
記憶部20は、端末1の動作に必要なプログラム、データ等を記憶するためのハードディスク、半導体メモリ素子等の記憶装置である。
記憶部20は、プログラム記憶部21と、知識部22と、端末履歴記憶部23(ローカル履歴記憶部)とを備える。
プログラム記憶部21は、プログラムを記憶するための記憶領域である。プログラム記憶部21は、対話プログラム21a(プログラム)を記憶している。
対話プログラム21aは、例えば、次に説明する制御部10の各種機能を実行するためのプログラムである。なお、制御部10の各種機能を、1つの対話プログラム21aによって実行してもよいし、機能ごとに複数のプログラムによって実行してもよい。
【0015】
知識部22は、例えば、案内をする場所に関する知識を記憶する記憶領域である。知識部22は、例えば、質問と回答とを対にしたものを記憶したルールベースのものであってもよいし、案内する場所に関する文書を学習した学習モデルであってもよい。知識部22が学習モデルである場合には、当該学習モデルは、端末1に記憶されるものであるため、後述する言語モデル6aと比較してモデルサイズの小さいものである。
端末履歴記憶部23は、端末1に入力された発話内容や、対話サーバ4や端末1が出力した返答を含む対話内容を、時系列に記憶する記憶領域である。端末履歴記憶部23は、例えば、車両を用いた観光の開始から終了までの間や、目的地到着までの間等の対話内容を、対話履歴データとして記憶する。
【0016】
次に、制御部10について説明する。
図1に示す制御部10は、位置取得部11と、通信接続確認部12と、対話切替部13と、リモート対話部14と、ローカル対話部15と、キャラクタ処理部16と、履歴送信部17と、履歴登録部18とを備える。
位置取得部11は、位置取得手段としての機能を有する。位置取得部11は、所定の時間間隔でGPS受信部28を介して位置情報を取得する。
通信接続確認部12は、通信状況確認手段としての機能を有する。通信接続確認部12は、対話サーバ4との間の通信状況を確認する。通信接続確認部12は、通信ネットワークNに接続されている場合には、通信状況が通信可であると確認する。また、通信接続確認部12は、通信ネットワークNに接続されていない場合には、通信状況が通信不可であると確認する。なお、通信接続確認部12は、通信ネットワークNに接続されているが電波が弱い場合には、通信状況が通信不可であると確認してもよい。
【0017】
対話切替部13は、対話切替手段としての機能を有する。対話切替部13は、通信接続確認部12による通信状況の確認結果に応じて、ローカル対話部15による処理と、リモート対話部14による処理とを切り替える。より具体的には、対話切替部13は、通信接続確認部12による通信状況が通信可である場合には、リモート対話部14による処理を行うようにし、通信接続確認部12による通信状況が通信不可の場合に限り、ローカル対話部15による処理を行うように処理を切り替える。
また、対話切替部13は、リモート対話部14による処理中において対話サーバ4から一定期間内に対話の応答である返答データを受信しない場合には、ローカル対話部15による処理を行うように切り替える。
【0018】
リモート対話部14は、リモート対話手段及び位置送信手段としての機能を有する。リモート対話部14は、ユーザP1との対話を対話サーバ4を介して行う。より具体的には、リモート対話部14は、ユーザP1の発話を、マイク25を介して発話データとして取得し、当該発話データを対話サーバ4に送信する。また、リモート対話部14は、位置取得部11が取得した位置情報を、対話サーバ4に送信する。さらに、リモート対話部14は、対話サーバ4から受信した返答データを、スピーカ26を介して出力する。
【0019】
ローカル対話部15は、ローカル対話手段としての機能を有する。ローカル対話部15は、ユーザP1との対話を知識部22を用いて行う。より具体的には、ローカル対話部15は、ユーザP1の発話を、マイク25を介して発話データとして取得し、当該発話データを、例えば、公知の音声認識の技術を用いてテキストにして知識部22に入力する。そして、ローカル対話部15は、知識部22から出力された返答に係るテキストを、公知の技術を用いて音声である返答データに変換し、スピーカ26を介して出力する。
キャラクタ処理部16は、キャラクタ処理手段としての機能を有する。キャラクタ処理部16は、対話相手としてキャラクタをディスプレイ27に出力する。そして、キャラクタ処理部16は、相手方の返答に対応してキャラクタを動作させる。
【0020】
履歴送信部17は、履歴送信手段としての機能を有する。履歴送信部17は、対話切替部13がローカル対話部15による処理からリモート対話部14による処理に切り替えた場合に、端末履歴記憶部23の対話履歴データを、対話サーバ4に送信する。その際、履歴送信部17は、少なくともローカル対話部15による処理の間に生じた対話履歴データを、対話サーバ4に送信する。
履歴登録部18は、ユーザP1と相手方との対話内容を、対話履歴データとして端末履歴記憶部23に登録する。
なお、これらの各機能の詳細については、後述する。
【0021】
マイク25は、ユーザP1の発話を取得するために用いられる音声入力装置である。マイク25は、例えば、ディスプレイ27の近傍に設けられる。ユーザP1の発話内容は、マイク25を介した音声データとして制御部10が取得できる。
スピーカ26は、対話の相手方の発話内容や返答内容に係る音声を出力する音声出力装置である。スピーカ26は、例えば、ディスプレイ27の近傍に設けられる。スピーカ26は、制御部10が出力した音声データを音声として出力する。
ディスプレイ27は、例えば、液晶パネル等で構成される表示装置である。
GPS受信部28は、例えば、衛星から受信した電波を利用して、端末1の現在の位置情報(緯度及び経度)を計測するものである。
通信インタフェース部29は、基地局Rを経由し、通信ネットワークNを介して対話サーバ4との間の通信を行うためのインタフェースである。
【0022】
<対話サーバ4>
対話サーバ4は、端末1と通信接続されている場合に、端末1から受信した発話データに基づく返答や、端末1から受信した位置情報に基づく対話処理をするサーバである。
図3に示すように、対話サーバ4は、制御部40と、記憶部50と、通信インタフェース部59とを備える。
制御部40は、対話サーバ4の全体を制御するCPUである。制御部40は、記憶部50に記憶されているOSや、各種のアプリケーションプログラムを適宜読み出して実行することにより、上述したハードウェアと協働し、各種機能を実行する。
【0023】
制御部40は、位置受信部41と、発話受信部42と、対話処理部43と、履歴受信部47と、履歴登録部48とを備える。
位置受信部41は、位置受信手段としての機能を有する。位置受信部41は、端末1か位置情報を受信する。
発話受信部42は、発話受信手段としての機能を有する。発話受信部42は、端末1から発話データを受信する。
対話処理部43は、対話処理手段としての機能を有する。対話処理部43は、受信した発話データを、例えば、公知の音声認識の技術を用いてテキストにして、サーバ履歴記憶部53に記憶された対話履歴データ及び位置受信部41が受信した位置情報と共に言語モデルサーバ6に送信する。そして、対話処理部43は、言語モデルサーバ6から返答内容を受信し、公知の技術を用いて音声である返答データに変換して端末1に送信する。
【0024】
履歴受信部47は、端末1が送信した対話履歴データを受信する。
履歴登録部48は、履歴登録手段としての機能を有する。履歴登録部48は、履歴受信部47が受信した対話履歴データを、例えば、端末1を識別する端末識別情報(ユーザ)に対応付けてサーバ履歴記憶部53に登録する。また、履歴登録部48は、対話処理部43によって取得した発話内容や返答内容を、対話履歴データとして、端末識別情報に対応付けてサーバ履歴記憶部53に登録する。
【0025】
記憶部50は、対話サーバ4の動作に必要なプログラム、データ等を記憶するためのハードディスク、半導体メモリ素子等の記憶装置である。
記憶部50は、プログラム記憶部51と、サーバ履歴記憶部53とを備える。
プログラム記憶部51は、プログラムを記憶するための記憶領域である。プログラム記憶部51は、制御部40の各種機能を実行するためのプログラムを含む、各種のプログラムを記憶する。
サーバ履歴記憶部53は、対話サーバ4と端末1との間での対話内容や、端末1から受信した対話履歴データを、端末識別情報に対応付けて時系列に記憶する記憶領域である。
通信インタフェース部59は、通信ネットワークNを介して端末1及び言語モデルサーバ6との間の通信を行うためのインタフェースである。
【0026】
なお、対話サーバ4を構成するハードウェアの数に制限はない。必要に応じて、1又は複数で構成してもよい。また、対話サーバ4のハードウェアは、必要に応じてウェブサーバ、DB(データベース)サーバ、アプリケーションサーバ等の各種サーバを含んで構成してもよく、1台のサーバで構成しても、それぞれ別のサーバで構成してもよい。また、対話サーバ4は、例えば、クラウドであってもよい。
コンピュータとは、制御部、記憶装置等を備えた情報処理装置をいい、端末1及び対話サーバ4は、各々制御部、記憶部等を備えた情報処理装置であり、コンピュータの概念に含まれる。
【0027】
<言語モデルサーバ6>
図1に示す言語モデルサーバ6は、複数の文書及び対話内容を学習した言語モデル6aを備えたサーバである。言語モデル6aは、膨大なテキストデータから言語のパターンを学習し、テキスト生成や要約等のテキストに関わるタスクを高い精度で行うことを可能にした巨大なニューラルネットワークである深層学習モデルであり、例えば、大規模言語モデル(LLM)である。また、言語モデル6aは、生成AI(ジェネレーティブAI)であってもよい。なお、言語モデルサーバ6は、言語モデル6aが大規模な計算指令が必要なものであるため、例えば、クラウドであってもよい。
【0028】
基地局Rは、無線通信の基地局であって、端末1と対話サーバ4との間で通信をするための中継を行う。基地局Rは、例えば、無線LAN(Local Area Network)や、携帯電話事業者の無線局等である。
通信ネットワークNは、各種のサーバ間や、各種のサーバと基地局Rとの間のネットワークである。通信ネットワークNは、例えば、インターネット回線等の通信網であり、有線であるか無線であるかを問わない。
【0029】
<処理の説明>
次に、対話システム100で行う処理について説明する。
図4は、第1実施形態に係る対話システム100における対話例を示す図である。
図5は、第1実施形態に係る対話システム100における対話と履歴との関係を説明するための図である。
図4に示すように、対話システム100は、案内が開始されると、まず、位置情報に基づく対話R1が端末1から出力される。端末1は、通信状況が通信可であるため、リモートでの対話処理を行う。そのため、端末1から対話サーバ4に対して位置情報が送信され、位置情報に基づく対話R1を、対話サーバ4が端末1に送信することで、対話R1が端末1に出力される。対話R1は、位置情報を言語モデル6aに入力することで言語モデル6aから出力されたものである。なお、案内開始の対話R1は、例えば、位置情報が所定の位置の場合に、所定の位置に対応した対話R1を記憶部50から取得して出力するものであってもよい。
【0030】
それを聞いたユーザP1が質問Q1をした際、端末1は、依然として通信状況が通信可である。そのため、端末1は、リモートでの対話処理を行う。端末1は、対話サーバ4に質問Q1を送信することで、対話サーバ4は、返答A1を端末1に出力する。返答A1は、質問Q1と対話履歴データとして対話R1とを言語モデル6aに入力することで、言語モデル6aから出力されたものである。
次に、ユーザP1が質問Q2をした場合、端末1は、通信状況が通信不可になっている。そのため、端末1は、ローカルでの対話処理を行う。具体的には、端末1は、知識部22を用いて質問Q2に対する返答A2を取得し、出力する。
【0031】
その後、ユーザP1が質問Q3をした場合、端末1は、通信状況が通信可である。そのため、端末1は、リモートでの対話処理を行う。端末1は、対話サーバ4に質問Q3と共に、対話履歴データとして、ローカルでの対話処理の対話履歴である質問Q2と返答A2とを送信することで、対話サーバ4は、返答A3を端末1に出力する。返答A3は、質問Q3と、対話履歴データとして質問Q1から返答A2までの間の対話とを言語モデル6aに入力することで言語モデル6aから出力されたものである。
図5は、返答A3を生成する態様を示す。サーバ履歴記憶部53には、ローカルでの対話処理男の対話履歴データも登録されている。そのため、返答A3は、端末1のみで行ったローカルでの対話処理での対話履歴データをも用いて生成されたものである。
【0032】
次に、上記で説明した処理を、フローチャートに基づいて説明する。
まず先に、端末1における処理を説明する。
図6は、第1実施形態に係る端末1の対話処理を示すフローチャートである。
図7は、第1実施形態に係る端末1のローカル処理を示すフローチャートである。
図6のステップS(以下、「ステップS」を、単に「S」という。)11において、端末1の位置取得部11は、端末1の位置情報を、GPS受信部28を介して取得する。位置取得部11は、例えば、1分おき等の所定の時間間隔で位置情報を取得することができる。
【0033】
S12において、通信接続確認部12は、通信状況を確認し、通信状況が通信可であるか否かを判断する。通信状況が通信可である場合(S12:YES)には、通信接続確認部12は、処理をS13に移し、対話切替部13は、リモート対話部14による処理に切り替える。他方、通信状況が通信可ではない場合(S12:NO)には、通信接続確認部12は、処理をS19に移し、対話切替部13は、ローカル対話部15による処理に切り替える。
S13において、リモート対話部14は、ユーザP1の発話を受け付けたか否かを判断する。ユーザP1の発話を受け付けた場合(S13:YES)には、リモート対話部14は、処理をS14に移す。他方、ユーザP1の発話を受け付けていない場合(S13:NO)には、リモート対話部14は、処理をS15に移す。
【0034】
S14において、リモート対話部14は、S11の処理で取得した位置情報と、発話データとを、対話サーバ4に送信する。その後、制御部10は、処理をS16に移す。
S15において、リモート対話部14は、S11の処理で取得した位置情報を、対話サーバ4に送信する。
S16において、対話切替部13は、一定期間内に対話サーバ4が送信する返答データを受信したか否かを判断する。ここで、一定期間は、対話サーバ4に送信した時点を開始時間とした経過時間であり、例えば、10秒等である。一定期間内に返答データを受信した場合(S16:YES)には、対話切替部13は、処理をS17に移す。他方、一定期間内に返答データを受信しなかった場合(S16:NO)には、対話切替部13は、処理をS19に移す。一定期間内に返答データを受信しなかった場合とは、例えば、処理の途中で通信状況が通信不可になった場合等が考えられる。そこで、一定期間内に返答データを受信しなかった場合には、対話切替部13は、ローカル対話部15による処理に切り替える。
【0035】
S17において、履歴登録部18は、発話及び返答からなる対話履歴データを端末履歴記憶部23に登録する。
S18において、リモート対話部14は、受信した返答データを、スピーカ26に出力する。そうすることで、ユーザP1は、自身の発話に対する返答を聞くことができる。
なお、当該処理を行っている間、キャラクタ処理部16は、端末1のディスプレイ27に、キャラクタを出力する。また、キャラクタ処理部16は、返答データをスピーカ26に出力している間、キャラクタがしゃべっているように口を動かす動作処理を行う。その後、制御部10は、処理をS11に移す。
【0036】
他方、S19において、ローカル対話部15は、ローカル処理を行う。
ここで、ローカル処理について、図7に基づき説明する。
図7のS31において、ローカル対話部15は、ユーザP1の発話を受け付けたか否かを判断する。ユーザP1の発話を受け付けた場合(S31:YES)には、ローカル対話部15は、処理をS32に移す。他方、ユーザP1の発話を受け付けていない場合(S31:NO)には、ローカル対話部15は、処理をS35に移す。なお、図6のS16の処理でNOになったことにより本処理に遷移した場合には、ユーザP1の発話を受け付けた(S31:YES)ものとして処理を進める。
【0037】
S32において、ローカル対話部15は、発話データを知識部22に入力する。その際、ローカル対話部15は、発話データを音声からテキストに変換した上で知識部22に入力する。
S33において、ローカル対話部15は、知識部22が出力した返答をテキストから音声に変換した上で、スピーカ26を介して出力する。
S34において、履歴登録部18は、発話及び返答からなる対話履歴データを、端末履歴記憶部23に登録する。
【0038】
S35において、通信接続確認部12は、対話サーバ4との間の通信状況を確認し、通信状況が通信可であるか否かを判断する。通信状況が通信可である場合(S35:YES)には、通信接続確認部12は、処理をS36に移し、対話切替部13は、リモート対話部14による処理に切り替える。他方、通信状況が通信可ではない場合(S35:NO)には、通信接続確認部12は、処理を図6のS11に移す。
S36において、履歴送信部17は、少なくともローカルでの対話処理で端末履歴記憶部23に登録した対話履歴データを、対話サーバ4に送信する。その後、制御部10は、処理を図6のS11に移す。
【0039】
次に、対話サーバ4の処理を説明する。
図8は、第1実施形態に係る対話サーバ4のサーバ処理を示すフローチャートである。
対話サーバ4の処理は、端末1が対話サーバ4に情報を送信し(図6のS14、S15及び図7のS36を参照)、対話サーバ4が情報を受信したことを契機に処理を開始する。
図8のS41において、位置受信部41は、端末1から位置情報を受信したか否かを判断する。位置情報を受信した場合(S41:YES)には、制御部40は、処理をS42に移す。他方、位置情報を受信していない場合(S41:NO)には、制御部40は、処理をS46に移す。
【0040】
S42において、発話受信部42は、端末1から発話データを受信したか否かを判断する。発話データを受信した場合(S42:YES)には、制御部40は、処理をS43に移す。他方、発話データを受信していない場合(S42:NO)には、制御部40は、処理をS44に移す。
S43において、対話処理部43は、受信した発話データと位置情報とを、端末1の端末識別情報に対応付けられた対話履歴データと共に、言語モデルサーバ6に送信する。ここで、発話データは、テキストに変換したものを言語モデルサーバ6に送信する。また、位置情報は、例えば、緯度経度から住所に変換したものを言語モデルサーバ6に送信する。言語モデルサーバ6では、受信したデータを言語モデル6aに入力する。その後、制御部40は、処理をS45に移す。
【0041】
S44において、対話処理部43は、受信した位置情報を、端末1の端末識別情報に対応付けられた対話履歴データと共に、言語モデルサーバ6に送信する。言語モデルサーバ6では、受信したデータを言語モデル6aに入力する。
S45において、対話処理部43は、言語モデル6aが出力し、言語モデルサーバ6から受信した返答データを、端末1に送信する。ここで、対話処理部43は、言語モデルサーバ6から受信した返答内容を、返答データとして音声化してから、端末1に送信する。その後、制御部40は、本処理を終了する。
【0042】
他方、S46において、履歴受信部47は、端末1から対話履歴データを受信したか否かを判断する。対話履歴データを受信した場合(S46:YES)には、履歴受信部47は、処理をS47に移す。他方、対話履歴データを受信していない場合(S46:NO)には、制御部40は、本処理を終了する。
S47において、履歴登録部48は、対話履歴データを、端末識別情報に対応付けてサーバ履歴記憶部53に登録する。その後、制御部40は、本処理を終了する。
【0043】
このように、第1実施形態によれば、対話システム100は、以下のような効果がある。
(1)端末1は、ユーザP1と、ユーザP1が対話をする相手方との間の対話内容である対話履歴データを記憶する端末履歴記憶部23と、ユーザP1との対話を特定の知識を有する知識部22を用いて行うローカル対話部15と、ユーザP1との対話を対話サーバ4を介して行うリモート対話部14と、対話サーバ4との間の通信状況を確認する通信接続確認部12と、通信接続確認部12による通信状況の確認結果に応じて、ローカル対話部15による処理と、リモート対話部14による処理とを切り替える対話切替部13と、対話切替部13がローカル対話部15による処理からリモート対話部14による処理に切り替えた場合に、端末履歴記憶部23の対話履歴データを対話サーバ4に送信する履歴送信部17とを備える。そして、対話サーバ4は、端末1から受信した対話履歴データを、端末識別情報に対応付けてサーバ履歴記憶部53に登録する。
【0044】
よって、端末1では、通信状況の確認結果に応じて、ユーザP1と対話をする相手を、端末1に有する知識部22を用いたローカルでの対話処理によって行うか、対話サーバ4を介したリモートでの対話処理によって行うかを切り替えることができる。また、ローカルでの対話処理からリモートでの対話処理に切り替えた場合に、ローカルでの対話処理での対話履歴データを、対話サーバ4に送信するので、対話サーバ4には、端末1と接続されていない間に端末1内で行われた対話に係る履歴をも有することができる。
【0045】
(2)端末1の履歴送信部17は、少なくともローカル対話部15による処理の間に生じた対話履歴データを、対話サーバ4に送信する。
よって、ユーザP1がローカル対話部15による処理によって生じた対話履歴を、対話サーバ4に送信するので、時系列に行われたユーザP1と相手方との対話に係る最小限の対話履歴データを、対話サーバ4が有することができる。
【0046】
(3)端末1の対話切替部13は、リモート対話部14による処理中において対話サーバ4から一定期間内に対話の応答である返答データを受信しない場合には、ローカル対話部15による処理に切り替える。
よって、ユーザP1が返答を待ち続けることがなく、対話サーバ4からの返答がない場合には、ローカル対話部15による処理に切り替えることよって、対話を継続させることができる。
【0047】
(4)対話サーバ4は、端末1からユーザP1の発話データを受信する発話受信部42と、発話受信部42が受信した発話データと、サーバ履歴記憶部53に記憶されたユーザP1の対話履歴データとを、複数の文書及び対話内容を学習した言語モデル6aに入力し、言語モデル6aが出力した返答データを、端末1に送信する対話処理部43を備える。
よって、ユーザP1の発話に対する返答を、発話と、それまでの対話履歴とから言語モデル6aが生成したものにできる。その結果、違和感のないシームレスな対話をユーザP1に提供できる。
【0048】
(5)端末1は、位置情報を所定の時間間隔で取得する位置取得部11を備え、リモート対話部14は、当該リモート対話部14による処理の間に位置取得部11が取得した位置情報を、対話サーバ4に送信し、対話サーバ4は、位置情報を端末1から受信する位置受信部41を備え、対話サーバ4の対話処理部43は、位置情報をさらに言語モデル6aに入力する。
よって、ユーザP1の発話に対する返答を、発話と、それまでの対話履歴と、位置情報とから言語モデル6aが生成したものにできる。その結果、さらにユーザP1の位置情報をも加味した返答を、ユーザP1に提供できる。
【0049】
(6)発話データ及び返答データは、音声データであり、端末1は、発話データを取得するマイク25と、返答データを出力するスピーカ26と、を備える。
よって、ユーザP1は、音声による対話を行うことができる。
【0050】
(7)端末1は、相手方に対応したキャラクタを出力するディスプレイ27と、相手方の返答に対応してキャラクタを動作させるキャラクタ処理部16と、を備える。
よって、ユーザP1は、キャラクタと対話をしているように感じることができる。また、キャラクタが返答に対応した動作をすることで、キャラクタの動作を自然なものにできる。
【0051】
(第2実施形態)
第2実施形態では、端末のユーザとの対話を、言語モデルに代わってオペレータが行うものについて説明する。なお、以降の説明において、上述した第1実施形態と同様の機能を果たす部分には、同一の符号又は末尾に同一の符号を付して、重複する説明を適宜省略する。
【0052】
<対話システム200の全体構成>
図9は、第2実施形態に係る対話システム200の全体構成図である。
図10は、第2実施形態に係る対話サーバ204及びオペレータ端末207の機能ブロック図である。
図9に示す対話システム200は、端末1と、対話サーバ204と、オペレータ端末207(相手方端末)とを備える。端末1と、対話サーバ204と、オペレータ端末207とは、通信ネットワークN及び基地局Rを介して通信可能に接続されている。
【0053】
対話システム200は、例えば、バスの車内SP1に設置された端末1を用いて、ユーザP1が、自宅等の室内SP2にいるオペレータP2を相手に対話を行うことを可能にした、遠隔ガイドのシステムである。対話システム100では、端末1が通信ネットワークNに接続されている状態において、対話サーバ204が、オペレータ端末207に発話データを送信する仲介を行う。オペレータP2は、オペレータ端末207から返答データを対話サーバ204に送信するので、対話サーバ204から端末1に返答データが送信される。また、端末1が通信ネットワークNに接続されていない状態になった場合においては、端末1が、ユーザP1の発話に対する処理を行って、ユーザP1の発話に対する返答を行う。
【0054】
<対話サーバ204>
図10(A)に示す対話サーバ204は、制御部240と、記憶部250と、通信インタフェース部59とを備える。
制御部240は、位置受信部41と、発話受信部42と、情報送信部244と、返答受信処理部245と、履歴受信部47と、履歴登録部48とを備える。
情報送信部244は、情報出力手段としての機能を有する。情報送信部244は、端末1から受信した発話データ及び位置情報と、サーバ履歴記憶部53に記憶された端末1の端末識別情報に対応付けられた対話履歴データとを、オペレータ端末207に送信する。
返答受信処理部245は、返答送信手段としての機能を有する。返答受信処理部245は、オペレータ端末207から返答データを受信し、端末1に送信する。
【0055】
記憶部250は、プログラム記憶部251と、サーバ履歴記憶部53とを備える。
プログラム記憶部251は、制御部240の各種機能を実行するためのプログラムを含む、各種のプログラムを記憶する記憶領域である。
【0056】
<オペレータ端末207>
図10(B)に示すオペレータ端末207は、制御部270と、記憶部275と、入力部276と、ディスプレイ277と、ヘッドセット278と、通信インタフェース部279とを備える。
制御部270は、情報受信部271と、情報出力部272と、返答受付処理部273とを備える。
情報受信部271は、対話サーバ204から発話データ及び位置情報と、対話履歴データとを受信する。
情報出力部272は、情報受信部271が受信した各種の情報を、ディスプレイ277やヘッドセット278に出力する。情報出力部272は、例えば、発話データをヘッドセット278に音声として出力すると共に、対話履歴データを、例えば、ディスプレイ277に時系列に文字で出力する。また、情報出力部272は、例えば、地図上に位置情報を示した地図情報を、ディスプレイ277に出力してもよい。
返答受付処理部273は、オペレータP2の返答をヘッドセット278を介して受け付けて、返答データを対話サーバ204に送信する。
【0057】
記憶部275は、制御部270の処理を行うプログラムの他、各種のプログラム等を記憶する記憶領域である。
入力部276は、例えば、キーボードやマウス等の入力装置である。
ディスプレイ277は、例えば、液晶パネル等で構成される表示装置である。
ヘッドセット278は、例えば、オペレータP2が頭部に装着する、マイクとヘッドフォンとが一体になった装置である。
通信インタフェース部279は、通信ネットワークNを介して対話サーバ204との間の通信を行うためのインタフェースである。
【0058】
<処理の説明>
次に、対話システム200で行う処理について説明する。
端末1における処理は、第1実施形態(図6及び図7)と同様である。
対話サーバ204の処理について説明する。
図11は、第2実施形態に係る対話サーバ204のサーバ処理を示すフローチャートである。
対話サーバ204の処理は、端末1が対話サーバ204に情報を送信し(図6のS14、S15及び図7のS36を参照)、対話サーバ204が情報を受信した場合や、オペレータ端末207から情報を受信したことを契機に処理を開始する。
【0059】
図11のS241において、位置受信部41は、端末1から位置情報を受信したか否かを判断する。位置情報を受信した場合(S241:YES)には、制御部240は、処理をS242に移す。他方、位置情報を受信していない場合(S241:NO)には、制御部240は、処理をS243に移す。
S242において、情報送信部244は、端末1から受信した位置情報を、オペレータ端末207に送信する。ここで、情報送信部244は、端末1から受信した位置情報から住所を特定し、当該住所を含む地図上に位置情報を示した地図情報として、オペレータ端末207に送信してもよい。また、位置情報は、例えば、それ以前に取得したものを軌跡として含んだものにしてもよい。そうすることで、オペレータP2は、車両の移動方向を含めた車両の位置が分かるので、案内がしやすくなる。
【0060】
S243において、発話受信部42は、端末1から発話データを受信したか否かを判断する。発話データを受信した場合(S243:YES)には、制御部240は、処理をS244に移す。他方、発話データを受信していない場合(S243:NO)には、制御部240は、処理をS245に移す。
S244において、情報送信部244は、端末1から受信した発話データ及びサーバ履歴記憶部53に記憶された当該端末1の端末識別情報に対応付けられた対話履歴データを、オペレータ端末207に送信する。
当該処理によって、オペレータ端末207の情報受信部271は、各種の情報を受信し、情報出力部272は、受信した各種の情報を出力する。よって、オペレータP2は、出力された情報を参照し、発話データに対する返答をすることができる。
【0061】
S245において、返答受信処理部245は、オペレータ端末207から返答データを受信したか否かを判断する。オペレータ端末207から返答データを受信した場合(S245:YES)には、制御部240は、処理をS246に移す。他方、オペレータ端末207から返答データを受信していない場合(S245:NO)には、制御部240は、処理をS247に移す。
S246において、返答受信処理部245は、返答データを端末1に送信する。
S247及びS248の処理は、第1実施形態(図8)のS46及びS47の処理と同様である。
【0062】
このように、第2実施形態によれば、対話システム200は、以下のような効果がある。
(1)対話サーバ204は、端末1からユーザP1の発話データを受信する発話受信部42と、発話受信部42が受信した発話データと、サーバ履歴記憶部53に記憶されたユーザP1の対話履歴データとを、オペレータ端末207に出力する情報送信部244と、オペレータ端末207から送信された返答データを、端末1に送信する返答受信処理部245とを備える。
よって、対話サーバ204を仲介して、端末1のユーザP1と、オペレータ端末207のオペレータP2とが対話をすることができる。
また、サーバ履歴記憶部53に記憶された対話履歴データを、オペレータ端末207に送信するので、オペレータP2は、ローカルでの対話処理によって端末1で行われた対話履歴を確認しながら、対話を進めることができる。
【0063】
(2)端末1は、位置情報を所定の時間間隔で取得する位置取得部11を備え、リモート対話部14は、当該リモート対話部14による処理の間に位置取得部11が取得した位置情報を、対話サーバ204に送信し、対話サーバ204は、位置情報を端末1から受信する位置受信部41を備え、情報送信部244は、位置受信部41が受信した位置情報をさらにオペレータ端末207に出力する。
よって、オペレータP2は、端末1の位置情報を確認することができるので、返答や対話を、位置情報を加味したものにできる。
【0064】
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限定されるものではない。また、実施形態に記載した効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、実施形態に記載したものに限定されない。なお、上述した実施形態及び後述する変形形態は、適宜組み合わせて用いることもできるが、詳細な説明は省略する。
【0065】
(変形形態)
(1)各実施形態では、対話システムを観光バスで用いるものを例に説明したが、これに限定されない。車載端末と対話サーバとを備え、言語モデルを用いて、又は、オペレータによる対話を行うものであれば、例えば、カーナビシステムに用いたり、他の用途に用いたりすることができる。さらに、電車内の端末であってもよいし、端末を、例えば、ユーザが持ち歩く携帯端末としてもよい。
【0066】
(2)各実施形態では、音声データからテキストへの変換及びテキストから音声データへの変換を対話サーバが行うものを例に説明したが、これに限定されない。端末で音声とテキストとの間の変換処理を行ってもよい。
【0067】
(3)各実施形態では、対話を音声で行うものを例に説明したが、これに限定されない。少なくとも一方の対話をテキストで行うものであってもよい。その場合には、端末がテキストでの入力を行う場合には、マイクに代えて、キーボード等の入力部を備えるようにすればよい。また、対話サーバがテキストの場合には、ディスプレイにテキストを出力するようにすればよい。
【0068】
(4)各実施形態では、ディスプレイにキャラクタとして、ガイドを模した人物の画像を表示させるものを例に説明したが、これに限定されない。他のキャラクタの画像であってもよいし、キャラクタの画像を用いなくてもよい。
【0069】
(5)第1実施形態では、言語モデルサーバに有する言語モデルを用いた処理をするものを例に説明したが、これに限定されない。対話サーバが言語モデルを有するものであってもよい。
【符号の説明】
【0070】
1 端末
4,204 対話サーバ
6 言語モデルサーバ
6a 言語モデル
10,40,240,270 制御部
11 位置取得部
12 通信接続確認部
13 対話切替部
14 リモート対話部
15 ローカル対話部
16 キャラクタ処理部
17 履歴送信部
18,48 履歴登録部
20,50,250,275 記憶部
21a 対話プログラム
22 知識部
23 端末履歴記憶部
25 マイク
26 スピーカ
27,277 ディスプレイ
28 GPS受信部
41 位置受信部
42 発話受信部
43 対話処理部
47 履歴受信部
53 サーバ履歴記憶部
100,200 対話システム
207 オペレータ端末
244 情報送信部
245 返答受信処理部
271 情報受信部
272 情報出力部
273 返答受付処理部
276 入力部
278 ヘッドセット
N 通信ネットワーク
P1 ユーザ
P2 オペレータ
SP1 車内
SP2 室内
R 基地局
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11