IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ Starley株式会社の特許一覧

特許7462995情報処理システム、情報処理方法及びプログラム
<>
  • 特許-情報処理システム、情報処理方法及びプログラム 図1
  • 特許-情報処理システム、情報処理方法及びプログラム 図2
  • 特許-情報処理システム、情報処理方法及びプログラム 図3
  • 特許-情報処理システム、情報処理方法及びプログラム 図4
  • 特許-情報処理システム、情報処理方法及びプログラム 図5
  • 特許-情報処理システム、情報処理方法及びプログラム 図6
  • 特許-情報処理システム、情報処理方法及びプログラム 図7
  • 特許-情報処理システム、情報処理方法及びプログラム 図8
  • 特許-情報処理システム、情報処理方法及びプログラム 図9
  • 特許-情報処理システム、情報処理方法及びプログラム 図10
  • 特許-情報処理システム、情報処理方法及びプログラム 図11
  • 特許-情報処理システム、情報処理方法及びプログラム 図12
  • 特許-情報処理システム、情報処理方法及びプログラム 図13
  • 特許-情報処理システム、情報処理方法及びプログラム 図14
  • 特許-情報処理システム、情報処理方法及びプログラム 図15
  • 特許-情報処理システム、情報処理方法及びプログラム 図16
  • 特許-情報処理システム、情報処理方法及びプログラム 図17
  • 特許-情報処理システム、情報処理方法及びプログラム 図18
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-03-29
(45)【発行日】2024-04-08
(54)【発明の名称】情報処理システム、情報処理方法及びプログラム
(51)【国際特許分類】
   G10L 15/10 20060101AFI20240401BHJP
   G10L 15/22 20060101ALI20240401BHJP
【FI】
G10L15/10 200W
G10L15/22 300Z
【請求項の数】 8
(21)【出願番号】P 2023184318
(22)【出願日】2023-10-26
【審査請求日】2023-11-15
【早期審査対象出願】
【前置審査】
(73)【特許権者】
【識別番号】523407012
【氏名又は名称】Starley株式会社
(74)【代理人】
【識別番号】110002789
【氏名又は名称】弁理士法人IPX
(72)【発明者】
【氏名】内波 生一
(72)【発明者】
【氏名】丸橋 得真
(72)【発明者】
【氏名】西信 貴博
(72)【発明者】
【氏名】西村 和則
【審査官】中村 天真
(56)【参考文献】
【文献】特開2020-086129(JP,A)
【文献】国際公開第2018/198812(WO,A1)
【文献】特開2017-215468(JP,A)
【文献】特開2016-206841(JP,A)
【文献】特開2002-287793(JP,A)
【文献】国際公開第2021/060315(WO,A1)
【文献】国際公開第2015/075975(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 13/00-25/93
G06F 3/16
(57)【特許請求の範囲】
【請求項1】
プロセッサを備える情報処理システムであって、
前記プロセッサが、
取得ステップでは、対話におけるユーザの発言を示すユーザ発言データを取得し、
判定ステップでは、一般的な対話における発言を示す一般発言データの特徴と当該対話において確認すべき要確認事項との関係を示す関係情報に基づいて、取得された前記ユーザ発言データが示す発言がされた対話における前記要確認事項を判定し、前記要確認事項は、前記対話において使用してもらいたい言葉遣いであり、
提示ステップでは、判定された前記要確認事項として前記言葉遣いを前記ユーザに提示し、
返答ステップでは、
取得された前記ユーザ発言データが示す発言の内容に基づいて、前記ユーザへの返答を出力し、
提示された前記要確認事項への回答として前記言葉遣いの指定があった場合は、以降は、指定された言葉遣いを用いた返答を出力する、
情報処理システム。
【請求項2】
請求項1に記載の情報処理システムにおいて、
前記言葉遣いは、前記ユーザの呼び方であり、
前記プロセッサが、
前記返答ステップでは、
提示された前記要確認事項への回答として前記呼び方の指定があった場合は、以降は、前記ユーザの呼び方を指定された呼び方とする返答を出力する、
情報処理システム。
【請求項3】
プロセッサを備える情報処理システムであって、
前記プロセッサが、
取得ステップでは、対話におけるユーザの発言を示すユーザ発言データをユーザ端末から取得し、
判定ステップでは、一般的な対話における発言を示す一般発言データの特徴と当該対話において確認すべき要確認事項との関係を示す関係情報に基づいて、取得された前記ユーザ発言データが示す発言がされた対話における前記要確認事項を判定し、
表示ステップでは、判定された前記要確認事項を前記ユーザ端末に表示させ、
返答ステップでは、
取得された前記ユーザ発言データが示す発言の内容に基づいて、前記ユーザへの返答の音声を前記ユーザ端末に対して出力し、
前記要確認事項が前記ユーザ端末に表示される場合、当該要確認事項について前記ユーザに問いかける返答の文を示す音声を前記ユーザ端末に対して出力し、当該返答の文には、当該要確認事項を示す語句が含まれておらず、
表示された前記要確認事項への回答があった場合は、当該回答の内容を反映した返答の音声を前記ユーザ端末に対して出力する、
情報処理システム。
【請求項4】
プロセッサを備える情報処理システムであって、
前記プロセッサが、
取得ステップでは、対話におけるユーザの発言を示すユーザ発言データを取得し、
判定ステップでは、一般的な対話における発言を示す一般発言データの特徴と当該対話において確認すべき要確認事項との関係を示す関係情報に基づいて、取得された前記ユーザ発言データが示す発言がされた対話における前記要確認事項を判定し、
提示ステップでは、判定された前記要確認事項を前記ユーザに提示し、
返答ステップでは、
取得された前記ユーザ発言データが示す発言の内容に基づいて、前記ユーザへの返答を出力し、
提示された前記要確認事項への回答があった場合は、当該回答の内容を反映した返答を出力し、
前記提示ステップでは、判定した前記要確認事項と同一の判定結果が過去に所定回数以上ある場合は、当該判定結果については前記要確認事項を提示しない、
情報処理システム。
【請求項5】
プロセッサを備える情報処理システムであって、
前記プロセッサが、 取得ステップでは、対話におけるユーザの発言を示すユーザ発言データを取得し、
判定ステップでは、一般的な対話における発言を示す一般発言データの特徴と当該対話において確認すべき要確認事項との関係を示す関係情報に基づいて、取得された前記ユーザ発言データが示す発言がされた対話における前記要確認事項を判定し、より具体的には、当該発言が特定の文脈であり、かつ、当該文脈に対応する語句が含まれている場合に、当該語句に対応する事項を前記要確認事項として判定し、前記要確認事項は、前記対話において使用してもらいたい言葉遣い又は前記ユーザの心情についての確認事項であり、
提示ステップでは、判定された前記要確認事項を前記ユーザに提示し、
返答ステップでは、
取得された前記ユーザ発言データが示す発言の内容に基づいて、前記ユーザへの返答を出力し、
提示された前記要確認事項への回答があった場合は、当該回答の内容を反映した返答を出力する、
情報処理システム。
【請求項6】
プロセッサを備える情報処理システムであって、
前記プロセッサが、
取得ステップでは、対話におけるユーザの発言を示すユーザ発言データを取得し、
判定ステップでは、一般的な対話における発言を示す一般発言データの特徴と当該対話において確認すべき要確認事項との関係を示す関係情報に基づいて、取得された前記ユーザ発言データが示す発言がされた対話における前記要確認事項を判定し、
提示ステップでは、判定された前記要確認事項を前記ユーザに提示し、
返答ステップでは、
取得された前記ユーザ発言データが示す発言の内容に基づいて、前記ユーザへの返答を出力し、
提示された前記要確認事項への回答があった場合は、当該回答の内容を反映した返答を出力し、
前記判定ステップでは、前記ユーザの発言の文脈と当該発言に含まれている語句との関係が予め登録されている関係である場合に当該関係に対応する事項を前記要確認事項として判定し、当該ユーザについての以降の前記要確認事項の判定においては、提示された当該要確認事項に対する回答と当該文脈及び語句との関係に基づいて前記要確認事項を判定する、
情報処理システム。
【請求項7】
情報処理方法であって、
請求項1~請求項の何れか1つに記載の情報処理システムの各ステップを備える、
情報処理方法。
【請求項8】
プログラムであって、
コンピュータに、請求項1~請求項の何れか1つに記載の情報処理システムの各ステップを実行させる
プログラム
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システム、情報処理方法及びプログラムに関する。
【背景技術】
【0002】
特許文献1には、入力された文を形態素解析し、形態素解析された文中の品詞が一定の条件を満たす語を取り出し、取り出した各語について他の語との共起度の和を求め、共起度の和の数値が所定の閾値より低い単語を入力誤りの語と判定し、入力誤りと判定された語がある場合に訂正文を作成する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2008-180801号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ユーザの発言に対して自動的に返答する対話機能が知られている。そのような対話機能とユーザが対話している際に、発言したユーザの意図や心情が正しく伝わっていないと、その後の対話の内容がユーザの望む内容とずれて違和感を与えるおそれがある。
【0005】
本発明では上記事情に鑑み、対話における違和感を低減することができる情報処理システム等を提供することとした。
【課題を解決するための手段】
【0006】
本発明の一態様によれば、プロセッサを備える情報処理システムが提供される。この情報処理システムでは、プロセッサが、取得ステップでは、対話におけるユーザの発言を示すユーザ発言データを取得する。判定ステップでは、一般的な対話における発言を示す一般発言データの特徴と当該対話において確認すべき要確認事項との関係を示す関係情報に基づいて、取得されたユーザ発言データが示す発言がされた対話における要確認事項を判定する。提示ステップでは、判定された要確認事項をユーザに提示する。返答ステップでは、取得されたユーザ発言データが示す発言の内容に基づいて、ユーザへの返答を出力する。提示された要確認事項への回答があった場合は、当該回答の内容を反映した返答を出力する。
【0007】
このような態様によれば、対話における違和感を低減することができる。
【図面の簡単な説明】
【0008】
図1】自動対話システム1の全体構成の一例を示す図である。
図2】サーバ装置10のハードウェア構成の一例を示す図である。
図3】ユーザ端末20のハードウェア構成の一例を示す図である。
図4】対話処理の一例を示すアクティビティ図である。
図5】表示された自動対話画面の一例を示す図である。
図6】対話の一例を示す図である。
図7】確認テーブルの一例を示す図である。
図8】出力された確認情報の一例を示す図である。
図9】修正入力欄の一例を示す図である。
図10】出力された返答の一例を示す図である。
図11】出力された返答の別の一例を示す図である。
図12】出力された確認情報の別の一例を示す図である。
図13】修正入力欄の別の一例を示す図である。
図14】出力された返答の別の一例を示す図である。
図15】出力された確認情報の一例を示す図である。
図16】修正用の操作画像の一例を示す図である。
図17】出力された返答の一例を示す図である。
図18】態様テーブルの一例を示す図である。
【発明を実施するための形態】
【0009】
以下、図面を用いて本発明の実施形態について説明する。以下に示す実施形態中で示した各種特徴事項は、互いに組み合わせ可能である。
【0010】
ところで、本実施形態に登場するソフトウェアを実現するためのプログラムは、コンピュータが読み取り可能な非一時的な記録媒体(Non-Transitory Computer-Readable Medium)として提供されてもよいし、外部のサーバからダウンロード可能に提供されてもよいし、外部のコンピュータで当該プログラムを起動させてクライアント端末でその機能を実現(いわゆるクラウドコンピューティング)するように提供されてもよい。
【0011】
また、本実施形態において「部」とは、例えば、広義の回路によって実施されるハードウェア資源と、これらのハードウェア資源によって具体的に実現されうるソフトウェアの情報処理とを合わせたものも含みうる。また、本実施形態においては様々な情報を取り扱うが、これら情報は、例えば電圧・電流を表す信号値の物理的な値、0又は1で構成される2進数のビット集団体としての信号値の高低、又は量子的な重ね合わせ(いわゆる量子ビット)によって表され、広義の回路上で通信・演算が実行されうる。
【0012】
また、広義の回路とは、回路(Circuit)、回路類(Circuitry)、プロセッサ(Processor)、及びメモリ(Memory)等を少なくとも適当に組み合わせることによって実現される回路である。すなわち、特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)、プログラマブル論理デバイス(例えば、単純プログラマブル論理デバイス(Simple Programmable Logic Device:SPLD)、複合プログラマブル論理デバイス(Complex Programmable Logic Device:CPLD)、及びフィールドプログラマブルゲートアレイ(Field Programmable Gate Array:FPGA))等を含むものである。
【0013】
<実施形態1>
1.システム構成
以下、実施形態1に係るシステム構成を説明する。
図1は、自動対話システム1の全体構成の一例を示す図である。図1においては、自動対話システム1が備える各装置と、それらの装置を使用するユーザの概要が示されている。各概要については、他の図も参照しながら随時説明する。自動対話システム1は、ユーザの操作がなくとも自動的に機械がユーザと対話する対話処理を実行する情報処理システムである。
【0014】
自動対話システム1は、通信回線2と、サーバ装置10と、ユーザ端末20とを備える。通信回線2は、特に限定されるものではないが、例えば、インターネット網によって構成されている。また、通信回線2は、ローカルエリアネットワーク、移動体通信網及びVPN(Virtual Private Network)等を含んでいてもよい。通信回線2は、自回線に接続する装置同士のデータのやり取りを仲介する。図1の例では、通信回線2には、サーバ装置10が有線で接続され、ユーザ端末20が無線で接続されている。なお、各装置の通信回線2との接続は有線でも無線でもよい。
【0015】
サーバ装置10は、対話処理を実行する情報処理装置である。サーバ装置10は、AIモジュール3を備えている。AIモジュール3は、AI(Artificial Intelligence)の技術を用いて、例えば、人からの発言が入力されるとその発言に対応する返答を出力する対話機能を実現するように調整(チューニング)されたモジュールである。AIモジュール3は、例えば、LLM(Large Language Models)と呼ばれる大規模なデータセットを用いた機械学習によって精度を高めた自然言語処理モデルを有している。
【0016】
LLMで機械学習をすることで、AIモジュール3は多様な対話を実現可能である。AIモジュール3により実現される対話機能は、単にユーザからの質問に回答するだけでなく、例えば、ユーザの発言に相槌を打ったり、現在の話題を発展させたり、話題を転換させたり、新しい話題を提供したり、過去の話題に触れたりすることができる。
【0017】
また、AIモジュール3は、対話機能以外にも、スマートスピーカ等で実現されているように、ユーザから対話において指示された特定のタスクを実行するタスク実行機能も実現するように調整されている。特定のタスクとは、例えば、インターネットでの検索、文章の作成、メールの送信及び特定のサイトで提供されているサービス(予約サービス等)の利用等である。なお、AIモジュール3は、対話機能及びタスク実行機能とは異なる他の機能も実現するよう調整可能である。
【0018】
ユーザ端末20は、ユーザによって使用される端末であり、例えばスマートフォン、タブレット端末又はパーソナルコンピュータ等である。ユーザ端末20は、対話処理における画像の表示及びユーザによる操作の受け付け等を実行する。より具体的には、ユーザ端末20は、ユーザの発言を示す音声又はテキストの入力を受け付ける。また、ユーザ端末20は、サーバ装置10による返答を音声又はテキストで出力する。
【0019】
2.ハードウェア構成
以下、実施形態1に係るハードウェア構成を説明する。
図2は、サーバ装置10のハードウェア構成の一例を示す図である。サーバ装置10は、制御部11と、記憶部12と、通信部13と、バス14とを備える。バス14は、サーバ装置10が備える各部を電気的に接続する。
【0020】
(制御部11)
制御部11は、少なくとも1つのプロセッサを有している。少なくとも1つのプロセッサは、例えば不図示の中央処理装置(Central Processing Unit:CPU)、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)、1以上のIntegrated Circuit、1以上のDiscrete Circuit、及び、これらの組合せによって構成されてもよい。
【0021】
制御部11は、記憶部12に記憶された所定のプログラムを読み出すことによって、自動対話システム1に係る種々の機能を実現するコンピュータである。すなわち、記憶部12に記憶されているソフトウェアによる情報処理が、ハードウェアの一例である制御部11によって具体的に実現されることで、制御部11に含まれる各機能部として実行されうる。なお、制御部11は単一であることに限定されず、機能ごとに複数の制御部11を有するように実施してもよい。またそれらの組合せであってもよい。
【0022】
(記憶部12)
記憶部12は、前述の記載により定義される様々な情報を記憶する。これは、例えば、制御部11によって実行される自動対話システム1に係る種々のプログラム等を記憶するソリッドステートドライブ(Solid State Drive:SSD)やHDD(Hard Disk Drive)等のストレージデバイスとして、あるいは、プログラムの演算に係る一時的に必要な情報(引数、配列等)を記憶するランダムアクセスメモリ(Random Access Memory:RAM)等のメモリとして実施されうる。記憶部12は、制御部11によって実行される自動対話システム1に係る種々のプログラムや変数等を記憶している。
【0023】
(通信部13)
通信部13は、通信モジュールによって構成される。通信モジュールは、IEEE802.11a/b/g/n/ac/ax、LTE、5G、6G等の規格に準拠する無線通信モジュールであってもよく、IEEE802.3等の規格に準拠する有線通信モジュールであってもよい。通信部13は、サーバ装置10から種々の電気信号を外部の構成要素に送信可能に構成される。また、通信部13は、外部の構成要素からサーバ装置10への種々の電気信号を受信可能に構成される。さらに好ましくは、通信部13がネットワーク通信機能を有し、これにより通信回線2を介して、サーバ装置10と外部機器との間で種々の情報を通信可能に実施してもよい。
【0024】
図3は、ユーザ端末20のハードウェア構成の一例を示す図である。ユーザ端末20は、制御部21と、記憶部22と、通信部23と、入力部24と、出力部25と、バス26とを備える。バス26は、ユーザ端末20が備える各部を電気的に接続する。制御部21、記憶部22及び通信部23は、図2に示す制御部11、記憶部12及び通信部13と、スペック、モデル等は異なっていてもよいが、同様のハードウェアである。
【0025】
(入力部24)
入力部24は、キー、ボタン、タッチスクリーン及びマウス等を有し、ユーザによる入力を受け付ける。また、入力部24は、マイクロフォンを有し、ユーザによる音声の入力を受け付ける。
【0026】
(出力部25)
出力部25は、ディスプレイ及びスピーカ等を有し、ディスプレイの表示面に画面、画像、アイコン、テキスト等といった、ユーザが視認可能な態様で生成された視覚情報を表示し、音声を含む音を出力する。
【0027】
3.情報処理
以下、実施形態に係る情報処理として、上述した対話処理について説明する。以下の説明では、サーバ装置10及びユーザ端末20を各対話処理の主体として記載するが、それらの情報処理は、各装置の制御部が有するプロセッサによって実行されている。なお、対話処理のうち、ユーザの発言から返答を生成する処理についてはAIモジュール3が用いられるが、その他の対話処理については、AIモジュール3が用いられてもよいし、他のモジュール(表示用モジュール等)が用いられてもよい。
【0028】
図4は、対話処理の一例を示すアクティビティ図である。図4に示す対話処理は、ユーザ端末20のユーザが、サーバ装置10が提供する自動対話サービスの提供画面を表示させる操作を行うことを契機に開始される。まず、サーバ装置10は、A11において、自動対話画面を示す画面データを生成し、生成した画面データをユーザ端末20に送信する。ユーザ端末20は、A12において、送信されてきた画面データが示す自動対話画面を表示する。
【0029】
図5は、表示された自動対話画面の一例を示す図である。図5の例では、サーバ装置10は、自動対話画面C1をユーザ端末20の表示画面に表示させている。自動対話画面C1には、対話相手画像F11と、対話終了ボタンB11とが表示されている。対話終了ボタンB11は、対話を終了させる場合に操作する操作用画像である。
【0030】
対話相手画像F11は、対話相手をイメージさせる画像であり、対話中に表示されている。対話相手画像F11によってイメージされる対話相手のことを以下では「対話AI」とも言う。なお、対話相手画像F11は人の顔を模した画像であるが、動物の画像又は図形の画像等が対話相手画像として用いられてもよい。
【0031】
次に、サーバ装置10は、A13において、自動対話サービスの利用を開始したユーザが、初めて自動対話サービスを利用した対話を行うユーザであるか否かを判断する。サーバ装置10は、A13において初めての対話ではない(NO)と判断した場合、後述するA25へ進む。A25については後ほど説明する。サーバ装置10は、A13において初めての対話である(YES)と判断した場合、A14において、初期の対話用の返答を生成してユーザ端末20に送信する。
【0032】
ユーザ端末20は、A15において、送信されてきた初期の対話用の返答を出力する。返答の出力は、音声でされてもよいし、テキストでされてもよい。図5の例では、ユーザ端末20は、「初めまして。私はトモダチと言います。」という音声V11を初期の対話用の返答として出力させる。音声V11は、対話AIが自己紹介をする発言を表している。音声V11を聞いたユーザは、例えば、自分の名前を含む自己紹介の発言を対話AIに対して行う。
【0033】
図6は、対話の一例を示す図である。図6の例では、ユーザは、「初めまして。僕の名前はトムだよ。」という発言を示す音声V12を発している。ユーザ端末20は、A21において、この音声V12をユーザの発言の入力として受け付け、入力された発言を示す音声データをサーバ装置10に送信する。サーバ装置10は、A22において、送信されてきた音声データを、ユーザの対話AIへの発言を示すユーザ発言データとして取得する。
【0034】
次に、サーバ装置10は、取得されたユーザ発言データに基づいて、A23において、要確認事項を判定する。要確認事項とは、対話において確認すべき事項として、自動対話システム1において予め定められている事項である。要確認事項の判定方法は、大きく2通りある。1つ目は図1に示すAIモジュール3を用いる方法であり、2つ目は後述する確認テーブルを用いる方法である。
【0035】
1つ目の方法では、大量の対話のやり取りを含むデータセットを学習させた学習モデルを生成し、生成した学習モデルに基づいて、ユーザ発言データを入力すると要確認事項を判定結果として出力するように調整されたAIモジュール3を用いる。1つ目の方法については後ほどもう少し詳しく説明する。一方、2つ目の方法では、どのようなユーザ発言データが取得された場合にどのような要確認事項を判定するかということを定めた確認テーブルを用いる。
【0036】
図7は、確認テーブルの一例を示す図である。図7に示す確認テーブルTB1では、要確認事項の種類と、要確認事項と、一般発言データの特徴とが対応付けられている。確認テーブルTB1が示す「一般発言データ」は、ユーザと対話AIとの対話における発言を示すデータに限らず、一般的に行われている対話から収集された発言を示すデータである。要確認事項の種類には、「ユーザの意図の確認」及び「ユーザの心情の確認」が含まれている。
【0037】
ここで言う「ユーザの意図」には、例えば、ユーザが対話において対話AIに使用してもらいたい言葉遣いが含まれる。この言葉遣いは、例えば、対話AIがユーザを呼ぶときに使ってもらいたい呼び方や、対話AIがユーザの個人情報(職業、年代又は出身地等)を話すときに使ってもらいたい言い方などである。また、AIモジュール3が上述したタスク実行機能を実現する場合には、ユーザが対話AIとの対話において行ったタスクの指示の内容が「ユーザの意図」に含まれる。
【0038】
対話において「ユーザの意図」を間違えて捉えると、例えばユーザが呼んでほしくない呼び方でユーザに呼びかけたり、ユーザが言ってほしくない言い方でユーザの個人情報を言われたり(例えば「~県出身」ではなく「関東出身」と言ってほしいなど)、ユーザが指示した内容とは異なるタスクが実行されたりすることになり、ユーザに対して違和感を与えることになる。
【0039】
また、対話において「ユーザの心情」を間違えて捉えると、例えば対話機能がその心情に沿って相槌を打っても、気分が落ち込んでいるのに「楽しいですね」という相槌を打ったり、楽しい気分なのに「つらいですね」と相槌を打ったりするというように、ユーザの心情に合わない相槌を打ってしまい、ユーザに対して違和感を与えることが起こりうる。このように、「ユーザの意図」及び「ユーザの心情」は、対話を違和感なく続けるために、確認すべき事項である。
【0040】
「ユーザの意図」として確認したい事項、すなわち要確認事項は、例えば、前述したユーザの「呼び方」、ユーザの「個人情報」、「タスク内容」及び「タスク期限」等である。「呼び方」は、ユーザが望む自分の呼び方を確認するための要確認事項であり、「個人情報」は、ユーザが望む個人情報の言い方を確認するための要確認事項である。「タスク内容」及び「タスク期限」は、ユーザが指示したとおりのタスクとなっているか否かを確認するための要確認事項である。
【0041】
また、「ユーザの心情」として確認したい事項、すなわち要確認事項は、「疲労」、「ストレス」、「感情(喜怒哀楽)」及び「活発度」等である。「疲労」は、ユーザが現在疲れた状態であるか否かを確認するための要確認事項であり、「ストレス」は、ユーザが現在ストレスを感じている状態であるか否かを確認するための要確認事項である。また、「感情(喜怒哀楽)」は、ユーザの現在の感情を確認するための要確認事項である。なお、これらの「意図」及び「心情」についての要確認事項は一例であり、これに限定されない。
【0042】
続いて、各要確認事項に対応付けられている一般発言データの特徴について説明する。一般発言データの特徴には、「文脈」及び「語句」と、「音声特徴量」とが含まれている。「文脈」及び「語句」は、一般発言データが示す発言を含む対話を形成する文章における文脈の特徴と、その対話におけるユーザの発言に含まれている語句の特徴とを意味している。
【0043】
例えば、「初めまして」又は「私の名前は」等の初対面のときに使われる語句を含む文章は、「自己紹介」という文脈を有する。また、「~して」、「~しといて」又は「~を頼む」等の指示を示す語句を含む文章は、「タスク指示」という文脈を有する。また、「通勤」、「出張」又は「残業」等の仕事に関する語句を含む文章は、「仕事関係」という文脈を有する。また、「~さん」、「~くん」又は「~部長」等の第三者を呼ぶときに用いる語句を含む文章は、「人間関係」という文脈を有する。このように、文章に含まれる語句によって文脈を判断することができる。
【0044】
また、ユーザの発言に含まれる語句の種類は、例えば、各語句とその種類とを対応付けた辞書データをサーバ装置10が記憶しておくことで、判断することができる。
【0045】
確認テーブルTB1では、「呼び方」という要確認事項には、「自己紹介」という文脈と「人名」という語句とが一般発言データの特徴として対応付けられている。また、「個人情報」という要確認事項には、「自己紹介」という文脈と、「職業」、「年代」及び「出身地」等の語句とが一般発言データの特徴として対応付けられている。また、「タスク内容」という要確認事項には、「タスク指示」という文脈と「検索」、「送信」及び「予約」等の語句とが一般発言データの特徴として対応付けられている。また、「タスク期限」という要確認事項には、「タスク指示」という文脈と「日付」及び「時刻」等の語句とが一般発言データの特徴として対応付けられている。
【0046】
サーバ装置10は、A23において、例えば、図5に示す音声V11が示す対話AIによる発言と、図6に示す音声V12が示すユーザの発言とが有する特徴に基づいて、文脈を判断する。この場合は「初めまして」と言う語句がどちらにも含まれるので、サーバ装置10は、A22で取得されたユーザ発言データが、「自己紹介」という文脈を示す特徴を有すると判断する。このように、サーバ装置10は、A22で取得されたユーザ発言データが示すユーザの発言だけでなく、対話AIの発言も含めて文脈を判断する。なお、対話が進んだ場合、サーバ装置10は、1回前のユーザの発言や1回前の対話AIの発言、2回前のユーザの発言など、過去の(2回以上前を含む)双方の発言も含めて文脈を判断してもよい。
【0047】
次に、サーバ装置10は、音声V12が示すユーザの発言に「トム」という人名が含まれているので、A22で取得されたユーザ発言データが、「人名」という語句を示す特徴を有すると判断する。そして、サーバ装置10は、「自己紹介」という文脈と「人名」という語句とに確認テーブルTB1において対応付けられている「呼び方」という要確認事項があると判定する。なお、サーバ装置10は、確認テーブルTB1に示される特徴がない場合は、要確認事項がないと判定する。
【0048】
サーバ装置10は、A24において、A23における判定が、要確認事項があるという判定だったか否かを判断する。サーバ装置10は、A24において要確認事項があるという判定ではなかった(NO)と判断した場合、A25において、A22で取得されたユーザ発言データが示す発言に対する返答を生成し、生成した返答をユーザ端末20に送信する。
【0049】
なお、サーバ装置10は、A25においては、A13において初めての対話ではない(NO)と判断した場合にも、ユーザに対する返答を生成する。この場合は、サーバ装置10は、前回までの対話に基づく返答を生成してもよいし、対話を再開する際によく使われる返答を生成してもよい。
【0050】
ユーザ端末20は、A26において、送信されてきた返答を出力する。返答の出力は、A15と同様に、音声でされてもよいし、テキストでされてもよい。A26の後は、A21に戻ってユーザの発言の入力が再び行われる。
【0051】
サーバ装置10は、A24において要確認事項があるという判定であった(YES)と判断した場合、A31において、A23で判定された要確認事項を確認するための確認情報を生成し、生成した確認情報をユーザ端末20に送信する。ユーザ端末20は、A32において、送信されてきた確認情報を出力する。
【0052】
図8は、出力された確認情報の一例を示す図である。図8の例では、ユーザ端末20は、「トム」という要確認事項D11を表示し、「この呼び方でよいですか?」という発言を示す音声V13を発している。要確認事項D11及び音声V13は、どちらも確認情報が示すテキスト及び音声である。ユーザ端末20は、要確認事項D11を表示する際は、修正ボタンB22も表示する。ユーザは、出力された確認情報に対して、回答を入力する。ユーザ端末20は、A33において、要確認事項へのユーザによる回答を受け付ける。
【0053】
ユーザは、要確認事項D11で表示された呼び方で良い場合は、「はい」又は「いいよ」等の肯定を示す返事をすることで、回答を入力する。この場合、ユーザ端末20は、音声で入力された肯定の回答を受け付け、その回答を示す回答データをサーバ装置10に送信する。
【0054】
また、ユーザは、要確認事項D11で表示された呼び方を変えたい場合は、修正ボタンB22を押す操作を行う。ユーザ端末20は、修正ボタンB22が操作されると、要確認事項D11を修正するための入力欄を表示する。なお、修正ボタンB22への操作の代わりに、対話相手画像F11をタップする操作又は画面のどこかをタップする操作等が、修正の操作として用いられてもよい。
【0055】
図9は、修正入力欄の一例を示す図である。図9の例では、ユーザ端末20は、名前の修正入力欄E23と、名前の入力用のソフトウェアキーボードB23と、確定ボタンB24とを表示している。ユーザは、ソフトウェアキーボードB23を操作して自分が対話AIに呼んでもらいたい名前を入力し、修正入力欄E23にその名前を入力すると、確定ボタンB24を押す操作を行って回答を確定させる。ユーザ端末20は、こうして入力された名前を要確認事項へのユーザによる回答として受け付けると、要確認事項が修正されたことを示す回答データをサーバ装置10に送信する。
【0056】
なお、ユーザ端末20は、例えば、「いやいや、トムじゃなくてトミーだよ。」等の音声による入力操作を、ユーザが修正したい名前の入力操作として受け付けてもよい。その場合は、修正入力欄E23等の表示はなくてもよい。ただし、音声による入力は失敗する場合があるので、ユーザ端末20は、音声による入力が所定の回数失敗した場合は、それ以降は音声での入力を受け付けず、修正入力欄E23等を表示してそちらへの入力操作のみを受け付けるようにしてもよい。
【0057】
サーバ装置10は、ユーザ端末20から回答データが送信されてくると、A34において、その回答データを取得する。次に、サーバ装置10は、A35において、取得した回答データが示す回答を反映した返答を生成する。サーバ装置10は、回答データが要確認事項の肯定を示す場合、ユーザの意図又は心情を正しく捉えていることが分かったので、要確認事項が肯定的な回答であったことを反映した返答を生成する。サーバ装置10は、生成した返答をユーザ端末20に送信し、ユーザ端末20は、A36において、送信されてきた返答を出力する。
【0058】
図10は、出力された返答の一例を示す図である。図10の例では、ユーザ端末20は、「では、あなたのことをトムと呼びますね!」という発言を示す音声V14を発している。音声V14は、「トム」という要確認事項D11の呼び方を使用して良いという回答を反映した返答を示している。サーバ装置10は、回答データが要確認事項の修正を示す場合、要確認事項がユーザの意図又は心情とは異なっていたことが分かったので、修正された要確認事項を反映した返答を生成する。
【0059】
図11は、出力された返答の別の一例を示す図である。図11の例では、ユーザ端末20は、「分かりました。では、これからはあなたのことをトミーさんと呼びますね!」という発言を示す音声V15を発している。音声V15は、「トム」という要確認事項D11ではなく、図9の入力欄に入力された「トミー」という呼び方を使用してほしいというユーザの意図を示す回答を反映した返答を示している。A36の後は、A21に戻ってユーザの発言の入力が再び行われる。
【0060】
図8等では、「呼び方」が要確認事項である場合について説明した。次に、「タスク内容」及び「タスク期限」が要確認事項である場合について説明する。サーバ装置10は、A23において、例えば、ユーザの音声に「~して」、「~までに」又は「~を頼む」等の語句が含まれる場合、A22で取得されたユーザ発言データが、「タスク指示」という文脈を示す特徴を有すると判断する。
【0061】
次に、サーバ装置10は、ユーザの発言に例えば「予約」という語句が含まれている場合、A22で取得されたユーザ発言データが、「予約」という語句の特徴を有すると判断する。また、サーバ装置10は、ユーザの発言に「日付」を示す語句が含まれている場合、A22で取得されたユーザ発言データが、「日付」を示す語句の特徴を有すると判断する。
【0062】
そして、サーバ装置10は、「タスク指示」という文脈と「予約」という語句とに確認テーブルTB1において対応付けられている「タスク内容」という要確認事項があると判定する。また、サーバ装置10は、「タスク指示」という文脈と「日付」とに確認テーブルTB1において対応付けられている「タスク期限」という要確認事項があると判定する。この後は、A31及びA32の処理が実行され、要確認事項を確認するための確認情報が出力される。
【0063】
図12は、出力された確認情報の別の一例を示す図である。図12の例は、「11月15日にADCホテルの予約をしておいて。」という音声V31がユーザによって発せられ、サーバ装置10が誤って「ADCホテル」を「ABCホテル」と認識した場合に出力される確認情報が示されている。この場合、ユーザ端末20は、「タスク内容」として、予約対象として認識した「ABCホテル」という要確認事項D31と、「タスク期限」として、予約すべき日付である「11月15日」という要確認事項D32と、修正ボタンB32とをユーザ端末20に表示している。
【0064】
また、ユーザ端末20は、「この予約で間違いないですか?」という発言を示す音声V32を発している。ユーザは、表示された要確認事項D31(ABCホテル)が自分の指示(ADCホテル)と異なっているので、修正したい要確認事項D31を選択した状態(図13では要確認事項D31に下線を示すことで選択されたことが示されている)で修正ボタンB32を操作して、要確認事項を修正するための入力欄を表示させる。
【0065】
図13は、修正入力欄の別の一例を示す図である。図13の例では、ユーザ端末20は、予約の入力欄E33と、名前の入力用のソフトウェアキーボードB33と、確定ボタンB34とを表示している。ユーザ端末20は、入力された予約修正を要確認事項へのユーザによる回答として受け付けると、要確認事項が修正されたことを示す回答データをサーバ装置10に送信する。サーバ装置10は、回答データが要確認事項の修正を示すので、修正された要確認事項を反映した返答を生成してユーザ端末20に出力する。
【0066】
図14は、出力された返答の別の一例を示す図である。図14の例では、ユーザ端末20は、「失礼しました。ABCホテルではなくADCホテルだったのですね。ではそちらで予約を取ります。」という発言を示す音声V33を発している。音声V33は、予約対象が「ABCホテル」であるという要確認事項D31がユーザの意図とは違っていたので、図13の入力欄に入力された「ADCホテル」を予約対象とするというユーザの意図を正しく示す回答を反映した返答を示している。
【0067】
続いて、要確認事項の種類が「ユーザの心情」である場合について説明する。サーバ装置10は、例えば、「疲労」及び「ストレス」については、図8等で述べた判定と同様に、文脈及び発言に含まれる語句をユーザ発言データの特徴として要確認事項の判定を行う。また、サーバ装置10は、「感情(喜怒哀楽)」及び「活発度」等については、音声の特徴量をユーザ発言データの特徴として要確認事項を判定する。
【0068】
サーバ装置10は、A23において、取得されたユーザ発言データが示すユーザの音声の音高、周波数成分及び音量等の特徴量から、周知技術を利用して、ユーザの感情及び活発度を要確認事項として判定する。ユーザの感情とは、例えば、喜怒哀楽であるが、これに限らず、ポジティブ、ネガティブ、満足、不満、平常、冷静、驚き又は恐怖等の感情が含まれていてもよい。
【0069】
サーバ装置10は、A23で要確認事項を判定すると、A31において、判定された要確認事項を確認するための確認情報を生成し、生成した確認情報をユーザ端末20に送信する。ユーザ端末20は、A32において、送信されてきた確認情報を出力する。
【0070】
図15は、出力された確認情報の一例を示す図である。図15の例では、ユーザが発した「おはよう!」という音声V41のユーザ発言データに基づいて「楽しい」という感情が判定され、ユーザ端末20が、「楽しい気分」という要確認事項D41を表示し、「おはようございます。何か楽しいことがありましたか?」という返答を示す音声V42を発している。要確認事項D41は、確認情報が示すテキストであり、音声V42は、確認情報が示す音声である。
【0071】
ユーザ端末20は、要確認事項D41とともに、修正ボタンB42を表示している。ユーザは、要確認事項D41で表示された感情が自分の感情と違っていると思った場合は、修正ボタンB42を押す操作を行う。ユーザ端末20は、修正ボタンB42が操作されると、要確認事項D41を修正するための操作画像を表示する。
【0072】
図16は、修正用の操作画像の一例を示す図である。図16の例では、ユーザ端末20は、心情の選択枝を示す複数の選択ボタンB43と、確定ボタンB44とを表示している。選択ボタンB43には、「喜び」、「怒り」、「哀しい」、「楽しい」、「元気がある」及び「元気がない」という文字列がそれぞれ表されている。ユーザは、選択ボタンB43から自分の心情に合ったものを操作し、確定ボタンB44を押す操作を行って回答を確定させる。なお、これらの選択ボタンB43は一例であり、他の心情を示す選択ボタンが表示されてもよい。また、図9に示すようなソフトウェアキーボードを表示させ、心情を示すテキストを入力させてもよい。
【0073】
ユーザ端末20は、要確認事項が修正されたことを示す回答データをサーバ装置10に送信する。サーバ装置10は、A35において、取得した回答データが示す回答を反映した返答を生成し、生成した返答をユーザ端末20に送信する。ユーザ端末20は、A36において、送信されてきた返答を出力する。
【0074】
図17は、出力された返答の一例を示す図である。図17の例では、図16の画面で「元気がある」という選択ボタンB43が操作されたものとする。この場合、ユーザ端末20は、「確かに元気そうですね。その調子でお仕事頑張りましょう。」という発言を示す音声V43を発している。音声V43は、「楽しい気分」という要確認事項D41ではなく、「元気がある」という活発度に合った対話をしてほしいというユーザの心情を示す回答を反映した返答を示している。
【0075】
以上が要確認事項の2つ目の判定方法(確認テーブルを用いる方法)の説明である。ここで、上述した1つ目の判定方法、すなわち、AIモジュール3を用いた要確認事項の判定方法について補足する。1つ目の判定方法では、ユーザ発言データをAIモジュール3に入力すると、AIモジュール3が学習モデルに基づいて要確認事項を判定結果として出力する。この学習モデルは、例えば、対話相手が自分の意図や心情と異なる返答をしたことが分かる一般的な対話を含む大規模データセットを用いた学習をしている。このデータセットは、一般的に行われている対話から収集された発言を示すデータ、すなわち、図7で述べたものと同様の一般発言データを含む。
【0076】
そのような対話の例としては、例えば、自己紹介の際に自分の呼び方や個人情報(職業、年代又は出身地等)の言い方について注文をつけた対話、タスクを依頼した際にタスク内容やタスク期限を修正した対話、又は、対話相手の返答が自分の心情と異なることを指摘した対話等であり、確認テーブルTB1において想定されている場面での対話である。このような対話を多く含むデータセットで学習するほど、AIモジュール3による要確認事項の判定精度が向上する。
【0077】
また、サーバ装置10は、A34で一度回答を取得すると、その後の対話においては、要確認事項が判定されない発言に対する返答であっても、その回答を反映させた返答を生成する。例えば、図11の例では「トミー」と呼ぶように回答されているので、サーバ装置10は、その後の対話でユーザに呼びかける場合は、A25及びA35のいずれにおいても、「トミーさん、~」というように回答を反映した返答を生成する。
【0078】
以上の通り、サーバ装置10は、例えば、図4に示すA22において、対話におけるユーザの発言を示すユーザ発言データを取得する取得ステップを実行する。また、サーバ装置10は、図4に示すA23において、取得ステップにおいて取得されたユーザ発言データが示す発言がされた対話における要確認事項を判定する判定ステップを実行する。この判定は、対話における発言を示す一般発言データの特徴とその対話において確認すべき要確認事項との関係を示す関係情報に基づいて行われる。図7に示す確認テーブルTB1及びAIモジュール3が有する学習モデルは、いずれも関係情報の一例である。
【0079】
また、サーバ装置10は、図4に示すA32において、判定ステップにおいて判定された要確認事項をユーザに提示する提示ステップを実行する。図8図12図15に示す要確認事項D11、D31、D32及びD41は、それぞれがユーザに提示された要確認事項の一例である。なお、図8等の例では、サーバ装置10は、要確認事項を表示させることでユーザに要確認事項を提示したが、これに限らず、要確認事項を音声で出力することでユーザに提示してもよい。
【0080】
また、サーバ装置10は、A25において、取得ステップにおいて取得されたユーザ発言データが示す発言の内容に基づいて、ユーザへの返答を出力する返答ステップを実行する。図10に示す音声V14は、返答ステップで出力された返答の一例である。サーバ装置10は、提示ステップにおいて提示された要確認事項への回答があった場合は、A35において、その回答の内容を反映した返答を出力するステップを返答ステップとして実行する。図11図14図17に示す音声V15、V33、V43は、回答の内容を反映した返答の一例である。
【0081】
このような態様によれば、要確認事項を含む対話がされた場合、その要確認事項についてユーザに確認がされ、その回答を反映した返答がされるので、要確認事項について確認がされない場合に比べて、対話における違和感を低減することができる。
【0082】
サーバ装置10は、判定ステップにおいて、例えば、取得ステップにおいて取得されたユーザ発言データが示す発言に特定の種類の語句が含まれている場合、その語句を対話で用いることが正しいか否かを要確認事項として判定する。そして、サーバ装置10は、提示ステップにおいて、その語句を要確認事項としてユーザに提示する。例えば、図6及び図8の例では、「人名」という特定の種類の語句が発言に含まれている場合に、その人名(「トム」)が要確認事項としてユーザに提示されている。このような態様によれば、ユーザが対話で使いたい語句を正しく使うことができる。
【0083】
また、サーバ装置10は、判定ステップにおいて、取得ステップにおいて取得されたユーザ発言データが示す発言の内容に特定のタスクが含まれている場合、そのタスクを実行することが正しいか否かを要確認事項として判定する。そして、サーバ装置10は、提示ステップにおいて、そのタスクの内容を要確認事項としてユーザに提示する。
【0084】
例えば、図12の例では、ホテルの予約という特定のタスクが発言に含まれている場合に、そのタスク内容及びタスク期限が要確認事項としてユーザに提示されている。このような態様によれば、タスクを進める前にその内容がユーザに確認されるので、要確認事項がユーザに提示されない場合に比べて、誤った内容でタスクが進むことを抑制することができる。
【0085】
また、サーバ装置10は、判定ステップにおいて、取得ステップにおいて取得されたユーザ発言データからユーザの心情が特定される場合、特定された心情に合った対話を行うことが正しいか否かを要確認事項として判定する。そして、サーバ装置10は、提示ステップにおいて、その心情の内容を要確認事項としてユーザに提示する。例えば、図15の例では、音声の特徴量から「楽しい」という感情が特定される場合に、その感情が要確認事項としてユーザに提示されている。このような態様によれば、ユーザの心情に合った対話を続けることができる。
【0086】
<変形例:判定への回答の反映>
サーバ装置10は、判定ステップにおいて、提示ステップにおいて提示した要確認事項への回答を、以降の要確認事項の判定に反映させてもよい。サーバ装置10は、実施形態では、例えば、周知技術を用いてユーザ発言データが示すユーザの音声の音高、周波数成分及び音量等の特徴量から、ユーザの感情及び活発度を要確認事項として判定した。
【0087】
サーバ装置10は、例えば、或る特徴量の場合に「楽しい」という要確認事項を判定したとする。これは、その特徴量が一般的には「楽しい」ときに出る声の特徴を表していたためである。しかし、その要確認事項への回答が「哀しい」であった場合、そのユーザの場合は、その特徴量が「楽しい」ではなく「哀しい」ときに出る声の特徴を表すことになる。そのため、サーバ装置10は、そのユーザについて同じ特徴量の音声を示すユーザ発言データが取得された場合、「楽しい」ではなく「哀しい」という要確認事項を判定する。
【0088】
また、サーバ装置10は、例えば、文脈が「仕事関係」で「多忙」を示す語句が含まれていたため「疲労」を要確認事項として判定したが、その要確認事項への回答が、「ストレス」という心情を示す回答であったとする。その場合、サーバ装置10は、そのユーザについては、確認テーブルTB1を、「仕事関係」という文脈と「多忙」という語句に対して「ストレス」という要確認事項を対応付けるように編集する。
【0089】
この場合、サーバ装置10は、そのユーザについて同じ文脈で同じ語句を含む発言を示すユーザ発言データが取得された場合、「疲労」ではなく「ストレス」という要確認事項を判定する。なお、AIモジュール3を用いた判定を行う場合は、要確認事項に対する回答をAIモジュール3の学習モデルの教師データに加えて学習させることで、要確認事項への回答を、以降の要確認事項の判定に反映することができる。このような態様によれば、これらの回答の反映を行わない場合に比べて、要確認事項の判定の精度を高めることができる。
【0090】
<変形例:要確認事項の不提示>
サーバ装置10は、提示ステップにおいて、判定ステップにおいて判定した要確認事項と同一の判定結果が過去に所定回数以上ある場合は、その判定結果については要確認事項を提示しないようにしてもよい。所定の回数は、例えば1回であるが、2回以上であってもよい。所定の回数が少ないほど、同じ要確認事項がユーザに提示される回数が少なくなる。
【0091】
サーバ装置10は、A24において要確認事項があるという判定であった(YES)と判断した場合に、その要確認事項と同じ要確認事項が判定された回数をユーザに対応付けて記憶しておく。そして、サーバ装置10は、次のA24において要確認事項があるという判定であった(YES)と判断した場合、その要確認事項が判定された回数を読み出し、今回の判定と合わせた回数が所定の回数以上である場合は、A31ではなく、A25に進んで返答を生成する、つまり、要確認事項を提示しないで返答だけを行う。このような態様によれば、何度も同じ要確認事項について確認しないようにすることができる。
【0092】
<変形例:提示態様の変化>
サーバ装置10は、タスク指示に関する要確認事項が判定された場合、提示ステップにおいて、タスク実行までの期間の長さに応じて、提示する要確認事項の態様を変化させてもよい。サーバ装置10は、例えば、タスク実行までの期間と要確認事項の提示態様とを対応付けた態様テーブルを用いる。
【0093】
図18は、態様テーブルの一例を示す図である。図18の例では、「Th1未満」、「Th1以上Th2未満」及び「Th2以上」というタスク実行までの期間と、「赤字+強調枠」、「青字+通常枠」及び「黒字+枠なし」という提示態様とが対応付けられた態様テーブルTB2が示されている。サーバ装置10は、A23においてタスクの「タスク期限」が要確認事項として判定された場合、A31において、タスク期限までの期間をタスク実行までの期間として算出する。
【0094】
サーバ装置10は、算出した期間に態様テーブルTB2において対応付けられている提示態様で要確認事項を表す情報を確認情報として生成する。サーバ装置10は、例えば、タスク実行までの期間が「Th2以上」である場合は、図8等に示す例と同様に単に黒字で要確認事項を提示するが、タスク実行までの期間が「Th1以上Th2未満」である場合は、要確認事項を示す文字を青字にして枠で囲んだ画像を提示し、タスク実行までの期間が「Th1未満」である場合は、要確認事項を示す文字を赤字にして強調された枠で囲んだ画像を提示する。
【0095】
このような態様によれば、提示された要確認事項が強調された態様であるほどタスク実行までの期間が短いことを表すようになるので、要確認事項を提示したユーザに、タスク実行までの期間の長さを直感的に把握させることができる。なお、図18に示す態様は一例であり、これに限らない。例えば、要確認事項が音声でユーザに提示される場合、タスク実行までの期間が短いほど音量を大きくする態様としてもよい。要するに、タスク実行までの期間の長短と要確認事項の提示態様との対応付けをユーザが分かるようになっていれば、どのような態様が用いられてもよい。
【0096】
<構成のバリエーション>
図1等に示す構成(全体構成、ハードウェア構成及び機能構成等)は一例であり、実施に不都合が無い限り、他の構成を取り得る。例えば、サーバ装置10は、2台以上の装置に分散されてもよく、また、SaaS(Software as a Service)又はクラウドコンピューティングシステム等の形態で提供されてもよい。また、サーバ装置10が実行する情報処理を、ユーザ端末20がまとめて実行してもよい。要するに、自動対話システム1の全体で必要な情報処理が実行されていれば、それらの情報処理を実行する装置はどのような構成であってもよい。
【0097】
また、人工知能モジュール(AIモジュール3)は、サーバ装置10の内部構成でも外部構成でもよいし、自動対話システム1の内部構成でも外部構成でもよい。また、1つの人工知能モジュールが実現する機能を、2以上の人工知能モジュールが分散して実現してもよいし、2以上の人工知能モジュールが実現する機能を、1つの人工知能モジュールが統合して実現してもよい。
【0098】
情報又はデータ(以下「情報等」と言う)の出力先は、他の装置、ディスプレイ、記憶部(内蔵の記憶部および外部の記憶部を含む)等であってもよい。情報等の取得には、他の装置から送信されてきた情報等を取得する態様に加え、自装置で生成された情報等を取得する態様を含む。パラメータを対応付けたテーブル等(テーブル又はデータベース等)は、図示したテーブル等に限らず、パラメータの数を少なくしたり多くしたりしてもよい。また、テーブル等を用いずに、数式または条件式等によりパラメータに応じた情報等を求めてもよい。
【0099】
上述した実施形態の態様は、サーバ装置10及びユーザ端末20のような情報処理装置や、サーバ装置10及びユーザ端末20を備える自動対話システム1のような情報処理システムであったが、情報処理方法であってもよい。その情報処理方法は、情報処理システムが実行するものと同じ各ステップを備える。また、上述した実施形態の態様は、プログラムであってもよい。そのプログラムは、コンピュータに、情報処理システムが実行するものと同じ各ステップを実行させる。
【0100】
<付記>
さらに、次に記載の各態様で提供されてもよい。
【0101】
(1)プロセッサを備える情報処理システムであって、前記プロセッサが、取得ステップでは、対話におけるユーザの発言を示すユーザ発言データを取得し、判定ステップでは、一般的な対話における発言を示す一般発言データの特徴と当該対話において確認すべき要確認事項との関係を示す関係情報に基づいて、取得された前記ユーザ発言データが示す発言がされた対話における前記要確認事項を判定し、提示ステップでは、判定された前記要確認事項を前記ユーザに提示し、返答ステップでは、取得された前記ユーザ発言データが示す発言の内容に基づいて、前記ユーザへの返答を出力し、提示された前記要確認事項への回答があった場合は、当該回答の内容を反映した返答を出力する、情報処理システム。
【0102】
このような態様によれば、対話における違和感を低減することができる。
【0103】
(2)上記(1)に記載の情報処理システムにおいて、前記プロセッサが、前記判定ステップでは、取得された前記ユーザ発言データが示す発言に特定の種類の語句が含まれている場合、当該語句を前記対話で用いることが正しいか否かを前記要確認事項として判定し、前記提示ステップでは、前記語句を前記要確認事項として前記ユーザに提示する、情報処理システム。
【0104】
このような態様によれば、ユーザが対話で使いたい語句を正しく使うことができる。
【0105】
(3)上記(1)又は(2)に記載の情報処理システムにおいて、前記プロセッサが、前記判定ステップでは、取得された前記ユーザ発言データが示す発言の内容に特定のタスクが含まれている場合、当該タスクを実行することが正しいか否かを前記要確認事項として判定し、前記提示ステップでは、前記タスクの内容を前記要確認事項として前記ユーザに提示する、情報処理システム。
【0106】
このような態様によれば、誤った内容でタスクが進むことを抑制することができる。
【0107】
(4)上記(3)に記載の情報処理システムにおいて、前記プロセッサが、前記提示ステップでは、前記タスクの実行までの期間の長さに応じて、提示する前記要確認事項の態様を変化させる、情報処理システム。
【0108】
このような態様によれば、タスク実行までの期間の長さを直感的に把握させることができる。
【0109】
(5)上記(1)~(4)の何れか1つに記載の情報処理システムにおいて、前記プロセッサが、前記判定ステップでは、取得された前記ユーザ発言データから前記ユーザの心情が特定される場合、特定された心情に合った対話を行うことが正しいか否かを前記要確認事項として判定し、前記提示ステップでは、前記心情の内容を前記要確認事項として前記ユーザに提示する、情報処理システム。
【0110】
このような態様によれば、ユーザの心情に合った対話を続けることができる。
【0111】
(6)上記(1)~(5)の何れか1つに記載の情報処理システムにおいて、前記プロセッサが、前記判定ステップでは、提示した前記要確認事項への回答を、以降の前記要確認事項の判定に反映させる、情報処理システム。
【0112】
このような態様によれば、要確認事項の判定の精度を高めることができる。
【0113】
(7)上記(1)~(6)の何れか1つに記載の情報処理システムにおいて、前記プロセッサが、前記提示ステップでは、判定した前記要確認事項と同一の判定結果が過去に所定回数以上ある場合は、当該判定結果については前記要確認事項を提示しない、情報処理システム。
【0114】
このような態様によれば、何度も同じ意図又は心情について確認しないようにすることができる。
【0115】
(8)情報処理方法であって、上記(1)~(7)の何れか1つに記載の情報処理システムの各ステップを備える、情報処理方法。
【0116】
このような態様によれば、対話における違和感を低減することができる。
【0117】
(9)プログラムであって、コンピュータに、上記(1)~(7)の何れか1つに記載の情報処理システムの各ステップを実行させるプログラム。
【0118】
このような態様によれば、対話における違和感を低減することができる。
もちろん、この限りではない。
また、上述した実施形態及び変形例を任意に組み合わせて実施するようにしてもよい。
【0119】
最後に、本発明に係る種々の実施形態を説明したが、これらは、例として提示したものであり、発明の範囲を限定することは意図していない。新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。実施形態やその変形は、発明の範囲や要旨に含まれると共に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
【符号の説明】
【0120】
1 :自動対話システム
2 :通信回線
3 :AIモジュール
10 :サーバ装置
11 :制御部
20 :ユーザ端末
21 :制御部
【要約】
【課題】対話における違和感を低減することができる情報処理システム等を提供する。
【解決手段】本発明の一態様によれば、プロセッサを備える情報処理システムが提供される。この情報処理システムでは、プロセッサが、取得ステップでは、対話におけるユーザの発言を示すユーザ発言データを取得する。判定ステップでは、一般的な対話における発言を示す一般発言データの特徴と当該対話において確認すべき要確認事項との関係を示す関係情報に基づいて、取得されたユーザ発言データが示す発言がされた対話における要確認事項を判定する。提示ステップでは、判定された要確認事項をユーザに提示する。返答ステップでは、取得されたユーザ発言データが示す発言の内容に基づいて、ユーザへの返答を出力する。提示された要確認事項への回答があった場合は、当該回答の内容を反映した返答を出力する。
【選択図】図1
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18