特開2023-129020 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

特開2023-129020端末装置、情報処理方法、および情報処理プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023129020

(43)【公開日】2023-09-14

(54)【発明の名称】端末装置、情報処理方法、および情報処理プログラム

(51)【国際特許分類】

G10L 15/10 20060101AFI20230907BHJP

G10L 15/22 20060101ALI20230907BHJP

G06F 3/16 20060101ALI20230907BHJP

G06F 3/01 20060101ALI20230907BHJP

G10L 15/00 20130101ALI20230907BHJP

G10L 15/16 20060101ALI20230907BHJP

G06F 40/232 20200101ALI20230907BHJP

G06F 40/216 20200101ALI20230907BHJP

【ＦＩ】

G10L15/10 500T

G10L15/22 453

G10L15/22 460Z

G06F3/16 650

G06F3/16 620

G06F3/01 510

G10L15/22 300Z

G10L15/00 200T

G10L15/16

G06F40/232

G06F40/216

【審査請求】未請求

【請求項の数】11

【出願形態】ＯＬ

(21)【出願番号】P 2022033758

(22)【出願日】2022-03-04

(71)【出願人】

【識別番号】319013263

【氏名又は名称】ヤフー株式会社

(74)【代理人】

【識別番号】110002147

【氏名又は名称】弁理士法人酒井国際特許事務所

(72)【発明者】

【氏名】三宅純平

(72)【発明者】

【氏名】西磨翁

(72)【発明者】

【氏名】友成愛

(72)【発明者】

【氏名】大島みゆき

【テーマコード（参考）】

5B091

5E555

【Ｆターム（参考）】

5B091AA11

5B091AA13

5B091CA21

5B091EA01

5E555AA46

5E555BA02

5E555BB02

5E555BC04

5E555CA47

5E555CB64

5E555DB41

5E555DC13

5E555DD08

5E555EA19

5E555EA20

5E555EA23

5E555FA00

(57)【要約】（修正有）

【課題】受け付けた発話に続く利用者Ｕの発話内容を推定し、推定した発話内容を含む発話内容を利用者Ｕに提供することで、利用者の利便性の向上を図ることが可能な端末装置、情報処理方法及び情報処理プログラムを提供する。
【解決手段】情報処理システム１００において、端末装置１は、受付部と、推定部と、提供部と、を備える。受付部は、利用者の発話を受け付ける。推定部は、受付部によって受け付けられた発話に続く利用者の発話内容を推定する。提供部は、推定部によって推定された発話内容を含む発話内容を利用者に提供する。
【選択図】図２

【特許請求の範囲】

【請求項1】

利用者の発話を受け付ける受付部と、
前記受付部によって受け付けられた前記発話に続く前記利用者の発話内容を推定する推定部と、
前記推定部によって推定された前記発話内容を含む発話内容を前記利用者に提供する提供部と、を備える
ことを特徴とする端末装置。

【請求項2】

前記推定部は、
前記受付部によって受け付けられた前記発話に対応する音声情報またはテキスト情報を入力とし、前記発話に続く前記利用者の発話内容の推定結果を出力とする学習済みモデルを有し、前記学習済みモデルを用いて前記発話に続く前記利用者の発話内容を推定する
ことを特徴とする請求項１に記載の端末装置。

【請求項3】

前記推定部は、
前記発話に続く前記利用者の発話内容として複数の発話内容候補を推定し、
前記提供部は、
前記推定部によって推定された前記複数の発話内容候補を含む発話内容を前記利用者に提供する
ことを特徴とする請求項２に記載の端末装置。

【請求項4】

前記提供部は、
前記複数の発話内容候補を表示部に表示させる
ことを特徴とする請求項３に記載の端末装置。

【請求項5】

前記提供部は、
前記複数の発話内容候補のうち前記利用者に選択された発話内容候補の情報を含むコンテンツ要求を外部サーバに送信し、前記コンテンツ要求に応じて前記外部サーバから送信されるコンテンツを前記利用者に提供する
ことを特徴とする請求項３または４に記載の端末装置。

【請求項6】

前記利用者による前記発話内容候補の選択履歴に基づいて、前記学習済みモデルを更新する学習部を備える
ことを特徴とする請求項５に記載の端末装置。

【請求項7】

前記学習済みモデルは、
前記受付部によって受け付けられた前記発話に対応する前記音声情報または前記テキスト情報を入力とし、各発話内容候補の推定スコアを出力とするモデルを含み、
前記推定部は、
前記推定スコアに基づいて、前記発話に続く前記利用者の発話内容として前記複数の発話内容候補を推定する
ことを特徴とする請求項３～６のいずれか１つに記載の端末装置。

【請求項8】

前記利用者の発話全体の音声情報を先頭から互いに異なる位置までで区切った分割音声情報または前記分割音声情報に対応する分割テキスト情報と前記利用者の発話全体のテキスト情報とを含む学習用データを用いて前記学習済みモデルを生成する学習部を備える
ことを特徴とする請求項２～５のいずれか１つに記載の端末装置。

【請求項9】

前記受付部は、
受け付けた前記発話に対応する前記音声情報をテキスト情報に変換し、
前記推定部は、
前記受付部によって変換された前記テキスト情報を前記学習済みモデルに入力することによって、前記発話に続く前記利用者の発話内容を推定する
ことを特徴とする請求項２～８のいずれか１つに記載の端末装置。

【請求項10】

端末装置が実行する情報処理方法であって、
利用者の発話を受け付ける受付工程と、
前記受付工程によって受け付けられた前記発話に続く前記利用者の発話内容を推定する推定工程と、
前記推定工程によって推定された前記発話内容を含む発話内容を前記利用者に提供する提供工程と、を含む
ことを特徴とする情報処理方法。

【請求項11】

利用者の発話を受け付ける受付手順と、
前記受付手順によって受け付けられた前記発話に続く前記利用者の発話内容を推定する推定手順と、
前記推定手順によって推定された前記発話内容を含む発話内容を前記利用者に提供する提供手順と、を端末装置に実行させる
ことを特徴とする情報処理プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、端末装置、情報処理方法、および情報処理プログラムに関する。

【背景技術】

【0002】

従来、利用者の発話を受け付け、外部サーバから所望の情報を検索したり、宅内の機器を制御したりする技術が知られている。例えば、特許文献１には、端末装置である音声対話装置と外部サーバである音声対話サーバとを含むシステムが開示されている。

【0003】

特許文献１に記載の技術では、利用者の発話が音声対話装置の音声認識によりテキスト化され、テキスト化された文字列が音声対話サーバに送信される。また、音声対話装置は、利用者の発話内容を形態素解析して得られた形態素に基づいて先行応答文を作成し、作成した先行応答文を音声合成して音声として出力する。

【0004】

音声対話サーバは、音声対話装置から受信した文字列の意図を理解して、サービス提供サーバから後続応答文の生成に必要な情報を取得し、取得した情報に基づいて後続応答文を作成し音声対話装置へ送信する。音声対話装置は、音声対話サーバから提供される後続応答文を音声合成により読み上げる。これにより、音声対話装置は、利用者の質問に対して回答することができる。

【先行技術文献】

【特許文献】

【0005】

【特許文献1】特開２０１７－１０７０７８号公報

【発明の概要】

【発明が解決しようとする課題】

【0006】

しかしながら、上記従来技術の音声対話装置では、利用者の発話内容に基づいて先行応答文を作成し、作成した先行応答文を音声合成して音声として出力することができるものの、利用者の利便性の向上を図る点で改善の余地がある。

【0007】

本願は、上記に鑑みてなされたものであって、利用者の利便性の向上を図ることができる端末装置、情報処理方法、および情報処理プログラムを提供することを目的とする。

【課題を解決するための手段】

【0008】

本願に係る端末装置は、受付部と、推定部と、提供部とを備える。受付部は、利用者の発話を受け付ける。推定部は、受付部によって受け付けられた発話に続く利用者の発話内容を推定する。提供部は、推定部によって推定された発話内容を含む発話内容を利用者に提供する。

【発明の効果】

【0009】

実施形態の一態様によれば、利用者の利便性の向上を図ることができるという効果を奏する。

【図面の簡単な説明】

【0010】

【図1】図１は、実施形態に係る情報処理の一例を示す図である。

【図2】図２は、実施形態に係る端末装置の構成の一例を示す図である。

【図3】図３は、実施形態に係る端末装置によって利用者に提供される複数の発話内容候補の一例を示す図である。

【図4】図４は、実施形態に係る端末装置によって利用者に提供される複数の発話内容候補の他の例を示す図である。

【図5】図５は、実施形態に係る端末装置の処理部による情報処理の一例を示すフローチャートである。

【図6】図６は、実施形態に係る端末装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。

【発明を実施するための形態】

【0011】

以下に、本願に係る端末装置、情報処理方法、および情報処理プログラムを実施するための形態（以下、「実施形態」と呼ぶ）について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る端末装置、情報処理方法、および情報処理プログラムが限定されるものではない。また、各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。

【0012】

〔１．情報処理の一例〕
図１は、実施形態に係る情報処理の一例を示す図であり、本実施形態においては端末装置１により情報処理方法が実行される。

【0013】

図１に示す端末装置１は、例えば、対話型の音声操作に対応するＡＩ（人工知能：Artificial Intelligence）アシスタント機能を利用可能な端末装置であり、利用者Ｕは、端末装置１と対話することで周辺の機器を制御したり、様々な情報を取得したりすることができる。周辺の機器は、例えば、照明機器、冷蔵庫、洗濯機、エアーコンディショナー、テレビジョン受像機、食器洗浄機、食器乾燥機、電磁調理器、または電子レンジといった種々の機器である。

【0014】

また、利用者Ｕは、様々な情報を取得するための発話を端末装置１に対して行うと、端末装置１は、利用者Ｕからの指示を示す入力情報を情報提供装置２へ送信する。端末装置１は、入力情報に応じた情報提供装置２からネットワークＮ（図２参照）を介して提供されるコンテンツ（例えば、ニュース、交通情報、天候、および音楽などの各種情報）を取得し、取得したコンテンツを表示部に表示したりスピーカから出力したりすることができる。

【0015】

利用者Ｕは、例えば、必要な情報が知りたい場合、知りたい情報を取得するための発話を行う（ステップＳ１）。端末装置１は、利用者Ｕからの発話を受け付ける（ステップＳ２）。

【0016】

そして、端末装置１は、利用者Ｕの発話を受け付けると、受け付けた発話に続く利用者Ｕの発話内容を推定する（ステップＳ３）。例えば、利用者Ｕの発話内容が「赤坂から新宿までの」である場合、「赤坂から新宿までの」に続く発話内容候補として、「移動時間」、「終電」、および「１０分後出発」などを推定する。

【0017】

端末装置１は、例えば、受け付けた利用者Ｕの発話に対応する音声情報またはテキスト情報を入力とし、発話に続く利用者Ｕの発話内容の推定結果を出力とする学習済みモデルを有し、学習済みモデルを用いて発話に続く利用者Ｕの発話内容を推定する。受け付けた利用者Ｕの発話に対応するテキスト情報は、端末装置１において、受け付けた利用者Ｕの発話に対応する音声情報を音声認識によりテキスト化することによって行われる。

【0018】

学習済みモデルは、例えば、受け付けた利用者Ｕの発話に対応する音声情報またはテキスト情報を入力とし、各発話内容候補の推定スコアを出力とする。端末装置１は、推定スコアが閾値以上の発話内容候補または推定スコアが高い上位の予め設定された数の発話内容候補を、受け付けた利用者Ｕの発話に続く利用者Ｕの発話内容として推定する。

【0019】

端末装置１は、利用者Ｕの発話全体の音声情報を先頭から互いに異なる位置までで区切った分割音声情報または分割音声情報に対応する分割テキスト情報と利用者Ｕの発話全体のテキスト情報とを含む学習用データを用いて学習済みモデルを生成することができる。

【0020】

分割音声情報または分割テキスト情報は、例えば、「あ」、「あか」、「あかさ」、「あかさか」、「あかさかか」、「あかさかから」、「あかさかからし」、「あかさかからしん」、・・・などといった音声情報またはテキスト情報である。利用者Ｕの発話全体のテキスト情報は、例えば、「赤坂から新宿までの終電」、「赤坂から新宿までの移動時間」、「赤坂から新宿までの１０分後出発」などといったテキスト情報である。なお、利用者Ｕの発話全体のテキスト情報は、端末装置１によって推定されて利用者Ｕによって選択された内容を含んでいてもよい。

【0021】

端末装置１は、受け付けた利用者Ｕの発話に続く発話内容であってステップＳ３で推定した発話内容を含む発話内容を示す情報である推定情報を利用者Ｕに提供する（ステップＳ４）。推定情報の利用者Ｕへの提供は、例えば、端末装置１の表示部に推定情報を表示させたり端末装置１のスピーカから推定情報を音声信号として出力させたりすることによって行われる。

【0022】

推定情報には、端末装置１によって推定された１以上の発話内容候補を示す情報が含まれている。例えば、利用者Ｕの発話内容が「赤坂から新宿までの」である場合、推定情報は、「終電」、「移動時間」、「１０分後出発」などのそれぞれを、発話内容候補を示す情報として含む。

【0023】

推定情報は、利用者Ｕの発話を示す情報と発話内容候補を示す情報とを発話内容候補毎に含んでいてもよい。例えば、利用者Ｕの発話内容が「赤坂から新宿までの」である場合、推定情報は、「赤坂から新宿までの終電」、「赤坂から新宿までの移動時間」、「赤坂から新宿までの１０分後出発」のそれぞれを、発話内容候補を示す情報として含んでいてもよい。

【0024】

端末装置１は、利用者Ｕに提供した１以上の発話内容候補のうち１つの発話内容候補が利用者Ｕによって選択されると（ステップＳ５）、利用者Ｕの発話を示す情報と選択された発話内容候補を示す情報とを含むコンテンツ要求を情報提供装置２に送信する（ステップＳ６）。

【0025】

情報提供装置２は、端末装置１からのコンテンツ要求を受信すると、コンテンツ要求に応じたコンテンツを端末装置１に送信する（ステップＳ７）。例えば、コンテンツ要求に含まれる情報が「赤坂から新宿までの終電」である場合、情報提供装置２は、「２３時４４分発です。」または「赤坂から新宿までの終電は、２３時４４分発です。」の文字列を示す情報を含むコンテンツを端末装置１に送信する。

【0026】

端末装置１は、情報提供装置２からコンテンツを受信すると、受信したコンテンツを利用者Ｕに提供する（ステップＳ８）。コンテンツの利用者Ｕへの提供は、例えば、端末装置１の表示部にコンテンツを表示させたり端末装置１のスピーカからコンテンツを音声信号として出力したりすることによって行われる。

【0027】

このように、実施形態に係る端末装置１は、受け付けた発話に続く利用者Ｕの発話内容を推定し、推定した発話内容を含む発話内容を利用者Ｕに提供する。これにより、端末装置１は、利用者Ｕの利便性の向上を図ることができる。

【0028】

以下、このような処理を行う端末装置１を含む情報処理システムの構成などについて、詳細に説明する。

【0029】

〔２．情報処理システムの構成〕
次に、図２を用いて、実施形態に係る端末装置１を含む情報処理システムの構成について説明する。図２は、実施形態に係る端末装置１の構成の一例を示す図である。図２に示すように、情報処理システム１００は、端末装置１と、情報提供装置２とを含む。端末装置１および情報提供装置２は、ネットワークＮを介して、有線または無線により通信可能に接続される。なお、図２に示す情報処理システム１００には、複数台の端末装置１および複数台の情報提供装置２が含まれてもよい。

【0030】

端末装置１は、例えば、スマートスピーカ、デスクトップ型ＰＣ（Personal Computer）、ノート型ＰＣ、タブレット端末、携帯電話機、またはＰＤＡ（Personal Digital Assistant）などである。なお、端末装置１は、上記例に限定されなくともよく、例えば、スマートウォッチ、またはウェアラブルデバイス（Wearable Device）であってもよい。

【0031】

情報提供装置２は、利用者Ｕにオンラインでサービスを提供する。情報提供装置２によって提供されるサービスは、例えば、検索サービス、情報提供サービス、電子商取引サービス、オークションサービス、音楽配信サービス、動画配信サービスなどのオンラインサービスであるが、かかる例に限定されない。情報提供サービスは、検索サイトによって提供される検索サービス、ニュースサイトで提供されるニュース配信サービス、交通情報サイトで提供される交通情報提供サービス、天候情報サイトで提供される天候情報提供サービスなどの種々のサービスが含まれる。

【0032】

情報提供装置２は、インターネットなどの所定のネットワークＮを介して、各種の装置と通信可能な情報処理装置であり、例えば、サーバ装置またはクラウドシステムなどにより実現される。例えば、情報提供装置２は、ネットワークＮを介して、他の各種装置と通信可能に接続される。

【0033】

〔３．端末装置１〕
図２に示すように、実施形態に係る端末装置１は、通信部１０と、表示部１１と、操作部１２と、記憶部１３と、音声入力部１４と、音声出力部１５と、位置検出部１６と、処理部１７とを備える。

【0034】

〔３．１．通信部１０〕
通信部１０は、例えば、ＮＩＣ（Network Interface Card）などによって実現される。通信部１０は、ネットワークＮと有線または無線で接続され、ネットワークＮを介して、情報提供装置２との間で情報の送受信を行う。

【0035】

〔３．２．表示部１１〕
表示部１１は、例えば、ＬＣＤ（Liquid Crystal Display）または有機ＥＬ（Electro Luminescence）ディスプレイなどである。

【0036】

〔３．３．操作部１２〕
操作部１２は、例えば、文字、数字、およびスペースを入力するためのキー、エンターキーおよび矢印キーなどを含むキーボード、マウス、および電源ボタンなどを含む。表示部１１がタッチパネルディスプレイの表示装置である場合、操作部１２はタッチパネルを含んでいてもよい。

【0037】

〔３．４．記憶部１３〕
記憶部１３は、例えば、ＲＡＭ（Random Access Memory）、フラッシュメモリ（Flash Memory）などの半導体メモリ素子、または、ハードディスク、光ディスクなどの記憶装置によって実現される。

【0038】

記憶部１３には、各種の情報が記憶される。例えば、記憶部１３には、情報提供装置２から送信されネットワークＮおよび通信部１０を介して処理部１７によって取得された情報などが記憶される。また、記憶部１３には、利用者Ｕの発話に対応する音声情報およびテキスト情報なども記憶される。

【0039】

〔３．５．音声入力部１４〕
音声入力部１４は、利用者Ｕが発した音声の信号である音声信号をデジタル信号に変換し、変換したデジタル信号である音声デジタル信号を処理部１７に音声情報として出力する。音声入力部１４は、例えば、マイクロホンと、マイクホンから出力される電気的なアナログ信号である音声信号をデジタル信号に変換するＡＤ（Analog to Digital）変換器とを含む。

【0040】

〔３．６．音声出力部１５〕
音声出力部１５は、例えば、処理部１７から出力される音声情報であるデジタル音声信号をアナログ音声信号に変換するＤＡ（Digital to Analog）変換器と、ＤＡ変換器から出力されるアナログ音声信号を音に変換して出力するスピーカとを備える。

【0041】

〔３．７．位置検出部１６〕
位置検出部１６は、例えば、端末装置１の位置を検出し、検出した端末装置１の位置のデータである位置データを処理部１７に出力する。位置検出部１６は、ＧＮＳＳ（Global Navigation Satellite System）における複数の測位衛星から送信される複数の測位信号を受信し、受信した複数の測位信号に基づいて、端末装置１の位置を検出する。

【0042】

〔３．８．処理部１７〕
処理部１７は、コントローラ（controller）であり、例えば、ＣＰＵ（Central Processing Unit）またはＭＰＵ（Micro Processing Unit）などによって、端末装置１内部の記憶装置に記憶されている各種プログラムがＲＡＭを作業領域として実行されることにより実現される。

【0043】

また、処理部１７は、例えば、ＡＳＩＣ（Application Specific Integrated Circuit）またはＦＰＧＡ（Field Programmable Gate Array）などの集積回路により実現されてもよい。処理部１７は、受付部２０と、推定部２１と、提供部２２と、学習部２３とを備える。

【0044】

〔３．８．１．受付部２０〕
受付部２０は、音声入力部１４から出力される音声デジタル情報に基づいて、利用者Ｕの発話を受け付ける。例えば、受付部２０は、利用者Ｕが操作部１２を用いて特定操作を行った場合に、その後に行われる利用者Ｕの発話を受け付ける。

【0045】

また、受付部２０は、利用者Ｕが特定のキーワードを発話した場合に、その後に行われる利用者Ｕの発話を受け付けることもできる。利用者Ｕが特定のキーワードを発話したか否かは、音声入力部１４から出力される音声情報に対する音声認識によって判定される。

【0046】

受付部２０は、利用者Ｕの発話によって音声入力部１４から出力される音声情報をテキスト情報に変換する音声認識機能を有している。また、受付部２０は、音声認識機能によって変換されたテキスト情報の意味を解析する機能を有していてもよい。

【0047】

受付部２０は、利用者Ｕの発話に対応する音声情報またはテキスト情報を推定部２１に出力する。利用者Ｕの発話に対応する音声情報は、音声入力部１４から出力される音声情報であり、利用者Ｕの発話に対応するテキスト情報は、利用者Ｕの発話に対応する音声情報を音声認識機能によってテキスト化された情報である。受付部２０は、例えば、利用者Ｕの発話に対応する音声情報と利用者Ｕの発話に対応するテキスト情報とを利用者Ｕの発話毎に関連付けて記憶部１３に記憶させる。

【0048】

〔３．８．２．推定部２１〕
推定部２１は、受付部２０によって受け付けられた利用者Ｕの発話（以下、利用者発話と記載する場合がある）に続く利用者Ｕの発話内容（以下、続く発話内容と記載する場合がある）を推定する。

【0049】

例えば、推定部２１は、利用者発話が「赤坂から新宿までの」または「赤坂から新宿まで」である場合、「赤坂から新宿まで」または「赤坂から新宿までの」に続く発話内容候補として、「移動時間」、「終電」、および「１０分後出発」などを推定する。また、推定部２１は、利用者発話が「今日」または「今日の」である場合、「今日の」または「今日」に続く発話内容候補として、「天気」、「スケジュール」、および「ニュース」などを推定する。

【0050】

推定部２１は、例えば、受付部２０によって受け付けられた利用者発話に対応する音声情報またはテキスト情報を入力とし、利用者発話に続く利用者Ｕの発話内容の推定結果を出力とする学習済みモデルを有する。推定部２１は、受付部２０によって受け付けられた利用者発話を学習済みモデルに入力し、学習済みモデルから出力される情報に基づいて、利用者発話に続く利用者Ｕの発話内容を推定する。

【0051】

例えば、学習済みモデルは、受け付けた利用者Ｕの発話に対応する音声情報またはテキスト情報を入力とし、各発話内容候補の推定スコアを出力とする。推定部２１は、推定スコアが閾値以上の発話内容候補または推定スコアが高い上位の予め設定された数の発話内容候補を、利用者発話に続く利用者Ｕの発話内容として推定する。

【0052】

また、学習済みモデルは、受け付けた利用者Ｕの発話に対応する音声情報またはテキスト情報を入力とし、１以上の発話内容候補の情報をテキスト情報として出力するモデルであってもよい。

【0053】

また、推定部２１によって用いられる学習済みモデルは、複数の学習済みモデルのうち時間帯、曜日、季節、および位置に応じて選択された学習済みモデルであってもよい。位置は、位置検出部１６によって検出される位置である。

【0054】

学習済みモデルは、例えば、畳み込みニューラルネットワークまたは回帰型ニューラルネットワークなどのニューラルネットワークによる機械学習によって生成されるが、かかる例に限定されない。例えば、学習済みモデルは、ニューラルネットワークに代えて、線形回帰、重回帰、またはロジスティック回帰といった回帰手法の学習アルゴリズムなどのように他の学習アルゴリズムによる機械学習を用いて生成されてもよい。

【0055】

なお、推定部２１は、学習済みモデルに代えて、利用者発話と複数の発話内容候補とを利用者発話毎に関連付けた発話内容候補テーブルを有する構成であってもよい。この場合、推定部２１は、利用者発話に関連付けられた複数の発話内容候補を発話内容候補テーブルから抽出し、抽出した複数の発話内容候補を利用者発話に続く利用者Ｕの発話内容として推定することができる。

【0056】

また、推定部２１は、予め設定された間隔または利用者発話の内容がＭ語追加される毎に繰り返し利用者発話に続く利用者Ｕの発話内容を推定することで、推定結果を更新する。Ｍは、１以上の整数である。例えば、推定部２１は、利用者発話が「あ」であるタイミング、利用者発話が「あか」となったタイミング、・・・、利用者発話が「あかさかからしんじゅくまでの」になったタイミングの各々で、利用者発話に続く利用者Ｕの発話内容を推定する。

【0057】

〔３．８．３．提供部２２〕
提供部２２は、推定部２１によって推定された続く発話内容を含む発話内容を利用者Ｕに提供する。例えば、提供部２２は、推定部２１によって推定された複数の発話内容候補を含む発話内容を利用者Ｕに提供する。提供部２２は、推定部２１による続く発話内容の推定結果が更新される毎に、推定部２１によって推定された続く発話内容を含む発話内容を利用者Ｕに提供することができる。

【0058】

例えば、推定部２１が利用者発話の内容が１語追加される毎に繰り返し利用者発話に続く利用者Ｕの発話内容を推定するとする。この場合、提供部２２は、例えば、利用者発話「あかさかからしんじ」に対する推定部２１の推定結果を含む情報を利用者Ｕに提供した後、利用者発話「あかさかからしんじゅ」に対する推定部２１の推定結果を含む情報を利用者Ｕに提供する。さらに、提供部２２は、利用者発話「あかさかからしんじゅく」に対する推定部２１の推定結果を含む情報を利用者Ｕに提供する。

【0059】

また、推定部２１が予め設定された間隔で繰り返し利用者発話に続く利用者Ｕの発話内容を推定するとする。この場合、提供部２２は、あるタイミングで推定部２１によって推定された結果を含む情報を利用者Ｕに提供した後、次の間隔で推定部２１によって推定された結果を含む情報を利用者Ｕに提供する。すなわち、提供部２２は、予め設定された間隔で繰り返し推定部２１によって推定された結果を含む情報を利用者Ｕに提供することもできる。

【0060】

提供部２２は、複数の発話内容候補を表示部１１に表示させることで、複数の発話内容候補を利用者Ｕに提供する。また、提供部２２は、複数の発話内容候補を音として音声出力部１５から出力することで、複数の発話内容候補を利用者Ｕに提供することもできる。例えば、提供部２２は、複数の発話内容候補の数が予め設定された数以下になった後に、複数の発話内容候補を音として音声出力部１５から出力する。

【0061】

図３は、実施形態に係る端末装置１によって利用者Ｕに提供される複数の発話内容候補の一例を示す図である。図３に示す例では、端末装置１の表示部１１に、利用者発話を示す情報である利用者発話情報５０と、推定部２１によって推定された情報である推定情報５１が表示されている。推定情報５１には、発話内容候補を示す情報である発話内容候補情報５２ａ，５２ｂ，５２ｃが含まれる。

【0062】

図３に示す例では、利用者発話情報５０は、「赤坂から新宿までの」であり、発話内容候補情報５２ａは、文字列「移動時間」であり、発話内容候補情報５２ｂは、「終電」であり、発話内容候補情報５２ｃは、「１０分後出発」である。以下において、発話内容候補情報５２ａ，５２ｂ，５２ｃの各々を個別に区別せずに示す場合、発話内容候補情報５２と記載する場合がある。

【0063】

なお、表示部１１に表示される推定情報５１は、予め設定された間隔または利用者発話の内容がＭ語追加される毎に新たに推定部２１によって推定された結果に基づいて更新される。Ｍは１以上の整数である。表示部１１に表示される利用者発話情報５０は、利用者発話が更新される毎に更新される。

【0064】

利用者Ｕは、操作部１２を操作することによって、発話内容候補情報５２ａ，５２ｂ，５２ｃのうち１つの発話内容候補情報を選択することができる。提供部２２は、複数の発話内容候補情報５２ａ，５２ｂ，５２のうち利用者Ｕによって選択された発話内容候補情報を含むコンテンツ要求を情報提供装置２（外部サーバの一例）に送信する。かかるコンテンツ要求には、例えば、利用者発話情報５０と利用者Ｕによって選択された発話内容候補情報とが含まれる。例えば、利用者Ｕによって発話内容候補情報５２ｂが選択された場合、文字列「赤坂から新宿までの終電」を含むコンテンツ要求が端末装置１から情報提供装置２に送信される。

【0065】

提供部２２は、上述したコンテンツ要求に応じて情報提供装置２から送信されるコンテンツを取得し、取得したコンテンツを利用者Ｕに提供する。例えば、提供部２２は、取得したコンテンツを表示部１１に表示させたり、取得したコンテンツを音として音声出力部１５から音として出力させたりすることで、取得したコンテンツを利用者Ｕに提供することができる。

【0066】

また、最新の推定情報５１を利用者Ｕに提供してから予め設定された時間経過した場合または利用者Ｕによって利用者発話情報５０が選択されたとする。この場合、提供部２２は、利用者発話を示す情報を含むが発話内容候補情報５２を含まないコンテンツ要求を情報提供装置２に送信する。この場合も、提供部２２は、コンテンツ要求に応じて情報提供装置２から送信されるコンテンツを取得し、取得したコンテンツを利用者Ｕに提供することができる。

【0067】

また、最新の推定情報５１を利用者Ｕに提供してから予め設定された時間経過した場合または利用者Ｕによる操作部１２への特定操作があるとする。この場合、提供部２２は、利用者発話情報５０と発話内容候補情報５２ａ，５２ｂ，５２ｃとを含むコンテンツ要求を情報提供装置２に送信することもできる。この場合も、提供部２２は、コンテンツ要求に応じて情報提供装置２から送信されるコンテンツを取得し、取得したコンテンツを利用者Ｕに提供することができる。

【0068】

また、最新の推定情報５１を利用者Ｕに提供してから予め設定された時間経過した場合または利用者Ｕによる操作部１２への特定操作があるとする。提供部２２は、利用者発話情報５０と発話内容候補情報５２ａとを含むコンテンツ要求、利用者発話情報５０と発話内容候補情報５２ｂとを含むコンテンツ要求、および利用者発話情報５０と発話内容候補情報５２ｃとを含むコンテンツ要求の順に情報提供装置２に送信することもできる。この場合、提供部２２は、これらのコンテンツ要求に応じて情報提供装置２から送信されるコンテンツを順次取得し、取得したコンテンツを順次利用者Ｕに提供することができる。

【0069】

また、最新の推定情報５１を利用者Ｕに提供してから予め設定された時間経過した場合または利用者Ｕによる操作部１２への特定操作があるとする。提供部２２は、利用者発話情報５０と最上位の発話内容候補情報５２である発話内容候補情報５２ａとを含むコンテンツ要求を送信し、コンテンツ要求に応じて情報提供装置２から送信される順次コンテンツを利用者Ｕに提供することもできる。最上位の発話内容候補情報５２は、例えば、上述した推定スコアが最も高い発話内容候補情報５２である。図３に示す例では、発話内容候補情報５２ａが最も推定スコアが高く、発話内容候補情報５２ｂが発話内容候補情報５２ａの次に推定スコアが高く、発話内容候補情報５２ｃが発話内容候補情報５２ｂの次に推定スコアが高い。

【0070】

図３に示す例では、推定情報５１には、発話内容候補情報５２ａ，５２ｂ，５２ｃが含まれるが、利用者Ｕに提供される推定情報５１は、図３に示す例に限定されない。例えば、推定情報５１には、利用者発話を示す情報と発話内容候補を示す情報とを含む総発話内容候補が発話内容候補毎に含まれてもよい。

【0071】

図４は、実施形態に係る端末装置１によって利用者Ｕに提供される複数の発話内容候補の他の例を示す図である。図４に示す例では、端末装置１の表示部１１に、利用者発話を示す情報である利用者発話情報５０と、推定部２１によって推定された情報である推定情報５１が表示されている。推定情報５１には、利用者発話情報５０と発話内容候補を示す情報である総発話内容候補情報５３ａ，５３ｂ，５３ｃが含まれる。以下、総発話内容候補情報５３ａ，５３ｂ，５３ｃの各々を個別に区別せずに示す場合、総発話内容候補情報５３と記載する場合がある。

【0072】

利用者Ｕは、発話内容候補情報５２ａ，５２ｂ，５２ｃの場合と同様に、操作部１２を操作することによって、総発話内容候補情報５３ａ，５３ｂ，５３のうち１つの総発話内容候補を選択することができる。提供部２２は、表示部１１が図４に示す状態である場合の処理を、表示部１１が図３に示す状態である場合の処理と同様に行う。

【0073】

また、提供部２２は、推定情報５１の提供を音声で行う場合、利用者Ｕによる音声での発話内容候補情報５２や総発話内容候補情報５３の選択を受け付け、表示部１１が図３または図４に示す状態である場合の処理と同様の処理を行うことができる。なお、利用者Ｕによる発話内容候補情報５２や総発話内容候補情報５３の選択結果は、利用者Ｕによる発話内容候補の選択履歴として提供部２２によって記憶部１３に記憶される。

【0074】

また、提供部２２は、利用者発話情報５０と利用者Ｕによって選択された発話内容候補情報５２とによって、利用者Ｕの発話の意図を判定することができる。提供部２２は、利用者Ｕの発話の意図が周辺の機器の制御であると判定した場合、利用者発話情報５０と利用者Ｕによって選択された発話内容候補情報５２とで特定される周辺の機器および制御内容に基づいて、周辺の機器の制御を行うことができる。

【0075】

また、提供部２２は、利用者Ｕの発話の意図が情報の取得であると判定した場合、上述したコンテンツ要求を情報提供装置２に送信する。これにより、利用者Ｕは、情報提供装置２から所望の情報を取得することができる。

【0076】

〔３．８．４．学習部２３〕
学習部２３は、学習用データを用いて学習済みモデルを生成したり更新したりする。例えば、学習部２３は、記憶部１３に記憶されている利用者発話に対応する音声情報およびテキスト情報に基づいて、利用者発話の音声情報を先頭から互いに異なる位置までで区切った分割音声情報または分割音声情報に対応する分割テキスト情報を生成する。利用者発話は、利用者Ｕの発話全体の一例である。学習部２３は、生成した分割音声情報または分割音声情報に対応する分割テキスト情報と利用者Ｕの発話全体のテキスト情報とを含む学習用データを生成する。

【0077】

分割音声情報または分割テキスト情報は、例えば、上述したように、「あ」、「あか」、「あかさ」、「あかさか」、「あかさかか」、「あかさかから」、「あかさかからし」、「あかさかからしん」、・・・などといった音声情報またはテキスト情報である。利用者Ｕの発話全体のテキスト情報は、例えば、「赤坂から新宿までの終電」、「赤坂から新宿までの移動時間」、「赤坂から新宿までの１０分後出発」などといったテキスト情報である。なお、利用者Ｕの発話全体のテキスト情報は、「赤坂から新宿まで終電」、「赤坂から新宿まで移動時間」、「赤坂から新宿まで１０分後出発」などといったテキスト情報であってもよい。

【0078】

また、学習部２３は、利用者Ｕによる発話内容候補の選択履歴に基づいて、学習済みモデルを更新する。この場合、学習部２３は、利用者Ｕの発話全体のテキスト情報と利用者Ｕによって選択された発話内容候補情報５２とを含む学習用データ、利用者Ｕによって選択された総発話内容候補情報５３を含む学習用データをさらに生成する。学習部２３は、このように生成した学習用データと上述した学習用データとを用いて、学習済みモデルを更新する。

【0079】

〔４．処理手順〕
次に、実施形態に係る端末装置１の処理部１７による情報処理の手順について説明する。図５は、実施形態に係る端末装置１の処理部１７による情報処理の一例を示すフローチャートである。

【0080】

図５に示すように、端末装置１の処理部１７は、利用者Ｕの発話があるか否かを判定する（ステップＳ１０）。処理部１７は、利用者Ｕの発話があると判定した場合（ステップＳ１０：Ｙｅｓ）、利用者Ｕの発話に続く発話内容を推定する（ステップＳ１１）。

【0081】

次に、処理部１７は、推定した発話内容を含む発話内容を利用者Ｕに提供する（ステップＳ１２）。例えば、ステップＳ１２の処理において、処理部１７は、上述した利用者発話情報５０を利用者Ｕに提供した後、例えば、発話内容候補情報５２または総発話内容候補情報５３を含む推定情報５１を含む情報を利用者Ｕに提供する。

【0082】

次に、処理部１７は、利用者Ｕによる発話内容候補情報５２または総発話内容候補情報５３の選択があるか否かを判定する（ステップＳ１３）。処理部１７は、利用者Ｕによる選択があると判定した場合（ステップＳ１３：Ｙｅｓ）、利用者Ｕによる選択結果に基づいて、情報提供装置２からコンテンツを取得する（ステップＳ１４）。ステップＳ１４の処理において、処理部１７は、利用者発話情報５０と利用者Ｕによって選択された発話内容候補情報５２とを含むコンテンツ要求または総発話内容候補情報５３を含むコンテンツ要求を情報提供装置２に送信する。これにより、処理部１７は、情報提供装置２からコンテンツを取得する。

【0083】

処理部１７は、利用者Ｕによる選択がないと判定した場合（ステップＳ１３：Ｎｏ）、利用者Ｕの発話に基づいて、情報提供装置２からコンテンツを取得する（ステップＳ１５）。ステップＳ１５の処理において、処理部１７は、利用者発話情報５０を含むが発話内容候補情報５２および総発話内容候補情報５３を含まないコンテンツ要求を情報提供装置２に送信することによって情報提供装置２からコンテンツを取得する。なお、ステップＳ１３の処理において、処理部１７は、例えば、最新の推定情報５１を利用者Ｕに提供してから予め設定された時間経過した場合または利用者Ｕによる操作部１２への特定操作がある場合、利用者Ｕによる選択がないと判定する。

【0084】

処理部１７は、ステップＳ１４の処理が終了した場合、またはステップＳ１５の処理が終了した場合、または利用者Ｕの発話がないと判定した場合（ステップＳ１０：Ｎｏ）、学習済みモデルの更新タイミングになったか否かを判定する（ステップＳ１６）。ステップＳ１６の処理において、処理部１７は、新たに追加された学習用データが予め設定された数以上になった場合に更新タイミングになったと判定する。

【0085】

処理部１７は、更新タイミングになったと判定した場合（ステップＳ１６：Ｙｅｓ）、学習済みモデルを更新する（ステップＳ１７）。処理部１７は、更新タイミングになっていないと判定した場合（ステップＳ１６：Ｎｏ）、またはステップＳ１７の処理が終了した場合、動作終了タイミングになったか否かを判定する（ステップＳ１８）。処理部１７は、例えば、端末装置１の電源がオフにされた場合などに動作終了タイミングになったと判定する。

【0086】

処理部１７は、動作終了タイミングになっていないと判定した場合（ステップＳ１８：Ｎｏ）、処理をステップＳ１０へ移行し、動作終了タイミングになったと判定した場合（ステップＳ１８：Ｙｅｓ）、図５に示す処理を終了する。

【0087】

〔５．変形例〕
上述した例では、利用者発話は、助詞などを含んでいたが、利用者発話は、助詞などを含まない複数の検索キーワードで構成されてもよい。

【0088】

また、推定部２１は、利用者Ｕの発話に続く利用者Ｕの発話内容に加えてまたは代えて、利用者Ｕの発話の前に発話されるべき利用者Ｕの発話内容を推定することもできる。例えば、推定部２１は、利用者Ｕの発話が「新宿まで」または「新宿までの終電」などである場合、「赤坂から」を利用者Ｕの発話の前に発話されるべき利用者Ｕの発話内容として推定することができる。

【0089】

この場合、推定部２１は、利用者Ｕの発話に加えて、位置検出部１６によって検出された位置の住所を示す情報を用いて、利用者Ｕの発話の前に発話されるべき利用者Ｕの発話内容（以下、前発話内容と記載する場合がある）を推定することができる。例えば、利用者Ｕの発話が「新宿まで」または「新宿までの」などであり、位置検出部１６によって検出された位置の住所が「赤坂」である場合、「赤坂から」を前発話内容として推定することができる。推定部２１は、利用者Ｕの発話に続く利用者Ｕの発話内容の場合と同様の処理によって、複数の発話内容候補を前発話内容として推定することができる。

【0090】

また、学習部２３は、端末装置１を用いた利用者Ｕの過去の検索履歴（例えば、情報提供装置２に対する検索クエリに含まれる検索キーワードの履歴）に基づいて、学習用データや発話内容候補テーブルの生成または更新を行うことができる。

【0091】

また、学習部２３は、利用者Ｕが発話した後に利用者Ｕが検索した内容と利用者Ｕの発話とに基づいて、学習用データや発話内容候補テーブルの生成または更新を行うことができる。例えば、利用者Ｕの発話が「動画サービス」で、その後に利用者Ｕが検索した内容が「アニメ」や「ドラマ」であるとする。この場合、学習部２３は、「動画サービス」を入力とし、「アニメ」や「ドラマ」を出力とする学習済みモデルや、「家電」が入力された場合に、「アニメ」や「ドラマ」の推定スコアが閾値以上になる学習済みモデルを生成することができる。

【0092】

また、学習部２３は、利用者Ｕが発話した後に、情報提供装置２から提供される商品やサービスなどの情報のうち利用者Ｕが端末装置１を用いて選択した商品やサービスなどの情報と、利用者Ｕの発話とを用いて、学習用データや発話内容候補テーブルの生成や更新を行うこともできる。例えば、利用者Ｕの発話が「家電」で、その後に利用者Ｕが選択した内容が「テレビ」や「パソコン」であるとする。この場合、学習部２３は、「家電」を入力とし、「テレビ」や「パソコン」を出力とする学習済みモデルや、「家電」が入力された場合に、「テレビ」や「パソコン」の推定スコアが閾値以上になる学習済みモデルを生成することができる。

【0093】

なお、端末装置１は、学習済みモデルや発話内容候補テーブルを利用者Ｕ毎に有しており、この場合の学習済みモデルは、オンデバイスモデルということもできる。

【0094】

〔６．ハードウェア構成〕
上述してきた実施形態に係る端末装置１は、例えば図６に示すような構成のコンピュータ８０によって実現される。図６は、実施形態に係る端末装置１の機能を実現するコンピュータ８０の一例を示すハードウェア構成図である。コンピュータ８０は、ＣＰＵ８１、ＲＡＭ８２、ＲＯＭ（Read Only Memory）８３、ＨＤＤ（Hard Disk Drive）８４、通信インターフェイス（Ｉ／Ｆ）８５、入出力インターフェイス（Ｉ／Ｆ）８６、およびメディアインターフェイス（Ｉ／Ｆ）８７を有する。

【0095】

ＣＰＵ８１は、ＲＯＭ８３またはＨＤＤ８４に記憶されたプログラムに基づいて動作し、各部の制御を行う。ＲＯＭ８３は、コンピュータ８０の起動時にＣＰＵ８１によって実行されるブートプログラムや、コンピュータ８０のハードウェアに依存するプログラムなどを記憶する。

【0096】

ＨＤＤ８４は、ＣＰＵ８１によって実行されるプログラム、および、かかるプログラムによって使用されるデータなどを記憶する。通信インターフェイス８５は、ネットワークＮ（図２参照）を介して他の機器からデータを受信してＣＰＵ８１へ送り、ＣＰＵ８１が生成したデータを、ネットワークＮを介して他の機器に送信する。

【0097】

ＣＰＵ８１は、入出力インターフェイス８６を介して、ディスプレイやプリンタなどの出力装置、および、キーボードまたはマウスなどの入力装置を制御する。ＣＰＵ８１は、入出力インターフェイス８６を介して、入力装置からデータを取得する。また、ＣＰＵ８１は、入出力インターフェイス８６を介して生成したデータを出力装置に出力する。

【0098】

メディアインターフェイス８７は、記録媒体８８に記憶されたプログラムまたはデータを読み取り、ＲＡＭ８２を介してＣＰＵ８１に提供する。ＣＰＵ８１は、かかるプログラムを、メディアインターフェイス８７を介して記録媒体８８からＲＡＭ８２上にロードし、ロードしたプログラムを実行する。記録媒体８８は、例えばＤＶＤ（Digital Versatile Disc）、ＰＤ（Phase change rewritable Disk）などの光学記録媒体、ＭＯ（Magneto-Optical disk）などの光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリなどである。

【0099】

例えば、コンピュータ８０が実施形態に係る端末装置１として機能する場合、コンピュータ８０のＣＰＵ８１は、ＲＡＭ８２上にロードされたプログラムを実行することにより、処理部１７の機能を実現する。また、ＨＤＤ８４には、記憶部１３内のデータが記憶される。コンピュータ８０のＣＰＵ８１は、これらのプログラムを記録媒体８８から読み取って実行するが、他の例として、他の装置からネットワークＮを介してこれらのプログラムを取得してもよい。

【0100】

〔７．その他〕
また、上記実施形態および変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。

【0101】

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。

【0102】

また、上述してきた実施形態および変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

【0103】

〔８．効果〕
上述してきたように、実施形態に係る端末装置１は、受付部２０と、推定部２１と、提供部２２とを備える。受付部２０は、利用者Ｕの発話を受け付ける。推定部２１は、受付部２０によって受け付けられた発話に続く利用者Ｕの発話内容を推定する。提供部２２は、推定部２１によって推定された発話内容を含む発話内容を利用者Ｕに提供する。これにより、端末装置１は、利用者Ｕの利便性の向上を図ることができる。また、端末装置１は、情報提供装置２に利用者Ｕの発話に対応する音声情報を送信することなく、利用者Ｕの発話に続く利用者Ｕの発話内容を推定することから、情報提供装置２で推定処理を行う場合に較べて、推定結果を利用者Ｕに提供する時間を短くできる。

【0104】

また、推定部２１は、受付部２０によって受け付けられた発話に対応する音声情報またはテキスト情報を入力とし、発話に続く利用者Ｕの発話内容の推定結果を出力とする学習済みモデルを有し、学習済みモデルを用いて利用者Ｕの発話に続く利用者Ｕの発話内容を推定する。これにより、端末装置１は、利用者Ｕの発話に続く利用者Ｕの発話内容を精度よく推定することができる。

【0105】

また、推定部２１は、利用者Ｕの発話に続く利用者Ｕの発話内容として複数の発話内容候補を推定する。提供部２２は、推定部２１によって推定された複数の発話内容候補を含む発話内容を利用者Ｕに提供する。これにより、端末装置１は、利用者Ｕに対して複数の発話内容候補を提示することができることから、利用者Ｕの利便性の向上をより図ることができる。

【0106】

また、提供部２２は、複数の発話内容候補を表示部１１に表示させる。これにより、端末装置１は、利用者Ｕの利便性の向上をより図ることができる。

【0107】

また、提供部２２は、複数の発話内容候補のうち利用者Ｕに選択された発話内容候補の情報を含むコンテンツ要求を情報提供装置２（外部サーバの一例）に送信し、コンテンツ要求に応じて情報提供装置２から送信されるコンテンツを利用者Ｕに提供する。これにより、端末装置１は、利用者Ｕの利便性の向上をより図ることができる。

【0108】

また、端末装置１は、利用者Ｕによる発話内容候補の選択履歴に基づいて、学習済みモデルを更新する学習部２３を備える。これにより、端末装置１は、利用者Ｕの発話に続く利用者Ｕの発話内容を精度よく推定することができる。

【0109】

また、学習済みモデルは、受付部２０によって受け付けられた発話に対応する音声情報またはテキスト情報を入力とし、各発話内容候補の推定スコアを出力とするモデルを含む。推定部２１は、推定スコアに基づいて、発話に続く利用者Ｕの発話内容として複数の発話内容候補を推定する。これにより、端末装置１は、利用者Ｕの発話に続く利用者Ｕの発話内容を精度よく推定することができる。

【0110】

また、学習部２３は、利用者Ｕの発話全体の音声情報を先頭から互いに異なる位置までで区切った分割音声情報または分割音声情報に対応する分割テキスト情報と利用者Ｕの発話全体のテキスト情報とを含む学習用データを用いて学習済みモデルを生成する。これにより、端末装置１は、利用者Ｕの発話に続く利用者Ｕの発話内容を精度よく推定することができる。

【0111】

また、受付部２０は、受け付けた発話に対応する音声情報をテキスト情報に変換する。推定部２１は、受付部２０によって変換されたテキスト情報を学習済みモデルに入力することによって、利用者Ｕの発話に続く利用者Ｕの発話内容を推定する。これにより、端末装置１は、利用者Ｕの発話に続く利用者Ｕの発話内容を精度よく推定することができる。

【0112】

以上、本願の実施形態を図面に基づいて詳細に説明したが、これは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。

【0113】

また、上述してきた「部（section、module、unit）」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。

【符号の説明】

【0114】

１端末装置
２情報提供装置
１０通信部
１１表示部
１２操作部
１３記憶部
１４音声入力部
１５音声出力部
１６位置検出部
１７処理部
２０受付部
２１推定部
２２提供部
２３学習部
５０利用者発話情報
５１推定情報
５２，５２ａ，５２ｂ，５２ｃ発話内容候補情報
５３，５３ａ，５３ｂ，５３ｃ総発話内容候補情報
１００情報処理システム

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版