IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ トヨタ自動車株式会社の特許一覧

<>
  • 特開-情報処理装置 図1
  • 特開-情報処理装置 図2
  • 特開-情報処理装置 図3
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023176156
(43)【公開日】2023-12-13
(54)【発明の名称】情報処理装置
(51)【国際特許分類】
   G10L 15/10 20060101AFI20231206BHJP
【FI】
G10L15/10 500T
【審査請求】未請求
【請求項の数】1
【出願形態】OL
(21)【出願番号】P 2022088290
(22)【出願日】2022-05-31
(71)【出願人】
【識別番号】000003207
【氏名又は名称】トヨタ自動車株式会社
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(72)【発明者】
【氏名】堀 敬滋
(72)【発明者】
【氏名】西山 浩司
(57)【要約】      (修正有)
【課題】音声認識の利便性を向上できる情報処理装置を提供する。
【解決手段】ユーザが音声入力可能な電子機器とネットワークを介して接続される情報サーバで構成されている情報処理装置100は、音声入力手段110と、予定取得手段120と、意図推定手段130と、出力手段140と、を備えている。音声入力手段110は、ユーザの発話内容を取得する。予定取得手段120は、スケジュールに登録されているユーザの行動予定情報を取得する。意図推定手段130は、発話内容に基づき施設情報を検索する場合、現在から所定時間先までの期間内のスケジュールに登録されている行動予定情報に関連した施設情報を参照し、発話内容の意図理解を行う。出力手段140は、意図理解の結果を出力する。
【選択図】図2
【特許請求の範囲】
【請求項1】
ユーザの発話内容を取得する音声入力手段と、
スケジュールに登録されているユーザの行動予定情報を取得する予定取得手段と、
前記発話内容に基づき施設情報を検索する場合、現在から所定時間先までの期間内の前記スケジュールに登録されている前記行動予定情報に関連した施設情報を参照し、前記発話内容の意図理解を行う意図推定手段と、
前記意図理解の結果を出力する出力手段と、を備えた
情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置に関する。
【背景技術】
【0002】
エージェント(音声対話サービス)は、話しかけると音声で応えて目的地や情報の検索をしてくれる。目的地のセットまで全て音声で操作できるので、キーボード等による手入力を行うことができない自動車の運転中に快適便利である。
【0003】
エージェントの音声認識の精度を向上させる種々の技術が開発されている。例えば、特許文献1には、過去の発話履歴データを意図理解に活用してユーザからの少ない音声入力でも音声認識の精度を向上させることができる音声認識システム等が開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2016-24652号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1に開示されている技術のように、過去の発話履歴データは意図理解に積極的に活用されている一方、未来のデータは意図理解にほとんど活用されていない。例えば、施設検索に関して、音声認識に基づく施設探索の結果が複数該当する場合、施設を更に特定するためにユーザへの追加の問いかけが必要である。複数回の発話が必要となりユーザにとって煩わしいことがある。
【0006】
本発明は、かかる課題に鑑みてなされたものであり、音声認識の利便性を向上できる情報処理装置を提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明の一態様に係る情報処理装置は、音声入力手段と、予定取得手段と、意図推定手段と、出力手段と、を備えている。音声入力手段は、ユーザの発話内容を取得する。予定取得手段は、スケジュールに登録されているユーザの行動予定情報を取得する。意図推定手段は、発話内容に基づき施設情報を検索する場合、現在から所定時間先までの期間内のスケジュールに登録されている行動予定情報に関連した施設情報を参照し、発話内容の意図理解を行う。出力手段は、意図理解の結果を出力する。
【0008】
この態様によれば、ユーザの未来の行動予定を加味することで、施設情報を具体的に特定するよう意図理解するため、音声認識の利便性が向上する。
【0009】
上記態様において、複数の行動予定情報が意図理解の候補に挙がる場合、より近い未来の行動予定情報を優先して意図理解するように構成されていることが好ましい。
【0010】
この態様によれば、複数の行動予定情報のうち、ユーザが意図している蓋然性が高い行動予定情報に関連した施設情報が上位に表示されるため、音声認識による意図理解の精度をより向上させることができる。
【発明の効果】
【0011】
本発明によれば、音声認識の利便性を向上できる情報処理装置を提供することができる。
【図面の簡単な説明】
【0012】
図1図1は、本発明の一実施形態の情報処理装置の概略的な構成の一例を示す図である。
図2図2は、本発明の位置実施形態の情報処理装置の機能的な構成の一例を示すブロック図である。
図3図3は、本発明の一実施形態の情報処理装置による予定情報を活用した音声認識の一例を示す図である。
【発明を実施するための形態】
【0013】
添付図面を参照して、本発明の好適な実施形態について説明する。なお、各図において、同一の符号を付したものは、同一又は同様の構成を有する。以下、図面を参照して本発明について詳しく説明する。
【0014】
図1は、本発明の一実施形態の情報処理装置の概略的な構成の一例を示す図である。情報処理装置100は、話しかけると音声で応えて目的地や情報の検索をしてくれるエージェント(音声対話サービス)の機能を有している。情報処理装置100は、例えば、ユーザが音声入力可能な電子機器1、ネットワークNを介して接続される情報サーバ2等で構成されている。電子機器1は、ヘッドユニット等の車両に搭載可能な車載装置であってもよいし、スマートフォン等の携帯端末であってもよい。
【0015】
電子機器1は、機能的な構成として、制御部11、記憶部12等を有している。同様に、情報サーバ2は、機能的な構成として、制御部21、記憶部22等を有している。なお、電子機器1及び情報サーバ2の構成要素は、図示した例に限定されず、必要に応じて任意の構成要素を適宜追加してもよい。
【0016】
電子機器1は、カーナビゲーション装置としての機能を備えている。制御部11は、ナビゲーション処理に加え、後述する音声入力手段110等、電子機器1における各種の処理を実行する機能を有する。記憶部12は、制御部11が処理した各種のデータを記憶する。
【0017】
制御部21は、情報サーバ2における各種の処理を実行する機能を有する。例えば、制御部21は、車両から送信されるデータを受信して電子機器1における各種の処理を実行する機能を有する。記憶部22は、各種のデータを記憶する。電子機器1及び情報サーバ2の制御部11,21及び記憶部12,22は、後述する音声入力手段110、予定取得手段120、意図推定手段130、出力手段140等を構成している。
【0018】
図2は、本発明の位置実施形態の情報処理装置100の機能的な構成の一例を示すブロック図である。図2に示すように、情報処理装置100は、音声入力手段110と、予定取得手段120と、意図推定手段130と、出力手段140と、を備えている。
【0019】
音声入力手段110は、電子機器1のマイク等から入力されたユーザの音声を電気的な音声波形信号に変換する等により、ユーザの発話内容を取得する。予定取得手段120は、ユーザのスケジュールを登録可能な予定DBを参照し、スケジュールに登録されているユーザの行動予定情報を取得する。予定DBは、情報処理装置100を構成する情報サーバ2の記憶部22に含まれていてもよいし、情報サーバ2とは異なるサーバに含まれていてもよい。
【0020】
意図推定手段130は、音声入力手段110によって取得された発話内容の意図理解を行う。例えば、意図推定手段130は、発話内容に基づき施設情報を検索する場合において、現在から所定時間先までの期間内(例えば、一週間以内)のスケジュールに登録されている行動予定情報に関連した施設情報を参照し、発話内容の意図理解を行う。意図推定手段130は、参照すべきスケジュールの範囲をユーザが任意に設定できるように構成されている。例えば、ユーザが音声入力手段110を通じて現在からどこまで先の期間内のスケジュールを参照するか所定時間を設定できる。
【0021】
出力手段140は、電子機器1を用いて意図理解の結果を出力する。例えば、電子機器1のモニターに意図理解の結果を表示したり、電子機器1のスピーカーから意図理解の結果を発話したりすることができる。
【0022】
図3は、本発明の一実施形態の情報処理装置100による予定情報を活用した音声認識の一例を示す図である。図3に示すように、エージェントとして機能する情報処理装置100は、音声認識による施設検索実行時に、スケジュールに登録されているデータを参照し、意図理解に活用することが特徴の一つである。
【0023】
例えば、屋号「A居酒屋」を用いて複数の店舗(B店,C店,D店,…)を展開している居酒屋チェーンがあり、かつスケジュールに行動予定情報として「1月1日18:00のA居酒屋B店」が登録されていた場合、ユーザから「A居酒屋」、「居酒屋」又は「飲み会」と発話されたら、「A居酒屋B店」を上位に表示する。
【0024】
固有名詞である「A居酒屋」は、スケジュールに登録されている「A居酒屋B店」と一部一致するキーワードである。一般名詞である「居酒屋」は、スケジュールに登録されている「A居酒屋B店」と一部一致するキーワードである。
【0025】
「居酒屋」や「飲み会」は、「A居酒屋B店」に関連するキーワードの一例である。「居酒屋」は、「A居酒屋B店」の施設が属する業種である日本標準産業分類の細分類番号7651「酒場,ビヤホール」に含まれ、「A居酒屋B店」と関連性が深いキーワードである。「飲み会」は、スケジュールに登録されている「A居酒屋B店」の施設の主たる使用目的であり、「A居酒屋B店」と関連性が深いキーワードである。
【0026】
以上のように構成された本実施形態の情報処理装置100によれば、ユーザの未来の行動予定を加味することで、施設情報を具体的に特定するよう意図理解するため、音声認識の利便性が向上する。音声認識の利便性を向上できる情報処理装置100は、キーボード等による手入力を行うことができない自動車の運転中に快適便利である。
【0027】
複数の行動予定情報が意図理解の候補に挙がる場合、より近い未来の行動予定情報を優先して意図理解するように構成されていることが好ましい。例えば、現在から所定時間先までの期間内に「1月1日18:00のA居酒屋B店」「1月2日17:00のA居酒屋C店」がスケジュールにともに登録されていた場合、ユーザから「A居酒屋」「居酒屋」「飲み会」と発話されたら、1月1日の行動予定情報と1月2日の行動予定情報と複数の行動予定情報が意図理解の候補に挙がる。
【0028】
そのような場合、より近い未来である1月1日の行動予定情報を優先して意図理解し、「A居酒屋B店」を「A居酒屋C店」よりも上位に表示するように構成されていることが好ましい。この態様によれば、複数の行動予定情報のうち、ユーザが意図している蓋然性が高い行動予定情報に関連した施設情報が上位に表示されるため、音声認識による意図理解の精度をより向上させることができる。
【0029】
情報処理装置100は、スケジュールに登録されている行動予定情報に付与された属性を参照することにより、意図理解に用いる行動予定情報と、意図理解に用いない行動予定情報と、を選択可能に構成されていてもよい。例えば、行動予定情報が、予定DBを利用する他のユーザも参照可能な「全体公開情報」の属性と、自分自身のみが参照できる「プライベート」の属性とに振り分けられていた場合、「プライベート」の属性のみを意図理解に用いるように構成されていてもよい。
【0030】
ユーザによるタグ分類等により行動予定情報に「仕事」又は「オフ」の属性を付与していた場合、「オフ」の属性のみを意図理解に用いるように構成されていてもよい。図2に示すように、情報処理装置100は、固有名詞の属性を判定する判定手段150を更に備えていてもよい。
【0031】
以上説明した実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。実施形態が備える各要素並びにその配置、材料、条件、形状及びサイズ等は、例示したものに限定されるわけではなく適宜変更することができる。また、異なる実施形態で示した構成同士を部分的に置換し又は組み合わせることが可能である。
【符号の説明】
【0032】
1…電子機器、2…情報サーバ、11,21…制御部、12,22…記憶部、100…情報処理装置、110…音声入力手段、120…予定取得手段、130…意図推定手段、140…出力手段、150…判定手段。
図1
図2
図3