(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024048304
(43)【公開日】2024-04-08
(54)【発明の名称】エージェントシステム
(51)【国際特許分類】
G10L 15/22 20060101AFI20240401BHJP
G10L 17/00 20130101ALI20240401BHJP
G10L 15/00 20130101ALI20240401BHJP
G10L 13/00 20060101ALI20240401BHJP
G10L 15/10 20060101ALI20240401BHJP
【FI】
G10L15/22 453
G10L15/22 460D
G10L17/00 200Z
G10L15/00 200J
G10L13/00 100L
G10L15/22 300Z
G10L15/10 500T
【審査請求】未請求
【請求項の数】4
【出願形態】OL
(21)【出願番号】P 2022154272
(22)【出願日】2022-09-27
(71)【出願人】
【識別番号】000005348
【氏名又は名称】株式会社SUBARU
(74)【代理人】
【識別番号】100122426
【弁理士】
【氏名又は名称】加藤 清志
(72)【発明者】
【氏名】三国 司
(72)【発明者】
【氏名】本間 拓也
(72)【発明者】
【氏名】元山 純一
(72)【発明者】
【氏名】中村 亮太
(72)【発明者】
【氏名】早川 和裕
(57)【要約】
【課題】車両においてシステム側が能動的に話題を決定し、話者を特定して対話することによって、車室内における乗員の会話が円滑となって、楽しい空間を演出する。
【解決手段】車両の車室内に設置されたマイク200によって乗員の音声情報を収集し、制御部150は、解釈部110が収集した音声情報に含まれる発話内容を解釈し、受話者を定め、乗員の携帯端末300から直近の事象を検索し話題を決定し、スピーカ400から音声情報を出力する。このように能動的にシステム側が受話者を決定して、直近の事象から話題を決定して出力することによって、車室内にいる乗員同士の会話が円滑に進み、結果として、楽しい空間を得ることができる。
【選択図】
図1
【特許請求の範囲】
【請求項1】
車両の車室内の乗員の音声を収集するマイクと、
前記車室内に音声を出力するスピーカと、
前記マイクによって収集された前記乗員の音声を取得し、取得した前記音声に含まれる乗員の発話内容を解釈する解釈部と、
該解釈された前記音声と発話者である前記乗員とを紐付けて格納する記憶部と、
該格納された情報に基づいて、最も発話頻度の高い前記乗員を受話者と定め、前記受話者に対する話題を決定し、その音声を前記スピーカから出力するよう制御する制御部と、
を備えたことを特徴とするエージェントシステム。
【請求項2】
前記乗員の携帯端末と、車両とからなる通信を行い、前記乗員の情報を取得する情報取得部を備え、
前記制御部は、該取得された前記乗員の情報のうち、前記受話者となる前記乗員の情報から直近の事象を検索し、該検索された前記直近の事象から前記話題を決定することを特徴とする請求項1に記載のエージェントシステム。
【請求項3】
前記乗員の携帯端末と、車両とからなる通信を行い、前記乗員の情報を取得する情報取得部を備え、
前記制御部は、該取得された前記乗員の情報から、ワードの検索傾向が特徴的な前記乗員を前記受話者と決定し、前記受話者となった前記乗員が最も高い頻度で検索を行ったワードに関する事柄を前記話題として決定することを特徴とする請求項1に記載のエージェントシステム。
【請求項4】
前記制御部は、前記受話者となった前記乗員の検索傾向から決定した前記話題のうち、ネガティブな話題を排除して、発話する前記話題を決定することを特徴とする請求項3に記載のエージェントシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、エージェントシステムに関する。
【背景技術】
【0002】
近年、車両においてコンシェルジュ機能を有するエージェントシステムと乗員とが対話を行うことができるシステムが知られている。
【0003】
この種のシステムとして、乗員がシステム側へ話しかけた際に、システム側はどのユーザが話しかけたかを特定し、乗員に対し応答をすることができるシステムが開示されている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1に記載の技術は、乗員がシステム側に話しかけた際に対応することができる技術であって、システム側から乗員に対して能動的に提案を行って対話をするという面においては、解決すべき課題があった。
【0006】
そこで、本発明は上述の課題に鑑みてなされたものであり、車両においてシステム側が能動的に話題を決定し、話者を特定して対話するエージェントシステムを提供することを目的とする。
【課題を解決するための手段】
【0007】
形態1;本発明の1またはそれ以上の実施形態は、車両の車室内の乗員の音声を収集するマイクと、前記車室内に音声を出力するスピーカと、前記マイクによって収集された前記乗員の音声を取得し、取得した前記音声に含まれる乗員の発話内容を解釈する解釈部と、該解釈された前記音声と発話者である前記乗員とを紐付けて格納する記憶部と、該格納された情報に基づいて、最も発話頻度の高い前記乗員を受話者と定め、前記受話者に対する話題を決定し、その音声を前記スピーカから出力するよう制御する制御部と、を備えたことを特徴とするエージェントシステム。
【0008】
形態2;本発明の1またはそれ以上の実施形態は、前記乗員の携帯端末と、車両とからなる通信を行い、前記乗員の情報を取得する情報取得部を備え、前記制御部は、該取得された前記乗員の情報のうち、前記受話者となる前記乗員の情報から直近の事象を検索し、該検索された前記直近の事象から前記話題を決定することを特徴とする請求項1または2のいずれかに記載のエージェントシステム。
【0009】
形態3;本発明の1またはそれ以上の実施形態は、前記乗員の携帯端末と、車両とからなる通信を行い、前記乗員の情報を取得する情報取得部を備え、前記制御部は、該取得された前記乗員の情報から、ワードの検索傾向が特徴的な前記乗員を前記受話者と決定し、前記受話者となった前記乗員が最も高い頻度で検索を行ったワードに関する事柄を前記話題として決定することを特徴とする請求項1に記載のエージェントシステム。
【0010】
形態4;本発明の1またはそれ以上の実施形態は、前記制御部は、前記受話者となった前記乗員の検索傾向から決定した前記話題のうち、ネガティブな話題を排除して、発話する前記話題を決定することを特徴とする請求項4に記載のエージェントシステム。
【発明の効果】
【0011】
本発明の1またはそれ以上の実施形態によれば、車両においてシステム側が能動的に話題を決定し、話者を特定して対話することによって、車室内における乗員の会話が円滑となって、楽しい空間を演出することができるという効果がある。
【図面の簡単な説明】
【0012】
【
図1】本発明の第1の実施形態に係るエージェントシステムの構成を示す図である。
【
図2】本発明の第1の実施形態に係る音声情報が記憶部に格納される処理を示す図である。
【
図3】本発明の第1の実施形態に係る情報取得部が収集したSNSへの投稿内容を例示した図である。
【
図4】本発明の第1の実施形態に係る情報取得部が収集したWeb閲覧履歴情報を例示した図である。
【
図5】本発明の第1の実施形態に係るエージェントシステムの処理を示す図である。
【
図6】本発明の第2の実施形態に係るエージェントシステムの構成を示す図である。
【
図7】本発明の第2の実施形態に係る情報取得部が収集した検索ワード履歴情報を例示した図である。
【
図8】本発明の第2の実施形態に係る情報取得部が収集した他の検索ワード履歴情報を例示した図である。
【
図9】本発明の第2の実施形態に係るエージェントシステムの処理を示す図である。
【発明を実施するための形態】
【0013】
<第1の実施形態>
以下、
図1から
図5用いて、本実施形態に係るエージェントシステム1について説明する。
【0014】
<エージェントシステム1の構成>
図1に示すように、本実施形態に係るエージェントシステム1は、解釈部110と、記憶部120と、通信部130と、情報取得部140と、制御部150と、マイク200と、携帯端末300と、スピーカ400と、を含んで構成されている。
以下では、コンシェルジュ機能を有するエージェントシステム1を例示して説明する。
【0015】
解釈部110は、後述するマイク200によって収集された乗員の音声を取得し、取得した音声に含まれる乗員の発話内容を解釈する。
具体的には、解釈部110は、発話内容および発話者の声色を、例えば、AI機能等によって解釈する。
より具体的には、解釈部110には、膨大な数の人の音声情報から学習された学習モデルが格納され、この学習モデルを用いて、発話内容および発話者の声色を解釈する。
なお、解釈部110によって、解釈された発話内容と発話者の声色とは、紐付けられて、後述する記憶部120にデータベースの形式で格納される。
【0016】
記憶部120は、解釈部110によって、解釈された発話内容と発話者の声色とを紐付けて格納する。
具体的には、例えば、
図2に示すように、発話者の声色から、発話者を、仮に、発話者A、B、C・・・とし、その発話者A、B、C・・・の解釈された発話内容を、発話者A、B、C・・・別に分類して格納する。
【0017】
通信部130は、後述する携帯端末300との通信を行うための、例えば、通信モジュールである。
通信形態としては、例えば、Bluetooth(登録商標)、Wi-Fiまたはセルラー網等を例示することができる。
通信部130は、例えば、車両の電源が入れられたことに応じて、後述する乗員の携帯端末300と、Wi-FiやBluetooth等の近距離無線通信を用いて、通信を行う。
ここで、携帯端末300は、乗員が所有する、例えば、スマートフォン、タブレット等を例示することができる。
【0018】
情報取得部140は、通信部130を介して、乗員の携帯端末300からの乗員の情報を取得する。
乗員の情報としては、例えば、SNS(Social Networking Service)への投稿内容、又は、Web閲覧履歴情報等が含まれる。
具体的には、SNSへの投稿内容としては、
図3に示すように、投稿日時、投稿内容等を示すテキスト情報が含まれる。また、投稿内容のテキストに、他ユーザの投稿に対するコメントや、評価を含めてもよい。Web閲覧履歴情報には、
図4に示すように、閲覧日時、閲覧したWebサイトのURL、テキスト情報等が含まれる。
さらに、情報取得部140において取得された乗員の情報は、後述する制御部150に出力される。
【0019】
なお、情報取得部140が、後述する携帯端末300から乗員の情報を取得するときには、例えば、後述する携帯端末300の表示部に、乗員の情報を取得して良いか否かを確認するための表示を行い、乗員からの承諾を確認した後に、乗員の情報の取得を開始するようにしてもよい。また、情報取得部140は、後述する携帯端末300の表示部に、乗員に取得してもよい乗員の情報を選択させるための表示を行い、乗員が選択した情報のみの取得を開始してもよい。
【0020】
制御部150は、図示しないROM(Read Only Memory)等に格納された制御プログラムにしたがって、エージェントシステム1全体を制御する。
本実施形態において、制御部150は、情報取得部140から取得された乗員の情報から、直近の事象を検索し、話題を決定する。
また、制御部150は、例えば、記憶部120に格納された情報に基づいて、最も発話頻度の高い乗員を受話者と定め、決定したその受話者に対する話題をスピーカ400から出力するよう制御する。
具体的には、
図2に示すように、乗員の音声データを、声色から発話者A、B、C、・・・と紐づけられ分類されて記憶部120に格納されているもののうち、最も多くの情報が格納されている発話者を受話者と定める。さらに、制御部150は、後述する乗員の携帯端末300から取得したSNSへの投稿内容や、Web閲覧履歴情報のうち、投稿日時や閲覧日時をもとに直近の投稿内容や、直近のWeb閲覧履歴情報を特定し、その直近の投稿内容や履歴情報からAI等が学習モデルを基に乗員の直近の事象を特定し、話題として決定し、後述するスピーカ400に出力する。
さらに具体的には、
図3に示すように、制御部150は、SNSへの投稿内容のうち、乗員の最も直近の投稿内容である「これからサッカーを見に行きます。楽しみだな~!」という投稿内容や、さらに、
図4に示すように、Web閲覧履歴情報のうち、乗員の最も直近の「サッカーの試合のスターティングメンバ―」というWeb閲覧履歴情報から、「サッカー観戦」に行ったことを特定し、かつ、「サッカー」に関する事項を話題として決定し、「サッカー」に関する事項をスピーカ400から出力する。
具体的には、「今日のサッカーの試合はいかがでしたか?」あるいは、「サッカーの試合は楽しめましたか?」といった内容を、スピーカ400から出力する。
【0021】
マイク200は、車両の車室内の乗員の音声を収集する。
具体的には、マイク200は、例えば、それぞれの乗員の音声を的確に収集できるような位置関係で、車室内の複数箇所に設置されている。
なお、マイク200によって、収集された乗員の音声に関する情報は、解釈部110へ出力される。
【0022】
スピーカ400は、車室内に話題に関する音声を出力する。
スピーカ400は、例えば、車室内の話題が乗員に認知可能となるように、車室内の複数箇所に設置されている。
【0023】
<エージェントシステム1の処理>
図5を用いて、本実施形態に係るエージェントシステム1の処理について説明する。
【0024】
まず、マイク200によって、車室内にいる乗員の会話等の音声情報の収集を行う(ステップS110)。
【0025】
次いで、マイク200によって収集された乗員の音声情報が解釈部110へ出力され、解釈部110は、マイク200から取得した音声情報に含まれる乗員の発話の内容について解釈を行う(ステップS120)。
【0026】
制御部150は、解釈された発話内容と発話者である乗員の声色とを紐付け(ステップS130)、解釈部110によって解釈された乗員の発話内容とともに、乗員Aの声色、乗員Bの声色、乗員Cの声色・・の発話者別に分類して記憶部120に格納する(ステップS140)。
【0027】
制御部150は、例えば、記憶部120に格納された乗員毎に分類された発話者の声色に基づいて、最も発話頻度の高い乗員を受話者に決定する(ステップS150)。
【0028】
通信部130は、乗員の携帯端末300と通信部130通信を行い、受信した情報を情報取得部140に出力する。情報取得部140は、通信部130から受信した情報に基づいて、乗員の情報を取得する(ステップS160)。
【0029】
制御部150は、受話者として決定された乗員について、情報取得部140が取得した乗員の情報から、直近の事象を検索し(ステップS170)、検索された直近の事象から話題を決定する(ステップS180)。
【0030】
制御部150は、決定した話題を車室内に音声データとしてスピーカ400から受話者に向けて出力する(ステップS190)。
【0031】
<作用・効果>
以上、説明したように、本実施形態に係るエージェントシステム1の解釈部110は、マイク200によって収集された乗員の音声を取得し、取得した音声に含まれる乗員の発話内容を解釈し、制御部150は、解釈部110において解釈された音声と発話者である乗員とを紐付けて記憶部120に格納された情報に基づいて、最も発話頻度の高い乗員を受話者と定め、前記受話者に対する話題を決定し、その音声をスピーカ400から出力するよう制御する。
つまり、制御部150は、解釈部110において解釈された音声と、記憶部120に格納されている発話者とを紐付けた情報から、最も発話頻度が高い乗員を抽出して、その乗員を受話者とし、受話者に紐付いた発話内容から受話者が興味を持っていると思われる頻出するテーマを話題として、車室内にスピーカ400を介して、話題を提示する。
そのため、最も発話頻度の高い受話者の興味を持っているテーマ話題を決定して出力することによって、発話頻度の高い人がリードして車室内の会話を進めやすくなり、車室内にいる乗員同士の会話が円滑に進み、結果として、楽しい空間を得ることができる。
【0032】
また、乗員の携帯端末300から、情報取得部140が乗員の情報を取得し、制御部150は、取得した乗員の情報のうち、受話者となる乗員の情報から直近の事象を検索し、話題を決定し、その音声をスピーカ400から出力するよう制御する。
つまり、制御部150は、情報取得部140が乗員の携帯端末300から取得した情報から、受話者となる乗員の直近の事象を特定する。そして、その直近の事象が受話者にとって、現在、最も興味を持っている事象であるとの推測に基づいて、その直近の事象に関連するテーマを話題として、車室内にスピーカ400を介して、乗員に話題を提示する。
そのため、話題について最も興味を持っている乗員が、会話の端緒となって、発話を促し、その発話をきっかとして、受話者である乗員が他の乗員からの問いかけに応じたり、他の乗員が相槌を打ったりすることとなって、乗員同士の会話が活発になる。
これにより、車室内にいる乗員同士の会話が弾み、車室内の乗員同士の会話が円滑になることによって、車室内を楽しい空間に演出することができる。
【0033】
<第2の実施形態>
以下、
図6~
図9を用いて、本実施形態に係るエージェントシステム1Aについて説明する。
【0034】
<エージェントシステム1Aの構成>
図6に示すように、本実施形態に係るエージェントシステム1Aは、解釈部110と、記憶部120と、通信部130と、情報取得部140と、制御部150Aと、マイク200と、スピーカ400と、を含んで構成されている。
以下では、コンシェルジュ機能を有するエージェントシステム1Aを例示して説明する。
なお、第1の実施形態と同一の符号を付す構成要素については、同様の機能を有することから、その詳細な説明は省略する。
【0035】
制御部150Aは、図示しないROM(Read Only Memory)等に格納された制御プログラムにしたがって、エージェントシステム1A全体を制御する。
本実施形態において、制御部150Aは、例えば、情報取得部140から取得された乗員の情報から、ワードの検索傾向が特徴的な乗員を受話者として決定する。
また、制御部150Aは、例えば、受話者に決定した乗員が最も高い頻度で検索を行ったワードに関する事柄を話題として決定し、その受話者に対する話題をスピーカ400から出力するよう制御する。
例えば、
図7に示すように、乗員の携帯端末300から、検索ワードの履歴情報から、「サッカー」の語を含むワードの検索を頻繁に行っている情報を取得した場合、その乗員を、ワードの検索傾向が特徴的な乗員と判定し、受話者とする。
さらに、その乗員が、最も高い頻度で「〇サッカーリーグ 試合結果」に関する事項を検索していた場合には、「〇サッカーリーグ」や、その「試合結果」を話題として決定し、スピーカ400から出力する。
具体的には、「サッカーの試合はどちらが勝ちましたか?」や、「〇サッカーリーグが本日開催されていますね」といった内容を、スピーカ400から出力する。
【0036】
さらに、制御部150Aは、受話者となった乗員の検索傾向から決定した話題のうち、ネガティブな話題を排除して、発話する話題を決定し、その受話者に対する話題をスピーカ400から出力するよう制御する。
例えば、
図8に示すように、検索傾向から「グルメ」に関連した内容を話題として抽出した場合に、制御部150Aが話題を提供する際に、例えば、事前に学習させた学習モデルを用いて、「グルメ」に関する話題のうち、「閉店」に関する話題がネガティブな話題と判断した場合には、「閉店」に関する話題を排除した「グルメ」に関連する内容の話題をスピーカ400から出力する。
具体的には、「グルメ」に関し、「〇〇レストランが閉店した」といった話題を排除し、「この辺りで、お気に入りのお店はありますか?」や、「最近お気に入りの料理があれば、教えてください。」といった話題をスピーカ400から出力する。
【0037】
<エージェントシステム1Aの処理>
図9を用いて、本実施形態に係るエージェントシステム1Aの処理について説明する。
【0038】
まず、マイク200によって、車室内にいる乗員の会話等の音声情報の収集を行う(ステップS210)。
【0039】
次いで、マイク200によって収集された乗員の音声情報が解釈部110へ出力され、解釈部110は、マイク200から取得した音声情報に含まれる乗員の発話の内容について解釈を行う(ステップS220)。
【0040】
制御部150Aは、解釈された発話内容と発話者である乗員の声色とを紐付け(ステップS230)、解釈された発話内容とともに、発話者別に分類して記憶部120に格納する(ステップS240)。
【0041】
制御部150Aは、乗員の携帯端末300と通信部130との間で通信を行い、情報取得部140は、乗員の携帯端末300から、乗員の情報を取得する(ステップS250)。
【0042】
制御部150Aは、情報取得部140が取得した乗員の情報から、検索ワードの傾向が特徴的な乗員を受話者として決定し(ステップS260)、該受話者が最も検索を行ったワードに関する事柄を話題内容として決定する(ステップS270)。
【0043】
制御部150Aは、検索傾向から決定した話題内容のうち、ネガティブな話題を排除した話題内容を決定し(ステップS280)、車室内に音声データとしてスピーカ400から受話者に向けて出力する(ステップS290)。
【0044】
<作用・効果>
以上、説明したように、本実施形態に係るエージェントシステム1Aの制御部150Aは、情報取得部160が乗員の携帯端末300から乗員の情報を取得し、検索ワードの履歴情報から、検索ワードの傾向が特徴的な乗員を受話者として決定し、その受話者が最も検索を行ったワードに関する事柄を話題として決定し、車室内に設置されたスピーカ400から音声情報が出力するよう制御する。
つまり、制御部150Aは、情報取得部160が取得した乗員の検索ワードの履歴情報から、検索ワードの傾向が特徴的な乗員を抽出して、その乗員を受話者とし、その受話者が最も検索を行ったワードに関するテーマを話題として、車室内にスピーカ400を介して、話題を提示する。
そのため、検索ワードの傾向が特徴的な受話者が、最も検索を行ったワードに関するテーマを話題として出力することによって、他の乗員が、受話者が関心のあるテーマに反応し、会話の端緒となることによって、乗員間の会話が活発となることを期待することができる。
これにより、車室内にいる乗員同士の会話が円滑に進み、車室内を楽しい空間として演出することができる。
【0045】
また、本実施形態に係るエージェントシステム1Aの制御部150Aは、検索ワードの傾向が特徴的な乗員を受話者として、その受話者が最も検索を行ったワードに関するテーマが話題として決定された場合において、ネガティブな内容の話題を排除して、話題を決定し、車室内に設置されたスピーカ400から音声情報が出力するよう制御する。
つまり、制御部150Aは、検索ワードの傾向が特徴的な乗員を抽出して、その乗員を受話者とし、その受話者が最も検索を行ったワードに関するテーマから、ネガティブな話題を排除した内容を話題として、車室内にスピーカ400を介して、話題を提示する。
そのため、話題について最も興味を持っている乗員が、会話の端緒となって、発話を促し、その発話をきっかとして、受話者である乗員が他の乗員からの問いかけに応じたり、他の乗員が相槌を打ったりすることとなって、乗員同士の会話が活発になる。
これにより、車室内にいる乗員同士の会話が弾み、車室内の乗員同士の会話が円滑になることによって、車室内を楽しい空間に演出することができる。
【0046】
なお、制御部150、150A等の処理をコンピュータシステムが読み取り可能な記録媒体に記録し、この記録媒体に記録されたプログラムを制御部150、150A等に読み込ませ、実行することによって本発明のエージェントシステム1、1Aを実現することができる。ここでいうコンピュータシステムとは、OSや周辺装置等のハードウェアを含む。
【0047】
また、「コンピュータシステム」は、WWW(World Wide Web)システムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
【0048】
また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
【0049】
以上、この発明の実施形態について、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【符号の説明】
【0050】
1;エージェントシステム
1A;エージェントシステム
110;解釈部
120;記憶部
130;通信部
140;情報取得部
150;制御部
150A;制御部
200;マイク
300;携帯端末
400;スピーカ