特開2022-143513 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ パイオニア株式会社の特許一覧

特開2022-143513音出力制御装置、データ構造、音出力制御方法および音出力制御プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2022143513

(43)【公開日】2022-10-03

(54)【発明の名称】音出力制御装置、データ構造、音出力制御方法および音出力制御プログラム

(51)【国際特許分類】

G06F 16/635 20190101AFI20220926BHJP

G06F 3/16 20060101ALI20220926BHJP

G10L 13/10 20130101ALI20220926BHJP

【ＦＩ】

G06F16/635

G06F3/16 540

G10L13/10 114

【審査請求】未請求

【請求項の数】10

【出願形態】ＯＬ

(21)【出願番号】P 2021044053

(22)【出願日】2021-03-17

(71)【出願人】

【識別番号】000005016

【氏名又は名称】パイオニア株式会社

(74)【代理人】

【識別番号】100112656

【弁理士】

【氏名又は名称】宮田英毅

(72)【発明者】

【氏名】田淵大将

【テーマコード（参考）】

5B175

【Ｆターム（参考）】

5B175DA05

5B175HA01

(57)【要約】

【課題】現在出力されている音声コンテンツが属するカテゴリをユーザが適切に把握できるようサポートすること。
【解決手段】音出力制御装置１００は、ユーザに提供する情報として、複数の異なるカテゴリそれぞれに属するエージェント情報を出力可能なエージェント装置から、出力対象のエージェント情報を取得する情報取得部１３３と、出力対象のエージェント情報に対応する音声メッセージを報知部より出力させる報知制御部１３５とを備える。また、報知制御部１３５は、出力対象のエージェント情報が属するカテゴリに応じて、音声メッセージの態様を変化させて報知部より報知させる。
【選択図】図２

【特許請求の範囲】

【請求項1】

ユーザに提供する情報として、複数の異なるカテゴリのそれぞれに属するエージェント情報を出力可能なエージェント装置から、出力対象のエージェント情報を取得する情報取得部と、
前記出力対象のエージェント情報に対応する音声メッセージを報知部より出力させる報知制御部と、
を備え、
前記報知制御部は、前記出力対象のエージェント情報が属するカテゴリに応じて、前記音声メッセージの態様を変化させて前記報知部より報知させる
ことを特徴とする音出力制御装置。

【請求項2】

前記情報取得部は、それぞれがエージェント情報を提供可能な複数のアプリケーションを含む前記エージェント装置から、前記出力対象のエージェント情報を取得し、
前記報知制御部は、前記出力対象のエージェント情報が、前記複数のアプリケーションのうちいずれのアプリケーションから提供されたエージェント情報であるかに拘わらず、前記出力対象のエージェント情報が属するカテゴリに応じて、前記音声メッセージの態様を変化させる
ことを特徴とする請求項１に記載の音出力制御装置。

【請求項3】

前記報知制御部は、前記複数の異なるカテゴリのうち、前記出力対象のエージェント情報が属するカテゴリに応じた音効果が付加された状態で前記音声メッセージが報知されるよう前記報知部を制御する
ことを特徴とする請求項１または２に記載の音出力制御装置。

【請求項4】

前記報知制御部は、前記複数の異なるカテゴリのうち、前記出力対象のエージェント情報が属するカテゴリに応じて、前記音声メッセージの声の音色を変化させる
ことを特徴とする請求項１または２に記載の音出力制御装置。

【請求項5】

前記エージェント装置から取得される各エージェント情報には、当該エージェント情報が属するカテゴリを識別するカテゴリ識別情報が付与され、
前記報知制御部は、前記出力対象のエージェントに付与された前記カテゴリ識別情報が示すカテゴリに応じて、前記音声メッセージの態様を変化させる
ことを特徴とする請求項１～４のいずれか１つに記載の音出力制御装置。

【請求項6】

前記複数のアプリケーション間では、態様の異なる音効果が設定され、
前記報知制御部は、前記複数のアプリケーション間で異なる前記音効果のうち、前記出力対象のエージェント情報を提供した提供元のアプリケーションに応じた音効果が付加された状態で前記音声メッセージが報知されるよう前記報知部を制御する
ことを特徴とする請求項２に記載の音出力制御装置。

【請求項7】

前記エージェント装置から取得される各エージェント情報には、当該エージェント情報を提供した提供元のアプリケーションを識別するアプリ識別情報が付与され、
前記報知制御部は、前記複数のアプリケーションのうち、前記出力対象のエージェント情報に付与された前記アプリ識別情報が示すアプリケーションに応じた音効果が付加された状態で前記音声メッセージが報知されるよう前記報知部を制御する
ことを特徴とする請求項６に記載の音出力制御装置。

【請求項8】

ユーザに提供する情報として、複数の異なるカテゴリのそれぞれに属するエージェント情報を出力可能なエージェント装置から出力され、且つ音出力制御装置が前記ユーザへの報知処理を行う際に用いられるエージェント情報のデータ構造であって、
前記ユーザに報知すべき内容を示すメッセージ情報と、
前記カテゴリのうち、前記メッセージ情報に対応するカテゴリを識別するための識別情報と、
を有し、
前記識別情報は、前記音出力制御装置が前記メッセージ情報に対応する音声メッセージを出力させる際に、当該音声メッセージの出力態様を設定する処理に使用可能である
ことを特徴とするデータ構造。

【請求項9】

音出力制御装置が実行する音出力制御方法であって、
ユーザに提供する情報として、複数の異なるカテゴリのそれぞれに属するエージェント情報を出力可能なエージェント装置から、出力対象のエージェント情報を取得する情報ステップと、
前記出力対象のエージェント情報に対応する音声メッセージを報知部より出力させる報知制御ステップと、
を含み、
前記報知制御ステップは、前記出力対象のエージェント情報が属するカテゴリに応じて、前記音声メッセージの態様を変化させて前記報知部より報知させる
ことを特徴とする音出力制御方法。

【請求項10】

コンピュータを備える音出力制御装置によって実行される音出力制御プログラムであって、
前記コンピュータを、
ユーザに提供する情報として、複数の異なるカテゴリそれぞれに属するエージェント情報を出力可能なエージェント装置から、出力対象のエージェント情報を取得する情報取得手段と、
前記出力対象のエージェント情報に対応する音声メッセージを報知部より出力させる報知制御手段、
として機能させ、
前記報知制御手段は、前記出力対象のエージェント情報が属するカテゴリに応じて、前記音声メッセージの態様を変化させて前記報知部より報知させる
ことを特徴とする音出力制御プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、音出力制御装置、データ構造、音出力制御方法および音出力制御プログラムに関する。

【背景技術】

【0002】

従来、タスクの種別ごとに音色や口調が異なるエージェントが応答する技術が知られている。また、複数の要求処理装置ごとにエージェントの声色を変える技術が知られている。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開平８－３３９２８８号公報

【特許文献2】特開２０２０－６７７８５号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら、上記に従来技術では、ユーザは、現在出力されている音声コンテンツが所望するカテゴリに属する音声コンテンツであるのか否かを適切に認識することが困難な場合がある、という問題が一例として挙げられる。

【0005】

本発明は、上記に鑑みてなされたものであって、例えば現在出力されている音声コンテンツが属するカテゴリをユーザが適切に把握できるようサポートすることができる音出力制御装置、データ構造、音出力制御方法および音出力制御プログラムを提供することを目的とする。

【課題を解決するための手段】

【0006】

請求項１に記載の音出力制御装置は、ユーザに提供する情報として、複数の異なるカテゴリのそれぞれに属するエージェント情報を出力可能なエージェント装置から、出力対象のエージェント情報を取得する情報取得部と、前記出力対象のエージェント情報に対応する音声メッセージを報知部より出力させる報知制御部と、を備え、前記報知制御部は、前記出力対象のエージェント情報が属するカテゴリに応じて、前記音声メッセージの態様を変化させて前記報知部より報知させることを特徴とする。

【0007】

また、請求項８に記載のデータ構造は、ユーザに提供する情報として、複数の異なるカテゴリのそれぞれに属するエージェント情報を出力可能なエージェント装置から出力され、且つ音出力制御装置が前記ユーザへの報知処理を行う際に用いられるエージェント情報のデータ構造であって、前記ユーザに報知すべき内容を示すメッセージ情報と、前記カテゴリのうち、前記メッセージ情報に対応するカテゴリを識別するための識別情報と、を有し、前記識別情報は、前記音出力制御装置が前記メッセージ情報に対応する音声メッセージを出力させる際に、当該音声メッセージの出力態様を設定する処理に使用可能であることを特徴とする。

【0008】

また、請求項９に記載の音出力制御方法は、音出力制御装置が実行する音出力制御方法であって、ユーザに提供する情報として、複数の異なるカテゴリのそれぞれに属するエージェント情報を出力可能なエージェント装置から、出力対象のエージェント情報を取得する情報取得ステップと、前記出力対象のエージェント情報に対応する音声メッセージを報知部より出力させる報知制御ステップと、を含み、前記報知制御ステップは、前記出力対象のエージェント情報が属するカテゴリに応じて、前記音声メッセージの態様を変化させて前記報知部より報知させることを特徴とする。

【0009】

また、請求項１０に記載の音出力制御プログラムは、コンピュータを備える音出力制御装置によって実行される音出力制御プログラムであって、前記コンピュータを、ユーザに提供する情報として、複数の異なるカテゴリそれぞれに属するエージェント情報を出力可能なエージェント装置から、出力対象のエージェント情報を取得する情報取得手段と、前記出力対象のエージェント情報に対応する音声メッセージを報知部より出力させる報知制御手段、として機能させ、前記報知制御ステップは、前記出力対象のエージェント情報が属するカテゴリに応じて、前記音声メッセージの態様を変化させて前記報知部より報知させることを特徴とする。

【図面の簡単な説明】

【0010】

【図1】図１は、実施形態に係る情報処理の全体像を示す図である。

【図2】図２は、第１の実施形態に係る音出力制御装置の構成例を示す図である。

【図3】図３は、第１の実施形態に係るカテゴリ分類データベースの一例を示す図である。

【図4】図４は、第１の実施形態に係るコンテンツバッファの一例を示す図である。

【図5】図５は、第１の実施形態に係る音出力制御方法の一例を示す図である。

【図6】図６は、第１の実施形態に係る情報処理手順を示すフローチャートである。

【図7】図７は、第２の実施形態に係る音出力制御装置の構成例を示す図である。

【図8】図８は、第２の実施形態に係るアプリ分類データベースの一例を示す図である。

【図9】図９は、第２の実施形態に係る音出力制御方法の一例を示す図である。

【図10】図１０は、第２の実施形態に係る情報処理手順を示すフローチャートである。

【図11】図１１は、第３の実施形態に係る音出力制御装置の構成例を示す図である。

【図12】図１２は、第３の情報処理の一例を示す図である。

【図13】図１３は、音出力制御装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。

【発明を実施するための形態】

【0011】

以下に、図面を参照しつつ、本発明を実施するための形態（以下、実施形態）について説明する。なお、以下に説明する実施の形態によって本発明が限定されるものではない。さらに、図面の記載において、同一の部分には同一の符号を付している。

【0012】

（実施形態の概要）
〔１．はじめに〕
車両に設置される端末装置（ナビゲーション端末）や、ユーザ（例えば、車両の搭乗者）が所有するスマートフォン等の端末装置を介して、各種のコンテンツを提供するアプリケーション（以下、「アプリ」と略す）が知られている。例えば、ユーザをアシストするエージェント機能を有することで、車両の走行状態や車両を運転しているユーザの状況に応じて運転をアシストしたり、各種入力（例えば、文字入力や音声入力）に従って道案内をアシストしたりするアプリが存在する。また、車両の走行に合わせて観光案内や店舗案内あるいはその他のお役立ち情報等といった各種コンテンツを提供することでより快適な運転をアシストするアプリも存在する。

【0013】

また、係るアプリの多くは、出力先のユーザが車両の搭乗者であることを考慮して、安全面から音声エージェント機能による音声コンテンツを用いてユーザをアシストしようとする。このような場合、例えば、乗車中のユーザについて複数のアプリが紐づき、また、様々なカテゴリの音声コンテンツが提供されることになるため、以下のような問題が発生する場合がある。

【0014】

例えば、第１の課題として、様々なカテゴリの音声コンテンツが出力されると、所望しているカテゴリの音声コンテンツが出力されることをユーザが待機しているといった場合に、ユーザは、現在出力されている音声コンテンツが所望しているカテゴリの音声コンテンツであるのか否かを把握することが困難になることが挙げられる。

【0015】

また、第２の課題として、様々なアプリ種別の音声コンテンツが出力されると、例えば、複数アプリのうち特定のアプリにより提供された音声コンテンツが出力されることをユーザが待機しているといった場合に、ユーザは、現在出力されている音声コンテンツが所望している種別の音声コンテンツであるのか否かを把握することが困難になることが挙げられる。

【0016】

また、第３の課題として、複数のアプリを利用する場合に、音声コンテンツの提供元がいずれのアプリであるかの区別がしづらいために、ユーザは、自分の嗜好に応じたアプリを特定することが困難になることが挙げられる。

【0017】

そこで、本発明は、上記の課題を解決することができる音出力制御装置、データ構造、音出力制御方法および音出力制御プログラムを提供することを目的とする。以下では、本発明に相当する音出力制御装置、データ構造、音出力制御方法および音出力制御プログラムによって実現される情報処理として、３つの情報処理（第１の情報処理、第２の情報処理、第３の情報処理）について詳細に説明する。具体的には、第１の実施形態に係る情報処理として第１の情報処理を説明し、第２の実施形態に係る情報処理として第２の情報処理を説明する。また、第３の実施形態に係る情報処理として第３の情報処理を説明する。

【0018】

〔２．実施形態に係る情報処理の全体像〕
各実施形態の説明に先立って、図１を用いて、実施形態に係る情報処理の全体像について説明する。図１は、実施形態に係る情報処理の全体像を示す図である。図１に示す情報処理システム１（実施形態に係る情報処理システムの一例）は、第１の実施形態、第２の実施形態および第３の実施形態について共通するものである。また、以降の説明において、第１の実施形態、第２の実施形態、第３の実施形態を区別する必要がない場合には、単に「実施形態」と表記する場合がある。

【0019】

図１の例によれば、実施形態に係る情報処理システム１は、端末装置１０と、状況把握装置３０と、エージェント装置６０－ｘと、音出力制御装置１００とを含む。また、情報処理システム１に含まれるこれら各装置は、ネットワークを介して有線または無線により通信可能に接続される。

【0020】

（端末装置について）
端末装置１０は、ユーザによって利用される情報処理端末である。端末装置１０は、例えば、車両に設置される据え置き型のナビゲーション装置であってもよいし、ユーザが所有する携帯型端末装置（例えば、スマートフォン、タブレット型端末、ノート型ＰＣ、デスクトップＰＣ、ＰＤＡ等）であってよい。本実施形態では、端末装置１０は、車両に設置されるナビゲーション装置であるものとする。

【0021】

また、図１の例では、端末装置１０には、複数のアプリが紐づいているものとする。例えば、端末装置１０には、複数のアプリがユーザによってインストールされていることにより紐付けられていてもよいし、インストールの有無に拘わらず各種コンテンツをプッシュ通知可能なアプリが情報処理システム１に含まれることにより紐付けが行われていてもよい。

【0022】

また、端末装置１０は、報知部（出力部）を有しており、この報知部から各アプリによって提供される音声コンテンツが出力される。このようなことから、報知部とは、例えば、スピーカーであってよい。また、ここでいうユーザとは、端末装置１０が設置される車両の搭乗者（例えば、運転手）であってよい。すなわち、図１の例では、端末装置１０は、車両ＶＥ１に設置されるとともに、当該端末装置１０のユーザが車両ＶＥ１を運転中のユーザＵ１である例が示される。

【0023】

（エージェント装置について）
エージェント装置６０－ｘは、端末装置１０に紐づくアプリごとに存在し、当該アプリの機能や役割を実現する情報処理装置であってよい。図１では、エージェント装置６０－ｘがサーバ装置である例が示されるが例えばクラウドシステムによって実現されてもよい。

【0024】

また、端末装置１０に紐づくアプリは、音声コンテンツを用いてユーザをアシストするアプリケーションであってよく、エージェント装置６０－ｘは、このアシスト機能に対応する音声エージェント機能を有する。また、このようなことから端末装置１０に紐づくアプリは、所謂、音声エージェントアプリといえる。

【0025】

また、以下の実施形態において、アプリＡＰｘに対応するエージェント装置６０－ｘ、エージェント装置６０－ｘが有する処理部（例えば、アプリ制御機能６３１－ｘ、エージェント情報生成部６３２－ｘ）を区別して表記する場合には、「ｘ」に対して任意の値を用いることにする。

【0026】

例えば、図１には、エージェント装置６０－ｘの一例としてエージェント装置６０－１が示される。エージェント装置６０－１は、アプリＡＰ１（危険察知アプリ）に対応するエージェント装置であり、運転における危険を察知し注意や警告を示す音声コンテンツをユーザに提供する。また、図１の例によれば、エージェント装置６０－ｘは、アプリ制御機能６３１－１と、エージェント情報生成部６３２－１とを有する。

【0027】

また、図１には、エージェント装置６０－ｘの他の一例としてエージェント装置６０－２が示される。エージェント装置６０－２は、アプリＡＰ２（ナビアプリ）に対応するエージェント装置であり、経路案内に関する音声コンテンツをユーザに提供する。図１では不図示であるが、エージェント装置６０－２は、アプリ制御機能６３１－２と、エージェント情報生成部６３２－２とを有してよい。

【0028】

なお、端末装置１０に紐づくアプリは、上記例に限定されず、例えば、観光案内に関する音声コンテンツ、店舗案内に関する音声コンテンツ、あるいは、各種のお役立ち情報を提供するものが他にも挙げられる。また、「アプリが提供する」との表現は、このアプリに対応する「エージェント装置６０－ｘが提供する」との概念を含むものとする。

【0029】

続いて、エージェント装置６０－ｘの機能について説明する。図１の例によれば、エージェント装置６０－ｘは、アプリ制御機能６３１－ｘ、エージェント情報生成部６３２－ｘを有する。

【0030】

アプリ制御機能６３１－ｘは、アプリＡＰｘに関する各種制御を実行する。例えば、アプリ制御機能６３１－ｘは、ユーザによる利用履歴に基づいて、ユーザごとに提供するコンテンツのパーソナライズ化を行う。また、アプリ制御機能６３１－ｘは、ユーザとの対話を実現できるよう、ユーザに入力された音声が示す発話内容に基づき、どのような内容の音声メッセージで応答すべきかを判定する処理を行う。また、アプリ制御機能６３１－ｘは、ユーザの状況に基づき、ユーザに提供するコンテンツや、ユーザに応答する音声メッセージの内容を決定することもできる。

【0031】

エージェント情報生成部６３２－ｘは、音声コンテンツ（エージェント情報の一例）を生成する生成処理を行う。例えば、エージェント情報生成部６３２－ｘは、後述する状況把握装置３０から受け付けたデータに基づいて、どのようなカテゴリに属する音声コンテンツを出力させるべきかを決定し、決定したカテゴリに属する内容の音声コンテンツを生成する。例えば、エージェント情報生成部６３２－ｘは、状況把握装置３０によって把握された車両の走行状態や車両を運転しているユーザの状況に応じた内容のメッセージ情報を生成する。なお、メッセージ情報は、最終的にユーザＵ１に報知される音声コンテンツの基となる例えばテキストデータであって、後に音声データに変換されて得られる音声の内容を定義するものである。すなわち、エージェント情報生成部６３２－ｘは、音声コンテンツとして音声データを生成することに限定されず、音声コンテンツとして、音声メッセージの基となる他の形式のデータを生成してもよい。また、エージェント情報生成部６３２－ｘは、生成したメッセージ情報が示す内容に基づいて、メッセージ情報が属するカテゴリを識別するカテゴリ識別情報（カテゴリＩＤ）を決定する。なお、メッセージ情報が属するカテゴリとは、メッセージ情報を含む音声コンテンツが属するカテゴリともいえる。

【0032】

また、エージェント情報生成部６３２－ｘは、エージェント装置６０－ｘに対応するアプリＡＰｘを識別するアプリ識別情報（アプリＩＤ）を音声コンテンツに付与する。

【0033】

エージェント装置６０－１を例に挙げると、エージェント情報生成部６３２－１は、エージェント装置６０－１に対応するアプリＡＰ１を識別するアプリＩＤ（例えば、「ＡＰ１」）を音声コンテンツに付与する。また、エージェント情報生成部６３２－１は、生成したこの音声コンテンツがカテゴリ「エンタメ」に属する場合には、カテゴリ「エンタメ」を示すカテゴリＩＤを音声コンテンツに付与する。すなわち、エージェント情報生成部６３２－１は、生成したメッセージ情報に、当該メッセージ情報の生成元を識別するためのアプリＩＤと、当該メッセージ情報の内容を識別するためのカテゴリＩＤを付加することで音声コンテンツとしてのエージェント情報を生成する。言い換えれば、エージェント情報生成部６３２－１により生成される音声コンテンツとしてのエージェント情報には、当該エージェント情報を提供した提供元のアプリケーションを識別するアプリ識別情報、及び当該エージェント情報が属するカテゴリを識別するカテゴリ識別情報が付与されている。

【0034】

また、エージェント情報生成部６３２－ｘは、上記例に限らず、例えば端末装置１０を介して発話による音声入力がユーザによって行われた場合には、入力された音声に応答する内容のメッセージ情報を生成してもよい。これにより、エージェント装置６０－ｘは、ユーザとの対話を実現可能な音声コンテンツを生成することができるようになる。

【0035】

また、さらにエージェント情報生成部６３２－ｘは、音声コンテンツを出力させるタイミングも指定することができる。例えば、エージェント情報生成部６３２－ｘは、時刻範囲、車両の走行距離範囲、車両の通過エリア、車両の速度等を用いて、音声コンテンツの出力を許容する時間的範囲、または地理的範囲を指定する許容範囲情報を生成することができる。また、係る場合、エージェント情報生成部６３２－ｘは、音声コンテンツと許容範囲情報とを音出力制御装置ＳＶに送信することにより、許容範囲情報で示される条件に合致した車両の端末装置１０に音声コンテンツを出力させるよう音出力制御装置ＳＶにリクエスト（予約）する。タイミング指定やリクエストについては、エージェント情報生成部６３２－ｘ以外の処理部によって行われてもよい。

【0036】

（状況把握装置について）
状況把握装置３０は、車両の走行状態や車両を運転しているユーザの状況を把握するための分析処理を行う。図１では、状況把握装置３０がサーバ装置である例が示されるが例えばクラウドシステムによって実現されてもよい。また、図１の例によれば、係る分析処理は、状況把握装置３０に搭載される状況把握エンジンＥ３０によって行われる。例えば、状況把握エンジンＥ３０は、各種センサから得られたセンサ情報に基づき、走行状態やユーザ状況のセンシングを行う。なお、ここでいうセンサは、例えば、車両に備えられたセンサや端末装置１０が有するセンサであってよく、加速度センサ、ジャイロセンサ、磁気センサ、ＧＰＳ、カメラ、マイク等が一例として挙げられる。

【0037】

例えば、状況把握エンジンＥ３０は、次のような一連の分析処理を行うことができる。例えば、状況把握エンジンＥ３０は、上記のセンサから取得したセンサ情報に基づき、センシングを行うとともに、センシング結果をコア要素として用いることで、ベース分析を行う。ベース分析では、状況把握エンジンＥ３０は、コア要素を情報源として必要なデータを抽出し、抽出したデータの変換および加工を行う。続いて、状況把握エンジンＥ３０は、変換および加工後のデータを用いて高次分析を行う。高次分析では、状況把握エンジンＥ３０は、変換および加工後のデータに基づいて、具体的な状況の分析を行う。例えば、状況把握エンジンＥ３０は、変換および加工後のデータから、車両にかかる衝撃の状況、車両照明の状況、走行状態の変化、ユーザ自身の状況等といった各種の状況把握を行う。また、状況把握エンジンＥ３０は、状況把握として、ユーザの行動予測（例えば、立ち寄り地の予測）を行うこともできる。

【0038】

（音出力制御装置について）
音出力制御装置ＳＶは、実施形態に係る情報処理を行う。具体的には、音出力制御装置ＳＶは、実施形態に係る情報処理として、後述する、第１の実施形態に係る情報処理（第１の情報処理）、第２の実施形態に係る情報処理（第２の情報処理）、第３の実施形態に係る情報処理（第３の情報処理）をそれぞれ行う。また、実施形態に係る情報処理とは、端末装置１０が有する報知部より音声メッセージを出力させる報知制御に関する処理である。図１では、音出力制御装置ＳＶがサーバ装置である例が示されるが例えばクラウドシステムによって実現されてもよい。

【0039】

また、図１に示すように、実施形態に係る各情報処理は、音出力制御装置ＳＶに搭載される情報整合エンジンＥＳＶによって行われる。情報整合エンジンＥＳＶには、図１に示すように、リクエストマネージャ機能ＥＳＶ１、レスポンスマネージャ機能ＥＳＶ２といった機能が含まれる。

【0040】

リクエストマネージャ機能ＥＳＶ１は、エージェント装置６０－ｘからリクエストを受け付けて、受け付けたリクエストに応じたキューイングを行う。なお、ここでいうリクエストとは、生成した音声コンテンツをユーザに向けて出力するよう要求する出力要求であってよく、例えば音声コンテンツを含んだ状態で送信される。また、リクエストマネージャ機能ＥＳＶ１は、受け付けた音声コンテンツをコンテンツバッファ１２２内（図４）でキューイングする。

【0041】

レスポンスマネージャ機能ＥＳＶ２は、状況把握装置３０によって把握された状況に関するデータ（例えば、分析処理の結果を示すデータ）や、リスエストに含まれる許容範囲情報に基づいて、出力予約された音声コンテンツを実際にどのような順で出力させるか優先順位を決定する。そして、レスポンスマネージャ機能ＥＳＶ２は、決定した優先順位で各音声コンテンツを出力するよう端末装置１０に対して出力制御する。なお、端末装置１０に対する出力制御は、端末装置１０が有する報知部に対する出力制御の概念を含むものとする。

【0042】

〔３．実施形態に係る情報処理の流れ〕
ここまで、情報処理システム１に含まれる各装置にフォーカスして説明してきた。続いて、情報処理システム１内で行われる実施形態に係る情報処理の全体的な流れについて説明する。ここでは、車両ＶＥ１を運転中のユーザＵ１に対して、車両ＶＥ１に設置される端末装置１０を介して音声コンテンツが出力される場面を想定する。

【0043】

係る場面では、端末装置１０は、自装置が有するセンサにより検出されたセンサ情報を随時、状況把握装置３０に送信している（ステップＳ１１）。

【0044】

状況把握装置３０の状況把握エンジンＥ３０は、端末装置１０から送信されたセンサ情報が取得されると、車両ＶＥ１の走行状態や車両ＶＥ１を運転しているユーザＵ１の状態をはじめとする各種状況を把握するための分析処理を行う（ステップＳ１２）。例えば、状況把握エンジンＥ３０は、センサ情報を用いたセンシング、センシング結果をコア要素として用いたベース分析、ベース分析の結果得られたデータを用いた高次分析、といった一連の分析処理を行うことで詳細な状況把握を行う。

【0045】

また、状況把握装置３０は、分析処理が終了すると、状況把握エンジンＥ３０によって把握された状況に関するデータ（例えば、分析処理の結果を示すデータ）をエージェント装置６０－ｘに送信する（ステップＳ１３）。図１の例では、状況把握装置３０は、エージェント装置６０－１、エージェント装置６０－２等の各エージェント装置６０－ｘに対して状況に関するデータを送信する。

【0046】

エージェント装置６０－ｘのエージェント情報生成部６３２－ｘは、状況把握装置３０から状況に関するデータが取得されると、係るデータに基づいて、出力対象の音声コンテンツを生成する生成処理を行う（ステップＳ１４）。例えば、エージェント情報生成部６３２－ｘは、取得されたデータに基づいて、自装置が対応可能なカテゴリのうち、いずれのカテゴリに属する音声コンテンツを出力させるべきかを決定し、決定したカテゴリに属する内容の音声コンテンツを生成する。例えば、エージェント情報生成部６３２－ｘは、取得されたデータが示す状況に応じた内容のメッセージ情報（テキストデータ）を生成する。

【0047】

また、エージェント情報生成部６３２－ｘは、生成した音声コンテンツに対して、音声コンテンツが属するカテゴリ（メッセージ情報が属するカテゴリ）を識別するカテゴリＩＤ、および、自装置に対応するアプリＡＰｘを識別するアプリＩＤを付与した状態で音出力制御装置ＳＶに送信する（ステップＳ１５）。

【0048】

図１の例では、ステップＳ１４の生成処理がエージェント装置６０－１、エージェント装置６０－２等の各エージェント装置６０－ｘによって行われたことで、ステップＳ１５では各エージェント装置６０－ｘが自己の音声コンテンツを音出力制御装置ＳＶに送信する例が示される。

【0049】

続いて、音出力制御装置ＳＶの情報整合エンジンＥＳＶは、出力対象の音声コンテンツが取得されると、出力対象の音声コンテンツに対して報知制御処理を行う（ステップＳ１６）。例えば、情報整合エンジンＥＳＶは、出力対象の音声コンテンツに含まれるメッセージ情報を音声データ（音声メッセージ）に変換する際に、当該音声コンテンツが属するカテゴリに応じて音声の態様を変化させつつ変換し、変換後の音声データが報知されるよう報知制御する。また、例えば、情報整合エンジンＥＳＶは、出力対象の音声コンテンツがどのようなアプリに属するかアプリ種別に応じた音効果（例えば背景音）を、変換後の音声データ（音声メッセージ）に付加した状態で報知されるよう報知制御する。このような報知制御処理について、後述する第１の実施形態および第２の実施形態で詳細に説明する。

【0050】

最後に、音出力制御装置ＳＶは、情報整合エンジンＥＳＶによる報知制御に応じて、端末装置１０に対して音出力制御を行う（ステップＳ１７）。具体的には、音出力制御装置ＳＶは、情報整合エンジンＥＳＶによって報知制御された音声データが端末装置１０の報知部により出力されるよう端末装置１０を制御する。

【0051】

（第１の実施形態）
〔１．第１の実施形態の概要〕
ここからは、第１の実施形態について説明する。第１の実施形態に係る情報処理（すなわち第１の情報処理）は、上述した第１の課題を解決することを目的として行われる。具体的には、第１の情報処理は、図１に示した音出力制御装置ＳＶに対応する音出力制御装置１００によって行われる。音出力制御装置１００は、第１の実施形態に係る音出力制御プログラムに従って、第１の情報処理を行う。また、音出力制御装置１００は、カテゴリ分類データベース１２１（図３）およびコンテンツバッファ１２２（図４）から成る構造を有する。

【0052】

〔２．第１の実施形態に係る音出力制御装置の構成〕
次に、図２を用いて、第１の実施形態に係る音出力制御装置１００について説明する。図２は、第１の実施形態に係る音出力制御装置１００の構成例を示す図である。図２に示すように、音出力制御装置１００は、通信部１１０と、記憶部１２０と、制御部１３０とを有する。

【0053】

（通信部１１０について）
通信部１１０は、例えば、ＮＩＣ等によって実現される。そして、通信部１１０は、ネットワークと有線または無線で接続され、例えば、端末装置１０、状況把握装置３０、エージェント装置６０－ｘとの間で情報の送受信を行う。

【0054】

（記憶部１２０について）
記憶部１２０は、例えば、ＲＡＭ（Random Access Memory)、フラッシュメモリ等の半導体メモリ素子またはハードディスク、光ディスク等の記憶装置によって実現される。記憶部１２０は、カテゴリ分類データベース１２１と、コンテンツバッファ１２２とを有する。

【0055】

（カテゴリ分類データベース１２１について）
カテゴリ分類データベース１２１は、アプリＡＰｘによって提供される音声コンテンツ（エージェント情報）が属するカテゴリに関する情報を記憶する。ここで、図３に第１の実施形態に係るカテゴリ分類データベース１２１の一例を示す。図３の例では、カテゴリ分類データベース１２１は、「カテゴリＩＤ」と、「カテゴリ」と、「音色特徴」といった項目を有する。

【0056】

「カテゴリＩＤ」は、アプリＡＰｘ側から提供された出力対象の音声コンテンツがいずれのカテゴリに属するかを特定するために用いられる候補の「カテゴリ」を識別する識別情報を示す。

【0057】

「カテゴリ」は、アプリ側から提供された出力対象の音声コンテンツがいずれのカテゴリに属するかを特定するために用いられる候補の「カテゴリ」である。図３の例では、候補の「カテゴリ」には、「注意」、「警告」、「エンタメ」、「広告」、「案内」、「ニュース」等が存在する。なお、出力対象の音声コンテンツを提供した提供元のアプリが異なる場合であっても、この出力対象の音声コンテンツ自体はそれぞれ同一のカテゴリに属している状況が存在する。一例を挙げると、アプリＡＰ１およびアプリＡＰ５といったそれぞれ異なるアプリが出力対象の音声コンテンツを提供した場合であっても、この出力対象の音声コンテンツが、いずれもカテゴリ「エンタメ」に属する場合がある。

【0058】

「音色特徴」は、出力対象の音声コンテンツが属するカテゴリに応じて、この音声コンテンツに対応する音声を端末装置１０の報知部から出力させる際の、音声の音色を変化させる報知制御処理で用いられる候補の音色パラメータを示す。

【0059】

図３の例では、カテゴリＩＤ「ＣＴ１」で識別されるカテゴリ「注意」に対して、音色特徴「男性の声＋ゆっくり」が対応付けられている。係る例は、出力対象の音声コンテンツがカテゴリ「注意」に属する場合には、端末装置１０の報知部から出力させる音声メッセージを「男性の声＋ゆっくり」という特徴の音色に変えるよう規定されている例を示す。したがって、係る例での音色パラメータは、「男性の声＋ゆっくり」を示すパラメータに相当する。

【0060】

また、図３の例では、カテゴリＩＤ「ＣＴ３」で識別されるカテゴリ「エンタメ」に対して、音色特徴「女性の声＋早口」が対応付けられている。係る例は、出力対象の音声コンテンツがカテゴリ「エンタメ」に属する場合には、端末装置１０の報知部から出力させる音声メッセージを「女性の声＋早口」という特徴の音色に変えるよう規定されている例を示す。したがって、係る例での音色パラメータは、「女性の声＋早口」を示すパラメータに相当する。

【0061】

（コンテンツバッファ１２２）
コンテンツバッファ１２２は、エージェント装置６０－ｘから送信された音声コンテンツに関する情報をキューイングするための記憶領域として機能する。ここで、図４に第１の実施形態に係るコンテンツバッファ１２２に記憶されるデータの一例を示す。図４の例では、コンテンツバッファ１２２は、「提供先ユーザＩＤ」、「アプリＩＤ」、「カテゴリＩＤ」、「音声コンテンツ」といった項目を有する。

【0062】

「提供先ユーザＩＤ」は、「音声コンテンツ」が出力（報知）される出力先のユーザ（または当該ユーザの端末装置１０）を識別する識別情報を示す。「アプリＩＤ」は、出力対象の「音声コンテンツ」を提供した提供元のアプリケーション（または、当該アプリケーションに対応するエージェント装置６０－ｘ）を識別する識別情報を示す。なお、提供元のアプリケーションは、出力対象の「音声コンテンツ」を生成した生成元のアプリケーションと言い換えることができる。

【0063】

「カテゴリＩＤ」は、「アプリＩＤ」で識別されるアプリケーションから提供された出力対象の「音声コンテンツ」が属するカテゴリを識別する識別情報を示す。「カテゴリＩＤ」は、「アプリＩＤ」で識別されるアプリケーションに対応するエージェント装置６０－ｘによって出力対象の「音声コンテンツ」に付与されたものである。

【0064】

「音声コンテンツ」は、「アプリＩＤ」で識別されるアプリケーションにより提供された出力対象の「音声コンテンツ」に関する情報である。「音声コンテンツ」は、例えば、メッセージ情報としてテキストデータを含む。

【0065】

すなわち、図４の例では、アプリＩＤ「ＡＰ１」で識別されるアプリケーション（アプリＡＰ１）により提供されたメッセージ情報♯１１の内容は、カテゴリＩＤ「ＣＴ３」で識別されるカテゴリに属するものであり、ユーザＩＤ「Ｕ１」で識別されるユーザ（ユーザＵ１）に対して出力されることになっている例を示す。

【0066】

（制御部１３０について）
図２に戻り、制御部１３０は、ＣＰＵ（Central Processing Unit）やＭＰＵ（Micro Processing Unit）等によって、音出力制御装置１００内部の記憶装置に記憶されている各種プログラム（例えば、音出力制御プログラム）がＲＡＭを作業領域として実行されることにより実現される。また、制御部１３０は、例えば、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）等の集積回路により実現される。

【0067】

図２に示すように、制御部１３０には、情報整合エンジンＥ１００が搭載される。情報整合エンジンＥ１００は、図１で説明した情報整合エンジンＥＳＶに対応する。情報整合エンジンＥ１００には、リクエストマネージャ機能Ｅ１０１（図１で説明したリクエストマネージャ機能ＥＳＶ１に対応）と、レスポンスマネージャ機能Ｅ１０２（図１で説明したレスポンスマネージャ機能ＥＳＶ２に対応）とが含まれる。

【0068】

また、図２に示すように、リクエストマネージャ機能Ｅ１０１は、リクエスト受付部１３１と、キューイング部１３２とを有する。また、レスポンスマネージャ機能Ｅ１０２は、情報取得部１３３と、決定部１３４と、報知制御部１３５を有する。

【0069】

（リクエスト受付部１３１について）
リクエスト受付部１３１は、エージェント装置６０－ｘからリクエストを受け付ける。具体的には、リクエスト受付部１３１は、出力対象の音声コンテンツをユーザに対して出力するよう要求するリクエストをエージェント装置６０－ｘから受け付ける。また、係るリクエストには、出力対象の音声コンテンツ、提供先のユーザを識別するユーザＩＤ、音声コンテンツの出力を許容する期間やタイミングを条件付ける許容範囲情報等が含まれてよい。

【0070】

（キューイング部１３２について）
キューイング部１３２は、リクエスト受付部１３１により受け付けられたリクエストに応じて、出力対象の音声コンテンツをキューイングする。例えば、キューイング部１３２は、リクエストに対応付けられた音声コンテンツをコンテンツバッファ１２２内にキューイングする。

【0071】

（情報取得部１３３について）
情報取得部１３３は、ユーザに提供する情報として、複数の異なるカテゴリのそれぞれに属する音声コンテンツ（エージェント情報）を出力可能なエージェント装置６０－ｘから、出力対象の音声コンテンツ（エージェント情報）を取得する。具体的には、情報取得部１３３は、複数のアプリケーションのそれぞれから提供されるエージェント情報を出力可能なエージェント装置６０－ｘであって、当該アプリケーションが有するエージェント機能に対応するエージェント装置６０－ｘのそれぞれから、複数の異なるカテゴリに属する音声コンテンツを取得してキューイング部１３２に引き渡す。

【0072】

（決定部１３４について）
決定部１３４は、リクエスト受付部１３１により受け付けられたリクエストに含まれる許容範囲情報に基づいて、出力予約された音声コンテンツを実際にどのような順で出力させるか優先順位を決定し、出力させるべきタイミングとなった音声コンテンツをコンテンツバッファ１２２から読み出す。

【0073】

（報知制御部１３５について）
報知制御部１３５は、エージェント装置６０－ｘから送信された音声コンテンツ（エージェント情報）に含まれるメッセージ情報を音声データに変換する。例えば、報知制御部１３５は、決定部１３４により出力することが決定された音声コンテンツについて、ＴｅｘｔｔｏＳｐｅｅｃｈ（ＴＴＳ）の技術を用いて、テキストデータを基に音声合成することで、メッセージ情報を音声データへ変換する。そして、メッセージ情報を変換することで得られた音声データ（音声メッセージ）を端末装置１０の報知部より出力させる。

【0074】

また、報知制御部１３５は、出力対象の音声コンテンツが属するカテゴリに応じて、音声メッセージの態様を変化させて報知部より報知させる。例えば、報知制御部１３５は、出力対象の音声コンテンツが、複数のアプリケーションのうちいずれのアプリケーションから提供された音声コンテンツであるかに拘わらず、出力対象の音声コンテンツが属するカテゴリに応じて音声合成の音色パラメータを変えることにより、変換する音声データの態様を変化させる。

【0075】

また、これまで説明したように、エージェント装置６０－ｘから取得される各音声コンテンツには、当該音声コンテンツが属するカテゴリを識別するカテゴリ識別情報（カテゴリＩＤ）が付与される。したがって、報知制御部１３５は、出力対象の音声コンテンツに付与されたカテゴリ識別情報が示すカテゴリに応じて、音声メッセージの態様を変化させる。

【0076】

例えば、報知制御部１３５は、複数の異なるカテゴリのうち、出力対象の音声コンテンツが属するカテゴリに応じて、音声メッセージの音色を変化させる。

【0077】

また、報知制御部１３５は、複数の異なるカテゴリのうち、出力対象の音声コンテンツが属するカテゴリに応じた音効果を付加した状態で音声データを報知部から報知させるようにしてもよい。なお、ここでいう音効果とは、音声メッセージの冒頭や末尾等に付加する効果音や、音声メッセージに重畳するバックグラウンドミュージック（ＢＧＭ）等の背景音を示す。

【0078】

一方で、複数のアプリケーション間では、態様の異なる音効果が設定されてよく、係る場合、報知制御部１３５は、複数のアプリケーション間で異なる音効果のうち、出力対象の音声コンテンツを提供した提供元のアプリケーションに応じた音効果が付加された状態で音声メッセージが報知部から報知されるようにしてもよい。具体的には、エージェント装置６０－ｘから取得される各音声コンテンツには、当該音声コンテンツを提供した提供元のアプリケーションを識別するアプリ識別情報（アプリＩＤ）が付与される。したがって、報知制御部１３５は、複数のアプリケーションのうち、出力対象の音声コンテンツに付与されたアプリ識別情報が示すアプリケーションに応じた音効果が付加された状態で音声メッセージが報知部から報知されるようにする。この点については、第２の実施形態で詳細に説明する。

【0079】

〔３．音出力制御方法の具体例〕
続いて、図５を用いて、第１の情報処理で行われる音出力制御方法の具体的な一例について説明する。図５は、第１の実施形態に係る音出力制御方法の一例を示す図である。

【0080】

図５には、複数のアプリとして、アプリＡＰ１、アプリＡＰ２、アプリＡＰ３、アプリＡＰ４、アプリＡＰ５（アプリＡＰ１～ＡＰ５）といった５つのアプリケーションが示される。また、図５には、アプリＡＰ１～ＡＰ５それぞれから提供される音声コンテンツを報知部に出力させることが可能なエージェント装置６０－ｘとして、エージェント装置６０－１、エージェント装置６０－２、エージェント装置６０－３、エージェント装置６０－４、エージェント装置６０－５が示される。具体的には、図５の例によれば、エージェント装置６０－１が、アプリＡＰ１に対応する音声コンテンツがユーザに提供されるようこれを出力させることが可能なエージェント装置である。また、エージェント装置６０－２が、アプリＡＰ２に対応する音声コンテンツがユーザに提供されるようこれを出力させることが可能なエージェント装置である。また、エージェント装置６０－３が、アプリＡＰ３に対応する音声コンテンツがユーザに提供されるようこれを出力させることが可能なエージェント装置である。また、エージェント装置６０－４が、アプリＡＰ４に対応する音声コンテンツがユーザに提供されるようこれを出力させることが可能なエージェント装置である。また、エージェント装置６０－５が、アプリＡＰ５に対応する音声コンテンツがユーザに提供されるようこれを出力させることが可能なエージェント装置である。

【0081】

また、図５の例によれば、エージェント装置６０－１は、カテゴリ「エンタメ」に属する音声コンテンツ、および、カテゴリ「広告」に属する音声コンテンツを出力させることが可能な装置である。また、エージェント装置６０－２は、カテゴリ「注意」に属する音声コンテンツ、および、カテゴリ「警告」に属する音声コンテンツを出力させることが可能な装置である。また、エージェント装置６０－３は、カテゴリ「案内」に属する音声コンテンツを出力させることが可能な装置である。また、エージェント装置６０－４は、カテゴリ「ニュース」に属する音声コンテンツ、および、カテゴリ「広告」に属する音声コンテンツを出力させることが可能な装置である。また、エージェント装置６０－５は、カテゴリ「注意」に属する音声コンテンツ、および、カテゴリ「エンタメ」に属する音声コンテンツを出力させることが可能な装置である。

【0082】

ここで、例えば、エージェント装置６０－１のエージェント情報生成部６３２－１は、状況把握装置３０から取得された状況に関するデータに基づき、カテゴリ「エンタメ」に属する内容のメッセージ情報に対応する音声コンテンツＡ－１を生成したとする。係る場合、エージェント装置６０－１は、音声コンテンツＡ－１がユーザＵ１に対して出力されるよう、図５に示すように、カテゴリ「エンタメ」を識別するカテゴリＩＤ「ＣＴ３」を音声コンテンツＡ－１に付与した状態で、音出力制御装置１００に送信する。また、このとき、エージェント装置６０－１は、音声コンテンツＡ－１を提供する提供元のアプリケーションであるアプリＡＰ１を識別するアプリＩＤ「ＡＰ１」をさらに付与してもよい。

【0083】

音出力制御装置１００の情報取得部１３３は、カテゴリＩＤ「ＣＴ３」が付与された音声コンテンツＡ－１を出力対象の音声コンテンツとしてエージェント装置６０－１から取得する。続いて、キューイング部１３２、決定部１３４による処理により、音声コンテンツＡ－１が、端末装置１０の報知部より出力させる音声コンテンツとして決定されると、報知制御部１３５は、決定された出力対象の音声コンテンツＡ－１に含まれるメッセージ情報について、音声コンテンツＡ－１が属するカテゴリに応じた音色パラメータを使用して音声合成を行うといった報知制御処理を行う。

【0084】

図５の例によれば、報知制御部１３５は、音声コンテンツＡ－１に付与されるカテゴリＩＤ「ＣＴ３」を、カテゴリ分類データベース１２１と照らし合わせることで、音声コンテンツＡ－１が属するカテゴリが「エンタメ」であることを特定することができる。また、報知制御部１３５は、カテゴリ分類データベース１２１を参照し、端末装置１０の報知部から出力させる音声メッセージを「女性の声＋早口」という特徴の音色に変えるよう規定されていることを認識する。そして、報知制御部１３５は、音声コンテンツＡ－１に含まれる音声データについて、「女性の声＋早口」を示すパラメータを使用して音声合成を行うことで、音声の音色を変化させる。

【0085】

続いて、報知制御部１３５は、音声コンテンツＡ－１の音声合成後の音声メッセージがユーザＵ１の端末装置１０の報知部より報知されるよう音出力制御を行う。例えば、報知制御部１３５は、ユーザＵ１の端末装置１０に対して、音声コンテンツＡ－１の音声合成後の音声メッセージを送信することで、音声コンテンツＡ－１に対応する音声メッセージを出力するよう制御する。端末装置１０は、報知制御部１３５からの音出力制御に応じて、当該音声メッセージを報知部より報知する。これにより、ユーザＵ１は、現在出力されている音声コンテンツがカテゴリ「エンタメ」に属するものであることを容易に把握することができるようになる。

【0086】

なお、報知制御部１３５は、音声コンテンツＡ－１がカテゴリ「エンタメ」に属することに応じて音声コンテンツＡ－１に対応する音声メッセージの音色を変えるだけでなく、音声コンテンツＡ－１がカテゴリ「エンタメ」に属することに応じた音効果（例えば、効果音やＢＧＭ等の背景音）を当該音声メッセージに付与してもよい。係る場合、例えば、図３に示すカテゴリ分類データベース１２１において、「カテゴリＩＤ」ごとに当該カテゴリＩＤが示すカテゴリに応じた音効果のデータが対応付けられるようにしておけばよい（図示せず）。

【0087】

次に、出力対象の音声コンテンツが、複数のアプリケーションのうちいずれのアプリケーションから提供された音声コンテンツであるかに拘わらず、出力対象の音声コンテンツが属するカテゴリに応じて、音声データの態様が変化させられる点について、音声コンテンツＡ－２およびＤ－３の例を用いて説明する。

【0088】

例えば、エージェント装置６０－１のエージェント情報生成部６３２－１は、状況把握装置３０から取得された状況に関するデータに基づき、カテゴリ「広告」に属する内容のメッセージ情報に対応する音声コンテンツＡ－２を生成したとする。係る場合、エージェント装置６０－１は、音声コンテンツＡ－２がユーザＵ１に対して出力されるよう、図５に示すように、カテゴリ「広告」を識別するカテゴリＩＤ「ＣＴ４」を音声コンテンツＡ－２に付与した状態で、音出力制御装置１００に送信する。このとき、エージェント装置６０－１は、音声コンテンツＡ－２を提供する提供元のアプリケーションであるアプリＡＰ１を識別するアプリＩＤ「ＡＰ１」をさらに付与してもよい。

【0089】

情報取得部１３３は、カテゴリＩＤ「ＣＴ４」が付与された音声コンテンツＡ－２を出力対象の音声コンテンツとしてエージェント装置６０－１から取得する。続いて、キューイング部１３２、決定部１３４による処理により、音声コンテンツＡ－２が、端末装置１０の報知部より出力させる音声コンテンツとして決定されると、報知制御部１３５は、決定された出力対象の音声コンテンツＡ－２に含まれるメッセージ情報について、音声コンテンツＡ－２が属するカテゴリに応じた音色パラメータを使用して音声合成を行うといった報知制御処理を行う。

【0090】

図５の例によれば、報知制御部１３５は、音声コンテンツＡ－２に付与されるカテゴリＩＤ「ＣＴ４」を、カテゴリ分類データベース１２１と照らし合わせることで、音声コンテンツＡ－２が属するカテゴリが「広告」であることを特定することができる。また、報知制御部１３５は、カテゴリ分類データベース１２１を参照し、端末装置１０の報知部から出力させる音声メッセージを「ロボットの声＋ゆっくり」という特徴の音色に変えるよう規定されていることを認識する。そして、報知制御部１３５は、音声コンテンツＡ－２に含まれる音声データについて、「ロボットの声＋ゆっくり」を示すパラメータを使用して音声合成を行うことで、音声の音色を変化させる。

【0091】

続いて、報知制御部１３５は、音声コンテンツＡ－２の音声合成後の音声メッセージがユーザＵ１の端末装置１０の報知部より報知されるよう音出力制御を行う。例えば、報知制御部１３５は、ユーザＵ１の端末装置１０に対して、音声コンテンツＡ－２の音声合成後の音声メッセージを送信することで、音声コンテンツＡ－２に対応する音声メッセージを出力するよう制御する。端末装置１０は、報知制御部１３５からの音出力制御に応じて、当該音声メッセージを報知部より報知する。これにより、ユーザＵ１は、現在出力されている音声コンテンツがカテゴリ「広告」に属するものであることを容易に把握することができるようになる。

【0092】

また、例えば、エージェント装置６０－４のエージェント情報生成部６３１－４は、状況把握装置３０から取得された状況に関するデータに基づき、カテゴリ「広告」に属する内容のメッセージ情報に対応する音声コンテンツＤ－３を生成したとする。係る場合、エージェント装置６０－４は、音声コンテンツＤ－３がユーザＵ１に対して出力されるよう、図５に示すように、カテゴリ「広告」を識別するカテゴリＩＤ「ＣＴ４」を音声コンテンツＤ－３に付与した状態で、音出力制御装置１００に送信する。このとき、エージェント装置６０－１は、音声コンテンツＤ－３を提供する提供元のアプリケーションであるアプリＡＰ４を識別するアプリＩＤ「ＡＰ４」をさらに付与してもよい。

【0093】

情報取得部１３３は、カテゴリＩＤ「ＣＴ４」が付与された音声コンテンツＤ－３を出力対象の音声コンテンツとしてエージェント装置６０－４から取得する。続いて、キューイング部１３２、決定部１３４による処理により、音声コンテンツＤ－３が、端末装置１０の報知部より出力させる音声コンテンツとして決定されると、報知制御部１３５は、決定された出力対象の音声コンテンツＤ－３に含まれるメッセージ情報について、音声コンテンツＤ－３が属するカテゴリに応じた音色パラメータを使用して音声合成を行うといった報知制御処理を行う。

【0094】

図５の例によれば、報知制御部１３５は、音声コンテンツＤ－３に付与されるカテゴリＩＤ「ＣＴ４」を、カテゴリ分類データベース１２１と照らし合わせることで、音声コンテンツＤ－３が属するカテゴリが「広告」であることを特定することができる。また、報知制御部１３５は、カテゴリ分類データベース１２１を参照し、端末装置１０の報知部から出力させる音声メッセージを「ロボットの声＋ゆっくり」という特徴の音色に変えるよう規定されていることを認識する。そして、報知制御部１３５は、音声コンテンツＤ－３に含まれる音声データについて、「ロボットの声＋ゆっくり」を示すパラメータを使用して音声合成を行うことで、音声の音色を変化させる。

【0095】

続いて、報知制御部１３５は、音声コンテンツＤ－３の音声合成後の音声メッセージがユーザＵ１の端末装置１０の報知部より報知されるよう音出力制御を行う。例えば、報知制御部１３５は、ユーザＵ１の端末装置１０に対して、音声コンテンツＤ－３の音声合成後の音声メッセージを送信することで、音声コンテンツＤ－３に対応する音声メッセージを出力するよう制御する。端末装置１０は、報知制御部１３５からの音出力制御に応じて、当該音声メッセージを報知部より報知する。これにより、ユーザＵ１は、現在出力されている音声コンテンツがカテゴリ「広告」に属するものであることを容易に把握することができるようになる。

【0096】

ここで、上記２例によれば、音声コンテンツを提供した提供元のアプリがアプリＡＰ１、アプリＡＰ４といったように異なる。しかしながら、双方から提供される各音声コンテンツは、共に同一カテゴリ（広告）に属することから、アプリの種別に拘わらず同一の態様（ロボットの声＋ゆっくり）に変化させられた状態で出力される。

【0097】

また、出力対象の音声コンテンツが、複数のアプリケーションのうちいずれのアプリケーションから提供された音声コンテンツであるかに拘わらず、出力対象の音声コンテンツが属するカテゴリに応じた音効果（例えば、効果音やＢＧＭ等の背景音）を当該音声コンテンツに付与してもよい。

【0098】

ここまで、図５に示される一部の音声コンテンツを例に挙げて、第１の情報処理で行われる音出力制御方法の具体的な一例を説明してきた。図５に示されるその他の音声コンテンツについても、一部の音声コンテンツの例に倣って説明可能であるため詳細な説明については省略する。

【0099】

〔４．処理手順〕
次に、図６を用いて、第１の実施形態に係る情報処理の手順について説明する。図６は、第１の実施形態に係る情報処理手順を示すフローチャートである。なお、図６のフローチャートに示すフローは、例えば、ユーザＵ１が車両ＶＥ１を運転している間、繰り返し実行される。

【0100】

まず、音出力制御装置１００の制御部１３０は、エージェント装置６０－ｘからエージェント情報を取得したか否かを判定する（ステップＳ１０１）。制御部１３０は、新たなエージェント情報を取得したと判定された場合には（ステップＳ１０１；Ｙｅｓ）、取得されたエージェント情報についてのキューイング処理を行う（ステップＳ１０２）。ステップＳ１０２においては、新たに取得したエージェント情報を既に取得済みのエージェント情報と共にキューイングし、音声メッセージとして出力させる優先順位を決定してステップＳ１０３に進む。一方、ステップＳ１０１において、エージェント装置６０－ｘから新たなエージェント情報を取得できていないと判定した場合は（ステップＳ１０１；Ｎｏ）、直接、ステップＳ１０３に進む。

【0101】

次に、制御部１３０は、エージェント装置６０－ｘから取得したエージェント情報（音声コンテンツ）のうち、出力すべきタイミングとなったエージェント情報が存在するか否かを判定する（ステップＳ１０３）。制御部１３０は、出力すべきタイミングとなったエージェント情報が存在しないと判定した場合は（ステップＳ１０３；Ｎｏ）、フローを一旦終了し、またフローをはじめから繰り返す。

【0102】

一方、制御部１３０は、出力すべきタイミングとなったエージェント情報が存在すると判定した場合には（ステップＳ１０３；Ｙｅｓ）、出力すべきエージェント情報に付与されるカテゴリＩＤに基づき、このエージェント情報が属するカテゴリを特定する（ステップＳ１０４）。例えば、制御部１３０は、出力すべきエージェント情報に付与されるカテゴリＩＤを、カテゴリ分類データベース１２１と照らし合わせることで、出力対象のエージェント情報が属するカテゴリを特定する。

【0103】

また、制御部１３０は、図３に示すカテゴリ分類データベース１２１の例のように、カテゴリ間で異なるよう設定される音色特徴（音色パラメータ）のうち、特定したカテゴリに対応する音色特徴を特定する（ステップＳ１０５）。

【0104】

そして、制御部１３０は、出力すべきエージェント情報に含まれるメッセージ情報を音声データに変換する際の音声合成のパラメータを、特定した音色パラメータ（出力すべきエージェント情報が属するカテゴリに応じた音色パラメータ）へと変更して音声変換を行う（ステップＳ１０６）。

【0105】

最後に、制御部１３０は、出力すべきエージェント情報に対応する音声データが当該エージェント情報の提供先として指定されているユーザの端末装置１０の報知部より報知されるよう音出力制御を行う（ステップＳ１０７）。その後、制御部１３０はフローをはじめから繰り返す。

【0106】

なお、図６のフローチャートにおいては、出力すべきタイミングとなったエージェント情報を特定した後に、当該特定されたエージェント情報に含まれるメッセージ情報を音声データに変換するという手順を説明したが、メッセージ情報を音声データに変換するタイミングはこれに限定されない。例えば、情報取得部１３３が新たなエージェント情報を取得したらすぐに、ステップＳ１０４～ステップＳ１０６に相当する音声データへの変換処理を実施してしまい、変換後の音声データを含む音声コンテンツについて、ステップＳ１０２及びステップＳ１０３に相当する、出力の優先順位の決定及び出力すべきタイミングの判定処理を行うようにしてもよい。

【0107】

〔５．まとめ〕
第１の実施形態に係る音出力制御装置１００は、ユーザに提供する情報として、複数の異なるカテゴリそれぞれに属するエージェント情報を出力可能なエージェント装置から、出力対象のエージェント情報を取得する。そして、音出力制御装置１００は、出力対象のエージェント情報に対応する音声メッセージを報知部より出力させる。具体的には、音出力制御装置１００は、出力対象のエージェント情報が属するカテゴリに応じて、音声メッセージの態様を変化させて報知部より報知させる。このような音出力制御装置１００によれば、ユーザは、現在出力されている音声コンテンツが所望しているカテゴリの音声コンテンツであるのか否かを容易に把握することができるようになる。

【0108】

（第２の実施形態）
〔１．第２の実施形態の概要〕
ここからは、第２の実施形態について説明する。第２の実施形態に係る情報処理（すなわち第２の情報処理）は、上述した第２の課題を解決することを目的として行われる。具体的には、第２の情報処理は、図１に示した音出力制御装置ＳＶに対応する音出力制御装置２００によって行われる。音出力制御装置２００は、第２の実施形態に係る音出力制御プログラムに従って、第２の情報処理を行う。また、音出力制御装置２００は、カテゴリ分類データベース１２１（図３）およびコンテンツバッファ１２２（図４）に加えて、アプリ分類データベース２３３から成る構造を有する。

【0109】

〔２．第２の実施形態に係る音出力制御装置の構成〕
次に、図７を用いて、第２の実施形態に係る音出力制御装置２００について説明する。図７は、第２の実施形態に係る音出力制御装置２００の構成例を示す図である。図７に示すように、音出力制御装置２００は、通信部１１０と、記憶部２２０と、制御部１３０とを有する。以下の説明において、音出力制御装置１００と同一符号が付された処理部については説明を省略する、もしくは、簡略化する場合がある。

【0110】

（記憶部２２０について）
記憶部２２０は、例えば、ＲＡＭ、フラッシュメモリ等の半導体メモリ素子またはハードディスク、光ディスク等の記憶装置によって実現される。記憶部２２０は、カテゴリ分類データベース１２１と、コンテンツバッファ１２２と、アプリ分類データベース２３３とを有する。

【0111】

（アプリ分類データベース２３３について）
アプリ分類データベース２３３は、音効果に関する情報を記憶する。ここで、図８に第２の実施形態に係るアプリ分類データベース２３３の一例を示す。図８の例では、アプリ分類データベース２３３は、「アプリＩＤ」、「アプリ種別」、「音効果」といった項目を有する。

【0112】

「アプリＩＤ」は、出力対象の「音声コンテンツ」を提供した提供元のアプリケーション（または、当該アプリケーションに対応するエージェント装置６０－ｘ）を識別する識別情報を示す。なお、提供元のアプリケーションは、出力対象の「音声コンテンツ」を生成した生成元のアプリケーションと言い換えることができる。「アプリ種別」は、「アプリＩＤ」により識別されるアプリケーションの種別に関する情報であって、例えば、アプリケーションの名称であってよい。また、「アプリ種別」は、「アプリＩＤ」により識別されるアプリケーションによって提供される出力対象の音声コンテンツ（エージェント情報）が属する種別に相当する。

【0113】

「音効果」は、出力対象の音声コンテンツを提供した提供元のアプリケーションに応じて、出力対象の音声コンテンツに対して重畳する背景音の候補であって、例えば、背景音は、効果音や音楽であってよい。

【0114】

図８の例では、アプリＩＤ「ＡＰ１」に対して音効果「効果音♯１」が対応付けられている。係る例は、出力対象の音声コンテンツを提供した提供元のアプリケーションがアプリＡＰ１である場合には、出力対象の音声コンテンツに含まれる音声データ（音声メッセージ）に背景音として効果音♯１を重畳した状態で報知させるよう規定されている例を示す。

【0115】

（情報取得部１３３について）
情報取得部１３３は、ユーザに提供する情報として、当該情報の内容または当該情報の提供元により区別される複数の種別の音声コンテンツを出力可能なエージェント装置から、出力対象の音声コンテンツを取得する。

【0116】

例えば、情報取得部１３３は、複数のアプリケーションそれぞれから提供される音声コンテンツを出力可能なエージェント装置６０－ｘであって、当該アプリケーションが有するエージェント機能に対応するエージェント装置６０－ｘから、出力対象の音声コンテンツを取得する。

【0117】

（報知制御部１３５について）
報知制御部１３５は、出力対象の音声コンテンツに対応する音声データを報知部より出力させる。

【0118】

また、報知制御部１３５は、出力対象の音声コンテンツが属する種別に応じた背景音を音声データに付加して報知部より報知させる。

【0119】

例えば、報知制御部１３５は、出力対象の音声コンテンツが属する種別として、出力対象の音声コンテンツを提供した提供元のアプリケーションに応じた背景音を音声データに付加して報知部より報知させる。このような場合、エージェント装置６０－ｘから取得される各音声コンテンツには、当該音声コンテンツを提供した提供元のアプリケーションを識別するアプリ識別情報が付与される。したがって、報知制御部１３５は、複数のアプリケーションのうち、出力対象の音声コンテンツに付与されたアプリ識別情報が示すアプリケーションに応じた背景音を音声データに付加して報知部より報知させる。

【0120】

また、複数の種別の音声コンテンツには、音声コンテンツの内容に基づき区別される複数の異なるカテゴリに属する音声コンテンツが含まれてよい。係る場合、情報取得部１３３は、複数の異なるカテゴリに属する音声コンテンツのうち、出力対象の音声コンテンツをエージェント装置６０－ｘから取得する。そうすると、報知制御部１３５は、複数の異なるカテゴリ間で異なる背景音のうち、出力対象の音声コンテンツが属するカテゴリに応じた背景音を音声メッセージに付加して報知部より報知させる。具体的な一例として、情報取得部１３３は、複数のアプリケーションそれぞれから提供される音声コンテンツを出力可能なエージェント装置６０－ｘであって、当該アプリケーションが有するエージェント機能に対応するエージェント装置６０－ｘから、出力対象の音声コンテンツを取得する。そして、報知制御部１３５は、出力対象の音声コンテンツが、複数のアプリケーションのうちいずれのアプリケーションから提供されたエージェント情報であるかに拘わらず、出力対象の音声コンテンツが属するカテゴリに応じた背景音を音声データに付加して報知部より報知させる。

【0121】

また、第１の実施形態で説明したように、報知制御部１３５は、複数の異なるカテゴリのうち、出力対象の音声コンテンツが属するカテゴリに応じた音色で、音声メッセージが報知されるよう報知部を制御してよい。係る場合、エージェント装置６０－ｘから取得される各音声コンテンツには、当該音声コンテンツが属するカテゴリを識別するカテゴリ識別情報が付与される。したがって、報知制御部１３５は、出力対象の音声コンテンツに付与されたカテゴリ識別情報が示すカテゴリに応じた音色で、音声データが報知されるよう報知部を制御する。

【0122】

〔３．音出力制御方法の具体例〕
続いて、図９を用いて、第２の情報処理で行われる音出力制御方法の具体的な一例について説明する。図９は、第２の実施形態に係る音出力制御方法の一例を示す図である。

【0123】

図９の多くは、図５の例に対応する。具体的には、図９には、複数のアプリとして、アプリＡＰ１、アプリＡＰ２、アプリＡＰ３、アプリＡＰ４、アプリＡＰ５（アプリＡＰ１～ＡＰ５）といった５つのアプリケーションが示される。また、図５には、アプリＡＰ１～ＡＰ５それぞれから提供される音声コンテンツを報知部に出力させることが可能なエージェント装置６０－ｘとして、エージェント装置６０－１、エージェント装置６０－２、エージェント装置６０－３、エージェント装置６０－４、エージェント装置６０－５が示される。各エージェント装置６０－ｘの説明についは省略する。

【0124】

ここで、例えば、エージェント装置６０－１のエージェント情報生成部６３２－１は、状況把握装置３０から取得された状況に関するデータに基づき、カテゴリ「エンタメ」に属する内容のメッセージ情報に対応する音声データを用いて音声コンテンツＡ－１を生成したとする。係る場合、エージェント装置６０－１は、音声コンテンツＡ－１がユーザＵ１に対して出力されるよう、図９に示すように、カテゴリ「エンタメ」を識別するカテゴリＩＤ「ＣＴ３」を音声コンテンツＡ－１に付与する。また、エージェント装置６０－１は、音声コンテンツＡ－１を提供する提供元のアプリケーションであるアプリＡＰ１を識別するアプリＩＤ「ＡＰ１」を音声コンテンツＡ－１にさらに付与する。そして、エージェント装置６０－１は、カテゴリＩＤおよびアプリＩＤを付与した音声コンテンツＡ－１を音出力制御装置２００に送信する。

【0125】

音出力制御装置２００の情報取得部１３３は、アプリＩＤ「ＡＰ１」およびカテゴリＩＤ「ＣＴ３」が付与された音声コンテンツＡ－１を出力対象の音声コンテンツとしてエージェント装置６０－１から取得する。続いて、キューイング部１３２、決定部１３４による処理により、音声コンテンツＡ－１が、端末装置１０の報知部より出力させる音声コンテンツとして決定されると、報知制御部１３５は、決定された出力対象の音声コンテンツＡ－１に含まれるメッセージ情報について、音声コンテンツＡ－１が属するカテゴリに応じた音色パラメータを使用して音声合成を行う。

【0126】

図９の例によれば、第１の実施形態と同様に、報知制御部１３５は、音声コンテンツＡ－１に付与されるカテゴリＩＤ「ＣＴ３」を、カテゴリ分類データベース１２１と照らし合わせることで、音声コンテンツＡ－１が属するカテゴリが「エンタメ」であることを特定することができる。また、報知制御部１３５は、カテゴリ分類データベース１２１を参照し、端末装置１０の報知部から出力させる音声メッセージを「女性の声＋早口」という特徴の音色に変えるよう規定されていることを認識する。そして、報知制御部１３５は、音声コンテンツＡ－１に含まれる音声データについて、「女性の声＋早口」を示すパラメータを使用して音声合成を行うことで、音声の音色を変化させる。

【0127】

第２の実施形態においては、これに加えて、音出力制御装置２００は音声コンテンツＡ－１を提供する提供元のアプリケーションに対応する背景音を音声メッセージに重畳して出力する。

【0128】

例えば、報知制御部１３５は、さらに、音声コンテンツＡ－１に付与されるアプリＩＤ「ＡＰ１」を、アプリ分類データベース２２３と照らし合わせることで、音声コンテンツＡ－１が属するアプリ種別が「アプリＡＰ１」であることを特定する。

【0129】

また、報知制御部１３５は、音声コンテンツＡ－１が属するアプリ種別が「アプリＡＰ１」であることに応じて、アプリ分類データベース２２３から効果音♯１を抽出する。そして、報知制御部１３５は、抽出した効果音♯１を背景音として音声合成後の音声メッセージに付加する。

【0130】

次に、報知制御部１３５は、上記のように音声合成および背景音の付加といった変換処理を行った後の音声コンテンツＡ－１がユーザＵ１の端末装置１０の報知部より報知されるよう音出力制御を行う。例えば、報知制御部１３５は、ユーザＵ１の端末装置１０に対して、変換処理後の音声コンテンツＡ－１を送信することで、変換処理後の音声コンテンツＡ－１を出力するよう制御する。端末装置１０は、報知制御部１３５からの音出力制御に応じて、変換処理後の音声コンテンツＡ－１を報知部より報知する。これにより、ユーザＵ１には、例えば、「ピッピッピッピッ…」といった効果音（効果音♯１の一例）を背景音として、「女性の声＋早口」の音声メッセージが出力される。すなわち、ユーザＵ１は、音声コンテンツのカテゴリに対応する音色の音声メッセージと、提供元のアプリケーションに対応する背景音を同時に聞くことができる。この結果、ユーザＵ１は、現在出力されている音声コンテンツがアプリＡＰ１から提供された「エンタメ」に関するものであることを容易に把握することができるようになる。

【0131】

続いて、図９に示す他の一例について説明する。例えば、エージェント装置６０－５のエージェント情報生成部６３１－５は、状況把握装置３０から取得された状況に関するデータに基づき、カテゴリ「注意」に属する内容のメッセージ情報に対応する音声データを用いて音声コンテンツＥ－１を生成したとする。係る場合、エージェント装置６０－５は、音声コンテンツＥ－１がユーザＵ１に対して出力されるよう、図９に示すように、カテゴリ「注意」を識別するカテゴリＩＤ「ＣＴ１」を音声コンテンツＥ－１に付与する。また、エージェント装置６０－５は、音声コンテンツＥ－１を提供する提供元のアプリケーションであるアプリＡＰ５を識別するアプリＩＤ「ＡＰ５」を音声コンテンツＥ－１にさらに付与する。そして、エージェント装置６０－５は、カテゴリＩＤおよびアプリＩＤを付与した音声コンテンツＡ－１を音出力制御装置２００に送信する。

【0132】

情報取得部１３３は、アプリＩＤ「ＡＰ５」およびカテゴリＩＤ「ＣＴ１」が付与された音声コンテンツＥ－１を出力対象の音声コンテンツとしてエージェント装置６０－５から取得する。続いて、キューイング部１３２、決定部１３４による処理により、音声コンテンツＥ－１が、端末装置１０の報知部より出力させる音声コンテンツとして決定されると、報知制御部１３５は、決定された出力対象の音声コンテンツＥ－１に含まれるメッセージ情報について、音声コンテンツＥ－１が属するカテゴリに応じた音色パラメータを使用して音声合成を行う。

【0133】

図９の例によれば、報知制御部１３５は、音声コンテンツＥ－１に付与されるカテゴリＩＤ「ＣＴ１」を、カテゴリ分類データベース１２１と照らし合わせることで、音声コンテンツＥ－１が属するカテゴリが「注意」であることを特定することができる。また、報知制御部１３５は、カテゴリ分類データベース１２１を参照し、端末装置１０の報知部から出力させる音声メッセージを「男性の声＋ゆっくり」という特徴の音色に変えるよう規定されていることを認識する。そして、報知制御部１３５は、音声コンテンツＥ－１に含まれる音声データについて、「男性の声＋ゆっくり」を示すパラメータを使用して音声合成を行うことで、音声の音色を変化させる。

【0134】

さらに報知制御部１３５は、音声コンテンツＥ－１に付与されるアプリＩＤ「ＡＰ５」を、アプリ分類データベース２２３と照らし合わせることで、音声コンテンツＥ－１が属するアプリ種別が「アプリＡＰ５」であることを特定することができる。

【0135】

また、報知制御部１３５は、音声コンテンツＥ－１が属するアプリ種別が「アプリＡＰ５」であることに応じて、アプリ分類データベース２２３から音楽♯５を抽出する。そして、報知制御部１３５は、抽出した音楽♯５を背景音として音声合成後の音声メッセージに付加する。

【0136】

次に、報知制御部１３５は、上記のように音声合成および背景音の付加といった変換処理を行った後の音声コンテンツＥ－１がユーザＵ１の端末装置１０の報知部より報知されるよう音出力制御を行う。例えば、報知制御部１３５は、ユーザＵ１の端末装置１０に対して、変換処理後の音声コンテンツＥ－１を送信することで、変換処理後の音声コンテンツＥ－１を出力するよう制御する。端末装置１０は、報知制御部１３５からの音出力制御に応じて、変換処理後の音声コンテンツＥ－１を報知部より報知する。これにより、ユーザＵ１には、音楽♯５を背景音として、「男性の声＋ゆっくり」の音声メッセージが出力される。すなわち、ユーザＵ１は、音声コンテンツのカテゴリに対応する音色の音声メッセージと、提供元のアプリケーションに対応する背景音を同時に聞くことができる。この結果、ユーザＵ１は、現在出力されている音声コンテンツがアプリＡＰ５から提供された「注意」に関するものであることを容易に把握することができるようになる。

【0137】

ここまで、図９に示される一部の音声コンテンツを例に挙げて、第２の情報処理で行われる音出力制御方法の具体的な一例を説明してきた。図９に示されるその他の音声コンテンツについても、一部の音声コンテンツの例に倣って説明可能であるため詳細な説明については省略する。

【0138】

〔４．処理手順〕
次に、図１０を用いて、第２の実施形態に係る情報処理の手順について説明する。図１０は、第２の実施形態に係る情報処理手順を示すフローチャートである。図１０に示すステップＳ１０１～Ｓ１０６については、図６の例と共通であるため説明を省略し、第２の実施形態に係る情報処理で新たに追加されるステップＳ２０７～Ｓ２１０について説明する。

【0139】

制御部１３０は、出力すべきエージェント情報に付与されるアプリＩＤに基づき、出力対象のエージェント情報が属するアプリ種別を特定する（ステップＳ２０７）。例えば、制御部１３０は、アプリＩＤを、アプリ分類データベース２２３と照らし合わせることで、出力対象のエージェント情報が属するアプリ種別を特定する。

【0140】

また、制御部１３０は、図８に示すアプリ分類データベース２２３の例のように、アプリ間で異なるよう設定される背景音のうち、特定したアプリ種別に対応する背景音を抽出する（ステップＳ２０８）。

【0141】

また、制御部１３０は、音声変換後のエージェント情報に対して、抽出した背景音を付加する（ステップＳ２０９）。

【0142】

最後に、報知制御部１３５は、背景音の付加後のエージェント情報がユーザＵ１の端末装置１０の報知部より報知されるよう音出力制御を行う（ステップＳ２１０）。

【0143】

なお、図１０のフローチャートにおいては、出力すべきタイミングとなったエージェント情報を特定した後に、当該特定されたエージェント情報に含まれるメッセージ情報を音声データに変換し、その後に背景音を付加するという手順を説明したが、メッセージ情報を音声データに変換するタイミング及び背景音を付加するタイミングはこれに限定されない。例えば、情報取得部１３３が新たなエージェント情報を取得したらすぐに、ステップＳ１０４～ステップＳ１０６に相当する音声データへの変換処理、及び、ステップＳ２０７～ステップＳ２０９に相当する背景音の付加処理を実施してしまい、背景音付加後の音声データを含む音声コンテンツについて、ステップＳ１０２およびステップＳ１０３に相当する、出力の優先順位の決定及び出力すべきタイミングの判定処理を行うようにしてもよい。

【0144】

なお、ここまで第２の実施形態として、音出力制御装置２００が、音声コンテンツのカテゴリに対応する音色の音声メッセージに、提供元のアプリケーションに対応する背景音を重畳して出力することを説明したが、他の例として、音出力制御装置２００は、提供元のアプリケーションに対応する音色の音声メッセージに、音声コンテンツが属するカテゴリに対応する背景音を重畳して出力するようにしてもよい。例えば、報知制御部１３５は、音声コンテンツの提供元のアプリケーションがアプリＡＰ１であり、且つ当該音声コンテンツに含まれるメッセージ情報がカテゴリ「エンタメ」に属する場合に、アプリＡ１に対応する音色パラメータを使用して音声合成を行い、且つカテゴリ「エンタメ」に対応する背景音を音声メッセージに付与してもよい。係る場合、例えば、図３に示すカテゴリ分類データベース１２１において、「カテゴリＩＤ」ごとに当該カテゴリＩＤが示すカテゴリに応じた背景音のデータが対応付けられ、また、図８に示すアプリ分類データベース２２３において、「アプリＩＤ」ごとに当該アプリＩＤが示すアプリ種別に応じた音声特徴（音声パラメータ）が対応付けられることとなる。

【0145】

この場合においても、ユーザＵ１は、提供元のアプリケーションに対応する音色の音声メッセージと、音声コンテンツのカテゴリに対応する背景音を同時に聞くことができる。この結果、ユーザＵ１は、現在出力されている音声コンテンツの提供元となるアプリケーションと、音声コンテンツのカテゴリを容易に把握することができるようになる。

【0146】

または、さらに他の例として、音出力制御装置２００は、音声メッセージの音声の音色については常に標準の音色に固定しておき、音声コンテンツのカテゴリに対応させて背景音のみを変更するようにしてもよい。すなわち、出力対象の音声コンテンツが、複数のアプリケーションのうちいずれのアプリケーションから提供された音声コンテンツであるかに拘わらず、出力対象の音声コンテンツが属するカテゴリに応じた背景音を付与するようにしてもよい。この場合においても、ユーザＵ１は、音声メッセージと同時に音声コンテンツのカテゴリに対応する背景音を聞くことができる。この結果、ユーザＵ１は、現在出力されている音声コンテンツが属するカテゴリを容易に把握することができるようになる。

【0147】

〔５．まとめ〕
第２の実施形態に係る音出力制御装置２００は、ユーザに提供する情報として、当該情報の内容または当該情報の提供元により区別される複数の種別のエージェント情報を出力可能なエージェント装置から、出力対象のエージェント情報を取得する。そして、音出力制御装置２００は、出力対象のエージェント情報に対応する音声メッセージを報知部より出力させる。具体的には、音出力制御装置２００は、出力対象のエージェント情報が属する種別に応じた背景音を音声メッセージに付加して報知部より報知させる。このような音出力制御装置２００によれば、ユーザは、現在出力されている音声コンテンツが所望している種別の音声コンテンツであるのか否かを容易に把握することができるようになる。

【0148】

（第３の実施形態）
〔１．第３の実施形態の概要〕
ここからは、第３の実施形態について説明する。第３の実施形態に係る情報処理（すなわち第３の情報処理）は、上述した第３の課題を解決することを目的として行われる。具体的には、第３の情報処理は、図１に示した音出力制御装置ＳＶに対応する音出力制御装置３００によって行われる。音出力制御装置３００は、第３の実施形態に係る音出力制御プログラムに従って、第３の情報処理を行う。

【0149】

〔２．第３の実施形態に係る音出力制御装置の構成〕
次に、図１１を用いて、第３の実施形態に係る音出力制御装置３００について説明する。図１１は、第３の実施形態に係る音出力制御装置３００の構成例を示す図である。図１１に示すように、音出力制御装置３００は、通信部１１０と、記憶部２２０と、制御部３３０とを有する。以下の説明において、音出力制御装置１００および２００と同一符号が付された処理部については説明を省略する、もしくは、簡略化する場合がある。

【0150】

（制御部３３０について）
制御部３３０は、ＣＰＵやＭＰＵ等によって、音出力制御装置３００内部の記憶装置に記憶されている各種プログラム（例えば、音出力制御プログラム）がＲＡＭを作業領域として実行されることにより実現される。また、制御部３３０は、例えば、ＡＳＩＣやＦＰＧＡ等の集積回路により実現される。

【0151】

図１１に示すように、制御部３３０は、提示制御部３３６と、音効果設定部３３７と、利用停止受付部３３８とをさらに有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部３３０の内部構成は、図１１に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部３３０が有する各処理部の接続関係は、図１１に示した接続関係に限られず、他の接続関係であってもよい。

【0152】

（提示制御部３３６について）
第２の実施形態で説明したように、報知制御部１３５は、複数のアプリケーションのうち、情報取得部１３３が取得した音声コンテンツの提供元であるアプリケーションに応じて、複数のアプリケーションの間で異なる音効果を付与した音声データを報知部より報知させる。そこで、提示制御部３３６は、複数のアプリケーションの各々に対応する音効果を示すアプリケーションリストをユーザに対して提示させるものである。

【0153】

例えば、提示制御部３３６は、アプリケーションリストを示す画像情報が表示部（端末装置１０の表示画面）を介してユーザに提示されるよう制御する。

【0154】

また、提示制御部３３６は、アプリケーションリストに含まれるアプリケーションの名称を示す音声メッセージを、当該アプリケーションに対応する音効果を付加した状態で報知部より報知させる。

【0155】

（音効果設定部３３７について）
音効果設定部３３７は、アプリケーションごとに、音効果を設定するためのユーザ操作を受付ける。

【0156】

（利用停止受付部３３８について）
利用停止受付部３３８は、ユーザに利用されている複数のアプリケーションのうち、任意のアプリケーションの利用を停止するためのユーザ操作を受付ける。例えば、利用停止受付部３３８は、アプリケーションリストに含まれるアプリケーションのうち、ユーザに選択されたアプリケーションの利用を停止する。

【0157】

〔３．第３の情報処理の具体例〕
続いて、図１２を用いて、提示制御部３３６、音効果設定部３３７、および、利用停止受付部３３８の間で行われる第３の情報処理の具体的な一例について説明する。図１２は、第３の情報処理の一例を示す図である。

【0158】

図１２には、ユーザＵ１の端末装置１０に紐づく複数のアプリケーション（ユーザＵ１が利用中のアプリ）のそれぞれについて、各種の設定を行うことのできる設定画面Ｃ１が端末装置１０に表示されている例が示される。設定画面Ｃ１は、例えば、ユーザＵ１からの要求に応じて提示制御部３３６によって提供されてよい。また、設定画面Ｃ１の態様（画面構成）は、図１２の例に限定されない。

【0159】

例えば、ユーザＵ１の端末装置１０に紐づくアプリケーションが、アプリＡＰ１、アプリＡＰ２、アプリＡＰ３、アプリＡＰ４およびアプリＡＰ５であったとする。係る場合、図１２に示すように、設定画面Ｃ１には、アプリＡＰ１～ＡＰ５それぞれの名称を示すアプリ名が、「ご利用中のアプリケーション一覧」として表示される。また、このようなアプリケーションの一覧は、アプリケーションリストに対応する。

【0160】

また、設定画面Ｃ１では、ユーザＵ１の端末装置１０に紐づくアプリケーションごとに、当該アプリケーションに対応する背景音を設定させることができるようになっている。この点について、図１２には、アプリＡＰ１を示すアプリ名の隣には、アプリＡＰ１に対応する背景音の候補をプルダウン形式で一覧表示させるためのプルダウンボタンＰＤ１が対応付けられている例が示される。これにより、ユーザＵ１は、プルダウンボタンＰＤ１を用いてプルダウン表示させた背景音の候補の中から、任意の背景音を選択することで、選択した背景音を設定することができる。

【0161】

例えば、音効果設定部３３７は、図１２に示すように、ＢＧＭ「ＭＵＳＩＣ♯３」が選択された場合には、係る選択操作に応じて、アプリＡＰ１に対するＢＧＭ「ＭＵＳＩＣ♯３」の設定を受け付ける。また、提示制御部３３６は、ＢＧＭ「ＭＵＳＩＣ♯３」の設定が受け付けられたことに応じて、アプリＡＰ１のアプリ名を示す音声データ（音声メッセージ）が、ＢＧＭ「ＭＵＳＩＣ♯３」を付加された状態で報知部より出力されるよう例えば報知制御部１３５を制御する。係る場合、報知制御部１３５は、ＢＧＭ「ＭＵＳＩＣ♯３」のデータを記憶部から抽出し、アプリＡＰ１のアプリ名を示す音声データに付加する。そして、報知制御部１３５は、ＢＧＭ「ＭＵＳＩＣ♯３」を付加した後の音声データがユーザＵ１の端末装置１０の報知部より報知されるよう音出力制御を行う。

【0162】

これにより、ユーザＵ１は、例えば、ＢＧＭ「ＭＵＳＩＣ♯３」が流れる中で、アプリＡＰ１のアプリ名を読み上げる音声メッセージ（例えば、「Ａ社のエンタメ情報提供アプリ」です）を聞くことができるようになり、ＢＧＭ「ＭＵＳＩＣ♯３」の雰囲気やその雰囲気の中では音声メッセージがどのように聞こえるのかをイメージすることができるようになる。また、この結果、ユーザＵ１は、図１２の例のように、複数のアプリを利用する場合に、音声コンテンツの提供元がいずれのアプリであるかを容易に区別することができるようになる。

【0163】

ここまで、第３の情報処理の具体例について、図１２に示すアプリＡＰ１の例を用いて説明してきたが、その他のアプリについても説明しておく。

【0164】

例えば、図１２には、アプリＡＰ３を示すアプリ名の隣には、アプリＡＰ３に対応する背景音の候補をプルダウン形式で一覧表示させるためのプルダウンボタンＰＤ３が対応付けられている例が示される。これにより、ユーザＵ１は、プルダウンボタンＰＤ３を用いてプルダウン表示させた背景音の候補の中から、任意の背景音を選択することで、選択した背景音を設定することができる。

【0165】

例えば、音効果設定部３３７は、図１２に示すように、ＢＧＭ「ＭＵＳＩＣ♯１」が選択された場合には、係る選択操作に応じて、アプリＡＰ３に対するＢＧＭ「ＭＵＳＩＣ♯１」の設定を受け付ける。また、提示制御部３３６は、ＢＧＭ「ＭＵＳＩＣ♯１」の設定が受け付けられたことに応じて、アプリＡＰ３のアプリ名を示す音声データが、ＢＧＭ「ＭＵＳＩＣ♯１」を付加された状態で報知部より出力されるよう例えば報知制御部１３５を制御する。係る場合、報知制御部１３５は、ＢＧＭ「ＭＵＳＩＣ♯１」のデータを記憶部から抽出し、アプリＡＰ３のアプリ名を示す音声データに付加する。そして、報知制御部１３５は、ＢＧＭ「ＭＵＳＩＣ♯１」を付加した後の音声データがユーザＵ１の端末装置１０の報知部より報知されるよう音出力制御を行う。

【0166】

これにより、ユーザＵ１は、例えば、ＢＧＭ「ＭＵＳＩＣ♯１」が流れる中で、アプリＡＰ３のアプリ名を読み上げる音声メッセージ（例えば、「Ｃ社の休暇施設情報提供アプリ」です）を聞くことができるようになり、ＢＧＭ「ＭＵＳＩＣ♯１」の雰囲気やその雰囲気の中では音声メッセージがどのように聞こえるのかをイメージすることができるようになる。また、この結果、ユーザＵ１は、図１２の例のように、複数のアプリを利用する場合に、音声コンテンツの提供元がいずれのアプリであるかを容易に区別することができるようになる。

【0167】

ここからは、図１２の例を用いて、アプリの利用停止（不要なアプリ）の削除について説明する。図１２に示す設定画面Ｃ１では、アプリケーションリストに含まれるアプリのうち、選択されたアプリを削除することで、この選択されたアプリを利用停止の状態にする機能をさらに備える。

【0168】

例えば、ユーザＵ１は、利用中のアプリであるアプリＡＰ１～ＡＰ５のうち、アプリＡＰ１からの音声コンテンツの提供は不要であり、アプリＡＰ１を利用停止の状態にしたいとする。係る場合、ユーザＵ１は、アプリケーションリストに含まれるアプリ名の中からアプリＡＰ１を選択した状態で、削除実行ボタンＢＴを押下する。

【0169】

そうすると、利用停止受付部３３８は、アプリＡＰ１の利用を停止するためのユーザ操作を受付ける。そして、利用停止受付部３３８は、アプリケーションリストに含まれるアプリのうち、ユーザＵ１より選択されたアプリＡＰ１の利用を停止する。例えば、利用停止受付部３３８は、アプリケーションリストの中からアプリＡＰ１を削除することによりアプリＡＰ１の利用を停止する。これにより、ユーザＵ１は、例えば、自身が必要な音声コンテンツだけが出力されるような環境を設定することができるようになる。

【0170】

〔４．まとめ〕
第３の実施形態に係る音出力制御装置３００は、音声エージェント機能を有する複数のアプリケーションの各々から提供されるエージェント情報を取得する。そして、音出力制御装置３００は、複数のアプリケーションのうち、前取得したエージェント情報の提供元であるアプリケーションに応じて、複数のアプリケーションの間で異なる音効果を付与した音声メッセージを報知部より報知させる。また、音出力制御装置３００は、複数のアプリケーションの各々に対応する音効果を示すアプリケーションリストをユーザに対して提示させる。このような音出力制御装置３００によれば、ユーザは、複数のアプリを利用する場合に、音声コンテンツの提供元がいずれのアプリであるかを容易に区別することができるようになり、この結果、自分の嗜好に応じたアプリを特定することができるようになる。

【0171】

（その他）
〔１．ハードウェア構成〕
また、上述してきた第１の実施形態における音出力制御装置１００、第２の実施形態に係る音出力制御装置２００は、例えば、図１３に示すような構成のコンピュータ１０００によって実現される。以下、音出力制御装置１００を例に挙げて説明する。図１３は、音出力制御装置１００の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ１０００は、ＣＰＵ１１００、ＲＡＭ１２００、ＲＯＭ１３００、ＨＤＤ１４００、通信インターフェイス（Ｉ／Ｆ）１５００、入出力インターフェイス（Ｉ／Ｆ）１６００、及びメディアインターフェイス（Ｉ／Ｆ）１７００を有する。

【0172】

ＣＰＵ１１００は、ＲＯＭ１３００またはＨＤＤ１４００に格納されたプログラムに基づいて動作し、各部の制御を行う。ＲＯＭ１３００は、コンピュータ１０００の起動時にＣＰＵ１１００によって実行されるブートプログラムや、コンピュータ１０００のハードウェアに依存するプログラム等を格納する。

【0173】

ＨＤＤ１４００は、ＣＰＵ１１００によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス１５００は、所定の通信網を介して他の機器からデータを受信してＣＰＵ１１００へ送り、ＣＰＵ１１００が生成したデータを所定の通信網を介して他の機器へ送信する。

【0174】

ＣＰＵ１１００は、入出力インターフェイス１６００を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。ＣＰＵ１１００は、入出力インターフェイス１６００を介して、入力装置からデータを取得する。また、ＣＰＵ１１００は、生成したデータを入出力インターフェイス１６００を介して出力装置へ出力する。

【0175】

メディアインターフェイス１７００は、記録媒体１８００に格納されたプログラムまたはデータを読み取り、ＲＡＭ１２００を介してＣＰＵ１１００に提供する。ＣＰＵ１１００は、かかるプログラムを、メディアインターフェイス１７００を介して記録媒体１８００からＲＡＭ１２００上にロードし、ロードしたプログラムを実行する。記録媒体１８００は、例えばＤＶＤ（Digital Versatile Disc）、ＰＤ（Phase change rewritable Disk）等の光学記録媒体、ＭＯ（Magneto-Optical disk）等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。

【0176】

例えば、コンピュータ１０００が第１の実施形態に音出力制御装置１００として機能する場合、コンピュータ１０００のＣＰＵ１１００は、ＲＡＭ１２００上にロードされたプログラムを実行することにより、制御部１３０の機能を実現する。コンピュータ１０００のＣＰＵ１１００は、これらのプログラムを記録媒体１８００から読み取って実行するが、他の例として、他の装置から所定の通信網を介してこれらのプログラムを取得してもよい。

【0177】

また、例えば、コンピュータ１０００が第３の実施形態に音出力制御装置３００として機能する場合、コンピュータ１０００のＣＰＵ１１００は、ＲＡＭ１２００上にロードされたプログラムを実行することにより、制御部３３０の機能を実現する。

【0178】

〔２．その他〕
また、上記各実施形態において説明した処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。

【0179】

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。

【0180】

また、上記各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

【0181】

以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。

【0182】

また、上述してきた「部（section、module、unit）」は、「手段」や「回路」などに読み替えることができる。例えば、情報取得部は、情報取得手段や情報取得回路に読み替えることができる。

【符号の説明】

【0183】

１情報処理システム
１００音出力制御装置
１２０記憶部
１２１カテゴリ分類データベース
１２２コンテンツバッファ
１３０制御部
１３３情報取得部
１３５報知制御部
２００音出力制御装置
２２０記憶部
２２３アプリ分類データベース
３００音出力制御装置
３３６提示制御部
３３７音効果設定部
３３８利用停止受付部

【図1】