特許第6981411号(P6981411)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ソニー株式会社の特許一覧

<>
  • 特許6981411-情報処理装置および方法 図000002
  • 特許6981411-情報処理装置および方法 図000003
  • 特許6981411-情報処理装置および方法 図000004
  • 特許6981411-情報処理装置および方法 図000005
  • 特許6981411-情報処理装置および方法 図000006
  • 特許6981411-情報処理装置および方法 図000007
  • 特許6981411-情報処理装置および方法 図000008
  • 特許6981411-情報処理装置および方法 図000009
  • 特許6981411-情報処理装置および方法 図000010
  • 特許6981411-情報処理装置および方法 図000011
  • 特許6981411-情報処理装置および方法 図000012
  • 特許6981411-情報処理装置および方法 図000013
  • 特許6981411-情報処理装置および方法 図000014
  • 特許6981411-情報処理装置および方法 図000015
  • 特許6981411-情報処理装置および方法 図000016
  • 特許6981411-情報処理装置および方法 図000017
  • 特許6981411-情報処理装置および方法 図000018
  • 特許6981411-情報処理装置および方法 図000019
  • 特許6981411-情報処理装置および方法 図000020
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6981411
(24)【登録日】2021年11月22日
(45)【発行日】2021年12月15日
(54)【発明の名称】情報処理装置および方法
(51)【国際特許分類】
   G06F 16/63 20190101AFI20211202BHJP
【FI】
   G06F16/63
【請求項の数】16
【全頁数】30
(21)【出願番号】特願2018-526023(P2018-526023)
(86)(22)【出願日】2017年6月22日
(86)【国際出願番号】JP2017022985
(87)【国際公開番号】WO2018008407
(87)【国際公開日】20180111
【審査請求日】2020年6月12日
(31)【優先権主張番号】特願2016-133964(P2016-133964)
(32)【優先日】2016年7月6日
(33)【優先権主張国】JP
(73)【特許権者】
【識別番号】000002185
【氏名又は名称】ソニーグループ株式会社
(74)【代理人】
【識別番号】100121131
【弁理士】
【氏名又は名称】西川 孝
(74)【代理人】
【識別番号】100082131
【弁理士】
【氏名又は名称】稲本 義雄
(72)【発明者】
【氏名】坪井 直人
【審査官】 後藤 彰
(56)【参考文献】
【文献】 特開2016−061996(JP,A)
【文献】 特開2010−224873(JP,A)
【文献】 特開2009−266249(JP,A)
【文献】 特開2016−001406(JP,A)
【文献】 特開2017−037576(JP,A)
【文献】 特開2015−018453(JP,A)
【文献】 特開2002−232935(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00ー16/958
(57)【特許請求の範囲】
【請求項1】
推薦するコンテンツの各候補について、推薦の適切さを評価した評価値である第1のスコアを算出する第1のスコア算出部と、
前記候補の各組み合わせについて、前記組み合わせにおける前記コンテンツに含まれる音声データ同士の音の重なり度合いを第2のスコアとして算出する第2のスコア算出部と、
前記第1のスコア算出部により算出された各候補の前記第1のスコアと、前記第2のスコア算出部により算出された前記候補の各組み合わせの前記第2のスコアとに基づいて、推薦するコンテンツを複数選択する選択部と
を備える情報処理装置。
【請求項2】
前記第2のスコア算出部は、各候補の音声データの定位に基づいて、前記音の重なり度合いを求める
請求項1に記載の情報処理装置。
【請求項3】
前記第のスコア算出部は、前記コンテンツを取得する側にとっての前記コンテンツの推薦の適切さを前記第のスコアとして算出する
請求項1または請求項2に記載の情報処理装置。
【請求項4】
前記第のスコア算出部は、前記コンテンツを取得する側にとっての前記コンテンツの推薦の適切さを、前記コンテンツを取得するユーザの行動に基づいて求める
請求項3に記載の情報処理装置。
【請求項5】
前記ユーザの行動の履歴を管理する履歴管理部をさらに備え、
前記第1のスコア算出部は、前記コンテンツを取得する側にとっての前記コンテンツの推薦の適切さを、前記履歴管理部により管理される前記ユーザの行動の履歴に基づいて求めるように構成される
請求項4に記載の情報処理装置。
【請求項6】
前記第1のスコア算出部は、前記コンテンツを取得する側にとっての前記コンテンツの推薦の適切さを、前記コンテンツを取得するユーザの嗜好に基づいて求める
請求項3乃至請求項5のいずれかに記載の情報処理装置。
【請求項7】
前記第1のスコア算出部は、前記コンテンツを供給する側にとっての前記コンテンツの推薦の適切さを前記第1のスコアとして算出する
請求項1乃至請求項6のいずれかに記載の情報処理装置。
【請求項8】
前記第1のスコア算出部は、前記コンテンツを提供する側にとっての前記コンテンツの推薦の適切さを、前記コンテンツを提供する側によって設定される優先度に基づいて求める
請求項7に記載の情報処理装置。
【請求項9】
前記第1のスコア算出部は、前記コンテンツを提供する側にとっての前記コンテンツの推薦の適切さを、前記コンテンツを提供する側によって設定される前記コンテンツの提供可能範囲に基づいて求める
請求項7または請求項8に記載の情報処理装置。
【請求項10】
前記第2のスコア算出部により算出された前記候補の各組み合わせの前記第2のスコアを補正する補正部をさらに備え、
前記選択部は、前記第1のスコア算出部により算出された前記第1のスコアと、前記補正部により補正された前記第2のスコアとに基づいて、推薦するコンテンツを複数選択するように構成される
請求項1乃至請求項9のいずれかに記載の情報処理装置。
【請求項11】
前記選択部により選択された複数の前記コンテンツのリストである推薦コンテンツリストを生成する推薦コンテンツリスト生成部をさらに備える
請求項1乃至請求項10のいずれかに記載の情報処理装置。
【請求項12】
前記推薦コンテンツリスト生成部により生成された前記推薦コンテンツリストを他の情報処理装置に提供する推薦コンテンツリスト提供部をさらに備える
請求項11に記載の情報処理装置。
【請求項13】
前記推薦コンテンツリスト生成部により生成された前記推薦コンテンツリストに含まれるコンテンツを他の情報処理装置より取得するコンテンツ取得部をさらに備える
請求項11または請求項12に記載の情報処理装置。
【請求項14】
前記コンテンツ取得部により取得された前記コンテンツを出力する出力部をさらに備える
請求項13に記載の情報処理装置。
【請求項15】
ユーザの操作入力を受け付ける受付部をさらに備え、
前記第2のスコア算出部は、前記受付部により受け付けられた前記操作入力に基づいて、前記第2のスコアを算出するように構成される
請求項1乃至請求項14のいずれかに記載の情報処理装置。
【請求項16】
情報処理装置が、
推薦するコンテンツの各候補について、推薦の適切さを評価した評価値である第1のスコアを算出し、
前記候補の各組み合わせについて、前記組み合わせにおける前記コンテンツに含まれる音声データ同士の音の重なり度合いを第2のスコアとして算出し、
算出された各候補の前記第1のスコアと、算出された前記候補の各組み合わせの前記第2のスコアとに基づいて、推薦するコンテンツを複数選択する
情報処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本技術は、情報処理装置および方法に関し、特に、コンテンツを提供するにあたって、より適切なコンテンツを推薦することができるようにした情報処理装置および方法に関する。
【背景技術】
【0002】
従来、広告や案内等、ユーザが操作する端末装置の位置に応じた音声情報を提供するシステムがある。例えば、音源の位置を設定し、ユーザの位置に応じて各音源の位置から音声情報が聞こえるようにするシステムがある(例えば特許文献1および特許文献2参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2013−5021号公報
【特許文献2】特開2008−151766号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来のこのようなシステムの場合、ユーザの近くに複数の音源が存在すると、端末装置には、その複数の音声情報が供給され、各音源からそれらの音声情報が聞こえるようになされることになる。そして、その複数の音源の位置が互いに近い場合、出力された音声同士が衝突し、ユーザにとって聞きづらい音声となってしまう(両音声を聞き分けることが困難になる)おそれがあった。
【0005】
本技術は、このような状況に鑑みて提案されたものであり、コンテンツを提供するにあたって、より適切なコンテンツを推薦することを目的とする。
【課題を解決するための手段】
【0006】
本技術の一側面の情報処理装置は、推薦するコンテンツの各候補について、推薦の適切さを評価した評価値である第1のスコアを算出する第1のスコア算出部と、前記候補の各組み合わせについて、前記組み合わせにおける前記コンテンツに含まれる音声データ同士の音の重なり度合いを第2のスコアとして算出する第2のスコア算出部と、前記第1のスコア算出部により算出された各候補の前記第1のスコアと、前記第2のスコア算出部により算出された前記候補の各組み合わせの前記第2のスコアとに基づいて、推薦するコンテンツを複数選択する選択部とを備える情報処理装置である。
【0009】
前記第2のスコア算出部は、各候補の音声データの定位に基づいて、前記音の重なり度合いを求めることができる。
【0010】
前記第1のスコア算出部は、前記コンテンツを取得する側にとっての前記コンテンツの推薦の適切さを前記第1のスコアとして算出することができる。
【0011】
前記第1のスコア算出部は、前記コンテンツを取得する側にとっての前記コンテンツの推薦の適切さを、前記コンテンツを取得するユーザの行動に基づいて求めることができる。
【0012】
前記ユーザの行動の履歴を管理する履歴管理部をさらに備え、前記第1のスコア算出部は、前記コンテンツを取得する側にとっての前記コンテンツの推薦の適切さを、前記履歴管理部により管理される前記ユーザの行動の履歴に基づいて求めるように構成されるようにすることができる。
【0013】
前記第1のスコア算出部は、前記コンテンツを取得する側にとっての前記コンテンツの推薦の適切さを、前記コンテンツを取得するユーザの嗜好に基づいて求めることができる。
【0014】
前記第1のスコア算出部は、前記コンテンツを供給する側にとっての前記コンテンツの推薦の適切さを前記第1のスコアとして算出することができる。
【0015】
前記第1のスコア算出部は、前記コンテンツを提供する側にとっての前記コンテンツの推薦の適切さを、前記コンテンツを提供する側によって設定される優先度に基づいて求めることができる。
【0016】
前記第1のスコア算出部は、前記コンテンツを提供する側にとっての前記コンテンツの推薦の適切さを、前記コンテンツを提供する側によって設定される前記コンテンツの提供可能範囲に基づいて求めることができる。
【0017】
前記第2のスコア算出部により算出された前記候補の各組み合わせの前記第2のスコアを補正する補正部をさらに備え、前記選択部は、前記第1のスコア算出部により算出された前記第1のスコアと、前記補正部により補正された前記第2のスコアとに基づいて、推薦するコンテンツを複数選択するように構成されるようにすることができる。
【0018】
前記選択部により選択された複数の前記コンテンツのリストである推薦コンテンツリストを生成する推薦コンテンツリスト生成部をさらに備えるようにすることができる。
【0019】
前記推薦コンテンツリスト生成部により生成された前記推薦コンテンツリストを他の情報処理装置に提供する推薦コンテンツリスト提供部をさらに備えるようにすることができる。
【0020】
前記推薦コンテンツリスト生成部により生成された前記推薦コンテンツリストに含まれるコンテンツを他の情報処理装置より取得するコンテンツ取得部をさらに備えるようにすることができる。
【0021】
前記コンテンツ取得部により取得された前記コンテンツを出力する出力部をさらに備えるようにすることができる。
【0022】
ユーザの操作入力を受け付ける受付部をさらに備え、前記第2のスコア算出部は、前記受付部により受け付けられた前記操作入力に基づいて、前記第2のスコアを算出するように構成されるようにすることができる。
【0023】
本技術の一側面の情報処理方法は、情報処理装置が、推薦するコンテンツの各候補について、推薦の適切さを評価した評価値である第1のスコアを算出し、前記候補の各組み合わせについて、前記組み合わせにおける前記コンテンツに含まれる音声データ同士の音の重なり度合いを第2のスコアとして算出し、算出された各候補の前記第1のスコアと、算出された前記候補の各組み合わせの前記第2のスコアとに基づいて、推薦するコンテンツを複数選択する情報処理方法である。
【0026】
本技術の一側面においては、推薦するコンテンツの各候補について、推薦の適切さを評価した評価値である第1のスコアが算出され、その候補の各組み合わせについて、その組み合わせにおけるコンテンツに含まれる音声データ同士の音の重なり度合いが第2のスコアとして算出され、算出された各候補の第1のスコアと、算出された候補の各組み合わせの第2のスコアとに基づいて、推薦するコンテンツが複数選択される。
【発明の効果】
【0028】
本技術によれば、情報を処理することが出来る。また本技術によれば、コンテンツを提供するにあたって、より適切なコンテンツを推薦することができる。
【図面の簡単な説明】
【0029】
図1】音声データ提供システムの主な構成例を示す図である。
図2】音声データ提供の様子の例を説明する図である。
図3】端末装置の主な構成例を示すブロック図である。
図4】サーバの主な構成例を示すブロック図である。
図5】端末装置およびサーバが有する機能の主な構成例を示す機能ブロック図である。
図6】推薦コンテンツリスト生成部の主な構成例を示す機能ブロック図である。
図7】音量分布の様子の例を示す図である。
図8】音声データの提供範囲の例を示す図である。
図9】音声データの提供範囲の補正の例を示す図である。
図10】コンテンツ推薦処理の流れの例を説明するフローチャートである。
図11】推薦コンテンツリスト生成処理の流れの例を説明するフローチャートである。
図12】スコア補正の様子の例を説明する図である。
図13】推薦コンテンツリスト生成部の主な構成例を示す機能ブロック図である。
図14】音声出力の様子の例を説明する図である。
図15】サーバの主な構成例を示すブロック図である。
図16】第1のフィルタ処理部の主な構成例を示す機能ブロック図である。
図17】コンテンツ推薦処理の流れの例を説明するフローチャートである。
図18】端末装置およびサーバが有する機能の主な構成例を示す機能ブロック図である。
図19】コンテンツ推薦処理の流れの例を説明するフローチャートである。
【発明を実施するための形態】
【0030】
以下、本開示を実施するための形態(以下実施の形態とする)について説明する。なお、説明は以下の順序で行う。
1.第1の実施の形態(音声データ提供システム)
2.第2の実施の形態(スコア補正)
3.第3の実施の形態(音声出力形態)
4.第4の実施の形態(行動認識)
5.第5の実施の形態(操作入力)
6.第6の実施の形態(その他)
【0031】
<1.第1の実施の形態>
<音声データの提供>
従来、街中等においては、多くの音声情報を周囲から得ることができる。一般的に、周囲の公共の空間の中で一律に配信される音声情報は、特定の人に向けて配信されていない。人によっては関心の無い情報を聞かされたり、関心の強い情報の音声が聞き取れなかったりする。また、音声情報はその配信源となる位置の情報から、聞いた者に対して興味を誘導したりする効果がある。
【0032】
そこで、例えば、特許文献1や特許文献2に記載の技術のように、個人に合わせて、適した音声情報を適した位置から配信することを実現することが考えられた。しかしながら、このような技術の場合、提供される音声情報は、音声情報の受け取り手であるユーザの位置や向き等に応じて選択されていたが、音声情報の供給元の意向は反映されていなかった。そのため、本来提供側が提供したい音声情報がユーザに提供されない可能性があった。
【0033】
また、このような音声情報の提供の場合、複数の音声情報を並行してユーザに提供する場合も考えられる。その場合に各音声情報をユーザと音源の位置関係に基づく方向から聞こえるように提供するようにすると、略同様の方向から複数の音声情報が提供される可能性があり、音声情報同士が重なり合って、ユーザにとって聞き取り難くなってしまう(各音声を聞き分けることが困難になる)おそれがあった。
【0034】
そこで、このような音声情報の衝突を避けたり、音声情報の取得側だけでなく、供給側の意向も反映するように、提供(推薦)するコンテンツを選択するようにする。このようにすることにより、コンテンツを提供するにあたって、より適切なコンテンツを推薦することができる。
【0035】
<音声データ提供システム>
図1は、本技術を適用した情報処理システムの一実施の形態である音声データ提供システムの主な構成例を示す図である。図1に示される音声データ提供システム100は、端末装置101(端末装置101を有するユーザ111)に音声情報を提供するシステムである。
【0036】
図1に示されるように、音声データ提供システム100は、端末装置101−1乃至端末装置101−N(Nは任意の自然数)を有する。端末装置101−1乃至端末装置101−Nを互いに区別しない場合、端末装置101と称する。端末装置101−1乃至端末装置101−Nは、それぞれ、互いに異なるユーザ111(ユーザ111−1乃至ユーザ111−N)が携帯しているとする。
【0037】
端末装置101は、例えばスピーカ等の音声出力機能を有し、その端末装置101を携帯するユーザ111に向けた音声出力を行うことができる。端末装置101は、また、無線通信機能を有し、他の装置と無線通信を行うことができる。例えば、端末装置101は、アクセスポイント102を介してネットワーク103に接続し、そのネットワーク103を介してサーバ104と通信を行うことができる。例えば、端末装置101は、その通信により、自身や自身のユーザ111に関する情報(例えば、操作内容や移動のログ(Log)等)をサーバ104に供給する。また、例えば、端末装置101は、その通信により、サーバ104により推薦されたコンテンツのリストである推薦コンテンツリストをサーバ104から取得する。さらに、例えば、端末装置101は、その通信により、サーバ104から供給された推薦コンテンツリストに基づいて、サーバ104に対してコンテンツを要求し、取得する。また、例えば、端末装置101は、このようにサーバ104から取得したコンテンツの音声データをユーザ111に向けて出力することができる。
【0038】
アクセスポイント102は、端末装置101と無線通信を行うとともに、ネットワーク103を介してサーバ104と通信を行い、端末装置101とサーバ104との間の通信を中継する。図1においてはアクセスポイント102は1台のみ示されているが、音声データ提供システム100は、任意の台数のアクセスポイント102を有することができる。アクセスポイント102と各端末装置101との間の無線通信の通信規格は任意である。
【0039】
ネットワーク103は、任意の通信網であり、有線通信の通信網であってもよいし、無線通信の通信網であってもよいし、それらの両方により構成されるようにしてもよい。また、ネットワーク103が、1の通信網により構成されるようにしてもよいし、複数の通信網により構成されるようにしてもよい。例えば、インターネット、公衆電話回線網、所謂3G回線や4G回線等の無線移動体用の広域通信網、WAN(Wide Area Network)、LAN(Local Area Network)、Bluetooth(登録商標)規格に準拠した通信を行う無線通信網、NFC(Near Field Communication)等の近距離無線通信の通信路、赤外線通信の通信路、HDMI(登録商標)(High-Definition Multimedia Interface)やUSB(Universal Serial Bus)等の規格に準拠した有線通信の通信網等、任意の通信規格の通信網や通信路がネットワーク103に含まれるようにしてもよい。
【0040】
サーバ104は、音声データを含むコンテンツの、各端末装置101(そのユーザ111)への提供に関する処理を行う。例えば、サーバ104は、端末装置101に対して提供するコンテンツを選択し、その選択したコンテンツのリストである推薦コンテンツリストを生成することができる。また、例えば、サーバ104は、各端末装置101と通信を行う。その通信によりサーバ104は、端末装置101から、その端末装置101やそのユーザ111に関する情報(例えば、操作内容や移動のログ(Log)等)を取得する。また、サーバ104は、その通信により、推薦コンテンツリストを端末装置101に供給する。さらに、サーバ104は、その通信により、端末装置101からコンテンツの要求を受け付け、要求されたコンテンツを端末装置101に供給することができる。
【0041】
なお、端末装置101が、有線通信機能を有し、ネットワーク103に接続されるようにしてもよい。また、サーバ104が無線通信機能を有し、端末装置101と無線通信を行うことができるようにしてもよい。
【0042】
<音声データ>
このようにサーバ104から端末装置101に提供される音声データの内容は、その端末装置101(ユーザ111)に対するものであれば、どのようなものであってもよい。例えば、図2のように、端末装置101(ユーザ111)の位置や軌跡、並びに、音声データの定位(音源の位置や向き)によって決定される情報であってもよい。例えば、空間121において、音源122−1乃至音源122−5が図2に示されるような位置および向きに設定されているとし、端末装置101(ユーザ111)が位置Pから位置Qまで矢印のように移動したとする。この位置Qや、位置Pから位置Qまでの軌跡等と、各音源122(音源122−1乃至音源122−5)の位置関係に、音声データの内容が対応するようにしてもよい。
【0043】
例えば、ユーザ111の位置に応じて提供される、「○○へは右側へお進み下さい」等の道案内(ナビゲーション)であってもよい。また、展示物の前に位置したユーザ111に対して提供される、「こちらの○○は○○年に設立され」等の開設(ガイド)であってもよい。また、入店したユーザ111に対して提供される、「いまなら○○が半額!」等の販売促進情報の紹介であってもよい。また、不適切な場所にいるユーザに対して提供される、「白線の内側にお下がりください」等の注意喚起であってもよい。また、災害等発生時に危険な場所に位置するユーザに対して提供される、「安全な場所に避難して下さい」等の緊急連絡であってもよい。
【0044】
<端末装置>
図3は、端末装置101の主な構成例を示すブロック図である。図3に示されるように、端末装置101は、バス154を介して相互に接続されているCPU(Central Processing Unit)151、ROM(Read Only Memory)152、およびRAM(Random Access Memory)153を有する。
【0045】
バス154にはまた、入出力インタフェース160も接続されている。入出力インタフェース160には、入力部161、出力部162、記憶部163、通信部164、およびドライブ165が接続されている。
【0046】
入力部161は、例えば、キーボード、マウス、タッチパネル、イメージセンサ、マイクロホン、スイッチ、入力端子等の任意の入力デバイスを有する。また、入力部161は、例えば、加速度センサ等の任意のセンサを有する。出力部162は、例えば、ディスプレイ、スピーカ、出力端子等の任意の出力デバイスを有する。記憶部163は、例えば、ハードディスク、RAMディスク、SSD(Solid State Drive)やUSBメモリ等のような不揮発性のメモリ等、任意の記憶媒体を有する。通信部164は、例えば、イーサネット(登録商標)、Bluetooth(登録商標)、USB、HDMI(登録商標)、IrDA等の、有線若しくは無線、または両方の、任意の通信規格の通信インタフェースを有する。ドライブ165は、自身に装着された、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等の任意の記憶媒体を有するリムーバブルメディア171を駆動する。
【0047】
以上のように構成される端末装置101では、CPU151が、例えば、記憶部163に記憶されているプログラムを、入出力インタフェース160およびバス154を介して、RAM153にロードして実行することにより、後述する機能を実現することができる。RAM153にはまた、CPU151が各種の処理を実行する上において必要なデータなども適宜記憶される。
【0048】
CPU151が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア171に記録して適用することができる。その場合、プログラムは、リムーバブルメディア171をドライブ165に装着することにより、入出力インタフェース160を介して、記憶部163にインストールすることができる。また、このプログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することもできる。その場合、プログラムは、通信部164で受信し、記憶部163にインストールすることができる。その他、このプログラムは、ROM152や記憶部163に、あらかじめインストールしておくこともできる。
【0049】
<サーバ>
図4は、サーバ104の主な構成例を示すブロック図である。図4に示されるように、サーバ104は、バス204を介して相互に接続されているCPU201、ROM202、およびRAM203を有する。
【0050】
バス204にはまた、入出力インタフェース210も接続されている。入出力インタフェース210には、入力部211、出力部212、記憶部213、通信部214、およびドライブ215が接続されている。
【0051】
入力部211は、例えば、キーボード、マウス、タッチパネル、イメージセンサ、マイクロホン、スイッチ、入力端子等の任意の入力デバイスを有する。出力部212は、例えば、ディスプレイ、スピーカ、出力端子等の任意の出力デバイスを有する。記憶部213は、例えば、ハードディスク、RAMディスク、SSDやUSBメモリ等のような不揮発性のメモリ等、任意の記憶媒体を有する。通信部214は、例えば、イーサネット(登録商標)、Bluetooth(登録商標)、USB、HDMI(登録商標)、IrDA等の、有線若しくは無線、または両方の、任意の通信規格の通信インタフェースを有する。ドライブ215は、自身に装着された、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等の任意の記憶媒体を有するリムーバブルメディア221を駆動する。
【0052】
以上のように構成されるサーバ104では、CPU201が、例えば、記憶部213に記憶されているプログラムを、入出力インタフェース210およびバス204を介して、RAM203にロードして実行することにより、後述する機能を実現することができる。RAM203にはまた、CPU201が各種の処理を実行する上において必要なデータなども適宜記憶される。
【0053】
CPU201が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア221に記録して適用することができる。その場合、プログラムは、リムーバブルメディア221をドライブ215に装着することにより、入出力インタフェース210を介して、記憶部213にインストールすることができる。また、このプログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することもできる。その場合、プログラムは、通信部214で受信し、記憶部213にインストールすることができる。その他、このプログラムは、ROM202や記憶部213に、あらかじめインストールしておくこともできる。
【0054】
<機能ブロック>
次に、以上のような端末装置101やサーバ104がプログラムを実行することにより実現する機能について説明する。図5は、端末装置101やサーバ104が実現する主な機能の例を示す機能ブロック図である。図5に示されるように、端末装置101は、機能ブロックとして、センサ情報取得部251、ログ管理部252、ログ提供部253、推薦コンテンツリスト取得部254、推薦コンテンツリスト管理部255、推薦コンテンツ取得部256、および音声出力制御部257を有する。また、サーバ104は、機能ブロックとして、ログ取得部261、ログ管理部262、コンテンツ管理部263、推薦コンテンツリスト生成部264、推薦コンテンツリスト提供部265、およびコンテンツ提供部266を有する。
【0055】
センサ情報取得部251は、センサ情報の取得に関する処理を行う。例えば、センサ情報取得部251は、入力部161に含まれる各種センサからセンサ情報を取得し、それをログ管理部252に供給する。ログ管理部252は、ログの管理に関する処理を行う。例えば、ログ管理部252は、センサ情報取得部251から供給されるセンサ情報に基づいて、端末装置101(ユーザ111)の位置等の履歴(ログ)を生成し、管理する。例えば、ログ管理部252は、そのログをログ提供部253に供給される。ログ提供部253は、ログの提供に関する処理を行う。例えば、ログ提供部253は、通信部164を介してサーバ104と通信を行い、端末装置101のログをサーバ104に供給する。
【0056】
推薦コンテンツリスト取得部254は、サーバ104により推薦されたコンテンツのリストである推薦コンテンツリストの取得に関する処理を行う。例えば、推薦コンテンツリスト取得部254は、通信部164を介してサーバ104と通信を行い、サーバ104から供給される推薦コンテンツリストを取得し、それを推薦コンテンツリスト管理部255に供給する。推薦コンテンツリスト管理部255は、その推薦コンテンツリストの管理に関する処理を行う。推薦コンテンツリスト管理部255は、例えば、記憶部163に推薦コンテンツリストを記憶させ、その推薦コンテンツリストを管理する。
【0057】
推薦コンテンツ取得部256は、推薦コンテンツリストに含まれるコンテンツである推薦コンテンツのデータの取得に関する処理を行う。例えば、推薦コンテンツ取得部256は、推薦コンテンツリスト管理部255が管理している推薦コンテンツリストを取得し、通信部164を介してサーバ104と通信を行い、それに含まれる推薦コンテンツをサーバ104に要求し、取得する。音声出力制御部257は、音声データの出力に関する処理を行う。例えば、音声出力制御部257は、推薦コンテンツ取得部256により取得された推薦コンテンツの音声データを、音声として、出力部162に含まれるスピーカから出力させる。
【0058】
サーバ104のログ取得部261は、端末装置101のログの取得に関する処理を行う。例えば、ログ取得部261は、通信部214を介して端末装置101と通信を行い、端末装置101から供給されるログを取得し、それをログ管理部262に供給する。ログ管理部262は、端末装置101のログの管理に関する処理を行う。例えば、ログ管理部262は、記憶部213にログ管理用のデータベース(ログDB)を生成し、ログ取得部261により取得された端末装置101のログをそのログDBに登録し、管理する。
【0059】
コンテンツ管理部263は、コンテンツの管理に関する処理を行う。例えば、コンテンツ管理部263は、複数のコンテンツ(音声データ)を記憶部213に記憶し、管理する。これらのコンテンツは、端末装置101に推薦されるコンテンツの候補となる。また、コンテンツ管理部263は、各コンテンツに関連付けて、そのコンテンツの提供元により指定される、コンテンツの推薦に関する情報も管理する。このコンテンツの推薦に関する情報は、どのような内容であってもよい、例えば、その提供元により指定されるそのコンテンツの推薦の優先度、広告料、コンテンツの提供対象として望ましいユーザの特徴(タイプ)、時間帯指定、曜日指定等が1つ以上含まれるようにしてもよい。
【0060】
推薦コンテンツリスト生成部264は、推薦コンテンツリストの生成に関する処理を行う。例えば、推薦コンテンツリスト生成部264は、ログ管理部262から、コンテンツを提供する端末装置101のログを取得する。また、例えば、推薦コンテンツリスト生成部264は、コンテンツ管理部263から、コンテンツの情報や、そのコンテンツに関連付けられた、提供元により指定されるコンテンツの推薦に関する情報等を取得する。推薦コンテンツリスト生成部264は、これらの情報に基づいて、コンテンツ管理部263により管理されているコンテンツ群の中から、端末装置101に対して推薦するコンテンツを選択し、推薦コンテンツリストを生成する。
【0061】
推薦コンテンツリスト提供部265は、推薦コンテンツリストの提供に関する処理を行う。例えば、推薦コンテンツリスト提供部265は、通信部214を介して端末装置101と通信を行い、推薦コンテンツリスト生成部264により生成された推薦コンテンツリストを端末装置101に供給する。コンテンツ提供部266は、コンテンツの提供に関する処理を行う。例えば、コンテンツ提供部266は、通信部214を介して端末装置101と通信を行い、端末装置101からの要求を受け付け、その要求に応じたコンテンツをコンテンツ管理部263から取得し、端末装置101に供給する。
【0062】
<推薦コンテンツリスト生成部>
図6は、推薦コンテンツリスト生成部264の主な構成例を示す機能ブロック図である。図6に示されるように、推薦コンテンツリスト生成部264は、コンテンツスコア算出部281、コンテンツ組み合わせスコア算出部282、コンテンツ選択部283、およびリスト生成部284を有する。
【0063】
コンテンツスコア算出部281は、コンテンツ管理部263により管理される各コンテンツ(すなわち、推薦するコンテンツの候補のそれぞれ)について、推薦の適切さを評価した評価値であるコンテンツスコアの算出に関する処理を行う。コンテンツスコアは、コンテンツ毎の評価値である。この評価値の算出方法任意である。例えば、コンテンツスコア算出部281が、コンテンツを取得する側(すなわち、端末装置101(のユーザ111))にとっての適切さを評価してコンテンツスコアを算出するようにしてもよい。
【0064】
また、「コンテンツを取得する側にとっての適切さ」は、どのようなパラメータであってもよいが、例えば、コンテンツを取得するユーザ111(端末装置101)の行動に基づいて算出されるようにしてもよい。そして、その「ユーザ111(端末装置101)の行動」は、例えば、ログ管理部262により管理されるユーザ111(端末装置101)の行動の履歴に基づいて求められるようにしてもよい。その他にも、例えば、「コンテンツを取得する側にとっての適切さ」は、コンテンツを取得するユーザ111(端末装置101)の嗜好に基づいて算出されるようにしてもよい。そして、この「ユーザ111の嗜好」も、例えば、ログ管理部262により管理されるユーザ111(端末装置101)の行動の履歴に基づいて求められるようにしてもよい。
【0065】
また、例えば、コンテンツスコア算出部281が、コンテンツを供給する側(すなわち、サーバ104やその管理者、またはコンテンツ提供者等)にとっての適切さを評価してコンテンツスコアを算出するようにしてもよい。この「コンテンツを供給する側にとっての適切さ」は、どのようなパラメータであってもよいが、例えば、コンテンツを提供する側によって設定される優先度に基づいて算出されるようにしてもよい。例えば、コンテンツに対して推薦の優先度が予め設定されている場合、コンテンツスコア算出部281は、どのコンテンツを推薦するかの選択に、その優先度を反映させるようにすることができる。例えば、コンテンツスコア算出部281は、高い優先度が設定されたコンテンツを、低い優先度が設定されたコンテンツよりも優先的に推薦コンテンツとして選択するようにすることができる。
【0066】
その他にも、例えば、「コンテンツを供給する側にとっての適切さ」は、コンテンツを提供する側によって設定されるコンテンツの提供可能範囲に基づいて算出されるようにしてもよい。例えば、ある空間において、音源の位置が定位され、その音源の位置を基準としてコンテンツの提供可能な範囲が設定されている場合、ユーザ111(端末装置101)がその範囲内に位置したコンテンツのみがユーザ111(端末装置101)に提供することができる。つまり、推薦コンテンツとして選択されるようにすることができる。
【0067】
なお、この提供可能範囲内において(つまり、コンテンツが提供される場合において)、コンテンツ(音声データ)を提供する際の音量が、例えば、図7に示されるグラフのように、位置に応じて変化するように設定することができるようにしてもよい。図7のグラフは、縦軸が音量、横軸が音源の位置からの距離を示す。図7に示される例の場合、音源の位置から所定の距離内は、全て同じ音量(最大)であり、音源の位置からの距離が遠くなるほど音量が小さくなっている。このようにすることにより、音源までの距離を音量によって表現することができる。
【0068】
なお、この提供可能範囲の形状は任意である。例えば、この提供可能範囲が、図8のAに示される例のように、音源の位置(黒点)を中心とする円形であるようにしてもよい(つまり、音源からの距離のみにより提供可能範囲であるか否かが識別されるようにしてもよい)。また、図8のBに示されるように、音源の位置(黒点)が移動する(可変である)ようにしてもよい。また、図8のCに示される各例のように、提供可能範囲が、音源の位置(黒点)を中心とする円状とならないようにしてもよい。
【0069】
なお、この提供可能範囲の形状を可変としてもよい。例えば、図9のAに示されるように、各コンテンツに対して推薦スコアや販売促進スコア等といったスコアが予め設定されている場合、それらのスコアに基づいて、図9のBに示されるように、提供可能範囲が、変形、拡大、または縮小されるようにしてもよい。
【0070】
以上のように、「コンテンツを供給する側にとっての適切さ」を評価してコンテンツスコアを算出するようにすることにより、コンテンツを提供する側が所望のコンテンツを端末装置101(ユーザ111)に提供することができるようになる。つまり、コンテンツを提供するにあたって、より適切なコンテンツを推薦することができる。
【0071】
なお、コンテンツスコア算出部281は、「コンテンツを取得する側にとっての適切さ」と、「コンテンツを供給する側にとっての適切さ」との両方を評価してコンテンツスコアを算出するようにしてもよいし、いずれか一方を評価してコンテンツスコアを算出するようにしてもよい。コンテンツを取得する側にとっての適切さ」と、「コンテンツを供給する側にとっての適切さ」との両方を評価してコンテンツスコアを算出するようにすることにより、コンテンツを提供する側が所望のコンテンツを端末装置101(ユーザ111)に提供することができるようになる。つまり、コンテンツを提供するにあたって、より適切なコンテンツを推薦することができる。
【0072】
図6に戻り、コンテンツ組み合わせスコア算出部282は、コンテンツ組み合わせスコアの算出に関する処理を行う。コンテンツ組み合わせスコアは、複数のコンテンツ(音声データ)の組み合わせ毎の評価値であり、その複数のコンテンツの音声を並行して出力した場合の聞き取り易さ(または聞き取りづらさ)を表すパラメータである。
【0073】
例えば、互いに同一の方向から聞こえる複数の音声は、音が重なり合って聞きづらくなるおそれがある。これに対して、互いに逆方向から聞こえる音声は、音が重なり合わないので、容易に両者を識別して聞きとることができる。上述のように音源を定位させ、端末装置101がその音源の方向から聞こえるように音声データを出力する場合、端末装置101(ユーザ111)と各音声データの音源との位置関係によって、音声が聞こえてくる方向が決定されるので、音声データの組み合わせによって、音の重なり具合が変化する可能性がある。
【0074】
そこで、コンテンツ組み合わせスコア算出部282は、このような音声データの各組み合わせについて、音声データ同士の音の重なり度合いを求めて評価し、コンテンツ組み合わせスコアを算出する。
【0075】
例えば、コンテンツ管理部263に管理されているN(Nは自然数)個のコンテンツc[i]のリストであるリストLが以下の式(1)ように定められているとする。
【0076】
リストL= [c[1], ... ,c[N]]
・・・(1)
【0077】
このような候補に対して、コンテンツ組み合わせスコア算出部282は、コンテンツ組み合わせスコアoverlap(c[i] , c[j])を算出する。例えば、コンテンツ組み合わせスコア算出部282は、コンテンツc[i]とコンテンツc[j]とを同時に定位して聴かせた場合に、聞き易いほどoverlap(c[i] , c[j])の値が小さくなるようにする。つまり、overlap(c[i] , c[j])の値は、コンテンツc[i]とコンテンツc[j]とを同時に定位した場合の音声の重なりが大きいほど大きくなり、重なりが無い場合は「0」になる。
【0078】
もちろん、このコンテンツ組み合わせスコアの算出方法は任意である。また、音の重なり度合いの求め方も任意であり、音声が聞こえる方向(音源との位置関係)以外の情報に基づいて求めるようにしてもよい。例えば、周波数帯、音質、音量等、その他の情報に基づいて求めるようにしてもよい。また、複数の情報を組み合わせて用いるようにしてもよい。
【0079】
コンテンツ選択部283は、推薦コンテンツとするコンテンツの選択に関する処理を行う。例えば、コンテンツ選択部283は、コンテンツスコア算出部281により算出されたコンテンツスコア、および、コンテンツ組み合わせスコア算出部282により算出されたコンテンツ組み合わせスコアを用いて、推薦コンテンツを選択する。
【0080】
このコンテンツスコアおよびコンテンツ組み合わせスコアを用いた推薦コンテンツの選択方法は任意である。例えば、以下のようにして推薦コンテンツを選択するようにしてもよい。
【0081】
M=Φ、i=1
for i in 1,... ,N
任意のMの要素mに対して、overlap(m , c[i])を求めて、閾値a以下であれば、c[i]をMに追加する
【0082】
このようにして得られたMは、ある程度(閾値a)、音声の重なりがなく、スコアも有る程度考慮されたリストとなる。
【0083】
以上のように、推薦コンテンツの選択に、コンテンツ組み合わせスコアを用いることにより、複数の音声データを並行して出力する場合であっても、音の重なりの増大を抑制することができ、聞き易さの低減を抑制することができる。つまり、サーバ104は、コンテンツを提供するにあたって、より適切なコンテンツを推薦することができる。
【0084】
リスト生成部284は、コンテンツ選択部283が選択したコンテンツのリスト(一覧)を生成する。このリストの内容は任意であるが、例えばコンテンツの名称や識別情報等が含まれるようにしてもよい。
【0085】
<コンテンツ推薦処理の流れ>
次に、以上のような音声データ提供システム100において実行される処理について説明する。端末装置101およびサーバ104は、互いに通信を行いながら、音声データ提供システム100においてコンテンツ推薦処理を実行する。このコンテンツ推薦処理の流れの例を、図10のフローチャートを参照して説明する。
【0086】
コンテンツ推薦処理が開始されると、端末装置101のセンサ情報取得部251は、ステップS101において、センサ情報を取得する。ステップS102において、ログ管理部252は、そのセンサ情報をログとして記録し、管理する。ステップS103において、ログ提供部253は、サーバ104にログを提供する。
【0087】
ステップS121においてサーバ104のログ取得部261は、そのログを取得する。ステップS122において、ログ管理部262は、その取得されたログを記録する。ステップS123において、推薦コンテンツリスト生成部264は、そのログやコンテンツ等の情報に基づいて、推薦コンテンツリスト生成処理を行い、推薦コンテンツリストを生成する。この処理の詳細は後述する。
【0088】
ステップS124において、推薦コンテンツリスト提供部265は、その推薦コンテンツリストを端末装置101に供給する。ステップS104において、推薦コンテンツリスト取得部254は、その推薦コンテンツリストを取得する。ステップS105において、推薦コンテンツリスト管理部255は、その推薦コンテンツリストを記憶する。
【0089】
また、ステップS125において、サーバ104のコンテンツ管理部263は、コンテンツの更新が合った場合、そのコンテンツの更新を行う。
【0090】
ステップS106において、端末装置101の推薦コンテンツ取得部256は、推薦コンテンツを要求する。これに対してサーバ104のコンテンツ提供部266は、ステップS126において、その要求を取得する。そして、ステップS127において、コンテンツ提供部266は、要求された推薦コンテンツを、要求元の端末装置101に供給する。これに対して、端末装置101の推薦コンテンツ取得部256は、ステップS107において、その推薦コンテンツを取得する。そして、音声出力制御部257は、ステップS108において、取得された推薦コンテンツの音声を、出力部162のスピーカより出力させる。
【0091】
ステップS108の処理が終了すると、コンテンツ推薦処理が終了する。
【0092】
<推薦コンテンツリスト生成処理の流れ>
次に、図11のフローチャートを参照して、図10のステップS123において実行される推薦コンテンツリスト生成処理の流れの例を説明する。
【0093】
推薦コンテンツリスト生成処理が開始されると、コンテンツスコア算出部281は、ステップS141において、ユーザ111(端末装置101)に対して、提供する音声情報コンテンツ配信源を配置する範囲の情報を取得する。
【0094】
ステップS142において、コンテンツスコア算出部281は、範囲情報において配信可能な音声情報コンテンツリストを取得する。
【0095】
ステップS143において、コンテンツスコア算出部281は、ユーザの行動や嗜好に基づいて、音声情報のコンテンツに対してコンテンツスコアを算出する。
【0096】
ステップS144において、コンテンツ組み合わせスコア算出部282は、音の重なり等について評価し、コンテンツ組み合わせスコアを求める。また、コンテンツ選択部283は、コンテンツスコア算出部281により算出されたコンテンツスコアと、そのコンテンツ組み合わせスコアとに基づいて、音声情報コンテンツとそのスコアのその定位位置から、配置する範囲内で、スコアがなるべく高く、かつ、音声が重なって聞きづらいということがあまりないような音声情報コンテンツのリストを決定する。リスト生成部284は、この公式の情報に基づいて推薦コンテンツリストを生成する。
【0097】
ステップS144の処理が終了すると、推薦コンテンツリスト生成処理が終了し、処理は図10に戻る。
【0098】
以上のように各処理を行うことにより、「コンテンツを供給する側にとっての適切さ」を評価してコンテンツスコアを算出するようにすることができる。また、複数の音声データを並行して出力する場合であっても、音の重なりの増大を抑制することができ、聞き易さの低減を抑制することができる。つまり、サーバ104は、コンテンツを提供するにあたって、より適切なコンテンツを推薦することができる。
【0099】
なお、コンテンツスコアやコンテンツ組み合わせスコアの算出タイミングは任意である。例えば、それらのスコアが予め算出され、記憶されているようにしてもよい。また、その場合に、それらのスコアがコンテンツに関連付けられて管理されているようにしてもよい。
【0100】
<2.第2の実施の形態>
<スコア補正>
なお、第1の実施の形態においては、推薦コンテンツの選択に、コンテンツ組み合わせスコアを用いるように説明したが、このコンテンツ組み合わせスコアを補正することができるようにしてもよい。
【0101】
例えば、スコアが高い複数の音声情報コンテンツがあった場合、それらが聞き取り難さをある程度なくすように音量分布を変換して配信するようにしてもよい。例えば、領域Sにおいて、音声情報コンテンツc[1]の音量分布と、音声情報コンテンツc[2]の音量分布とが、図12のAに示されるような分布であるとする。この場合、横線模様で示される部分が、音が重なり合っている部分であり、コンテンツ組み合わせスコアoverlap(c[1] , c[2])は、この部分の大きさを示す。
【0102】
このような場合に、音声情報コンテンツc[1]の音量分布と、音声情報コンテンツc[2]の音量分布とを図12のBのように変換fで補正し、コンテンツ組み合わせスコアoverlap(c[1] , c[2])が所定の値pとなるようにしてもよい。
【0103】
このようにすることにより、例えば、音量分布を正規分布で表現する場合、c[i],c[j]の組に対して、overlapをpにするために、分散を制御するパラメータとして、前もって計算しておくことができる。
【0104】
<推薦コンテンツリスト生成部>
この場合の推薦コンテンツリスト生成部264の主な構成例を図13に示す。図13に示されるように、この場合の推薦コンテンツリスト生成部264は、図6の構成に加え、スコア補正部401を有する。スコア補正部401は、上述のように、コンテンツ組み合わせスコアを補正する。
【0105】
この場合、推薦コンテンツリスト生成処理は、第1の実施の形態の場合と同様に行われる(図11)。スコア補正部401は、例えば、ステップS144において、コンテンツ組み合わせスコア算出部282が算出したコンテンツ組み合わせスコアを補正する。
【0106】
このようにすることにより、コンテンツ組み合わせスコアをより低くすることができるので、複数の音声データを並行して出力する場合であっても、音の重なりの増大を抑制することができ、聞き易さの低減を抑制することができる。つまり、サーバ104は、コンテンツを提供するにあたって、より適切なコンテンツを推薦することができる。
【0107】
<3.第3の実施の形態>
<音声出力形態>
第1の実施の形態においては、端末装置101がスピーカを有し、サーバ104から供給されたコンテンツ(音声データ)の音声を出力するように説明したが、この例に限定されない。例えば、図14のAに示されるように、端末装置101が、推薦コンテンツ(音声データ)を他の装置に伝送するようにしてもよい。図14の例の場合、端末装置101は、ヘッドホン411と無線通信を行い、推薦コンテンツ(音声データ)をそのヘッドホン411に供給して、そのヘッドホン411から出力させる。このようにすることにより、ユーザ111に対してのみ、そのユーザ111のみに対する音声を出力させることができる。なお、ヘッドホン411と端末装置101との間の通信は、有線通信であってもよい。
【0108】
また、図14のBに示されるように、端末装置101が、推薦コンテンツ(音声データ)を、例えば店舗等で貸りることができるカート412に設けられた情報処理装置413に伝送し、その情報処理装置413のスピーカから、推薦コンテンツ(音声データ)を出力させるようにしてもよい。なお、この場合、端末装置101と、カート412の情報処理装置413との通信は、無線通信であってもよいし、有線通信であってもよい。
【0109】
また、図14のCに示されるように、端末装置101が、推薦コンテンツ(音声データ)を、例えば店舗等の、ユーザ111の近傍に設置されたスピーカ装置414およびスピーカ装置415に伝送し、そのスピーカ装置414およびスピーカ装置415から、推薦コンテンツ(音声データ)を出力させるようにしてもよい。この場合、端末装置101と、スピーカ装置414およびスピーカ装置415との通信は、無線通信であってもよいし、有線通信であってもよい。
【0110】
また、図14のDに示されるように、端末装置101の代わりに、例えば店舗等で貸りることができるカート412に設けられた情報処理装置416を用いるようにしてもよい。つまり、この場合、端末装置101を用いずに、サーバ104と情報処理装置416とが無線通信を行って、第1の実施の形態の端末装置101とサーバ104とのように、コンテンツ推薦処理や推薦コンテンツリスト生成処理等を行い、サーバ104がコンテンツを推薦し、その推薦されたコンテンツの音声が情報処理装置416から出力される。
【0111】
<4.第4の実施の形態>
<行動認識>
なお、推薦コンテンツリストの生成(推薦コンテンツの選択)は、サーバ104で行われるようにしてもよいが、端末装置101において行われるようにしてもよいし、端末装置101とサーバ104との両方において行われるようにしてもよい。例えば、サーバ104において1回目フィルタ処理を行って、推薦コンテンツとする候補を絞り込み、端末装置101において、2回目のフィルタ処理を行い、その中から推薦コンテンツを選択するようにしてもよい。
【0112】
また、端末装置101が、センサ情報に基づいてユーザ111の行動を認識し、その行動の認識結果を2回目のフィルタ処理に利用するようにしてもよい。
【0113】
<機能ブロック>
その場合の、端末装置101やサーバ104が実現する主な機能ブロックの例を、図15に示す。
【0114】
図15に示されるように、この場合の端末装置101は、第1の実施の形態の場合の構成(図5)に加えて行動認識部451を有する。また、この場合の端末装置101は、第1の実施の形態の場合の構成(図5)の、推薦コンテンツリスト取得部254の代わりに、第1のフィルタ結果取得部452および第2のフィルタ処理部453を有する。
【0115】
行動認識部451は、センサ情報取得部251から取得したセンサ情報に基づいて、ユーザ111の行動を認識し、その認識結果をログ提供部253に提供したり、第2のフィルタ処理部453に供給したりする。
【0116】
第1のフィルタ結果取得部452は、サーバ104において行われた第1のフィルタ処理の結果の取得に関する処理を行う。例えば、第1のフィルタ結果取得部452は、通信部164を介してサーバ104と通信を行い、第1のフィルタ処理の結果を取得する。
【0117】
第2のフィルタ処理部453は、第1のフィルタ結果取得部452により取得された第1のフィルタ処理の結果を用いて、推薦コンテンツを選択するための第2のフィルタ処理を行う。つまり、第2のフィルタ処理は、第1のフィルタ処理を通過した候補から、推薦コンテンツを選択する処理である。この第2のフィルタ処理の内容は任意である。例えば、所定の条件を設定し、この条件に引っかからない候補を推薦コンテンツとするようにしてもよい。
【0118】
サーバ104は、第1の実施の形態の場合の構成(図5)の、推薦コンテンツリスト生成部264および推薦コンテンツリスト提供部265の代わりに、第1のフィルタ処理部461、第1のフィルタ結果管理部462、および第1のフィルタ結果提供部463を有する。
【0119】
第1のフィルタ処理部461は、推薦コンテンツの候補を絞り込む第1のフィルタ処理に関する処理を行う。この第2のフィルタ処理の内容は任意である。例えば、所定の条件を設定し、この条件に引っかかるコンテンツを全て候補から外し、条件に引っかからなかったコンテンツのみを、第2のフィルタ処理が行われる候補とするようにしてもよい。
【0120】
第1のフィルタ結果管理部462は、第1のフィルタ処理部461において行われた第1のフィルタ処理の結果の管理に関する処理を行う。例えば、第1のフィルタ結果管理部462は、第1のフィルタ処理部461より供給される第1のフィルタ処理の結果を記憶部213に記憶させ管理する。第1のフィルタ結果提供部463は、その第1のフィルタ処理の結果の提供に関する処理を行う。例えば、第1のフィルタ結果提供部463は、通信部214を介して端末装置101と通信を行い、その第1のフィルタ結果を端末装置101に供給する。
【0121】
<第1のフィルタ処理部>
図16は、第1のフィルタ処理部461が有する主な機能ブロックの構成例を示す図である。図16に示されるように、記憶部213には、ログDB471および販促設定情報DB472が形成される。また、第1のフィルタ処理部461は、第1のスコア計算部481、第2のスコア計算部482、第3のスコア計算部483、およびフィルタリング484を有する。
【0122】
ログDB471は、ログ管理部262により生成され、管理されるデータベースである。ログDB471には、端末装置101から供給された、端末装置101のログが登録される。つまり、ログDB471には、コンテンツを取得する側の情報が格納されている。
【0123】
販促設定情報DB472は、コンテンツ管理部263により生成され、管理されるデータベースである。販促設定情報DB472には、コンテンツ(音声データ)の提供元等が設定するコンテンツの提供に関する情報が登録される。この情報はどのような情報であってもよいが、例えば、推薦の優先度、推薦対象ユーザ属性、推薦日時指定等であってもよいし、これら以外の情報であってもよい。
【0124】
第1のスコア計算部481は、ログDB471の情報に基づいて、コンテンツスコアを算出する。つまり、第1のスコア計算部481は、コンテンツを取得する側の情報を用いて、コンテンツスコアを算出する。第1のスコア計算部481は、算出したスコアをフィルタリング484に供給する。
【0125】
また、第3のスコア計算部483は、販促設定情報DB472の情報に基づいて、コンテンツスコアを算出する。つまり第3のスコア計算部483は、コンテンツを提供する側の情報を用いて、コンテンツスコアを算出する。第3のスコア計算部483は、算出したスコアをフィルタリング484に供給する。
【0126】
第2のスコア計算部482は、ログDB471の情報および販促設定情報DB472の情報に基づいて、コンテンツスコアを算出する。つまり第2のスコア計算部482は、コンテンツを取得する側の情報と提供する側の情報との両方を用いて、コンテンツスコアを算出する。第2のスコア計算部482は、算出したスコアをフィルタリング484に供給する。
【0127】
フィルタリング484は、これらのスコアを用いて候補の絞り込みを行う(フィルタ処理を行う)。その際、フィルタリング484は、第1のスコア計算部481乃至第3のスコア計算部483のそれぞれから供給されるコンテンツスコアに対して、重み係数を乗算して合成し、その合成結果を用いて候補の絞り込みを行うようにしてもよい。各コンテンツスコアに乗算する重み係数は、それぞれ、任意に設定することができる。つまり、フィルタリング484は、コンテンツを提供する側の情報と、コンテンツを取得する側の情報とを任意の割合で反映させてフィルタ処理を行うことができる。したがって、より柔軟な条件で候補の絞り込みを行うことができる。
【0128】
<コンテンツ推薦処理の流れ>
この場合のコンテンツ推薦処理の流れの例を、図17のフローチャートを参照して説明する。
【0129】
コンテンツ推薦処理が開始されると、端末装置101のセンサ情報取得部251は、ステップS201において、センサ情報を取得する。ステップS202において、ログ管理部252は、そのセンサ情報をログとして記録し、管理する。ステップS203において、行動認識部451は、センサ情報に基づいてユーザ111の行動を認識する。ステップS204において、ログ提供部253は、サーバ104にログを提供する。
【0130】
ステップS231においてサーバ104のログ取得部261は、そのログを取得する。ステップS232において、ログ管理部262は、その取得されたログを記録する。ステップS233において、第1のフィルタ処理部461は、そのログやコンテンツ等の情報に基づいて、第1のフィルタ処理を行い、候補を絞り込む。ステップS234において、第1のフィルタ結果管理部462は、その第1のフィルタ処理の結果を記録し、管理する。
【0131】
ステップS235において、第1のフィルタ結果提供部463は、その第1のフィルタ処理の結果を端末装置101に供給する。ステップS205において、第1のフィルタ結果取得部452は、その第1のフィルタ処理の結果を取得する。ステップS206において、第2のフィルタ処理部453は、第1のフィルタ処理で絞り込まれた候補(コンテンツ)に対して、第2のフィルタ処理を行い、推薦コンテンツを選択し、推薦コンテンツリストを生成する。ステップS207において、推薦コンテンツリスト管理部255は、生成された推薦コンテンツリストを記憶し、管理する。
【0132】
また、ステップS236において、サーバ104のコンテンツ管理部263は、コンテンツの更新が合った場合、そのコンテンツの更新を行う。
【0133】
ステップS208において、端末装置101の推薦コンテンツ取得部256は、推薦コンテンツを要求する。これに対してサーバ104のコンテンツ提供部266は、ステップS237において、その要求を取得する。そして、ステップS238において、コンテンツ提供部266は、要求された推薦コンテンツを、要求元の端末装置101に供給する。これに対して、端末装置101の推薦コンテンツ取得部256は、ステップS209において、その推薦コンテンツを取得する。そして、音声出力制御部257は、ステップS210において、取得された推薦コンテンツの音声を、出力部162のスピーカより出力させる。
【0134】
ステップS210の処理が終了すると、コンテンツ推薦処理が終了する。
【0135】
以上のようにコンテンツ推薦処理を行うことにより、「コンテンツを供給する側にとっての適切さ」を評価してコンテンツスコアを算出するようにすることができる。また、複数の音声データを並行して出力する場合であっても、音の重なりの増大を抑制することができ、聞き易さの低減を抑制することができる。つまり、サーバ104は、コンテンツを提供するにあたって、より適切なコンテンツを推薦することができる。また、この場合、推薦コンテンツの選択が、第1のフィルタ処理と第2のフィルタ処理として、端末装置101とサーバ104に分けて行われるので、負荷を分散させることができる。
【0136】
<5.第5の実施の形態>
<操作入力>
なお、端末装置101において行われる第2のフィルタ処理の条件設定を、ユーザが行うことができるようにしてもよい。
【0137】
<機能ブロック>
その場合の、端末装置101やサーバ104が実現する主な機能ブロックの例を、図18に示す。
【0138】
図18に示されるように、この場合の端末装置101は、第4の実施の形態の場合の構成(図15)に加えて操作入力部551を有する。操作入力部551は、入力部161を制御してユーザ操作を受け付け、ユーザからの指示を受け付ける。このユーザ操作の内容は任意であるが、例えば、第2のフィルタ処理の条件設定等に関する指示であってもよい。操作入力部551は、受け付けたユーザ指示を第2のフィルタ処理部453に供給する。第2のフィルタ処理部453は、そのユーザ指示に基づいて条件設定を行い、その条件を用いて第2のフィルタ処理を行う。
【0139】
<コンテンツ推薦処理の流れ>
この場合のコンテンツ推薦処理の流れの例を、図19のフローチャートを参照して説明する。
【0140】
この場合、コンテンツ推薦処理のステップS301乃至ステップS305、並びに、ステップS331乃至ステップS335の各処理は、図17のステップS201乃至ステップS205、並びに、ステップS231乃至ステップS235の各処理と同様に実行される。
【0141】
端末装置101において第1のフィルタ結果が取得されると、操作入力部551は、ステップS306において、ユーザ111からの操作入力を受け付ける。ステップS307において、第2のフィルタ処理部453は、その操作入力に従って条件を設定(または更新)し、その操作入力を反映させた条件を用いて第2のフィルタ処理を行う。
【0142】
ステップS308乃至ステップS311、並びに、ステップS336乃至ステップS338の各処理は、図17のステップS207乃至ステップS210、並びに、ステップS236乃至ステップS238の各処理と同様に実行される。
【0143】
ステップS311の処理が終了すると、コンテンツ推薦処理が終了する。
【0144】
以上のようにコンテンツ推薦処理を行うことにより、第2のフィルタ処理にユーザ操作を反映させることができるので、よりユーザの嗜好に応じたコンテンツを推薦し、提供することができる。
【0145】
<6.第6の実施の形態>
<その他のシステム>
本技術は、上述した電子棚札システムに限らず、例えば、交通、医療、防犯、農業、畜産業、鉱業、美容、工場、家電、気象、自然監視等、任意の分野の任意の用途に用いられるシステムに適用することができる。
【0146】
<コンピュータ>
上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行する場合、そのソフトウエアを実行することができるコンピュータとしての構成を有するようにすればよい。このコンピュータには、例えば、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、任意の機能を実行することが可能な汎用のコンピュータ等が含まれる。
【0147】
例えば、図3の端末装置101の場合、CPU151が、例えば、記憶部163に記憶されているプログラムを、入出力インタフェース160およびバス154を介して、RAM153にロードして実行することにより、各実施の形態において上述したハードウエアの構成の一部または全部と同等の機能を実現することができる。つまり、上述した一連の処理の少なくとも一部が行われる。RAM153にはまた、CPU151が各種の処理を実行する上において必要なデータなども適宜記憶される。
【0148】
CPU151が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア171に記録して適用することができる。その場合、プログラムは、リムーバブルメディア171をドライブ165に装着することにより、入出力インタフェース160を介して、記憶部163にインストールすることができる。また、このプログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することもできる。その場合、プログラムは、通信部164で受信し、記憶部163にインストールすることができる。その他、このプログラムは、ROM152や記憶部163に、あらかじめインストールしておくこともできる。
【0149】
また、例えば、図4のサーバ104の場合、CPU201が、例えば、記憶部213に記憶されているプログラムを、入出力インタフェース210およびバス204を介して、RAM203にロードして実行することにより、各実施の形態において上述したハードウエアの構成の一部または全部と同等の機能を実現することができる。つまり、上述した一連の処理の少なくとも一部が行われる。RAM203にはまた、CPU201が各種の処理を実行する上において必要なデータなども適宜記憶される。
【0150】
CPU201が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア221に記録して適用することができる。その場合、プログラムは、リムーバブルメディア221をドライブ215に装着することにより、入出力インタフェース210を介して、記憶部213にインストールすることができる。また、このプログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することもできる。その場合、プログラムは、通信部214で受信し、記憶部213にインストールすることができる。その他、このプログラムは、ROM202や記憶部213に、あらかじめインストールしておくこともできる。
【0151】
なお、上述した一連の処理は、一部をハードウエアにより実行させ、他をソフトウエアにより実行させることもできる。
【0152】
<その他>
本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
【0153】
また、例えば、本技術は、装置またはシステムを構成するあらゆる構成、例えば、システムLSI(Large Scale Integration)等としてのプロセッサ、複数のプロセッサ等を用いるモジュール、複数のモジュール等を用いるユニット、ユニットにさらにその他の機能を付加したセット等(すなわち、装置の一部の構成)として実施することもできる。
【0154】
なお、本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、全ての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれも、システムである。
【0155】
また、例えば、1つの装置(または処理部)として説明した構成を分割し、複数の装置(または処理部)として構成するようにしてもよい。逆に、以上において複数の装置(または処理部)として説明した構成をまとめて1つの装置(または処理部)として構成されるようにしてもよい。また、各装置(または各処理部)の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置(または処理部)の構成の一部を他の装置(または他の処理部)の構成に含めるようにしてもよい。
【0156】
また、例えば、本技術は、1つの機能を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
【0157】
また、例えば、上述したプログラムは、任意の装置において実行することができる。その場合、その装置が、必要な機能(機能ブロック等)を有し、必要な情報を得ることができるようにすればよい。
【0158】
また、例えば、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
【0159】
なお、コンピュータが実行するプログラムは、プログラムを記述するステップの処理が、本明細書で説明する順序に沿って時系列に実行されるようにしても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで個別に実行されるようにしても良い。つまり、矛盾が生じない限り、各ステップの処理が上述した順序と異なる順序で実行されるようにしてもよい。さらに、このプログラムを記述するステップの処理が、他のプログラムの処理と並列に実行されるようにしても良いし、他のプログラムの処理と組み合わせて実行されるようにしても良い。
【0160】
なお、本明細書において複数説明した本技術は、矛盾が生じない限り、それぞれ独立に単体で実施することができる。もちろん、任意の複数の本技術を併用して実施することもできる。例えば、いずれかの実施の形態において説明した本技術を、他の実施の形態において説明した本技術と組み合わせて実施することもできる。また、上述した任意の本技術を、上述していない他の技術と併用して実施することもできる。
【0161】
なお、本技術は以下のような構成も取ることができる。
(1) 推薦するコンテンツの各候補について、推薦の適切さを評価した評価値である第1のスコアを算出する第1のスコア算出部と、
前記候補の各組み合わせについて、推薦の適切さを評価した評価値である第2のスコアを算出する第2のスコア算出部と、
前記第1のスコア算出部により算出された各候補の前記第1のスコアと、前記第2のスコア算出部により算出された前記候補の各組み合わせの前記第2のスコアとに基づいて、推薦するコンテンツを複数選択する選択部と
を備える情報処理装置。
(2) 前記コンテンツは音声データを含む
(1)に記載の情報処理装置。
(3) 前記第2のスコア算出部は、前記組み合わせにおける音声データ同士の音の重なり度合いを前記第2のスコアとして算出する
(1)または(2)に記載の情報処理装置。
(4) 前記第2のスコア算出部は、各候補の音声データの定位に基づいて、前記音の重なり度合いを求める
(1)乃至(3)のいずれかに記載の情報処理装置。
(5) 前記第1のスコア算出部は、前記コンテンツを取得する側にとっての適切さを前記第1のスコアとして算出する
(1)乃至(4)のいずれかに記載の情報処理装置。
(6) 前記第1のスコア算出部は、前記コンテンツを取得する側にとっての前記コンテンツの推薦の適切さを、前記コンテンツを取得するユーザの行動に基づいて求める
(1)乃至(5)のいずれかに記載の情報処理装置。
(7) 前記ユーザの行動の履歴を管理する履歴管理部をさらに備え、
前記第1のスコア算出部は、前記コンテンツを取得する側にとっての前記コンテンツの推薦の適切さを、前記履歴管理部により管理される前記ユーザの行動の履歴に基づいて求めるように構成される
(1)乃至(6)のいずれかに記載の情報処理装置。
(8) 前記第1のスコア算出部は、前記コンテンツを取得する側にとっての前記コンテンツの推薦の適切さを、前記コンテンツを取得するユーザの嗜好に基づいて求める
(1)乃至(7)のいずれかに記載の情報処理装置。
(9) 前記第1のスコア算出部は、前記コンテンツを供給する側にとっての適切さを前記第1のスコアとして算出する
(1)乃至(8)のいずれかに記載の情報処理装置。
(10) 前記第1のスコア算出部は、前記コンテンツを提供する側にとっての前記コンテンツの推薦の適切さを、前記コンテンツを提供する側によって設定される優先度に基づいて求める
(1)乃至(9)のいずれかに記載の情報処理装置。
(11) 前記第1のスコア算出部は、前記コンテンツを提供する側にとっての前記コンテンツの推薦の適切さを、前記コンテンツを提供する側によって設定される前記コンテンツの提供可能範囲に基づいて求める
(1)乃至(10)のいずれかに記載の情報処理装置。
(12) 前記第2のスコア算出部により算出された前記候補の各組み合わせの前記第2のスコアを補正する補正部をさらに備え、
前記選択部は、前記第1のスコア算出部により算出された前記第1のスコアと、前記補正部により補正された前記第2のスコアとに基づいて、推薦するコンテンツを複数選択するように構成される
(1)乃至(11)のいずれかに記載の情報処理装置。
(13) 前記選択部により選択された複数の前記コンテンツのリストである推薦コンテンツリストを生成する推薦コンテンツリスト生成部をさらに備える
(1)乃至(12)のいずれかに記載の情報処理装置。
(14) 前記推薦コンテンツリスト生成部により生成された前記推薦コンテンツリストを他の情報処理装置に提供する推薦コンテンツリスト提供部をさらに備える
(1)乃至(13)のいずれかに記載の情報処理装置。
(15) 前記推薦コンテンツリスト生成部により生成された前記推薦コンテンツリストに含まれるコンテンツを他の情報処理装置より取得するコンテンツ取得部をさらに備える
(1)乃至(14)のいずれかに記載の情報処理装置。
(16) 前記コンテンツ取得部により取得された前記コンテンツを出力する出力部をさらに備える
(1)乃至(15)のいずれかに記載の情報処理装置。
(17) ユーザの操作入力を受け付ける受付部をさらに備え、
前記第2のスコア算出部は、前記受付部により受け付けられた前記操作入力に基づいて、前記第2のスコアを算出するように構成される
(1)乃至(16)のいずれかに記載の情報処理装置。
(18) 推薦するコンテンツの各候補について、推薦の適切さを評価した評価値である第1のスコアを算出し、
前記候補の各組み合わせについて、推薦の適切さを評価した評価値である第2のスコアを算出し、
算出された各候補の前記第1のスコアと、算出された前記候補の各組み合わせの前記第2のスコアとに基づいて、推薦するコンテンツを複数選択する
情報処理方法。
(19) 推薦するコンテンツの各候補について、前記コンテンツを供給する側にとっての推薦の適切さと、前記コンテンツを取得する側にとっての推薦の適切さとの両方を評価して、スコアを算出するスコア算出部と、
前記スコア算出部により算出された各候補の前記スコアに基づいて、推薦するコンテンツを選択する選択部と
を備える情報処理装置。
(20) 推薦するコンテンツの各候補について、前記コンテンツを供給する側にとっての推薦の適切さと、前記コンテンツを取得する側にとっての推薦の適切さとの両方を評価して、スコアを算出し、
算出された各候補の前記スコアに基づいて、推薦するコンテンツを選択する
情報処理方法。
【符号の説明】
【0162】
100 音声データ提供システム, 101 端末装置, 102 アクセスポイント, 103 ネットワーク, 104 サーバ, 151 CPU, 201 CPU, 251 センサ情報取得部, 252 ログ管理部, 253 ログ提供部, 254 推薦コンテンツリスト取得部, 255 推薦コンテンツリスト管理部, 256 推薦コンテンツ取得部, 257 音声出力制御部, 261 ログ取得部, 262 ログ管理部, 263 コンテンツ管理部, 264 推薦コンテンツリスト生成部, 265 推薦コンテンツリスト提供部, 266 コンテンツ提供部, 281 コンテンツスコア算出部, 282 コンテンツ組み合わせスコア算出部, 283 コンテンツ選択部, 284 リスト生成部, 401 スコア補正部, 451 行動認識部, 452 第1のフィルタ結果取得部, 453 第2のフィルタ処理部, 461 第1のフィルタ処理部, 462 第1のフィルタ結果管理部, 463 第1のフィルタ結果提供部, 471 ログDB, 472 販促設定情報DB, 481 第1のスコア計算部, 482 第2のスコア計算部, 483 第3のスコア計算部, 484 フィルタリング, 551 操作入力部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19