特許第5997108号(P5997108)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電信電話株式会社の特許一覧 ▶ 学校法人慶應義塾の特許一覧

特許5997108コンテンツ配信装置、コンテンツ配信方法及びプログラム
<>
  • 特許5997108-コンテンツ配信装置、コンテンツ配信方法及びプログラム 図000002
  • 特許5997108-コンテンツ配信装置、コンテンツ配信方法及びプログラム 図000003
  • 特許5997108-コンテンツ配信装置、コンテンツ配信方法及びプログラム 図000004
  • 特許5997108-コンテンツ配信装置、コンテンツ配信方法及びプログラム 図000005
  • 特許5997108-コンテンツ配信装置、コンテンツ配信方法及びプログラム 図000006
  • 特許5997108-コンテンツ配信装置、コンテンツ配信方法及びプログラム 図000007
  • 特許5997108-コンテンツ配信装置、コンテンツ配信方法及びプログラム 図000008
  • 特許5997108-コンテンツ配信装置、コンテンツ配信方法及びプログラム 図000009
  • 特許5997108-コンテンツ配信装置、コンテンツ配信方法及びプログラム 図000010
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5997108
(24)【登録日】2016年9月2日
(45)【発行日】2016年9月28日
(54)【発明の名称】コンテンツ配信装置、コンテンツ配信方法及びプログラム
(51)【国際特許分類】
   G06F 13/00 20060101AFI20160915BHJP
【FI】
   G06F13/00 540A
   G06F13/00 560A
【請求項の数】6
【全頁数】14
(21)【出願番号】特願2013-145274(P2013-145274)
(22)【出願日】2013年7月11日
(65)【公開番号】特開2015-18418(P2015-18418A)
(43)【公開日】2015年1月29日
【審査請求日】2015年7月27日
(73)【特許権者】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(73)【特許権者】
【識別番号】899000079
【氏名又は名称】学校法人慶應義塾
(74)【代理人】
【識別番号】100121706
【弁理士】
【氏名又は名称】中尾 直樹
(74)【代理人】
【識別番号】100128705
【弁理士】
【氏名又は名称】中村 幸雄
(74)【代理人】
【識別番号】100147773
【弁理士】
【氏名又は名称】義村 宗洋
(72)【発明者】
【氏名】井島 勇祐
(72)【発明者】
【氏名】吉岡 理
(72)【発明者】
【氏名】小川 克彦
【審査官】 佐々木 洋
(56)【参考文献】
【文献】 特開2008−191979(JP,A)
【文献】 特開2012−185303(JP,A)
【文献】 特開2005−275985(JP,A)
【文献】 岡本浩実 他,歩きながら街のつぶやきを聴くシステム”WalkON”の提案,ヒューマンインタフェースシンポジウム2012論文集,2012年 9月 4日,pp. 259-262
(58)【調査した分野】(Int.Cl.,DB名)
G06F 13/00
(57)【特許請求の範囲】
【請求項1】
ソーシャルネットワーキングサービスからコンテンツを含む投稿情報を取得する投稿情報取得部と、
上記ソーシャルネットワーキングサービス上で上記投稿情報を購読する購読者の属性を集計して投稿属性を推定する投稿属性推定部と、
上記コンテンツと上記投稿属性を関連付ける対応情報を生成する対応情報作成部と、
利用者の操作する個人端末に設定された上記利用者の属性であるコンテンツ生成情報を取得する生成情報取得部と、
上記対応情報を用いて、上記投稿属性と上記コンテンツ生成情報とが合致する上記コンテンツを生成するコンテンツ生成部と、
上記コンテンツを上記個人端末へ送信するコンテンツ送信部と、
を含むコンテンツ配信装置。
【請求項2】
請求項1に記載のコンテンツ配信装置であって、
上記コンテンツがテキストであれば、上記コンテンツを音声合成して合成音声を生成する音声合成部
をさらに含むコンテンツ配信装置。
【請求項3】
請求項2に記載のコンテンツ配信装置であって、
上記投稿属性の各属性値に対応する音声合成パラメータを記憶する音声合成パラメータ記憶部
をさらに含み、
上記音声合成部は、上記コンテンツに関連付けられた上記投稿属性に基づいて決定した上記音声合成パラメータを用いて上記コンテンツを音声合成するものである
コンテンツ配信装置。
【請求項4】
請求項1から3のいずれかに記載のコンテンツ配信装置であって、
上記投稿属性推定部は、上記投稿情報を投稿した位置に関連した属性を上記投稿属性にさらに含めるものであり、
上記生成情報取得部は、上記個人端末を操作する位置に関連した属性を上記コンテンツ生成情報にさらに含めるものである
コンテンツ配信装置。
【請求項5】
投稿情報取得部が、ソーシャルネットワーキングサービスからコンテンツを含む投稿情報を取得する投稿情報取得ステップと、
投稿属性推定部が、上記ソーシャルネットワーキングサービス上で上記投稿情報を購読する購読者の属性を集計して投稿属性を推定する投稿属性推定ステップと、
対応情報作成部が、上記コンテンツと上記投稿属性を関連付ける対応情報を生成する対応情報作成ステップと、
生成情報取得部が、利用者の操作する個人端末に設定された上記利用者の属性であるコンテンツ生成情報を取得する生成情報取得ステップと、
コンテンツ生成部が、上記対応情報を用いて、上記投稿属性と上記コンテンツ生成情報とが合致する上記コンテンツを生成するコンテンツ生成ステップと、
コンテンツ送信部が、上記コンテンツを上記個人端末へ送信するコンテンツ送信ステップと、
を含むコンテンツ配信方法。
【請求項6】
請求項1からのいずれかに記載のコンテンツ配信装置としてコンピュータを機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、個人端末へコンテンツを配信する技術に関する。
【背景技術】
【0002】
近年、屋内もしくは屋外に設置した平面ディスプレイなどの媒体へテキスト、音声・音、写真、動画などのコンテンツを表示するデジタルサイネージ(Digital Signage、電子看板)技術が普及している。デジタルサイネージでは媒体に表示するコンテンツを動的に変更することが可能となっていることが特徴である。このようなデジタルサイネージの利点を活用して、媒体を見ている個人ごとに適切なコンテンツを動的に選択又は生成して表示することが広告効果を高めるために望ましいと考えられている。
【0003】
ところで、近年、ソーシャルネットワーキングサービス(Social Networking Service、SNS)の普及が進んでいる。ソーシャルネットワーキングサービスでは、利用者がテキストや写真、動画、音声などを投稿することができ、利用者は他の利用者の投稿を購読することができる。特に、携帯電話やスマートフォン、タブレット端末などの全地球測位システム(Global Positioning System、GPS)機能を搭載したモバイル機器を用いると、投稿にその投稿日時や投稿したときの位置情報を付加することができ、その投稿がいつどこで投稿されたものであるかが判別できるようになっている。このようなソーシャルネットワーキングサービスの例として、米国Twitter社が運営する「Twitter(登録商標)」、米国Facebook社が運営する「Facebook(登録商標)」、米国Foursquare社が運営する「Foursquare(登録商標)」などが挙げられる。
【0004】
また、近年、テキストから合成音声を生成する音声合成技術では、様々な話者(特定個人の音声等)や口調(感情等)の合成音声を作成することが可能となっている。このような音声合成技術には非特許文献1に記載の技術がある。非特許文献1に記載されている音声合成技術を活用することで多様な合成音声を生成することができる。
【先行技術文献】
【非特許文献】
【0005】
【非特許文献1】橘他、「平均声モデルを用いる合成音声の話者性とスタイルの同時多様化の検討」、電子情報通信学会技術研究報告、Vol. 107、No. 356、SP2007-87、pp. 7-12、2007年11月
【発明の概要】
【発明が解決しようとする課題】
【0006】
従来のデジタルサイネージ技術は、施設内や屋外などで大人数が閲覧することを前提としている。そのため、個人に対して適切なコンテンツを表示することは難しい。一方、近年では無線通信技術の発展により、個人個人がコンテンツを表示することが可能な個人端末(携帯電話、スマートフォン、タブレット端末、ラップトップコンピュータなど)を保持していることが多くなっている。このような個人端末において、利用者の属性や時間、場所などに適したコンテンツを表示・再生させることができると望ましい。
【0007】
しかし、コンテンツ提供者があらかじめ指定したコンテンツを個人端末において表示・再生させるだけでは、個人毎に適切なコンテンツを提供できているとは限らない。そこで、既存のソーシャルネットワーキングサービスなどへの投稿をコンテンツとして扱うことで、個人毎に適切なコンテンツを提供できるようになると考えられる。そのためには、ソーシャルネットワーキングサービスに投稿されたコンテンツがどのような利用者にとって適切なのかを決定することが必要となる。
【0008】
この発明の目的は、ソーシャルネットワーキングサービスへ投稿されたコンテンツから利用者にとって適切なコンテンツを抽出し、個人端末へ配信することである。
【課題を解決するための手段】
【0009】
上記の課題を解決するために、この発明のコンテンツ配信装置は、投稿情報取得部、投稿属性推定部、対応情報作成部、生成情報取得部、コンテンツ生成部及びコンテンツ送信部を含む。投稿情報取得部は、ソーシャルネットワーキングサービスからコンテンツを含む投稿情報を取得する。投稿属性推定部は、投稿情報に基づいて投稿属性を推定する。対応情報作成部は、コンテンツと投稿属性を関連付ける対応情報を生成する。生成情報取得部は、利用者の操作する個人端末からコンテンツ生成情報を取得する。コンテンツ生成部は、対応情報を用いて、投稿属性とコンテンツ生成情報とが合致するコンテンツを生成する。コンテンツ送信部は、コンテンツを個人端末へ送信する。
【発明の効果】
【0010】
この発明のコンテンツ配信技術によれば、個人端末において現在地や利用者の属性に応じて適切なコンテンツを動的に表示・再生することができる。
【図面の簡単な説明】
【0011】
図1図1は、第一実施形態のコンテンツ配信装置の機能構成を例示する図である。
図2図2は、コンテンツ収集方法の処理フローを例示する図である。
図3図3(A)は、購読者の属性情報の設定内容を例示する図である。図3(B)は、投稿属性の集計結果を例示する図である。
図4図4は、対応情報の設定内容を例示する図である。
図5図5は、第一実施形態のコンテンツ配信方法の処理フローを例示する図である。
図6図6は、コンテンツ生成情報の設定内容を例示する図である。
図7図7は、第二実施形態のコンテンツ配信装置の機能構成を例示する図である。
図8図8は、第二実施形態のコンテンツ配信方法の処理フローを例示する図である。
図9図9(A)は、音声合成パラメータの一例を示す図である。図9(B)は、音声合成パラメータの他の例を示す図である。
【発明を実施するための形態】
【0012】
以下、この発明の実施の形態について詳細に説明する。なお、図面中において同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
【0013】
[第一実施形態]
図1を参照して、第一実施形態に係るコンテンツ配信装置の機能構成の一例を説明する。第一実施形態に係るコンテンツ配信装置1は、少なくとも1台の個人端末2及び少なくとも1つのソーシャルネットワーキングサービス3と連携して動作する。また、コンテンツ配信装置1は、必要に応じて情報提供サービス4と連携して動作してもよい。
【0014】
コンテンツ配信装置1は、投稿情報取得部10、投稿属性推定部11、対応情報作成部12、生成情報取得部13、コンテンツ生成部14、コンテンツ送信部15、対応情報記憶部101及びコンテンツ記憶部102を含む。コンテンツ配信装置1は、例えば、中央演算処理装置(Central Processing Unit、CPU)、主記憶装置(Random Access Memory、RAM)などを有する公知又は専用のコンピュータに特別なプログラムが読み込まれて構成された特別な装置である。コンテンツ配信装置1は、例えば、中央演算処理装置の制御のもとで各処理を実行する。コンテンツ配信装置1に入力されたデータや各処理で得られたデータは、例えば、主記憶装置に格納され、主記憶装置に格納されたデータは必要に応じて読み出されて他の処理に利用される。コンテンツ配信装置1が備える各記憶部は、例えば、RAM(Random Access Memory)などの主記憶装置、ハードディスクや光ディスクもしくはフラッシュメモリ(Flash Memory)のような半導体メモリ素子により構成される補助記憶装置、またはリレーショナルデータベースやキーバリューストアなどのミドルウェアにより構成することができる。コンテンツ配信装置1が備える各記憶部は、それぞれ論理的に分割されていればよく、一つの物理的な記憶装置に記憶されていてもよい。
【0015】
個人端末2は、携帯電話、スマートフォン、タブレット端末、ラップトップコンピュータなどの無線通信機能を備え、利用者が持ち運んで利用することを想定して設計された端末である。個人端末2は、例えば、中央演算処理装置(Central Processing Unit、CPU)、主記憶装置(Random Access Memory、RAM)などを有する公知又は専用のコンピュータに特別なプログラムが読み込まれて構成された特別な装置である。個人端末2は、例えば、無線LAN(Local Area Network)やW-CDMA(Wideband Code Division Multiplexing Access、広帯域符号分割多重接続)、LTE(Long Term Evolution)などに代表される携帯電話回線を用いて、データを送受信するための無線通信インターフェースを備える。個人端末2は、人工衛星からの電波を受信することで地球上での位置情報を取得する全地球測位システム(Global Positioning System、GPS)機能を搭載していることが望ましい。
【0016】
ソーシャルネットワーキングサービス3は、ネットワークを介して利用者同士の繋がりを促進しサポートするコミュニティ型のウェブサービスである。ソーシャルネットワーキングサービス3は、インターネット上でサービスが提供される場合が一般的であるが、独自に構築した閉ざされたネットワーク上でサービスが提供されてもよい。ソーシャルネットワーキングサービス3において、利用者は性別や年齢、職業などの個人的な属性を含むプロフィールを設定することができる。利用者は、例えば、個人端末2などのインターネットにアクセスすることが可能な機器を用いて、テキストや写真、動画、音声などをソーシャルネットワーキングサービス3へ投稿することができる。ソーシャルネットワーキングサービス3において、利用者は、任意にもしくは相手の承諾を得て、他の利用者の投稿を購読することができるようになっていることが一般的である。このようなソーシャルネットワーキングサービスの例としては、上述の「Twitter(登録商標)」、「Facebook(登録商標)」、「Foursquare(登録商標)」などが挙げられる。
【0017】
情報提供サービス4は、ネットワークを介して特定の情報を提供するウェブサービスである。情報提供サービス4は、インターネット上でサービスが提供される場合が一般的であるが、独自に構築した閉ざされたネットワーク上でサービスが提供されてもよい。情報提供サービス4は、例えば、位置情報が指定されるとその場所の天気や気温、湿度などの天候情報を返却する気象情報サービス、もしくは要求に応じてNTP(Network Time Protocol)などの手順により標準時刻を提供するインターネット時刻サービスである。
【0018】
図2を参照して、コンテンツ収集方法の処理フローの一例を、実際に行われる手続きの順に従って説明する。
【0019】
ステップS10において、投稿情報取得部10は、ソーシャルネットワーキングサービス3からコンテンツを含む投稿情報を取得する。投稿情報取得部10は、ソーシャルネットワーキングサービス3が提供するAPI(Application Programming Interface)を利用して、利用者の投稿情報を取得する。以下、投稿情報を投稿した利用者を投稿者と呼ぶ。投稿情報の取得は、投稿情報の有無を常時監視することによりリアルタイムに実行してもよいし、あらかじめ定めた時間間隔で定期的に実行してもよい。投稿情報を取得する対象の利用者は事前に登録した利用者であってもよいし、ソーシャルネットワーキングサービス3において投稿情報を公開している利用者からランダムに選択してもよい。取得した投稿情報は、投稿属性推定部11へ入力される。
【0020】
ステップS11aにおいて、投稿属性推定部11は、入力された投稿情報に基づいて購読者の属性情報を取得する。購読者とは、投稿者の投稿を購読している他の利用者である。購読者の属性情報とは、ソーシャルネットワーキングサービス3において購読者それぞれが設定している属性情報であり、例えば、性別や年代、職業、居住地などの情報である。購読者の属性情報は、その購読者の過去の投稿情報から推定することも可能である(例えば、下記参考文献1参照)。
〔参考文献1〕平野他、「Markov Logicを用いたテキストからのユーザ属性推定」、2013年度人工知能学会全国大会、3E3-3、2013年6月
【0021】
図3(A)に購読者の属性情報の一例を示す。「性別」「年代」「職業」は、ソーシャルネットワーキングサービス3において購読者自身が設定した属性情報である。この例では、「読者1」は、性別が男性、年代が20代、職業が社会人に設定されている。同様に、「読者2」は、性別が女性、年代が30代、職業が自営業であり、「読者15」は、性別が男性、年代が10代、職業が学生である。
【0022】
ステップS11bにおいて、投稿属性推定部11は、購読者の属性情報を集計して投稿属性を推定する。集計は各属性について同一の設定値の数を計数することで行う。購読者の属性情報を集計した結果から、各属性について最も人数が多い設定値を使用して投稿属性を生成する。
【0023】
図3(B)に集計結果の一例を示す。この例では、性別が男性である購読者は10名であり、性別が女性である購読者は5名である。同様に、年代が20代である購読者は8名、30代である購読者は4名、30代である購読者は3名である。また、職業が学生である購読者は11名、社会人である購読者は3名、自営業である購読者は1名である。
【0024】
ステップS12aにおいて、対応情報作成部12は、取得した投稿情報を一意に識別するコンテンツ識別子(以下、コンテンツIDとも言う)を生成し、投稿情報に含まれるコンテンツに付与する。コンテンツ識別子はコンテンツ記憶部102において記憶されているコンテンツを一意に識別するための情報である。コンテンツ識別子は、都度使用中の識別子に重複しないように連番でもしくはランダムに決定してもよいし、あらかじめ用意した複数の識別子を記憶しておき特定の規則に従って選択することにより決定してもよい。
【0025】
ステップS12bにおいて、対応情報作成部12は、コンテンツ識別子と投稿属性を組としてコンテンツと投稿属性を関連付けるための対応情報を生成する。
【0026】
図4に対応情報の一例を示す。「コンテンツID」はコンテンツを一意に識別するコンテンツ識別子である。「日付」「時刻」はコンテンツを含む投稿情報が投稿された日付及び時刻である。「現在地」はコンテンツを含む投稿情報が投稿された位置情報である。「性別」「年代」「職業」はコンテンツを含む投稿情報の購読者の属性情報を集計して決定した属性情報である。この例では、「コンテンツID」が「音声1」である対応情報は、○月○日◆曜日△時から○時の晴れの時に▲駅において20代で男性の学生によって投稿されたものであることを表している。
【0027】
ステップS12cにおいて、対応情報作成部12は、生成した対応情報を対応情報記憶部101へ記憶し、コンテンツ識別子が付与されたコンテンツをコンテンツ記憶部102に記憶する。
【0028】
図5を参照して、コンテンツ配信方法の処理フローの一例を、実際に行われる手続きの順に従って説明する。
【0029】
ステップS13において、生成情報取得部13は、利用者の操作する個人端末2からコンテンツ生成情報を取得する。コンテンツ生成情報とは、個人端末2へ配信するコンテンツを生成するために利用される情報である。コンテンツ生成情報は、例えば、情報取得時の時間情報(日時、曜日など)、個人端末2の現在地や現在地の天気、利用者の性別や年代、職業、居住地などの属性情報を含む。
【0030】
コンテンツ生成情報のうち、個人端末2から直接取得することが可能な情報は個人端末2から取得する。個人端末2から取得可能な情報には、例えば、個人端末2の現在地や利用者の属性情報などが含まれる。個人端末2の現在地は個人端末2に搭載されたGPS機能から取得する位置情報である。一般的にGPS機能により取得可能な情報は緯度経度情報であるが、外部の地理情報サービスなどと連携して現在地周辺の代表的な施設や行政上の地理表示に変換してもよい。利用者の属性情報(性別、年代、職業など)は利用者が個人端末2の利用に際して事前に登録する情報である。一方、個人端末2から直接取得することが難しい情報は、外部のインターネットサービスや外部サーバである情報提供サービス4から取得すればよい。個人端末2から取得不可な情報には、例えば、気象情報や時間情報などが含まれる。気象情報は民間又は公的機関が運営する気象情報サービスから取得することができる。時間情報はインターネット上に存在するNTP(Network Time Protocol)サーバから標準時刻を取得することができる。
【0031】
図6にコンテンツ生成情報の一例を示す。「日付」「時刻」「曜日」は、外部のNTPサーバ又は個人端末2のシステム時刻から取得した現在時刻である。「現在地」は個人端末2に搭載されたGPS機能により特定した個人端末2の現在地を示す情報である。「天気」は現在時刻及び現在地を指定して外部の気象情報サービスから取得した天気を示す情報(晴れ、曇、雨、雪など)である。「性別」「年代」「職業」は、個人端末2に利用者自身が設定した属性情報である。この例では、現在時刻は○月○日◆曜日△時△分であり、天気は晴れであり、個人端末2の利用者は20代で男性の学生である。
【0032】
ステップS14aにおいて、コンテンツ生成部14は、対応情報記憶部101へ記憶されている対応情報を参照して、投稿属性とコンテンツ生成情報とが合致するコンテンツ識別子を抽出する。具体的には、以下のようにコンテンツ識別子を抽出する。まず、コンテンツ生成部14は、対応情報の「時間」及びコンテンツ生成情報の「時間」並びに対応情報の「現在地」及びコンテンツ生成情報の「現在地」が一致する対応情報を選択する。複数の対応情報が一致した場合には、「曜日」「天気」「性別」「年代」「職業」などのいずれかが一致するものをさらに選択し、一つの対応情報を決定する。いずれの属性が一致するものを選択するかは、あらかじめ属性ごとに優先度を設定しておき、その優先度に従って決定してもよいし、選択される対応情報が一つに絞られるように属性を任意に組み合わせて決定するようにしてもよい。図6に示したコンテンツ生成情報により図4に示した対応情報からコンテンツ識別子を抽出するのであれば、まず、「時間」と「現在地」が一致する「音声1」及び「テキスト2」が選択され、さらに「性別」「年代」「職業」が一致する「音声1」が抽出されることになる。コンテンツ生成情報に一致する対応情報が存在しない場合、もしくは対応情報の取得に失敗した場合には、コンテンツ生成部14は、コンテンツ識別子を出力せず、処理を終了する。
【0033】
ステップS14bにおいて、コンテンツ生成部14は、抽出したコンテンツ識別子が付与されたコンテンツをコンテンツ記憶部102から読み込む。
【0034】
ステップS15において、コンテンツ送信部15は、読み込んだコンテンツを個人端末2へ送信する。個人端末2は受信したコンテンツをその種類に応じて再生する。例えば、コンテンツがテキストであれば、個人端末2が備えるディスプレイにそのテキストを表示する。また、例えば、コンテンツが音声であれば、個人端末2が備えるスピーカを用いてその音声を再生する。また、例えば、コンテンツが動画であれば、個人端末2が備えるディスプレイ及びスピーカを用いてその動画を再生する。
【0035】
ソーシャルネットワーキングサービスにおいては一般的に興味の分野が近い利用者同士が互いの投稿を購読する場合が多い。上述のように、ソーシャルネットワーキングサービスに投稿されたコンテンツを購読者の属性情報と対応付けて、利用者の属性情報と購読者の属性情報とが合致するコンテンツを利用者へ配信することで、利用者に対してより適切なコンテンツを配信することが可能となる。
【0036】
[第二実施形態]
第一実施形態では、あらかじめ作成されているコンテンツ群の中からコンテンツ生成情報に応じて適切なコンテンツを動的に選択した。第二実施形態では、選択したコンテンツがテキストであれば、さらに音声合成技術を利用して、動的に音声コンテンツを生成して個人端末に配信する。これにより、コンテンツの多様性をより広げることができる。
【0037】
図7を参照して、第二実施形態に係るコンテンツ配信装置の機能構成の一例を説明する。第二実施形態に係るコンテンツ配信装置5は、第一実施形態に係るコンテンツ配信装置1と同様に、投稿情報取得部10、投稿属性推定部11、対応情報作成部12、生成情報取得部13、コンテンツ生成部14、コンテンツ送信部15、対応情報記憶部101及びコンテンツ記憶部102を含み、さらに音声合成部16及び音声合成パラメータ記憶部103を含む。コンテンツ配信装置5は、例えば、中央演算処理装置(Central Processing Unit、CPU)、主記憶装置(Random Access Memory、RAM)などを有する公知又は専用のコンピュータに特別なプログラムが読み込まれて構成された特別な装置である。コンテンツ配信装置5は、例えば、中央演算処理装置の制御のもとで各処理を実行する。コンテンツ配信装置5に入力されたデータや各処理で得られたデータは、例えば、主記憶装置に格納され、主記憶装置に格納されたデータは必要に応じて読み出されて他の処理に利用される。コンテンツ配信装置5が備える各記憶部は、例えば、RAM(Random Access Memory)などの主記憶装置、ハードディスクや光ディスクもしくはフラッシュメモリ(Flash Memory)のような半導体メモリ素子により構成される補助記憶装置、またはリレーショナルデータベースやキーバリューストアなどのミドルウェアにより構成することができる。コンテンツ配信装置5が備える各記憶部は、それぞれ論理的に分割されていればよく、一つの物理的な記憶装置に記憶されていてもよい。
【0038】
第二実施形態に係る個人端末2、ソーシャルネットワーキングサービス3及び情報提供サービス4の構成は第一実施形態と同様である。
【0039】
図8を参照して、第二実施形態のコンテンツ配信方法におけるコンテンツ配信処理の処理フローの一例を、実際に行われる手続きの順に従って説明する。ステップS13からステップS14bまでの処理は第一実施形態と同様である。
【0040】
音声パラメータ記憶部103には、音声合成部16が音声合成処理の際に利用する音声合成パラメータが記憶される。音声合成パラメータについての詳細は音声合成部16の処理の中で併せて説明する。
【0041】
ステップS16aにおいて、音声合成部16は、読み込んだコンテンツの種類を確認する。コンテンツの種類がテキストであれば、ステップS16bへ処理を進める。コンテンツの種類がテキスト以外であれば、ステップS15へ処理を進める。
【0042】
ステップS16bにおいて、音声合成部16は、読み込んだコンテンツの内容である文字列を音声合成して合成音声を生成する。合成音声を生成する際には、音声パラメータ記憶部103にあらかじめ記憶した音声パラメータからコンテンツ生成情報に合致する音声パラメータを決定し、多様な合成音声を動的に生成する。音声合成方法は既存の様々な音声合成技術を適用することができる。以下では、合成音声の発話者及び口調、合成音声の抑揚情報であるピッチレンジをそれぞれ決定する音声合成方法を例示する。
【0043】
近年の音声合成技術では、様々な話者(特定個人の音声など)や口調(感情など)の合成音声を作成することが可能となっている。このような音声合成技術には、例えば、非特許文献1に記載された音声合成方法がある。非特許文献1に記載された音声合成方法を利用することにより、音声合成部16は、コンテンツ生成情報に合致した発話者及び口調により合成音声を生成することができる。
【0044】
図9(A)にコンテンツ生成情報に応じて発話者及び口調を決定する場合の音声パラメータの一例を示す。「話者」は発話者を特定する名称である。「口調」は口調を特定する名称である。「性別」「年代」「職業」は話者及び口調に関連付けられた属性情報である。
【0045】
音声合成部16は、音声パラメータ記憶部103に記憶した音声パラメータから属性情報がコンテンツ生成情報に含まれる属性情報と一致する音声パラメータを特定する。そして、音声合成部16は、特定した音声パラメータを用いてコンテンツを音声合成して合成音声を生成する。
【0046】
また例えば、合成音声のピッチレンジをコンテンツ生成情報に応じて決定する方法がある。ピッチレンジとは、F0の最大値と最小値の幅であり、抑揚を表現するパラメータの一つである。ピッチレンジが大きい場合は抑揚が大きくなり、ピッチレンジが小さい場合は抑揚が小さくなる。抑揚が小さくなるといわゆる棒読みに近くなる。
【0047】
図9(B)にコンテンツ生成情報に応じてピッチレンジを決定する場合の音声パラメータの一例を示す。「ピッチレンジ重みw」は天気に応じて音声合成時に指定するピッチレンジに対する重みである。「天気」はそのピッチレンジに関連付けられた天気である。この例では、コンテンツ生成情報の「天気」が「晴れ」であれば、ピッチレンジ重みを「1.5」とする。同様に、コンテンツ生成情報の「天気」が「雨」であれば、ピッチレンジ重みを「0.5」とする。これにより天気によってピッチレンジが変動し、例えば、晴れの場合には抑揚を大きくし、雨の場合には抑揚を小さくし、適切なピッチレンジでテキストのコンテンツを音声合成することができる。
【0048】
図9(B)の例では、ピッチレンジprは以下の式により算出する。
pr=w×prd
【0049】
ここで、wはピッチレンジの重みである。重みwは、天気により決定される正の実数値である。prdは、あらかじめ音声合成部16に設定されているピッチレンジの規定値である。これより、例えば天気が晴れであれば、ピッチレンジが大きく抑揚の変化に富んだ合成音声が作成され、雨であればピッチレンジが小さく抑揚の変化がほとんどない合成音声が作成される。
【0050】
音声パラメータ記憶部103に記憶する音声パラメータに時間や日付の項目を追加することで、時間帯や日付によって発話者及び口調もしくはピッチレンジを変化させることも可能である。
【0051】
ステップS15において、コンテンツ送信部15は、コンテンツを音声合成により変換した合成音声を個人端末2へ送信する。個人端末2は第一実施形態と同様に、受信したコンテンツをその種類に応じて再生する。受信したコンテンツが音声であれば、個人端末2が備えるスピーカを用いてその音声を再生するため、コンテンツがテキストである場合は、合成音声がスピーカから再生されることになる。
【0052】
[プログラム、記録媒体]
この発明は上述の実施形態に限定されるものではなく、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。上記実施例において説明した各種の処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。
【0053】
また、上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
【0054】
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリなどどのようなものでもよい。
【0055】
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROMなどの可搬型記録媒体を販売、譲渡、貸与などすることによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
【0056】
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータなど)を含むものとする。
【0057】
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
【符号の説明】
【0058】
1、5 コンテンツ配信装置
2 個人端末
3 ソーシャルネットワーキングサービス
4 情報提供サービス
10 投稿情報取得部
11 投稿属性推定部
12 対応情報作成部
13 生成情報取得部
14 コンテンツ生成部
15 コンテンツ送信部
16 音声合成部
101 対応情報記憶部
102 コンテンツ記憶部
103 音声合成パラメータ記憶部
図1
図2
図3
図4
図5
図6
図7
図8
図9