特許5997108 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電信電話株式会社の特許一覧 ▶ 学校法人慶應義塾の特許一覧

特許5997108コンテンツ配信装置、コンテンツ配信方法及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】5997108

(24)【登録日】2016年9月2日

(45)【発行日】2016年9月28日

(54)【発明の名称】コンテンツ配信装置、コンテンツ配信方法及びプログラム

(51)【国際特許分類】

G06F 13/00 20060101AFI20160915BHJP

【ＦＩ】

G06F13/00 540A

G06F13/00 560A

【請求項の数】6

【全頁数】14

(21)【出願番号】特願2013-145274(P2013-145274)

(22)【出願日】2013年7月11日

(65)【公開番号】特開2015-18418(P2015-18418A)

(43)【公開日】2015年1月29日

【審査請求日】2015年7月27日

(73)【特許権者】

【識別番号】000004226

【氏名又は名称】日本電信電話株式会社

(73)【特許権者】

【識別番号】899000079

【氏名又は名称】学校法人慶應義塾

(74)【代理人】

【識別番号】100121706

【弁理士】

【氏名又は名称】中尾直樹

(74)【代理人】

【識別番号】100128705

【弁理士】

【氏名又は名称】中村幸雄

(74)【代理人】

【識別番号】100147773

【弁理士】

【氏名又は名称】義村宗洋

(72)【発明者】

【氏名】井島勇祐

(72)【発明者】

【氏名】吉岡理

(72)【発明者】

【氏名】小川克彦

【審査官】佐々木洋

(56)【参考文献】

【文献】特開２００８−１９１９７９（ＪＰ，Ａ）

【文献】特開２０１２−１８５３０３（ＪＰ，Ａ）

【文献】特開２００５−２７５９８５（ＪＰ，Ａ）

【文献】岡本浩実他，歩きながら街のつぶやきを聴くシステム”ＷａｌｋＯＮ”の提案，ヒューマンインタフェースシンポジウム２０１２論文集，２０１２年９月４日，pp. 259-262

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｆ１３／００

(57)【特許請求の範囲】

【請求項1】

ソーシャルネットワーキングサービスからコンテンツを含む投稿情報を取得する投稿情報取得部と、
上記ソーシャルネットワーキングサービス上で上記投稿情報を購読する購読者の属性を集計して投稿属性を推定する投稿属性推定部と、
上記コンテンツと上記投稿属性を関連付ける対応情報を生成する対応情報作成部と、
利用者の操作する個人端末に設定された上記利用者の属性であるコンテンツ生成情報を取得する生成情報取得部と、
上記対応情報を用いて、上記投稿属性と上記コンテンツ生成情報とが合致する上記コンテンツを生成するコンテンツ生成部と、
上記コンテンツを上記個人端末へ送信するコンテンツ送信部と、
を含むコンテンツ配信装置。

【請求項2】

請求項１に記載のコンテンツ配信装置であって、
上記コンテンツがテキストであれば、上記コンテンツを音声合成して合成音声を生成する音声合成部
をさらに含むコンテンツ配信装置。

【請求項3】

請求項２に記載のコンテンツ配信装置であって、
上記投稿属性の各属性値に対応する音声合成パラメータを記憶する音声合成パラメータ記憶部
をさらに含み、
上記音声合成部は、上記コンテンツに関連付けられた上記投稿属性に基づいて決定した上記音声合成パラメータを用いて上記コンテンツを音声合成するものである
コンテンツ配信装置。

【請求項4】

請求項１から３のいずれかに記載のコンテンツ配信装置であって、
上記投稿属性推定部は、上記投稿情報を投稿した位置に関連した属性を上記投稿属性にさらに含めるものであり、
上記生成情報取得部は、上記個人端末を操作する位置に関連した属性を上記コンテンツ生成情報にさらに含めるものである
コンテンツ配信装置。

【請求項5】

投稿情報取得部が、ソーシャルネットワーキングサービスからコンテンツを含む投稿情報を取得する投稿情報取得ステップと、
投稿属性推定部が、上記ソーシャルネットワーキングサービス上で上記投稿情報を購読する購読者の属性を集計して投稿属性を推定する投稿属性推定ステップと、
対応情報作成部が、上記コンテンツと上記投稿属性を関連付ける対応情報を生成する対応情報作成ステップと、
生成情報取得部が、利用者の操作する個人端末に設定された上記利用者の属性であるコンテンツ生成情報を取得する生成情報取得ステップと、
コンテンツ生成部が、上記対応情報を用いて、上記投稿属性と上記コンテンツ生成情報とが合致する上記コンテンツを生成するコンテンツ生成ステップと、
コンテンツ送信部が、上記コンテンツを上記個人端末へ送信するコンテンツ送信ステップと、
を含むコンテンツ配信方法。

【請求項6】

請求項１から４のいずれかに記載のコンテンツ配信装置としてコンピュータを機能させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

この発明は、個人端末へコンテンツを配信する技術に関する。

【背景技術】

【0002】

近年、屋内もしくは屋外に設置した平面ディスプレイなどの媒体へテキスト、音声・音、写真、動画などのコンテンツを表示するデジタルサイネージ（Digital Signage、電子看板）技術が普及している。デジタルサイネージでは媒体に表示するコンテンツを動的に変更することが可能となっていることが特徴である。このようなデジタルサイネージの利点を活用して、媒体を見ている個人ごとに適切なコンテンツを動的に選択又は生成して表示することが広告効果を高めるために望ましいと考えられている。

【0003】

ところで、近年、ソーシャルネットワーキングサービス（Social Networking Service、SNS）の普及が進んでいる。ソーシャルネットワーキングサービスでは、利用者がテキストや写真、動画、音声などを投稿することができ、利用者は他の利用者の投稿を購読することができる。特に、携帯電話やスマートフォン、タブレット端末などの全地球測位システム（Global Positioning System、GPS）機能を搭載したモバイル機器を用いると、投稿にその投稿日時や投稿したときの位置情報を付加することができ、その投稿がいつどこで投稿されたものであるかが判別できるようになっている。このようなソーシャルネットワーキングサービスの例として、米国Twitter社が運営する「Twitter（登録商標）」、米国Facebook社が運営する「Facebook（登録商標）」、米国Foursquare社が運営する「Foursquare（登録商標）」などが挙げられる。

【0004】

また、近年、テキストから合成音声を生成する音声合成技術では、様々な話者（特定個人の音声等）や口調（感情等）の合成音声を作成することが可能となっている。このような音声合成技術には非特許文献１に記載の技術がある。非特許文献１に記載されている音声合成技術を活用することで多様な合成音声を生成することができる。

【先行技術文献】

【非特許文献】

【0005】

【非特許文献1】橘他、「平均声モデルを用いる合成音声の話者性とスタイルの同時多様化の検討」、電子情報通信学会技術研究報告、Vol. 107、No. 356、SP2007-87、pp. 7-12、2007年11月

【発明の概要】

【発明が解決しようとする課題】

【0006】

従来のデジタルサイネージ技術は、施設内や屋外などで大人数が閲覧することを前提としている。そのため、個人に対して適切なコンテンツを表示することは難しい。一方、近年では無線通信技術の発展により、個人個人がコンテンツを表示することが可能な個人端末（携帯電話、スマートフォン、タブレット端末、ラップトップコンピュータなど）を保持していることが多くなっている。このような個人端末において、利用者の属性や時間、場所などに適したコンテンツを表示・再生させることができると望ましい。

【0007】

しかし、コンテンツ提供者があらかじめ指定したコンテンツを個人端末において表示・再生させるだけでは、個人毎に適切なコンテンツを提供できているとは限らない。そこで、既存のソーシャルネットワーキングサービスなどへの投稿をコンテンツとして扱うことで、個人毎に適切なコンテンツを提供できるようになると考えられる。そのためには、ソーシャルネットワーキングサービスに投稿されたコンテンツがどのような利用者にとって適切なのかを決定することが必要となる。

【0008】

この発明の目的は、ソーシャルネットワーキングサービスへ投稿されたコンテンツから利用者にとって適切なコンテンツを抽出し、個人端末へ配信することである。

【課題を解決するための手段】

【0009】

上記の課題を解決するために、この発明のコンテンツ配信装置は、投稿情報取得部、投稿属性推定部、対応情報作成部、生成情報取得部、コンテンツ生成部及びコンテンツ送信部を含む。投稿情報取得部は、ソーシャルネットワーキングサービスからコンテンツを含む投稿情報を取得する。投稿属性推定部は、投稿情報に基づいて投稿属性を推定する。対応情報作成部は、コンテンツと投稿属性を関連付ける対応情報を生成する。生成情報取得部は、利用者の操作する個人端末からコンテンツ生成情報を取得する。コンテンツ生成部は、対応情報を用いて、投稿属性とコンテンツ生成情報とが合致するコンテンツを生成する。コンテンツ送信部は、コンテンツを個人端末へ送信する。

【発明の効果】

【0010】

この発明のコンテンツ配信技術によれば、個人端末において現在地や利用者の属性に応じて適切なコンテンツを動的に表示・再生することができる。

【図面の簡単な説明】

【0011】

【図1】図１は、第一実施形態のコンテンツ配信装置の機能構成を例示する図である。

【図2】図２は、コンテンツ収集方法の処理フローを例示する図である。

【図3】図３（Ａ）は、購読者の属性情報の設定内容を例示する図である。図３（Ｂ）は、投稿属性の集計結果を例示する図である。

【図4】図４は、対応情報の設定内容を例示する図である。

【図5】図５は、第一実施形態のコンテンツ配信方法の処理フローを例示する図である。

【図6】図６は、コンテンツ生成情報の設定内容を例示する図である。

【図7】図７は、第二実施形態のコンテンツ配信装置の機能構成を例示する図である。

【図8】図８は、第二実施形態のコンテンツ配信方法の処理フローを例示する図である。

【図9】図９（Ａ）は、音声合成パラメータの一例を示す図である。図９（Ｂ）は、音声合成パラメータの他の例を示す図である。

【発明を実施するための形態】

【0012】

以下、この発明の実施の形態について詳細に説明する。なお、図面中において同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。

【0013】

［第一実施形態］
図１を参照して、第一実施形態に係るコンテンツ配信装置の機能構成の一例を説明する。第一実施形態に係るコンテンツ配信装置１は、少なくとも１台の個人端末２及び少なくとも１つのソーシャルネットワーキングサービス３と連携して動作する。また、コンテンツ配信装置１は、必要に応じて情報提供サービス４と連携して動作してもよい。

【0014】

コンテンツ配信装置１は、投稿情報取得部１０、投稿属性推定部１１、対応情報作成部１２、生成情報取得部１３、コンテンツ生成部１４、コンテンツ送信部１５、対応情報記憶部１０１及びコンテンツ記憶部１０２を含む。コンテンツ配信装置１は、例えば、中央演算処理装置（Central Processing Unit、CPU）、主記憶装置（Random Access Memory、RAM）などを有する公知又は専用のコンピュータに特別なプログラムが読み込まれて構成された特別な装置である。コンテンツ配信装置１は、例えば、中央演算処理装置の制御のもとで各処理を実行する。コンテンツ配信装置１に入力されたデータや各処理で得られたデータは、例えば、主記憶装置に格納され、主記憶装置に格納されたデータは必要に応じて読み出されて他の処理に利用される。コンテンツ配信装置１が備える各記憶部は、例えば、ＲＡＭ（Random Access Memory）などの主記憶装置、ハードディスクや光ディスクもしくはフラッシュメモリ（Flash Memory）のような半導体メモリ素子により構成される補助記憶装置、またはリレーショナルデータベースやキーバリューストアなどのミドルウェアにより構成することができる。コンテンツ配信装置１が備える各記憶部は、それぞれ論理的に分割されていればよく、一つの物理的な記憶装置に記憶されていてもよい。

【0015】

個人端末２は、携帯電話、スマートフォン、タブレット端末、ラップトップコンピュータなどの無線通信機能を備え、利用者が持ち運んで利用することを想定して設計された端末である。個人端末２は、例えば、中央演算処理装置（Central Processing Unit、CPU）、主記憶装置（Random Access Memory、RAM）などを有する公知又は専用のコンピュータに特別なプログラムが読み込まれて構成された特別な装置である。個人端末２は、例えば、無線LAN（Local Area Network）やW-CDMA（Wideband Code Division Multiplexing Access、広帯域符号分割多重接続）、LTE（Long Term Evolution）などに代表される携帯電話回線を用いて、データを送受信するための無線通信インターフェースを備える。個人端末２は、人工衛星からの電波を受信することで地球上での位置情報を取得する全地球測位システム（Global Positioning System、GPS）機能を搭載していることが望ましい。

【0016】

ソーシャルネットワーキングサービス３は、ネットワークを介して利用者同士の繋がりを促進しサポートするコミュニティ型のウェブサービスである。ソーシャルネットワーキングサービス３は、インターネット上でサービスが提供される場合が一般的であるが、独自に構築した閉ざされたネットワーク上でサービスが提供されてもよい。ソーシャルネットワーキングサービス３において、利用者は性別や年齢、職業などの個人的な属性を含むプロフィールを設定することができる。利用者は、例えば、個人端末２などのインターネットにアクセスすることが可能な機器を用いて、テキストや写真、動画、音声などをソーシャルネットワーキングサービス３へ投稿することができる。ソーシャルネットワーキングサービス３において、利用者は、任意にもしくは相手の承諾を得て、他の利用者の投稿を購読することができるようになっていることが一般的である。このようなソーシャルネットワーキングサービスの例としては、上述の「Twitter（登録商標）」、「Facebook（登録商標）」、「Foursquare（登録商標）」などが挙げられる。

【0017】

情報提供サービス４は、ネットワークを介して特定の情報を提供するウェブサービスである。情報提供サービス４は、インターネット上でサービスが提供される場合が一般的であるが、独自に構築した閉ざされたネットワーク上でサービスが提供されてもよい。情報提供サービス４は、例えば、位置情報が指定されるとその場所の天気や気温、湿度などの天候情報を返却する気象情報サービス、もしくは要求に応じてNTP（Network Time Protocol）などの手順により標準時刻を提供するインターネット時刻サービスである。

【0018】

図２を参照して、コンテンツ収集方法の処理フローの一例を、実際に行われる手続きの順に従って説明する。

【0019】

ステップＳ１０において、投稿情報取得部１０は、ソーシャルネットワーキングサービス３からコンテンツを含む投稿情報を取得する。投稿情報取得部１０は、ソーシャルネットワーキングサービス３が提供するAPI（Application Programming Interface）を利用して、利用者の投稿情報を取得する。以下、投稿情報を投稿した利用者を投稿者と呼ぶ。投稿情報の取得は、投稿情報の有無を常時監視することによりリアルタイムに実行してもよいし、あらかじめ定めた時間間隔で定期的に実行してもよい。投稿情報を取得する対象の利用者は事前に登録した利用者であってもよいし、ソーシャルネットワーキングサービス３において投稿情報を公開している利用者からランダムに選択してもよい。取得した投稿情報は、投稿属性推定部１１へ入力される。

【0020】

ステップＳ１１ａにおいて、投稿属性推定部１１は、入力された投稿情報に基づいて購読者の属性情報を取得する。購読者とは、投稿者の投稿を購読している他の利用者である。購読者の属性情報とは、ソーシャルネットワーキングサービス３において購読者それぞれが設定している属性情報であり、例えば、性別や年代、職業、居住地などの情報である。購読者の属性情報は、その購読者の過去の投稿情報から推定することも可能である（例えば、下記参考文献１参照）。
〔参考文献１〕平野他、「Markov Logicを用いたテキストからのユーザ属性推定」、2013年度人工知能学会全国大会、3E3-3、2013年6月

【0021】

図３（Ａ）に購読者の属性情報の一例を示す。「性別」「年代」「職業」は、ソーシャルネットワーキングサービス３において購読者自身が設定した属性情報である。この例では、「読者１」は、性別が男性、年代が20代、職業が社会人に設定されている。同様に、「読者２」は、性別が女性、年代が30代、職業が自営業であり、「読者１５」は、性別が男性、年代が10代、職業が学生である。

【0022】

ステップＳ１１ｂにおいて、投稿属性推定部１１は、購読者の属性情報を集計して投稿属性を推定する。集計は各属性について同一の設定値の数を計数することで行う。購読者の属性情報を集計した結果から、各属性について最も人数が多い設定値を使用して投稿属性を生成する。

【0023】

図３（Ｂ）に集計結果の一例を示す。この例では、性別が男性である購読者は10名であり、性別が女性である購読者は5名である。同様に、年代が20代である購読者は8名、30代である購読者は4名、30代である購読者は3名である。また、職業が学生である購読者は11名、社会人である購読者は3名、自営業である購読者は1名である。

【0024】

ステップＳ１２ａにおいて、対応情報作成部１２は、取得した投稿情報を一意に識別するコンテンツ識別子（以下、コンテンツIDとも言う）を生成し、投稿情報に含まれるコンテンツに付与する。コンテンツ識別子はコンテンツ記憶部１０２において記憶されているコンテンツを一意に識別するための情報である。コンテンツ識別子は、都度使用中の識別子に重複しないように連番でもしくはランダムに決定してもよいし、あらかじめ用意した複数の識別子を記憶しておき特定の規則に従って選択することにより決定してもよい。

【0025】

ステップＳ１２ｂにおいて、対応情報作成部１２は、コンテンツ識別子と投稿属性を組としてコンテンツと投稿属性を関連付けるための対応情報を生成する。

【0026】

図４に対応情報の一例を示す。「コンテンツID」はコンテンツを一意に識別するコンテンツ識別子である。「日付」「時刻」はコンテンツを含む投稿情報が投稿された日付及び時刻である。「現在地」はコンテンツを含む投稿情報が投稿された位置情報である。「性別」「年代」「職業」はコンテンツを含む投稿情報の購読者の属性情報を集計して決定した属性情報である。この例では、「コンテンツID」が「音声１」である対応情報は、○月○日◆曜日△時から○時の晴れの時に▲駅において20代で男性の学生によって投稿されたものであることを表している。

【0027】

ステップＳ１２ｃにおいて、対応情報作成部１２は、生成した対応情報を対応情報記憶部１０１へ記憶し、コンテンツ識別子が付与されたコンテンツをコンテンツ記憶部１０２に記憶する。

【0028】

図５を参照して、コンテンツ配信方法の処理フローの一例を、実際に行われる手続きの順に従って説明する。

【0029】

ステップＳ１３において、生成情報取得部１３は、利用者の操作する個人端末２からコンテンツ生成情報を取得する。コンテンツ生成情報とは、個人端末２へ配信するコンテンツを生成するために利用される情報である。コンテンツ生成情報は、例えば、情報取得時の時間情報（日時、曜日など）、個人端末２の現在地や現在地の天気、利用者の性別や年代、職業、居住地などの属性情報を含む。

【0030】

コンテンツ生成情報のうち、個人端末２から直接取得することが可能な情報は個人端末２から取得する。個人端末２から取得可能な情報には、例えば、個人端末２の現在地や利用者の属性情報などが含まれる。個人端末２の現在地は個人端末２に搭載されたGPS機能から取得する位置情報である。一般的にGPS機能により取得可能な情報は緯度経度情報であるが、外部の地理情報サービスなどと連携して現在地周辺の代表的な施設や行政上の地理表示に変換してもよい。利用者の属性情報（性別、年代、職業など）は利用者が個人端末２の利用に際して事前に登録する情報である。一方、個人端末２から直接取得することが難しい情報は、外部のインターネットサービスや外部サーバである情報提供サービス４から取得すればよい。個人端末２から取得不可な情報には、例えば、気象情報や時間情報などが含まれる。気象情報は民間又は公的機関が運営する気象情報サービスから取得することができる。時間情報はインターネット上に存在するNTP（Network Time Protocol）サーバから標準時刻を取得することができる。

【0031】

図６にコンテンツ生成情報の一例を示す。「日付」「時刻」「曜日」は、外部のNTPサーバ又は個人端末２のシステム時刻から取得した現在時刻である。「現在地」は個人端末２に搭載されたGPS機能により特定した個人端末２の現在地を示す情報である。「天気」は現在時刻及び現在地を指定して外部の気象情報サービスから取得した天気を示す情報（晴れ、曇、雨、雪など）である。「性別」「年代」「職業」は、個人端末２に利用者自身が設定した属性情報である。この例では、現在時刻は○月○日◆曜日△時△分であり、天気は晴れであり、個人端末２の利用者は20代で男性の学生である。

【0032】

ステップＳ１４ａにおいて、コンテンツ生成部１４は、対応情報記憶部１０１へ記憶されている対応情報を参照して、投稿属性とコンテンツ生成情報とが合致するコンテンツ識別子を抽出する。具体的には、以下のようにコンテンツ識別子を抽出する。まず、コンテンツ生成部１４は、対応情報の「時間」及びコンテンツ生成情報の「時間」並びに対応情報の「現在地」及びコンテンツ生成情報の「現在地」が一致する対応情報を選択する。複数の対応情報が一致した場合には、「曜日」「天気」「性別」「年代」「職業」などのいずれかが一致するものをさらに選択し、一つの対応情報を決定する。いずれの属性が一致するものを選択するかは、あらかじめ属性ごとに優先度を設定しておき、その優先度に従って決定してもよいし、選択される対応情報が一つに絞られるように属性を任意に組み合わせて決定するようにしてもよい。図６に示したコンテンツ生成情報により図４に示した対応情報からコンテンツ識別子を抽出するのであれば、まず、「時間」と「現在地」が一致する「音声１」及び「テキスト２」が選択され、さらに「性別」「年代」「職業」が一致する「音声１」が抽出されることになる。コンテンツ生成情報に一致する対応情報が存在しない場合、もしくは対応情報の取得に失敗した場合には、コンテンツ生成部１４は、コンテンツ識別子を出力せず、処理を終了する。

【0033】

ステップＳ１４ｂにおいて、コンテンツ生成部１４は、抽出したコンテンツ識別子が付与されたコンテンツをコンテンツ記憶部１０２から読み込む。

【0034】

ステップＳ１５において、コンテンツ送信部１５は、読み込んだコンテンツを個人端末２へ送信する。個人端末２は受信したコンテンツをその種類に応じて再生する。例えば、コンテンツがテキストであれば、個人端末２が備えるディスプレイにそのテキストを表示する。また、例えば、コンテンツが音声であれば、個人端末２が備えるスピーカを用いてその音声を再生する。また、例えば、コンテンツが動画であれば、個人端末２が備えるディスプレイ及びスピーカを用いてその動画を再生する。

【0035】

ソーシャルネットワーキングサービスにおいては一般的に興味の分野が近い利用者同士が互いの投稿を購読する場合が多い。上述のように、ソーシャルネットワーキングサービスに投稿されたコンテンツを購読者の属性情報と対応付けて、利用者の属性情報と購読者の属性情報とが合致するコンテンツを利用者へ配信することで、利用者に対してより適切なコンテンツを配信することが可能となる。

【0036】

［第二実施形態］
第一実施形態では、あらかじめ作成されているコンテンツ群の中からコンテンツ生成情報に応じて適切なコンテンツを動的に選択した。第二実施形態では、選択したコンテンツがテキストであれば、さらに音声合成技術を利用して、動的に音声コンテンツを生成して個人端末に配信する。これにより、コンテンツの多様性をより広げることができる。

【0037】

図７を参照して、第二実施形態に係るコンテンツ配信装置の機能構成の一例を説明する。第二実施形態に係るコンテンツ配信装置５は、第一実施形態に係るコンテンツ配信装置１と同様に、投稿情報取得部１０、投稿属性推定部１１、対応情報作成部１２、生成情報取得部１３、コンテンツ生成部１４、コンテンツ送信部１５、対応情報記憶部１０１及びコンテンツ記憶部１０２を含み、さらに音声合成部１６及び音声合成パラメータ記憶部１０３を含む。コンテンツ配信装置５は、例えば、中央演算処理装置（Central Processing Unit、CPU）、主記憶装置（Random Access Memory、RAM）などを有する公知又は専用のコンピュータに特別なプログラムが読み込まれて構成された特別な装置である。コンテンツ配信装置５は、例えば、中央演算処理装置の制御のもとで各処理を実行する。コンテンツ配信装置５に入力されたデータや各処理で得られたデータは、例えば、主記憶装置に格納され、主記憶装置に格納されたデータは必要に応じて読み出されて他の処理に利用される。コンテンツ配信装置５が備える各記憶部は、例えば、ＲＡＭ（Random Access Memory）などの主記憶装置、ハードディスクや光ディスクもしくはフラッシュメモリ（Flash Memory）のような半導体メモリ素子により構成される補助記憶装置、またはリレーショナルデータベースやキーバリューストアなどのミドルウェアにより構成することができる。コンテンツ配信装置５が備える各記憶部は、それぞれ論理的に分割されていればよく、一つの物理的な記憶装置に記憶されていてもよい。

【0038】

第二実施形態に係る個人端末２、ソーシャルネットワーキングサービス３及び情報提供サービス４の構成は第一実施形態と同様である。

【0039】

図８を参照して、第二実施形態のコンテンツ配信方法におけるコンテンツ配信処理の処理フローの一例を、実際に行われる手続きの順に従って説明する。ステップＳ１３からステップＳ１４ｂまでの処理は第一実施形態と同様である。

【0040】

音声パラメータ記憶部１０３には、音声合成部１６が音声合成処理の際に利用する音声合成パラメータが記憶される。音声合成パラメータについての詳細は音声合成部１６の処理の中で併せて説明する。

【0041】

ステップＳ１６ａにおいて、音声合成部１６は、読み込んだコンテンツの種類を確認する。コンテンツの種類がテキストであれば、ステップＳ１６ｂへ処理を進める。コンテンツの種類がテキスト以外であれば、ステップＳ１５へ処理を進める。

【0042】

ステップＳ１６ｂにおいて、音声合成部１６は、読み込んだコンテンツの内容である文字列を音声合成して合成音声を生成する。合成音声を生成する際には、音声パラメータ記憶部１０３にあらかじめ記憶した音声パラメータからコンテンツ生成情報に合致する音声パラメータを決定し、多様な合成音声を動的に生成する。音声合成方法は既存の様々な音声合成技術を適用することができる。以下では、合成音声の発話者及び口調、合成音声の抑揚情報であるピッチレンジをそれぞれ決定する音声合成方法を例示する。

【0043】

近年の音声合成技術では、様々な話者（特定個人の音声など）や口調（感情など）の合成音声を作成することが可能となっている。このような音声合成技術には、例えば、非特許文献１に記載された音声合成方法がある。非特許文献１に記載された音声合成方法を利用することにより、音声合成部１６は、コンテンツ生成情報に合致した発話者及び口調により合成音声を生成することができる。

【0044】

図９（Ａ）にコンテンツ生成情報に応じて発話者及び口調を決定する場合の音声パラメータの一例を示す。「話者」は発話者を特定する名称である。「口調」は口調を特定する名称である。「性別」「年代」「職業」は話者及び口調に関連付けられた属性情報である。

【0045】

音声合成部１６は、音声パラメータ記憶部１０３に記憶した音声パラメータから属性情報がコンテンツ生成情報に含まれる属性情報と一致する音声パラメータを特定する。そして、音声合成部１６は、特定した音声パラメータを用いてコンテンツを音声合成して合成音声を生成する。

【0046】

また例えば、合成音声のピッチレンジをコンテンツ生成情報に応じて決定する方法がある。ピッチレンジとは、F0の最大値と最小値の幅であり、抑揚を表現するパラメータの一つである。ピッチレンジが大きい場合は抑揚が大きくなり、ピッチレンジが小さい場合は抑揚が小さくなる。抑揚が小さくなるといわゆる棒読みに近くなる。

【0047】

図９（Ｂ）にコンテンツ生成情報に応じてピッチレンジを決定する場合の音声パラメータの一例を示す。「ピッチレンジ重みw」は天気に応じて音声合成時に指定するピッチレンジに対する重みである。「天気」はそのピッチレンジに関連付けられた天気である。この例では、コンテンツ生成情報の「天気」が「晴れ」であれば、ピッチレンジ重みを「1.5」とする。同様に、コンテンツ生成情報の「天気」が「雨」であれば、ピッチレンジ重みを「0.5」とする。これにより天気によってピッチレンジが変動し、例えば、晴れの場合には抑揚を大きくし、雨の場合には抑揚を小さくし、適切なピッチレンジでテキストのコンテンツを音声合成することができる。

【0048】

図９（Ｂ）の例では、ピッチレンジprは以下の式により算出する。
pr=w×pr_d

【0049】

ここで、wはピッチレンジの重みである。重みwは、天気により決定される正の実数値である。pr_dは、あらかじめ音声合成部１６に設定されているピッチレンジの規定値である。これより、例えば天気が晴れであれば、ピッチレンジが大きく抑揚の変化に富んだ合成音声が作成され、雨であればピッチレンジが小さく抑揚の変化がほとんどない合成音声が作成される。

【0050】

音声パラメータ記憶部１０３に記憶する音声パラメータに時間や日付の項目を追加することで、時間帯や日付によって発話者及び口調もしくはピッチレンジを変化させることも可能である。

【0051】

ステップＳ１５において、コンテンツ送信部１５は、コンテンツを音声合成により変換した合成音声を個人端末２へ送信する。個人端末２は第一実施形態と同様に、受信したコンテンツをその種類に応じて再生する。受信したコンテンツが音声であれば、個人端末２が備えるスピーカを用いてその音声を再生するため、コンテンツがテキストである場合は、合成音声がスピーカから再生されることになる。

【0052】

［プログラム、記録媒体］
この発明は上述の実施形態に限定されるものではなく、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。上記実施例において説明した各種の処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。

【0053】

また、上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。

【0054】

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリなどどのようなものでもよい。

【0055】

また、このプログラムの流通は、例えば、そのプログラムを記録したＤＶＤ、ＣＤ−ＲＯＭなどの可搬型記録媒体を販売、譲渡、貸与などすることによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。

【0056】

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるＡＳＰ（Application Service Provider）型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの（コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータなど）を含むものとする。

【0057】

また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

【符号の説明】

【0058】

１、５コンテンツ配信装置
２個人端末
３ソーシャルネットワーキングサービス
４情報提供サービス
１０投稿情報取得部
１１投稿属性推定部
１２対応情報作成部
１３生成情報取得部
１４コンテンツ生成部
１５コンテンツ送信部
１６音声合成部
１０１対応情報記憶部
１０２コンテンツ記憶部
１０３音声合成パラメータ記憶部

【図1】