特許第6290260号(P6290260)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社東芝の特許一覧 ▶ 東芝デバイス&ストレージ株式会社の特許一覧

特許6290260テレビシステムとサーバ装置及びテレビ装置
<>
  • 特許6290260-テレビシステムとサーバ装置及びテレビ装置 図000002
  • 特許6290260-テレビシステムとサーバ装置及びテレビ装置 図000003
  • 特許6290260-テレビシステムとサーバ装置及びテレビ装置 図000004
  • 特許6290260-テレビシステムとサーバ装置及びテレビ装置 図000005
  • 特許6290260-テレビシステムとサーバ装置及びテレビ装置 図000006
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6290260
(24)【登録日】2018年2月16日
(45)【発行日】2018年3月7日
(54)【発明の名称】テレビシステムとサーバ装置及びテレビ装置
(51)【国際特許分類】
   G10L 21/0316 20130101AFI20180226BHJP
   G10L 25/81 20130101ALI20180226BHJP
   G10L 21/028 20130101ALI20180226BHJP
【FI】
   G10L21/0316 100
   G10L25/81
   G10L21/028 Z
【請求項の数】9
【全頁数】11
(21)【出願番号】特願2015-554405(P2015-554405)
(86)(22)【出願日】2013年12月26日
(86)【国際出願番号】JP2013084927
(87)【国際公開番号】WO2015097818
(87)【国際公開日】20150702
【審査請求日】2015年12月3日
(73)【特許権者】
【識別番号】000003078
【氏名又は名称】株式会社東芝
(73)【特許権者】
【識別番号】317011920
【氏名又は名称】東芝デバイス&ストレージ株式会社
(74)【代理人】
【識別番号】110001737
【氏名又は名称】特許業務法人スズエ国際特許事務所
(72)【発明者】
【氏名】山梨 直希
【審査官】 上田 雄
(56)【参考文献】
【文献】 特開2009−128906(JP,A)
【文献】 特開2013−050604(JP,A)
【文献】 特表2010−512042(JP,A)
【文献】 特開2003−259245(JP,A)
【文献】 特開2012−208737(JP,A)
【文献】 特開2005−071090(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 21/00−21/18
G10L 25/00−25/93
(57)【特許請求の範囲】
【請求項1】
複数のコンテンツを指示に応じて選択的に提供するコンテンツ提供手段と、前記提供するコンテンツの音響信号を指示に応じて非負行列因子分解処理によって音声成分の音源と非音声成分の音源に分離し、それぞれの音源の音量を指示に応じて設定する音源分離手段とを備えるサーバ装置と、
前記サーバ装置とネットワークを通じて接続され、前記サーバ装置のコンテンツ提供手段に対して前記コンテンツの選択を指示すると共に、前記音源分離手段に対して前記音源の分離及び音量の設定の処理実行を選択的に指示する指示手段と、前記指示に応答して前記サーバ装置から提供されるコンテンツを再生する再生手段とを備えるテレビ装置と
を具備し、
前記非負行列因子分解処理は、
前記非音声成分の音源が含まれる蓋然性が高い区間における音響信号のスペクトログラムから、前記非音声成分の音源の特徴を表す第1の基底行列を作成し、
前記第1の基底行列から前記音声成分の音源との関連性が高い成分を除外することで前記非音声成分の音源の特徴を正確に表す第2の基底行列を作成し、
前記第2の基底行列を用いて前記音響信号の前記音声成分の音源の特徴を表す第3の基底行列と第1の係数行列を計算し、
前記第3の基底行列と前記第1の係数行列の積により前記音声成分の音源のスペクトログラムを推定し、
推定された前記音声成分の音源のスペクトログラムを時間信号に変換することで前記音響信号から前記音声成分の音源を分離する処理を実行するテレビシステム。
【請求項2】
前記サーバ装置の音源分離手段は、前記音声成分の音源と非音声成分の音源の音量の比率を指示に応じて段階的に変更する比率変更手段を備え、
前記テレビ装置の指示手段は、前記音声成分の音源前記非音声成分の音源の音量の比率を段階的に指示する比率指示手段を備える請求項1記載のテレビシステム。
【請求項3】
前記サーバ装置は、前記テレビ装置にサーバ搭載機能として前記音源分離手段を備えることを示すサーバ管理情報を提供し、
前記テレビ装置は、前記サーバ管理情報から前記音源分離手段の有無を判別しサーバ機能メニューとして提示する請求項1記載のテレビシステム。
【請求項4】
ネットワークを通じてテレビ装置と接続されるサーバ装置であって、
前記テレビ装置からの指示に応じて前記テレビ装置に複数のコンテンツを選択的に提供するコンテンツ提供手段と、
前記テレビ装置からの指示に応じて前記テレビ装置に提供するコンテンツの音響信号を非負行列因子分解処理によって音声成分の音源と非音声成分の音源に分離し、前記テレビ装置からの指示に応じてそれぞれの音源の音量を設定する音源分離手段と
を備え、
前記非負行列因子分解処理は、
前記非音声成分の音源が含まれる蓋然性が高い区間における音響信号のスペクトログラムから、前記非音声成分の音源の特徴を表す第1の基底行列を作成し、
前記第1の基底行列から前記音声成分の音源との関連性が高い成分を除外することで前記非音声成分の音源の特徴を正確に表す第2の基底行列を作成し、
前記第2の基底行列を用いて前記音響信号の前記音声成分の音源の特徴を表す第3の基底行列と第1の係数行列を計算し、
前記第3の基底行列と前記第1の係数行列の積により前記音声成分の音源のスペクトログラムを推定し、
推定された前記音声成分の音源のスペクトログラムを時間信号に変換することで前記音響信号から前記音声成分の音源を分離する処理を実行するサーバ装置。
【請求項5】
前記音源分離手段は、前記音声成分の音源と非音声成分の音源の音量の比率を段階的に変更する比率変更手段を備え、前記テレビ装置からの比率指示に従って前記音声成分の音源と非音声成分の音源の音量を指示された比率で設定する請求項4記載のサーバ装置。
【請求項6】
前記テレビ装置にサーバ搭載機能として前記音源分離手段を備えることを示すサーバ管理情報を提供し、前記テレビ装置に、前記サーバ管理情報を通じて前記音源分離手段の有無を判別させ、サーバ機能メニューとして提示させる請求項4記載のサーバ装置。
【請求項7】
複数のコンテンツを指示に応じて選択的に提供するコンテンツ提供手段と、前記提供するコンテンツの音響信号を指示に応じて非負行列因子分解処理によって音声成分の音源と非音声成分の音源に分離し、それぞれの音源の音量を指示に応じて設定する音源分離手段とを備えるサーバ装置とネットワークを通じて接続されるテレビ装置であって、
前記サーバ装置のコンテンツ提供手段に対して前記コンテンツの選択を指示すると共に、前記音源分離手段に対して前記音源の分離及び音量の設定の処理実行を選択的に指示する指示手段と、
前記指示に応答して前記サーバ装置から提供されるコンテンツを再生する再生手段と
を備え、
前記非負行列因子分解処理は、
前記非音声成分の音源が含まれる蓋然性が高い区間における音響信号のスペクトログラムから、前記非音声成分の音源の特徴を表す第1の基底行列を作成し、
前記第1の基底行列から前記音声成分の音源との関連性が高い成分を除外することで前記非音声成分の音源の特徴を正確に表す第2の基底行列を作成し、
前記第2の基底行列を用いて前記音響信号の前記音声成分の音源の特徴を表す第3の基底行列と第1の係数行列を計算し、
前記第3の基底行列と前記第1の係数行列の積により前記音声成分の音源のスペクトログラムを推定し、
推定された前記音声成分の音源のスペクトログラムを時間信号に変換することで前記音響信号から前記音声成分の音源を分離する処理を実行するテレビ装置。」
【請求項8】
前記サーバ装置の音源分離手段が、前記音声成分の音源と非音声成分の音源の音量の比率を指示に応じて段階的に変更する比率変更手段を備えるとき、前記指示手段は、前記音声成分の音源と非音声成分の音源の音量の比率を段階的に指示する比率指示手段を備える請求項7記載のテレビ装置。
【請求項9】
前記サーバ装置が、サーバ搭載機能として音源分離手段を備えることを示すサーバ管理情報を提供するとき、前記指示手段は、前記サーバ管理情報から前記音源分離手段の有無を判別しサーバ機能メニューとして提示する請求項7記載のテレビ装置。
【発明の詳細な説明】
【技術分野】
【0001】
この発明の実施の形態は、サーバ装置から提供されるコンテンツをテレビ装置にて再生するテレビシステムに係り、特に音響信号を再生する処理に関する。
【背景技術】
【0002】
近年、音響信号の再生技術にあっては、音声と非音声(背景音)とを分離して別々に音量を設定する音源分離処理が実用化され、テレビ装置において、音声再生のオプションとして、音源分離機能の搭載が検討されている。この音源分離機能は、音響信号の音源となっている音声成分と非音声成分とに、指定の割合で分離し再生することができる。この機能は、コンテンツの内容に応じて背景音を下げて音声を明瞭にしたり、音声を消去してカラオケとして利用したりすることができ、視聴者毎のニーズに合わせた音響再生が可能となる。
【0003】
しかしながら、テレビ装置に音源分離機能を搭載すると、テレビ装置のコストアップにつながる。そこで、テレビ装置の外部で音源分離処理を実行させることが要望されている。
【発明の概要】
【発明が解決しようとする課題】
【0004】
以上述べたように、テレビ装置に音源分離機能を搭載すると、テレビ装置のコストアップにつながる。
【0005】
そこで、テレビ装置の外部で音源分離処理を実行させることのできるテレビシステムとサーバ装置及びテレビ装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
実施の形態によれば、サーバ装置が、複数のコンテンツを指示に応じて選択的に提供するコンテンツ提供手段と、前記提供するコンテンツの音響信号を指示に応じて非負行列因子分解処理によって音声成分の音源と非音声成分の音源に分離し、それぞれの音源の音量を指示に応じて設定する音源分離手段とを備え、前記サーバ装置とネットワークを通じて接続されるテレビ装置が、前記サーバ装置のコンテンツ提供手段に対して前記コンテンツの選択を指示すると共に、前記音源分離手段に対して前記音源の分離及び音量の設定の処理実行を指示する指示手段と、前記指示に応答して前記サーバ装置から提供されるコンテンツを再生する再生手段とを備え、前記非負行列因子分解処理は、前記非音声成分の音源が含まれる蓋然性が高い区間における音響信号のスペクトログラムから、前記非音声成分の音源の特徴を表す第1の基底成分の音源を作成し、前記第1の基底行列から前記音声成分の音源との関連性が高い成分を除外することで前記非音声成分の音源の特徴を正確に表す第2の基底行列を作成し、前記第2の基底行列を用いて前記音響信号の前記音声成分の音源の特徴を表す第3の基底行列と第1の係数行列を計算し、前記第3の基底行列と前記第1の係数行列の積により前記音声成分の音源のスペクトログラムを推定し、推定された前記音声成分の音源のスペクトログラムを時間信号に変換することで前記音響信号から前記音声成分の音源を分離する。

【発明の効果】
【0007】
上記の構成によるテレビシステムは、テレビ装置からの要求に応じてサーバ装置側で音響信号の音源分離処理を実行して、要求元のテレビ装置に提供することができる。これにより、テレビ装置の外部で音源分離処理を実行させることのできるテレビシステムとサーバ装置及びテレビ装置を提供することができる。
【図面の簡単な説明】
【0008】
図1】実施の形態に係るテレビシステムの構成を示すブロック図である。
図2図1に示すシステムに用いられる音源分離処理部の構成を示す機能ブロック図である。
図3図2に示す音源分離処理部の機能を説明するための図である。
図4図1に示すシステムにおいて、音源分離処理を実行する際のテレビ装置とサーバ装置との処理手順を示すシーケンス図である。
図5図1に示すシステムにおいて、テレビ装置側で音源分離処理の処理指示をサーバ装置に通知するためのメニュー画面を示す図である。
【発明を実施するための形態】
【0009】
以下、実施の形態について図面を参照して詳細に説明する。
【0010】
図1は、実施の形態に係わるテレビシステムを概略的に示すブロック図である。図1に示すように、このシステムは、サーバ装置11とテレビ装置12とをネットワーク13を通じて接続した構成である。図では1台のテレビ装置12をネットワーク13に接続しているが、システムとして複数台のテレビ装置を接続した構成であってもよい。また、以下の説明において、音声コンテンツは音声を含むファイルを意味し、コンテンツとして映像を含む場合もあるが、ここでは説明を簡単にするため、映像の処理については省略する。
【0011】
図1において、サーバ装置11はネットワークと接続され、テレビ装置12との間でデータの送受信を行う受信部111及び送信部112を備える。また、記録部113、コンテンツ処理部114及びモニタ出力部115を備える。
【0012】
上記記録部113は、テレビ番組等のコンテンツを蓄積するためのハードディスク等の記録装置を備える。上記コンテンツ処理部114は、上記受信部112を通じてネットワーク上のテレビ装置12から送信される指示データを受け取り、その指示データに基づいて記録部113から該当するコンテンツを読み出してストリームデータにデコード処理を行う。そして、その処理の一機能として音源分離部114Aを備える。
【0013】
この音源分離部114Aは、上記指示データ中の音源制御指示に応じて、デコードされた音響信号の音源を解析し、音声と非音声に分離し、指定の比率で音量を設定し出力する。上記出力部115は、コンテンツ処理部114でデコードされたストリームデータをモニタ出力する。また、コンテンツ処理部114で得られたストリームデータは送信部112を通じて要求元のテレビ装置12に送られる。
【0014】
上記テレビ装置12は、デジタル放送受信用チューナ122を搭載する。このチューナ122は、図中のアンテナ121で受信したBS,CS,地上波等のデジタル放送のうち、ユーザが指示した視聴用のチャンネルCHを選局し復調する。復調されたチャンネルの放送信号は信号処理部123で様々なデジタル信号として取り出され処理される。映像信号は映像処理部124で正しい画面サイズに調整され、表示処理部125でさらに文字情報等グラフィックが重ねられてディスプレイ表示部126にて画面表示される。また、音声信号は音声処理部127で音響処理して増幅され、スピーカ128で音声として出力される。
【0015】
前記122,123,124,125,127といったデバイスは、IIC−BUSといった通信ライン129を介して制御部(マイコン)1210でコントロールされており、データの授受を行っている。またテレビ装置12には他にRAM1211、ROM1212、キーボード1213、リモコン1214から信号を受信する受光部(リモコン受信)1215が接続されており、それぞれ信号やデータの授受を行っている。またこのテレビ装置12は、LAN端子1216、無線LAN送受信部1217、Bluetooth送受信部1218を持っており、外部とネットワーク通信してリモコン1214と同様にテレビをコントロールすることができる。このテレビ装置12は、音声処理部127に音源分離機能を持たないが、サーバ装置11に搭載される音源分離部114Aに音源分離処理を指示するための音源分離指示機能を備える。
【0016】
上記構成において、上記サーバ装置11に搭載される音源分離部114Aについて具体的に説明する。
本実施形態の音源分離部114Aは、非負行列因子分解を用いた技術であり、非音声信号が含まれる蓋然性が高い区間における音響信号のスペクトログラム(スペクトル特徴)から、非音声信号の特徴を表す第1の基底行列を作成する。そして、音声信号が含まれる尤もらしさを表す音声尤度を利用して、第1の基底行列から音声信号との関連性が高い成分を除外して第2の基底行列を作成する。この第2の基底行列を用いて音声信号の特徴を表す第3の基底行列と第1の係数行列を計算し、第3の基底行列と第1の係数行列の積により、音声信号のスペクトログラムを推定する。最後に、推定された音声信号のスペクトログラムを時間信号に変換することで、音響信号から音声信号を分離する。
【0017】
このように、本実施形態の音源分離部114Aは、作成された非音声信号の第1の基底行列から音声信号との関連性が高い成分を除外した第2の基底行列を作成する。これにより、非音声信号の特徴を正確に表す基底行列を作成することができ、結果として、音声信号の分離性能を向上させることができる。
【0018】
図2は上記音源分離部114Aの構成を示すブロック図である。この音源分離部114Aは、音響取得部A1と、尤度計算部A2と、音声・非音声判別部A3と、スペクトル特徴抽出部A4と、第1基底行列作成部A5と、第2基底行列作成部A6と、スペクトル特徴推定部A7と、逆変換部A8とを備える。
【0019】
上記音響取得部A1は、音声信号と非音声信号を含んだ音響信号を取得する。上記尤度計算部A2は、音響信号から音声信号および非音声信号の特徴を表す音響特徴を抽出し、この音響特徴を利用して、音響信号に音声信号が含まれる尤もらしさを表す音声尤度と非音声信号が含まれる尤もらしさを表す非音声尤度を計算する。上記音声・非音声判別部A3は、音声尤度と非音声尤度を利用して、音響信号の所定区間ごとに音声・非音声を判別する。上記スペクトル特徴抽出部A4は、音響信号をフーリエ変換してスペクトログラムを抽出する。上記第1基底行列作成部A5は、非音声信号と判別された区間の音響信号から抽出されたスペクトログラムを利用して、非音声信号の特徴を表す第1の基底行列を作成する。
【0020】
上記第2基底行列作成部A6は、音声尤度を利用して、第1の基底行列から音声信号との関連性が高い列ベクトルの成分を除外して第2の基底行列を作成する。上記スペクトル特徴推定部A7は、スペクトログラムを前記第2の基底行列を用いて非負行列因子分解することにより、音声信号の特徴を表す第3の基底行列および第1の係数行列を計算し、この第3の基底行列および第1の係数行列の積により、音響信号に含まれる音声信号のスペクトログラムを推定する。上記逆変換部A8は、推定された音声信号のスペクトログラムを逆フーリエ変換により時間信号に変換する。
【0021】
上記構成による音源分離部114Aにおいて、音響取得部A1は、記録部113から読み出される音響信号または受信部111によって接続されたテレビ装置12から送信される音響信号を取得する。
【0022】
尤度計算部A2は、音響取得部A1で取得された音響信号から、音声信号および非音声信号の特徴を表す音響特徴を抽出する。そして、この音響特徴を利用して、音響信号に音声信号が含まれる尤もらしさ(音声尤度)および非音声信号が含まれる尤もらしさ(非音声尤度)を計算する。
【0023】
具体的には、尤度計算部A2は、音響信号を長さ25ms(400サンプル)、間隔8ms(128サンプル)のフレームに分割する。フレーム分割にはハミング窓を使用する。次に、各フレームから音響特徴を抽出する。音響特徴としては、各フレームの音響信号をフーリエ変換して得られるスペクトルだけでなく、LPCケプストラムやMFCC等のケプストラム系の特徴量を用いることができる。そして、抽出された音響特徴を予め学習した音声モデルおよび非音声モデルと照合して、各フレームの音声尤度および非音声尤度を計算する。
【0024】
音声・非音声判別部A3は、尤度計算部A2で計算されたフレーム毎の音声尤度および非音声尤度を用いて、所定区間ごとに音声信号が音声であるか非音声であるかを判別する。本実施形態では、所定区間の長さを400ms(50フレーム分)に設定する。音声・非音声判別部A3は、50フレーム分の音声尤度および非音声尤度の平均値を計算し、その大小を比較することで音声・非音声を判別する。この他にも、各平均値を予め設定した閾値と比較して音声・非音声を判別してもよい。
【0025】
スペクトル特徴抽出部A4は、音響信号を長さ25ms(400サンプル)、間隔8ms(128サンプル)のフレームに分割し、各フレームの音響信号をフーリエ変換(周波数解析)してスペクトルを抽出する。なお、本実施形態では、各フレームに対して112点の零詰めを行った後、512点の離散フーリエ変換を実行する。
【0026】
1基底行列作成部A5は、スペクトル特徴抽出部A4で抽出された複数フレームのスペクトル(スペクトログラム)を利用して、非音声信号の特徴を表す第1の基底行列Hを作成する。ここで本実施形態では、音声・非音声判別部A3において非音声と判別された区間の音響信号から抽出されたスペクトログラムを利用して、第1の基底行列Hを作成する。
【0027】
第1基底行列作成部A5は、まず、T個のフレームから抽出した各F次元のスペクトルの全要素を格納した行数F、列数Tの行列Zを作成する。次に、この行列Zを、行数F・列数Dの第1の基底行列Hと、行数D・列数Tの係数行列Uの積で近似する。ここで、Dは基底の数を表し、経験的に32に設定する。第1の基底行列Hと係数行列Uの導出は、第1の基底行列Hと係数行列Uの積と行列Zの二乗誤差を基準とした反復法により行う。この際、第1の基底行列Hおよび係数行列Uの初期行列には、ランダム値を用いることができる。
【0028】
第2基底行列作成部A6は、尤度計算部A2で計算された音声尤度を利用して、第1の基底行列Hから音声信号との関連性が高い列ベクトルの成分を除外した第2の基底行列Bを作成する。これにより、非音声信号の特性を表す第2の基底行列Bを正確に作成することができる。
【0029】
スペクトル特徴推定部A7は、スペクトル特徴抽出部A4で抽出されたスペクトル特徴を第2の基底行列Bを用いて非負行列因子分解することにより、音声信号の特徴を表す第3の基底行列Mおよび第1の係数行列Vを計算する。そして、この第3の基底行列Mと第1の係数行列Vの積を取ることにより、音響信号に含まれる音声信号のスペクトル特徴を推定する。
【0030】
逆変換部A8は、推定された音声信号のスペクトログラムを離散逆フーリエ変換することにより時間信号に変換する。これにより、音響信号から音声信号を分離することができる。
【0031】
上記構成による音源分離部114Aは、図3に示すように、通常モード(音声・非音声の音量を均等にする)、音声モード(非音声を完全に抑圧)、カラオケモード(音声を完全に抑圧)の機能を有する。このように、複数段階の音量調整モードを備えることで、ユーザがテレビ装置12を通じてサーバ装置11に各モードをいずれかを選択するように指示する、あるいはその比率を指示することが可能である。
【0032】
図1に示すシステムにおいて、図4に示すシーケンス図を参照して、音源分離処理を実行する際のテレビ装置とサーバ装置との処理手順を説明する。
【0033】
まず、テレビ装置12において、起動時に、あるいは定期的に、あるいはデバイスリストを開くときに、サーバ装置11に搭載機能の一覧を示すサーバ管理情報を要求する。サーバ装置11は、要求に応答して、音源分離機能を含むサーバ管理情報をテレビ装置12に送り返す。テレビ装置12は、サーバ管理情報を取得すると、その情報に示される機能一覧をメニュー画面に表示する。
【0034】
ここで、ユーザの操作により、テレビ装置12からサーバ装置11にコンテンツリストが要求されると、サーバ装置11は記録部113に記録されるコンテンツのリストを作成してテレビ装置12に送り返す。
【0035】
テレビ装置12は、コンテンツリストを受け取ると、そのリストに基づいてコンテンツ選択画面を表示する。このとき、オプションとして、音源分離機能を利用するためのメニュー画面(図3に示す複数段階の音量調整モードを表示)も提示する。メニュー画面の一例を図5に示す。ユーザがその選択画面から任意のコンテンツと音量調整モードのいずれかを選択操作すると、そのコンテンツの再生要求が音源分離モードの選択指示と共にサーバ装置12に送られる。サーバ装置12は、コンテンツ再生要求と音量調整モードの選択指示を受けると、該当するコンテンツを読み出し、ストリームデータに変換する。このとき、音量調整モードが選択指示されている場合には、読み出されたコンテンツをストリームデータに変換する際に、対応する音源分離処理を実行し、指定モードに対応する比率で音量を設定する。このようにして生成されたストリームデータを要求元のテレビ装置12に送出する。
【0036】
テレビ装置12は、要求したコンテンツのストリームデータを受けると、そのストリームデータを再生出力する。この状態で、ユーザの音量調整モードの変更指示があった場合、その変更指示はサーバ装置11に通知され、サーバ装置11はその変更指示に基づいて音源分離処理における音量調整モードを変更し、モード変更指示に応じた比率の音量でストリームデータを生成しテレビ装置12に送信する。
【0037】
以上の処理により、テレビ装置12が音源分離機能を搭載していなくても、サーバ装置11が音源分離機能を有しているので、テレビ装置12のコストアップを抑圧しつつ、音源分離機能を利用したいユーザのニーズにも対応することができる。
【0038】
このとき、本実施形態では、サーバ装置11は音源分離機能を有することを示す情報をネットワーク経由で提供するようにすることで、クライアント側のテレビ装置12では、サーバ装置11が音源分離機能を搭載しており、その機能を利用できることがユーザに知らせることができる。
【0039】
この場合、クライアント側のテレビ装置12は、サーバ装置11が音源分離機能を有することを判別し、サーバ装置11の録画番組をネットワーク経由で再生する際に、音源分離設定(人声とその他音を別々に音量設定)を行うGUIを表示する。そして、ユーザのGUI表示に対する操作に応じて、設定された音源分離設定をサーバ装置11へ送る。これにより、サーバ装置11は、テレビ装置12から送られてきた音源分離設定に応じて、音源分離機能で音量調整したストリームをクライアントのテレビ装置12へ配信することができる。
【0040】
尚、上記の実施形態では、ストリームでコンテンツを提供する場合について説明したが、ダウンロードで行う場合でも同様に実施可能である。また、クライアント側のテレビ装置が音源分離機能を有する場合には、搭載している音源分離機能で音量調整したストリームをサーバ装置11へアップロードしておけば、他の音源分離機能を有していないテレビ装置で音源分離されたストリームを視聴することが可能となる。すなわち、この場合は、音源分離機能を備えるテレビ装置がサーバ装置として機能することになる。
【0041】
また、上記音源分離機能を有するテレビ装置において、音源分離機能で音源分離されたストリームをサーバ装置11にアップロードする際に、サーバ装置11が音源分離機能を有している場合には、テレビ装置12側で音源分離機能による音量調整を行わないでアップロードするようにしてもよい。
【0042】
その他、上記実施形態では、初期段階で、テレビ装置12からの要求に応じてサーバ装置11からサーバ管理情報を提示するようにしたが、テレビ装置12が最初からサーバ装置11を利用する機能としてプリセットされているようにしても、同様に実施可能である。
【0043】
なお、この発明は上記した実施の形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を種々変形して具体化することができる。また、上記した実施の形態に開示されている複数の構成要素を適宜に組み合わせることにより、種々の発明を形成することができる。例えば、実施の形態に示される全構成要素から幾つかの構成要素を削除しても良いものである。さらに、異なる実施の形態に係る構成要素を適宜組み合わせても良いものである。
図1
図2
図3
図4
図5