(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024096765
(43)【公開日】2024-07-17
(54)【発明の名称】音声出力端末及び音声出力方法
(51)【国際特許分類】
H04N 21/439 20110101AFI20240709BHJP
H04N 21/442 20110101ALI20240709BHJP
H04N 21/436 20110101ALI20240709BHJP
【FI】
H04N21/439
H04N21/442
H04N21/436
【審査請求】有
【請求項の数】20
【出願形態】OL
(21)【出願番号】P 2024060287
(22)【出願日】2024-04-03
(62)【分割の表示】P 2022000181の分割
【原出願日】2017-08-08
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.HDMI
2.QRコード
(71)【出願人】
【識別番号】000005810
【氏名又は名称】マクセル株式会社
(74)【代理人】
【識別番号】110002066
【氏名又は名称】弁理士法人筒井国際特許事務所
(72)【発明者】
【氏名】喜多村 章悟
(72)【発明者】
【氏名】谷田部 祐介
(72)【発明者】
【氏名】松原 孝志
(57)【要約】
【課題】複数の音声出力部に対して適切に音声コンテンツを出力制御する。
【解決手段】音声連携システムは、端末とコンテンツ表示装置と、を備える。端末は、第1の音声コンテンツと、第2の音声コンテンツとを取得する音声取得部と、第1の音声コンテンツ及び第2の音声コンテンツの出力先を示す情報を設定する設定部と、設定部により設定された情報に基づいて、第1の音声コンテンツを第1の音声出力部及び第2の音声出力部の一方に出力し、第2の音声コンテンツを他方に出力する音声出力制御部と、コンテンツ表示装置から音声データを第1の音声コンテンツとして受信する受信部、を備える。コンテンツ表示装置は、受信したコンテンツから映像データ及び音声データを取得する取得部と、取得部により取得された映像データを表示する表示部と、取得部により取得された音声データを出力する第3の音声出力部と、音声データを端末へ送信する送信部とを備える。
【選択図】
図2
【特許請求の範囲】
【請求項1】
音声出力端末であって、
音声コンテンツを取得する無線通信部と、
前記音声コンテンツを出力する音声出力部と、
前記音声出力部から前記音声コンテンツを出力する第1パターンと前記音声コンテンツを出力しない第2パターンとを少なくとも含む前記音声コンテンツの出力パターンに関する第1情報と、前記音声出力部の音量制御機能のオンオフに関する第2情報と、を含む設定情報に基づいて、前記音声出力部を制御する制御部と、
前記音声出力端末の周辺音を取得する音声入力部と、
を備え、
前記制御部は、前記音声入力部を介して取得した周辺音を解析して前記周辺音の種別を特定し、特定された前記周辺音の種別と前記設定情報とに基づいて前記音声出力部の音量を制御することを特徴とする音声出力端末。
【請求項2】
請求項1記載の音声出力端末であって、
前記制御部は、前記周辺音の種別として、少なくとも会話、生活音の2つを特定することが可能であることを特徴とする音声出力端末。
【請求項3】
請求項1記載の音声出力端末であって、
前記特定された前記周辺音の種別が生活音であり前記音量制御機能がオンである場合、前記制御部は、前記設定情報に基づいて、前記第1パターンの一つとして前記音声出力部の音量を上げるように制御することを特徴とする音声出力端末。
【請求項4】
請求項1記載の音声出力端末であって、
前記特定された前記周辺音の種別が会話であり前記音量制御機能がオンである場合、前記制御部は、前記設定情報に基づいて、前記音声コンテンツを出力するように前記音声出力部を制御することを特徴とする音声出力端末。
【請求項5】
音声出力端末であって、
音声コンテンツを取得する無線通信部と、
前記音声コンテンツを出力する音声出力部と、
前記音声出力部から前記音声コンテンツを出力する第1パターンと前記音声コンテンツを出力しない第2パターンとを少なくとも含む前記音声コンテンツの出力パターンに関する第1情報と、前記音声出力部の音量制御機能のオンオフに関する第2情報と、を含む設定情報に基づいて、前記音声出力部を制御する制御部と、
前記音声出力端末の周辺音を取得する音声入力部と、
を備え、
前記制御部は、前記音声入力部を介して取得した周辺音を解析して前記周辺音の種別を特定し、特定された前記周辺音の種別と前記音声コンテンツの種別と前記設定情報とに基づいて前記音声出力部の音量を制御することを特徴とする音声出力端末。
【請求項6】
請求項5記載の音声出力端末であって、
前記制御部は、前記周辺音の種別として、少なくとも会話、生活音の2つを特定することが可能であることを特徴とする音声出力端末。
【請求項7】
請求項5記載の音声出力端末であって、
前記特定された前記周辺音の種別が生活音であり前記音量制御機能がオンである場合、前記制御部は、前記設定情報に基づいて、前記第1パターンの一つとして前記音声出力部の音量を上げるように制御することを特徴とする音声出力端末。
【請求項8】
請求項5記載の音声出力端末であって、
前記特定された前記周辺音の種別が会話であり前記音量制御機能がオンである場合、前記制御部は、前記設定情報に基づいて、前記音声コンテンツを出力するように前記音声出力部を制御することを特徴とする音声出力端末。
【請求項9】
請求項8記載の音声出力端末であって、
前記特定された前記周辺音の種別が会話であり前記音量制御機能がオンである場合、前記制御部は、前記設定情報に基づいて、前記第1パターンの一つとして前記音声出力部の音量を下げるように制御することを特徴とする音声出力端末。
【請求項10】
請求項5記載の音声出力端末であって、
前記特定された前記周辺音の種別が会話であり前記音量制御機能がオンである場合、前記制御部は、前記設定情報に基づいて、前記第1パターンの一つとして前記音声出力部の音量を下げるように制御することを特徴とする音声出力端末。
【請求項11】
音声出力端末を用いて音声の出力を行う音声出力方法であって、
音声コンテンツを取得する無線通信ステップと、
前記音声コンテンツを出力する音声出力ステップと、
前記音声出力ステップで前記音声コンテンツを出力する第1パターンと前記音声コンテンツを出力しない第2パターンとを少なくとも含む前記音声コンテンツの出力パターンに関する第1情報と、前記音声出力ステップでの音量制御機能のオンオフに関する第2情報と、を含む設定情報に基づいて、前記音声出力ステップでの前記音声コンテンツの出力を制御する制御ステップと、
前記音声出力端末の周辺音を取得する音声入力ステップと、
を備え、
前記制御ステップでは、前記音声入力ステップで取得した周辺音を解析して前記周辺音の種別を特定し、特定された前記周辺音の種別と前記設定情報とに基づいて前記音声出力ステップでの音量を制御することを特徴とする音声出力方法。
【請求項12】
請求項11記載の音声出力方法であって、
前記制御ステップでは、前記周辺音の種別として、少なくとも会話、生活音の2つを特定することが可能であることを特徴とする音声出力方法。
【請求項13】
請求項11記載の音声出力方法であって、
前記特定された前記周辺音の種別が生活音であり前記音量制御機能がオンである場合、前記制御ステップでは、前記設定情報に基づいて、前記第1パターンの一つとして前記音声出力ステップの音量を上げるように制御することを特徴とする音声出力方法。
【請求項14】
請求項11記載の音声出力方法であって、
前記特定された前記周辺音の種別が会話であり前記音量制御機能がオンである場合、前記制御ステップでは、前記設定情報に基づいて、前記音声コンテンツを出力するように前記音声出力ステップを制御することを特徴とする音声出力方法。
【請求項15】
音声出力端末を用いて音声の出力を行う音声出力方法であって、
音声コンテンツを取得する無線通信ステップと、
前記音声コンテンツを出力する音声出力ステップと、
前記音声出力ステップで前記音声コンテンツを出力する第1パターンと前記音声コンテンツを出力しない第2パターンとを少なくとも含む前記音声コンテンツの出力パターンに関する第1情報と、前記音声出力ステップでの音量制御機能のオンオフに関する第2情報と、を含む設定情報に基づいて、前記音声出力ステップでの前記音声コンテンツの出力を制御する制御ステップと、
前記音声出力端末の周辺音を取得する音声入力ステップと、
を備え、
前記制御ステップでは、前記音声入力ステップで取得した周辺音を解析して前記周辺音の種別を特定し、特定された前記周辺音の種別と前記音声コンテンツの種別と前記設定情報とに基づいて前記音声出力ステップでの音量を制御することを特徴とする音声出力方法。
【請求項16】
請求項15記載の音声出力方法であって、
前記制御ステップでは、前記周辺音の種別として、少なくとも会話、生活音の2つを特定することが可能であることを特徴とする音声出力方法。
【請求項17】
請求項15記載の音声出力方法であって、
前記特定された前記周辺音の種別が生活音であり前記音量制御機能がオンである場合、前記制御ステップでは、前記設定情報に基づいて、前記第1パターンの一つとして前記音声出力ステップの音量を上げるように制御することを特徴とする音声出力方法。
【請求項18】
請求項15記載の音声出力方法であって、
前記特定された前記周辺音の種別が会話であり前記音量制御機能がオンである場合、前記制御ステップでは、前記設定情報に基づいて、前記音声コンテンツを出力するように前記音声出力ステップを制御することを特徴とする音声出力方法。
【請求項19】
請求項18記載の音声出力方法であって、
前記特定された前記周辺音の種別が会話であり前記音量制御機能がオンである場合、前記制御ステップでは、前記設定情報に基づいて、前記第1パターンの一つとして前記音声出力ステップでの音量を下げるように制御することを特徴とする音声出力方法。
【請求項20】
請求項15記載の音声出力方法であって、
前記特定された前記周辺音の種別が会話であり前記音量制御機能がオンである場合、前記制御ステップでは、前記設定情報に基づいて、前記第1パターンの一つとして前記音声出力ステップでの音量を下げるように制御することを特徴とする音声出力方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声コンテンツを出力する音声出力端末及び音声出力方法に関する。
【背景技術】
【0002】
従来から、主となる受信端末装置とデータの送受信が可能な複数の副受信端末のそれぞれに、各副受信端末装置に固有のID情報(識別情報)を持たせ、このID情報に対応する副コンテンツを主受信端末装置から副受信端末装置に送信する技術がある(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に記載されたような主受信端末装置(テレビ受信機)と、副受信端末装置とを含むシステムでは、主受信端末装置及び副受信端末装置それぞれに音声出力部がある。また、1台の端末装置でも、複数の音声出力部(例えば、スピーカとヘッドフォン)を有することがある。
【0005】
このように、複数の音声出力部を有している場合、適切にコンテンツの音声出力することが望ましい。そこで、上述のように、複数の音声出力部に対して適切に音声コンテンツを出力制御し得る端末、音声連携再生システム及びコンテンツ表示装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
前記課題を解決するための手段として、特許請求の範囲に記載の技術を用いる。
【0007】
一例を挙げるならば、音声出力端末であって、音声コンテンツを取得する無線通信部と、前記音声コンテンツを出力する音声出力部と、前記音声出力部から前記音声コンテンツを出力する第1パターンと前記音声コンテンツを出力しない第2パターンとを少なくとも含む前記音声コンテンツの出力パターンに関する第1情報と、前記音声出力部の音量制御機能のオンオフに関する第2情報と、を含む設定情報に基づいて、前記音声出力部を制御する制御部と、前記音声出力端末の周辺音を取得する音声入力部と、を備え、前記制御部は、前記音声入力部を介して取得した周辺音を解析して前記周辺音の種別を特定し、特定された前記周辺音の種別と前記設定情報とに基づいて前記音声出力部の音量を制御することを特徴とする音声出力端末、を備える。
【発明の効果】
【0008】
本発明の技術を用いることにより、音声出力部に対して適切に音声コンテンツを出力制御することができる。
【図面の簡単な説明】
【0009】
【
図1】実施例1に係る携帯情報端末の活用例を示す図である。
【
図2】実施例1に係る携帯情報端末のブロック図である。
【
図3】実施例1に係る携帯情報端末の音声出力部からの出力パターンを説明する図である。
【
図4】実施例1に係る携帯情報端末の処理を示すフローチャートである。
【
図5A】実施例2に係る音声連携再生システムのシステム構成図(1)である。
【
図5B】実施例2に係る音声連携再生システムのシステム構成図(2)である。
【
図5C】実施例2に係る音声連携再生システムのシステム構成図(3)である。
【
図6】実施例2に係る音声連携再生システムの携帯情報端末の音声出力部におけるデフォルト設定の説明図である。
【
図7】実施例2に係るコンテンツ表示装置のブロック図である。
【
図8】実施例2に係る外部送信装置のブロック図である。
【
図9】実施例2に係る携帯情報端末の処理を示すフローチャート(1)である。
【
図10】実施例2に係る携帯情報端末の処理を示すフローチャート(2)である。
【
図11A】実施例2に係る音声連携再生システムの活用例を示す図(1)である。
【
図11B】実施例2に係る音声連携再生システムの活用例を示す図(2)である。
【
図12A】実施例2に係る音声連携再生システムの活用例を示す図(3)である。
【
図12B】実施例2に係る音声連携再生システムの活用例を示す図(4)である。
【
図13】実施例3に係る音声連携再生システムの音声制御を説明する図である。
【
図14】実施例3に係る携帯情報端末の処理を示すフローチャート(1)である。
【
図15】実施例3に係る携帯情報端末の処理を示すフローチャート(2)である。
【
図16】実施例4に係る携帯情報端末の処理を示すフローチャートである。
【
図17】実施例4に係る音声連携再生システムの同期制御を説明する図である。
【
図18】実施例5に係る携帯情報端末の処理を示すフローチャートである。
【
図19】実施例6に係る携帯情報端末の処理を示すフローチャートである。
【
図20】実施例7に係る音声連携再生システムの字幕表示例を示す図である。
【
図21】実施例8に係る音声連携再生システムの翻訳に必要となる各種処理を示す図である。
【発明を実施するための形態】
【0010】
以下、本発明の実施形態の例を、図面を用いて説明する。
【0011】
(実施例1)
先ず、本実施例の携帯情報端末(端末)で再生可能なコンテンツの一例を説明する。まず、
図1を用いて、携帯情報端末700(携帯情報端末700mu)の活用例を説明する。携帯情報端末700は、例えば、携帯電話やスマートフォン、タブレット端末等である。また、携帯情報端末700は、PDA(Personal Digital Assistants)やノート型PCであってもよい。また、携帯情報端末700は、デジタルスチルカメラや動画撮影可能なビデオカメラ、携帯型ゲーム機等、またはその他の携帯用デジタル機器であってもよい。
【0012】
携帯情報端末700は、外部ネットワーク(例えば、インターネット等)を介して音声データを含む音声コンテンツを受信し、当該音声コンテンツを再生する。ここで、音声コンテンツとは、音楽コンテンツ、動画コンテンツ、ワンセグメント放送コンテンツ等である。また、携帯情報端末700は、ワンセグメント放送波を受信可能であり、ワンセグメント放送コンテンツを受信し、当該ワンセグメントコンテンツを再生する。
【0013】
携帯情報端末700は、複数の音声出力部を有し、当該音声出力部から音声出力可能である。具体的に、携帯情報端末700は、スピーカと、自装置が接続するヘッドフォンから音声出力することができる。
【0014】
さらに、携帯情報端末700は、上記の外部ネットワークまたは移動体電話通信網を介して通話することができる。すなわち、携帯情報端末700は、電話網を用いて通話可能である。さらに、携帯情報端末700は、外部ネットワークまたは移動体電話通信網を介して通話を行い、通話音声を受信し、通話相手に通話データを送信する。また、携帯情報端末700は、予め記憶している音楽コンテンツを再生する。以上の説明は、日本国内のみの適用に限定されるものではない。
【0015】
図1は、2種類のコンテンツ視聴を示す模式図である。携帯情報端末700では、ストリーミングコンテンツと音楽コンテンツとを再生している。ここで、Aユーザ10000muaはストリーミングコンテンツを視聴したい一方で、Bユーザ10000mubは音楽コンテンツを視聴したいと考えているものとする。
【0016】
この場合、携帯情報端末700muのヘッドフォン音声出力部は、前記ストリーミングコンテンツの音声を再生し、携帯情報端末700muのスピーカ音声出力部は、前記音楽コンテンツを再生する。この場合、Aユーザ10000muaは、ストリーミングコンテンツを、Bユーザ10000mubは音楽コンテンツを、それぞれ他方のコンテンツの視聴を阻害することなく視聴することが可能となる。
【0017】
[携帯情報端末のハードウェア構成]
次に、本実施例における具体的な構成例の説明を行う。
図2は、携帯情報端末700の内部構成の一例を示すブロック図である。携帯情報端末700は、主制御部701、システムバス702、通信処理部720(受信部)、操作部730、画像処理部740(表示制御部)、及び音声処理部750を備える。
【0018】
主制御部701は、携帯情報端末700全体を制御するマイクロプロセッサユニットである。主制御部701は、通信処理部720を介して放送コンテンツ、動画コンテンツ等の複数の音声コンテンツを取得する。また、主制御部701は、取得したコンテンツを記憶してもよい。このように、主制御部701は、音声取得部として機能する。
【0019】
主制御部701は、コンテンツを再生するアプリケーション(例えば、音声連携再生アプリケーション)、通話アプリケーションをインストールしており、ユーザの操作要求等に応じて、これらのアプリケーションを実行する。コンテンツを再生するアプリケーションは、各種音声コンテンツを再生する。例えば、取得した音声コンテンツを再生する。また、音声連携再生アプリケーションは、テレビ受信機から取得した音声データを再生するアプリケーションである。この音声連携アプリケーションの動作については、後述する。通話アプリケーションは、発着信を制御するアプリケーションである。
【0020】
主制御部701は、上記のコンテンツを再生するアプリケーションが、コンテンツの再生要求を受け付けた場合、取得したコンテンツ又は記憶したコンテンツを画像処理部740又は音声処理部750へ送出する。また、主制御部701は、上記の通話アプリケーションにより、電話による発着信制御と、スピーカ音声出力部751及び音声入力部754を利用した通話制御を行う。システムバス702は、主制御部701と携帯情報端末700内の各動作ブロックとの間でデータ送受信を行うためのデータ通信路である。
【0021】
通信処理部720は、LAN通信部721、移動体電話網通信部722、及びNFC通信部723を有する。LAN通信部721は、インターネットを介してデータの送受信を行う。移動体電話網通信部722は、移動体電話通信網を介して電話通信(通話)及びデータの送受信を行う。
【0022】
NFC通信部723は、対応するリーダ/ライタとの近接時に無線通信を行う。LAN通信部721、移動体電話網通信部722、及びNFC通信部723は、それぞれ符号回路や復号回路、アンテナ等を備えるものとする。また、通信処理部720が、BlueTooth(登録商標)通信部や赤外線通信部等、他の通信部を更に備えていてもよい。例えば、通信処理部720は、外部装置(例えば、テレビ受信機)から送信されたコンテンツを受信する。
【0023】
操作部730は、携帯情報端末700に対する操作指示の入力を行う指示入力部であり、本実施例では、表示部741に重ねて配置したタッチパネル及びボタンスイッチを並べた操作キーで構成されるものとする。何れか一方のみであってもよい。有線通信または無線通信により接続された別体の携帯端末機器を用いて携帯情報端末700の操作を行ってもよい。また、前記タッチパネル機能は表示部741が備え持っているものであってもよい。
【0024】
画像処理部740は、表示部741、画像信号処理部742、第一画像入力部743、及び第二画像入力部744で構成される。表示部741は、例えば、液晶パネル等の表示デバイスであり、画像信号処理部742で処理した画像データを携帯情報端末700のユーザに提供(表示出力)する。画像信号処理部742は、図示を省略したビデオRAMを備え、ビデオRAMに入力された画像データに基づいて表示部741が駆動される。
【0025】
また、画像信号処理部742は、必要に応じてフォーマット変換、メニューやその他のOSD(On Screen Display)信号の重畳処理等を行う機能を有するものとする。第一画像入力部743及び第二画像入力部744は、例えば、カメラユニットである。このカメラユニットは、CCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide Semiconductor)センサ等の電子デバイスを用いてレンズから入力した光を電気信号に変換することにより、周囲や対象物の画像データを入力する。
【0026】
音声処理部750は、スピーカ音声出力部751(第1の音声出力部)、ヘッドフォン音声出力部752(第2の音声出力部)、音声信号処理部753(音声出力制御部、解析部、算出部)、及び音声入力部754(入力部)で構成される。
【0027】
スピーカ音声出力部751は、出力されるスピーカ音声を聞くことのできる範囲内にいる全ユーザに対し、音声信号処理部753で処理した音声信号を提供する。ヘッドフォン音声出力部752は、音声信号処理部753で処理した音声信号を携帯情報端末700のユーザに提供するものである。ヘッドフォン音声出力部752は、ヘッドフォンやイヤフォン等を接続可能な端子を備えるものであってもよい。また、ヘッドフォン音声出力部752は、BlueTooth(登録商標)通信(近距離無線通信)等を介して音声信号を無線出力するものであってもよい。このように、携帯情報端末700は、音声コンテンツを出力する複数の音声出力部を備えた端末である。
【0028】
また、音声信号処理部753は、スピーカ音声出力部751とヘッドフォン音声出力部752で異なる音声信号を出力するために、2つ以上の音声信号を処理することが可能である。スピーカ音声出力部751またはヘッドフォン音声出力部752から出力する音声信号は、主制御部701によって選択的に制御される。
【0029】
スピーカ音声出力部751とヘッドフォン音声出力部752で出力される音声信号は、それぞれモノラルであってもよいしステレオであってもよい。音声入力部754はマイクであり、ユーザの声などを音声データに変換して入力する。
【0030】
音声信号処理部753は、操作部730を介して、後述する出力パターン情報を設定し、設定した出力パターン情報を記憶する。このように、音声信号処理部753は、設定部として機能する。また、音声信号処理部753は、出力パターン情報に基づいて、第1の音声コンテンツを第1の音声出力部及び第2の音声出力部の一方に出力し、第2の音声コンテンツを第1の音声出力部及び第2の音声出力部の他方に出力する。
【0031】
なお、
図2に示した携帯情報端末700の構成例は、本実施例に必須ではない構成も多数含んでいるが、これらが備えられていない構成であっても本実施例の効果を損なうことはない。また、デジタル放送受信機能や電子マネー決済機能等、図示していない構成が更に加えられていてもよい。
【0032】
[音声信号の出力パターン]
図3は、携帯情報端末700において第一の音声信号または第二の音声信号をスピーカ音声出力部751とヘッドフォン音声出力部752から出力する際の出力パターンの一例を示す図である。各音声信号は、「出力せず」「スピーカ音声出力部751から出力」「ヘッドフォン音声出力部752から出力」の3パターンがあり、二種類の音声信号の組み合わせとしては3×3=9パターンを取り得る。二種類の音声信号は、いずれも音声コンテンツの信号である。第一の音声信号は、例えば、動画コンテンツの信号であり、第二の音声信号は、例えば、音楽コンテンツの信号である。
【0033】
具体的には、
図3に示すNo.1出力パターン22000乃至No.9出力パターン22008である。このうち、第一の音声信号と第二の音声信号を共に出力するパターンは、No.5出力パターン22004、No.6出力パターン22005、No.8出力パターン22007、No.9出力パターン22008の4パターンである。特にNo.5出力パターン22004とNo.9出力パターン22008は、第一の音声信号と第二の音声信号を重畳して出力する。
【0034】
これらの出力パターンの選択は、操作部730を介してユーザが手動で選択してもよいし、ヘッドフォンが接続されたことを判定するヘッドフォン接続検出部を備え、ヘッドフォン接続検出部の検出結果に基づいて自動で選択してもよい。主制御部701が、端子の接続状態を検出したり、近距離無線通信によるヘッドフォン接続を検出したりすることにより、ヘッドフォン接続検出部を実現する。
【0035】
図3に示す設定はあくまで一例であり、携帯情報端末700が他の音声出力部を備える場合は、他の音声出力部の選択も許容し、複数の音声出力部からの同一の音声信号の出力も許容する。
【0036】
続いて、
図4を用いて、携帯情報端末700が音声信号の出力切り替えをする処理の手順を説明する。
図4は、携帯情報端末700が音声信号の出力切り替えをする処理の手順を示すフローチャートである。なお、予め出力パターンが設定されているものとする。
【0037】
まず、主制御部701が第1の音声コンテンツ(第一の音声信号)を取得し(ステップS91)、さらに第2の音声コンテンツ(第二の音声信号)を取得する(ステップS92)。音声信号処理部753は、出力パターン(設定値)を参照して、第1の音声コンテンツを第1の音声出力部及び第2の音声出力部の一方に出力し、第2の音声コンテンツを第1の音声出力部及び第2の音声出力部の他方に出力する(ステップS93)。
【0038】
以上説明したように、実施例1に記載の携帯情報端末700によれば、出力パターンを設定しておき、当該出力パターンにより、第1の音声信号を第1の音声出力部及び第2の音声出力部の一方に出力し、第2の音声信号を第1の音声出力部及び第2の音声出力部の他方に出力する。例えば、携帯情報端末700は、音楽コンテンツをスピーカ音声出力部751から出力し、映像コンテンツをヘッドフォン音声出力部752から出力することができる。このように、携帯情報端末700は、複数の音声出力部を用いて適切に音声コンテンツを出力制御し得る。
【0039】
(実施例2)
本発明の実施例2に関して説明する。本実施例は実施例1に記載の携帯情報端末を使用する音声連携再生システムである。なお、本実施例における携帯情報端末の構成及び効果等は特に断りのない限り実施例1と同様であるものとする。
【0040】
先ず、本実施例の音声連携再生システムで再生可能なコンテンツの一例を説明する。本実施例の音声連携再生システムでは、例えばテレビ受信機であるコンテンツ表示装置がアンテナを介して放送波を受信することで、BS/地上デジタル放送を再生可能である。
【0041】
さらには、コンテンツ表示装置が外部ネットワークと接続可能である場合、外部ネットワークを介してストリーミングコンテンツを受信し、再生することが可能である。一方で、携帯情報端末が前記外部ネットワークを介して受信したストリーミングコンテンツをコンテンツ表示装置に伝送し、再生することが可能である。
【0042】
さらには、携帯情報端末700がワンセグメント放送波を受信可能である場合は、ワンセグメント放送コンテンツをコンテンツ表示装置に伝送し、再生することが可能である。以上の説明は、日本国内のみの適用に限定されるものではない。
【0043】
次に、本実施例における実施形態の具体的な構成例の説明を行う。
[システム構成]
まず、
図5(
図5A~
図5C)を用いて、音声連携再生システムのシステム構成を説明する。
図5は、音声連携システムのシステム構成を示す図である。
図5Aは、本実施例の音声連携再生システムの一例を示すシステム構成図である。本実施例の音声連携再生システムは、コンテンツ表示装置100と、アンテナ100aと、ブロードバンドネットワーク等であるインターネット200と、ルータ装置210と、放送局の電波塔300tと、移動体電話通信網の基地局600bと、携帯情報端末700とを含む。
【0044】
コンテンツ表示装置100は、既存のデジタル放送受信機能に加え、放送通信連携システムに対応する機能を有するテレビ受信機である。コンテンツ表示装置100は、電波塔300tから送出された放送波を、アンテナ100aを介して受信する。また、コンテンツ表示装置100は、ルータ装置210を介してインターネット200と接続可能であり、インターネット200上の各サーバ装置との通信によるデータの送受信が可能である。
【0045】
ルータ装置210は、インターネット200と無線通信または有線通信により接続され、また、コンテンツ表示装置100とは無線通信または有線通信で、携帯情報端末700とは無線通信で接続される。これにより、インターネット200上の各サーバ装置とコンテンツ表示装置100と携帯情報端末700とが、ルータ装置210を介して、データの送受信を相互に行うことが可能となる。すなわち、コンテンツ表示装置100と携帯情報端末700とは、通信可能である。電波塔300tは、放送局の放送設備からデジタル放送信号等を含む放送波を送出する。
【0046】
図5Bは、本実施例の音声連携再生システムの別の一例を示すシステム構成図である。
図5Aに示すシステム構成と異なり、ルータ装置210を含まない。
図5Bに示すシステム構成では、ルータ装置210を介さない代わりに、BlueTooth(登録商標)等の方式を用いることで、コンテンツ表示装置100と携帯情報端末700との通信を行う。
【0047】
図5Cは、本実施例の音声連携再生システムの別の一例を示すシステム構成図である。
図5Bに示すシステム構成と異なり、外部送信装置100bを使用する。
【0048】
コンテンツ表示装置100は、ルータ装置210との接続ができない場合やBlueTooth(登録商標)等の通信方式を有さない場合、外部送信装置100bを介し、音声信号等を携帯情報端末700に伝送する。
【0049】
図5A乃至
図5Cに示す3つのシステム構成は、コンテンツ表示装置100と携帯情報端末700間の通信方式が異なるが、いずれか1つの通信方式に限定されたものではなく、2つ以上の通信方式を併用してもよい。上述のように、コンテンツ表示装置100は、各種通信手段(ルータ装置210、外部送信装置100b等)を用いて、携帯情報端末700へ各種情報(例えば、デジタル放送における音声データ)を送信する。携帯情報端末700は、これに応じて当該情報を受信する。また、コンテンツ表示装置100が、携帯情報端末700へ送信する音声データには、主音声又は副音声の種別を示す情報が含まれる。
【0050】
なお、携帯情報端末700の主制御部701は、上述のように、コンテンツ表示装置100と連携するためのアプリケーションを記憶している。携帯情報端末700は、当該アプリケーションを起動すると、コンテンツ表示装置100との間で認証処理を行う。また、携帯情報端末700は、予め音量基準情報を記憶しており、受信した情報(音声データ)を当該音量基準情報に基づいて音声出力する。
【0051】
[音声信号の出力パターン]
ところで、本実施例の音声連携再生システムは、実施例1の携帯情報端末700を使用するため、第一の音声信号または第二の音声信号をスピーカ音声出力部751とヘッドフォン音声出力部752から出力することが可能である。例えば、コンテンツ表示装置100のスピーカ174から出力される音声を、携帯情報端末700のスピーカ音声出力部751から出力し、ネットワーク上の動画コンテンツといった他の音声コンテンツの音声信号をヘッドフォン音声出力部752から出力することが可能である。携帯情報端末700は、出力対象のデータの出力先を、取得元毎で定めた出力パターンを予め記憶している。
【0052】
図6は、携帯情報端末700において各種音声コンテンツを再生する場合の、音声出力部に関するデフォルト設定の一例を示す図である。コンテンツ表示装置100で映像を表示するコンテンツ20000においては、多くのユーザが視聴する主音声をスピーカ音声出力部751から出力し、副音声をヘッドフォン音声出力部752から出力することがデフォルト設定されている。
【0053】
一方で、携帯情報端末700で映像を表示するコンテンツ20001においては、基本的には、視聴するユーザは前記携帯情報端末700を所持する一名のみであるため、音声コンテンツの種類を問わずヘッドフォン音声出力部752から音声を出力することがデフォルト設定されている。
【0054】
図6に示すデフォルト設定に基づく場合、ヘッドフォンを外している状態ではコンテンツ20000の副音声やコンテンツ20001の音声信号は出力できないため、スピーカ音声出力部751から前記コンテンツ20000の主音声のみが出力される。また、音声信号処理部753は、ヘッドフォンを接続している状態では、スピーカ音声出力部751からコンテンツ20000の主音声の音声信号を出力する。また、音声信号処理部753は、ヘッドフォン音声出力部752からコンテンツ20000の副音声またはコンテンツ20001の音声信号を出力する。ヘッドフォンの接続が解除された場合、音声信号処理部753は、ヘッドフォン音声出力部752からの音声信号の出力を中断する。
【0055】
図6に示す設定はあくまでデフォルト設定であり、
図6における各音声出力の設定は他方の出力部の選択も許容する。
【0056】
[コンテンツ表示装置のハードウェア構成]
図7は、コンテンツ表示装置100の内部構成の一例を示すブロック図である。コンテンツ表示装置100は、主制御部101と、システムバス102と、外部通信部103と、チューナ/復調部131と、分離部132と、映像表示部173と、スピーカ174(第3の音声出力部)とを含む。
【0057】
主制御部101は、所定の動作プログラムに従ってコンテンツ表示装置100全体を制御するマイクロプロセッサユニットである。システムバス102は主制御部101とコンテンツ表示装置100内の各動作ブロックとの間でデータ送受信を行うためのデータ通信路である。
【0058】
外部通信部103は、例えばLAN(Local Area Network)通信部を備える場合、
図5Aに示すように、ルータ装置210を介してインターネットからストリーミングコンテンツを受信したり、携帯情報端末700と通信したりするシステムを構成可能である。また、前記外部通信部103は、例えばBlueTooth(登録商標)通信部等を備える場合、
図5Bに示すように、携帯情報端末700と直接通信するシステムを構成可能である。
【0059】
また、外部通信部103は、例えば音声出力部を備える場合、
図5Cに示すように外部送信装置100bを介し、携帯情報端末700へ音声情報を送信することが可能となる。LAN通信部、BlueTooth通信部、音声出力部による通信方式は、いずれか1つの通信方式に限定されたものではなく、2つ以上の通信方式を併用してもよい。また、外部通信部103は、NFC通信部、赤外線通信部等、他の通信部を更に備えていてもよい。
【0060】
外部通信部103は、後述する分離部132から音声データを受け取った場合、当該音声データを携帯情報端末700へ送信する。なお、外部通信部103は、チューナ/復調部131によって受信されたコンテンツを携帯情報端末700へ送信するようにしてもよい。
【0061】
チューナ/復調部131は、アンテナ100aを介して電波塔300tから放送波を受信し、主制御部101の制御に基づいてユーザの所望するサービスのチャンネルに同調(選局)する。更に、チューナ/復調部131は、受信した放送信号を復調してトランスポートストリーム(Transport Stream:TS)を取得する。なお、
図6に示した例では、チューナ/復調部が一つである構成を例示しているが、複数画面同時表示や裏番組録画等を目的として、コンテンツ表示装置100がチューナ/復調部を複数搭載する構成としてもよい。
【0062】
分離部132は、チューナ/復調部131から出力されたTSを入力し、映像データ列、音声データ列、字幕データ列、等の各データ列に分離して出力する。このように、分離部132は、受信したコンテンツ(TS)から映像データ及び音声データを取得する。映像表示部173は、例えば液晶パネル等の表示デバイスであり、分離部132で分離された映像情報や字幕情報をコンテンツ表示装置100のユーザに提供する。スピーカ174は、分離部132で分離された音声情報をコンテンツ表示装置100のユーザに提供する。
【0063】
コンテンツ表示装置100は、テレビ受信機の他、DVD(Digital Versatile Disc)レコーダなどの光ディスクドライブレコーダ、HDDレコーダなどの磁気ディスクドライブレコーダ、STB(Set Top Box)等であってもよい。デジタル放送受信機能及び放送通信連携機能を備えたPC(Personal Computer)やタブレット端末、ゲーム機等であってもよい。コンテンツ表示装置100がDVDレコーダ、HDDレコーダ、STB等である場合、映像表示部173及びスピーカ174は備えなくともよい。外部通信部103に外部モニタ及び外部スピーカを接続することにより、本実施例のコンテンツ表示装置100と同様の動作が可能となる。
【0064】
[外部送信装置のハードウェア構成]
図8は、本実施例の音声連携再生システムが、例えば
図5Cに示すシステム構成をとる場合に使用する外部送信装置100bに関して、内部構成の一例を示すブロック図である。外部送信装置100bは、主制御部100b1、システムバス100b2、音声入力部100b3、及び外部信号送信部100b4を備える。
【0065】
主制御部100b1は、所定の動作プログラムに従って外部送信装置100b全体を制御するマイクロプロセッサユニットである。システムバス100b2は、主制御部100b1と外部送信装置100b内の各動作ブロックとの間でデータ送受信を行うためのデータ通信路である。
【0066】
音声入力部100b3は、コンテンツ表示装置100内の外部通信部103が備える音声出力部より出力された音声信号を取得する。
【0067】
外部信号送信部100b4は、例えばBlueTooth(登録商標)通信部を備え、音声入力部が取得した音声信号を変換し、装置の外部へ送信する。外部信号送信部100b4は、NFC通信部、赤外線通信部等、他の通信部を更に備えていてもよい。
【0068】
コンテンツ表示装置100内の外部通信部103が、例えば映像出力部を備える場合、外部送信装置100bは映像入力部を備えることで、例えばBlueTooth(登録商標)通信によって映像信号を装置の外部へ送信することが可能となる。音声信号入力と映像信号入力は、それぞれ独立した端子で行ってもよいし、例えば、HDMI端子等を介して音声信号と映像信号を同時に入力してもよい。また、音声信号と映像信号と共に入力した場合、外部信号送信部100b4で送信する情報は、音声信号と映像信号の両方であってもよいし、音声信号のみであってもよい。
【0069】
[音声連携再生時の動作シーケンス]
図9は、本実施例の音声連携再生システムを動作させる際の、携帯情報端末700の動作シーケンスの一例を示す動作シーケンス図である。同図は、本実施例の音声連携再生システムを動作させるためのアプリケーションを携帯情報端末700が起動し、コンテンツの視聴を継続したのちに視聴を終了するまでの一連の流れを示すものである。
【0070】
まず、携帯情報端末700は、本実施例の音声連携再生システムを動作させるためのアプリケーションを起動し(S101)、連携するコンテンツ表示装置100の認証を行う。本実施例の音声連携再生システムが
図5Aに示すシステムを構成している場合は、携帯情報端末700は、ネットワークを介してパスワード入力等により認証を行う。本実施例の音声連携再生システムが
図5Bに示すシステムを構成している場合は、ペアリング操作等によりコンテンツ表示装置100の認証を行う。
【0071】
本実施例の音声連携再生システムが
図5Cに示すシステムを構成している場合は、携帯情報端末700は、ペアリング操作等により外部送信装置100bの認証を行う。なお、コンテンツ表示装置100や外部送信装置100bがNFC通信部を備える場合、携帯情報端末700は、NFC通信部723を介してコンテンツ表示装置100や外部送信装置100bの認証を直接行ってもよい。
【0072】
また、コンテンツ表示装置100がユーザ操作によって映像表示部173にQRコードを表示し、携帯情報端末700の画像処理部740が画像処理によってQRコードを処理することで認証を行ってもよい。特に、本実施例の音声連携再生システムは、家族のような複数ユーザでコンテンツを視聴することを想定しているため、NFC通信やQRコードを活用する方法は操作が簡単であり、子供からお年寄りまで簡単に連携を開始することが可能となる。
【0073】
本実施例の音声連携再生システムを動作させるためのアプリケーションの起動と各装置の認証が完了したら、音声連携再生を開始する。携帯情報端末700は、個人差による音声の聞こえ方の差異を低減するために、操作部730を介して再生基準音量の設定等が可能である。音声信号処理部753は、操作部730等により設定された設定値を確認(S103)した後、通信処理部720より受信する受信音声を確認し(S105)、前記受信した音声を、スピーカ音声出力部751またはヘッドフォン音声出力部752より出力する(S106)。
【0074】
音声連携再生を継続するか否かは、S103乃至S106の処理ループ内で常時監視されている(S102)。アプリケーションの中断/終了要求が操作部730より入力されたり、コンテンツ表示装置100の電源が切れてコンテンツ表示装置100と携帯情報端末700間の通信が途切れたりした場合、本実施例の音声連携再生システムを終了する。以上の処理により、コンテンツ表示装置100と携帯情報端末700による、本実施例の音声連携再生システムの動作が可能となる。
【0075】
図10は、
図9に示す携帯情報端末700の動作シーケンスの一例において、音声出力(S106)の詳細な動作シーケンスの一例を示す動作シーケンス図である。まず、音声信号処理部753は、音声を出力するにあたり、携帯情報端末700が通話状態であるか否かを確認する(S10601)。
【0076】
具体的に、音声信号処理部753は、主制御部701へ通話状態の問合せをして、主制御部701から通話中であるか否かを示す情報を取得して判断する。音声信号処理部753は、もし通話状態である場合は(S10601:Yes)、着信音声を聴く上で支障にならないように、全ての音声信号の出力は行わずに処理を終了する。
【0077】
一方で、音声信号処理部753は、通話状態でない場合は(S10601:No)、音声信号は再生可能とし、次いでヘッドフォン接続検出部よる接続判定を行う(S10602)。音声信号処理部753は、ヘッドフォンが接続されている場合は(S10602:Yes)、2つ以上の音声信号の再生が可能であるため、スピーカ音声出力部751乃至ヘッドフォン音声出力部752の一方もしくは両方を使用して、1つまたは2つの音声信号の出力を行う(S10603)。
【0078】
一方で、ヘッドフォンが接続されていない場合、音声信号処理部753は、音声出力が可能であるのはスピーカ音声出力部751のみであるため、前記スピーカ音声出力部751より単一の音声信号を再生する(S10604)。S10603乃至S10604の処理で出力する音声信号の選択は、S103の処理において選択してもよいし、予め設定したデフォルト設定に基づいて選択してもよい。
【0079】
図10に示す動作シーケンスに基づいて音声信号を再生している途中に、携帯情報端末700に着信があった場合、音声信号処理部753は、S10601の処理における判断が変わり、音声信号の出力を中断する。通話が終了すると、音声信号処理部753は、S10601の処理における判断を再度変えて、音声信号の出力を再開する。
【0080】
また、ヘッドフォンを接続してスピーカ音声出力部751とヘッドフォン音声出力部752の両方からそれぞれ音声信号を再生している途中に、ヘッドフォンの接続が解除された場合、S10602の処理における判断を変えて、ヘッドフォン音声出力部752からの音声信号の出力を中断する。ヘッドフォンが接続されると、音声信号処理部753は、S10602の処理における選択を再度変えて、ヘッドフォン音声出力部752からの音声信号の出力を再開する。
【0081】
図9及び
図10の各動作シーケンスは適宜部分的に組み合わせることが可能であり、更に、一部動作ステップは他の動作ステップと、適宜、順序入れ替え、同時動作、等が可能であるものとする。また、
図9及び
図10の各動作シーケンスは、ユーザ操作の入力を除いてバックグラウンド動作が可能であり、ユーザが他のアプリケーションを使用する際に、これを阻害することはないものとする。
【0082】
[本実施例の音声連携再生システムの活用例]
図11Aは、本実施例の音声連携再生システムの活用例の一例である、2種コンテンツ視聴を示す模式図である。コンテンツ表示装置100uaの映像表示部173で再生しているコンテンツを、Aユーザ10000uaaとBユーザ10000uabが視聴している。Bユーザ10000uabはAユーザ10000uaaよりコンテンツ表示装置100uaから離れた位置にいる。
【0083】
一方で、Cユーザ10000uacは、Bユーザ10000uabで前記コンテンツを視聴中に、携帯情報端末700uaで前記コンテンツの関連コンテンツの視聴を開始したものとする。ここで、携帯情報端末700uaのスピーカ音声出力部751は、コンテンツ表示装置100uaのスピーカ174が再生する音声を再生する。また、携帯情報端末700uaのヘッドフォン音声出力部752は、前記関連コンテンツの音声を再生する。これにより、Aユーザ10000uaaとBユーザ10000uabはコンテンツ表示装置100uaの映像表示部173で再生しているコンテンツを視聴し、Cユーザ10000uacは前記コンテンツの再生を阻害することなく、携帯情報端末700uaで前記コンテンツの関連コンテンツを視聴することが可能となる。
【0084】
図11Bは、本実施例の音声連携再生システムの活用例の一例である、2画面のコンテンツ表示装置のコンテンツ視聴を示す模式図である。コンテンツ表示装置100ubは、チューナ/復調部131を2つ備え、映像表示部173を2分割し、第一コンテンツと第二コンテンツを再生している。
【0085】
ここで、Aユーザ10000ubaとBユーザ10000ubbは第一コンテンツを視聴したい一方で、Cユーザ10000uccは第二コンテンツを視聴したいものとする。そこで、コンテンツ表示装置100ubのスピーカ174と携帯情報端末700ubのスピーカ音声出力部751から前記第一コンテンツの音声を再生する。また、携帯情報端末700ubのヘッドフォン音声出力部752から前記第二コンテンツの音声を再生する。これにより、Aユーザ10000ubaとBユーザ10000ubbは、第一コンテンツを、Cユーザ10000uccは第二コンテンツを、それぞれ他方のコンテンツの視聴を阻害することなく、映像/音声共に視聴することが可能となる。
【0086】
図12Aは、本実施例の音声連携再生システムの活用例の一例である、多重音声コンテンツ視聴を示す模式図である。コンテンツ表示装置100ucは、第一音声と第二音声を含む多重音声コンテンツを再生している。
【0087】
ここで、Aユーザ10000ucaとBユーザ10000ucbは前記多重音声コンテンツを第一音声で視聴したい一方で、Cユーザ10000uccは前記多重音声コンテンツを第二音声で視聴したいものとする。そこで、コンテンツ表示装置100ucのスピーカ174と携帯情報端末700ucのスピーカ音声出力部751から前記第一音声を再生する。また、携帯情報端末700ucのヘッドフォン音声出力部752から前記第二音声を再生する。これにより、Aユーザ10000ucaとBユーザ10000ucbは第一音声で、Cユーザ10000uccは第二音声で、それぞれ他方の視聴を阻害することなく、多重音声コンテンツを視聴することが可能となる。
【0088】
図12Bは、本実施例の音声連携再生システムの活用例の一例である、サラウンドサウンドコンテンツ視聴を示す模式図である。コンテンツ表示装置100udは、例えば5.1chのようなサラウンドサウンドを含むコンテンツを再生している。
【0089】
ここで、前記コンテンツを視聴するAユーザ10000uda、Bユーザ10000udb、及びCユーザ10000udcの周囲に、A携帯情報端末700uda、B携帯情報端末700udb、C携帯情報端末700udc、及びD携帯情報端末700uddを配置しているものとする。コンテンツ表示装置100udは、前記サラウンドサウンドをA携帯情報端末700uda乃至D携帯情報端末700uddに伝送する。A携帯情報端末700uda乃至D携帯情報端末700uddは、伝送された各音声を再生する。これにより、Aユーザ10000uda乃至Cユーザ10000udcは、サラウンドサウンドコンテンツを高臨場な視聴環境で視聴することが可能となる。
【0090】
なお、本実施例の音声連携再生システムを動作させるためのアプリケーションの拡張機能として、コンテンツ表示装置と複数の携帯情報端末の台数や位置関係を登録し、前記携帯情報端末の台数や位置関係に基づいて、所望のサラウンドサウンド視聴を実現するための各音声を生成し、前記各音声を各携帯情報端末に伝送するようにしてもよい。
【0091】
以上説明したように、実施例2に記載の音声連携再生システムによれば、コンテンツ表示装置100から携帯情報端末700へ音声データを送信するので、コンテンツ表示装置100だけでなく、携帯情報端末700の音声出力部(例えば、スピーカ音声出力部751)でも出力することができる。このように、複数の音声出力部に対する複数の音声コンテンツの選択的な出力制御が可能な携帯情報端末700を用い、コンテンツ表示装置100で再生する第一のコンテンツの視聴環境を向上させると同時に、携帯情報端末700のユーザが第二のコンテンツを視聴可能な音声連携再生システムを実現できる。
【0092】
(実施例3)
以下では、本発明の実施例3に関して説明する。なお、本実施例における構成及び効果等は特に断りのない限り実施例2と同様であるものとする。このため、以下では、本実施例と実施例2との相違点を主に説明し、共通する点については重複を避けるため極力説明を省略する。
【0093】
実施例2においても音声連携再生システムを行う場合の実施態様を記載したが、さらに詳細の実施態様につき説明する。
【0094】
音声連携再生を行う際に、コンテンツ表示装置からの距離の違いに依る音声の聞こえ方の差異が少ない視聴環境を構築したい場合がある。この際、コンテンツ表示装置から携帯情報端末700までの距離が離れるほど携帯情報端末700のスピーカ音量を上げるように制御するのが望ましい。
【0095】
そこで、本実施例では、携帯情報端末700は、コンテンツ表示装置100から出力された音声を入力し、入力された音声の音量に基づいて、スピーカ音声出力部751から音声を出力する。
【0096】
具体的に、携帯情報端末700の音声入力部754が周囲の音声(端末外部の音声)を入力し、音声信号処理部753が、当該音声を取得する。音声信号処理部753は、当該音声と、コンテンツ表示装置100から通信により取得した音声データとを比較して、入力した音声の中からコンテンツ表示装置100から出力した音声を特定し、当該音声の音量を特定する。音声信号処理部753は、特定した音量と、設定された基準音量とに基づいてコンテンツ表示装置100から取得した音声データの音量を特定して、音声出力する。
【0097】
図13は、本実施例の音声連携再生システムにおける音量制御の一例を示す模式図である。コンテンツ表示装置100で再生されるコンテンツのユーザとして、コンテンツ表示装置100から近い場所にAユーザ10000a、コンテンツ表示装置100から遠い場所にBユーザ10000bがいる。Aユーザ10000aはA携帯情報端末700aを所持しており、Bユーザ10000bはB携帯情報端末700bを所持している。
【0098】
Aユーザ10000aは、コンテンツ表示装置100のスピーカ174から出力される音声を、Aユーザの位置におけるコンテンツ表示装置のスピーカ音量100saで聞く。一方でBユーザ10000bは、コンテンツ表示装置100のスピーカ174から出力される音声を、Bユーザの位置におけるコンテンツ表示装置のスピーカ音量100sbで聞く。前記Bユーザの位置におけるコンテンツ表示装置のスピーカ音量100sbは、前記Aユーザの位置におけるコンテンツ表示装置のスピーカ音量100saと比較して小さく、Bユーザ10000bはAユーザ10000aと比較して、スピーカ174が出力する音声が聞き取りづらくなる。
【0099】
そこで、A携帯情報端末700aとB携帯情報端末700bはコンテンツ表示装置100と連携し、A携帯情報端末700aはスピーカ音声出力部751からA携帯情報端末のスピーカ音量700saで音声を再生し、B携帯情報端末700bはスピーカ音声出力部751からB携帯情報端末のスピーカ音量700sbで音声を再生する。
【0100】
前記A携帯情報端末のスピーカ音量700saと比較し、B携帯情報端末のスピーカ音量700sbは大きい音量である。このとき、Aユーザ10000aとBユーザ10000bが聞く音量はそれぞれ、Aユーザが聞く音量800saとBユーザが聞く音量800sbとなる。A携帯情報端末700aとB携帯情報端末700bは、前記Aユーザが聞く音量800saと前記Bユーザが聞く音量800sbがおおよそ同じ値となるよう、それぞれ前記A携帯情報端末のスピーカ音量700saと前記B携帯情報端末のスピーカ音量700sbを制御する。
【0101】
図14は、
図9に示す携帯情報端末700の動作シーケンスに対し、スピーカ音声出力部751の音量制御を考慮した動作シーケンスの一例を示す動作シーケンス図である。
図9中のS105の処理では受信音声の確認のみであったのに対し、
図14中のS104の処理では受信音声に加えて音声入力部754から入力される入力音声の確認を行う。
【0102】
音声信号処理部753は、受信音声と入力音声を確認したら、音声入力部754から入力される入力音声の音量を計測する(S107)。
図13に示すように、音声信号処理部753は、コンテンツ表示装置100がスピーカ174より出力する出力音声と携帯情報端末700がスピーカ音声出力部751より出力する出力音声の音量の合計が再生基準音量に常時近い値となるよう、携帯情報端末700のスピーカ音声出力部751より出力する音声の音量を算出する(S108)。そして、携帯情報端末700は、算出した音量の音声を、スピーカ音声出力部751より出力する(S106)。
【0103】
図15は、
図14に示す携帯情報端末700の動作シーケンスの一例において、入力音声確認/受信音声確認(S104)の詳細な動作シーケンスの一例を示す動作シーケンス図である。まず、音声信号処理部753は、携帯情報端末700の音声入力部754から入力される入力音声を確認し(S10401)、所定時間のバッファリングが可能なバッファへ入力音声データを格納する(S10402)。
【0104】
一方、携帯情報端末700の通信処理部720が受信した受信音声を確認し(S10403)、所定時間のバッファリングが可能なバッファへ受信音声データを格納する(S10404)。そして、前記入力音声データが格納されたバッファと前記受信音声が格納されたバッファの両バッファ間において、同一の音声データと判定される箇所を検出する(S10405)。前記検出を行うことで、入力音声データに含まれる音声コンテンツの音声信号成分のみの大きさを算出することが可能となる。
【0105】
図14及び
図15の各動作シーケンスは適宜部分的に組み合わせることが可能であり、更に、一部動作ステップは他の動作ステップと、適宜、順序入れ替え、同時動作、等が可能であるものとする。また、
図14及び
図15の各動作シーケンスは、ユーザ操作の入力を除いてバックグラウンド動作が可能であり、ユーザが他のアプリケーションを使用する際に、これを阻害することはないものとする。
【0106】
音量制御は、コンテンツ表示装置100のスピーカ174より出力される音声と同一の音声信号を携帯情報端末700のスピーカ音声出力部751より出力する場合は、コンテンツ表示装置100からの距離の違いに依る聞こえ方の差異を低減するために、デフォルト設定ではオンとしておくのが望ましい。一方で、前記音声信号をヘッドフォン音声出力部752より出力する場合は、コンテンツ表示装置100からの距離の違いに依る聞こえ方の差異は非常に小さいため、デフォルト設定ではオフとしておくのが望ましい。
【0107】
以上説明したように、スピーカ音声出力部751が携帯情報端末700の外部の音声を入力し、音声信号処理部753が、入力された音声に基づいて、音声出力を制御する。具体的には、音声信号処理部753は、スピーカ音声出力部751によって入力された音声に基づいて、受信した音声データの音量を定めて出力する。これにより、コンテンツ表示装置100から離れている利用者にも適切な音量で音声データをスピーカ音声出力部751から出力することができる。
【0108】
以上説明したように、本発明では、コンテンツ表示装置100から携帯情報端末700までの距離が離れるほど携帯情報端末のスピーカ音量を上げるように制御することで、コンテンツ表示装置100からの距離の違いに依る音声の聞こえ方の差異が少ない音声連携再生システムを実現可能とする。
【0109】
(実施例4)
以下では、本発明の実施例4に関して説明する。なお、本実施例における構成及び効果等は特に断りのない限り実施例2と同様であるものとする。このため、以下では、本実施例と実施例2との相違点を主に説明し、共通する点については重複を避けるため極力説明を省略する。
【0110】
実施例2においても音声連携再生システムを行う場合の実施態様を記載したが、さらに詳細の実施態様につき説明する。
【0111】
音声連携再生を行う際に、コンテンツ表示装置100のスピーカから出力する音声信号と、携帯情報端末700のスピーカ音声出力部751から出力する前記音声信号と同一の音声信号の再生タイミングがずれる場合がある。これは、コンテンツ表示装置100と携帯情報端末700間の通信遅延によるものである。この際、好適な視聴環境を得るためには、前記同一の音声信号、さらにはコンテンツ表示装置が再生する映像の再生タイミングを同期させる制御を行うのが望ましい。
【0112】
本実施例の音声連携再生システムは、上記の再生タイミングを調整するものである。具体的に、携帯情報端末700の音声入力部754が周囲の音声を入力し、音声信号処理部753が、当該音声を取得し、記憶する。また、音声信号処理部753は、通信処理部720を介して取得した音声データを記憶する。
【0113】
音声信号処理部753は、音声入力部754から入力した音声と、通信処理部720を介して取得した音声データとを比較して、一致するデータの有無を判断する。音声信号処理部753は、一致するデータがある場合、音声入力時の時刻と、受信データの受信時刻とを比較して、時刻差を算出する。音声信号処理部753は、当該時刻差に基づき、音声出力タイミングを調整する。具体的には、音声入力時の時刻の方が先である場合、音声信号処理部753は、コンテンツ表示装置100の再生タイミングを遅らせる旨制御する。また、音声データの方が早い場合、携帯情報端末700の再生タイミングを遅らせる。
【0114】
同期制御は音声入力部754から入力される入力音声に基づいて行うため、携帯情報端末700の動作シーケンスは
図16となる。
図16は、
図15に示す入力音声確認/受信音声確認(S104)の詳細な動作シーケンスに対し、同期制御を考慮した動作シーケンスの一例である。入力音声データと受信音声データの同一箇所を検出(S10405)したのちに、入力音声における前記同一の音声データの可聴タイミングと、受信音声における前記同一の音声データの再生タイミングの時刻差を計算する(S10406)。
【0115】
ここで、入力音声の方が早い場合は、コンテンツ表示装置100におけるコンテンツ再生タイミングを遅らせ(S10408)、一方で受信音声の方が早い場合は、携帯情報端末700のスピーカ音声出力部751における音声再生タイミングを遅らせる(S10409)。S10408の処理は、携帯情報端末700からコンテンツ表示装置100への通信が可能な場合のみ実行できるため、本実施例の音声連携再生システムとしては、
図5A、または
図5Bに示すシステム構成をとる場合に有効となる。
【0116】
図17は、本実施例の音声連携再生システムにおける同期制御の一例を示す模式図である。コンテンツとして、コンテンツ表示装置100が受信したBS/地上デジタル放送を視聴することを想定する。コンテンツ表示装置100と携帯情報端末700間の伝送時間等を考慮すると、基本的には、コンテンツ表示装置100のスピーカ174より出力される音声、すなわち携帯情報端末700の音声入力部754から入力される入力音声の方が、携帯情報端末700の通信処理部720が受信する受信音声より、時間的に早いデータとなる。
【0117】
そこで、音声信号処理部753は、同期前の入力音声100spの可聴タイミング11000aと、同期前の受信音声700spの再生タイミング11000bとの時刻差を解消するために、S10408の処理を行う。S10408の処理では、まずコンテンツ表示装置100におけるコンテンツ再生タイミングを遅らせる指示をコンテンツ表示装置100の外部通信部103に伝送し、指示を受信したコンテンツ表示装置100は、リップシンク技術等を活用することで、50msec程度の分解能100sdtで、スピーカ174や映像表示部173の再生タイミングを遅らせる。
【0118】
しかし、入力音声の可聴タイミングと受信音声の再生タイミングは、空気中の音声の伝搬遅延等を考慮してさらに細かいオーダーで同期をとらないと、ユーザにはエコーがかかったように聞こえてしまう。そこで、音声信号処理部753は、入力音声の可聴タイミングが受信音声の再生タイミングより遅くなるように前記分解能100sdtに基づいてスピーカ174の再生タイミングを遅らせると同時に、さらに細かい20usec程度の分解能700sdtで、携帯情報端末700のスピーカ音声出力部751における再生タイミングを遅らせる。
【0119】
分解能100sdtに基づいて遅らせた同期後の入力音声100sqの可聴タイミングと、分解能700sdtに基づいて遅らせた同期後の受信音声700sqの再生タイミングは、同期タイミング11000cで一致し、ユーザはエコーが低減された視聴環境でコンテンツを視聴することが可能となる。
【0120】
本実施例の音声連携再生システムにおけるコンテンツとして、コンテンツ表示装置100が受信したストリーミングコンテンツを視聴する場合も、
図16に示す動作シーケンスに基づいて同期制御を行うことができる。BS/地上デジタル放送との視聴時と異なり、S10408の処理においてストリーミングを行うためのプログラムを制御することで、コンテンツ表示装置100の再生タイミングを遅らせてもよい。
【0121】
本実施例の音声連携再生システムにおけるコンテンツとして、携帯情報端末700が受信したストリーミングコンテンツまたはワンセグメント放送コンテンツを視聴する場合を想定する。この場合、携帯情報端末700からコンテンツ表示装置100への伝送時間等を考慮すると、基本的には、コンテンツ表示装置100のスピーカ174より出力される音声の再生タイミングの方が、携帯情報端末700のスピーカ音声出力部751より出力される音声の再生タイミングより、時間的に遅くなる。したがって、携帯情報端末700の再生タイミングを遅らせるS10409の処理のみで同期制御を行うことが可能となる。
【0122】
図16の動作シーケンスは適宜部分的に組み合わせることが可能であり、更に、一部動作ステップは他の動作ステップと、適宜、順序入れ替え、同時動作、等が可能であるものとする。また、
図16の動作シーケンスは、ユーザ操作の入力を除いてバックグラウンド動作が可能であり、ユーザが他のアプリケーションを使用する際に、これを阻害することはないものとする。
【0123】
1台のコンテンツ表示装置100に対し、2台以上の携帯情報端末700を連携させ、本実施例の音声連携再生システムを構築する場合においても、
図16に示す動作シーケンスに基づいて同期制御を行うことで、これらの全装置における音声や映像等の同期制御を行うことが可能となる。
【0124】
同期制御は、コンテンツ表示装置100のスピーカ174より出力される音声と同一の音声信号を、携帯情報端末700のスピーカ音声出力部751乃至ヘッドフォン音声出力部752より出力するいずれの場合においても、コンテンツ表示装置100が再生する映像との再生タイミングを同期させるという目的で、デフォルト設定ではオンとしておくのが望ましい。
【0125】
以上説明したように、本実施例では、音声信号処理部753は、音声入力部754により入力されたタイミングを特定し、当該タイミングに基づいて、スピーカ音声出力部751へ出力するタイミングを制御する。これにより、コンテンツ表示装置100から出力される音声と、携帯情報端末700から出力する音声との出力タイミングを適切に調整することができ、例えば、通信遅延により受信タイミングにズレが生じても、適切に調整することができる。
【0126】
(実施例5)
以下では、本発明の実施例5に関して説明する。なお、本実施例における構成及び効果等は特に断りのない限り実施例2乃至4と同様であるものとする。このため、以下では、本実施例と実施例2乃至4との相違点を主に説明し、共通する点については重複を避けるため極力説明を省略する。
【0127】
実施例2乃至4においても音声連携再生システムを行う場合の実施態様を記載したが、さらに詳細の実施態様につき説明する。
【0128】
音声連携再生を行う際に、再生するコンテンツの音声の他にも、周辺音を解析し、周辺状況に合わせてコンテンツの音声の音量を制御したい場合がある。例えばコンテンツの視聴ユーザが他人に話しかけられた場合、会話を聞き取りやすくするために、携帯情報端末のスピーカの音量は下げるのが望ましい。一方で、例えばコンテンツの視聴ユーザの周囲の生活音が大きい場合、コンテンツの音声を聞き取りやすくするために、携帯情報端末のスピーカの音量は上げるのが望ましい。
【0129】
本実施例の音声連携再生システムは、周辺音の種別を解析し、当該種別に基づいて、出力する音声の音量を制御するものである。具体的に、携帯情報端末700の音声入力部754が周囲の音声を入力し、音声信号処理部753が、当該音声を取得し、記憶する。また、音声信号処理部753は、通信処理部720を介して取得した音声データを記憶する。
【0130】
音声信号処理部753は、音声入力部754から入力した音声と、通信処理部720を介して取得した音声データとを比較して、一致する部分を抽出すると共に、音声入力部754から入力した音声から一致しない部分(周辺音部分)を抽出する。音声信号処理部753は、周辺音の種別(例えば、会話、周辺の騒音)を特定して、特定した周辺音の種別に応じて、受信した音声データの音声出力音量を決定し、当該音量に基づいて音声出力する。
【0131】
本実施例では、以上の詳細の実施態様を実現するための手順について説明する。
図18は、
図9に示す携帯情報端末700の動作シーケンスに対し、周辺音の解析に基づく音量制御を考慮した動作シーケンスの一例を示す動作シーケンス図である。S104の処理において、音声入力部754から入力される入力音声の中から受信音声と一致するデータ、すなわちコンテンツの音声を検出した際、前記入力音声においてコンテンツの音声と周辺音の分離を行う(S109)。
【0132】
音声信号処理部753は、分離した周辺音に基づき、前記周辺音に含まれる主成分が例えば会話であるのか、あるいは生活音であるのか、といった種別解析を行う(S110)。音声信号処理部753は、一方で、前記周辺音の音量を計測し(S111)、S108の処理では、周辺音の種別解析結果と音量を考慮した上で、携帯情報端末700のスピーカ音声出力部751より出力する音声の音量を算出する。
【0133】
音量の制御方法の例としては、前記周辺音の種別解析結果が例えば会話であった場合、スピーカ音声出力部751より出力する音声は一律で所定の小さい音量とし、前記周辺音の種別解析結果が例えば生活音であった場合、スピーカ音声出力部751より出力する音声は、生活音の音量が大きいほど大きくなるように音量の制御を行う。
【0134】
ここで、音声分離(S109)や周辺音の解析(S110)等は、携帯情報端末700の内部で行ってもよいし、インターネット上のサーバ装置において行ってもよい。処理S109やS110等が長い処理時間を要するようであれば、処理時間の最大値を予め見積もった上で、S104の処理における同期制御では前記処理時間の最大値を考慮する。そして、
図7Bに示すS10406の処理で前記処理時間の最大値、すなわち受信音声を確認(S10403)してから周辺音を解析し実際に出力(S106)されるまでの時間を考慮して入力音声との時刻差を計算してもよい。
【0135】
図18の各動作シーケンスは適宜部分的に組み合わせることが可能であり、更に、一部動作ステップは他の動作ステップと、適宜、順序入れ替え、同時動作、等が可能であるものとする。また、
図18の各動作シーケンスは、ユーザ操作の入力を除いてバックグラウンド動作が可能であり、ユーザが他のアプリケーションを使用する際に、これを阻害することはないものとする。
【0136】
このように、音声信号処理部753は、周辺音を抽出し、当該周辺音の種別を解析して、当該解析結果に基づいて、出力音量を制御するので、周辺状況に応じた音量制御をすることができる。
【0137】
以上説明したように、本発明では、周辺音を解析し、周辺状況に合わせてコンテンツの音声の音量を制御可能な音声連携再生システムを実現可能である。
【0138】
(実施例6)
以下では、本発明の実施例6に関して説明する。なお、本実施例における構成及び効果等は特に断りのない限り実施例2乃至4と同様であるものとする。このため、以下では、本実施例と実施例2乃至4との相違点を主に説明し、共通する点については重複を避けるため極力説明を省略する。
【0139】
実施例2乃至4においても音声連携再生システムを行う場合の実施態様を記載したが、さらに詳細の実施態様につき説明する。
【0140】
音声連携再生システムによりコンテンツを視聴している最中に、携帯情報端末を用いて通話を行いたい場合がある。この際、通話を行う相手に対して明瞭な音声を届けるためには、マイクより入力する音声に含まれる通話内容成分を増大させるか、視聴中のコンテンツの音声成分をなるべく低減するのが望ましい。
【0141】
前者の方式の一例としては、実施例5における音声分離処理(S109)を適用することで、マイクより入力する音声に含まれる通話内容成分と視聴中のコンテンツの音声成分を分離し、このうち通話内容成分のみを増幅させる方式がある。後者の方式の一例としては、スピーカ音声出力部751より出力するために受信している受信音声情報を用いて、マイクより入力する音声に含まれる視聴中のコンテンツの音声成分を打ち消す方式が考えられる。
【0142】
本実施例の音声連携システムは、携帯情報端末700が、コンテンツ表示装置100から受信する音声データを出力しつつ、通話処理をしている場合に、通話音声(通話による入力音声)を適切に制御するものである。具体的には、音声信号処理部753は、主制御部701へ通話状態の問合せをして、主制御部701から通話中であるか否かを示す情報を取得して判断する。音声信号処理部753は、受信した音声データの位相反転と、音声入力部754に入力されるコンテンツの音声成分の音量に基づく振幅調整をして、ユーザの発信音声に加算する。
【0143】
本実施例では、以上の詳細の実施態様を実現するための手順について説明する。
図19は、
図9に示す携帯情報端末700の動作シーケンスに対し、本実施例の音声連携再生システムを動作させるためのアプリケーションと通話アプリケーションの連携動作を考慮した動作シーケンスの一例を示す動作シーケンス図である。通話アプリケーションは、着信もしくは発信したら処理ループを開始する(S121)。まず、着信音声の確認(S123)と、受話部より前記着信音声の出力を行う(S124)。一方、音声入力部754からのユーザの発信音声を確認する(S125)。
【0144】
ここで、前記発信音声を発信するにあたり、音声連携再生システムとして動作している携帯情報端末700のスピーカ音声出力部751より出力するコンテンツの音声を利用する。具体的には、音声信号処理部753は、S106の処理でスピーカ音声出力部751より出力するコンテンツの音声の位相反転と、発信音声に含まれるコンテンツの音声成分の音量に基づく振幅調整を行う(S120)。そして、音声信号処理部753は、S125の処理で確認したユーザの発信音声に加算(S126)することで、発信音声に含まれるコンテンツの音声成分を低減し、明瞭な発信音声を生成することが可能となる。そして、前記明瞭な発信音声を発信する(S127)。
【0145】
通話を継続するか否かは、S123乃至S127の処理ループ内で常時監視されており(S122)、終話要求が操作部730より入力されたり、通話を行う相手が終話を要求したりした場合、本実施例の通話を終了する。
【0146】
図19の各動作シーケンスは適宜部分的に組み合わせることが可能であり、更に、一部動作ステップは他の動作ステップと、適宜、順序入れ替え、同時動作、等が可能であるものとする。また、
図19の各動作シーケンスは、ユーザ操作の入力を除いてバックグラウンド動作が可能であり、ユーザが他のアプリケーションを使用する際に、これを阻害することはないものとする。
【0147】
上述の実施例のように、音声信号処理部753は、音声入力部754により入力された音声と、通信処理部720を介して取得した音声データとに基づいて、音声入力部754により入力された音声に含まれる通話音声を強調する。具体的には、音声信号処理部753は、当該強調処理として、通信処理部720により受信された音声データの位相を反転させた結果を、音声入力部754により入力された音声に加算する。これにより、音声信号処理部753は、受信した音声データ(音声コンテンツ)部分を弱める処理をするので、コンテンツを視聴している最中でも、明瞭な音声で通話を行うことができる。
【0148】
なお、音声信号処理部753は、上述の例で挙げたように、実施例5における音声分離処理をして、マイクより入力する音声に含まれる通話内容成分と視聴中のコンテンツの音声成分を分離し、このうち通話内容成分(通話音声部分)のみを増幅するようにしてもよい。この場合、音声信号処理部753は、通話内容部分を強調するので、コンテンツを視聴している最中でも、明瞭な音声で通話を行うことができる。
【0149】
(実施例7)
以下では、本発明の実施例7に関して説明する。なお、本実施例における構成及び効果等は特に断りのない限り実施例2乃至4と同様であるものとする。このため、以下では、本実施例と実施例2乃至4との相違点を主に説明し、共通する点については重複を避けるため極力説明を省略する。
【0150】
実施例2乃至4においても音声連携再生システムを行う場合の実施態様を記載したが、さらに詳細の実施態様につき説明する。
【0151】
音声連携再生システムによりコンテンツを視聴している最中に、携帯情報端末において音声のみならず、映像または字幕を表示したい場合がある。特に、字幕に関しては、複数ユーザが視聴するコンテンツ表示装置で表示する場合に、映像に重畳する字幕を邪魔と考えるユーザがいる場合がある。このとき、例えばコンテンツ表示装置には字幕を表示せず、字幕を必要とするユーザが所持する携帯情報端末にのみ字幕を表示するのが望ましい。
【0152】
本実施例の音声連携システムでは、携帯情報端末700が、音声データに関連する字幕データを受信して、当該字幕データを表示する。
【0153】
本実施例では、以上の詳細の実施態様を実現するための手順について説明する。
図20は、携帯情報端末700の表示部741における表示画面の一例である。前記表示部741はタッチパネル機能を備え、操作部730を兼ねる。まず、メニュー741bでは、ユーザが映像や字幕の表示要否等を選択する。ユーザが字幕の表示を選択した場合、字幕741aが表示される。
【0154】
前記字幕741aは、タッチパネル機能を活用して上下方向にスライドさせることで、所定の時間の字幕データを遡ることができ、もし一時的にコンテンツの見逃し/聞き逃しをした場合、コンテンツの再生を止めずに見逃し/聞き逃しをした箇所の内容を知ることが可能となる。表示する字幕741aは、スクロールバー741cにおいて現在の字幕の位置を示すつまみ741dを操作することにより移動することも可能である。
【0155】
以上説明したように、本発明では、携帯情報端末において音声のみならず、映像または字幕を表示することが可能な音声連携再生システムを実現可能とする。
【0156】
(実施例8)
以下では、本発明の実施例8に関して説明する。なお、本実施例における構成及び効果等は特に断りのない限り実施例2乃至4と同様であるものとする。このため、以下では、本実施例と実施例2乃至4との相違点を主に説明し、共通する点については重複を避けるため極力説明を省略する。
【0157】
実施例2乃至4においても音声連携再生システムを行う場合の実施態様を記載したが、さらに詳細の実施態様につき説明する。
【0158】
音声連携再生を行う際に、再生するコンテンツの一種類以上の音声や一種類以上の字幕において、視聴ユーザが理解可能な言語が含まれていない場合がある。このとき、前記一種類以上の音声や一種類以上の字幕のいずれかを用いて翻訳を行い、ユーザが理解可能な言語の音声または字幕として提供できるのが望ましい。
【0159】
本実施例では、携帯情報端末700は、字幕データを受信して、受信した字幕データを外部のサーバ(翻訳部)に翻訳要求し、当該外部サーバが当該翻訳要求に応じて翻訳して、当該翻訳結果を表示したり、音声出力したりする。なお、携帯情報端末700自身が翻訳手段を備えるようにしてもよい。
【0160】
本実施例では、以上の詳細の実施態様を実現するための手順について説明する。
図21は、各種翻訳パターンにおいて必要となる各種処理の一例を示す図である。翻訳パターンとしては、翻訳前のデータとして「字幕」「音声」の2パターンがあり、翻訳後のデータとしても「字幕」「音声」の2パターンがあるため、翻訳パターンの組み合わせとしては、2×2=4パターンを取り得る。
【0161】
具体的には、
図21に示すように、字幕から字幕への翻訳パターン23000、字幕から音声への翻訳パターン23001、音声から字幕への翻訳パターン23002、音声から音声への翻訳パターン23003である。また、一般的に翻訳はテキストベースで行うことが多いため、前記4パターンの翻訳を行うための処理として、音声をテキストに変換するための音声テキスト化処理23004、テキストベースの翻訳処理23005、テキストを音声に変換するためのテキスト音声化処理23006が必要となる。前記3種類の処理を
図21に示すように適用することで、前記4パターンの翻訳が可能となる。
【0162】
音声から字幕への翻訳パターン23002、音声から音声への翻訳パターン23003は、
図14に示す携帯情報端末700の動作シーケンスにおいて、S104の処理内で受信音声を確認したのちに実行する。字幕から字幕への翻訳パターン23000、字幕から音声への翻訳パターン23001についても、音声と同等のタイミングで伝送される字幕を用いて行うため、音声を用いて行う翻訳パターンと同等のタイミングで実行する。ここで、音声テキスト化処理23004乃至テキスト音声化処理23006は、携帯情報端末700の内部で行ってもよいし、インターネット上のサーバ装置において行ってもよい。
【0163】
翻訳後の字幕または音声は、コンテンツに元より含まれてはいないデータであるため、ユーザへの提供タイミングは
図16に示す動作シーケンスのように厳密な同期は取れないが、コンテンツの映像と大まかに同期が取れているのが望ましい。そのため、音声テキスト化処理23004乃至テキスト音声化処理23006が長い処理時間を要するようであれば、処理時間の最大値を予め見積もる。そして、S104の処理における同期制御では前記処理時間の最大値を考慮し、
図16に示すS10406の処理で前記処理時間の最大値、すなわち受信音声を確認(S10403)してから翻訳を行い実際に出力(S106)されるまでの時間を考慮して入力音声との時刻差を計算してもよい。
【0164】
図21に示す設定はあくまで一例であり、例えばテキストベースの翻訳処理ではなく、音声から音声への翻訳が可能な音声ベースの翻訳処理の適用も許容する。
【0165】
以上説明したように、本発明では、一種類以上の音声や一種類以上の字幕のいずれかを用いて翻訳を行い、ユーザが理解可能な言語の音声または字幕を提供可能な音声連携再生システムを実現可能とする。
【0166】
以上、本発明の実施形態の例を、実施例1~8を用いて説明したが、言うまでもなく、本発明の技術を実現する構成は前記実施例に限られるものではなく、様々な変形例が考えられる。例えば、ある実施例の構成の一部を他の実施例の構成と置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。これらは全て本発明の範疇に属するものである。また、文中や図中に現れる数値やメッセージ等もあくまでも一例であり、異なるものを用いても本発明の効果を損なうことはない。
【0167】
例えば、携帯情報端末700は、近距離無線通信手段(例えば、ビーコン等)を用いて、携帯情報端末700とコンテンツ表示装置100との距離を算出して、算出した結果に基づいて、受信した音声データを出力する音量の制御するようにしてもよい。例えば、携帯情報端末700は、距離に応じた音量を定めた情報を記憶しておき、当該情報を参照して、算出した距離に対応する音量を特定し、当該音量で音声データを出力するようにしてもよい。
【0168】
この場合、携帯情報端末700は、距離が長い場合に音量を高めるようにすれば、コンテンツ表示装置100と離れていても、携帯情報端末700から高い音量で音声データを出力するので、視聴環境を向上させることができる。
【0169】
また、コンテンツ表示装置100は、受信対象のコンテンツの変更を受け付けた場合、変更後のコンテンツの音声データを携帯情報端末700へ送信するようにしてもよい。また、コンテンツ表示装置100は、受信対象のコンテンツの変更を受け付けた場合、変更前のコンテンツを携帯情報端末700へ送信するようにしてもよい。
【0170】
なお、コンテンツ表示装置100が、受信対象のコンテンツの変更を受け付けた場合において、当該変更に応じて携帯情報端末700へ送信する音声データを変えるか否かを予め定めておいてもよいし、携帯情報端末700へ問い合わせるようにしてもよい。
【0171】
前述した本発明の機能等は、それらの一部または全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、マイクロプロセッサユニット等がそれぞれの機能等を実現する動作プログラムを解釈して実行することによりソフトウェアで実現してもよい。ハードウェアとソフトウェアを併用してもよい。
【0172】
また、図中に示した制御線や情報線は説明上必要と考えられるものを示しており、必ずしも製品上の全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
【0173】
また、図中に示した制御線や情報線は説明上必要と考えられるものを示しており、必ずしも製品上の全ての制御線や情報線を示しているとは限らない。実際にはほとんど全ての構成が相互に接続されていると考えてもよい。
【符号の説明】
【0174】
100…コンテンツ表示装置、100a…アンテナ、100b…外部送信装置、100b1…主制御部、100b2…システムバス、100b3…音声入力部、100b4…外部信号送信部、101…主制御部、102…システムバス、103…外部通信部、131…チューナ/復調部、132…分離部、173…映像表示部、174…スピーカ、200…インターネット、210…ルータ装置、300t…放送局の電波塔、600b…移動体電話通信網の基地局、700…携帯情報端末、701…主制御部、702…システムバス、720…通信処理部、721…LAN通信部、722…移動体電話網通信部、723…NFC通信部、730…操作部、740…画像処理部、741…表示部、742…画像信号処理部、743…第一画像入力部、744…第二画像入力部、750…音声処理部、751…スピーカ音声出力部、752…ヘッドフォン音声出力部、753…音声信号処理部、754…音声入力部。