(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-10-24
(45)【発行日】2024-11-01
(54)【発明の名称】ロボットに備えたデータ送受信装置及びプログラム
(51)【国際特許分類】
H04L 67/50 20220101AFI20241025BHJP
G10L 13/00 20060101ALI20241025BHJP
【FI】
H04L67/50
G10L13/00 100V
(21)【出願番号】P 2021016019
(22)【出願日】2021-02-03
【審査請求日】2024-01-04
(73)【特許権者】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】100121119
【氏名又は名称】花村 泰伸
(72)【発明者】
【氏名】山本 正男
(72)【発明者】
【氏名】西村 敏
【審査官】小林 義晴
(56)【参考文献】
【文献】国際公開第2020/202354(WO,A1)
【文献】萩尾勇太,他9名,人と一緒にテレビを視聴するコミュニケーションロボットの試作と検証,電子情報通信学会技術研究報告 Vol.119 No.445,日本,一般社団法人電子情報通信学会,2020年02月26日,第119巻,第445号,pp.7-12
(58)【調査した分野】(Int.Cl.,DB名)
H04L 67/00
G10L 13/00
(57)【特許請求の範囲】
【請求項1】
第1の場所に、第1のディスプレイに表示された映像を視聴する第1のユーザ、及び前記映像に関連するキーワードに基づいた発話を行う第1のロボットが存在し、前記第1の場所とは異なる第2の場所に、第2のディスプレイに表示された前記映像を視聴する第2のユーザ、及び前記映像に関連する前記キーワードに基づいた発話を行う第2のロボットが存在し、前記第1のユーザ及び前記第2のユーザが同一の前記キーワードに基づいた発話を聞いて会話を行う際の、前記第1のロボットに備えたデータ送受信装置と、前記第2のロボットに備えた遠隔データ送受信装置と、クラウドサーバとがインターネットを介して接続されるデータ送受信システムの下で、
前記データ送受信装置及び前記遠隔データ送受信装置のそれぞれが、前記映像のデータファイルを映像ファイルとして取得し、前記映像ファイルを前記クラウドサーバへ送信し、前記クラウドサーバから前記キーワードを受信する場合の前記データ送受信装置において、
前記第1のユーザによる発声のデータファイルを第1の発声ファイルとして取得し、前記第1の発声ファイルを前記遠隔データ送受信装置へ送信し、前記遠隔データ送受信装置から、前記第2のユーザによる発声のデータファイルを第2の発声ファイルとして受信し、
前記映像ファイルを前記クラウドサーバへ送信してから前記キーワードを受信するまでの間の、当該データ送受信装置における前記インターネットの混雑度合いを反映した時間情報Taを算出し、前記時間情報Taを前記遠隔データ送受信装置へ送信し、前記遠隔データ送受信装置から、前記遠隔データ送受信装置における前記インターネットの混雑度合いを反映した時間情報Tbを受信し、
前記時間情報Ta及び前記時間情報Tbに基づいて、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置よりも高いと判断した場合、前記映像ファイルの前記クラウドサーバへの送信を停止し、前記遠隔データ送受信装置から、前記遠隔データ送受信装置が前記クラウドサーバから受信した前記キーワードを受信する送受信処理部と、
前記送受信処理部により受信された前記第2の発声ファイルを再生する発声再生部と、
前記送受信処理部により受信された前記キーワードに基づいた発話文を再生する発話文再生部と、
を備えたことを特徴とするデータ送受信装置。
【請求項2】
請求項1に記載のデータ送受信装置において、
前記送受信処理部は、
前記時間情報Tbから前記時間情報Taを減算することで、時間情報Tを求め、
前記時間情報Tの値が0よりも小さい場合、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置よりも高いと判断し、前記映像ファイルの前記クラウドサーバへの送信を停止し、前記遠隔データ送受信装置から、前記遠隔データ送受信装置が前記クラウドサーバから受信した前記キーワードを受信する第1の処理を行い、
前記時間情報Tの値が0よりも大きい場合、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置よりも低いと判断し、前記映像ファイルを取得して前記クラウドサーバへ送信し、前記クラウドサーバから前記キーワードを受信する第2の処理を行い、
前記時間情報Tの値が0である場合、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置と同じであると判断し、前記第1の処理または前記第2の処理を行う、ことを特徴とするデータ送受信装置。
【請求項3】
請求項2に記載のデータ送受信装置において、
前記送受信処理部は、
前記時間情報Tの値が0よりも小さい場合、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置よりも高いと判断し、前記映像ファイルの前記クラウドサーバへの送信を停止し、前記遠隔データ送受信装置から、前記遠隔データ送受信装置が前記クラウドサーバから受信した前記キーワードを受信し、予め設定された時間待機した後に、前記映像ファイルを取得して前記クラウドサーバへ送信し、前記クラウドサーバから前記キーワードを受信する前記第1の処理を行う、ことを特徴とするデータ送受信装置。
【請求項4】
請求項1に記載のデータ送受信装置において、
前記送受信処理部は、
前記時間情報Tbから前記時間情報Taを減算することで、時間情報Tを求め、
前記時間情報Tの値が0よりも小さい場合、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置よりも高いと判断し、前記映像ファイルの前記クラウドサーバへの送信を停止し、前記遠隔データ送受信装置から、前記遠隔データ送受信装置が前記クラウドサーバから受信した前記キーワードを受信し、予め設定された値をNとして時間Nの間待機した後に、前記映像ファイルを取得して前記クラウドサーバへ送信し、前記クラウドサーバから前記キーワードを受信し、前記時間情報Taを算出し、前記映像ファイルを取得したときから前記時間Nの間待機した後に、前記遠隔データ送受信装置から前記時間情報Tbを受信し、前記時間情報Tを求める第3の処理を行い、
前記時間情報Tの値が0よりも大きい場合、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置よりも低いと判断し、前記映像ファイルを取得して前記クラウドサーバへ送信し、前記クラウドサーバから前記キーワードを受信し、前記時間情報Taを算出し、前記映像ファイルを取得したときから前記時間Nの間待機した後に、前記遠隔データ送受信装置から前記時間情報Tbを受信し、前記時間情報Tを求める第4の処理を行い、
前記時間情報Tの値が0である場合、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置と同じであると判断し、前記第3の処理または前記第4の処理を行う、ことを特徴とするデータ送受信装置。
【請求項5】
請求項4に記載のデータ送受信装置において、
前記送受信処理部は、
前記時間情報Tの絶対値が予め設定された閾値よりも大きい場合、前記時間Nを、予め設定された前記値よりも大きい値に設定し、前記時間情報Tの絶対値が前記閾値以下である場合、予め設定された前記値を前記時間Nに設定する、ことを特徴とするデータ送受信装置。
【請求項6】
請求項1から5までのいずれか一項に記載のデータ送受信装置において、
前記発話文再生部は、
前記発話文の再生を開始する際に、前記送受信処理部により前記第1の発声ファイルが取得中である場合、前記第1の発声ファイルの取得が完了するまで待機し、または前記発声再生部により前記第2の発声ファイルが再生中である場合、前記第2の発声ファイルの再生が完了するまで待機し、待機した後に前記発話文を再生する、ことを特徴とするデータ送受信装置。
【請求項7】
コンピュータを、請求項1から6までのいずれか一項に記載のデータ送受信装置として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、発話を行うロボットに備えたデータ送受信装置及びプログラムに関する。
【背景技術】
【0002】
従来、人と一緒にテレビを視聴するテレビ視聴ロボットが知られている(例えば、非特許文献1を参照)。このテレビ視聴ロボットは、周辺のテレビ及び人を検出し、番組に関連する発話文を生成して発話する。これにより、人は、テレビ視聴ロボットの発話を聞くことで、一人でテレビを視聴している場合であっても、複数人で視聴しているかのようにテレビ視聴を楽しむことができる。
【0003】
また、テレビ視聴ロボット(以下、「ロボット」という。)の発話に伴い、人同士の会話の活性化効果及びテレビ視聴への影響等を検証するためのロボット開発が進められている(例えば、非特許文献2を参照)。これは、「人が2人及びロボットが1体」の組み合わせでテレビを視聴している状態において、ロボットが番組に関連するキーワードを発話することで、検証を行うものである。
【0004】
一方、新型コロナウイルス感染症の流行による外出自粛及びソーシャルディスタンスをとること等が新しい生活習慣として定着するに連れて、友人または知人等の複数の人がテレビを一緒に視聴する機会が減る傾向にあることが予想される。このため、前述の非特許文献2のロボット開発においては、「人が2人及びロボットが1体」の組み合わせの機会が減ることを考慮する必要がある。
【0005】
また、新しい生活習慣では、人同士のコミュニケーション手段として、Zoom(登録商標)等のインターネットを介したリモート会議ツールが急速に普及している。
【0006】
これらを考慮すると、「人が1人及びロボットが1体」の組み合わせと別の「人が1人及びロボットが1体」の組み合わせとのペアにおいて、人同士がインターネットを介して会話する環境形態を想定することができる。
【0007】
具体的には、離れた場所にいる2つの組み合わせのペアにおいて、同じテレビ番組または動画を視聴しながら会話を楽しみ、さらに、ロボットが視聴中の番組内容等に関連する発話を行うことで、人同士の会話をさらに弾ませる状態を想定することができる。
【0008】
前述の非特許文献2には、ロボットに視聴中の番組内容に関する発話を行わせる手段が記載されている。この発話手段は、Microsoft Azure(AZURE(登録商標))またはAmazon Web Services(アマゾンウェブサービス(登録商標))等のクラウドサービスを用いて、視聴中の番組の映像に関するキャプション生成、有名人検索及び画像ラベル検出を並列に行う。そして、発話手段は、これらの結果に基づいて、予め用意したキーワード辞書に含まれる単語をキーワードとして出力する。
【0009】
すなわち、ロボットからクラウドサービスへの上り回線には映像が送信され、クラウドサービスからロボットへの下り回線にはキャプション、有名人名及び画像ラベル等のテキスト情報(映像に関連するキーワード)が送信される。この場合、上り回線のトラフィック量は大きく、下り回線のトラフィックは小さいという特徴がある。
【先行技術文献】
【非特許文献】
【0010】
【文献】星祐太、“テレビ視聴ロボット”、NHK放送技術研究所、技研だより、2017年10月号
【文献】萩尾勇太、“人と一緒にテレビを視聴するコミュニケーションロボットの試作と検証”、電子情報通信学会技術研究報告、vol.119、no.446、BioX2019-63、CNR2019-46、2020、pp.7-12
【発明の概要】
【発明が解決しようとする課題】
【0011】
前述の「人が1人及びロボットが1体」の組み合わせと別の「人が1人及びロボットが1体」の組み合わせとのペアからなる環境形態においては、各組み合わせは、同じ番組または動画を視聴する。このため、各組み合わせのロボットは、上り回線を用いてクラウドサービスに対し、同じ映像ファイルを送信する。これでは、クラウドサービスにかかるコストの観点から、無駄が生じることとなる。
【0012】
この問題を解決するために、一方のロボットが、映像ファイルをクラウドサービスへ送信してテキスト情報を受信し、受信したテキスト情報を他方のロボットへ送信する手法が想定される。これにより、クラウドサービスにかかるコストを半減することができる。
【0013】
しかしながら、一方のロボットのインターネット接続環境と、他方のロボットのインターネット接続環境とが異なる場合には、両ロボット間でテキスト情報の共有が遅れ、視聴中の映像とロボットの発話内容とがずれてしまう可能性がある。
【0014】
例えば、一方のロボットが、映像ファイルをクラウドサービスへ送信してテキスト情報を受信し、テキスト情報を他方のロボットへ送信する状況において、一方のロボットに接続されたインターネットサービスプロバイダ等で輻輳が生じた場合を想定する。
【0015】
この場合、一方のロボットから送信された映像ファイルのクラウドサービスへの到着が遅れてしまい、一方のロボットによるテキスト情報の受信が遅れ、他方のロボットによる一方のロボットからのテキスト情報の受信も遅れてしまう。結果として、両ロボット間でテキスト情報の共有が遅れ、ロボットの発話のタイミングが遅れてしまう。
【0016】
このロボットの発話内容は、人が以前の時間に視聴した映像に関するものであるため、発話のタイミングが遅れれば遅れるほど、視聴中の映像に対して的はずれとなってしまい、人同士の会話の活性化効果が得られ難いという課題があった。
【0017】
そこで、本発明は前記課題を解決するためになされたものであり、その目的は、クラウドサービスにかかるコストを低減すると共に、ロボットの発話のタイミングの遅れを抑制可能なデータ送受信装置及びプログラムを提供することにある。
【課題を解決するための手段】
【0018】
前記課題を解決するために、請求項1のデータ送受信装置は、第1の場所に、第1のディスプレイに表示された映像を視聴する第1のユーザ、及び前記映像に関連するキーワードに基づいた発話を行う第1のロボットが存在し、前記第1の場所とは異なる第2の場所に、第2のディスプレイに表示された前記映像を視聴する第2のユーザ、及び前記映像に関連する前記キーワードに基づいた発話を行う第2のロボットが存在し、前記第1のユーザ及び前記第2のユーザが同一の前記キーワードに基づいた発話を聞いて会話を行う際の、前記第1のロボットに備えたデータ送受信装置と、前記第2のロボットに備えた遠隔データ送受信装置と、クラウドサーバとがインターネットを介して接続されるデータ送受信システムの下で、前記データ送受信装置及び前記遠隔データ送受信装置のそれぞれが、前記映像のデータファイルを映像ファイルとして取得し、前記映像ファイルを前記クラウドサーバへ送信し、前記クラウドサーバから前記キーワードを受信する場合の前記データ送受信装置において、前記第1のユーザによる発声のデータファイルを第1の発声ファイルとして取得し、前記第1の発声ファイルを前記遠隔データ送受信装置へ送信し、前記遠隔データ送受信装置から、前記第2のユーザによる発声のデータファイルを第2の発声ファイルとして受信し、前記映像ファイルを前記クラウドサーバへ送信してから前記キーワードを受信するまでの間の、当該データ送受信装置における前記インターネットの混雑度合いを反映した時間情報Taを算出し、前記時間情報Taを前記遠隔データ送受信装置へ送信し、前記遠隔データ送受信装置から、前記遠隔データ送受信装置における前記インターネットの混雑度合いを反映した時間情報Tbを受信し、前記時間情報Ta及び前記時間情報Tbに基づいて、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置よりも高いと判断した場合、前記映像ファイルの前記クラウドサーバへの送信を停止し、前記遠隔データ送受信装置から、前記遠隔データ送受信装置が前記クラウドサーバから受信した前記キーワードを受信する送受信処理部と、前記送受信処理部により受信された前記第2の発声ファイルを再生する発声再生部と、前記送受信処理部により受信された前記キーワードに基づいた発話文を再生する発話文再生部と、を備えたことを特徴とする。
【0019】
また、請求項2のデータ送受信装置は、請求項1に記載のデータ送受信装置において、前記送受信処理部が、前記時間情報Tbから前記時間情報Taを減算することで、時間情報Tを求め、前記時間情報Tの値が0よりも小さい場合、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置よりも高いと判断し、前記映像ファイルの前記クラウドサーバへの送信を停止し、前記遠隔データ送受信装置から、前記遠隔データ送受信装置が前記クラウドサーバから受信した前記キーワードを受信する第1の処理を行い、前記時間情報Tの値が0よりも大きい場合、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置よりも低いと判断し、前記映像ファイルを取得して前記クラウドサーバへ送信し、前記クラウドサーバから前記キーワードを受信する第2の処理を行い、前記時間情報Tの値が0である場合、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置と同じであると判断し、前記第1の処理または前記第2の処理を行う、ことを特徴とする。
【0020】
また、請求項3のデータ送受信装置は、請求項2に記載のデータ送受信装置において、前記送受信処理部が、前記時間情報Tの値が0よりも小さい場合、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置よりも高いと判断し、前記映像ファイルの前記クラウドサーバへの送信を停止し、前記遠隔データ送受信装置から、前記遠隔データ送受信装置が前記クラウドサーバから受信した前記キーワードを受信し、予め設定された時間待機した後に、前記映像ファイルを取得して前記クラウドサーバへ送信し、前記クラウドサーバから前記キーワードを受信する前記第1の処理を行う、ことを特徴とする。
【0021】
また、請求項4のデータ送受信装置は、請求項1に記載のデータ送受信装置において、前記送受信処理部が、前記時間情報Tbから前記時間情報Taを減算することで、時間情報Tを求め、前記時間情報Tの値が0よりも小さい場合、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置よりも高いと判断し、前記映像ファイルの前記クラウドサーバへの送信を停止し、前記遠隔データ送受信装置から、前記遠隔データ送受信装置が前記クラウドサーバから受信した前記キーワードを受信し、予め設定された値をNとして時間Nの間待機した後に、前記映像ファイルを取得して前記クラウドサーバへ送信し、前記クラウドサーバから前記キーワードを受信し、前記時間情報Taを算出し、前記映像ファイルを取得したときから前記時間Nの間待機した後に、前記遠隔データ送受信装置から前記時間情報Tbを受信し、前記時間情報Tを求める第3の処理を行い、前記時間情報Tの値が0よりも大きい場合、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置よりも低いと判断し、前記映像ファイルを取得して前記クラウドサーバへ送信し、前記クラウドサーバから前記キーワードを受信し、前記時間情報Taを算出し、前記映像ファイルを取得したときから前記時間Nの間待機した後に、前記遠隔データ送受信装置から前記時間情報Tbを受信し、前記時間情報Tを求める第4の処理を行い、前記時間情報Tの値が0である場合、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置と同じであると判断し、前記第3の処理または前記第4の処理を行う、ことを特徴とする。
【0022】
また、請求項5のデータ送受信装置は、請求項4に記載のデータ送受信装置において、前記送受信処理部が、前記時間情報Tの絶対値が予め設定された閾値よりも大きい場合、前記時間Nを、予め設定された前記値よりも大きい値に設定し、前記時間情報Tの絶対値が前記閾値以下である場合、予め設定された前記値を前記時間Nに設定する、ことを特徴とする。
【0023】
また、請求項6のデータ送受信装置は、請求項1から5までのいずれか一項に記載のデータ送受信装置において、前記発話文再生部が、前記発話文の再生を開始する際に、前記送受信処理部により前記第1の発声ファイルが取得中である場合、前記第1の発声ファイルの取得が完了するまで待機し、または前記発声再生部により前記第2の発声ファイルが再生中である場合、前記第2の発声ファイルの再生が完了するまで待機し、待機した後に前記発話文を再生する、ことを特徴とする。
【0024】
さらに、請求項7のプログラムは、コンピュータを、請求項1から6までのいずれか一項に記載のデータ送受信装置として機能させることを特徴とする。
【発明の効果】
【0025】
以上のように、本発明によれば、クラウドサービスにかかるコストを低減すると共に、ロボットの発話のタイミングの遅れを抑制することができる。
【図面の簡単な説明】
【0026】
【
図1】本発明の実施形態によるデータ送受信装置を含むデータ送受信システムを説明する概念図である。
【
図2】本発明の実施形態によるデータ送受信装置の構成例を示すブロック図である。
【
図3】送受信処理部の構成例を示すブロック図である。
【
図4】送信制御部の処理例を示すフローチャートである。
【
図5】送受信処理部による映像ファイルの送信、送信停止及び送信再開処理等の例を示すフローチャートである。
【
図6】送受信処理部による映像ファイルの送信、送信停止及び送信再開処理等の例のタイミングを説明する図である。
【
図7】データ送受信装置による映像ファイルのアップロード送信期間を説明するイメージ図である。
【
図8】両方のデータ送受信装置のアップロードトラフィックが発生する期間T1,T3,T5のデータフロー(a)を説明する図である。
【
図9】一方のデータ送受信装置のアップロードトラフィックが発生しない期間T2,T4のデータフロー(b)を説明する図である。
【
図10】他方のデータ送受信装置のアップロードトラフィックが発生しない期間T6のデータフロー(c)を説明する図である。
【発明を実施するための形態】
【0027】
以下、本発明を実施するための形態について図面を用いて詳細に説明する。
〔データ送受信システム〕
まず、データ送受信システムについて説明する。
図1は、本発明の実施形態によるデータ送受信装置を含むデータ送受信システムを説明する概念図である。
【0028】
このデータ送受信システム1は、場所A(第1の場所)に設置されたデータ送受信装置2、場所B(第2の場所)に設置されたデータ送受信装置(遠隔データ送受信装置)3、及びクラウド上に設置されたクラウドサーバ4を備えて構成される。データ送受信装置2,3及びクラウドサーバ4は、インターネット30を介して接続される。
【0029】
場所Aは、データ送受信装置2を備えたロボット(第1のロボット)11、人(第1のユーザ)12及びディスプレイ(第1のディスプレイ)13が存在する環境である。場所Bは、データ送受信装置3を備えたロボット(第2のロボット)21、人(第2のユーザ)22及びディスプレイ(第2のディスプレイ)23が存在する環境である。
【0030】
場所Aに存在するディスプレイ13及び場所Bに存在するディスプレイ23には、同一の映像が表示される。映像は、例えばテレビ番組、動画である。人12,22は、友人、知人、親子等の会話の対象人物である。
【0031】
場所Aに存在する人12(及びロボット11)は、ディスプレイ13に表示された映像を視聴し、場所Bに存在する人22(及びロボット21)は、ディスプレイ23に表示された映像を視聴する。ロボット11は、ディスプレイ13に表示された映像に関連するキャプション、有名人名及び画像ラベル等のテキスト情報(以下、「キーワード」という。)に基づいた発話を行い、ロボット21は、ディスプレイ23に表示された映像に関連するキーワードに基づいた発話を行う。
【0032】
人12は、ロボット11による映像(ディスプレイ13に表示された映像)に関連するキーワードに基づいた発話を聞きながら、遠隔の場所Bに存在する人22と会話を行う。同様に、人22は、ロボット21による映像(ディスプレイ23に表示された映像)に関連するキーワードに基づいた発話を聞きながら、遠隔の場所Aに存在する人12と会話を行う。つまり、人12,22は、それぞれロボット11,21による同一の映像に関連する同一のキーワードに基づいた発話を聞きながら、会話を行う。
【0033】
データ送受信装置2は、データ送受信装置3よりもインターネット30の接続環境が良い場合(混雑度合いが低い場合)、ディスプレイ13に表示された映像に関する映像ファイルを、インターネット30を介してクラウドサーバ4へ送信する。そして、データ送受信装置2は、クラウドサーバ4から映像ファイルの映像に関連するキーワードを受信する。データ送受信装置2は、受信したキーワード及び人12の発声ファイル(第1の発声ファイル)等を、インターネット30を介してデータ送受信装置3へ送信する。
【0034】
一方、データ送受信装置2は、データ送受信装置3よりもインターネット30の接続環境が良くない場合(混雑度合いが高い場合)、データ送受信装置3から、映像ファイルの映像に関連するキーワードを受信する。また、データ送受信装置2は、データ送受信装置3から人22の発声ファイル(第2の発声ファイル)等を受信する。
【0035】
データ送受信装置2は、クラウドサーバ4またはデータ送受信装置3からキーワードを受信すると、キーワードに基づいた発話文をロボット11の発話として再生し、データ送受信装置3から人22の発声ファイルを受信すると、人22の発声を再生する。
【0036】
これにより、場所Aに存在する人12は、ディスプレイ13に表示された映像に関連するキーワードに基づいた発話をロボット11の発話として聞くことができ、場所Bに存在する人22の発声も聞くことができる。つまり、人12は、映像に関連する情報を得ながら、人22と会話を行うことができる。
【0037】
データ送受信装置3は、データ送受信装置2と同様の処理を行う。これにより、場所Bに存在する人22は、ディスプレイ23に表示された映像に関連するキーワードに基づいた発話をロボット21の発話として聞くことができ、場所Aに存在する人12の発声も聞くことができる。つまり、人22は、映像に関連する情報を得ながら、人12と会話を行うことができる。データ送受信装置2,3の詳細については後述する。
【0038】
クラウドサーバ4は、データ送受信装置2から送信された映像ファイルを、インターネット30を介して受信し、例えばキャプション生成、有名人検索、画像ラベル検出等を並列に処理する。そして、クラウドサーバ4は、処理結果の中から、例えば予め設定されたキーワード辞書に含まれる単語をキーワードとして設定し、映像ファイルの映像に関連するキーワードとして、映像ファイルを送信してきたデータ送受信装置2へ送信する。
【0039】
クラウドサーバ4は、データ送受信装置3から映像ファイルを受信した場合も同様の処理を行い、映像ファイルの映像に関連するキーワードを、映像ファイルを送信してきたデータ送受信装置3へ送信する。
【0040】
〔データ送受信装置〕
次に、
図1に示したデータ送受信装置2,3について詳細に説明する。
図2は、本発明の実施形態によるデータ送受信装置2,3の構成例を示すブロック図である。
【0041】
このデータ送受信装置2は、映像取得部51、映像ファイル生成部52、発声取得部53、発声ファイル生成部54、遠隔発声再生部(発声再生部)55、発話文生成部56、テンプレート保持部57、発話文再生部58及び送受信処理部59を備えている。尚、データ送受信装置3の構成は、
図2に示すデータ送受信装置2の構成と同様である。
【0042】
映像取得部51は、ディスプレイ13に表示された映像のデータを取得するカメラであり、映像のデータを取得して映像ファイル生成部52に転送する。映像ファイル生成部52は、映像取得部51から転送された映像のデータを入力し、クラウドサーバ4が処理する映像ファイル形式の映像のデータファイルを生成し、これを映像ファイルとして送受信処理部59に出力する。映像ファイル形式は、例えばMP4である。
【0043】
発声取得部53は、人12の発声を取得するマイクであり、発声のデータを取得して発声ファイル生成部54に転送する。発声ファイル生成部54は、発声取得部53から転送された発声のデータを入力し、一般的な音声ファイル形式の発声のデータファイルを生成し、これを発声ファイルとして送受信処理部59に出力する。音声ファイル形式は、例えばMP3である。
【0044】
遠隔発声再生部55は、送受信処理部59から転送された後述する遠隔発声ファイルを入力し、遠隔発声ファイルを再生する。
【0045】
遠隔発声ファイルは、場所Bに存在する人22の発声のデータから生成された発声ファイルである。これにより、場所Aに存在する人12は、場所Bに存在する人22の発声を聞くことができる。
【0046】
尚、遠隔発声再生部55は、スピーカの機能を有するようにしてもよい。この場合、場所Bに存在する人22の発声が、ロボット11に備えたデータ送受信装置2の遠隔発声再生部55からなされることとなる。
【0047】
また、遠隔発声再生部55は、スピーカの機能を有していなくてもよい。この場合のスピーカは、データ送受信装置2とは独立して外部に設置される。遠隔発声再生部55は、例えばブルートゥース(登録商標)等の通信手段を介して、遠隔発声ファイルを外部のスピーカへ送信し、外部のスピーカは、遠隔発声ファイルを受信して再生を行う。外部のスピーカとしては、例えばスマートフォン、タブレット等のモバイル端末のスピーカ機能が用いられる。モバイル端末は、場所Bに存在する人22の顔を画面表示しながら、人22の発声の遠隔発声ファイルを受信して再生を行うようにしてもよい。
【0048】
これにより、場所Bに存在する人22の発声が、ロボット11とは離れた箇所に設置されたスピーカからなされることとなり、人12は、場所Bに存在する人22の発声と、ロボット11の発話とを容易に区別することができる。
【0049】
発話文生成部56は、送受信処理部59から転送されたキーワード(映像ファイルの映像に関連するキーワード)を入力すると共に、テンプレート保持部57からテンプレートを読み出し、キーワード及びテンプレートを組み合わせることで、発話文を生成する。そして、発話文生成部56は、発話文を発話文再生部58に出力する。
【0050】
テンプレート保持部57は、文章の述語等のテンプレートを保持する。発話文再生部58は、発話文生成部56から発話文を入力し、発話文を再生する。これにより、場所Aに存在する人12は、場所Aに存在するロボット11の発話(ディスプレイ13に表示された映像に関する情報)を聞くことができる。
【0051】
例えば発話文生成部56が入力したキーワードがドラマの出演者名「〇○××」であり、テンプレートが「ですよ」である場合、発話文生成部56は、発話文「○○××ですよ」を生成する。テンプレート保持部57は、例えば「ですよ」、「ですか」、「だね」等のテンプレートを保持する。
【0052】
尚、発話文生成部56による発話文生成処理としては、例えば以下の非特許文献に記載された技術が用いられる。
[非特許文献]
金子豊、外2名、“テレビ視聴ロボットにおける字幕文内キーワードに基づく発話生成手法”、[online]、映像情報メディア学会、[令和3年1月11日検索]、インターネット<https://www.jstage.jst.go.jp/article/iteac/2017/0/2017_32B-4/_pdf>
【0053】
また、発話文生成部56は、テンプレート保持部57に保持されたテンプレートをランダムに選択し、キーワード及びテンプレートを組み合わせることで、発話文を生成するようにしてもよい。
【0054】
送受信処理部59は、映像ファイル生成部52から映像ファイルを入力すると共に、発声ファイル生成部54から発声ファイルを入力する。送受信処理部59は、発声ファイルをデータ送受信装置3へ送信し、データ送受信装置3から遠隔発声ファイルを受信し、遠隔発声ファイルを遠隔発声再生部55に転送する。
【0055】
送受信処理部59は、映像ファイルをクラウドサーバ4へ送信し、クラウドサーバ4からキーワードを受信することで、ラウンドトリップタイムに相当する時間情報Taを算出する。そして、送受信処理部59は、時間情報Ta(遠隔時間情報Tb)をデータ送受信装置3へ送信する。時間情報Taは、データ送受信装置2におけるインターネット30の混雑度合いを反映した情報である。
【0056】
送受信処理部59は、データ送受信装置3から、データ送受信装置3におけるラウンドトリップタイムに相当する遠隔時間情報Tbを受信する。そして、送受信処理部59は、遠隔時間情報Tbから時間情報Taを減算し、減算結果に基づいてデータ送受信装置2,3間のインターネット30の混雑度合いを判定する。遠隔時間情報Tbは、データ送受信装置3におけるインターネット30の混雑度合いを反映した情報である。
【0057】
送受信処理部59は、当該データ送受信装置2におけるインターネット30の混雑度合いがデータ送受信装置3よりも低いと判定した場合、クラウドサーバ4への映像ファイルの送信処理、及びクラウドサーバ4からのキーワードの受信処理を継続する。送受信処理部59は、クラウドサーバ4から受信したキーワードを発話文生成部56に転送し、データ送受信装置3からのリクエストに従い、キーワードをデータ送受信装置3へ送信する。
【0058】
一方、送受信処理部59は、当該データ送受信装置2におけるインターネット30の混雑度合いがデータ送受信装置3よりも高いと判定した場合、クラウドサーバ4への映像ファイルの送信処理を停止する。そして、送受信処理部59は、データ送受信装置3へリクエストを送信することで、データ送受信装置3からキーワードを受信し、キーワードを発話文生成部56に転送する。
【0059】
〔送受信処理部59〕
次に、
図2に示したデータ送受信装置2,3に備えた送受信処理部59について詳細に説明する。
図3は、送受信処理部59の構成例を示すブロック図である。
【0060】
この送受信処理部59は、映像ファイル取得部60、キーワード転送部61、時計62、時間算出部63、時間比較部64、遠隔発声ファイル受信部65、キーワード受信時刻取得部66、キーワード受信部67、キーワード送信部68、映像ファイル送信時刻取得部69、送信制御部70、発声ファイル送信部71、映像ファイル送信部72、遠隔時間情報取得部73及び時間情報送信部74を備えている。
【0061】
映像ファイル取得部60は、映像ファイル生成部52から映像ファイルを取得し、映像ファイルを映像ファイル送信部72に転送する。これにより、映像ファイルは、映像ファイル送信部72からクラウドサーバ4へ送信される。
【0062】
キーワード転送部61は、キーワード受信部67からキーワードを入力し、キーワードを発話文生成部56に転送する。キーワードは、キーワード受信部67によりクラウドサーバ4または遠隔の場所Bに設置されたデータ送受信装置3から受信される。
【0063】
これにより、キーワードは、ディスプレイ13に表示されている映像に関連するキーワードとして、発話文生成部56、テンプレート保持部57及び発話文再生部58により、ロボット11の発話文として再生される。
【0064】
時計62は、当該データ送受信装置2における時刻をカウントする。時間算出部63は、映像ファイル送信時刻取得部69から送信開始時刻t1を入力すると共に、キーワード受信時刻取得部66から受信完了時刻t2を入力する。送信開始時刻t1は、映像ファイル送信部72が映像ファイルをクラウドサーバ4へ送信した時刻であり、受信完了時刻t2は、キーワード受信部67がキーワードをクラウドサーバ4から受信した時刻である。
【0065】
時間算出部63は、以下の式にて、受信完了時刻t2から送信開始時刻t1を減算することで、当該データ送受信装置2が映像ファイルを送信してからキーワードを受信するまでの間の時間情報Ta(ラウンドトリップタイムに相当)を求める。そして、時間算出部63は、時間情報Taを時間比較部64に出力する。
[数1]
Ta=t2-t1 ・・・(1)
【0066】
時間比較部64は、時間算出部63から時間情報Taを入力すると共に、遠隔時間情報取得部73から遠隔時間情報Tbを入力する。遠隔時間情報Tbは、遠隔の場所Bに設置されたデータ送受信装置3において、当該データ送受信装置2と同様の処理により前記式(1)にて算出された時間情報Taであり、遠隔時間情報取得部73によりデータ送受信装置3から受信される。
【0067】
時間比較部64は、以下の式にて、遠隔時間情報Tbから時間情報Taを減算することで、当該データ送受信装置2におけるインターネット30の混雑度合いを判定するための時間情報T(混雑度合い判定用時間情報T)を求める。
[数2]
T=Tb-Ta ・・・(2)
【0068】
時間比較部64は、混雑度合い判定用時間情報Tを送信制御部70に出力し、時間情報Taを時間情報送信部74に転送する。時間情報Taは、時間情報送信部74によりデータ送受信装置3へ送信され、データ送受信装置3は、当該時間情報Taを遠隔時間情報Tbとして受信する。
【0069】
遠隔発声ファイル受信部65は、データ送受信装置3から人22の発声のデータファイルを遠隔発声ファイルとして受信し、遠隔発声ファイルを遠隔発声再生部55に転送する。
【0070】
これにより、遠隔発声ファイルは、遠隔発声再生部55により、遠隔の場所Bに存在する人22の発声として再生される。
【0071】
キーワード受信時刻取得部66は、キーワード受信部67から、クラウドサーバ4から受信したキーワードの受信タイミングを示す受信完了を入力する。そして、キーワード受信時刻取得部66は、受信完了を入力したときの時刻を時計62から取得し、当該時刻を受信完了時刻t2に設定し、受信完了時刻t2を時間算出部63に出力する。
【0072】
キーワード受信部67は、クラウドサーバ4からキーワードを受信した場合、その受信タイミングを示す受信完了をキーワード受信時刻取得部66に出力すると共に、キーワードをキーワード転送部61及びキーワード送信部68に出力する。
【0073】
キーワード受信部67は、送信制御部70から送信停止指示または送信再開指示を入力する。送信停止指示及び送信再開指示の詳細については後述する。キーワード受信部67は、送信停止指示を入力した場合、例えばキーワードの送信のリクエストをデータ送受信装置3へ送信し、データ送受信装置3からキーワードを受信し、キーワードをキーワード転送部61に出力する。
【0074】
この場合、データ送受信装置3は、データ送受信装置2から当該リクエストを受信すると、当該データ送受信装置3のキーワード送信部68は、クラウドサーバ4から受信したキーワードをデータ送受信装置2へ送信する。
【0075】
一方、キーワード受信部67は、送信制御部70から送信再開指示を入力した場合、前述のデータ送受信装置3へのリクエストの送信処理を停止する。そして、キーワード受信部67は、映像ファイル送信部72により映像ファイルがクラウドサーバ4へ送信された後、クラウドサーバ4からキーワードを受信し、キーワードをキーワード転送部61及びキーワード送信部68に出力する。
【0076】
キーワード送信部68は、キーワード受信部67からキーワードを入力し、キーワードをデータ送受信装置3へ送信する。これにより、クラウドサーバ4から受信したキーワードが、データ送受信装置2からデータ送受信装置3へ送信される。
【0077】
映像ファイル送信時刻取得部69は、映像ファイル送信部72から、クラウドサーバ4へ映像ファイルを送信した送信タイミングを示す送信開始を入力する。そして、映像ファイル送信時刻取得部69は、送信開始を入力したときの時刻を時計62から取得し、当該時刻を送信開始時刻t1に設定し、送信開始時刻t1を時間算出部63に出力する。
【0078】
送信制御部70は、時間比較部64から混雑度合い判定用時間情報Tを入力し、混雑度合い判定用時間情報Tに基づいて、当該データ送受信装置2における混雑度合いを判定する。このデータ送受信装置2における混雑度合いには、当該データ送受信装置2におけるインターネット30の混雑度合いがデータ送受信装置3よりも高い場合、低い場合、及びデータ送受信装置3と同じ場合の3状態がある。
【0079】
送信制御部70は、混雑度合いが高いと判定した場合、映像ファイルの送信処理を停止することを示す送信停止指示を映像ファイル送信部72及びキーワード受信部67に出力する。そして、送信制御部70は、時計62から時刻を取得しながら、予め設定された値をNとして時間Nの間待機し、時間N経過後に、映像ファイルの送信処理を再開することを示す送信再開指示を映像ファイル送信部72及びキーワード受信部67に出力する。
【0080】
図4は、送信制御部70の処理例を示すフローチャートである。送信制御部70は、時間比較部64から混雑度合い判定用時間情報Tを入力したか否かを判定する(ステップS401)。
【0081】
送信制御部70は、ステップS401において、混雑度合い判定用時間情報Tを入力していない場合(ステップS401:N)、混雑度合い判定用時間情報Tを入力するまで待つ。一方、送信制御部70は、ステップS401において、混雑度合い判定用時間情報Tを入力した場合(ステップS401:Y)、ステップS402へ移行する。
【0082】
送信制御部70は、混雑度合い判定用時間情報Tが0よりも小さい(T<0、すなわちTb<Ta)、0よりも大きい(T>0、すなわちTb>Ta)、または0である(T=0、すなわちTb=Ta)を判定する(ステップS402)。
【0083】
送信制御部70は、ステップS402において、混雑度合い判定用時間情報Tが0よりも小さい(T<0、すなわちTb<Ta)と判定した場合、送信停止指示を映像ファイル送信部72及びキーワード受信部67に出力する(ステップS403)。
【0084】
これにより、当該データ送受信装置2におけるインターネット30の混雑度合いがデータ送受信装置3よりも高いものと判断される。つまり、当該データ送受信装置2のラウンドトリップタイムがデータ送受信装置3のラウンドトリップタイムよりも大きいものと判断される。そして、当該データ送受信装置2からクラウドサーバ4への映像ファイルの送信処理が停止し、データ送受信装置3からクラウドサーバ4への映像ファイルの送信処理が行われる。
【0085】
送信制御部70は、ステップS403から移行して、送信停止指示を出力してからの経過時間を時計62から特定する。そして、送信制御部70は、時計62の時刻に基づいて、予め設定された値をNとして時間N(キーワード受信部67が遠隔時間情報Tbの送信のリクエストをデータ送受信装置3へ送信してから時間N)の間待機する(ステップS404)。予め設定された時間Nは、例えば10秒、60秒である。そして、送信制御部70は、経過時間が時間Nに到達したときに、送信再開指示を映像ファイル送信部72及びキーワード受信部67に出力する(ステップS405)。
【0086】
これにより、データ送受信装置2,3におけるインターネット30の混雑度合いの変化に伴い、映像ファイルを送信してキーワードを受信するデータ送受信装置2,3を切り替えることができる。すなわち、混雑度合いの低い方のデータ送受信装置2,3は、時間N毎に、映像ファイルをクラウドサーバ4へ送信し、クラウドサーバ4からキーワードを受信することとなる。
【0087】
一方、送信制御部70は、ステップS402の処理において、混雑度合い判定用時間情報Tが0よりも大きい(T>0、すなわちTb>Ta)と判定した場合、映像ファイル送信部72及びキーワード受信部67に対する通知を行わない。
【0088】
尚、送信制御部70は、映像ファイルの送信処理を継続することを示す送信継続指示を映像ファイル送信部72及びキーワード受信部67に出力するようにしてもよい。
【0089】
これにより、当該データ送受信装置2におけるインターネット30の混雑度合いがデータ送受信装置3よりも低いものと判断される。つまり、当該データ送受信装置2のラウンドトリップタイムがデータ送受信装置3のラウンドトリップタイムよりも小さいものと判断される。そして、当該データ送受信装置2からクラウドサーバ4への映像ファイルの送信処理が継続することとなる。
【0090】
一方、送信制御部70は、ステップS402において、混雑度合い判定用時間情報Tが0である(T=0、すなわちTb=Ta)と判定した場合、前回と同じ処理を行う(ステップS406)。
【0091】
つまり、送信制御部70は、前回のステップS402の処理において、混雑度合い判定用時間情報Tが0よりも小さい(T<0、すなわちTb<Ta)と判定した場合、前述のステップS403~S405の処理を行う。一方、送信制御部70は、前回のステップS402の処理において、混雑度合い判定用時間情報Tが0よりも大きい(T>0、すなわちTb>Ta)と判定した場合、映像ファイル送信部72及びキーワード受信部67に対する通知を行わない。
【0092】
これにより、当該データ送受信装置2におけるインターネット30の混雑度合いがデータ送受信装置3と同じであるものと判断される。つまり、当該データ送受信装置2のラウンドトリップタイムとデータ送受信装置3のラウンドトリップタイムとが同じであると判断される。そして、前回の処理と同様に、データ送受信装置3からクラウドサーバ4への映像ファイルの送信処理が行われるか、または、当該データ送受信装置2からクラウドサーバ4への映像ファイルの送信処理が行われる。
【0093】
尚、送信制御部70は、ステップS402において、混雑度合い判定用時間情報Tが0である(T=0、すなわちTb=Ta)と判定した場合、混雑度合い判定用時間情報Tが0よりも小さい(T<0、すなわちTb<Ta)ときの処理、または混雑度合い判定用時間情報Tが0よりも大きい(T>0、すなわちTb>Ta)ときの処理のうちのいずれか一方を行うようにすればよい。例えば送信制御部70は、これらの処理のうち予め設定された処理を行う。
【0094】
図3に戻って、発声ファイル送信部71は、発声ファイル生成部54から発声ファイルを入力し、発声ファイルをデータ送受信装置3へ送信する。
【0095】
これにより、人12の発声ファイルはデータ送受信装置3へ送信され、データ送受信装置3は、人12の発声ファイルを遠隔発声ファイルとして受信する。
【0096】
映像ファイル送信部72は、映像ファイル取得部60から映像ファイルを入力すると共に、送信制御部70から送信停止指示または送信再開指示を入力する。映像ファイル送信部72は、初期処理の際に、映像ファイルをクラウドサーバ4へ送信する。そして、映像ファイル送信部72は、初期処理の後の時間N毎のタイミングで、映像ファイルをクラウドサーバ4へ送信する処理、送信停止指示を入力した場合の処理、または送信再開指示を入力した場合の映像ファイルをクラウドサーバ4へ送信する処理を行う。
【0097】
映像ファイル送信部72は、初期処理の後の時間N毎のタイミングで、送信制御部70から送信停止指示を入力した場合、クラウドサーバ4への映像ファイルの送信処理を停止する。一方、映像ファイル送信部72は、初期処理の後の時間N毎のタイミングで、送信制御部70から送信再開指示を入力した場合、クラウドサーバ4への映像ファイルの送信処理を再開する。映像ファイル送信部72は、映像ファイルをクラウドサーバ4へ送信したときに、送信開始を映像ファイル送信時刻取得部69に出力する。
【0098】
遠隔時間情報取得部73は、時計62の時刻に基づいて、後述する
図5に示す当該送受信処理部59による処理のスタート(ステップS501の処理)から時間N経過したときに、例えば遠隔時間情報Tbの送信のリクエストをデータ送受信装置3へ送信する。そして、遠隔時間情報取得部73は、データ送受信装置3から遠隔時間情報Tbを受信し、遠隔時間情報Tbを時間比較部64に転送する。前述のとおり、遠隔時間情報Tbは、データ送受信装置3において、当該データ送受信装置2と同様の処理により前記式(1)にて算出された時間情報Taである。
【0099】
時間情報送信部74は、時間比較部64から時間情報Taを入力し、例えばデータ送受信装置3からの遠隔時間情報Tbの送信のリクエストに従い、時間情報Taをデータ送受信装置3へ送信する。これにより、時間情報Taはデータ送受信装置3へ送信され、データ送受信装置3は、時間情報Taを遠隔時間情報Tbとして受信する。この場合、データ送受信装置3は、後述する
図5に示すデータ送受信装置3の送受信処理部59による処理のスタート(ステップS501の処理)から時間N経過したときに、遠隔時間情報Tbの送信のリクエストを当該データ送受信装置2へ送信する。
【0100】
(送受信処理部59による映像ファイルの送信、送信停止及び送信再開処理等)
次に、
図3に示した送受信処理部59による映像ファイルの送信、送信停止及び送信再開処理等について説明する。
図5は、送受信処理部59によるこれらの処理の例を説明するフローチャートであり、
図6は、そのタイミングを説明する図である。
【0101】
図6に示すように、送受信処理部59は、予め設定された時間Nを単位として、時間Nの区間毎に「映像ファイル送信」、「送信停止」及び「送信再開」のうちのいずれかの処理にて動作する。
【0102】
尚、
図1に示したデータ送受信システム1において、データ送受信装置2の送受信処理部59による動作と、データ送受信装置3の送受信処理部59による動作とは、同期しているものとする。データ送受信装置2及びデータ送受信装置3は、例えばNTP(Network Time Protocol)を用いてそれぞれの時計62を合わせる等して同期を実現し、両装置の送受信処理部59による処理のスタートのタイミングを合わせる。
【0103】
送受信処理部59は、当該送受信処理部59の処理をスタートすると、映像ファイル生成部52から映像ファイルを取得し(ステップS501)、映像ファイルをクラウドサーバ4へ送信する(ステップS502)。送受信処理部59は、映像ファイルを送信したときの時刻を送信開始時刻t1として取得する(ステップS503)。
【0104】
送受信処理部59は、クラウドサーバ4からキーワードを受信し(ステップS504)、キーワードを受信したときの時刻を受信完了時刻t2として取得する(ステップS505)。そして、送受信処理部59は、前記式(1)にて、受信完了時刻t2から送信開始時刻t1を減算することで時間情報Taを求める(ステップS506)。
【0105】
送受信処理部59は、当該処理のスタート(ステップS501における映像ファイルを取得して)から時間Nの間待機する(ステップS507)。そして、送受信処理部59は、時間Nが経過したときに、遠隔時間情報Tbの送信のリクエストをデータ送受信装置3へ送信し、遠隔時間情報Tbを受信する(ステップS508)。
【0106】
送受信処理部59は、遠隔時間情報Tbから時間情報Taを減算することで、混雑度合い判定用時間情報Tを求める(ステップS509)。送受信処理部59は、混雑度合い判定用時間情報Tが0よりも小さい(T<0、すなわちTb<Ta)、0よりも大きい(T>0、すなわちTb>Ta)、または0である(T=0、すなわちTb=Ta)を判定する(ステップS510)。このステップS510の処理は、
図4のステップS402に対応している。この場合のステップS501~S510の処理の区間は、
図6の時刻0~時刻Nまでの間の区間に相当し、「映像ファイル送信」の動作が行われる。
【0107】
送受信処理部59は、ステップS510において、混雑度合い判定用時間情報Tが0よりも小さい(T<0、すなわちTb<Ta)と判定した場合、クラウドサーバ4への映像ファイルの送信処理を停止する(ステップS511)。このステップS511及び後述するステップS513の処理は、
図4のステップS403~S405に対応している。
【0108】
送受信処理部59は、キーワードの送信のリクエストをデータ送受信装置3へ送信し、データ送受信装置3からキーワードを受信する(ステップS512)。
【0109】
送受信処理部59は、ステップS508における遠隔時間情報Tbの送信のリクエストをデータ送受信装置3へ送信してから時間Nの間待機する(ステップS513)。そして、送受信処理部59は、時間Nが経過したときに、当該送受信処理部59の処理が完了していない場合(ステップS515:N)、スタートへ移行して送信を再開し、ステップS501~S510の処理を行う。
【0110】
この場合のステップS511~S513の処理の区間は、
図6の時刻N~時刻2Nまでの間の区間に相当し、「送信停止」の動作が行われる。そして、その後のステップS501~S510の処理の区間は、
図6の時刻2N~時刻3Nまでの間の区間に相当し、「送信再開」の動作が行われる。
【0111】
一方、送受信処理部59は、ステップS510において、混雑度合い判定用時間情報Tが0よりも大きい(T>0、すなわちTb>Ta)と判定し、当該送受信処理部59の処理が完了していない場合(ステップS515:N)、スタートへ移行する。そして、送受信処理部59は、ステップS501~S510の処理を行う。この場合のステップS501~S510の処理の区間は、
図6の時刻3N~時刻4Nまでの間の区間に相当し、「映像ファイル送信」の動作が行われる。
【0112】
また、送受信処理部59は、ステップS510において、混雑度合い判定用時間情報Tが0である(T=0、すなわちTb=Ta)と判定した場合、前回と同じ処理を行う(ステップS514)。
【0113】
つまり、送受信処理部59は、前回のステップS510の処理において、混雑度合い判定用時間情報Tが0よりも小さい(T<0、すなわちTb<Ta)と判定した場合、前述のステップS511~S513の処理を行う。一方、送受信処理部59は、前回のステップS510の処理において、混雑度合い判定用時間情報Tが0よりも大きい(T>0、すなわちTb>Ta)と判定した場合、ステップS515へ移行する。
【0114】
図6の例では、前回のステップS510の処理において、混雑度合い判定用時間情報Tが0よりも大きい(T>0、すなわちTb>Ta)と判定されている。このため、送受信処理部59は、ステップS515へ移行し、当該送受信処理部59の処理が完了していない場合(ステップS515:N)、スタートへ移行して送信を継続し、ステップS501~S510の処理を行う。この場合のステップS501~S510の処理の区間は、
図6の時刻4N~時刻5Nまでの間の区間に相当し、「映像ファイル送信」の動作が行われる。
【0115】
このように、
図1に示したデータ送受信システム1において、データ送受信装置2,3に備えたそれぞれの送受信処理部59は、時間Nの区間毎に「映像ファイル送信」、「送信停止」及び「送信再開」のうちのいずれかの処理にて独立して動作する。この場合の動作は同期している。
【0116】
それぞれの送受信処理部59は、初期処理の時間Nの区間において「映像ファイル送信」の処理にて動作する。そして、送受信処理部59は、前記式(2)にて、自らの装置におけるインターネット30の混雑度合いを示す混雑度合い判定用時間情報Tを算出する。
【0117】
送受信処理部59は、混雑度合い判定用時間情報Tに基づき、自らの装置が他の装置よりも混雑度合いが低いと判定した場合、「映像ファイル送信」の処理にて動作を継続する。一方、送受信処理部59は、自らの装置が他の装置よりも混雑度合いが高いと判定した場合、映像ファイルの送信処理を停止する「送信停止」、及び送信処理を再開する「送信再開」の処理にて動作する。
【0118】
図7は、データ送受信装置2,3による映像ファイルのアップロード送信期間を説明するイメージ図であり、本発明の実施形態の効果を説明する図でもある。
【0119】
前述のとおり、データ送受信装置2,3は、それぞれ映像ファイルをクラウドサーバ4へ送信する役割を担っている。映像ファイルをクラウドサーバ4へ送信する役割を担う期間(映像ファイルの送信期間)には、
図7に示すとおり、両装置が同時に当該役割を担う期間T1,T3,T5、及びいずれか一方の装置が当該役割を担う期間T2,T4,T6がある。
【0120】
映像ファイルを送信する役割を担うか否かは、データ送受信装置2,3が接続されるインターネット30の混雑度合いに基づいて判断される。インターネット30の混雑度合いは、映像ファイルの送信を開始してからキーワードを受信するまでの間の時間を基準として、前記式(2)の混雑度合い判定用時間情報Tに基づき判断される(
図4のステップS402、
図5のステップS510)。
【0121】
一方で、インターネット30の輻輳状況は時々刻々と変化するため、映像ファイルの送信を停止した後、時間Nが経過したときに送信停止が解除され、送信が再開される(
図4のステップS403~S405、
図5のステップS511,S513)。そして、インターネット30の混雑度合いが判断される。このような動作が繰り返される。
【0122】
期間T1,T3,T5は、データ送受信装置2,3が映像ファイルを同時に送信する期間である。期間T2,T4は、データ送受信装置3のみが映像ファイルを送信する期間であり、データ送受信装置2は映像ファイルを送信しない。また、期間T6は、データ送受信装置2のみが映像ファイルを送信する期間であり、データ送受信装置3は映像ファイルを送信しない。
【0123】
図7に示した期間T2,T4,T6は、このような動作により、アップロードトラフィックの発生が低減されることを示している。これにより、データ送受信装置2,3の両方から常に映像ファイルを送信する必要はなく、いずれか一方から映像ファイルを送信すれば済み、期間T2,T4,T6において、クラウドサービスにかかるコストを低減することができる。
【0124】
図8は、両方のデータ送受信装置2,3のアップロードトラフィックが発生する期間T1,T3,T5のデータフロー(a)を説明する図である。期間T1,T3,T5は、初期処理の期間(両データ送受信装置2,3にて「映像ファイル送信」の期間)、または、データ送受信装置2,3の一方における「送信再開」の期間及び他方における「映像ファイル送信」の期間である。
【0125】
期間T1,T3,T5においては、データ送受信装置2,3は、映像ファイルをクラウドサーバ4へ送信し、クラウドサーバ4からキーワードを受信する。また、データ送受信装置2,3は、対応するデータ送受信装置3,2から、データ送受信装置3,2における時間情報Taを遠隔時間情報Tbとして受信する。さらに、データ送受信装置2,3は、発声ファイルを遠隔発声ファイルとし、対応するデータ送受信装置3,2へ送信する。
【0126】
図9は、一方のデータ送受信装置2のアップロードトラフィックが発生しない期間T2,T4のデータフロー(b)を説明する図である。期間T2,T4は、データ送受信装置2におけるインターネット30の混雑度合いがデータ送受信装置3よりも高いと判定された場合の期間である。つまり、データ送受信装置2における「送信停止」の期間、データ送受信装置3における「映像ファイル送信」の期間である。
【0127】
期間T2,T4において、データ送受信装置3は、映像ファイルをクラウドサーバ4へ送信し、クラウドサーバ4からキーワードを受信し、キーワードをデータ送受信装置2へ送信する。この場合、データ送受信装置2は、映像ファイルを送信せず、データ送受信装置3からキーワードを受信する。また、データ送受信装置3は、データ送受信装置2から、データ送受信装置2における時間情報Taを遠隔時間情報Tbとして受信する。さらに、データ送受信装置2,3は、発声ファイルを遠隔発声ファイルとして、対応するデータ送受信装置3,2へ送信する。
【0128】
図10は、他方のデータ送受信装置3のアップロードトラフィックが発生しない期間T6のデータフロー(c)を説明する図である。期間T6は、データ送受信装置2におけるインターネット30の混雑度合いがデータ送受信装置3よりも低いと判定された場合の期間である。つまり、データ送受信装置2における「映像ファイル送信」の期間、データ送受信装置3における「送信停止」の期間である。
【0129】
期間T6において、データ送受信装置2は、映像ファイルをクラウドサーバ4へ送信し、クラウドサーバ4からキーワードを受信し、キーワードをデータ送受信装置3へ送信する。この場合、データ送受信装置3は、映像ファイルを送信せず、データ送受信装置2からキーワードを受信する。また、データ送受信装置2は、データ送受信装置3から、データ送受信装置3における時間情報Taを遠隔時間情報Tbとして受信する。さらに、データ送受信装置2,3は、発声ファイルを遠隔発声ファイルとして、対応するデータ送受信装置3,2へ送信する。
【0130】
以上のように、本発明の実施形態のデータ送受信装置2によれば、映像取得部51は、ディスプレイ13に表示された映像のデータを取得し、映像ファイル生成部52は、所定の映像ファイル形式の映像ファイルを生成する。発声取得部53は、人12の発声のデータを取得し、発声ファイル生成部54は、所定の音声ファイル形式の発声ファイルを生成する。
【0131】
送受信処理部59は、映像ファイルをクラウドサーバ4へ送信し、クラウドサーバ4からキーワードを受信することで、当該データ送受信装置2におけるラウンドトリップタイムに相当する時間情報Taを算出する。また、送受信処理部59は、発声ファイルをデータ送受信装置3へ送信し、データ送受信装置3から遠隔発声ファイルを受信する。
【0132】
送受信処理部59は、当該送受信処理部59の処理のスタート時から時間Nだけ待機した後、データ送受信装置3から、データ送受信装置3におけるラウンドトリップタイムに相当する遠隔時間情報Tbを受信する。そして、送受信処理部59は、遠隔時間情報Tbから時間情報Taを減算することで、混雑度合い判定用時間情報Tを算出する。
【0133】
送受信処理部59は、混雑度合い判定用時間情報T<0の場合、クラウドサーバ4への映像ファイルの送信処理を停止し、データ送受信装置3からキーワードを受信し、時間Nの間待機した後、映像ファイルの送信処理を再開する。一方、送受信処理部59は、混雑度合い判定用時間情報T>0の場合、クラウドサーバ4への映像ファイルの送信処理を継続する。また、送受信処理部59は、混雑度合い判定用時間情報T=0の場合、前回と同じ処理を行う。
【0134】
遠隔発声再生部55は、送受信処理部59が受信した遠隔発声ファイルを再生する。これにより、場所Aに存在する人12は、遠隔の場所Bに存在する人22の発声を聞くことができる。発話文生成部56は、送受信処理部59が受信したキーワードに基づいた発話文を生成し、発話文再生部58は、発話文を再生する。これにより、場所Aに存在する人12は、キーワードに基づいた発話文を聞くことができ、視聴している映像に関連する情報を得ることができる。
【0135】
このように、インターネット30の混雑度合いの低いデータ送受信装置2,3のいずれか一方から映像ファイルが送信され、混雑度合いの高い他方からは映像ファイルが送信されない。このため、データ送受信装置2,3の両方から常に映像ファイルを送信する必要はなく、
図7に示した期間T2,T4,T6のように、いずれか一方のみから映像ファイルを送信する期間が存在することとなる。つまり、映像ファイルをクラウドサーバ4へ送信するアップロードトラフィックの発生を低減することができ、クラウドサービスにかかるコストを低減することができる。
【0136】
また、本発明の実施形態では、インターネット30の混雑度合いの低いデータ送受信装置2,3のいずれか一方が映像ファイルをクラウドサーバ4へ送信し、クラウドサーバ4からキーワードを受信して他方へ転送するようにした。このキーワードは、映像ファイルのように大容量ではない。このため、データ送受信装置2,3は、混雑度合いの低いインターネット30の環境の下でキーワードを迅速に取得することができ、キーワードの受信遅れに伴うロボット11,21による発話のタイミングの遅れを抑制することができる。つまり、ロボット11,21は、ディスプレイ13,23に表示される同一の映像に対してさほど遅れることなく迅速なタイミングで、当該ロボット11,21間でほぼ同時に、映像に関連する同じキーワードに基づいた発話を行うことができる。
【0137】
このため、人12,22の会話とロボット11,21の発話とは、大きくずれることがなく、ロボット11,21の発話から受ける違和感を緩和することができ、同一の映像を視聴している人12,22間で会話の活性化を図ることができる。
【0138】
以上、実施形態を挙げて本発明を説明したが、本発明は前記実施形態に限定されるものではなく、その技術思想を逸脱しない範囲で種々変形可能である。
【0139】
(時間情報Ta及び遠隔時間情報Tbに基づく混雑度合いの判定)
例えば前記実施形態において、データ送受信装置2の送受信処理部59の送信制御部70は、混雑度合い判定用時間情報Tに基づいて、当該データ送受信装置2における混雑度合いを判定するようにした。これに対し、送信制御部70は、時間情報Ta及び遠隔時間情報Tbに基づいて、当該データ送受信装置2における混雑度合いを判定するようにしてもよい。
【0140】
(場所Aにおける人12,22の発声及びロボット11の発話の重なりの回避)
また、前記実施形態において、データ送受信装置2の発声取得部53は、場所Aに存在する人12の発声のデータを取得するようにした。また、遠隔発声再生部55は、遠隔の場所Bに存在する人22の発声の遠隔発声ファイルを再生し、発話文再生部58は、映像に関連するキーワードに基づいた発話文を再生するようにした。
【0141】
ここで、人12の発声とキーワードに基づいた発話文の再生とが同時に行われる場合があり、また、人22の発声の遠隔発声ファイルの再生とキーワードに基づいた発話文の再生とが同時に行われる場合もある。これでは、人12は、当該人12の発声とロボット11の発話とが重なってしまい、ロボット11の発話を聞くことができない可能性があり、また、人22の発声とロボット11の発話とが重なってしまい、これらを聞き分けることができない可能性がある。
【0142】
この問題を解決するために、発声取得部53は、人12の発声のデータを取得しているときに、取得中であることを示す信号(取得中信号)を発話文再生部58に出力する。また、遠隔発声再生部55は、人22の発声の遠隔発声ファイルを再生しているときに、再生中であることを示す信号(再生中信号)を発話文再生部58に出力する。
【0143】
発話文再生部58は、発話文の再生を開始する際に、発声取得部53から取得中信号を入力している場合、取得中信号を入力しなくなるまで待機する。また、発話文再生部58は、発話文の再生を開始する際に、遠隔発声再生部55から再生中信号を入力している場合、再生中信号を入力しなくなるまで待機する。そして、発話文再生部58は、待機後に取得中信号及び再生中信号を入力していない場合、発話文の再生を開始する。
【0144】
これにより、発話文再生部58による発話文の再生は、発声取得部53による人12の発声のデータの取得が完了するまで待った後に行われ、また、遠隔発声再生部55による人22の発声の遠隔発声ファイルの再生が完了するまで待った後に行われる。
【0145】
つまり、人12,22の発声及びロボット11の発話の時間的な重なりを回避することができる。したがって、人12は、ロボット11の発話及び人22の発声を確実に聞くことができ、映像を視聴している人12,22間の会話の活性化を一層図ることができる。
【0146】
(時間Nの変更)
また、前記実施形態において、データ送受信装置2の送受信処理部59の送信制御部70は、予め設定された時間Nを単位として、時間Nの区間毎に「映像ファイル送信」、「送信停止」及び「送信再開」のうちのいずれかの処理にて動作するようにした。この場合の時間Nは固定であるが、可変とするようにしてもよい。
【0147】
例えば送信制御部70は、混雑度合い判定用時間情報Tの絶対値が予め設定された閾値よりも大きい場合、予め設定された時間Nよりも大きい値を新たな時間Nに設定する。その後、送信制御部70は、混雑度合い判定用時間情報Tの絶対値が前記閾値以下に変化した場合、元の時間N(予め設定された時間N)に戻す。
【0148】
また、送信制御部70は、混雑度合い判定用時間情報Tの絶対値と複数の異なる閾値とを用いた閾値処理にて、予め設定された時間Nよりも大きい値を新たな時間Nに設定することで、新たな時間Nを閾値に応じて段階的に変化させるようにしてもよい。また、送信制御部70は、新たな時間Nが混雑度合い判定用時間情報Tの絶対値に比例するように、予め設定された時間Nと所定の最大値との間で、新たなNを変化させるようにしてもよい。
【0149】
これにより、例えば場所Aに設置されたデータ送受信装置2に接続されるインターネット30の回線と、場所Bに設置されたデータ送受信装置3に接続されるインターネット30の回線とが異なり、回線速度の差が明らかである場合(例えば一方が光回線、他方がADSLの場合)、インターネット30の混雑度合いを判定する頻度を低くすることとができる。つまり、回線速度の差が明らかな場合は、映像ファイルを送信してキーワードを受信し、混雑度合い判定用時間情報Tを算出する等の「映像ファイル送信」、「送信停止」及び「送信再開」の処理の頻度を低くし、データ送受信装置2,3の処理負荷を低減することができる。
【0150】
尚、データ送受信装置2,3は、設定した新たな時間Nをメモリに記憶するようにしてもよい。この場合、データ送受信装置2,3によるデータ送受信システム1の処理が再開したときに、データ送受信装置2,3は、メモリから新たな時間Nを読み出し、新たな時間Nを用いて、「映像ファイル送信」の処理を開始する。
【0151】
ここで、データ送受信装置2,3に接続されたインターネット30の回線が光回線、ADSL等のように固定である場合には、それぞれのインターネット30の環境の優劣は明確であり、混雑度合いはさほど変化しない。このため、データ送受信装置2,3は、インターネット30の環境の優劣を反映した新たな時間Nをメモリに記憶しておくことで、当該新たな時間Nを、処理の開始から用いることができ、効率的な処理を実現することができる。
【0152】
(キーワードに基づいた発話文の送受信)
また、前記実施形態において、データ送受信装置2の送受信処理部59は、クラウドサーバ4からキーワードを受信した場合、受信したキーワードをデータ送受信装置3へ送信するようにした。これに対し、送受信処理部59は、キーワードの代わりに、発話文生成部56により生成された発話文をデータ送受信装置3へ送信するようにしてもよい。
【0153】
具体的には、データ送受信装置2の送受信処理部59のキーワード受信部67は、クラウドサーバ4からキーワードを受信した場合、キーワードを、キーワード転送部61を介して発話文生成部56に出力する。発話文生成部56は、キーワード受信部67からキーワード転送部61を介してキーワードを入力し、キーワードに基づいて発話文を生成し、キーワードに基づいた発話文を、送受信処理部59に備えた発話文送信部(
図3には図示せず)に出力する。発話文送信部は、発話文生成部56からキーワードに基づいた発話文を入力してデータ送受信装置3へ送信する。
【0154】
また、データ送受信装置3がクラウドサーバ4から受信したキーワードに基づいて発話文を生成した場合には、データ送受信装置2の送受信処理部59の発話文受信部(
図3には図示せず)は、データ送受信装置3からキーワードに基づいた発話文を受信する。そして、発話文受信部は、キーワードに基づいた発話文を発話文再生部58に出力する。発話文再生部58は、発話文受信部から入力したキーワードに基づいた発話文を再生する。
【0155】
これにより、キーワードと同様に、発話文自体のデータ量は少ないため、回線が混雑することはない。また、データ送受信装置2は、データ送受信装置3からキーワードに基づいた発話文を受信した場合には、これをそのまま再生すればよく、キーワードから発話文を生成する必要がないため、処理負荷を低減することができる。尚、データ送受信装置3についてもデータ送受信装置2と同様の処理が行われる。
【0156】
尚、本発明の実施形態によるデータ送受信装置2,3のハードウェア構成としては、通常のコンピュータを使用することができる。データ送受信装置2,3は、CPU、RAM等の揮発性の記憶媒体、ROM等の不揮発性の記憶媒体、及びインターフェース等を備えたコンピュータによって構成される。
【0157】
データ送受信装置2,3に備えた映像取得部51、映像ファイル生成部52、発声取得部53、発声ファイル生成部54、遠隔発声再生部55、発話文生成部56、テンプレート保持部57、発話文再生部58及び送受信処理部59の各機能は、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。
【0158】
これらのプログラムは、前記記憶媒体に格納されており、CPUに読み出されて実行される。また、これらのプログラムは、磁気ディスク(フロッピー(登録商標)ディスク、ハードディスク等)、光ディスク(CD-ROM、DVD等)、半導体メモリ等の記憶媒体に格納して頒布することもでき、ネットワークを介して送受信することもできる。
【符号の説明】
【0159】
1 データ送受信システム
2 データ送受信装置
3 データ送受信装置(遠隔データ送受信装置)
4 クラウドサーバ
11 ロボット(第1のロボット)
12 人(第1のユーザ)
13 ディスプレイ(第1のディスプレイ)
21 ロボット(第2のロボット)
22 人(第2のユーザ)
23 ディスプレイ(第2のディスプレイ)
30 インターネット
51 映像取得部
52 映像ファイル生成部
53 発声取得部
54 発声ファイル生成部
55 遠隔発声再生部(発声再生部)
56 発話文生成部
57 テンプレート保持部
58 発話文再生部
59 送受信処理部
60 映像ファイル取得部
61 キーワード転送部
62 時計
63 時間算出部
64 時間比較部
65 遠隔発声ファイル受信部
66 キーワード受信時刻取得部
67 キーワード受信部
68 キーワード送信部
69 映像ファイル送信時刻取得部
70 送信制御部
71 発声ファイル送信部
72 映像ファイル送信部
73 遠隔時間情報取得部
74 時間情報送信部
t1 送信開始時刻
t2 受信完了時刻
Ta 時間情報
Tb 遠隔時間情報
T 混雑度合い判定用時間情報