(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-06-13
(45)【発行日】2022-06-21
(54)【発明の名称】端末装置、会議システム、端末装置の制御方法、及びプログラム
(51)【国際特許分類】
H04N 7/15 20060101AFI20220614BHJP
H04N 21/44 20110101ALI20220614BHJP
H04M 3/56 20060101ALI20220614BHJP
H04M 1/00 20060101ALI20220614BHJP
【FI】
H04N7/15
H04N21/44
H04M3/56 C
H04M1/00 H
(21)【出願番号】P 2018140640
(22)【出願日】2018-07-26
【審査請求日】2021-05-20
(73)【特許権者】
【識別番号】000006747
【氏名又は名称】株式会社リコー
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】小山 毅
【審査官】富樫 明
(56)【参考文献】
【文献】特開2012-129950(JP,A)
【文献】特開平09-163332(JP,A)
【文献】特開平07-245665(JP,A)
【文献】特開2004-259263(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 7/14-7/15
H04N 21/00-21/858
H04M 3/56
H04M 1/00
(57)【特許請求の範囲】
【請求項1】
ネットワークを介して他の端末装置と通信を行う端末装置であって、
前記他の端末装置と共有する共有画像のデータを受信する共有画像受信部と、
前記他の端末装置が送信した音声データを受信する音声データ受信部と、
前記共有画像を表示部に表示させる共有画像表示部と、
前記共有画像受信部が前記共有画像のデータを受信した場合、前記音声データを記憶する音声データ記憶部と、
前記音声データ記憶部に記憶されている前記音声データを前記音声データ受信部による前記音声データの受信の時期より遅れて出力する出力部と、
前記音声データ記憶部に記憶されている前記音声データから、発話がない期間を検出する検出部と、
前記検出部において、前記音声データ記憶部に記憶されている前記音声データに発話がない期間が検出された場合、前記音声データ記憶部に記憶されている前記音声データから前記発話がない期間の一部又は全部を除外して、前記音声データを前記出力部に出力させる出力制御部と、
を有する、端末装置。
【請求項2】
前記出力制御部は、前記共有画像表示部が前記共有画像を前記表示部に表示させた後、前記音声データにおいて発話がない期間が検出された場合、前記音声データにおける前記発話がない期間の一部又は全部を除外する、請求項1に記載の端末装置。
【請求項3】
前記出力部は、前記音声データ記憶部に記憶されている前記音声データを所定の期間遅延させて出力し、
前記出力制御部は、前記所定の期間の範囲内で前記音声データから前記発話がない期間を除外する、請求項1又は2に記載の端末装置。
【請求項4】
前記所定の期間は、前記共有画像のデータの受信を開始してから、前記共有画像が表示されるまでの期間を含む、請求項3に記載の端末装置。
【請求項5】
前記音声データは、前記他の端末で撮影した動画像を含む映像データに含まれ、
前記出力部は、前記音声データを用いて前記動画像を前記所定の期間遅延させて出力する、請求項3又は4に記載の端末装置。
【請求項6】
前記動画像は、該動画像を再生すべき時間情報を含み、
前記出力部は、前記共有画像受信部が前記共有画像のデータを受信するとき、前記動画像の前記時間情報を前記所定の期間遅らせて出力する、請求項5に記載の端末装置。
【請求項7】
前記出力制御部は、前記共有画像表示部が前記共有画像を前記表示部に表示させた後、前記音声データにおいて発話がない期間が検出された場合、前記動画像の前記時間情報を、前記発話がない期間の一部又は全部に相当する期間だけ進めて、前記動画像を前記出力部に出力させる、請求項6に記載の端末装置。
【請求項8】
第1の端末装置と、前記第1の端末装置とネットワークを介して通信可能な第2の端末装置とを用いて通信を行う会議システムであって、
前記第1の端末装置は、
前記第2の端末装置と共有する共有画像のデータを前記第2の端末装置に送信する共有画像送信部と、
前記第1の端末装置が取得した音声データを前記第2の端末装置に送信する音声データ送信部と、
を有し、
前記第2の端末装置は、
前記第1の端末装置が送信する前記共有画像のデータを受信する共有画像受信部と、
前記第1の端末装置が送信する前記音声データを受信する音声データ受信部と、
前記共有画像を表示部に表示させる共有画像表示部と、
前記共有画像受信部が前記共有画像のデータを受信した場合、前記音声データを記憶する音声データ記憶部と、
前記音声データ記憶部に記憶されている前記音声データを前記音声データ受信部による前記音声データの受信の時期より遅れて出力する出力部と、
前記音声データ記憶部に記憶されている前記音声データから、発話がない期間を検出する検出部と、
前記検出部において、前記音声データ記憶部に記憶されている前記音声データに発話がない期間が検出された場合、前記音声データ記憶部に記憶されている前記音声データから前記発話がない期間の一部又は全部を除外して、前記音声データを前記出力部に出力させる出力制御部と、
を有する、会議システム。
【請求項9】
ネットワークを介して他の端末装置と通信を行う端末装置の制御方法であって、
前記端末装置が、
前記他の端末装置と共有する共有画像のデータを受信するステップと、
前記他の端末装置が送信した音声データを受信するステップと、
前記共有画像を表示部に表示させるステップと、
前記共有画像のデータを受信した場合、前記音声データを記憶部に記憶するステップと、
前記記憶部に記憶されている前記音声データを、前記音声データの受信の時期より遅れて出力するステップと、
前記記憶部に記憶されている前記音声データから、発話がない期間を検出するステップと、
前記記憶部に記憶されている前記音声データに発話がない期間が検出された場合、前記記憶部に記憶されている前記音声データから前記発話がない期間の一部又は全部を除外して、前記音声データを出力させるステップと、
を実行する、端末装置の制御方法。
【請求項10】
端末装置が備えるコンピュータに実行させるプログラムであって、
前記コンピュータに、
ネットワークを介して通信を行う他の端末装置と共有する共有画像のデータを受信するステップと、
前記他の端末装置が送信した音声データを受信するステップと、
前記共有画像を表示部に表示させるステップと、
前記共有画像のデータを受信した場合、前記音声データを記憶部に記憶するステップと、
前記記憶部に記憶されている前記音声データを、前記音声データの受信の時期より遅れて出力するステップと、
前記記憶部に記憶されている前記音声データから、発話がない期間を検出するステップと、
前記記憶部に記憶されている前記音声データに発話がない期間が検出された場合、前記記憶部に記憶されている前記音声データから前記発話がない期間の一部又は全部を除外して、前記音声データを出力させるステップと、
を実行させる、プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、端末装置、会議システム、端末装置の制御方法、及びプログラムに関する。
【背景技術】
【0002】
複数の端末装置の間で画像を共有して会議を行う会議システムが知られている。例えば、端末装置の表示部に、会議に参加している他の参加者を撮影した会議映像と共に、情報端末や電子ホワイトボード等に表示している共有画像を表示する会議システムが知られている。
【0003】
また、ビデオ会議システムにおいて、受信した音声を遅延させて再生することで、受信した音声と映像との時間のズレを修正する技術が知られている(例えば、特許文献1参照)。
【発明の概要】
【発明が解決しようとする課題】
【0004】
複数の端末装置の間で、例えば、PC(Personal Computer)や電子ホワイトボード等に表示されている高解像度の共有画像を共有する場合、共有画像の通信に時間を要するために、共有先の端末装置で共有画像の表示に要する時間が長くなるという問題がある。これにより、例えば、共有先の端末装置で共有画像が表示される前に、会議音声で共有画像の説明が始まってしまう等、共有画像の表示と会議音声との間の時間差が会議の妨げとなる場合がある。
【0005】
また、特許文献1に開示された技術のように、受信した音声を遅延させて再生するだけでは、例えば、会議の参加者の発話に対して、他の参加者からの応答が返ってくるまでの遅延時間が大きくなるので、この遅延時間が会議の進行の妨げとなる場合がある。
【0006】
本発明の実施の形態は、上記の問題点を鑑みてなされたものであって、共有画像の共有と会議音声の送受信とを行う会議システムにおいて、共有画像と会議音声との間の時間差を低減しつつ、会議音声の遅延時間の増大を抑制する。
【課題を解決するための手段】
【0007】
上記の課題を解決するため、本発明の一実施形態に係る端末装置は、ネットワークを介して他の端末装置と通信を行う端末装置であって、前記他の端末装置と共有する共有画像のデータを受信する共有画像受信部と、前記他の端末装置が送信した音声データを受信する音声データ受信部と、前記共有画像を表示部に表示させる共有画像表示部と、前記共有画像受信部が前記共有画像のデータを受信した場合、前記音声データを記憶する音声データ記憶部と、前記データ記憶部に記憶されている前記音声データを前記音声データ受信部による前記音声データの受信の時期より遅れて出力する出力部と、前記データ記憶部に記憶されている前記音声データから、発話がない期間を検出する検出部と、前記検出部において、前記音声データ記憶部に記憶されている前記音声データに発話がない期間が検出された場合、前記音声データ記憶部に記憶されている前記音声データから前記発話がない期間の一部又は全部を除外して、前記音声データを前記出力部に出力させる出力制御部と、を有する。
【発明の効果】
【0008】
本発明の実施の形態によれば、共有画像の共有と会議音声の送受信とを行う会議システムにおいて、共有画像と会議音声との間の時間差を低減しつつ、会議音声の遅延時間の増大を抑制することができる。
【図面の簡単な説明】
【0009】
【
図1】一実施形態に係る会議システムのシステム構成の例を示す図である。
【
図2】一実施形態に係る会議端末が表示する表示画面のイメージを示す図である。
【
図3】一実施形態に係る会議端末のハードウェア構成の例を示す図である。
【
図4】第1の実施形態に係る会議端末の機能構成の例を示す図である。
【
図5】第1の実施の形態に係る会議映像の出力処理について説明するための図(1)である。
【
図6】第1の実施の形態に係る会議映像の出力処理について説明するための図(2)である。
【
図7】第1の実施の形態に係る会議システムの処理の例を示すシーケンス図である。
【
図8】第2の実施の形態に係る会議端末の機能構成の例を示す図である。
【
図9】第2の実施の形態に係る会議映像の出力処理について説明するための図(1)である。
【
図10】第2の実施の形態に係る会議映像の出力処理について説明するための図(2)である。
【
図11】第2の実施の形態に係る会議システムの処理の例を示すシーケンス図である。
【
図12】第2の実施の形態に係る共有画像を受信したときの処理の別の一例を示すフローチャートである。
【発明を実施するための形態】
【0010】
以下に、本発明の実施の形態について、添付の図面を参照して説明する。
<システムの構成>
図1は、一実施形態に係る会議システムのシステム構成の例を示す図である。会議システム100は、例えば、インターネットやLAN(Local Area Network)等のネットワーク160で通信可能に接続される複数の会議端末110a、110b、・・・、呼制御サーバ130、及び画像配信サーバ140等を有する。なお、以下の説明の中で、複数の会議端末110a、110b、・・・のうち、任意の会議端末を示す場合、「会議端末110」を用いる。
【0011】
会議端末110は、コンピュータの構成を有する端末装置であり、会議システム100用の専用端末であっても良いし、会議システム100のアプリケーションプログラム(以下、アプリと呼ぶ)を実行する汎用の情報端末であっても良い。ここでは、一例として、会議端末110が、会議システム100用の専用端末であるものとして、以下の説明を行う。
【0012】
会議端末110は、例えば、呼制御サーバ130の制御により、画像配信サーバ140を介して1つ以上の他の会議端末110と通信を行い、会議の画像や音声を送受信することができる。これにより、例えば、会議端末110aの利用者は、他の会議端末110bの利用者と、リアルタイムに送受信される会議の画像や音声を介してビデオ会議を行うことができる。なお、ビデオ会議は、テレビ会議、又は遠隔会議等と呼ばれる場合もある。
【0013】
呼制御サーバ130は、コンピュータの構成を有する情報処理装置、又は複数の情報処理装置を含むシステムであり、複数の会議端末110間で会議を行うための通信を制御する。
【0014】
画像配信サーバ140は、コンピュータの構成を有する情報処理装置、又は複数の情報処理装置を含むシステムであり、会議に参加している会議端末110間の音声、及び動画像を含む映像データの配信(中継)を行う。
【0015】
例えば、会議端末110a、110bが同じ会議に参加している場合、画像配信サーバ140は、会議端末110aから送信された映像データを受信し、受信した映像データを会議端末110bに配信する。また、画像配信サーバ140は、会議端末110bから送信された映像データを受信し、受信した映像データを会議端末110aに配信する。
【0016】
このように、画像配信サーバ140は、会議に参加している一の会議端末110から送信された映像データを受信し、受信した映像データを会議に参加している他の会議端末110に配信する。これにより、会議端末110は、会議に参加する会議端末110の数が多い場合でも、映像データを画像配信サーバ140に送信するだけで良いので、会議端末110の負荷を低減させることができる。
【0017】
また、本実施形態に係る会議システム100では、例えば、会議端末110aの外部I/F(Interface)111に接続された情報端末120等に表示している表示画面を、共有画面として他の会議端末110b、・・・と共有することができる。
【0018】
図2は、一実施形態に係る会議端末が表示する表示画面のイメージを示す図である。
図1に示す会議システム100において、会議端末110aと会議端末110bとの間で会議が行われている場合、会議端末110bの表示部には、例えば、
図2に示すような表示画面200が表示される。
【0019】
図2に示す表示画面200には、会議端末110aが撮影した会議映像210、会議端末110bが撮影した会議映像220、及び共有画像230が表示されている。共有画像230は、例えば、会議端末110aの外部I/F111に接続された情報端末120や電子ホワイトボード等が表示している表示画面、又は表示画面をキャプチャした静止画像である。
【0020】
なお、ここでは、共有画像230が、一例として、4K等の高解像度の静止画像であるものとする。なお、4Kとは、フルハイビジョンの解像度(1920×1080ドット)の縦横2倍(面積比で4倍)である4098×2160ドット程度の解像度を表す。なお、4Kの静止画像は、高解像度の静止画像の一例であり、他の解像度であっても良い。
【0021】
例えば、会議端末110aの利用者は、会議資料等の説明を行うとき等に、説明の対象となる表示画面をキャプチャした静止画像を、共有画像230として共有することができる。これにより、会議端末110aの利用者は、説明の対象となる表示画面を、共有画像230に表示したまま、情報端末120の表示画面を自由に変更することができる。
【0022】
ただし、複数の会議端末110の間で、例えば、PC(Personal Computer)や電子ホワイトボード等に表示されている高解像度の共有画像を共有する場合、共有先の会議端末110で共有画像230の表示に要する時間が長くなるという問題がある。これにより、例えば、会議端末110aの利用者が、
図2に示すような共有画像230を共有して、会議映像210の音声で説明を行うときに、会議端末110bで共有画像230が表示される前に、会議映像210で説明が始まってしまう場合がある。
【0023】
このような、会議映像210と共有画像230との間の時間差は、環境によって、例えば、4~8秒程度になる場合があり、会議の進行を妨げてしまう可能性がある。
【0024】
そこで、本実施形態に係る会議端末110bは、共有画像230を受信するときに、会議映像210(動画像+音声)を、所定の期間遅延させて出力する。この所定の期間には、例えば、会議端末110が共有画像230の受信を開始してから、共有画像230が表示されるまでの期間等が含まれる。これにより、会議映像210と共有画像230との間の時間差が低減され、例えば、共有画像230が表示されてから、会議映像210による説明が開始されるようになる。
【0025】
ただし、これだけでは、例えば、会議端末110aの利用者の発話に対して、会議端末110bからの応答が返ってくるまでの遅延時間が大きくなってしまうので、この遅延時間が会議のスムーズな進行の妨げとなる場合がある。
【0026】
そのため、会議端末110bは、共有画像230を表示した後に、会議映像210において、発話がない期間を検出し、発話がない期間の一部又は全部を除外して会議映像210を出力(表示)する機能を有することが望ましい。これにより、会議映像210に発話がない期間が含まれている場合に、共有画像230を表示する際に発生した遅延時間の増大を抑制することができる。
【0027】
このように、本実施形態によれば、共有画像230の共有と会議映像210の送受信とを行う会議システム100において、共有画像230と会議映像210との間の時間差を低減しつつ、会議映像210の遅延時間の増大を抑制することができる。
【0028】
なお、
図1で説明した会議システム100のシステム構成は一例である。例えば、会議システム100は、呼制御サーバ130、画像配信サーバ140等を介さずに、会議端末110aと会議端末110bとの間で会議を行うものであっても良い。また、呼制御サーバ130と、画像配信サーバ140とは、1つの会議サーバ150で実現されるものであっても良い。
【0029】
さらに、会議システム100は、会議映像(動画像+音声)に代えて、会議音声の送受信を行うものであっても良い。この場合、会議端末110bは、共有画像230を受信するときに、会議音声を所定の期間遅延させて出力し、会議音声において発話がない期間の一部又は全部を除外して、会議音声を出力すれば良い。
【0030】
また、会議端末110は、会議システム100に対応する会議用プログラムを実行するノートPCやタブレット端末等の情報端末であっても良い。さらに、共有画像230は、外部I/F111に接続された情報端末120やホワイトボード等の表示画面に限られず、情報端末が備えるカメラや、外部カメラ等で撮影した画像であっても良い。
【0031】
<ハードウェア構成>
(会議端末のハードウェア構成)
図3は、一実施形態に係る会議端末のハードウェア構成の例を示す図である。会議端末110は、例えば、CPU(Central Processing Unit)301、ROM(Read Only Memory)302、RAM(Random Access Memory)303、ストレージ304、入力装置305、ネットワークI/F306、カメラ307、撮像素子I/F308、スピーカ309、マイク310、音声I/F311、ディスプレイ312、表示I/F313、外部I/F111、及びシステムバス314等を有する。なお、入力装置305、カメラ307、スピーカ309、マイク310、及びディスプレイ312のうち、少なくとも一部は、会議端末110の外部に接続されるものであっても良い。
【0032】
CPU301は、ストレージ304、ROM302等に記憶されたプログラムを実行することにより、会議端末110の全体の動作を制御する演算装置である。ROM302は、例えば、IPL(Initial Program Loader)等のCPU301の起動に用いられるプログラムを記憶した不揮発性のメモリである。RAM303は、CPU301のワークエリア等として用いられる揮発性のメモリである。ストレージは、OS(Operating System)、アプリ、データ等を記憶する大容量の記憶装置であり、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)等によって実現される。
【0033】
入力装置305は、利用者による操作を受け付ける入力デバイスであり、例えば、操作ボタン、キーボード、タッチパネル等によって実現される。ネットワークI/F306は、会議端末110をネットワーク160に接続して、他の装置の通信を行うためのインタフェースである。
【0034】
カメラ307は、被写体を撮像して画像データを取得する撮像デバイスである。撮像素子I/F308は、カメラ307を会議端末110に接続するためのインタフェースである。スピーカ309は、音声I/F311から出力される音声信号を音声に変換して出力する。マイク310は、周辺の音声を取得して、音声信号に変換し、音声I/F311に出力する。音声I/F311は、スピーカ309、及びマイク310を会議端末110に接続するためのインタフェースである。
【0035】
ディスプレイ312は、会議端末110の表示画面を表示する表示装置である。表示I/F313は、ディスプレイ312を会議端末110に接続するためのインタフェースである。
【0036】
外部I/F111は、例えば、情報端末120等の外部機器を会議端末110に接続するためのインタフェースである。なお、外部I/F111は、有線接続に限られず、無線通信を用いて、外部機器を会議端末110に接続するものであっても良い。
【0037】
システムバス314は、上記の各構成要素を、
図2に示すように接続し、アドレス信号、データ信号、及び各種の制御信号を伝送する。
【0038】
なお、呼制御サーバ130、及び画像配信サーバ140は、一般的なコンピュータのハードウェア構成を有しているが、本実施形態では、呼制御サーバ130、及び画像配信サーバ140の構成は任意で良いので、ここでは説明を省略する。
【0039】
[第1の実施形態]
続いて、第1の実施形態に係る会議システム100における会議端末110の機能構成について説明する。
【0040】
<機能構成>
図4は、第1の実施形態に係る会議端末110aの機能構成の例を示す図である。システムの機能構成の例を示す図である。なお、
図4において、会議端末110bは、会議端末110aと同様の機能構成を有しているものとする。
【0041】
(会議端末の機能構成)
会議端末(端末装置)110は、例えば、通信部401、操作受付部402、会議映像送信部403、共有画像送信部404、共有画像受信部405、共有画像表示部406、会議映像受信部407、記憶部408、及び会議映像出力部409等を有する。
【0042】
会議端末110は、例えば、
図3のCPU301で所定のプログラムを実行することにより、上記の各機能構成を実現している。また、上記の各機能構成のうち、少なくとも一部は、ハードウェアによって実現されるものであっても良い。
【0043】
また、本実施形態では、
図1の呼制御サーバ130、及び画像配信サーバ140は、任意の構成であって良いので、
図3では、会議サーバ150として記載し、以下の説明においても、呼制御サーバ130と画像配信サーバ140とを特に区別せずに説明を行う。
【0044】
通信部401は、例えば、
図3のCPU301で実行されるプログラム、及びネットワークI/F306等によって実現され、ネットワーク160を介して、他の会議端末110、及び会議サーバ150等と通信を行う。
【0045】
例えば、通信部401は、会議サーバ150と制御用のセッションを確立し、呼制御サーバ130へのログイン処理、及び会議の開始、終了、参加等の通信制御を行う。また、通信部401は、会議サーバ150の制御に従って、会議サーバ150と通信用のセッションを確立し、同じセッションに参加している他の会議端末110との間で、共有画像、及び会議映像(例えば、動画像+音声)等の送受信を行う。
【0046】
操作受付部402は、例えば、
図3のCPU301で実行されるプログラムによって実現され、
図3の入力装置305等を用いて、利用者による入力操作(例えば、発信、応答、宛先指定等の操作)を受け付ける。
【0047】
会議映像送信部(音声データ送信部、映像データ送信部)403は、例えば、
図3のCPU301で実行されるプログラムによって実現される。会議映像送信部403は、例えば、
図3のカメラ307等で撮影した会議の動画像と、
図3のマイク310等で取得した会議の音声データとを含む会議映像のデータを、例えば、会議サーバ150を介して会議に参加している他の会議端末110に送信する。
【0048】
共有画像送信部404は、例えば、
図3のCPU301で実行されるプログラムによって実現される。共有画像送信部404は、例えば、外部I/F111等によって接続された外部装置等から共有画像を取得して、取得した共有画像のデータを、例えば、会議サーバ150を介して、会議に参加している他の会議端末110に送信する。
【0049】
共有画像受信部405は、例えば、
図3のCPU301で実行されるプログラムによって実現される。共有画像受信部405は、他の会議端末110が、会議に参加している複数の会議端末110の間で共有する共有画像のデータを送信するとき、他の会議端末110が送信する共有画像のデータを、例えば、会議サーバ150を介して受信する。
【0050】
共有画像表示部406は、例えば、
図3のCPU301で実行されるプログラムによって実現され、共有画像受信部405が受信した共有画像のデータを用いて、例えば、
図3のディスプレイ312等の表示部に共有画像を表示させる。例えば、共有画像表示部406は、
図2に示すような会議の表示画面200に共有画像230を表示させる。
【0051】
会議映像受信部(音声データ受信部、映像データ受信部)407は、例えば、
図3のCPU301で実行されるプログラムによって実現される。会議映像受信部407は、会議に参加している他の会議端末110が送信する会議の音声データを含む映像データを受信して、記憶部(音声データ記憶部、映像データ記憶部)408に記憶する。
【0052】
記憶部408は、例えば、
図3のCPU301で実行されるプログラム、及びストレージ304、RAM303等によって実現され、会議映像受信部407が受信した、会議の音声を含む映像データを記憶する。また、記憶部408は、例えば、会議端末を識別する端末ID等の情報や、共有画像受信部405が受信した共有画像のデータ等の様々な情報やデータを記憶することができる。なお、記憶部408は、共有画像受信部404が共有画像のデータを受信した場合、会議映像受信部407が受信した音声データを記憶する音声データ記憶部の一例である。
【0053】
会議映像出力部409は、例えば、
図3のCPU301で実行されるプログラムによって実現され、記憶部408に記憶した映像データを用いて、例えば、
図2に示すような会議映像210と会議の音声を出力する。また、本実施形態に係る会議映像出力部409は、共有画像受信部405が共有画像のデータを受信した場合、記憶部408に記憶した映像データを用いて、会議映像(動画像+音声)を所定の期間だけ遅延させて出力する機能を有している。
【0054】
会議の動画像のデータは、動画像を再生すべき時間情報(タイムスタンプ)を含み、会議映像出力部409は、共有画像受信部405が共有画像のデータを受信するとき、例えば、会議の動画像の時刻情報を所定の期間だけ遅らせて出力する。会議映像出力部409は、会議の音声に関しても同様にして、所定の期間だけ遅らせて出力することができる。
【0055】
図5、6は、第1の実施形態に係る会議映像の出力処理について説明するための図である。例えば、
図5の時間t1において、会議端末110aが、共有画像501、及び共有画像501を説明するための発話502を含む会議映像を、会議端末110bに送信するものとする。
【0056】
このとき、会議端末110bが受信する会議音声の発話502には、会議の進行の妨げとなるような大きな遅延は発生しないものとする。一方、共有画像501が、例えば、4K等の高解像度の画像である場合、会議端末110bが共有画像501の受信を完了し、表示する時間t2までには、比較的大きな遅延時間(例えば、4~8秒程度)が発生し得る。
【0057】
このような、会議端末110bにおける共有画像230と会議映像210との間の時間差により、例えば、会議端末110bにおいて、共有画像501の説明を行う発話502が開始されたときには、まだ共有画像230が表示されていない場合がある。これにより、例えば、会議端末110bの利用者が、共有画像230の説明を理解し難くなる等、会議の進行の妨げとなることがある。
【0058】
そこで、本実施形態では、会議端末110bの会議映像出力部409は、
図6に示すように、共有画像501を受信するとき、会議映像を所定の期間Tdだけ遅延させて出力する。なお、
図6の時間t1からt2の期間において、会議映像出力部409は、例えば、時間t1の直前に表示していたフレームを静止画像として表示するものであっても良いし、タイミング調整中であることを示す表示画面等を表示するものであっても良い。
【0059】
所定の期間Tdの決定方法として、例えば、会議端末110bが共有画像501の受信を開始してから、共有画像501が表示されるまでの期間を所定の期間Tdとしても良い。また、別の一例として、共有画像501の解像度や、通信速度に応じて、適切な遅延時間Tdを記憶部等に予め記憶しておくもの等であっても良い。
【0060】
さらに、会議端末110bは、例えば、
図7に示す処理により、会議映像を遅延させて出力するものであっても良い。
【0061】
<処理の流れ>
図7は、第1の実施形態に係る会議システム処理の例を示すシーケンス図である。この処理は、会議端末110aと会議端末110bとの間で会議が行われている間に、会議端末110aが共有画像501を送信するときに、会議システム100で実行される処理の例を示している。
【0062】
ステップS701、S702において、会議端末110aから、会議サーバ150を介して会議端末110bに、会議映像(動画像+音声)のデータの送信が開始される。
【0063】
ステップS703、S704において、会議端末110bの会議映像受信部407は、会議端末110aから送信される会議映像のデータを受信し、受信した会議映像のデータを記憶部408に記憶する。
【0064】
ステップS705、S706において、例えば、利用者による画面共有操作等に応じて、会議端末110aから、会議サーバ150を介して会議端末110bに、共有画像のデータの送信が開始される。
【0065】
ステップS707、S708において、会議端末110bの共有画像受信部405は、会議端末110aから送信される共有画像のデータを受信し、共有画像表示部406は、共有画像を表示する表示処理を行う。なお、この共有画像のデータの受信には、例えば、
図6の遅延時間Tdに相当する時間を要するものとする。
【0066】
ステップS709において、会議端末110bの共有画像受信部405は、共有画像の受信を完了すると、共有画像の受信が完了したことを示す受信完了通知を、会議映像出力部409に通知する。
【0067】
好ましくは、この受信完了通知には、例えば、共有画像のデータの受信を開始した時間(又は共有画像のデータの送信を開始した時間)を示す時刻情報(タイムスタンプ)等が含まれる。
【0068】
ステップS710、S711において、会議端末110bの会議映像出力部409は、受信完了通知を受け付けると、記憶部408に記憶された会議映像のデータを読み出し、会議映像の再生を開始する。
【0069】
好ましくは、会議映像のデータには、再生すべき時刻を示す時刻情報(タイムスタンプ)が含まれており、会議映像出力部409は、例えば、受信完了通知に含まれる時刻情報と、再生する会議映像の時刻情報とが略一致するように、会議映像を再生する。
【0070】
これにより、会議端末110bは、例えば、
図6に示すように、時間t2において、共有画像501の表示に合わせて、共有画像501を説明する発話502を含む会議映像を出力することができるようになる。
【0071】
なお、上記の説明では、会議端末110aと会議端末110bとの間で、会議映像(動画像+音声)を送受信するものとして説明を行ったが、本実施形態は、会議映像に代えて、会議音声のみを送受信する会議システム100にも適用することができる。
【0072】
このように、本実施形態に係る会議端末110bの会議映像出力部409は、共有画像受信部405が共有画像を受信するとき、少なくとも会議の音声を所定の期間遅延させて出力する。
【0073】
したがって、本実施形態によれば、共有画像の共有と会議映像の送受信とを行う会議システム100において、共有画像と会議映像との間の時間差を低減させることができる。
【0074】
[第2の実施形態]
第1の実施形態により、共有画像の共有と会議映像の送受信とを行う会議システムにおいて、共有画像と会議映像との間の時間差を低減させることができる。ただし、これだけでは、例えば、会議端末110aの利用者の発話に対して、会議端末110bからの応答が返ってくるまでの遅延時間が大きくなってしまうので、この遅延時間が会議のスムーズな進行の妨げとなる場合がある。第2の実施形態では、この遅延時間を低減させる場合の例について説明する。
【0075】
<機能構成>
図8は、第2の実施形態に係る会議端末の機能構成の例を示す図である。
図8に示すように、第2の実施形態に係る会議端末110は、
図4に示した第1の実施形態に係る会議端末110の機能構成に加えて、検出部801、及び出力制御部802を有している。
【0076】
検出部801は、例えば、
図3のCPU301で実行されるプログラムによって実現され、記憶部408に記憶された会議映像のデータに含まれる会議音声において、発話がない期間を検出する。例えば、検出部801は、会議音声の出力レベル(又は音量)がしきい値未満の期間を発話がない期間として検出しても良いし、人の音声に対応する周波数帯の音波が含まれない期間を発話がない期間として検出しても良い。
【0077】
出力制御部802は、例えば、
図3のCPU301で実行されるプログラムによって実現され、記憶部408に記憶された会議映像における発話がない期間の一部又は全部を除外して、会議映像出力部409に会議映像を出力させる。
【0078】
図9、10は、第2の実施形態に係る会議映像の出力処理について説明するための図である。例えば、
図9の時間t1において、会議端末110aが、共有画像501、及び共有画像501を説明するための発話502を含む会議映像を、会議端末110bに送信するものとする。また、一例として、時間t3~t4の間の発話なし901の期間をおいて、時間t4から再び発話902が開始されるものとする。また、会議端末110bは、第1の実施形態で説明した処理により、時間t1から遅延時間Tdを経過して時間t2において、共有画像501を表示すると共に、発話502を含む会議映像の再生を開始するものとする。
【0079】
このとき、会議端末110bの検出部801は、記憶部408に記憶された会議映像において、発話なし901の期間Tsを検出する。また、会議端末110bの出力制御部802は、会議映像における発話なし901の期間Tsを除外して、会議映像出力部409に会議映像を出力させる。
【0080】
これにより、例えば、
図9に示すように、遅延時間Tdより、発話なし901の期間Tsが短い場合、発話502を含む会議映像に続いて、発話902を含む会議映像が出力される。
【0081】
ただし、遅延時間Tdより、発話なし901の期間Tsが長い場合には、出力制御部802は、発話なし901の期間Tsの全てを除外することはできないので、遅延時間Tdの範囲内で、発話なし901の期間Tsの一部を除外する。これにより、会議端末110bは、共有画像501の受信に伴う遅延時間Tdの増大を抑制することができる。
【0082】
ここで、
図10を用いて、出力制御部802の処理の具体的な一例について説明する。会議映像の動画データ、及び音声データには再生すべき時間を示す時間情報(タイムスタンプ)が付加されている。
【0083】
例えば、
図10において、会議端末110aが共有画像501の送信を開始する相対時間を0秒とし、4.5秒後に会議端末110bにおいて、共有画像501の受信が完了して、共有画像501が表示されるものとする。また、会議端末110aにおいて、発話502の後に、3秒間の発話なし901の期間があるものとする。
【0084】
会議端末110bの出力制御部802は、発話なし901の期間を除外(スキップ)する場合、発話902を再生すべき時間情報「8秒」に遅延時間「4.5秒」を加算し、発話なし901の期間「3秒」を減算した相対時間「9.5秒」を、発話902を再生する時間情報とする。これにより、会議端末110bの会議映像出力部409は、例えば、
図10に示すように、発話なし901の期間を除外して、会議映像を出力することができる。
【0085】
<処理の流れ>
(会議システムの処理)
図11は、第1の実施形態に係る会議システム処理の例を示すシーケンス図である。この処理は、会議端末(第1の端末装置)110aと会議端末(第2の端末装置)110bとの間で会議が行われている間に、会議端末110aが共有画像501を送信するときに、会議システム100で実行される処理の例を示している。
【0086】
ステップS1101において、会議端末110bの会議映像受信部407は、例えば、
図7のステップS701、702に示すように、会議端末110aから、会議サーバ150を介して送信される会議映像のデータの受信を開始するものとする。
【0087】
ステップS1102、S1103において、会議端末110bの会議映像受信部407は、受信した会議映像のデータを記憶部408に記憶する。
【0088】
ステップS1104、S1105において、会議端末110bの検出部801は、記憶部408に記憶された会議映像のデータを取得して、発話がない期間の検出を開始する。
【0089】
ステップS1106において、会議端末110bの共有画像受信部405は、例えば、
図7のステップS705、S706に示すように、会議端末110aから、会議サーバ150を介して送信される共有画像のデータの受信を開始するものとする。
【0090】
ステップS1107、S1108において、会議端末110bの共有画像表示部406は、共有画像受信部405が受信した共有画像のデータを用いて、共有画像を表示する表示処理を行う。なお、この共有画像のデータの受信には、例えば、
図9の遅延時間Tdに相当する時間を要するものとする。
【0091】
ステップS1109において、会議端末110bの共有画像受信部405は、共有画像のデータの受信を完了すると、共有画像のデータの受信が完了したことを示す受信完了通知を、会議映像出力部409に通知する。
【0092】
ステップS1110、S1111において、会議端末110bの会議映像出力部409は、受信完了通知を受け付けると、第1の実施形態と同様にして、記憶部408に記憶された会議映像のデータを読み出し、会議映像の再生を開始する。
【0093】
この状態で、例えば、ステップS1112において、検出部801は、発話がない期間を検出すると、発話がない期間が検出されたことを示す検出通知を、出力制御部802に通知する。
【0094】
ステップS1114において、会議端末110bの会議映像出力部409は、例えば、
図10で説明したようにして、発話がない期間を除外した会議映像を、会議映像出力部409に再生させる。
【0095】
これにより、会議端末110bは、例えば、
図9に示すように、時間t2において、共有画像501、及び発話502の出力を開始すると共に、発話なし901の期間の一部又は全部を除外した会議映像を出力することができるようになる。
【0096】
したがって、上記の処理により、会議端末110は、例えば、
図9に示すように、時間t2において、共有画像501、及び発話502の出力を開始すると共に、発話なし901の期間の一部又は全部を除外した会議映像を出力することができるようになる。
【0097】
なお、
図11に示す処理は、共有画像と会議映像との間の時間差を低減しつつ、会議映像の遅延時間の増大を抑制する処理の一例である。例えば、会議端末110bは、
図12に示す処理を実行することにより、共有画像と会議映像との間の時間差を低減しつつ、会議映像の遅延時間の増大を抑制するものであっても良い。
【0098】
(会議端末の処理)
図12は、第2の実施形態に係る共有画像を受信したときの処理の別の一例を示す図である。例えば、他の会議端末と会議を行っている会議端末110は、
図12に示す処理を繰り返し実行する。なお、
図12に示す処理は、会議端末110の制御方法の一例である。
【0099】
ステップS1201において、会議端末110の共有画像受信部405は、会議を行っている他の会議端末から共有画像のデータの受信を開始したかを判断する。
【0100】
共有画像のデータの受信を開始した場合、会議端末110は、ステップS1202以降の処理を実行する。一方、共有画像のデータの受信を開始していない場合、会議端末110は、
図12に示す処理を終了させる。
【0101】
ステップS1202に移行すると、会議端末110の会議映像出力部409は、会議映像の再生を一時的に停止する。
【0102】
ステップS1203において、会議映像出力部409は、共有画像のデータの受信が完了したか否かを判断し、共有画像のデータの受信が完了すると、ステップS1204において、会議映像の再生を再開する。
【0103】
これにより、会議映像出力部409は、共有画像受信部405が共有画像のデータを受信するとき、記憶部408に記憶した会議映像のデータに基づいて会議の音声、及び動画像を所定の期間遅延させて出力することができる。
【0104】
ステップS1205において、会議端末110の検出部801が、発話がない期間を検出すると、ステップS1206の処理が実行される。
【0105】
ステップS1206において、会議端末110の出力制御部802は、例えば、
図10で説明したようにして、発話がない期間を除外した会議映像を、会議映像出力部409に再生させる。
【0106】
上記の処理により、会議端末110は、例えば、
図9に示すように、時間t2において、共有画像501、及び発話502の出力を開始すると共に、発話なし901の期間の一部又は全部を除外した会議映像を出力することができる。
【0107】
以上、第2の実施形態の各処理によれば、共有画像の共有と会議映像の送受信とを行う会議システム100において、共有画像と会議映像との間の時間差を低減しつつ、会議映像の遅延時間の増大を抑制することができるようになる。
【0108】
なお、
図4、8に示す会議映像受信部407は、会議の音声を含む映像データを受信する映像データ受信部、又は音声データを受信する音声データ受信部の一例である。また、会議映像送信部403は、会議の音声を含む映像データを送信する映像データ送信部、又は音声データを送信する音声データ送信部の一例である。前述したように、映像データは、例えば、会議の動画像データを含まない会議の音声データであっても良い。
【0109】
同様に、会議映像出力部409は、記憶部408に記憶されている音声データを、会議映像受信部407による音声データの受信の時期より遅れて出力する出力部の一例である。出力部は、前述したように、会議の動画像、及び音声を所定の期間遅延させて出力することができる。
【符号の説明】
【0110】
100 会議システム100
110 会議端末(端末装置)
110a 会議端末(第1の端末装置)
110b 会議端末(第2の端末装置)
403 会議映像送信部(音声データ送信部、映像データ送信部)
404 共有画像送信部
405 共有画像受信部
406 共有画像表示部
407 会議映像受信部(音声データ受信部、映像データ受信部)
408 記憶部(音声データ記憶部、映像データ記憶部)
409 会議映像出力部(出力部)
801 検出部
802 出力制御部
【先行技術文献】
【特許文献】
【0111】