IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社JVCケンウッドの特許一覧

<>
  • 特開-画像処理装置および画像処理方法 図1
  • 特開-画像処理装置および画像処理方法 図2
  • 特開-画像処理装置および画像処理方法 図3
  • 特開-画像処理装置および画像処理方法 図4
  • 特開-画像処理装置および画像処理方法 図5
  • 特開-画像処理装置および画像処理方法 図6
  • 特開-画像処理装置および画像処理方法 図7A
  • 特開-画像処理装置および画像処理方法 図7B
  • 特開-画像処理装置および画像処理方法 図8
  • 特開-画像処理装置および画像処理方法 図9
  • 特開-画像処理装置および画像処理方法 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024088060
(43)【公開日】2024-07-02
(54)【発明の名称】画像処理装置および画像処理方法
(51)【国際特許分類】
   H04N 19/115 20140101AFI20240625BHJP
   H04N 19/167 20140101ALI20240625BHJP
   H04N 19/17 20140101ALI20240625BHJP
   H04N 23/60 20230101ALI20240625BHJP
   H04N 19/136 20140101ALI20240625BHJP
【FI】
H04N19/115
H04N19/167
H04N19/17
H04N23/60 300
H04N23/60 500
H04N19/136
【審査請求】未請求
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2022203037
(22)【出願日】2022-12-20
(71)【出願人】
【識別番号】308036402
【氏名又は名称】株式会社JVCケンウッド
(74)【代理人】
【識別番号】100083806
【弁理士】
【氏名又は名称】三好 秀和
(74)【代理人】
【識別番号】100101247
【弁理士】
【氏名又は名称】高橋 俊一
(72)【発明者】
【氏名】岡 尚志
(72)【発明者】
【氏名】田所 一美
(72)【発明者】
【氏名】伊藤 優雅
(72)【発明者】
【氏名】熊岡 泰佑
(72)【発明者】
【氏名】宗形 亮太
(72)【発明者】
【氏名】藤井 優美
(72)【発明者】
【氏名】堀切 一輝
【テーマコード(参考)】
5C122
5C159
【Fターム(参考)】
5C122DA08
5C122EA47
5C122EA55
5C122FH01
5C122FH02
5C122FH08
5C122FH09
5C122FK12
5C122FK16
5C122GC17
5C122GC38
5C122GC53
5C122HA02
5C122HA65
5C122HB05
5C159MB02
5C159MB12
5C159TA60
5C159TB18
5C159TC34
5C159UA02
5C159UA05
(57)【要約】
【課題】利用者が、表示されたが顔の画像情報から表情を読み取り易い状態を維持しつつ、当該画像情報の情報量を低減させることが可能な画像処理装置を提供する。
【解決手段】画像処理装置としての利用者端末10A、20Aは、重視部位記憶部162、262と画像情報取得部としての撮像情報取得部174、274と送信情報生成部179、279とを備える。重視部位記憶部162、262は、所定の視認者が人の表情を読み取る際に重視する顔の構成部位を示す重視部位情報を記憶する。撮像情報取得部174、274は、被写体の人物の顔を含む撮像情報を取得する。送信情報生成部179、279は、取得した画像情報のうち、重視部位情報で示される部位を除く画像情報部分に関する情報量を低減させて送信情報を生成し、視認者が視認する表示部を有する装置に送信する。
【選択図】図2
【特許請求の範囲】
【請求項1】
所定の視認者が人の表情を読み取る際に重視する顔の構成部位を示す重視部位情報を記憶する重視部位記憶部と、
被写体の人物の顔を含む画像情報を取得する画像情報取得部と、
前記画像情報取得部が取得した画像情報の中で、前記重視部位情報で示される部位を除く画像情報部分に関する情報量を低減させて送信情報を生成し、前記視認者が視認する表示部を有する装置に送信する送信情報生成部と、を備えた画像処理装置。
【請求項2】
前記送信情報生成部は、前記画像情報取得部が取得した画像情報内の変化量が所定値以上の顔の部位を除く画像情報部分に関する情報量を低減させて前記送信情報を生成する、請求項1に記載の画像処理装置。
【請求項3】
前記送信情報生成部は、前記画像情報取得部が取得した画像情報の中で、所定の画像情報部分の輝度または色の少なくともいずれかの階調数を減らすことで情報量を低減させて、前記送信情報を生成する、請求項1または2に記載の画像処理装置。
【請求項4】
前記重視部位記憶部に記憶される重視部位情報は、前記視認者に関する属性情報、または前記視認者が人の顔を見ている際に検出された前記視認者の視線情報に基づいて生成される、請求項1に記載の画像処理装置。
【請求項5】
画像処理装置が、
所定の視認者が人の表情を読み取る際に重視する顔の構成部位を示す重視部位情報を記憶し、
被写体の人物の顔を含む画像情報を取得し、
取得した画像情報の中で、前記重視部位情報で示される部位を除く画像情報部分に関する情報量を低減させて送信情報を生成し、前記視認者が視認する表示部を有する装置に送信する、画像処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置および画像処理方法に関する。
【背景技術】
【0002】
昨今のコロナウィルスの蔓延に伴って、情報通信技術を利用したテレワークが社会で認知されるようになっている。テレワークでは、複数の利用者がそれぞれ所持する端末で撮影した利用者の顔の撮像情報および収音した利用者の音声情報を、通信ネットワークを用いオンラインでやりとりすることで、利用者同士がコミュニケーションをとる。
【0003】
通信ネットワークを用いてやりとりする情報の中に撮像情報が含まれる場合、通信情報量が膨大になり、これに起因して情報通信に遅延が生じたり、撮像情報の品質が低下したり、さらには音声情報にも不具合が生じたりする場合がある。そのため、リアルタイムで質の高いコミュニケーションをとるには、撮像情報の情報量をなるべく低減させることが求められる。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平6-233292号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
一方で、相手の表情を読み取る際に、顔のどこの部位を重視するかは、文化的な背景や個人それぞれのコミュニケーションスキルによって異なる。例えば日本では、目およびその周辺を重視して表情を読み取る傾向があることが知られている。また、最近の研究でも、コミュニケーションをとる際に、日本人は目元を重視し、一部の外国人は口元を重視する傾向があることが指摘されている。
【0006】
利用者間で顔の撮像情報を用いてコミュニケーションをとる場合には、撮像情報から相手の表情を読み取ることで相手の感情を推測し、コミュケーションの質を上げることができる。そのため、表情を読み取るために重要度が高い部位の情報部分に関しては、撮像情報の情報量を低減させることは好ましくない。
【0007】
しかし、上述したように、相手の表情を読み取る際に、顔のどこの部位を重視するかは人によって異なる。そのため、利用者それぞれが通信相手の表情を読み取り易い状態を維持しつつ、通信でやりとりする撮像情報の情報量を低減させることが困難であるという問題があった。
【0008】
本発明は、利用者が、表示された顔の画像情報から表情を読み取り易い状態を維持しつつ、当該画像情報を装置間で送受信する際の情報量を低減させることが可能な、画像処理装置および画像処理方法を提供することを目的とする。
【課題を解決するための手段】
【0009】
上記目的を達成するための本発明の画像処理装置は、所定の視認者が人の表情を読み取る際に重視する顔の構成部位を示す重視部位情報を記憶する重視部位記憶部と、被写体の人物の顔を含む画像情報を取得する画像情報取得部と、前記画像情報取得部が取得した画像情報の中で、前記重視部位情報で示される部位を除く画像情報部分に関する情報量を低減させて送信情報を生成し、前記視認者が視認する表示部を有する装置に送信する送信情報生成部とを備える。
【0010】
また、本発明の画像処理方法は、画像処理装置が、所定の視認者が人の表情を読み取る際に重視する顔の構成部位を示す重視部位情報を記憶し、被写体の人物の顔を含む画像情報を取得し、取得した画像情報の中で、前記重視部位情報で示される部位を除く画像情報部分に関する情報量を低減させて送信情報を生成し、前記視認者が視認する表示部を有する装置に送信する。
【発明の効果】
【0011】
本発明の画像処理装置および画像処理方法によれば、利用者が、表示された顔の画像情報から表情を読み取り易い状態を維持しつつ、当該画像情報を装置間で送受信する際の情報量を低減させることができる。
【図面の簡単な説明】
【0012】
図1】本発明の第1および第2実施形態による遠隔コミュニケーションシステムの構成を示す全体図である。
図2】本発明の第1実施形態による遠隔コミュニケーションシステム内の第1利用者端末および第2利用者端末の構成を示すブロック図である。
図3】本発明の第1実施形態による遠隔コミュニケーションシステムが動作する際に第1利用者端末および第2利用者端末が実行する処理を示すシーケンス図である。
図4】本発明の第1実施形態による遠隔コミュニケーションシステムにおいて、第1利用者端末が撮像情報内で特定した、重視部位および変化量が所定値以上の部位を示す説明図である。
図5】本発明の第2実施形態による遠隔コミュニケーションシステム内の第1利用者端末および第2利用者端末の構成を示すブロック図である。
図6】本発明の第2実施形態による遠隔コミュニケーションシステムが動作する際に第1利用者端末および第2利用者端末が実行する処理を示すシーケンス図である。
図7A】本発明の第1または第2実施形態による遠隔コミュニケーションシステムの第1利用者端末および第2利用者端末がVR-HMDで構成された場合の出力部と視線検出用カメラ装置と利用者との位置関係を示す説明図である。
図7B】本発明の第1または第2実施形態による遠隔コミュニケーションシステムの第1利用者端末および第2利用者端末内に設置された、人の両目の動きから視線を検出する視線検出用カメラ装置と出力部と利用者との位置関係を示す説明図である。
図8】本発明の他の実施形態による遠隔コミュニケーションシステムの構成を示す全体図である。
図9】本発明の他の実施形態による遠隔コミュニケーションシステムにおいて、利用者端末の出力部に、複数の通信先の利用者端末から取得した撮像情報を同じ大きさで並べて表示した表示情報の一例である。
図10】本発明の他の実施形態による遠隔コミュニケーションシステムにおいて、利用者端末の出力部に、複数の通信先の利用者端末から取得した撮像情報を異なる大きさで並べて表示した表示情報の一例である。
【発明を実施するための形態】
【0013】
以下に、本発明の実施形態による画像処理装置としての機能を含む複数の利用者端末が通信ネットワークを介してオンラインで情報を相互に送受信することで、利用者同士が遠隔でコミュニケーションをとるための処理を行う遠隔コミュニケーションシステムについて説明する。
【0014】
《第1実施形態》
〈第1実施形態による遠隔コミュニケーションシステムの構成〉
図1は、第1実施形態による遠隔コミュニケーションシステム1Aの構成を示す全体図である。遠隔コミュニケーションシステム1Aは、第1利用者端末10Aと第2利用者端末20Aとが、通信ネットワーク30を介して通信可能に接続されて構成されている。
【0015】
第1利用者端末10Aは第1利用者X1が利用する端末であり、第2利用者端末20Aは第2利用者X2が利用する端末である。第1利用者端末10Aと第2利用者端末20Aとは、同様の構成を有している。
【0016】
図2は、第1利用者端末10Aおよび第2利用者端末20Aの構成を示すブロック図である。第1利用者端末10Aは、操作入力部11と、収音部12と、撮像部13と、通信部14と、出力部15と、記憶部16と、演算処理部17Aとを有する。
【0017】
操作入力部11は第1利用者X1による操作情報を入力する。収音部12はマイクロホンで構成され、第1利用者X1が発する音声を入力する。撮像部13はカメラ装置で構成され、第1利用者X1を、顔を含めて撮影する。
【0018】
通信部14は、通信ネットワーク30を介して第2利用者端末20Aと互いに通信する。出力部15は、例えば表示装置およびスピーカ装置で構成され、第2利用者端末20Aから送信された画像情報および音声情報を出力する。第1利用者X1は、出力部15から出力される画像情報を視認し、音声情報を聴く。
【0019】
記憶部16は、ハードディスク、フラッシュメモリ等の不揮発性記憶装置またはRAM(Random Access Memory)等の揮発性記憶装置から構成される。記憶部16は、調整内容記憶部161と、重視部位記憶部162とを有する。
【0020】
調整内容記憶部161は、画像情報内の部分ごとに予め設定された、当該画像情報を他の装置と送受信する際に情報量を下げるための画像調整内容を記憶する。重視部位記憶部162は、予め第2利用者端末20Aから送信された、第2利用者X2が、人の表情を読み取る際に重視する顔の構成部位を示す情報(以下、「第2重視部位情報」と記載する)を記憶する。
【0021】
演算処理部17Aは、例えば汎用のマイクロコンピュータが備えるCPU(中央処理装置)であって、所定の情報処理プログラムをインストールして実行することにより、以下に示す1又は2以上の情報処理部を構成する。
【0022】
演算処理部17Aは、2つ以上の情報処理部として、パラメータ情報処理部171と、重視部位生成部172Aと、音声処理部173と、画像情報取得部としての撮像情報取得部174と、部位検出部175と、装備品検出部176と、変化量算出部177と、調整内容決定部178と、画像調整部としての送信情報生成部179と、出力制御部180とを有する。
【0023】
パラメータ情報処理部171は、第1利用者X1が操作入力部11から入力する、第1利用者X1が人の表情を読み取る際に重視する顔の構成部位を特定するための第1利用者X1の属性に関するパラメータ(以下、「第1パラメータ」と記載する)を取得し、第2利用者端末20Aに送信する。
【0024】
重視部位生成部172Aは、第2利用者端末20Aから送信される、第2利用者X2が人の表情を読み取る際に重視する顔の構成部位を特定するためのパラメータ(以下、「第2パラメータ」と記載する)を取得する。重視部位生成部172Aは、取得した第2パラメータに基づいて第2重視部位情報を生成し、重視部位記憶部162に記憶させる。
【0025】
音声処理部173は、収音部12が収音した第1利用者X1が発する音声の情報を第1音声情報として取得する。
【0026】
撮像情報取得部174は、撮像部13が撮影した、被写体である第1利用者X1の撮像情報を取得する。部位検出部175は、撮像情報取得部174が取得した撮像情報の中から、第1利用者X1の顔の構成部位をそれぞれ検出する。装備品検出部176は、部位検出部175が検出した第1利用者X1の顔の構成部位の情報の中から、眼鏡、サングラス、またはマスク等の装備品を検出する。
【0027】
変化量算出部177は、部位検出部175で検出された顔の構成部位ごとの撮像情報部分に関する、所定時間ごとの変化量を算出する。変化量算出部177は、この変化量を算出する際に、装備品検出部176においてサングラスまたはマスク等の遮光量の多い装備品が検出された構成部位は、変化量の算出処理対象から除く。
【0028】
調整内容決定部178は、第1利用者端末10Aと第2利用者端末20Aとの間でオンラインによる通信が開始すると、重視部位記憶部162に記憶された情報に基づいて撮像情報内の調整部分を特定する。調整部分の詳細については後述する。また調整内容決定部178は、調整部分の特定に関する補助的な処理として、変化量算出部177で算出された変化量が所定値以上の顔の構成部位の撮像情報部分に基づいて、特定した調整部分を補正する。
【0029】
また調整内容決定部178は、調整内容記憶部161に記憶された情報に基づいて、特定した調整部分に関する調整内容を決定する。調整内容の詳細については後述する。
【0030】
送信情報生成部179は、撮像情報取得部174が取得した撮像情報の中で、調整内容決定部178が特定した調整部分を、決定した調整内容に基づいて調整する。送信情報生成部179は、調整した撮像情報を第1撮像情報として、第1音声情報とともに通信部14を介して第2利用者端末20Aに送信する。
【0031】
出力制御部180は、第2利用者端末20Aから送信される、第2利用者X2を撮影した撮像情報である第2撮像情報、および第2利用者X2が発した音声の情報である第2音声情報を取得し、出力部15から出力させる。
【0032】
第2利用者端末20Aは、第1利用者端末10Aと同様の構成を有し、第2利用者X2が入力した第2パラメータを第1利用者端末10Aに送信する機能を有する。第2利用者端末20Aは、第1利用者端末10Aから送信される第1パラメータを取得して記憶する機能、第2利用者X2に関する第2撮像情報および第2音声情報を生成して第1利用者端末10Aに送信する機能を有する。さらに、第2利用者端末20Aは、第1利用者端末10Aから送信された第1撮像情報および第1音声情報を取得して出力させる機能を有する。
【0033】
〈第1実施形態による遠隔コミュニケーションシステムの動作〉
本実施形態による遠隔コミュニケーションシステム1Aの動作について説明する。図3は、遠隔コミュニケーションシステム1Aが動作する際に第1利用者端末10Aおよび第2利用者端末20Aが実行する処理を示すシーケンス図である。
【0034】
ここでは、遠隔コミュニケーションシステム1Aの動作の一例として、第1利用者端末10Aが、被写体である第1利用者X1の顔を撮影し、撮影により生成した撮像情報を、視認者である第2利用者X2に提供するために第2利用者端末X2に送信する処理について説明する。
【0035】
第1利用者端末10Aと第2利用者端末20Aとの間でオンライン通信が開始される前に、第2利用者X2が、人の表情を読み取る際に重視する顔の構成部位を特定するための情報を、第2パラメータとして第2利用者端末20Aの操作入力部21から入力する。この情報は、例えば、第2利用者の属性情報である国籍、出身地、または在住地域等である。また第2利用者X2は、第2パラメータとして、人の表情を読み取る際に重視する顔の構成部位を特定して入力してもよい。
【0036】
パラメータ情報処理部171は、第2利用者X2が第2パラメータとして入力した情報を取得し、通信部24を介して第1利用者端末10Aに送信する(S1)。
【0037】
第1利用者端末10Aでは、第2利用者端末20Aから送信された第2パラメータを、通信部14を介して重視部位生成部172Aが取得する。重視部位生成部172Aは、取得した第2パラメータに基づいて第2重視部位情報を生成する。
【0038】
重視部位生成部172Aは、例えば以下の(1)~(4)のように、第2重視部位情報を生成する。
【0039】
(1) 第2パラメータとして、第2利用者X2の国籍の情報「日本」を取得した場合、日本人の特性に基づいて、目を重視することを示す第2重視部位情報を生成する。
【0040】
(2) 第2パラメータとして、第2利用者X2の在住地域の情報「沖縄」を取得した場合、温暖地域ではサングラスをかけている人が多いことから目を重視することを避け、目以外の部位、例えば口元を重視することを示す第2重視部位情報を生成する。
【0041】
(3) 第2パラメータとして、第2利用者X2の在住地域の情報「北海道」を取得した場合、寒冷地域では防寒具としてマスクを着用することが多いことから口を重視することを避け、目およびその周辺の部位を重視することを示す第2重視部位情報を生成する。
【0042】
(4) 第2パラメータとして、第2利用者X2が人の表情を読み取る際に重視する顔の構成部位を特定して入力した情報、例えば入力情報「目」を取得した場合、この入力情報を、それ以外の情報、例えば国籍、出身地、または在住地域の情報よりも優先して用いて、第2重視部位情報を生成する。
【0043】
一般的に、人の顔は、笑みを浮かべているときには目尻が下がり、不機嫌なときには口角が下がるように変化するため、人の表情を読み取る際に重視する顔の構成部位としては、目や口の周辺の情報も重要である。そのため、本実施形態では、第1重視部位情報及び第2重視部位情報で用いる「目」の情報には目の周辺の目尻を含み、「口」の情報には口の周辺の口角を含む。
【0044】
重視部位生成部172Aは、生成した第2重視部位情報を、重視部位記憶部162に記憶させる(S2)。この重視部位記憶部162に記憶された第2重視部位情報は、以降に撮像情報の調整処理が実行される間、変化しない静的な情報である。
【0045】
上述したように第2重視部位情報が記憶された状態で、第1利用者端末10Aと第2利用者端末20Aとの間でオンライン通信が開始されると(S3)、第1利用者X1が発する音声を収音部12が収音する処理を開始する。音声処理部173は、収音部12が収音した音声の情報を第1音声情報として取得する。また、オンライン通信が開始されると、撮像部13が第1利用者X1の撮影を開始する。撮像情報取得部174は、撮像部13が撮影した撮像情報を取得する。
【0046】
部位検出部175は、撮像情報取得部174が取得した撮像情報の中から、第1利用者X1の顔の構成部位をそれぞれ検出する。顔の構成部位は、例えば、目、眉、鼻、口、頬、耳、輪郭、髪等である。眉間は表情を読み取る際に重要な部位であるため、部位検出部175の検出対象として含める。
【0047】
また、装備品検出部176は、部位検出部175が検出した第1利用者X1の顔の構成部位の情報の中から、眼鏡、サングラス、またはマスク等の装備品を検出する(S4)。
【0048】
変化量算出部177は、部位検出部175で検出された顔の構成部位ごとの撮像情報部分に関する、所定時間ごとの変化量を算出する(S5)。ここで、第1利用者X1が笑顔になると、眉は山型に丸くなり、目は細くなり、場合によっては目尻に皺ができ、口角が上がり、歯が見えるほど口が開き、場合によっては頬に皺ができる。また、第1利用者X1が怒っている場合には、眉の先端が上がり、これにつられて目尻が上がり、眉間に皺ができ、口角が下がる。
【0049】
変化量算出部177は、このような構成部位ごとの撮像情報の変化量を算出する。変化量算出部177は、感情が変化したときにのみ現れる皺の位置を、常時認識可能な部位である目、口等からの相対位置として予め設定しておくことで、精度良く皺の変化量を算出することができる。
【0050】
なお変化量算出部177は、構成部位「口」については、第1利用者X1が話しているかどうかを判断して、話している場合は変化量を検出せず、話していない場合に変化量、例えば歯が見えるかなどの変化量を検出するようにしてもよい。このように口の部位の変化量を検出することで、精度良く第1利用者X1の表情を読み取ることができる。
【0051】
また、第1利用者X1がサングラスをかけている場合には目およびその周辺の画像情報部分は変化せず、マスクをしている場合には口元の画像情報部分は変化しない。そこで変化量算出部177は、装備品検出部176においてサングラスまたはマスク等の遮光量の多い装備品が検出されている場合には、対応する部位である目または口は、変化量の算出対象から除く。
【0052】
一方、装備品検出部176において装備品として眼鏡が検出されている場合には、目およびその周辺の画像情報部分の変化を認識することが可能であるため、変化量算出部177は、対応する部位である目を変化量の算出対象に含める。このように処理を行うことで、変化量算出部177は、効率良く、構成部位ごとの撮像情報の変化量を算出することができる。ここで算出される構成部位ごとの撮像情報の変化量は、オンライン通信が行われている間に第1利用者X1の状態によって変更する、動的な情報である。
【0053】
調整内容決定部178は、重視部位記憶部162に記憶された情報、および変化量算出部177で算出された顔の構成部位ごとの撮像情報部分の変化量に基づいて、画像情報内の調整部分を特定する。
【0054】
具体的には、調整内容決定部178は、まず第2重視部位情報で示される顔の構成部位を除く画像部分、つまり第2利用者X2が重視しないと考えられる画像部分を、調整部分として特定する。次に調整内容決定部178は、変化量算出部177で算出された顔の構成部位ごとの撮像情報部分の変化量の情報を補助的に用いて、特定した調整部分を補正する。
【0055】
例えば、調整内容決定部178が、第2重視部位情報で示される顔の構成部位が「目」であり、目を除く画像部分を調整部分として特定したとする。そして、変化量算出部177において、所定値以上の変化量が算出された構成部位が、眉、口、および頬であったとする。
【0056】
この場合、調整内容決定部178は、これらの情報に基づいて図4に示すように、第2重視部位情報で示される部位である目の情報部分C1、および所定値以上の変化量が算出された部位である眉の情報部分C2、口の情報部分C3、および頬の情報部分C4を除く撮像情報部分を調整部分として特定する。調整内容決定部178は、第2重視部位情報で示される部位の情報よりも、所定値以上の変化量が算出された部位の情報を優先して用いて、該当する部位を除く撮像情報部分を調整部分として特定してもよい。
【0057】
このように処理を行うことで、第2重視部位情報で示される部位と、利用者が実際に話す際に変化量が多い部位とが異なる場合に、撮像情報の中で調整部分を適宜補正することができる。
【0058】
例えば、日本人は目から表情や感情を読み取ることが多いとして、国籍が日本の第2利用者X2に対して目を重視することを示す第2重視重視部位情報を生成していた場合であっても、第2利用者X2が必ずしも第1利用者X1の撮像情報内の目の部位を重視するとは限らない。
【0059】
そのため、リアルタイムで第1利用者X1の顔の部位の変化量を算出し、これに基づいて調整部分を適宜補正することで、実際には第1利用者X1の目の変化量が少なく、口およびその周辺の変化量が多いことにより第2利用者X2が口元を重視する可能性が高いときには、これに基づいて調整部分を補正することで、第2利用者X2が重視する部分の画質を下げないようにすることができる。
【0060】
次に調整内容決定部178は、調整内容記憶部161に記憶された情報に基づいて、特定した調整部分に関する調整内容を決定する(S6)。調整内容決定部178は例えば、調整部分である髪や顔の輪郭部分に関する撮像情報部分の輝度または色の少なくともいずれかの階調を下げて画質を下げることを決定する。このように画質を下げることで、撮像情報を通信ネットワーク30に送出する際の圧縮率が高くなり、通信負荷を低減させることができる。
【0061】
送信情報生成部179は、撮像情報取得部174が取得した撮像情報の中で、調整内容決定部178が特定した調整部分を、決定した調整内容に基づいて調整する。送信情報生成部179は、調整した撮像情報を第1撮像情報として、第1音声情報とともに通信部14を介して第2利用者端末20Aに送信する(S7)。
【0062】
第2利用者端末20Aでは、第1利用者端末10Aから送信された第1撮像情報および第1音声情報を出力制御部280が取得し、出力部25から出力させる(S8)。第2利用者X2は、出力部25から出力された第1撮像情報を視認し、第1音声情報を認識する。出力部25に出力された第1撮像情報は、第2利用者X2が重視する顔の部位が精度の高い画像情報で表示されているため、第2利用者X2は、第1利用者X1の表情を読み取り易い状態で第1撮像情報を視認することができる。
【0063】
また、第1利用者端末10Aにおいても同様に、第1利用者X1が入力したパラメータに基づいて第2利用者端末20Aで生成された第2撮像情報および第2音声情報を取得して出力させる。第1利用者X1は、出力部15から出力された第2撮像情報を視認し、第2音声情報を認識する。出力部15に出力された第2撮像情報は、第1利用者X1が重視する顔の部位が精度の高い画像情報で表示されているため、第1利用者X1は、第2利用者X1の表情を読み取り易い状態で第2撮像情報を視認することができる。
【0064】
オンライン通信の実行中、ステップS4~S6の処理を所定時間間隔で繰り返すことで、第1利用者X1または第2利用者X2の顔の中で変化量の多い部位が変わった際に、これに応じて調整部分を適宜変更するようにしてもよい。
【0065】
以上の第1実施形態によれば、第1利用者X1が操作する第1利用者端末10Aと、第2利用者X2が操作する第2利用者端末20Aとの間でオンライン通信を行う際に、双方の利用者が相手の撮像情報から表情を読み取り易い状態を維持しつつ、送受信時の撮像情報の情報量を低減させて通信負荷を低減させることができる。
【0066】
《第2実施形態》
〈第2実施形態による遠隔コミュニケーションシステムの構成〉
第2実施形態による遠隔コミュニケーションシステム1Bは、図1に示すように、第1利用者端末10Bと第2利用者端末20Bとが、通信ネットワーク30を介して通信可能に接続されて構成されている。
【0067】
図5は、第1利用者端末10Bおよび第2利用者端末20Bの構成を示すブロック図である。第1利用者端末10Bは、視線検出用カメラ装置18、および演算処理部17B内の視認部位判定部181を有する他は、第1実施形態で説明した第1利用者端末10Aと同様の構成有する。また第2利用者端末20Bも、視線検出用カメラ装置28、および演算処理部27B内の視認部位判定部281を有する他は、第1実施形態で説明した第2利用者端末20Aと同様の構成有する。そのため、第1実施形態で説明した第1利用者端末10A、第2利用者端末20Aと同一機能を有する部分の詳細な説明は省略する。
【0068】
視線検出用カメラ装置18は、第1利用者X1の目を撮影する。視認部位判定部181は、出力部15に人の顔の画像情報が表示されているときに、視線検出用カメラ装置18が撮影した撮像情報に基づいて、表示情報を視認している第1利用者X1の視線を検出する。
【0069】
視認部位判定部181は、検出した情報に基づいて、出力部15に表示されている人の顔の画像情報内で、第1利用者X1が視認している部位を判定する。視認部位判定部181は、第1利用者X1が視認していると判定した部位を示す第1視認部位情報を生成し、第2利用者端末20Bに送信する。
【0070】
視線検出用カメラ装置28は、第2利用者X2の目を撮影する。視認部位判定部281は、出力部25に人の顔の画像情報が表示されているときに、視線検出用カメラ装置28が撮影した撮像情報に基づいて、表示情報を視認している第2利用者X2の視線を検出する。
【0071】
視認部位判定部281は、検出した情報に基づいて、出力部25に表示されている人の顔の画像情報内で、第2利用者X2が視認している部位を判定する。視認部位判定部281は、第2利用者X2が視認していると判定した部位を示す第2視認部位情報を生成し、第1利用者端末10Bに送信する。
【0072】
重視部位生成部172Bは、第2利用者端末20Bから送信された第2視認部位情報を取得し、取得した情報に基づいて第2重視部位情報を生成し、重視部位記憶部162に記憶させる。
【0073】
重視部位生成部272Bは、第1利用者端末10Bから送信された第1視認部位情報を取得し、取得した情報に基づいて第1重視部位情報を生成し、重視部位記憶部262に記憶させる。
【0074】
〈第2実施形態による遠隔コミュニケーションシステムの動作〉
図6は、遠隔コミュニケーションシステム1Bが動作する際に第1利用者端末10Bおよび第2利用者端末20Bが実行する処理を示すシーケンス図である。
【0075】
第1利用者端末10Bと第2利用者端末20Bとの間でオンライン通信が開始されると、第1利用者X1が発する音声を収音部12が収音する処理を開始する。音声処理部173は、収音部12が収音した音声の情報を第1音声情報として取得する。また、オンライン通信が開始されると、撮像部13が第1利用者X1の撮影を開始する。撮像情報取得部174は、撮像部13が撮影した撮像情報を取得する。
【0076】
部位検出部175は、撮像情報取得部174が取得した撮像情報の中から、第1利用者X1の顔の構成部位をそれぞれ検出する。また、装備品検出部176は、部位検出部175が検出した第1利用者X1の顔の構成部位の情報の中から、眼鏡、サングラス、またはマスク等の装備品を検出する(S12)。
【0077】
オンライン通信が開始すると第2利用者端末20Bでは、第2利用者X2の視線を検出し、検出した情報に基づいて第2視認部位情報を生成する。第2利用者端末20Bが実行する、第2視認部位情報の生成処理について説明する。
【0078】
図7Aは、第1利用者端末10Bおよび第2利用者端末20BがVR-HMD(Virtual Reality-Head Mounted Display)で構成された場合における、出力部15、25と、視線検出用カメラ装置18、28と、第1利用者X1、第2利用者X2との位置関係を示す説明図である。VR-HMDで構成された第1利用者端末10Bおよび第2利用者端末20Bは、内蔵する光学系Lに対して、利用者の眼球位置がある程度固定されるように設計されている。
【0079】
第2利用者X2がVR-HMDで構成された第2利用者端末20Bを装着し、出力部25に人が話している動画を表示させ、第2利用者X2がこの動画を視認している状態で、視線検出用カメラ装置28が第2利用者X2の目を撮影すると、撮像情報を視認部位判定部281が取得し、これを解析して第2利用者X2の視線を検出する。
【0080】
視認部位判定部281は、検出した第2利用者X2の視線の情報と、光学系Lに対する利用者の両目の相対位置とに基づいて、第2利用者X2が動画内の視認している位置、つまり人の顔の中の視認している部位を判定し、判定した部位を示す第2視認部位情報を生成する。
【0081】
また、図7Bは、第1利用者端末10Bおよび第2利用者端末20B内で、視線検出用カメラ装置18、28が、出力部15、25内の所定位置に設置されている場合における、出力部15、25と、視線検出用カメラ装置18、28と、第1利用者X1、第2利用者X2との位置関係を示す説明図である。
【0082】
この場合、第2利用者端末20Bが出力部25に人が話している動画を表示させ、第2利用者X2がこの動画を視認している状態で、視線検出用カメラ装置28が第2利用者X2の両目を撮影すると、撮像情報を視認部位判定部281が取得し、これを解析して第2利用者X2の視線を検出する。
【0083】
視認部位判定部281は、検出した第2利用者X2の視線の情報と、第2利用者X2の目の位置と、出力部25の位置と、出力部25内における視線検出用カメラ装置28の位置とに基づいて、第2利用者X2が動画内の視認している位置、つまり人の顔の中の視認している部位を判定し、判定した部位を示す第2視認部位情報を生成する。
【0084】
視認部位判定部281は、生成した第2視認部位情報を、第1利用者端末X1に送信する(S13)。
【0085】
第1利用者端末10Bでは、重視部位生成部172Bが、第2利用者端末20Bから送信された第2視認部位情報を取得し、取得した情報に基づいて第2重視部位情報を生成する。具体的には、重視部位生成部172Bは、取得した第2視認部位情報で示される部位を、第2利用者X2が重視する部位として第2重視部位情報を生成する。ここで算出される第2重視部位情報は、オンライン通信が行われている間に第2利用者X2の視線情報によって変更する、動的な情報である。重視部位生成部172Bは、生成した第2重視部位情報を調整内容決定部178に送出する。
【0086】
調整内容決定部178は、重視部位生成部172Bで生成されたに基づいて、画像情報内の調整部分を特定する。その際、調整内容決定部178は、第1実施形態で説明した場合と同様に、変化量算出部177で算出された顔の構成部位ごとの撮像情報部分の変化量に基づいて調整部分を補正してもよい。また調整内容決定部178は、調整内容記憶部161に記憶された情報に基づいて、特定した調整部分に関する調整内容を決定する(S14)。
【0087】
以降、ステップS15、S16で実行する処理は、第1実施形態で説明したステップS7、S8の処理と同様であるため、詳細な説明は省略する。
【0088】
以上の第2実施形態によれば、第1利用者X1が操作する第1利用者端末10Bと、第2利用者X2が操作する第2利用者端末20Bとの間でオンライン通信を行う際に、それぞれの利用者端末が、通信先の利用者端末を操作する利用者の実際の視線情報に基づいて、自端末で撮影した撮像情報の情報量を減らすための調整部分を特定する。このように処理を行うことで、さらに精度良く、双方の利用者が相手の撮像情報から表情を読み取り易い状態を維持しつつ、送受信時の撮像情報の情報量を低減させて通信負荷を低減させることができる。
【0089】
上述した第2実施形態においては、各利用車端末10B、20Bが、通信先の利用者端末を利用する利用者の視線情報に基づく重視部位情報を、オンライン通信を行う前に予め取得して記憶しておき、オンライン通信が開始するとこの記憶した情報を用いて送信情報を生成する場合について説明した。しかしこれには限定されず、オンライン通信中に、通信先の利用者端末を利用する利用者の視線情報から生成された重視部位情報を適宜取得し、以降は新たに取得した重視部位情報を用いて送信情報を生成するようにしてもよい。
【0090】
このように処理を行うことにより、視認者が実際に重視している顔の部位を当該視認者が見易い状態で、撮像情報を表示させることができる。
【0091】
上述した第1および第2実施形態では、第1利用者端末10A、10Bと、第2利用者端末20A、20Bそれぞれが、自端末で撮影した撮像情報を調整して通信先の利用者端末に送信する遠隔コミュニケーションシステム1A、1Bについて説明した。しかしこの形態には限定されず、図8に示すように、第1利用者端末10Cと第2利用者端末20Cと管理サーバ40とが通信ネットワーク30を介して通信可能になるような遠隔コミュニケーションシステム1Cを構成してもよい。
【0092】
この遠隔コミュニケーションシステム1Cでは、管理サーバ40が、第1実施形態で説明した第1利用者端末10A内の記憶部16、演算処理部17Aおよび第2利用者端末20A内の記憶部26、演算処理部27A、または、第2実施形態で説明した第1利用者端末10B内の記憶部16、演算処理部17Bおよび第2利用者端末20B内の記憶部26、演算処理部27Bの機能を有する。
【0093】
そして、管理サーバ40は、第1利用者端末10A、10Bで撮影された撮像情報を取得して適宜調整し、第2利用者端末20A、20Bに送信する。また管理サーバ40は、第2利用者端末20A、20Bで撮影された撮像情報を取得して適宜調整し、第1利用者端末10A、10Bに送信する。
【0094】
このように遠隔コミュニケーションシステム1Cを構成することで、撮像情報の調整処理を、管理サーバ40で一元化して効率良く実行することができる。また第1利用者端末10Cおよび第2利用者端末20Cは、操作入力部、撮像部、収音部、通信部、および出力部を有していればよく、撮像情報を調整するための専用のアプリケーション等を搭載する必要がない。
【0095】
また、上述した第1および第2実施形態においては、遠隔コミュニケーションシステム1A、1Bがそれぞれ2台の利用者端末(第1利用者端末と第2利用者端末)を有し、この2台の利用者端末間でオンライン通信を実行する場合について説明した。しかしこれには限定されず、3台以上の利用者端末間でオンライン通信を行う遠隔コミュニケーションシステムを構築してもよい。
【0096】
このように構成された遠隔コミュニケーションシステムでは、複数の利用者端末がそれぞれ、通信先の利用者端末ごとの重視部位情報を記憶しておき、自端末で撮影した撮像情報を各重視部位情報に基づいて調整して、通信先の利用者端末ごとの送信情報を生成する。そして、各利用者端末は、生成した通信先の利用者端末ごとの送信情報を、それぞれ該当する通信先の利用者端末に送信する。
【0097】
各利用者端末では、他の利用者端末から送信された送信情報を取得し、図9に示すように通信先の利用者端末ごとの撮像情報を並べて表示する。図9は、所定の利用者端末の出力部に、通信先の6台の利用者端末から取得された撮像情報が同じ大きさで一画面上に並べて表示された場合の例を示している。この図9の情報を視認する利用者に関しては、目を重視する重視部位情報が各利用者端末に記憶されており、例えば目およびその周辺の画質は低下させず、それ以外の部位の画質を低下させて、撮像情報が生成されている。
【0098】
また、3台以上の利用者端末間でオンライン通信を行う場合に、図8に示したように構築した遠隔コミュニケーションシステムの管理サーバ40で、各利用車端末で撮影された撮像情報の調整処理を行うようにすることで、送信先の利用者端末ごとに生成する複数の撮像情報の調整処理をまとめて効率良く実行することができる。
【0099】
また、3台以上の利用者端末間でオンライン通信を行う場合、各利用車端末が、通信先の利用者端末から取得した複数の撮像情報を出力部に表示させる際に、図10に示すように、話し手になっている利用者の撮像情報を大きくし、他の利用者の撮像情報は上部に小さくして異なる大きさで一画面上に並べて表示させるようにしてもよい。
【0100】
この場合、管理サーバ40は、大きく表示させる撮像情報の所定部位に対してのみ画質を低下させてもよいし、小さく表示させる撮像情報全体の画質を低下させてもよい。このように処理を行うことで、管理サーバ40の処理負荷を低減させることができる。
【0101】
また、上述した実施形態では、撮像情報内の重視部位を除く画像部分の画質を下げることで撮像情報の送信時の圧縮率を高めて送信情報量を調整する場合について説明したが、撮像情報全体としての送信情報量が低下するのであれば、重視部位の画像部分の画質を高くする処理を加えてもよい。このように処理を加えることで、さらに利用者が表情を読み取りやすい状態で、撮像情報を表示させることができる。
【符号の説明】
【0102】
1A、1B、1C 遠隔コミュニケーションシステム
10A、10B、10C 第1利用者端末
11、21 操作入力部
12、22 収音部
13、23 撮像部
14、24 通信部
15、25 出力部
16、26 記憶部
17A、27A、17B、27B 演算処理部
18、28 視線検出用カメラ装置
20A、20B、20C 第2利用者端末
30 通信ネットワーク
40 管理サーバ
161、261 調整内容記憶部
162、262 重視部位記憶部
171 パラメータ情報処理部
172A、272A、172B、272B 重視部位生成部
173、273 音声処理部
174、274 撮像情報取得部
175、275 部位検出部
176、276 装備品検出部
177、277 変化量算出部
178、278 調整内容決定部
179、279 送信情報生成部
180、280 出力制御部
181、281 視認部位判定部
図1
図2
図3
図4
図5
図6
図7A
図7B
図8
図9
図10