(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022092747
(43)【公開日】2022-06-23
(54)【発明の名称】表示画像処理システム及び表示画像処理装置
(51)【国際特許分類】
G06T 19/00 20110101AFI20220616BHJP
G06T 1/00 20060101ALI20220616BHJP
【FI】
G06T19/00 A
G06T1/00 340A
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2020205631
(22)【出願日】2020-12-11
(71)【出願人】
【識別番号】593165487
【氏名又は名称】学校法人金沢工業大学
(74)【代理人】
【識別番号】100114074
【弁理士】
【氏名又は名称】大谷 嘉一
(74)【代理人】
【識別番号】100222324
【弁理士】
【氏名又は名称】西野 千明
(72)【発明者】
【氏名】坂 知樹
【テーマコード(参考)】
5B050
5B057
【Fターム(参考)】
5B050AA08
5B050BA04
5B050BA06
5B050BA12
5B050CA01
5B050DA07
5B050EA07
5B050EA27
5B050FA02
5B057AA20
5B057BA02
5B057CA12
5B057CA16
5B057CB13
5B057CB16
5B057CD14
5B057DA06
5B057DB02
(57)【要約】
【課題】Web会議システム等を利用するユーザ同士が容易に視線を合わせてコミュニケーション可能な表示画像処理システム及び表示画像処理装置の提供を目的とする。
【解決手段】表示画面を視るユーザを複数のカメラから撮影して複数の撮影画像を取得する撮影画像取得手段と、前記複数の撮影画像から前記ユーザの立体情報を取得する立体情報取得手段と、前記立体情報から前記表示画面を視るユーザの正面画像を作成する画像作成手段と、前記正面画像を表示画面に表示するように制御する表示制御手段と、を備えることを特徴とする。
【選択図】
図1
【特許請求の範囲】
【請求項1】
表示画面を視るユーザを複数のカメラから撮影して複数の撮影画像を取得する撮影画像取得手段と、
前記複数の撮影画像から前記ユーザの立体情報を取得する立体情報取得手段と、
前記立体情報から前記表示画面を視るユーザの正面画像を作成する画像作成手段と、
前記正面画像を表示画面に表示するように制御する表示制御手段と、
を備えることを特徴とする表示画像処理システム。
【請求項2】
前記表示画面は前記複数のカメラの間に介在し、
前記撮影画像取得手段は、前記表示画面を視るユーザの顔領域を特定可能であることを特徴とする請求項1に記載の表示画像処理システム。
【請求項3】
前記立体情報取得手段は、ステレオマッチングにより立体情報を取得することを特徴とする請求項1又は2に記載の表示画像処理システム。
【請求項4】
前記画像作成手段は、表示画面内に仮想カメラを設けて撮影したような該仮想カメラを視るユーザの正面画像を作成することを特徴とする請求項1~3のいずれかに記載の表示画像処理システム。
【請求項5】
前記画像作成手段は、仮想カメラ位置における前記ユーザの特徴点の透視投影像を作成することを特徴とする請求項4に記載の表示画像処理システム。
【請求項6】
請求項1~5のいずれかに記載の表示画像処理システムを備えた表示画像処理装置であって、
複数のカメラと、該複数のカメラの間に介在する表示画面とを有することを特徴とする表示画像処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、表示画像処理システム及び表示画像処理装置に関する。
【背景技術】
【0002】
近年、ネットワークを介して互いに音声や画像を送受信することにより対話ができるWeb会議システムが、会議や面接、飲み会等の様々な場面で利用されている。
例えば、特許文献1のような画像入力装置付きラップトップ型コンピュータを使用した場合には、表示画面(平面ディスプレイ)の上部の略中央部に配設したカメラ(小型カメラ)から被写体であるユーザの画像を撮影できる。
また、特許文献2のように携帯端末を用いてWeb会議システムを利用する場合には、表示画面(表示器)の上部等にあらかじめ搭載されているカメラを用いて画像を撮影できる。
【0003】
上記のようにカメラで撮影した画像は、カメラから視たユーザの画像として相手ユーザの表示画面に表示される。
すなわち、ユーザがカメラを視ながら話をすれば、表示画面に表示されるユーザの目は相手ユーザを直視しているような画像となり、まるで対面で会話しているような自然な感じに映る。
しかしながら、カメラを視ることで表示画面から視線が外れ、表示画面に表示される相手ユーザの顔などを確認できないために、多くのユーザは自然と表示画面を視ながら話をし、カメラから視線をずらしてしまう。
これにより、表示画面に表示されるユーザの目は下などを向いてしまう。
このように、ユーザ同士が視線を合わせて対話することが難しいため、Web会議等において相手ユーザとの良好なコミュニケーションは取りづらいものとなっている。
また、表示画面の中央付近にカメラを設置することで表示画面を視るユーザを正面から
撮影できるが、この場合にはカメラが表示画面を遮蔽してしまう問題がある。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平5-66855号公報
【特許文献2】特開2015-82207号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明は、Web会議システム等を利用するユーザ同士が容易に視線を合わせてコミュニケーション可能な表示画像処理システム及び表示画像処理装置の提供を目的とする。
【課題を解決するための手段】
【0006】
本発明に係る表示画像処理システムは、表示画面を視るユーザを複数のカメラから撮影して複数の撮影画像を取得する撮影画像取得手段と、前記複数の撮影画像から前記ユーザの立体情報を取得する立体情報取得手段と、前記立体情報から前記表示画面を視るユーザの正面画像を作成する画像作成手段と、前記正面画像を表示画面に表示するように制御する表示制御手段と、を備えることを特徴とする。
複数のカメラから撮影して得られる複数の撮影画像は、いずれも2次元の画像データである。
この2次元の画像データから3次元の情報である立体情報を得ることで、立体情報の中からユーザの正面画像を作成するのに必要なデータを得ることができる。
これにより、ユーザが実際にカメラを視ていなくても、まるで表示画面内に設けたカメラから撮影したような表示画面を視るユーザの正面画像を仮想的に作成できる。
【0007】
本発明において、前記表示画面は前記複数のカメラの間に介在し、前記撮影画像取得手段は、前記表示画面を視るユーザの顔領域を特定可能であることが好ましい。
複数のカメラは、例えば、表示画面の両脇(上下方向又は左右方向等)に表示画面を挟むように設置されていても、設置可能であってもよい。
また、本発明において、前記立体情報取得手段は、ステレオマッチングにより立体情報を取得してもよい。
【0008】
本発明において、前記画像作成手段は、表示画面内に仮想カメラを設けて撮影したような該仮想カメラを視るユーザの正面画像を作成することが好ましい。
仮想カメラは、表示画面内であれば特にその位置は限定されない。
また、前記画像作成手段は、仮想カメラ位置における前記ユーザの特徴点の透視投影像を作成してもよい。
【0009】
本発明に係る表示画像処理装置は、上記に記載の表示画像処理システムを備えた表示画像処理装置であって、複数のカメラと、該複数のカメラの間に介在する表示画面とを有することを特徴とする。
【発明の効果】
【0010】
本発明によれば、ユーザがカメラではなく表示画面を視たままの状態で、まるで表示画面内に設けたカメラを視ているような画像を仮想的に作成できるため、Web会議システム等を利用するユーザ同士の視線を合わせた対話を容易に可能とする。
【図面の簡単な説明】
【0011】
【
図1】本発明に係る表示画像処理システムの構成例をブロック図で示す。
【
図2】表示画像処理システムによる処理の流れをフローチャートで示す。
【
図3】(a)、(b)は本発明に係る表示画像処理装置の構成例の一部を模式図で示し、(c)はその表示画面に表示される画像の一例を示す。
【
図4】本発明に係る技術思想を説明するための模式図を示す。
【
図5】(a)、(b)は従来装置の構成例の一部を模式図で示し、(c)はその表示画面に表示される画像の一例を示す。
【発明を実施するための形態】
【0012】
本発明に係る表示画像処置システム及び表示画像処理装置について、以下、図に基づいて説明する。
図1に本発明に係る表示画像処理システムの構成例をブロック図で示し、
図2にその処理の流れをフローチャートで示す。
また、
図3に本発明に係る表示画像処理装置の構成例の一部を模式図で示し、
図4に本発明に係る技術思想を説明するための模式図を、
図5に従来装置20の構成例の一部を模式図で示す。
【0013】
従来装置20は、プロセッサ、メモリ、ストレージ、通信インタフェース等の他に、表示画面11とカメラ12を備えるパーソナルコンピュータなどであり、ネットワークを介して会議サーバへアクセスできる。
例えば、プロセッサにWeb会議の開始指示が入力されることで、特定のコンピュータプログラムを実行し、会議サーバへアクセスする。
会議サーバは、従来装置20等を使用するユーザ間での会議を実現するためのサーバである。
【0014】
従来装置20を用いてWeb会議をする場合、例えば
図5(a)に示すように表示画面11の上側に配置したカメラ12を用いてユーザ1を撮影することで、
図5(c)に示す表示画面11内のグラフィカルユーザインタフェースである表示部11aにユーザ1が表示される。
このとき、ユーザ1がカメラ12ではなく表示画面11を視ることで、カメラ12にはカメラ12よりも下側の表示画面11を視るユーザ1が撮影され、カメラ12が出力した撮影画像はそのまま表示部11aに表示される。
これにより、表示部11aにはユーザ1の視線が下側を向いた状態、すなわち目2の下側に黒目2aが位置する画像として表示される。
また、
図5(b)に示すように表示画面11の右側に配置したカメラ12を用いてユーザ3を撮影することで、
図5(c)に示すように表示画面11内の表示部11bにユーザ3が表示される。
このとき、ユーザ3がカメラ12ではなく表示画面11を視ることで、表示部11bにはユーザ3の視線が左側を向いた状態、すなわち目4の左側に黒目4aが位置する画像として表示される。
そのため、従来装置20を用いたWeb会議では、表示画面11に表示されるユーザ1,3(相手ユーザ及び/又はユーザである自分)と、表示画面11を視るユーザ3,1とが、視線を合わせて対話することが困難であった。
【0015】
そこで、本発明に係る表示画像処理装置10は、表示画面11を挟むように複数のカメラ12,13を配置し、会議サーバへアクセスするとプロセッサ等が表示画像処理装置システム100を機能させるものとした。
図4に示すように、例えばユーザ1が
図3(a)に示す表示画像処理装置10の表示画面11を視ると、表示画面11の左側に配置したカメラ12からは撮影画像12aが撮影され、表示画面11の右側に配置したカメラ13からは撮影画像13aが撮影される。
このとき、撮影画像12aに表示されるユーザ1の目2は、黒目2aが右側に位置し、撮影画像13aでは黒目2aが左側に位置することになる。
そこで、本発明においては、例えばカメラ12,13のおよそ中央位置に仮想カメラ14があると仮想的に設定し、仮想カメラ14から視たユーザ1の正面画像(仮想画像14a)を作成することで、これを表示画面11に表示する。
これにより、ユーザ1がカメラ12、13ではなく表示画面11を視ながら話をしても、表示画面11内に仮想カメラ14を設けて撮影したようなユーザ1の正面画像、具体的には、
図3(c)に示すようにユーザ1の目2のおよそ中央に黒目2aが位置するような画像として表示部11aに表示可能となる。
以下、本発明に係る表示画像処置システム100及び表示画像処理装置10について、より詳細に説明する。
【0016】
表示画像処理装置10は、例えばネットワーク通信機能を備えるパーソナルコンピュータ、タブレット端末、携帯端末などであり、ネットワークを介して会議サーバとデータ通信が可能である。
会議サーバは、表示画像処理装置10等を使用するユーザ間での会議を実現するためのサーバであり、表示画像処理装置10が会議サーバへアクセスすることで、Web会議システムの利用が可能となる。
表示画像処理装置10は、プロセッサ、メモリ、ストレージ、通信インタフェース等の他に、少なくとも
図3に示すような表示画面11と、複数のカメラ12、13を備える。
表示画面11は、例えば音声を出力するスピーカを内蔵した液晶ディスプレイなどであり、プロセッサにより制御されて各種情報を表示する。
複数のカメラ12、13は、少なくとも2台以上のカメラであり、表示画面11を挟むように表示画面11の両脇(上下方向、左右方向又は対角方向等)に配置され、表示画面11を視るユーザを撮影する。
例えば
図3(a)に示すように、カメラ12、13を表示画面11の左右方向両脇に配置した横長の表示画像処理装置10は、90度回転することで
図3(b)に示すような縦長の表示画像処理装置10として使用してもよい。
また、表示画像処理装置10は、表示画面11の両脇にカメラ12、13を設置した状態で市場に流通するものであってもよく、カメラ12、13等を表示画面11に対して後から備え付け可能なものであってもよい。
カメラ12,13は、例えばマイクロフォンが内蔵されており、マイクロフォンにより集音された音声成分を含む撮影画像を撮影でき、カメラ12、13が出力した撮影画像はプロセッサに入力される。
表示画像処理装置10は、プロセッサ等に予め表示画像処理システム100を備えているものであってもよいし、後から表示画像処理システム100を備え付けられるものであってもよい。
【0017】
以下、
図3に示す表示画像処理装置10に備えた表示画像処理システム100を実施例にして、詳細に説明する。
表示画像処理システム100は、
図1に示すように撮影画像取得手段110と、立体情報取得手段120と、画像作成手段130と、表示制御手段140を備える。
図2に、この表示画像処理システム100による処理の流れをフローチャートで示す。
【0018】
撮影画像取得手段110は、表示画面11を視るユーザ1を複数のカメラ12,13から撮影して複数の撮影画像を取得する。
撮影画像取得手段110による処理の流れとしては、
図2に示すようなカメラ起動S111,カメラキャリブレーションS112、顔認識ニューラルネットワーク読み込みS113、仮想カメラ初期位置設定S114を含んでもよい。
カメラ起動S111は、表示画面11を視るユーザ1を撮影するためのカメラ12、13を起動させる。
カメラキャリブレーションS112は、カメラレンズ焦点距離などの内部パラメータ、カメラ12,13の位置・姿勢を表す外部パラメータ、カメラレンズの歪収差係数を求め、カメラ12、13で撮影した撮影画像を補正処理する。
カメラキャリブレーションS112は、例えばZhangの手法を用いてもよい。
顔認識ニューラルネットワーク読み込みS113は、ニューラルネットワークによりユーザ1の顔領域を特定する。
顔認識ニューラルネットワーク読み込みS113は、ディープランニング等によりユーザ1の目2(黒目2a)の動きを追うことが好ましい。
仮想カメラ初期位置設定S114は、表示画面11内に仮想カメラ14の位置を仮想的に設定する。
仮想カメラ14の位置は、カメラ12,13の位置等を計算することで、表示画面11内に自由に設定できる。
【0019】
立体情報取得手段120は、上記により撮影した撮影画像からユーザ1の立体情報を取得する。
立体情報取得手段120としては、ステレオマッチングS121、特徴点の3D座標計算S122、顔領域検出S123を含むことが好ましい。
ステレオマッチングS121は、複数のカメラ12,13で撮影した撮影画像である2次元の画像データを基に、3次元の情報であるユーザ1の立体情報を推定する。
特徴点の3D座標計算S122は、上記ステレオマッチングS121より推定された立体情報から、具体的にユーザ1の特徴点、例えば顔領域の目、鼻、口などの各パーツの立体座標を計算する。
顔領域検出S123は、上記特徴点の3D座標計算により求めたユーザ1の顔領域の座標数値を検出する。
【0020】
画像作成手段130は、仮想カメラ14を視るユーザ1の正面画像を作成する。
画像作成手段130による処理の流れとしては、仮想カメラ位置更新S131,仮想カメラ位置における特徴点の透視投影像作成S132を含む。
仮想カメラ位置更新S131は、顔認識ニューラルネットワーク読み込みS113によりユーザ1の目の動きを追うことで、表示画面11を視るユーザ1の視点の先に仮想カメラ14の位置を再設定する。
仮想カメラ位置における特徴点の透視投影像作成S132は、顔領域検出S123により検出した特徴点の3D座標数値から、表示画面11内の仮想カメラ14を視るユーザ1の正面画像、具体的には黒目2aの位置が目2のおよそ中央になる透視投影像を作成する。
【0021】
表示制御手段140は、上記透視投影像を表示画面11に表示するように制御する。
仮想カメラ透視投影像の表示S141は、仮想カメラ位置における特徴点の透視投影像作成S132により作成した透視投影像を、表示画面11内の表示部11a等に表示するように制御する。
本発明に係る画像表示処理システム100は、撮影画像取得手段110、立体情報取得手段120、画像作成手段130、表示制御手段140をWeb会議又はカメラ撮影を終了するまで繰り返し実施する。
具体的には、顔認識ニューラルネットワーク解放S151を経て、カメラ停止S152を実施することで、Web会議を終了する又はカメラ12,13での撮影を終了することになる。
【0022】
本実施例においては、表示画面11を1人のユーザが視る場合で説明したが、表示画面11を2人以上のユーザで視る場合にも適応できる。
具体的には、例えば装置画像処理装置10の表示画面11をユーザ1,3の2人で視る場合には、
図3(c)に示すように表示画面11内に表示部11a、11bを別々に設けることで、表示部11a、11bに目2,4のおよそ中央に黒目2a、4aが位置する各ユーザ1,3の画像を表示することも可能である。
表示画像処理システム100は、さらに補完手段を有していてもよい。
補完手段により、画像作成手段130や表示制御手段140等を補完することで、透視投影像をより綺麗な画像に表示することができ、実際のカメラで撮影した画像により近づけることができる。
【0023】
本発明により、Web会議システム等を利用するユーザ同士の視線を合わせた対話が容易に可能となるが、本発明に係る技術思想を証明写真機に応用することもできる。
証明写真機に応用することで、撮影者はカメラを視ないで表示画面を視たまま、鏡を視るように証明写真を撮影することができる。
【符号の説明】
【0024】
1 ユーザ
10 表示画像処理装置
11 表示画面
12 カメラ
13 カメラ
14 仮想カメラ
100 表示画像処理システム
110 撮影画像取得手段
120 立体情報取得手段
130 画像作成手段
140 表示制御手段