(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023176244
(43)【公開日】2023-12-13
(54)【発明の名称】画像処理システム、装置、処理方法、およびプログラム
(51)【国際特許分類】
G06V 10/422 20220101AFI20231206BHJP
G06T 7/00 20170101ALI20231206BHJP
【FI】
G06V10/422
G06T7/00 660B
【審査請求】未請求
【請求項の数】14
【出願形態】OL
(21)【出願番号】P 2022088420
(22)【出願日】2022-05-31
(71)【出願人】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100110928
【弁理士】
【氏名又は名称】速水 進治
(72)【発明者】
【氏名】竹内 浩明
(72)【発明者】
【氏名】川合 諒
(72)【発明者】
【氏名】吉田 登
(72)【発明者】
【氏名】劉 健全
(72)【発明者】
【氏名】並木 悠太
(72)【発明者】
【氏名】進藤 直樹
(72)【発明者】
【氏名】佐々木 洋平
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096CA22
5L096DA01
5L096EA39
5L096FA09
5L096FA67
5L096GA51
5L096JA03
5L096JA11
5L096KA04
5L096KA09
(57)【要約】
【課題】画像に含まれる人体の複数のキーポイント各々の特徴量に基づく類似画像の検索処理において、より高速な検索処理を実現する。
【解決手段】本発明は、対象画像を取得する対象画像取得部11と、対象画像に含まれる人体のキーポイントを検出する処理を行う骨格構造検出部12と、検出されたキーポイントに基づき、複数の参照画像の中から、対象画像との間の関係が第1の抽出条件を満たす第1の参照画像を抽出する第1の照合部13と、検出されたキーポイントに基づき、第1の参照画像の中から、対象画像との間の関係が第2の抽出条件を満たす第2の参照画像を抽出する第2の照合部14と、を有する画像処理システム10を提供する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
対象画像を取得する対象画像取得手段と、
前記対象画像に含まれる人体のキーポイントを検出する処理を行う骨格構造検出手段と、
検出された前記キーポイントに基づき、複数の参照画像の中から、前記対象画像との間の関係が第1の抽出条件を満たす第1の参照画像を抽出する第1の照合手段と、
検出された前記キーポイントに基づき、前記第1の参照画像の中から、前記対象画像との間の関係が第2の抽出条件を満たす第2の参照画像を抽出する第2の照合手段と、
を有する画像処理システム。
【請求項2】
前記第1の抽出条件は、第1の算出方法で算出した画像に含まれる人体の姿勢の類似度が第1の基準値以上であり、
前記第2の抽出条件は、第2の算出方法で算出した画像に含まれる人体の姿勢の類似度が第2の基準値以上である請求項1に記載の画像処理システム。
【請求項3】
前記第1の算出方法及び前記第2の算出方法は、人体の姿勢の類似度を算出する際に参照する前記キーポイントの数及び前記キーポイントの種類の少なくとも一方が互いに異なる請求項2に記載の画像処理システム。
【請求項4】
前記第2の抽出条件は、
人体の姿勢の類似度を算出する際に参照する前記キーポイントの中の所定数以上が検出されていること、及び、
人体の姿勢の類似度を算出する際に参照する前記キーポイントの中の所定の前記キーポイントが検出されていること、
の少なくとも一方を含む請求項3に記載の画像処理システム。
【請求項5】
前記第1の算出方法及び前記第2の算出方法は、人体の姿勢の類似度を算出する際に参照する前記キーポイント各々の重みの設定内容が互いに異なる請求項2に記載の画像処理システム。
【請求項6】
前記第1の算出方法では、全ての前記キーポイントの重みを同じにして人体の姿勢の類似度を算出し、
前記第2の算出方法では、キーポイント毎に設定された重みに基づき人体の姿勢の類似度を算出する請求項5に記載の画像処理システム。
【請求項7】
前記第2の参照画像を表示装置に表示させる表示制御手段と、
前記第2の抽出条件を変更する入力を受付ける変更受付手段と、
をさらに有し、
前記第2の抽出条件を変更する入力の受付に応じて、
前記第2の照合手段は、前記第1の参照画像の中から、前記対象画像との間の関係が変更後の前記第2の抽出条件を満たす前記第2の参照画像を新たに抽出し、
前記表示制御手段は、前記表示装置に表示させる内容を、変更前の前記第2の抽出条件を満たす前記第2の参照画像から、変更後の前記第2の抽出条件を満たす前記第2の参照画像に変更させる請求項1から6のいずれか1項に記載の画像処理システム。
【請求項8】
前記変更受付手段は、
複数の前記キーポイントで構成された人体モデルを含み、前記人体モデル上で設定対象の前記キーポイントを選択する入力を受付け、選択された前記キーポイントの重みを変更する入力を受付ける設定画面を介して、前記第2の抽出条件を変更する入力を受付ける請求項7に記載の画像処理システム。
【請求項9】
前記変更受付手段は、
前記人体モデルにおいて、選択された前記キーポイントを強調表示する前記設定画面を介して、前記第2の抽出条件を変更する入力を受付ける請求項8に記載の画像処理システム。
【請求項10】
前記変更受付手段は、
前記人体モデルにおいて、設定されている重みが閾値より大の前記キーポイントと、その他の前記キーポイントとを異なる態様で表示する前記設定画面を介して、前記第2の抽出条件を変更する入力を受付ける請求項8に記載の画像処理システム。
【請求項11】
サーバと、クライアント端末とを有し、
前記サーバは、前記第1の照合手段を有し、抽出した前記第1の参照画像を前記クライアント端末に送信し、
前記クライアント端末が前記第2の照合手段を有し、前記サーバから受信した前記第1の参照画像の中から前記第2の参照画像を抽出する請求項1に記載の画像処理システム。
【請求項12】
対象画像を取得する対象画像取得手段と、
前記対象画像に含まれる人体のキーポイントを検出する処理を行う骨格構造検出手段と、
検出された前記キーポイントに基づき、複数の参照画像の中から、前記対象画像との間の関係が第1の抽出条件を満たす第1の参照画像を抽出する第1の照合手段と、
検出された前記キーポイントに基づき、前記第1の参照画像の中から、前記対象画像との間の関係が第2の抽出条件を満たす第2の参照画像を抽出する第2の照合手段と、
を有する装置。
【請求項13】
1つ又は複数のコンピュータが、
対象画像を取得し、
前記対象画像に含まれる人体のキーポイントを検出する処理を行い、
検出された前記キーポイントに基づき、複数の参照画像の中から、前記対象画像との間の関係が第1の抽出条件を満たす第1の参照画像を抽出し、
検出された前記キーポイントに基づき、前記第1の参照画像の中から、前記対象画像との間の関係が第2の抽出条件を満たす第2の参照画像を抽出する画像処理方法。
【請求項14】
コンピュータを、
対象画像を取得する対象画像取得手段、
前記対象画像に含まれる人体のキーポイントを検出する処理を行う骨格構造検出手段、
検出された前記キーポイントに基づき、複数の参照画像の中から、前記対象画像との間の関係が第1の抽出条件を満たす第1の参照画像を抽出する第1の照合手段、
検出された前記キーポイントに基づき、前記第1の参照画像の中から、前記対象画像との間の関係が第2の抽出条件を満たす第2の参照画像を抽出する第2の照合手段、
として機能させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理システム、装置、処理方法、およびプログラムに関する。
【背景技術】
【0002】
本発明に関連する技術が、特許文献1乃至3、及び非特許文献1に開示されている。
【0003】
特許文献1には、画像に含まれる人体の複数のキーポイント各々の特徴量を算出し、算出した特徴量に基づき姿勢が似た人体や動きが似た人体を含む画像を検索したり、当該姿勢や動きが似たもの同士でまとめて分類したりする技術が開示されている。また、非特許文献1には、人物の骨格推定に関連する技術が開示されている。
【0004】
特許文献2には、画像に含まれる人物の骨格データを推定し、各関節の推定結果の信頼度を基に関節の重みを計算し、計算された各関節の重みを用いて、推定された骨格データと所定の画像データから推定された骨格データとの類似度を算出する技術が開示されている。
【0005】
特許文献3には、画像に含まれる人体の複数のキーポイント各々の特徴量、及び各キーポイントの重みを用いて、人体の姿勢の類似度を算出する技術が開示されている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】国際公開第2021/084677号
【特許文献2】特開2021-60736号公報
【特許文献3】国際公開第2022/009327号
【非特許文献】
【0007】
【非特許文献1】Zhe Cao, Tomas Simon, Shih-En Wei, Yaser Sheikh, "Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields", The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2017, P. 7291-7299
【発明の概要】
【発明が解決しようとする課題】
【0008】
画像に含まれる人体の複数のキーポイント各々の特徴量に基づく類似画像の検索処理において、より高速な検索処理が求められている。例えば、検索処理の条件(例:類似度の閾値、各キーポイントの重み等)を設定する場面では、オペレータは、条件を調整しながら検索処理を繰り返し行い、各回の検索結果を参照しながら条件を適切に調整していく。このような検索処理を繰り返し行う場面において、検索処理に多くの時間を要すると、作業効率が悪くなる。
【0009】
特許文献1及び非特許文献1は、画像に含まれる人体の複数のキーポイント各々の特徴量に基づく類似画像の検索処理を開示しているものの、検索処理をより高速化するという課題及びその解決手段は開示していない。
【0010】
特許文献2及び3は、各キーポイントの重みを用いて類似度を算出する技術を開示しているものの、検索処理をより高速化するという課題及びその解決手段は開示していない。
【0011】
本発明の目的の一例は、上述した問題を鑑み、画像に含まれる人体の複数のキーポイント各々の特徴量に基づく類似画像の検索処理において、より高速な検索処理を実現するという課題を解決する画像処理システム、装置、処理方法、およびプログラムを提供することにある。
【課題を解決するための手段】
【0012】
本発明の一態様によれば、
対象画像を取得する対象画像取得手段と、
前記対象画像に含まれる人体のキーポイントを検出する処理を行う骨格構造検出手段と、
検出された前記キーポイントに基づき、複数の参照画像の中から、前記対象画像との間の関係が第1の抽出条件を満たす第1の参照画像を抽出する第1の照合手段と、
検出された前記キーポイントに基づき、前記第1の参照画像の中から、前記対象画像との間の関係が第2の抽出条件を満たす第2の参照画像を抽出する第2の照合手段と、
を有する画像処理システムが提供される。
【0013】
本発明の一態様によれば、
対象画像を取得する対象画像取得手段と、
前記対象画像に含まれる人体のキーポイントを検出する処理を行う骨格構造検出手段と、
検出された前記キーポイントに基づき、複数の参照画像の中から、前記対象画像との間の関係が第1の抽出条件を満たす第1の参照画像を抽出する第1の照合手段と、
検出された前記キーポイントに基づき、前記第1の参照画像の中から、前記対象画像との間の関係が第2の抽出条件を満たす第2の参照画像を抽出する第2の照合手段と、
を有する装置が提供される。
【0014】
本発明の一態様によれば、
1つ又は複数のコンピュータが、
対象画像を取得し、
前記対象画像に含まれる人体のキーポイントを検出する処理を行い、
検出された前記キーポイントに基づき、複数の参照画像の中から、前記対象画像との間の関係が第1の抽出条件を満たす第1の参照画像を抽出し、
検出された前記キーポイントに基づき、前記第1の参照画像の中から、前記対象画像との間の関係が第2の抽出条件を満たす第2の参照画像を抽出する画像処理方法が提供される。
【0015】
本発明の一態様によれば、
コンピュータを、
対象画像を取得する対象画像取得手段、
前記対象画像に含まれる人体のキーポイントを検出する処理を行う骨格構造検出手段、
検出された前記キーポイントに基づき、複数の参照画像の中から、前記対象画像との間の関係が第1の抽出条件を満たす第1の参照画像を抽出する第1の照合手段、
検出された前記キーポイントに基づき、前記第1の参照画像の中から、前記対象画像との間の関係が第2の抽出条件を満たす第2の参照画像を抽出する第2の照合手段、
として機能させるプログラムが提供される。
【発明の効果】
【0016】
本発明の一態様によれば、画像に含まれる人体の複数のキーポイント各々の特徴量に基づく類似画像の検索処理において、より高速な検索処理を実現するという課題を解決する画像処理システム、装置、処理方法、およびプログラムが実現される。
【図面の簡単な説明】
【0017】
上述した目的、およびその他の目的、特徴および利点は、以下に述べる公的な実施の形態、およびそれに付随する以下の図面によってさらに明らかになる。
【0018】
【
図1】画像処理システムの機能ブロック図の一例を示す図である。
【
図3】画像処理システムのハードウエア構成の一例を示す図である。
【
図4】画像処理システムにより検出される人体モデルの骨格構造の一例を示す図である。
【
図5】画像処理システムにより検出された人体モデルの骨格構造の一例を示す図である。
【
図6】画像処理システムにより検出された人体モデルの骨格構造の一例を示す図である。
【
図7】画像処理システムにより検出された人体モデルの骨格構造の一例を示す図である。
【
図8】画像処理システムにより算出されるキーポイントの特徴量の一例を示す図である。
【
図9】画像処理システムにより算出されるキーポイントの特徴量の一例を示す図である。
【
図10】画像処理システムにより算出されるキーポイントの特徴量の一例を示す図である。
【
図11】参照画像情報の一例を模式的に示す図である。
【
図12】画像処理システムの処理の流れの一例を示すシーケンス図である。
【
図13】画像処理システムの処理の流れの一例を示すシーケンス図である。
【
図14】画像処理システムの機能ブロック図の一例を示す図である。
【
図15】画像処理システムの処理の流れの一例を示すシーケンス図である。
【
図16】画像処理システムの処理の流れの一例を示すシーケンス図である。
【
図17】画像処理システムの処理の流れの一例を示すフローチャートである。
【
図18】画像処理システムが提供する設定画面の一例を示す図である。
【
図19】画像処理システムが提供する設定画面の一例を示す図である。
【
図20】画像処理システムが提供する設定画面の一例を示す図である。
【
図21】画像処理システムが提供する設定画面の一例を示す図である。
【
図22】画像処理システムが提供する設定画面の一例を示す図である。
【発明を実施するための形態】
【0019】
以下、本発明の実施の形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。
【0020】
<第1の実施形態>
図1は、第1の実施形態に係る画像処理システム10の概要を示す機能ブロック図である。画像処理システム10は、対象画像取得部11と、骨格構造検出部12と、第1の照合部13と、第2の照合部14とを有する。
【0021】
対象画像取得部11は、対象画像を取得する。骨格構造検出部12は、対象画像に含まれる人体のキーポイントを検出する処理を行う。第1の照合部13は、検出されたキーポイントに基づき、複数の参照画像の中から、対象画像との間の関係が第1の抽出条件を満たす第1の参照画像を抽出する。第2の照合部14は、検出されたキーポイントに基づき、第1の参照画像の中から、対象画像との間の関係が第2の抽出条件を満たす第2の参照画像を抽出する。
【0022】
このような構成を備える画像処理システム10によれば、画像に含まれる人体の複数のキーポイント各々の特徴量に基づく類似画像の検索処理において、より高速な検索処理を実現するという課題が解決される。
【0023】
<第2の実施形態>
「概要」
本実施形態の画像処理システム10は、第1の実施形態の画像処理システム10をより具体化したものである。本実施形態の画像処理システム10は、複数の参照画像の中から所望の参照画像を検索する処理を2ステップに分けて行う。すなわち、第1のステップである程度絞り込んだのち、第2のステップで絞り込まれた参照画像の中から所望の参照画像を検索する。
【0024】
図2に示すように、本実施形態の画像処理システム10は、サーバ1とクライアント端末2とを有する。クライアント端末2は、パーソナルコンピュータ、スマートフォン、タブレット端末、スマートウォッチ、携帯電話、インターネット接続機能を備えたテレビ等であるが、これらに限定されない。
【0025】
本実施形態では、サーバ1が上記第1のステップを行う。すなわち、サーバ1は、複数の参照画像の中から、対象画像との間の関係が第1の抽出条件を満たす第1の参照画像を抽出する。そして、クライアント端末2が上記第2のステップを行う。すなわち、クライアント端末2は、抽出された第1の参照画像(絞り込まれた参照画像)の中から、対象画像との間の関係が第2の抽出条件を満たす第2の参照画像を抽出する。以下、画像処理システム10の構成を詳細に説明する。
【0026】
「ハードウエア構成」
次に、画像処理システム10のハードウエア構成の一例を説明する。画像処理システム10の各機能部は、任意のコンピュータのCPU(Central Processing Unit)、メモリ、メモリにロードされるプログラム、そのプログラムを格納するハードディスク等の記憶ユニット(あらかじめ装置を出荷する段階から格納されているプログラムのほか、CD(Compact Disc)等の記録媒体やインターネット上のサーバ等からダウンロードされたプログラムをも格納できる)、ネットワーク接続用インターフェイスを中心にハードウエアとソフトウエアの任意の組合せによって実現される。そして、その実現方法、装置にはいろいろな変形例があることは、当業者には理解されるところである。
【0027】
図3は、画像処理システム10のハードウエア構成を例示するブロック図である。
図3に示すように、画像処理システム10は、プロセッサ1A、メモリ2A、入出力インターフェイス3A、周辺回路4A、バス5Aを有する。周辺回路4Aには、様々なモジュールが含まれる。画像処理システム10は周辺回路4Aを有さなくてもよい。なお、画像処理システム10は物理的及び/又は論理的に分かれた複数の装置(サーバ1及びクライアント端末2)で構成されてもよい。この場合、複数の装置各々が上記ハードウエア構成を備えることができる。
【0028】
バス5Aは、プロセッサ1A、メモリ2A、周辺回路4A及び入出力インターフェイス3Aが相互にデータを送受信するためのデータ伝送路である。プロセッサ1Aは、例えばCPU、GPU(Graphics Processing Unit)などの演算処理装置である。メモリ2Aは、例えばRAM(Random Access Memory)やROM(Read Only Memory)などのメモリである。入出力インターフェイス3Aは、入力装置、外部装置、外部サーバ、外部センサ、カメラ等から情報を取得するためのインターフェイスや、出力装置、外部装置、外部サーバ等に情報を出力するためのインターフェイスなどを含む。入力装置は、例えばキーボード、マウス、マイク、物理ボタン、タッチパネル等である。出力装置は、例えばディスプレイ、スピーカ、プリンター、メーラ等である。プロセッサ1Aは、各モジュールに指令を出し、それらの演算結果をもとに演算を行うことができる。
【0029】
「機能構成」
次に、本実施形態の画像処理システム10の機能構成を詳細に説明する。
図1に、画像処理システム10の機能ブロック図の一例を示す。図示するように、画像処理システム10は、対象画像取得部11と、骨格構造検出部12と、第1の照合部13と、第2の照合部14とを有する。サーバ1が、骨格構造検出部12及び第1の照合部13を備える。そして、クライアント端末2が、対象画像取得部11及び第2の照合部14を備える。
【0030】
クライアント端末2は、例えば、予めインストールされた専用のソフトウエアやアプリケーション、又はサーバ1から提供されたプログラム(ウェブページ等)を介して、サーバ1と通信するとともに各種処理を実行し、対象画像取得部11及び第2の照合部14の機能を実現することができる。以下、画像処理システム10が備える機能部の構成を説明する。
【0031】
対象画像取得部11は、対象画像を取得する。対象画像は、骨格構造検出部12、第1の照合部13及び第2の照合部14により実行される処理の対象となる静止画像である。
【0032】
対象画像取得部11は、例えば所定のアクセス可能な記憶装置に記憶されている静止画像の中から1つを指定するユーザ入力を受付け、その指定された静止画像を対象画像として取得してもよい。その他、対象画像取得部11は、動画像の中のユーザが指定したフレーム画像を対象画像として取得してもよい。動画像は過去に撮影されたものであってもよいし、ライブ画像であってもよい。例えば、対象画像取得部11は、動画像を再生中にユーザ入力を受付け、そのユーザ入力を受付けた時点で画面表示されていたフレーム画像を対象画像として取得してもよい。その他、対象画像取得部11は、動画像の中からユーザが指定した時間間隔で複数のフレーム画像を順に対象画像として取得してもよい。なお、ここで説明した対象画像を取得する処理は一例であり、これらに限定されない。
【0033】
上述の通り、本実施形態では、クライアント端末2が対象画像取得部11を備える。クライアント端末2の対象画像取得部11は、自装置の入力装置(タッチパネル、物理ボタン、キーボード、マウス、マイク等)を介して、上述のような対象画像を指定する入力を受付ける。そして、対象画像取得部11は、取得した対象画像をクライアント端末2内の記憶装置に記憶させる。また、対象画像取得部11は、取得した対象画像をサーバ1に送信する。
【0034】
骨格構造検出部12は、対象画像に含まれる人体のキーポイントを検出する処理を行う。骨格構造検出部12は、対象画像に含まれる人体のN(Nは2以上の整数)個のキーポイントを検出する。骨格構造検出部12による当該処理は、特許文献1に開示されている技術を用いて実現される。詳細は省略するが、特許文献1に開示されている技術では、非特許文献1に開示されたOpenPose等の骨格推定技術を利用して骨格構造の検出を行う。当該技術で検出される骨格構造は、関節等の特徴的な点である「キーポイント」と、キーポイント間のリンクを示す「ボーン(ボーンリンク)」とから構成される。
【0035】
図4は、骨格構造検出部12により検出される人体モデル300の骨格構造を示しており、
図5乃至
図7は、骨格構造の検出例を示している。骨格構造検出部12は、OpenPose等の骨格推定技術を用いて、2次元の画像から
図4のような人体モデル(2次元骨格モデル)300の骨格構造を検出する。人体モデル300は、人物の関節等のキーポイントと、各キーポイントを結ぶボーンから構成された2次元モデルである。
【0036】
骨格構造検出部12は、例えば、画像の中からキーポイントとなり得る特徴点を抽出し、キーポイントの画像を機械学習した情報を参照して、人体のN個のキーポイントを検出する。検出するN個のキーポイントは予め定められる。検出するキーポイントの数(すなわち、Nの数)や、人体のどの部分を検出するキーポイントとするかは様々であり、あらゆるバリエーションを採用できる。
【0037】
例えば、
図4に示すように、頭A1、首A2、右肩A31、左肩A32、右肘A41、左肘A42、右手A51、左手A52、右腰A61、左腰A62、右膝A71、左膝A72、右足A81、左足A82が、検出対象のN個のキーポイント(N=14)として定められる。なお、
図4に示す人体モデル300では、これらのキーポイントを連結した人物の骨として、頭A1と首A2を結ぶボーンB1、首A2と右肩A31及び左肩A32をそれぞれ結ぶボーンB21及びボーンB22、右肩A31及び左肩A32と右肘A41及び左肘A42をそれぞれ結ぶボーンB31及びボーンB32、右肘A41及び左肘A42と右手A51及び左手A52をそれぞれ結ぶボーンB41及びボーンB42、首A2と右腰A61及び左腰A62をそれぞれ結ぶボーンB51及びボーンB52、右腰A61及び左腰A62と右膝A71及び左膝A72をそれぞれ結ぶボーンB61及びボーンB62、右膝A71及び左膝A72と右足A81及び左足A82をそれぞれ結ぶボーンB71及びボーンB72がさらに定められている。
【0038】
図5は、直立した状態の人物を検出する例である。
図5では、直立した人物が正面から撮像されており、正面から見たボーンB1、ボーンB51及びボーンB52、ボーンB61及びボーンB62、ボーンB71及びボーンB72がそれぞれ重ならずに検出され、右足のボーンB61及びボーンB71は左足のボーンB62及びボーンB72よりも多少折れ曲がっている。
【0039】
図6は、しゃがみ込んでいる状態の人物を検出する例である。
図6では、しゃがみ込んでいる人物が右側から撮像されており、右側から見たボーンB1、ボーンB51及びボーンB52、ボーンB61及びボーンB62、ボーンB71及びボーンB72がそれぞれ検出され、右足のボーンB61及びボーンB71と左足のボーンB62及びボーンB72は大きく折れ曲がり、かつ、重なっている。
【0040】
図7は、寝込んでいる状態の人物を検出する例である。
図7では、寝込んでいる人物が左斜め前から撮像されており、左斜め前から見たボーンB1、ボーンB51及びボーンB52、ボーンB61及びボーンB62、ボーンB71及びボーンB72がそれぞれ検出され、右足のボーンB61及びボーンB71と左足のボーンB62及びボーンB72は折れ曲がり、かつ、重なっている。
【0041】
第1の照合部13は、骨格構造検出部12により検出されたキーポイントに基づき、予め登録された複数の参照画像の中から、対象画像との間の関係が第1の抽出条件を満たす第1の参照画像を抽出する。
【0042】
第1の抽出条件は、「第1の算出方法」で算出した「画像に含まれる人体の姿勢の類似度」が「第1の基準値以上」である。すなわち、第1の照合部13は、対象画像に含まれる人体の姿勢と、参照画像各々に含まれる人体の姿勢との類似度を第1の算出方法で算出する。そして、第1の照合部13は、算出した類似度が第1の基準値以上である参照画像を、第1の参照画像として抽出する。
【0043】
第2の照合部14は、骨格構造検出部12により検出されたキーポイントに基づき、第1の照合部13により抽出された第1の参照画像の中から、対象画像との間の関係が第2の抽出条件を満たす第2の参照画像を抽出する。すなわち、第2の照合部14は、第1の照合部13により絞り込まれた参照画像(第1の参照画像)を照合対象として対象画像との照合を行い、第1の参照画像の中から第2の参照画像を抽出する。
【0044】
第2の抽出条件は、「第2の算出方法」で算出した「画像に含まれる人体の姿勢の類似度」が「第2の基準値以上」である。すなわち、第2の照合部14は、対象画像に含まれる人体の姿勢と、第1の参照画像各々に含まれる人体の姿勢との類似度を第2の算出方法で算出する。そして、第2の照合部14は、算出した類似度が第2の基準値以上である第1の参照画像を、第2の参照画像として抽出する。
【0045】
第1の算出方法と第2の算出方法とは互いに異なってもよいし、同じであってもよい。例えば、第1の算出方法及び第2の算出方法は、人体の姿勢の類似度を算出する際に参照するキーポイントの数及びキーポイントの種類の少なくとも一方が互いに異なってもよい。
【0046】
また、第1の算出方法及び第2の算出方法は、人体の姿勢の類似度を算出する際に参照するキーポイント各々の重みの設定内容が互いに異なってもよい。例えば、第1の算出方法では、全てのキーポイントの重みを同じにして人体の姿勢の類似度を算出し、第2の算出方法では、キーポイント毎に設定された重みに基づき人体の姿勢の類似度を算出してもよい。また、第1の算出方法及び第2の算出方法は、各種キーポイントの重みが互いに異なってもよい。
【0047】
また、第1の基準値及び第2の基準値は別々に独立して設定できる。このため、第1の基準値及び第2の基準値を同じ値にすることもできるし、異なる値にすることもできる。
【0048】
また、第1の抽出条件及び第2の抽出条件は、互いに異なるその他の条件を含んでもよい。例えば、第1の抽出条件及び第2の抽出条件のいずれか一方が、
・人体の姿勢の類似度を算出する際に参照するキーポイントの中の所定数以上が検出されていること、及び、
・人体の姿勢の類似度を算出する際に参照するキーポイントの中の所定のキーポイント(例:頭)が検出されていること、
の少なくとも一方を含んでもよい。当該条件の「所定数(最低検出点)」及び「所定のキーポイント(必須検出キーポイント)」は予め定められていてもよいし、ユーザが設定できてもよい。
【0049】
例えば、第1の抽出条件が当該条件を含んでもよいし、第2の抽出条件が当該条件を含んでもよい。
【0050】
その他、第1の抽出条件及び第2の抽出条件の両方が、当該条件を含んでもよい。その場合、その内容が互いに異なってもよい。
【0051】
例えば、第1の抽出条件及び第2の抽出条件の両方が「人体の姿勢の類似度を算出する際に参照するキーポイントの中の所定数以上が検出されていること」を含む場合、当該所定数は別々に独立して設定できてもよい。この場合、第1の抽出条件の当該所定数及び第2の抽出条件の当該所定数を同じ値にすることもできるし、異なる値にすることもできる。
【0052】
また、第1の抽出条件及び第2の抽出条件の両方が「人体の姿勢の類似度を算出する際に参照するキーポイントの中の所定のキーポイントが検出されていること」を含む場合、当該所定のキーポイントは別々に独立して設定できてもよい。この場合、第1の抽出条件の当該所定のキーポイント及び第2の抽出条件の当該所定のキーポイントの種類や数を同じ内容にすることもできるし、異なる内容にすることもできる。
【0053】
また、第2の抽出条件は上述した複数の項目(人体の姿勢の類似度を算出する際に参照するキーポイントの数、キーポイントの種類、各キーポイントの重み、最低検出点、必須検出キーポイント)の中の少なくとも1つがユーザ入力により変更可能であってもよい。そして、第1の抽出条件は上述した複数の項目が固定されていてもよい。
【0054】
ここで、第1の抽出条件及び第2の抽出条件の具体例を説明する。なお、ここでの例示はあくまで一例であり、本実施形態の第1の抽出条件及び第2の抽出条件はこれに限定されない。
【0055】
第1の抽出条件は、「N個のキーポイントの全てに基づき算出した人体の姿勢の類似度が第1の基準値以上」である。なお、第1の抽出条件の当該類似度は、N個のキーポイントの重みは同じにして算出される。
【0056】
第2の抽出条件は、「N個のキーポイントの中の一部に基づき算出した人体の姿勢の類似度が第2の基準値以上」である。なお、第2の抽出条件の当該類似度は、キーポイント毎に設定された重みに基づき算出される。
【0057】
そして、第2の抽出条件は、人体の姿勢の類似度を算出する際に参照するキーポイントの数、キーポイントの種類、各キーポイントの重みがユーザ入力により変更可能である。一方、第1の抽出条件は、人体の姿勢の類似度を算出する際に参照するキーポイントの数、キーポイントの種類、各キーポイントの重みが固定されている。
【0058】
また、第2の抽出条件は、第2の基準値がユーザ入力により変更可能である。第1の抽出条件は、第1の基準値がユーザ入力により変更可能であってもよいし、固定値であってもよい。
【0059】
また、第2の抽出条件は、さらに、
・人体の姿勢の類似度を算出する際に参照するキーポイントの中の所定数以上が検出されていること、及び、
・人体の姿勢の類似度を算出する際に参照するキーポイントの中の所定のキーポイントが検出されていること、
の少なくとも一方を含む。当該条件の「所定数」及び「所定のキーポイント」は予め定められていてもよいし、ユーザ入力により変更可能であってもよい。なお、第1の抽出条件は、当該条件を含まない。
【0060】
ここで、骨格構造検出部12により検出されたキーポイントに基づき、対象画像から検出された人体の姿勢と、予め登録された参照画像が示す人体の姿勢との類似度を算出する処理の一例を説明する。
【0061】
人体の姿勢の類似度の算出の仕方は様々であり、あらゆる技術を採用できる。例えば、特許文献1に開示の技術を採用してもよい。以下、一例を説明するがこれに限定されない。
【0062】
一例として、検出されたキーポイントで示される骨格構造の特徴量を算出し、対象画像から検出された人体の骨格構造の特徴量と、参照画像が示す人体の骨格構造の特徴量との類似度を算出することで、2つの人体の姿勢の類似度を算出してもよい。
【0063】
骨格構造の特徴量は、人物の骨格の特徴を示しており、人物の骨格に基づいて人物の姿勢を分類するための要素となる。通常、この特徴量は、複数のパラメータを含んでいる。そして類似度の算出において参照する特徴量は、骨格構造の全体の特徴量でもよいし、骨格構造の一部の特徴量でもよく、骨格構造の各部のように複数の特徴量を含んでもよい。特徴量の算出方法は、機械学習や正規化等の任意の方法でよく、正規化として最小値や最大値を求めてもよい。一例として、特徴量は、骨格構造を機械学習することで得られた特徴量や、骨格構造の頭部から足部までの画像上の大きさ、画像上の骨格構造を含む骨格領域の上下方向における複数のキーポイントの相対的な位置関係、当該骨格領域の左右方向における複数のキーポイントの相対的な位置関係等である。骨格構造の大きさは、画像上の骨格構造を含む骨格領域の上下方向の高さや面積等である。上下方向(高さ方向または縦方向)は、画像における上下の方向(Y軸方向)であり、例えば、地面(基準面)に対し垂直な方向である。また、左右方向(横方向)は、画像における左右の方向(X軸方向)であり、例えば、地面に対し平行な方向である。
【0064】
なお、ユーザが望む検索を行うためには、検索処理に対しロバスト性を有する特徴量を用いることが好ましい。例えば、ユーザが、人物の向きや体型に依存しない検索を望む場合、人物の向きや体型にロバストな特徴量を使用してもよい。同じ姿勢で様々な方向に向いている人物の骨格や同じ姿勢で様々な体型の人物の骨格を学習することや、骨格の上下方向のみの特徴を抽出することで、人物の向きや体型に依存しない特徴量を得ることができる。骨格構造の特徴量を算出する処理の一例は、特許文献1に開示されている。
【0065】
図8は、複数のキーポイント各々の特徴量の例を示している。複数のキーポイントの特徴量の集合が、骨格構造の特徴量となる。なお、ここで例示するキーポイントの特徴量はあくまで一例であり、これに限定されない。
【0066】
この例では、キーポイントの特徴量は、画像上の骨格構造を含む骨格領域の上下方向における複数のキーポイントの相対的な位置関係を示す。首のキーポイントA2を基準点とするため、キーポイントA2の特徴量は0.0となり、首と同じ高さの右肩のキーポイントA31及び左肩のキーポイントA32の特徴量も0.0である。首よりも高い頭のキーポイントA1の特徴量は-0.2である。首よりも低い右手のキーポイントA51及び左手のキーポイントA52の特徴量は0.4であり、右足のキーポイントA81及び左足のキーポイントA82の特徴量は0.9である。この状態から人物が左手を挙げると、
図9のように左手が基準点よりも高くなるため、左手のキーポイントA52の特徴量は-0.4となる。一方で、Y軸の座標のみを用いて正規化を行っているため、
図10のように、
図8に比べて骨格構造の幅が変わっても特徴量は変わらない。すなわち、当該例の特徴量(正規化値)は、骨格構造(キーポイント)の高さ方向(Y方向)の特徴を示しており、骨格構造の横方向(X方向)の変化に影響を受けない。
【0067】
このような特徴量で示される姿勢の類似度の算出の仕方は様々である。例えば、キーポイント毎に特徴量の類似度を算出した後、複数のキーポイントの特徴量の類似度に基づき、姿勢の類似度を算出してもよい。例えば、複数のキーポイントの特徴量の類似度の平均値、最大値、最小値、最頻値、中央値、加重平均値、加重和等が、姿勢の類似度として算出されてもよい。加重平均値や加重和を算出する場合、各キーポイントの重みはユーザが設定できてもよいし、予め定められていてもよい。
【0068】
ここで、
図11に、予め画像処理システム10に登録される参照画像情報について説明する。本実施形態では、サーバ1に参照画像及び参照画像情報が登録される。
図11に示す参照画像情報は、参照画像識別情報と、データ名と、特徴量とが互いに紐付けられている。
【0069】
参照画像識別情報は、複数の参照画像を互いに識別する情報である。
【0070】
データ名は、各参照画像に付される情報である。複数の参照画像に同一のデータ名を付すこともできる。また、1つの参照画像に複数のデータ名を付すこともできる。データ名は、画像の内容(人体の姿勢、対象物の捉え方等)等に応じたものとすることができる。図示する「車イス・俯瞰」は、車イスに乗った人を含み、かつその人を上から見下ろすように撮影された参照画像に付される。その他、右手で携帯電話をもって通話中の人を含む参照画像に「携帯電話・右手・俯瞰」というデータ名が付されてもよい。例えば、車イスに乗り、右手で携帯電話をもって通話中の人を含む参照画像に、「車イス・俯瞰」というデータ名と、「携帯電話・右手・俯瞰」というデータ名が付されてもよい
【0071】
特徴量は、各参照画像に含まれる人体の姿勢の特徴量(例:各キーポイントの特徴量の集合)である。
【0072】
なお、クライアント端末2は、対象画像を指定するユーザ入力に加えて、データ名を指定するユーザ入力を受付けてもよい。そして、クライアント端末2は、指定された対象画像に加えて、データ名を指定するユーザ入力の内容をサーバ1に送信してもよい。この場合、第1の照合部13は、参照画像の中から指定されたデータ名に紐付けられた参照画像を抽出した後、抽出した参照画像の中から第1の抽出条件を満たす第1の参照画像を抽出してもよい。このように構成した場合、検索対象とする参照画像をデータ名で絞り込むことができ、より高速な検索処理が実現される。
【0073】
なお、上記「データ名を指定するユーザ入力」の内容は様々な構成を採用できる。例えば、クライアント端末2は、上記「データ名を指定するユーザ入力」として、1つ又は複数のデータ名を直接指定する入力を受付けてもよい。その他、サーバ11は、共通項を有する複数のデータ名をまとめてグループを作成し、各グループにラベル名を紐付けて管理してもよい。例えば、「携帯電話・右手・俯瞰」、「携帯電話・左手・俯瞰」等のデータ名をまとめたグループに「携帯使用」というラベル名が紐付けられてもよい。そして、クライアント端末2は、上記「データ名を指定するユーザ入力」として、ラベル名を選択する入力を受付けてもよい。この場合、選択されたラベル名のグループに紐付くデータ名が指定される。
【0074】
ここで、
図12のシーケンス図を用いて、サーバ1及びクライアント端末2で構成される画像処理システム10の処理の流れの一例を説明する。
【0075】
まず、クライアント端末2が、対象画像を指定するユーザ入力を受付ける(S10)。次いで、クライアント端末2は、指定された対象画像をサーバ1に送信する(S11)。
【0076】
サーバ1は、対象画像に含まれる人体のキーポイントを検出する処理を行った後、検出されたキーポイントに基づき、複数の参照画像の中から、対象画像との間の関係が第1の抽出条件を満たす第1の参照画像を抽出する(S12)。次いで、サーバ1は、第1の参照画像と、第1の参照画像各々から検出された人体のキーポイントに関する情報(例:特徴量等)(
図11参照)と、対象画像から検出された人体のキーポイントに関する情報(例:特徴量等)をクライアント端末2に送信する(S13)。
【0077】
クライアント端末2は、受信した第1の参照画像各々から検出された人体のキーポイントに関する情報と、対象画像から検出された人体のキーポイントに関する情報とに基づき、受信した第1の参照画像の中から、S10で指定された対象画像との間の関係が第2の抽出条件を満たす第2の参照画像を抽出する(S14)。そして、クライアント端末2は、抽出した第2の参照画像を表示する(S15)。当該表示は、ディスプレイへの表示、投影装置を利用した映像の投影等で実現される。
【0078】
なお、クライアント端末2は、S13で受信したデータ(画像や情報)を自端末の記憶装置内に記憶し、当該データを利用してS14及びS15の処理を繰り返し行うことができる。
【0079】
例えば、ユーザが、クライアント端末2に対して第2の抽出条件を変更する入力を行ってもよい。そして、クライアント端末2は、受信した第1の参照画像の中から、S10で指定された対象画像との間の関係が変更後の第2の抽出条件を満たす第2の参照画像を抽出し(S14)、抽出した第2の参照画像を表示してもよい(S15)。この処理については、第5の実施形態で詳述する。
【0080】
その他、予め複数の第2の抽出条件が設定されていてもよい。そして、クライアント端末2は、受信した第1の参照画像の中から、S10で指定された対象画像との間の関係が複数の第2の抽出条件各々を満たす第2の参照画像を抽出し(S14)、複数の第2の抽出条件各々に基づき抽出した第2の参照画像を分けて表示してもよい(S15)。
【0081】
このように、第2の抽出条件に基づく抽出を複数回行う場合に、その都度、第1の抽出条件に基づく抽出と第2の抽出条件に基づく抽出の両方を行っていると、コンピュータの処理負担が大きくなるほか、処理速度が低速化する。当該例のように、第1の抽出処理(S12)と、第2の抽出処理(S14)とに分け、1回の第1の抽出処理に対応して複数回の第2の抽出処理を行うことが可能な構成とすることで、コンピュータの処理負担が小さくなるほか、処理速度が高速化する。
【0082】
<作用効果>
本実施形態の画像処理システム10によれば、画像に含まれる人体の複数のキーポイント各々の特徴量に基づく類似画像の抽出処理(検索処理)を、2つのステップに分けて行うことができる。すなわち、第1のステップで検索対象の参照画像を絞り込んだ後、第2のステップで、その絞り込んだ参照画像の中から対象画像に類似する画像を検索することができる。このように、画像に含まれる人体の複数のキーポイント各々の特徴量に基づく類似画像の検索処理を2つのステップに分けて行うことで、より高速な検索処理を実現することができる。
【0083】
例えば、2つのステップに分けた場合、第1のステップの結果を記憶しておくことで、その結果を利用して複数回の第2のステップを行うことができる。すなわち、1回の第1のステップに対応して第2ステップを複数回行うことが可能となる。これに対し、抽出処理が2つのステップに分かれていない場合、毎回、抽出処理の全てを実行する必要がある。このような比較例に比べ、本実施形態の画像処理システム10によれば、コンピュータの処理負担が小さくなるほか、処理速度が高速化する。
【0084】
また、本実施形態では、第1のステップの第1の抽出条件では、人体の姿勢の類似度を算出する際に参照するキーポイントの数、キーポイントの種類、各キーポイントの重みを固定し、第2のステップの第2の抽出条件では、それら項目をユーザ入力により変更可能な構成とすることができる。ところで、検索の高速化に関する技術として、データベースにデータをクラスタリングしながら格納し検索時にはクエリと似たクラスタに絞って検索するという技術が存在する。しかし、検索条件をその都度変化させながら検索する場合、データ間の類似性が検索条件によって変化してしまうため、上記の技術は使えず、検索が遅くなってしまう。この問題に対し、第1のステップの第1の抽出条件を固定し、第2のステップの第2の抽出条件を可変とすることで、第1の抽出条件(膨大なデータから絞る工程)は高速にできつつ、第2のステップにおいて検索条件(第2の抽出条件)の変更もできるため、目的の検索が高速に行えるようになる。
【0085】
<第3の実施形態>
本実施形態の画像処理システム10も、
図2に示すように、サーバ1とクライアント端末2とを有する。
【0086】
第2の実施形態では、画像に含まれる人体の複数のキーポイント各々の特徴量に基づく類似画像の抽出処理(検索処理)を2つのステップに分け、サーバ1が第1のステップを行い、クライアント端末2が第2のステップを行った。これに対し、本実施形態では、サーバ1が、第1のステップ及び第2のステップの両方を行う。以下、詳細に説明する。
【0087】
図1に、画像処理システム10の機能ブロック図の一例を示す。図示するように、画像処理システム10は、対象画像取得部11と、骨格構造検出部12と、第1の照合部13と、第2の照合部14とを有する。サーバ1が、骨格構造検出部12、第1の照合部13及び第2の照合部14を備える。そして、クライアント端末2が対象画像取得部11を備える。各機能部の構成は、第2の実施形態で説明した通りである。
【0088】
ここで、
図13のシーケンス図を用いて、サーバ1及びクライアント端末2で構成される画像処理システム10の処理の流れの一例を説明する。
【0089】
まず、クライアント端末2が、対象画像を指定するユーザ入力を受付ける(S20)。次いで、クライアント端末2は、指定された対象画像をサーバ1に送信する(S21)。
【0090】
サーバ1は、対象画像に含まれる人体のキーポイントを検出する処理を行った後、検出されたキーポイントに基づき、複数の参照画像の中から、対象画像との間の関係が第1の抽出条件を満たす第1の参照画像を抽出する(S22)。次いで、サーバ1は、S22のキーポイントの検出結果に基づき、S22で抽出した第1の参照画像の中から、S21で受信した対象画像との間の関係が第2の抽出条件を満たす第2の参照画像を抽出する(S23)。そして、サーバ1は、抽出した第2の参照画像をクライアント端末2に送信する(S24)。
【0091】
その後、クライアント端末2は、受信した第2の参照画像を表示する(S25)。当該表示は、ディスプレイへの表示、投影装置を利用した映像の投影等で実現される。
【0092】
なお、サーバ1は、S22の処理で得られたデータ(画像や情報)を自装置の記憶装置内に記憶し、当該データを利用してS23及びS24の処理を繰り返し行うことができる。そして、クライアント端末2は、新たに第2の参照画像を受信すると(S24)、新たに受信した第2の参照画像を表示することができる。
【0093】
例えば、ユーザが、クライアント端末2に対して第2の抽出条件を変更する入力を行ってもよい。そして、クライアント端末2は、変更後の第2の抽出条件をサーバ1に送信してもよい。そして、サーバ1は、S22で抽出した第1の参照画像の中から、S21で受信した対象画像との間の関係が変更後の第2の抽出条件を満たす第2の参照画像を抽出し(S23)、抽出した第2の参照画像をクライアント端末2に送信してもよい(S24)。この処理については、第5の実施形態で詳述する。
【0094】
その他、予め複数の第2の抽出条件が設定されていてもよい。そして、サーバ1は、S22で抽出した第1の参照画像の中から、S20で指定された対象画像との間の関係が複数の第2の抽出条件各々を満たす第2の参照画像を抽出し(S23)、複数の第2の抽出条件各々に基づき抽出した第2の参照画像を互いに識別可能にクライアント端末2に送信してもよい(S24)。
【0095】
このように、第2の抽出条件に基づく抽出を複数回行う場合に、その都度、第1の抽出条件に基づく抽出と第2の抽出条件に基づく抽出の両方を行っていると、コンピュータの処理負担が大きくなるほか、処理速度が低速化する。当該例のように、第1の抽出処理(S22)と、第2の抽出処理(S23)とに分け、1回の第1の抽出処理に対応して第2の抽出処理を複数回行うことが可能な構成とすることで、コンピュータの処理負担が小さくなるほか、処理速度が高速化する。
【0096】
本実施形態の画像処理システム10のその他の構成は、第1及び第2の実施形態の画像処理システム10の構成と同様である。
【0097】
本実施形態の画像処理システム10によれば、第1及び第2の実施形態の画像処理システム10と同様の作用効果が実現される。また、本実施形態の画像処理システム10によれば、クライアント端末2の処理負担が軽減される。
【0098】
<第4の実施形態>
本実施形態の画像処理システム10は、物理的及び/又は論理的に1つの装置で構成される。本実施形態の画像処理システム10の機能ブロック図の一例は
図1で示される。本実施形態では、物理的及び/又は論理的に1つの装置が、対象画像取得部11、骨格構造検出部12、第1の照合部13及び第2の照合部14を備え、第1乃至第3の実施形態で説明した処理を実行する。
【0099】
本実施形態の画像処理システム10のその他の構成は、第1乃至第3の実施形態の画像処理システム10の構成と同様である。本実施形態の画像処理システム10のように構成しても、第1乃至第3の実施形態の画像処理システム10と同様の作用効果が実現される。
【0100】
<第5の実施形態>
本実施形態の画像処理システム10は、第2の抽出条件を変更する機能を有する。以下、詳細に説明する。
【0101】
図14に、画像処理システム10の機能ブロック図の一例を示す。図示するように、画像処理システム10は、対象画像取得部11と、骨格構造検出部12と、第1の照合部13と、第2の照合部14と、表示制御部15と、変更受付部16とを有する。
【0102】
表示制御部15は、第2の照合部14により抽出された第2の参照画像を表示装置に表示させる。例えば、画像処理システム10が、第2及び第3の実施形態のようにサーバ1とクライアント端末2とで構成される場合、表示制御部15は、クライアント端末2の表示装置(ディスプレイ、投影装置等)に第2の参照画像を表示させる。また、画像処理システム10が、第4の実施形態のように物理的及び/又は論理的に1つの装置で構成される場合、表示制御部15は、その装置の表示装置(ディスプレイ、投影装置等)に第2の参照画像を表示させる。
【0103】
変更受付部16は、第2の抽出条件を変更する入力を受付ける。変更受付部16は、例えば、第2の抽出条件で定義される第2の基準値、人体の姿勢の類似度を算出する際に参照するキーポイントの数、人体の姿勢の類似度を算出する際に参照するキーポイントの種類、人体の姿勢の類似度を算出する際に参照する各キーポイントの重み、最低検出点、及び必須検出キーポイントの中の少なくとも1つを変更する入力を受付けてもよい。
【0104】
最低検出点は、第2の実施形態で説明した第2の抽出条件に含めることができる「人体の姿勢の類似度を算出する際に参照するキーポイントの中の所定数以上が検出されていること」という条件の中の所定数の数である。
【0105】
必須検出キーポイントは、第2の実施形態で説明した第2の抽出条件に含めることができる「人体の姿勢の類似度を算出する際に参照するキーポイントの中の所定のキーポイントが検出されていること」という条件の中の所定のキーポイントである。
【0106】
画像処理システム10が、第2及び第3の実施形態のようにサーバ1とクライアント端末2とで構成される場合、変更受付部16は、クライアント端末2の入力装置(タッチパネル、物理ボタン、キーボード、マウス、マイク等)を介して、第2の抽出条件を変更する入力を受付けることができる。また、画像処理システム10が、第4の実施形態のように物理的及び/又は論理的に1つの装置で構成される場合、変更受付部16は、その装置の入力装置(タッチパネル、物理ボタン、キーボード、マウス、マイク等)を介して、第2の抽出条件を変更する入力を受付けることができる。
【0107】
なお、変更受付部16による第2の抽出条件を変更する入力の受付に応じて、第2の照合部14は、第1の参照画像の中から、対象画像との間の関係が変更後の第2の抽出条件を満たす第2の参照画像を新たに抽出する。そして、表示制御部15は、表示装置に表示させる内容を、変更前の第2の抽出条件を満たす第2の参照画像から、変更後の第2の抽出条件を満たす第2の参照画像に変更させる。
【0108】
次に、
図15のシーケンス図を用いて、サーバ1及びクライアント端末2で構成される画像処理システム10の処理の流れの一例を説明する。当該処理例では、サーバ1が第1の照合部13を有し、クライアント端末2が第2の照合部14を有する。
【0109】
まず、クライアント端末2が、対象画像を指定するユーザ入力を受付ける(S30)。次いで、クライアント端末2は、指定された対象画像をサーバ1に送信する(S31)。
【0110】
サーバ1は、対象画像に含まれる人体のキーポイントを検出する処理を行った後、検出されたキーポイントに基づき、複数の参照画像の中から、対象画像との間の関係が第1の抽出条件を満たす第1の参照画像を抽出する(S32)。次いで、サーバ1は、第1の参照画像と、第1の参照画像各々から検出された人体のキーポイントに関する情報(例:特徴量等)(
図11参照)と、対象画像から検出された人体のキーポイントに関する情報(例:特徴量等)をクライアント端末2に送信する(S33)。
【0111】
クライアント端末2は、S33で受信したデータ(画像や情報)を自端末の記憶装置内に記憶し、当該データに基づき、S33で受信した第1の参照画像の中から、S30で指定された対象画像との間の関係が第2の抽出条件を満たす第2の参照画像を抽出する(S34)。そして、クライアント端末2は、抽出した第2の参照画像を表示する(S35)。当該表示は、ディスプレイへの表示、投影装置を利用した映像の投影等で実現される。
【0112】
その後、ユーザは、クライアント端末2に表示された検索結果(第2の参照画像)を参照しながら、第2の抽出条件を変更する入力を行う。クライアント端末2は、当該第2の抽出条件を変更する入力を受付ける(S36)。そして、クライアント端末2は、当該入力の受付に応じて、S33で受信した第1の参照画像の中から、S30で指定された対象画像との間の関係が変更後の第2の抽出条件を満たす第2の参照画像を新たに抽出する(S37)。なお、クライアント端末2は、S33で受信し、自端末の記憶装置内に記憶されたデータに基づき、S37の抽出処理を行う。次いで、クライアント端末2は、表示装置に表示させる内容を、変更前の第2の抽出条件を満たす第2の参照画像から、変更後の第2の抽出条件を満たす第2の参照画像に変更させる(S38)。
【0113】
クライアント端末2は、S36乃至S38の処理を繰り返し行うことができる。
【0114】
次に、
図16のシーケンス図を用いて、サーバ1及びクライアント端末2で構成される画像処理システム10の処理の流れの他の一例を説明する。当該処理例では、サーバ1が第1の照合部13及び第2の照合部14を有する。
【0115】
まず、クライアント端末2が、対象画像を指定するユーザ入力を受付ける(S40)。次いで、クライアント端末2は、指定された対象画像をサーバ1に送信する(S41)。
【0116】
サーバ1は、対象画像に含まれる人体のキーポイントを検出する処理を行った後、検出されたキーポイントに基づき、複数の参照画像の中から、対象画像との間の関係が第1の抽出条件を満たす第1の参照画像を抽出する(S42)。そして、サーバ1は、S42の処理で得られたデータ(画像や情報)を自装置の記憶装置内に記憶する。
【0117】
次いで、サーバ1は、S42のキーポイントの検出結果に基づき、S42で抽出した第1の参照画像の中から、S41で受信した対象画像との間の関係が第2の抽出条件を満たす第2の参照画像を抽出する(S43)。そして、サーバ1は、抽出した第2の参照画像をクライアント端末2に送信する(S44)。
【0118】
クライアント端末2は、受信した第2の参照画像を表示する(S45)。当該表示は、ディスプレイへの表示、投影装置を利用した映像の投影等で実現される。
【0119】
その後、ユーザは、クライアント端末2に表示された検索結果(第2の参照画像)を参照しながら、第2の抽出条件を変更する入力を行う。クライアント端末2は、当該第2の抽出条件を変更する入力を受付ける(S46)。そして、クライアント端末2は、変更後の第2の抽出条件をサーバ1に送信する(S47)。
【0120】
次いで、サーバ1は、S42で抽出した第1の参照画像の中から、S40で指定された対象画像との間の関係が変更後の第2の抽出条件を満たす第2の参照画像を新たに抽出する(S48)。なお、サーバ1は、S42の処理で得られ、自装置の記憶装置内に記憶されたデータに基づき、S48の抽出処理を行う。次いで、サーバ1は、変更後の第2の抽出条件を満たす第2の参照画像をクライアント端末2に送信する(S49)。
【0121】
そして、クライアント端末2は、表示装置に表示させる内容を、変更前の第2の抽出条件を満たす第2の参照画像から、変更後の第2の抽出条件を満たす第2の参照画像に変更させる(S50)。
【0122】
サーバ1及びクライアント端末2は、S46乃至S50の処理を繰り返し行うことができる。
【0123】
次に、
図17のフローチャートを用いて、物理的及び/又は論理的に1つの装置で構成される画像処理システム10の処理の流れの他の一例を説明する。
【0124】
まず、画像処理システム10は、対象画像を指定するユーザ入力を受付ける(S60)。次いで、画像処理システム10は、対象画像に含まれる人体のキーポイントを検出する処理を行った後、検出されたキーポイントに基づき、複数の参照画像の中から、対象画像との間の関係が第1の抽出条件を満たす第1の参照画像を抽出する(S61)。そして、画像処理システム10は、S61の処理で得られたデータ(画像や情報)を自装置の記憶装置内に記憶する。
【0125】
次いで、画像処理システム10は、S61のキーポイントの検出結果に基づき、S61で抽出した第1の参照画像の中から、S60で指定された対象画像との間の関係が第2の抽出条件を満たす第2の参照画像を抽出する(S62)。そして、画像処理システム10は、抽出した第2の参照画像を表示する(S63)。当該表示は、ディスプレイへの表示、投影装置を利用した映像の投影等で実現される。
【0126】
その後、ユーザは、画像処理システム10に表示された検索結果(第2の参照画像)を参照しながら、第2の抽出条件を変更する入力を行う。画像処理システム10は、当該第2の抽出条件を変更する入力を受付ける(S64)。
【0127】
次いで、画像処理システム10は、S61で抽出した第1の参照画像の中から、S60で指定された対象画像との間の関係が変更後の第2の抽出条件を満たす第2の参照画像を新たに抽出する(S65)。なお、画像処理システム10は、S61の処理で得られ、自装置の記憶装置内に記憶されたデータに基づき、S65の抽出処理を行う。次いで、画像処理システム10は、表示装置に表示させる内容を、変更前の第2の抽出条件を満たす第2の参照画像から、変更後の第2の抽出条件を満たす第2の参照画像に変更させる(S66)。
【0128】
画像処理システム10は、S64乃至S66の処理を繰り返し行うことができる。
【0129】
本実施形態の画像処理システム10のその他の構成は、第1乃至第4の実施形態の画像処理システム10の構成と同様である。本実施形態の画像処理システム10のように構成しても、第1乃至第4の実施形態の画像処理システム10と同様の作用効果が実現される。
【0130】
また、本実施形態の画像処理システム10によれば、検索処理を繰り返し行い、その検索結果を確認しながら第2の抽出条件を変更する作業において、検索処理を高速化することができる。
【0131】
<第6の実施形態>
本実施形態の画像処理システム10は、特徴的なUI(user interface)画面を介して、第2の抽出条件の変更を受付ける。以下、詳細に説明する。
【0132】
図14に、画像処理システム10の機能ブロック図の一例を示す。図示するように、画像処理システム10は、対象画像取得部11と、骨格構造検出部12と、第1の照合部13と、第2の照合部14と、表示制御部15と、変更受付部16とを有する。
【0133】
変更受付部16は、特徴的な設定画面(UI画面)を介して、第2の抽出条件を変更する入力を受付ける。画像処理システム10が、第2及び第3の実施形態のようにサーバ1とクライアント端末2とで構成される場合、クライアント端末2が設定画面を表示する。また、画像処理システム10が、第4の実施形態のように物理的及び/又は論理的に1つの装置で構成される場合、その装置が設定画面を表示する。
【0134】
図18に、設定画面の一例を示す。図示するUI画面においては、左端の領域において、「静止画」、「撮像」、「Live」及び「設定」の項目が選択可能になっている。当該領域で「設定」を選択することで図示するような設定画面が表示される。
【0135】
図示する設定画面では、領域Mにおいて動画像が再生表示されている。当該動画像は、任意のカメラが現在撮影中のライブ画像であってもよいし、過去に撮影され保存された動画像であってもよい。
【0136】
「回転角度」は、領域Mの画像を回転させるためのUI部品である。例えば、0度、90度、180度、270度が選択可能であり、選択された角度だけ領域Mに表示される画像が回転する。例えば、図示する状態において「90度」が選択されると、領域Mに表示されている画像が時計回りに90度回転する。
【0137】
「検出閾値」は、第1の抽出条件の第1の基準値である。
【0138】
「ラベル名」は、第2の実施形態で説明した通りである。ユーザは、当該UI部品を介してラベル名を選択することができる。
【0139】
「枠線の色」、「初期選択」、「チェック項目を全て選択」及び「使用していない姿勢も表示」については、後述する。
【0140】
上記項目が表示された領域の下には、第2の抽出条件を変更する入力を受付けるためのUI部品が表示されている。ラベル名の選択に応じて、そのラベル名のグループに紐付く1つ又は複数のデータ名各々に対応した現在の設定内容が表示される。ユーザは、その設定内容を所望の内容に変更することができる。例えば、図示するようにユーザがラベル名として「車イス」を選択すると、そのラベル名のグループに紐付くデータ名である「車イス:俯瞰」に対応した現在の設定内容が表示される。また、図示ないが、例えばユーザがラベル名として「携帯使用」を選択すると、そのラベル名のグループに紐付く「携帯電話・右手・俯瞰」、「携帯電話・左手・俯瞰」等のデータ名各々に対応した現在の設定内容が表示される。すなわち、「携帯電話・右手・俯瞰」、「携帯電話・左手・俯瞰」等のデータ名各々に対応して、図示するような人体モデル、第二閾値、最低検出点等が表示される。
【0141】
領域Rには、N個のキーポイントで構成された人体モデルが表示されている。そして、人体の姿勢の類似度を算出する際に参照するキーポイントと、参照しないキーポイントとが識別可能に表示されている。図示する例の場合、白丸で示されたキーポイントK1は人体の姿勢の類似度を算出する際に参照され、黒丸で示されたキーポイントK2は人体の姿勢の類似度を算出する際に参照されない。
【0142】
ユーザは、N個のキーポイント中から1つを選択し、そのキーポイントの重みを変更することができる。図示する例の場合、マークQで囲まれたキーポイントがユーザにより選択されている。このキーポイントの名称は「joint3」である。1つのキーポイントの選択に応じて、図示するように、選択されているキーポイントの名称と、その重みを変更するUI部品が画面に表示される。図示する例の場合、joint3の重みは「0.0」になっている。これは、このキーポイントは人体の姿勢の類似度を算出する際に参照しないことを意味する。
【0143】
ユーザは、例えば図示するスライドバーの操作、又は数値の直接入力等で、選択中のキーポイントの重みを変更することができる。例えば、joint3の重みを「0」から「0と異なる数値」に変更することができる。すると、当該変更に応じて、joint3は人体の姿勢の類似度を算出する際に参照しないキーポイントから参照するキーポイントに切り替わる。それに応じて、領域Rにおけるjoint3の表示が、黒丸から白丸に切り替わる。
【0144】
なお、人体の姿勢の類似度を算出する際に参照するキーポイント(白丸で示されたキーポイントK1)を選択し、そのキーポイントの重みを「0」にすることもできる。当該変更に応じて、そのキーポイントは、人体の姿勢の類似度を算出する際に参照するキーポイントから参照しないキーポイントに切り替わる。それに応じて、領域Rにおけるそのキーポイントの表示が、白丸から黒丸に切り替わる。
【0145】
その他、人体の姿勢の類似度を算出する際に参照するキーポイント(白丸で示されたキーポイントK1)を選択し、そのキーポイントの重みを「0」と異なる範囲で変更することもできる。
【0146】
「ID19:車イス・俯瞰」は、第2の実施形態で説明した「データ名」である。本実施形態では、データ名ごとに第2の抽出条件が設定される。「ID19:車イス・俯瞰」等データ名の表示を参照することで、ユーザは、どのデータ名に対応する第2の抽出条件が表示され、設定中か認識できる。
【0147】
「第二閾値」は、第2の抽出条件の第2の基準値である。
【0148】
「最低検出点」は、第5の実施形態で説明した通りである。当該例の場合、第2の抽出条件は、「人体の姿勢の類似度を算出する際に参照するキーポイントの中の所定数以上が検出されていること」が含まれる。図示する例の場合、6個のキーポイント(白丸で示されたキーポイントK1)が「人体の姿勢の類似度を算出する際に参照するキーポイント」となり、最低検出点は「2」となっている。この場合、この6個のキーポイントの中の2個以上が検出されていることが、第2の抽出条件を満たすための条件となる。
【0149】
変更受付部16は、このような複数のキーポイントで構成された人体モデル(領域Rに表示された人体モデル)を含み、当該人体モデル上で設定対象のキーポイントを選択する入力を受付け、選択されたキーポイント(マークQで囲まれたキーポイント)の重みを変更する入力を受付ける設定画面を介して、第2の抽出条件を変更する入力を受付けることができる。
【0150】
また、変更受付部16は、上記人体モデルにおいて、選択されたキーポイントを強調表示(マークQで強調表示)する設定画面を介して、第2の抽出条件を変更する入力を受付けることができる。
【0151】
また、変更受付部16は、上記人体モデルにおいて、設定されている重みが閾値(例:0)より大のキーポイント(白丸で示されたキーポイントK1)と、その他のキーポイント(黒丸で示されたキーポイントK2)とを異なる態様で表示する設定画面を介して、第2の抽出条件を変更する入力を受付けることができる。
【0152】
なお、
図18の画面左上の「設定保存」ボタンを押下すると、その時点の設定内容が保存される。保存対象は、第2の抽出条件であるが、さらに第1の抽出条件の第1の基準値も当該操作での保存対象としてもよい。
【0153】
画面左上の「分析」ボタンを押下すると、対象画像取得部11は、その時点で領域Mに表示されていたフレーム画像を対象画像として取得する。その後、骨格構造検出部12、第1の照合部13及び第2の照合部14は、その対象画像に対し、第1乃至第5の実施形態で説明した処理を行う。そして、表示制御部15は、
図19に示すように、第2の照合部14により抽出された第2の参照画像を表示させる。図の「照合結果」の欄に表示された10件の画像が、第2の照合部14により抽出された第2の参照画像である。
【0154】
なお、表示制御部15は、図示するように、対象画像の指定(
図18の画面左上の「分析」ボタンの押下)に応じて、領域Mに表示する画像を、当初の動画像から、指定された対象画像(静止画像)に切り替えることができる。そして、表示制御部15は、当該対象画像上に枠Wを重畳表示することができる。枠Wは、対象画像内で検出された「選択中のラベル名のグループに紐付くデータ名に対応した第2の抽出条件を満たす人物」を囲むように表示される。当該画面で設定可能な「枠線の色」は、この枠Wの色である。
【0155】
表示制御部15は、さらに、対象画像上に、対象画像内で検出された人体のキーポイントを重畳表示してもよい。当該重畳表示は、骨格構造検出部12による検出結果に基づき実現される。なお、当該重畳表示においては、全てのキーポイントを同じ表示態様で表示してもよいし、異なる表示態様で表示してもよい。例えば、右半身のキーポイントと左半身のキーポイントを互いに異なる表示態様で表示してもよいし、上半身のキーポイントと下半身のキーポイントを互いに異なる表示態様で表示してもよい。また、人体の姿勢の類似度を算出する際に参照するキーポイントを強調表示してもよい。さらに、領域Rにおいて1つのキーポイントが選択されると、対象画像上に重畳表示された人体モデルにおいて、その選択されたキーポイントを強調表示してもよい。
【0156】
ユーザは、照合結果を参照しながら、第2の抽出条件を変更する入力を行うことができる。例えば、ユーザは、
図19の状態から最低検出点を「3」に変更したとする。すると、当該第2の抽出条件の変更に応じて、第2の照合部14は、第1の参照画像の中から、対象画像との間の関係が変更後の第2の抽出条件を満たす第2の参照画像を新たに抽出する。そして、表示制御部15は、
図20に示すように、照合結果の欄に表示させる内容を、変更前の第2の抽出条件を満たす第2の参照画像から、変更後の第2の抽出条件を満たす第2の参照画像に変更させる。
図19及び
図20では、最低検出点を2から3に変更することで、抽出される第2の参照画像の数が10件から6件にかわる様子が示されている。
【0157】
図21に示すように「使用していない姿勢も表示」にチェックを入れると、選択されたラベル名以外のラベル名のグループに紐付くデータ名に対応した第2の抽出条件(設定保存されているもの)も同時に表示される。
図21では、「ラベル名」において「車イス」が選択されているが、「使用していない姿勢も表示」にチェックが入っているため、「携帯電話・右手」等の選択されたラベル名のグループに紐付かないデータ名に対応した第2の抽出条件も表示されている。
【0158】
ユーザは、
図22に示すように、複数のデータ名各々に対応した複数の第2の抽出条件各々を、第2の照合部14による第2の参照画像の抽出処理において参照するか否かを指定することができる。
図22では、複数のデータ名各々に対応した複数の第2の抽出条件各々に対応してチェックボックス(各領域Rの隣のチェックボックス)が表示されている。この複数のチェックボックスを個別に操作し、「チェック項目を全て要求」にチェックを入れると、チェックボックスにチェックが入っている第2の抽出条件の全てが第2の照合部14による第2の参照画像の抽出処理において参照される。そして、第2の照合部14は、チェックボックスにチェックが入っている第2の抽出条件の全てを満たす第2の参照画像を抽出する。なお、「チェック項目を全て要求」にチェックが入っていない場合、第2の照合部14は、チェックボックスにチェックが入っている第2の抽出条件の中の少なくとも1つを満たす第2の参照画像を抽出する。
【0159】
ここで、
図18乃至
図22のUI画面において、左端の領域で「静止画」、「撮像」、「Live」の項目が選択された場合に実行される処理を簡単に説明する。
【0160】
「静止画」が選択されると、記憶装置に記憶されている画像の中から処理画像を選択するための画面が表示される。1つの画像が処理画像として選択されると、骨格構造検出部12、第1の照合部13及び第2の照合部14は、その処理画像に対し、第1乃至第5の実施形態で説明した処理を行う。なお、第1の照合部13及び第2の照合部14はその時点の第1の抽出条件及び第2の抽出条件の設定内容に基づき、第1の参照画像及び第2の参照画像の抽出を行う。そして、抽出された第2の参照画像が照合結果として画面に表示される。
【0161】
「撮像」が選択されると、任意のカメラが現在撮影中のライブ画像、又は過去に撮影された動画像から処理画像を選択するための画面が表示される。当該画面では、ライブ画像又は過去に撮影された動画像が再生表示される。そして、ユーザは、その再生中に、任意のタイミングで撮影操作を行う。すると、そのタイミングで表示されていたフレーム画像が処理画像として選択される。1つの画像が処理画像として選択されると、骨格構造検出部12、第1の照合部13及び第2の照合部14は、その処理画像に対し、第1乃至第5の実施形態で説明した処理を行う。なお、第1の照合部13及び第2の照合部14はその時点の第1の抽出条件及び第2の抽出条件の設定内容に基づき、第1の参照画像及び第2の参照画像の抽出を行う。そして、抽出された第2の参照画像が照合結果として画面に表示される。
【0162】
「Live」が選択されると、任意のカメラが現在撮影中のライブ画像、又は過去に撮影された動画像から処理画像を選択するための画面が表示される。当該画面では、ライブ画像又は過去に撮影された動画像が再生表示される。そして、ユーザは、処理画像を選択する時間間隔を指定する入力を行う。すると、指定された時間間隔で複数のフレーム画像が処理画像として選択される。骨格構造検出部12、第1の照合部13及び第2の照合部14は、選択された複数の処理画像各々に対し、順次、第1乃至第5の実施形態で説明した処理を行う。なお、第1の照合部13及び第2の照合部14はその時点の第1の抽出条件及び第2の抽出条件の設定内容に基づき、第1の参照画像及び第2の参照画像の抽出を行う。そして、抽出された第2の参照画像が照合結果として画面に表示される。
【0163】
なお、「静止画」、「撮像」、「Live」のいずれの項目が選択された場合においても、ユーザは少なくとも1つのラベル名を選択する。例えば、画面上に複数のラベル名各々に対応したチェックボックスが表示される。ユーザは所望のラベル名のチェックボックスにチェックを入れることで、少なくとも1つのラベル名を選択する。そして、画像処理システム10は、選択されたラベル名のグループに紐付くデータ名に対応した第2の抽出条件(設定保存されているもの)を用いた抽出処理を行い、抽出された第2の参照画像を照合結果として画面に表示する。
【0164】
ここで、上述した設定画面(
図18乃至
図22参照)における「初期選択」について説明する。設定画面上で1つのラベル名が選択され、初期選択にチェックが入った状態で設定保存がなされると、そのラベル名は上述した「静止画」、「撮像」、「Live」の画面における上記ラベル名の選択のUI部品において、選択された状態がデフォルトとなる。例えば、
図21に示すように、設定画面においてラベル名として「車イス」が選択され、初期選択にチェックが入った状態で設定保存がなされると、ラベル名「車イス」は上述した「静止画」、「撮像」、「Live」の画面における上記ラベル名の選択のUI部品において、選択された状態がデフォルトとなる。
【0165】
本実施形態の画像処理システム10のその他の構成は、第1乃至第5の実施形態の画像処理システム10の構成と同様である。本実施形態の画像処理システム10のように構成しても、第1乃至第5の実施形態の画像処理システム10と同様の作用効果が実現される。
【0166】
また、本実施形態の画像処理システム10によれば、上述した特徴的な設定画面を介して、第2の抽出条件を変更する入力を行うことができる。ユーザは、上述した特徴的な設定画面を介して第2の抽出条件を変更する入力を行うことで、効率的に、かつより正確に、所望の第2の抽出条件を設定することができる。
【0167】
以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。上述した実施形態の構成は、互いに組み合わせたり、一部の構成を他の構成に入れ替えたりしてもよい。また、上述した実施形態の構成は、趣旨を逸脱しない範囲内において種々の変更を加えてもよい。また、上述した各実施形態や変形例に開示される構成や処理を互いに組み合わせてもよい。
【0168】
また、上述の説明で用いた複数のフローチャートでは、複数の工程(処理)が順番に記載されているが、各実施の形態で実行される工程の実行順序は、その記載の順番に制限されない。各実施の形態では、図示される工程の順番を内容的に支障のない範囲で変更することができる。また、上述の各実施の形態は、内容が相反しない範囲で組み合わせることができる。
【0169】
上記の実施の形態の一部または全部は、以下の付記のようにも記載されうるが、以下に限られない。
1. 対象画像を取得する対象画像取得手段と、
前記対象画像に含まれる人体のキーポイントを検出する処理を行う骨格構造検出手段と、
検出された前記キーポイントに基づき、複数の参照画像の中から、前記対象画像との間の関係が第1の抽出条件を満たす第1の参照画像を抽出する第1の照合手段と、
検出された前記キーポイントに基づき、前記第1の参照画像の中から、前記対象画像との間の関係が第2の抽出条件を満たす第2の参照画像を抽出する第2の照合手段と、
を有する画像処理システム。
2. 前記第1の抽出条件は、第1の算出方法で算出した画像に含まれる人体の姿勢の類似度が第1の基準値以上であり、
前記第2の抽出条件は、第2の算出方法で算出した画像に含まれる人体の姿勢の類似度が第2の基準値以上である1に記載の画像処理システム。
3. 前記第1の算出方法及び前記第2の算出方法は、人体の姿勢の類似度を算出する際に参照する前記キーポイントの数及び前記キーポイントの種類の少なくとも一方が互いに異なるに記載の画像処理システム。
4. 前記第2の抽出条件は、
人体の姿勢の類似度を算出する際に参照する前記キーポイントの中の所定数以上が検出されていること、及び、
人体の姿勢の類似度を算出する際に参照する前記キーポイントの中の所定の前記キーポイントが検出されていること、
の少なくとも一方を含む3に記載の画像処理システム。
5. 前記第1の算出方法及び前記第2の算出方法は、人体の姿勢の類似度を算出する際に参照する前記キーポイント各々の重みの設定内容が互いに異なる2から4のいずれかに記載の画像処理システム。
6. 前記第1の算出方法では、全ての前記キーポイントの重みを同じにして人体の姿勢の類似度を算出し、
前記第2の算出方法では、キーポイント毎に設定された重みに基づき人体の姿勢の類似度を算出する5に記載の画像処理システム。
7. 前記第2の参照画像を表示装置に表示させる表示制御手段と、
前記第2の抽出条件を変更する入力を受付ける変更受付手段と、
をさらに有し、
前記第2の抽出条件を変更する入力の受付に応じて、
前記第2の照合手段は、前記第1の参照画像の中から、前記対象画像との間の関係が変更後の前記第2の抽出条件を満たす前記第2の参照画像を新たに抽出し、
前記表示制御手段は、前記表示装置に表示させる内容を、変更前の前記第2の抽出条件を満たす前記第2の参照画像から、変更後の前記第2の抽出条件を満たす前記第2の参照画像に変更させる1から6のいずれかに記載の画像処理システム。
8. 前記変更受付手段は、
複数の前記キーポイントで構成された人体モデルを含み、前記人体モデル上で設定対象の前記キーポイントを選択する入力を受付け、選択された前記キーポイントの重みを変更する入力を受付ける設定画面を介して、前記第2の抽出条件を変更する入力を受付ける7に記載の画像処理システム。
9. 前記変更受付手段は、
前記人体モデルにおいて、選択された前記キーポイントを強調表示する前記設定画面を介して、前記第2の抽出条件を変更する入力を受付ける8に記載の画像処理システム。
10. 前記変更受付手段は、
前記人体モデルにおいて、設定されている重みが閾値より大の前記キーポイントと、その他の前記キーポイントとを異なる態様で表示する前記設定画面を介して、前記第2の抽出条件を変更する入力を受付ける8に記載の画像処理システム。
11. サーバと、クライアント端末とを有し、
前記サーバは、前記第1の照合手段を有し、抽出した前記第1の参照画像を前記クライアント端末に送信し、
前記クライアント端末が前記第2の照合手段を有し、前記サーバから受信した前記第1の参照画像の中から前記第2の参照画像を抽出する1に記載の画像処理システム。
12. 対象画像を取得する対象画像取得手段と、
前記対象画像に含まれる人体のキーポイントを検出する処理を行う骨格構造検出手段と、
検出された前記キーポイントに基づき、複数の参照画像の中から、前記対象画像との間の関係が第1の抽出条件を満たす第1の参照画像を抽出する第1の照合手段と、
検出された前記キーポイントに基づき、前記第1の参照画像の中から、前記対象画像との間の関係が第2の抽出条件を満たす第2の参照画像を抽出する第2の照合手段と、
を有する装置。
13. 1つ又は複数のコンピュータが、
対象画像を取得し、
前記対象画像に含まれる人体のキーポイントを検出する処理を行い、
検出された前記キーポイントに基づき、複数の参照画像の中から、前記対象画像との間の関係が第1の抽出条件を満たす第1の参照画像を抽出し、
検出された前記キーポイントに基づき、前記第1の参照画像の中から、前記対象画像との間の関係が第2の抽出条件を満たす第2の参照画像を抽出する画像処理方法。
14. コンピュータを、
対象画像を取得する対象画像取得手段、
前記対象画像に含まれる人体のキーポイントを検出する処理を行う骨格構造検出手段、
検出された前記キーポイントに基づき、複数の参照画像の中から、前記対象画像との間の関係が第1の抽出条件を満たす第1の参照画像を抽出する第1の照合手段、
検出された前記キーポイントに基づき、前記第1の参照画像の中から、前記対象画像との間の関係が第2の抽出条件を満たす第2の参照画像を抽出する第2の照合手段、
として機能させるプログラム。
【符号の説明】
【0170】
1 サーバ
2 クライアント端末
10 画像処理システム
11 対象画像取得部
12 骨格構造検出部
13 第1の照合部
14 第2の照合部
15 表示制御部
16 変更受付部
1A プロセッサ
2A メモリ
3A 入出力I/F
4A 周辺回路
5A バス