(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】特開2017-41218(P2017-41218A)
(43)【公開日】2017年2月23日
(54)【発明の名称】顔画像から体重を推定するシステム
(51)【国際特許分類】
G06T 1/00 20060101AFI20170203BHJP
G06T 7/00 20170101ALI20170203BHJP
G01G 19/44 20060101ALI20170203BHJP
【FI】
G06T1/00 340A
G06T7/00 350B
G01G19/44 D
【審査請求】未請求
【請求項の数】8
【出願形態】書面
【全頁数】10
(21)【出願番号】特願2015-175154(P2015-175154)
(22)【出願日】2015年8月20日
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.イーサネット
(71)【出願人】
【識別番号】515244829
【氏名又は名称】石▲崎▼ 仁一
(72)【発明者】
【氏名】石▲崎▼ 仁一
【テーマコード(参考)】
5B057
5L096
【Fターム(参考)】
5B057AA20
5B057BA02
5B057BA23
5B057CA08
5B057CA12
5B057CA16
5B057CB08
5B057CB12
5B057CB16
5B057CD02
5B057CD03
5B057CD05
5B057CF05
5B057CH11
5B057CH14
5B057CH20
5B057DA16
5B057DA20
5B057DB02
5B057DB09
5B057DC02
5B057DC03
5B057DC05
5B057DC08
5B057DC16
5B057DC33
5B057DC36
5B057DC40
5L096BA08
5L096CA02
5L096CA25
5L096DA02
5L096EA13
5L096EA15
5L096EA16
5L096EA31
5L096FA34
5L096FA66
5L096FA67
5L096HA07
5L096HA11
5L096JA11
5L096KA04
(57)【要約】 (修正有)
【課題】複数の顔画像を分析し、体重に影響する部分とそうでない部分との相関関係から体重測定を行うことを可能とする。
【解決手段】ユーザーの携帯端末100
1〜100
Nから複数の顔画像をネットワーク網NW1に送信する。送られた顔画像データはインターネット網を経て情報処理装置200に蓄積する。蓄積された顔画像データはインターネット網を経由してPCより閲覧、解析を行う事が出来、顔について、目と目の間、鼻、口、顔の輪郭の幅や、顔の輪郭上の複数の接線が交わる際の角度といったデータについて解析を行う。解析したデータから上記相関関係に従って体重測定を行い、情報処理装置200に蓄積しつつユーザーの携帯端末100
1〜100
Nに表示する。PCは顔画像解析から学習し、上記相関関係の統計データを改めることで体重測定精度を向上させる。
【選択図】
図1
【特許請求の範囲】
【請求項1】
人物の顔画像からその人物の体重を推定するための機械学習システムであって、(a)人物の顔画像に含まれる頭部の形状を表現する特徴量となる座標の集合を入力とし、その人物の体重の推定値を出力することができる推定アルゴリズムと、(b)人物の顔画像に含まれる頭部の座標の集合を入力とし、その人物の体重の正解データを出力とすることで、推定アルゴリズムに含まれる可変パラメータが自動的に学習され、推定あるゴリズムの精度を向上させることができる学習アルゴリズムと、(c)システムの利用者によって、顔写真とその写真撮影時の体重をシステムにアップロードすることができる、正解データ収集支援アプリケーションと、を含む機械学習システム。
【請求項2】
前記推定アルゴリズムは、線形回帰、ボルツマンマシン、ニューラルネットワーク、サポートベクターマシン、ベイジアンネットワークを用いた統計的推定、強化学習、深層学習の内の1つまたは複数を含む、請求項1に記載の機械学習システム。
【請求項3】
前記学習アルゴリズムは、線形回帰、ニューラルネットワーク、サポートベクターマシン、ベイジアンネットフークを用いた統計的推定、強化学習、深層学習の内の1つまたは複数を含む、請求項1に記載の機械学習システム。
【請求項4】
前期正解データ収集支援アプリケーションは、スマートフォンおよびパーソナルコンピュータ上で動作するネイティブアプリケーションもしくはブラウザアプリケーション。
【請求項5】
前記頭部の形状を表現する特徴量となる座標の集合に対する、請求項2および請求項3の機械学習効率を高めるための補正処理であって、(a)画像サイズに精度が依存しないようにするための正規化補正、(b)画像の鉛直軸もしくは水平軸に対する顔の回転角度に精度が依存しないようにするための角度補正、(c)画像の中央座標に対する顔の中央座標の位置ベクトルが精度に依存しないようにするための平行移動補正を、1つまたは複数含む補正処理。
【請求項6】
前期正規化補正は、頭部画像を画像処理することにより得られる、両側の外眼角点もしくは画側の内眼角点の間の距離を、距離の単位として画像全体を正規化する補正方法を含む正規化補正。
【請求項7】
前期角度補正は、頭部画像を画像処理することにより得られる、両側の外眼角点もしくは両側の内眼角点を結ぶことよって形成される直線の傾きを増減させるように画像全体に回転処理を施す方法を含む角度補正。
【請求項8】
前期平行移動補正は、頭部画像を画像処理することにより得られる、両側の外眼角点もしくは両側の内眼角点を結ぶことよって形成される直線の中点の座標、もしくは、鼻根点の座標、もしくは、眉間点の座標のいずれかを原点として、画像全体に平行移動処理を施す方法を含む平行補正。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、人物の顔画像からその人物の体重を推定するプログラム、情報処理装置、ネットワーク装置、サーバ装置に関する。
【背景技術】
【0002】
体重計は一般的に体重を計測する装置として使用されている。この体重計の応用として、例えば、体重を測定した後にその値を外部の記憶装置に送信し、その人物の体重測定の履歴を記録することが可能な高機能体重計が存在する。
【0003】
顔認識技術は一般的に人物画像の中から顔画像を検出するために使用されている。この技術を用いた応用技術として、例えば、顔画像を検出した後に、その顔画像の特徴からその人物の年齢や性別を推定することが可能な技術が存在する。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特許公開2004−265431
【特許文献2】特許出願2004−110880
【0005】
以上のような体重計には次のような課題があった。体重を計測するためには、自宅に据え置きされている体重計に乗る必要があるため、外出先から気軽に使用することができない。また、体重を外部記憶装置に記録できる機能を有する高機能体重計は、その機能を有しない一般的な体重計に比べて高価であるため、その機能による費用対効果が低いと考える消費者に対しては普及しにくい。
【0006】
さらに、次のような理由により、これらの課題は解決を求められている。『総務省国民生活に関する世論調査1996』によると、国民生活における関心事項の割合において第一位が「自分の健康」(44%)、第三位が「家族の健康」(36%)となっており、国民が医療やヘルスケアに高い関心を持っていることが示されている。特に、近年は生活習慣病予防の観点や、容姿外見に関する美的観点から、体重やBMIを正常値に保つことが重用視されている。そのため、場所を選ばず自動的に体重を記録して管理することに対するニーズが高くなっている。
【0007】
上記の課題を解決すべく、本発明は、顔認識技術を応用して人物の顔画像からその人物の体重を推定すること、および、外部記録装置と組み合わせて体重を自動的に記憶することを可能にするソフトウェアとシステム構成を提供する。
【0008】
本発明の利用者は、スマートフォンやパーソナルコンピュータ、携帯型ゲーム機、電子書籍リーダーなどの、既に保有している可搬な端末上でソフトウェアを動作させる。ソフトウェアは顔画像からその人物の体重を推定すし、推定された体重は電子記録媒体に自動的に記録され管理される。
【0009】
本発明は、既に広く普及しているスマートフォンなどの端末でも利用可能であるため、場所を選ばず体重を推定して記録することが可能になる。そのため、体重を計測する際に自宅に据え置きされている体重計に乗る必要性がなくなる。また、体重を外部記憶装置に記録できる機能を有する高機能体重計を高額で入手する必要性がなくなる。以上により、本発明は前述の課題を解決する効果を有する。
【0010】
また、システムには様々な人物の顔画像と体重の推定結果が蓄積されていくが、蓄積された推定結果には、正しく推定できなかったものも含まれることが想定される。利用者は自身の体重がシステムによって正しく推定されてなかったと感じた場合、正しい値をシステムに送信することによって、推定体重の修正を申し出ることができる。システムは、修正された値を学習用データとして機械学習を行うことにより、それ以降の推定精度を向上させる。
【0011】
さらに、利用者は自身の顔写真と健康状態をシステムに送信することができる。システムは、顔写真と健康状態を学習用データとして機械学習を行うことにより、顔写真からその人物の健康状態を推定できるようになる。
【図面の簡単な説明】
【0012】
【
図2】 クライアント端末のハードウェア構成を示すブロック図
【
図3】 情報処理装置のハードウェア構成を示すブロック図
【
図6】 体重推定の結果を表示するまでの流れを示す図
【
図7】 クライアント端末上への推定体重の表示例を示す図
【発明を実施するための形態】
【0013】
請求項1およびせい請求項2に係る本発明は以下のシステム構成と処理フローを提供する。
【0015】
システムには、利用者が保有しているクライアント端末100を少なくとも必要とする。このクライアント端末100は、スマートフォンやパーソナルコンピュータ、携帯型ゲーム機、電子書籍リーダーなどが該当する。いずれの場合も、クライアント端末100は、ソフトウェアを実行するためのCPUおよびメモリと、利用者に対して情報を表示するためのディスプレイを少なくとも必要とする。
【0016】
クライアント端末100が高性能なCPUやメモリを有しており、CPU負荷が大きい複雑な画像処理プログラムを実行することが可能である場合、後述の体重推定プログラム900をクライアント端末100の内部で実行することが可能である。このように、他の端末に依存せず単独の端末だけで動作する方式を「スタンドアロン型アプリケーション方式」と命名する。本発明は、スタンドアロン型アプリケーション方式によって体重推定プログラム900を動作させ、利用者に対して結果を表示するということを可能にする。
【0017】
しかし、本発明は、必ずしもスタンドアロン型アプリケーション方式をとる必要はない。他の機器とネットワークを介して連携することで動作する方式を「クライアントサーバ型アプリケーション方式」と命名する。本発明は、例えば、計算用サーバ機のような情報処理装置200の内部で体重推定プログラム900を実行し、クライアント端末100にその結果を表示するという方式を取ることも可能である。この場合、クライアント端末100には情報処理装置200と通信するための通信部が必要である。
【0018】
これより以下では、本発明をクライアントサーバ型アプリケーション方式で実現した場合の詳細について記述されているが、本発明は、スタンドアロン型アプリケーション方式でも実現可能であることに留意されたい。
【0019】
図1はこの発明をクライアントサーバ型アプリケーション方式で実施する際のシステムの形態を示す図である。システムには少なくとも、利用者が保有しているクライアント端末100と、後述の体重推定プログラム900が動作する情報処理装置200と、それらをネットワーク接続するためのネットワーク網NW1と、利用者情報を記録するための利用者データベースDB1と、顔写真情報を記録するための顔写真データベースDB2と、顔写真の実データを保存しておくためのストレージSTR1とを必要とする。
【0020】
図1において、複数のクライアント端末100を図示しており、それぞれ100_1、100_2、および100_Nと記載している。クライアント端末100は、例えば、スマートフォンやタブレット端末、携帯型のゲーム機、電子書籍リーダーであってもよい。
また、全てのクライアント端末100がネットワーク網NW1を介して単一の情報処理装置200と接続さてているが、情報処理装置200は複数存在しても良い。また、その場合、任意のクライアント端末100は、ネットワーク網NW1を介して任意の情報処理装置200と接続することができる。また、ネットワーク網NW1は、クライアント端末100と情報処理装置200を接続するための任意のネットワークであり、例えば、インターネット、広域イーサネット、VPN、LANなどである。
【0021】
図2は、クライアント端末100のハードウェア構成を示すブロック図である。クライアント端末100は、制御部110、記憶部120、通信部130、演算部140、入力部150、表示部160を少なくとも備える。制御部110は、クライアント端末100の各部の動作を制御するものである。記憶部120はROM(Read Only Memory)、RAM(Random Access Memory)といったメモリやHDD(Hard Disk Drive)やSSD(Solid State Drive)といった記憶装置である。通信部130は、ネットワーク網NW1を介して情報処理装置200と接続するための機能を有する、ネットワークアダプタといった有線通信もしくは無線通信装置である。演算部140は、プログラムを実行するための機能を有する、CPU(Central Processing Unit)や算術論理ユニットALU(Arithmetic Logic Unit)、各種レジスターやカウンター、命令解読と実行制御をつかさどる装置である。入力部150は、クライアント端末100の利用者がクライアント端末100を操作したり、クライアント端末100に情報を入力したりするための、マウス、キーボード、タッチパネル、カメラといった入力装置である。表示部160は、クライアント端末100の利用者に情報を視覚的に伝えるための、液晶素子や有機EL(electroluminescence)素子を用いた表示パネルと、表示パネルの各素子を駆動する駆動回路とを備える表示装置である。
【0022】
図3は、情報処理端末200のハードウェア構成を示すブロック図である。情報処理端末200は、制御部210、記憶部220、通信部230、演算部240を少なくとも備える。制御部210は、情報処理端末200の各部の動作を制御するものである。記憶部220はROM(Read Only Memory)、RAM(Random Access Memory)といったメモリやHDD(Hard Disk Drive)やSSD(Solid State Drive)といった記憶装置である。通信部230は、ネットワーク網NW1を介してクライアント端末100と接続するための機能を有する、ネットワークアダプタといった有線通信もしくは無線通信装置である。演算部240は、プログラムを実行するための機能を有する、CPU(Central Processing Unit)や算術論理ユニットALU(Arithmetic Logic Unit)、各種レジスターやカウンター、命令解読と実行制御をつかさどる装置である。
【0023】
図4は、利用者データベースDB1に記録されるデータの構成例を表す図である。1利用者ごとに、利用者ID、氏名、身長といった要素が記録される。利用者IDは、利用者を区別するための固有の文字列である。氏名は、利用者がシステムに登録した氏名である。身長は、利用者がシステムに登録した身長である。
【0024】
図5は、体重データベースDB2に記録されるデータの構成例を表す図である。1つの体重データごとに、体重ID、利用者ID、顔画像のURL、推定された体重、実際の体重、日時、健康状態といった要素が記録される。体重IDとは、体重データを区別するための固有の文字列である。利用者IDとは、この体重データがどの利用者と紐づいているかを表す文字列で、
図4で示した利用者IDのことである。顔画像のURLとは、実際の顔画像の保存場所を表すURLである。推定された体重とは、後述の体重推定プログラム900によって推定されたその利用者の体重である。日時とは、このデータが体重データベースDB2に書き込まれた日時である。
【0026】
図6は、クライアント端末100の表示部160に、推定体重を表示するまでの流れの一例を表す図である。利用者は、利用者を識別するためのIDと顔写真と体重の正解データを、クライアント端末100から情報処理装置200に対して送信することが出来る。ただし、ここでは、正解データとは請求項1に記載されているデータである。また、正解データの送信は必須ではない。情報処理装置200は受け取ったIDで利用者データベースDB1から利用者情報を検索する。情報処理装置200は受け取った顔写真から体重計算に必要な特徴量を抽出する。情報処理装置200は後述の体重推定プログラム900を実行して体重を推定する。情報処理装置200体重データベースDB2に、
図5に示した要素を書き込む。推定された体重をクライアント端末100に返信する。クライアント端末は、受け取った推定体重を表示する。
【0027】
図7は、クライアント端末100の表示画面の例を示した図である。
図7ではクライアント端末がスマートフォンである場合を例にしている。150はスマートフォンの表示部であり、その中に顔写真の表示部L001、推定体重の表示部L002を内在する。また、情報処理装置200に対して写真を送るアクションを開始させるボタンBt4、スマートフォン内部に保存されている顔写真を選択するボタンBt1、スマートフォンに内蔵されているカメラを起動させたり、フロントカメラとバックカメラを切り替えるボタンBt2などが含まれていても良い。
【0028】
図8は、体重推定プログラム900が体重の推定に使用する、頭部の形状を表現する特徴量の例1である。眼を開いた状態て?内眼角において上下の眼瞼か?移行する点を「内眼角点」と呼び、両方の内眼角点間の距離を「両内眼角点間距離」と呼ぶ。頭部側面て?最も外側にある点を「側頭点」と呼び、両方の側頭点間の距離を「両側頭点間距離」と呼ぶ。頬骨弓のうち最も外側にある点を「頬骨弓点」よ呼び、両方の頬骨弓点間の距離を「両頬骨弓点間距離」と呼ぶ。下顎角か?最も外側に突出している点を「顎角点」と呼び、両方の顎角点間の距離を「両顎角点間距離」と呼ぶ。なお、これらの距離は請求項6および請求項7および請求項8で示される補正が適用されている。
【0029】
図9は、体重推定手法の概略図である。両側頭点間距離、両頬骨弓点間距離、両顎角点間距離を入力とし、体重を出力とする関数によって、体重を推定する。いかなる関数系を用いても良いが、
図9では各変数の一次結合関数を例として図示している。なお、関数には可変パラメータが含まれており、請求項3の機械学習システムを用いてパラメータを学習することができる。
【0030】
図10は、体重推定プログラム900が体重の推定に使用する、頭部の形状を表現する特徴量の例2である。顎角点の両端の輪郭を直線で近似し、その2本の直線の間の角を「顎角点角度」と呼ぶ。両方の顎角点角の平均値を「平均顎角点角度」と呼ぶ。
【0031】
図11は、体重推定手法の概略図である。平均顎角点角度の余弦と、その人物のBMIとには相関関係が存在しており、横軸にBMI、縦軸に平均顎角点角度の余弦をとった座標空間にデータをプロットした場合、線形の関数で近似することができる。平均顎角点角度からBMIを推定し、推定されたBMIに身長の二乗を乗算することによって体重を推定する。なお、線形関数の傾きは請求項3の機械学習システムを用いて学習することができる。