IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ オプシス・ピーティイー・リミテッドの特許一覧

特開2023-129152表情分析で使用するデータセットを拡張する方法
<>
  • 特開-表情分析で使用するデータセットを拡張する方法 図1
  • 特開-表情分析で使用するデータセットを拡張する方法 図2
  • 特開-表情分析で使用するデータセットを拡張する方法 図3
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023129152
(43)【公開日】2023-09-14
(54)【発明の名称】表情分析で使用するデータセットを拡張する方法
(51)【国際特許分類】
   G06T 7/00 20170101AFI20230907BHJP
   G06T 7/55 20170101ALI20230907BHJP
   G06T 1/00 20060101ALI20230907BHJP
【FI】
G06T7/00 660A
G06T7/55
G06T1/00 340A
【審査請求】有
【請求項の数】13
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2022033968
(22)【出願日】2022-03-04
(31)【優先権主張番号】10202202207V
(32)【優先日】2022-03-04
(33)【優先権主張国・地域又は機関】SG
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り 1. 刊行物名 モーフセット:フェースモーフィングによる、次元情動ラベルを用いたカテゴリー感情データセットの拡張(MORPHSET: AUGMENTING CATEGORICAL EMOTION DATASETS WITH DIMENSIONAL AFFECT USING FACE MORPHING) 投稿日 2021年3月4日 投稿アドレス https://arxiv.org/abs/2103.02854v1 https://arxiv.org/pdf/2103.02854v1.pdf 2. 刊行物名 モーフセット:フェースモーフィングによる、次元情動ラベルを用いたカテゴリー感情データセットの拡張(MORPHSET: AUGMENTING CATEGORICAL EMOTION DATASETS WITH DIMENSIONAL AFFECT USING FACE MORPHING) 投稿日 2021年6月16日 投稿アドレス https://arxiv.org/abs/2103.02854v2 https://arxiv.org/pdf/2103.02854v2.pdf 3. 刊行物名 モーフセット:フェースモーフィングによる、次元情動ラベルを用いたカテゴリー感情データセットの拡張(MORPHSET: AUGMENTING CATEGORICAL EMOTION DATASETS WITH DIMENSIONAL AFFECT USING FACE MORPHING) 投稿日 2021年8月23日 投稿アドレス https://ieeexplore.ieee.org/document/9506566 4. 公開日 2021年9月20日(開催期間:2021年9月19日~22日) 学会名 2021 アイトリプルイー インターナショナル カンフェランス オン イメージ(アイシーアイピー)(2021 IEEE International Conference on Image(ICIP)) 開催場所 オンライン開催 学会の会期が終了したためリンクは削除されている。(学会のURL https://www.2021.ieeeicip.org/www.2021.ieeeicip.org/default.html)
(71)【出願人】
【識別番号】522087796
【氏名又は名称】オプシス・ピーティイー・リミテッド
【氏名又は名称原語表記】OPSIS PTE. LTD.
【住所又は居所原語表記】27 GRACE PARK, GRACE PARK, SINGAPORE 557781, REPUBLIC OF SINGAPORE
(74)【代理人】
【識別番号】110001818
【氏名又は名称】弁理士法人R&C
(72)【発明者】
【氏名】シュテファン・ヴィンクラー
【テーマコード(参考)】
5B057
5L096
【Fターム(参考)】
5B057CA08
5B057CA12
5B057CA16
5B057CB08
5B057CB12
5B057CB16
5B057CC01
5B057CE08
5L096DA01
5L096EA33
5L096FA12
5L096FA22
5L096GA34
(57)【要約】
【課題】次元情動の表情分析システムをトレーニングおよびテストするのに適し、注釈を付与した、バランスのとれた画像データセットを、効率的かつ対費用効果の高い方法で生成すること。
【解決手段】表情分析で使用するデータセットを拡張する、コンピュータによって実行される方法である。第1顔画像および第2顔画像を、トレーニング/テスト用データセットに追加し、連続的次元感情空間における、2つの点のそれぞれにマッピングする。連続的次元感情空間において、2つの点の間の第3の点の位置を特定する。ラベリングした顔画像を第1表情および第2表情に対する第3の点の位置から導出して、拡張を実現する。
【選択図】なし
【特許請求の範囲】
【請求項1】
表情分析で使用するデータセットを拡張する、コンピュータによって実行される方法であって、
データセットに第1顔画像と第2顔画像とを追加する工程と、
前記第1顔画像および前記第2顔画像を、連続的次元感情空間における第1表情点および第2表情点のそれぞれにマッピングする工程と、
前記連続的次元感情空間において、前記第1表情点と前記第2表情点との間の第3表情点の位置を特定する工程と、
表情変化画像を生成する工程と、
前記表情変化画像に第1次元ラベルを割り当てる工程と、
前記データセットに前記表情変化画像を追加する工程と、を含み、
前記表情変化画像および前記第1次元ラベルは、前記第1顔画像および前記第2顔画像に対する前記第3表情点の位置から導出する、方法。
【請求項2】
前記第3表情点は、前記第1表情点または前記第2表情点に表情距離を適用することによって特定する、請求項1に記載の方法。
【請求項3】
前記表情距離をあらかじめ選択しておく、請求項2に記載の方法。
【請求項4】
前記第1顔画像および前記第2顔画像は、それぞれに、「うれしい」、「驚いた」、「怖がった」、「怒った」、「むかついた」、又は「悲しい」の表情を含むラベルを割り当て、前記連続的次元感情空間における、前記ラベルに対応する位置にマッピングする、請求項1に記載の方法。
【請求項5】
前記第1顔画像および前記第2顔画像は、頂点表情である、請求項1に記載の方法。
【請求項6】
前記データセットにニュートラル顔画像を追加する工程と、
前記ニュートラル顔画像を前記連続的次元感情空間におけるニュートラルな点にマッピングする工程と、
前記連続的次元感情空間において、前記ニュートラル顔画像と、前記第1顔画像、前記第2顔画像、または前記表情変化画像と、の間の第1強度点を特定する工程と、
強度変化画像を生成する工程と、
第1変化画像に第2次元ラベルを割り当てる工程と、
前記データセットに前記強度変化画像を追加する工程と、をさらに含み、
前記強度変化画像および前記第2次元ラベルは、前記ニュートラル顔画像と前記第1顔画像との間の、前記第1強度点の相対位置に基づく、請求項1に記載の方法。
【請求項7】
前記第1強度点は、ニュートラル表情点または前記第1顔画像に強度距離を適用することによって特定する、請求項6に記載の方法。
【請求項8】
強度距離をあらかじめ選択しておく、請求項6に記載の方法。
【請求項9】
前記表情変化画像は、第1モーフィング関数を適用して前記第1顔画像および前記第2顔画像を補間することによって取得し、
強度変化画像は、第2モーフィング関数を適用してニュートラル顔画像および前記第1顔画像を補間することによって取得する、請求項1又は6に記載の方法。
【請求項10】
表情分析で使用するデータセットを拡張する、コンピュータによって実行される方法であって、
データセットにニュートラル顔画像と第1顔画像とを追加する工程と、
前記ニュートラル顔画像および前記第1顔画像を、連続的次元感情空間におけるニュートラルな点および第1表情点のそれぞれにマッピングする工程と、
前記連続的次元感情空間の強度平面上で、前記ニュートラル顔画像および第1表情の間の第1強度点を特定する工程と、
強度変化画像を生成する工程と、
前記強度変化画像に次元ラベルを割り当てる工程と、を含み、
前記強度変化画像および前記次元ラベルは、前記ニュートラル顔画像と前記第1顔画像との間の、前記第1強度点の相対位置に基づく、方法。
【請求項11】
前記強度変化画像は、第2モーフィング関数を適用して前記ニュートラル顔画像および前記第1顔画像を補間することによって取得する、請求項10に記載の方法。
【請求項12】
前記連続的次元感情空間は、感情価-覚醒度円環である、請求項1~11のいずれか一項に記載の方法。
【請求項13】
機械読み取り可能な命令を記憶する記憶媒体であって、
前記命令は、請求項1~12のいずれか一項に記載の方法をコンピュータシステムに実行させるための命令である、記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、表情分析システムのためのトレーニング用またはテスト用データセットを拡張する、コンピュータによって実行される方法に関する。
【背景技術】
【0002】
基本的かつ原型的な高強度の表情を分類することは、広範に研究されているテーマである。初めにエクマンの発展性のある研究[1]に刺激を受けて、近年著しい進歩を遂げている[2,3]。しかしながら、そのような手法は、実生活での利用可能性は限定的である。人々は、高強度の原型的な表情を見せることは稀であり、日常では、控えめの、非原型的な表情を見せることの方が、はるかに多い。結果として、研究者たちは、代替的な手法を探究し始めた。例えば、顔の動き単位の強度[4,5]、複合表情[6]、および顔の表情の次元モデル[7-9]である。しかし、これらの代替的な手法は、カテゴリーモデルと比較して、コンピュータビジョン業界においてそれほど注目されていない。
【発明の概要】
【発明が解決しようとする課題】
【0003】
次元モデルの広汎な使用を妨害する主要な問題の1つは、データセットの利用可能性が限られていることである。この原因は、数多くの対象者および表情を含む大きな画像セットの収集が困難であることにある。教師あり学習のための、信頼できる感情注釈を取得することは、より困難である。例えば感情価および覚醒度などの連続的次元感情ラベルは、素人の使用者にとっては評価および割り当てが困難であり、経験が豊富な注釈者を雇って大きな画像コーパスをラベリングするのは、ひどく高価で時間のかかることである。経験が豊富な注釈者であっても、これらのラベルについては意見が分かれる可能性があるため、画像ごとに複数の注釈が必要となり、これによって、作業の費用および複雑さがさらに増す。それにもかかわらず、可能性のある表情および強度をすべて網羅できる保証はどこにもなく、データセットは不均衡なものになってしまう。結果として、数多くの対象者の広範囲の表情変化および表情強度を網羅し、かつ高品質な注釈を有する、バランスのとれた大きな感情データセットは、不足している。
【0004】
したがって、次元情動の表情分析システムをトレーニングおよびテストするのに適し、注釈を付与した、バランスのとれた画像データセットを、効率的かつ対費用効果の高い方法で生成するという要求は、満たされていない。
【課題を解決するための手段】
【0005】
発明の概要
本発明の第1の実施形態は、
表情分析で使用するデータセットを拡張する、コンピュータによって実行される方法であって、
データセットに第1顔画像と第2顔画像とを追加する工程と、
第1および第2顔画像を、連続的次元感情空間における第1表情点および第2表情点のそれぞれにマッピングする工程と、
前記連続的次元感情空間において、第1表情点と第2表情点との間の第3表情点の位置を特定する工程と、
表情変化画像を生成する工程と、
前記表情変化画像に第1次元ラベルを割り当てる工程と、
任意で、前記データセットに前記表情変化画像を追加する工程と、を含み、
前記表情変化画像および前記第1次元ラベルは、第1顔画像および第2顔画像に対する第3表情点の位置から導出する、方法、である。
【0006】
任意で、第3表情点は、第1表情点または第2表情点に表情距離を適用することによって特定する。任意で、前記表情距離をあらかじめ選択しておく。
【0007】
任意で、第1および第2顔画像は、それぞれに、「うれしい」、「驚いた」、「怖がった」、「怒った」、「むかついた」、および「悲しい」の表情を含むラベルを割り当て、前記連続的次元感情空間における、前記ラベルに対応する位置にマッピングする。任意で、第1および第2顔画像は、頂点表情である。
【0008】
任意で、第1の実施形態は、
前記データセットにニュートラル顔画像を追加する工程と、
前記ニュートラル顔画像を前記連続的次元感情空間におけるニュートラルな点にマッピングする工程と、
前記連続的次元感情空間において、前記ニュートラル顔画像と、第1顔画像、第2顔画像、または前記表情変化画像と、の間の第1強度点を特定する工程と、
強度変化画像を生成する工程と、
第1変化画像に第2次元ラベルを割り当てる工程と、
任意で、前記データセットに前記強度変化画像を追加する工程と、をさらに含み、
前記強度変化画像および第2次元ラベルは、前記ニュートラル顔画像と第1顔画像との間の、第1強度点の相対位置に基づく。
【0009】
任意で、第1強度点は、前記ニュートラル表情点または第1顔画像に強度距離を適用することによって特定する。任意で、前記強度距離をあらかじめ選択しておく。任意で、前記表情変化画像は、第1モーフィング関数を適用して第1顔画像および第2顔画像を補間することによって取得し、前記強度変化画像は、第2モーフィング関数を適用して前記ニュートラル画像および第1顔画像を補間することによって取得する。
【0010】
第1の実施形態の代替的な形態は、
表情分析で使用するデータセットを拡張する、コンピュータによって実行される方法であって、
データセットにニュートラル顔画像と第1顔画像とを追加する工程と、
前記ニュートラル顔画像および第1顔画像を、連続的次元感情空間におけるニュートラルな点および第1表情点のそれぞれにマッピングする工程と、
前記連続的次元感情空間の強度平面上で、前記ニュートラル顔画像および第1表情の間の第1強度点を特定する工程と、
強度変化画像を生成する工程と、
前記強度変化画像に次元ラベルを割り当てる工程と、を含み、
前記強度変化画像および前記次元ラベルは、前記ニュートラル顔画像と第1顔画像との間の、第1強度点の相対位置に基づく、方法、である。
【0011】
任意で、前記強度変化画像は、第2モーフィング関数を適用して前記ニュートラル顔画像および第1顔画像を補間することによって取得する。
【0012】
任意で、前記連続的次元感情空間は、感情価-覚醒度円環である。
【0013】
第1の実施形態の代替的な形態は、
機械読み取り可能な命令を記憶する記憶媒体であって、
前記命令は、前記方法をコンピュータシステムに実行させるための命令である、記憶媒体、である。
【図面の簡単な説明】
【0014】
図1】本発明に係る、表情分析で使用するデータセットを拡張する方法を示す。
図2】円環モデルの感情価-覚醒度空間における、本発明に係る拡張の枠組みの描写である。
図3】表情変化および強度変化を生成するのに使用する2種類のモーフィングを描写する。
【発明を実施するための形態】
【0015】
以下の詳細な記載では、その一部を構成する添付図面を参照する。詳細な記載、図面、および請求項に記載する実例としての各実施形態は、本発明を限定することを意図してはいない。本願で提示する主題の精神または範囲から逸脱することなく、他の実施形態を実現可能であり、他の変更を加えることが可能である。
【0016】
本発明は、表情分析システムで使用するデータセットを拡張する方法100を提供し、これは、具体的には、カテゴリーデータセット中の既存の利用可能な画像同士の間の高品質なモーフィング画像を生成することによって数多くの表情変化に近づけることができるという所見を前提とする。典型的には、表情分析で使用する機械学習モデルをトレーニングする目的で使用するトレーニング用データセットを拡張するために採用されることを想定するが、本方法は、同様に、テスト用データセットを拡張するために使用することもできる。
【0017】
図1を参照すると、本発明の第1の実施形態において、第1顔画像および第2顔画像をデータセットに追加する(101)。データセットに追加する顔画像は、典型的には、7つの表情、すなわち、「ニュートラルな」(NE)、「うれしい」(HA)、「驚いた」(SU)、「怖がった」(AF)、「怒った」(AN)、「むかついた」(DI)、および「悲しい」(SA)のうちの1つを描写し、すでにその旨の注釈が付与されている/ラベリングがされている。一例として、典型的なカテゴリーデータセットは、対象者ごとに7つの表情のそれぞれを含むものと想定する。しかしながら、第1および第2顔画像は、例えば、これらには限定されないが、「大いに喜んで」、「興奮した」などの他の表情であってもよいことは、当業者は容易に理解するであろう。表情を拡張する目的で、第1および第2顔画像は、「ニュートラルな」を描写することはできない。
【0018】
一実施形態において、第1顔画像および第2顔画像は、ともに頂点表情を描写する。つまり、表情がピーク強度を有する。
【0019】
図2に、2次元極性情動空間を描写する。これは、円環モデルの覚醒度-感情価(AV)空間と同様であり、「ニュートラルな」が中心にある。中心からの距離(すなわち、ニュートラルからの偏差)は、表情の強度を表す。高強度の表情(例えば、「非常にうれしい」)は、情動空間の外周に位置する一方、控えめの表情(例えば、「少しうれしい」)は、空間の中心近傍の、「ニュートラルな」の近くに位置する。覚醒度および感情価の範囲は、[-1,1]である。感情は、間隔[0°,360°]の角度によって定義される。表情の強度は、中心(「ニュートラルな」)からの距離によって定義され、間隔は[0,1]である。また、以下のように仮定する。第1に、情動座標は、顔変形と1対1で対応する。第2に、顔変形空間は、連続性を有する。第3に、隣接する情動座標は、同様の顔変形を示す。情動座標における小さな変化は、顔変形空間における小さな変化をもたらす。最後に、次元的情動空間は、連続性を有する。
【0020】
第1および第2顔画像は、連続的次元感情空間における第1および第2表情点にそれぞれマッピングする(102)。連続的2次元感情空間の非限定的な例は、円環モデルの感情価-覚醒度空間であり、これについては、以下で非限定的な例としてさらに述べる。
【0021】
第1および第2顔画像はすでにラベリングしてあるので、第1および第2表情点は、円環モデルの感情価-覚醒度空間におけるとても具体的な座標であり得る。図2に、元のデータセット画像を、輪郭を有する円で示す。7つの典型的な表情を描写する顔画像を含む典型的なデータセットをマッピングした後、感情価-覚醒度空間には空の空間がたくさんあることが明らかである。
【0022】
次に、連続的次元感情空間において、第1および第2表情点の間の第3表情点の位置を特定する(103)。好ましくは、第3表情点の位置は、第3表情点が第1および第2表情点の間に位置する限り、表情距離を第1または第2表情点に適用することによって特定する。好ましくは、表情距離を第3表情点などに適用して、第1および第2表情点の間の一連の表情点を得ることによって、さらなる表情点を特定することができる。厳密には必要ではないが。より好ましくは、表情距離は、表情の粒度、拡張因子、点間の対称性などの、トレーニング用またはテスト用データセットの具体的な要件に基づいてあらかじめ選択する。好ましくは、表情距離は、第1または第2表情点から始まる15°の角度増加であり、上述の基準同士の間の釣り合いをとる。好ましくは、表情は、あらかじめ選択する。上述のような方法は、ニュートラルな点および任意の表情画像に適用することもできる。当該表情画像は、第1顔画像および第2顔画像、ならびに、強度変化画像を生成するための下記の表情変化画像などの、拡張の結果として新しく生成される画像を含む。この場合、第3表情点は、マッピングの目的で、第1強度点と類似する。
【0023】
好ましくは、第1および第2顔画像は、連続的次元感情空間にマッピングしたときに互いに直接隣接する点に対応する。一例として、再度図2を参照すると、「怒った」および「怖がった」という感情は、感情価-覚醒度空間において互いに直接隣接する2つの表情の例である。
【0024】
第3表情の位置を特定すると、表情変化画像を生成し、当該表情変化画像に第1次元ラベルを割り当てることができる。表情変化画像および第1次元ラベルは、第1および第2表情に対する第3表情点の位置から導出される(104)。非限定的な例において、円環モデルの2次元感情価-覚醒度空間を想定する。
【0025】
表情Eを有する対象者iの顔の画像を、
【数1】
とする。カテゴリーデータセットとしては、通常、E∈{NE,HA,SU,AF,AN,DI,SA}である。感情研究[7,23]で推定するように、極性感情価-覚醒度空間における各表情の具体的な角度を、θ Eとする。対象者iの表情Eの強度を、
【数2】
とする。ゼロ表情強度I=0は、NEと一致し(定義上、INE=0)、可能な限り最も高い表情強度を、I=1で表す。顔の目印pに基づく、新しい顔の画像を返すモーフィング関数を、
【数3】
とする。新しい顔の画像は、比率r∈[0,1]で
【数4】

【数5】
にモーフィングした結果である。r=0のとき、モーフ画像は、
【数6】
と同一となり、r=1のとき、
【数7】
と同一となる。このために、現在周知のモーフィング手法を適宜用いることができる。例えば、ドロネー三角形分割に続いて、顔の目印群を局所的に変形させることができる。
【0026】
本発明に係る拡張方法は、2種類のモーフィングに基づく。新たな表情変化を合成するためには、カテゴリーデータセットにおける所定の頂点表情同士の間で、頂点-頂点(Apex to Apex)モーフィング(1)を用いる。
【数8】
【0027】
ここで、A、A、およびAは、親データセットからの頂点表情であり、rは、間隔[0,1]の比率である。
【0028】
新たな強度変化を合成するためには、NE画像と所定の(または補間した)頂点画像との間で、ニュートラル-頂点(Neutral to Apex)モーフィング(2)を用いる。
【数9】
【0029】
図3に、これら2種類のモーフィングの例を描写する。
【数10】
を有する、所定の、または生成した顔の画像
【数11】
のそれぞれについて、第1次元ラベルは、以下のように算出することができる。
【数12】
好ましくは、強度変化画像は、0.1の強度増加である強度距離を適用することによって生成する。任意で、(1)と(2)との両方を適用して、表情と強度との両方における拡張画像を生成することができる。
【0030】
任意で、表情変化画像または表情変化画像は、データセットに追加することができる(105)。
図1
図2
図3
【外国語明細書】