(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-05-22
(45)【発行日】2023-05-30
(54)【発明の名称】印象推定方法、印象推定プログラムおよび印象推定装置
(51)【国際特許分類】
G06T 7/00 20170101AFI20230523BHJP
G06Q 30/0203 20230101ALI20230523BHJP
G10L 15/10 20060101ALI20230523BHJP
【FI】
G06T7/00 660Z
G06Q30/0203
G06T7/00 P
G10L15/10 500N
(21)【出願番号】P 2019179536
(22)【出願日】2019-09-30
【審査請求日】2022-06-09
(73)【特許権者】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】内田 昭嘉
【審査官】藤原 敬利
(56)【参考文献】
【文献】特開2018-195164(JP,A)
【文献】特表2010-503110(JP,A)
【文献】特開2001-350904(JP,A)
【文献】特開2018-106419(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
A61B 5/16
G06Q 30/00-30/08
G06Q 50/00-50/34
G06T 7/00- 7/90
G06V 10/00-20/90
G06V 40/16、40/20
G10L 15/00-15/34
(57)【特許請求の範囲】
【請求項1】
ユーザそれぞれの動作に基づいて前記ユーザそれぞれの所定の対象に対する印象を推定する印象推定方法であって、
前記ユーザそれぞれの動作を検出し、
検出した前記ユーザそれぞれの動作において、第1のユーザが前記対象に対して行う動作を示す第1のトリガを検出し、
検出した前記ユーザそれぞれの動作において、前記第1のユーザから第2のユーザに対するコミュニケーション動作を示す第2のトリガを検出し、
前記第1のトリガを検出した後の所定時間内に前記第2のトリガを検出した場合に、前記第1のトリガおよび前記第2のトリガに基づき、前記第1のユーザおよび前記第2のユーザの少なくとも一方について前記対象に対する印象を推定する動作の期間を設定し、
設定した前記期間内における前記第1のユーザおよび前記第2のユーザの少なくとも一方の動作を特徴量とし、前記第1のユーザおよび前記第2のユーザの少なくとも一方の前記対象に対する印象を推定する、
処理をコンピュータが実行することを特徴とする印象推定方法。
【請求項2】
前記第1のトリガを検出する処理は、前記対象に対する匂いを嗅ぐ動作、味見をする動作、触れる動作および直視する動作の少なくとも1つを第1のトリガとして検出する、
ことを特徴とする請求項1に記載の印象推定方法。
【請求項3】
前記第2のトリガを検出する処理は、少なくとも、前記対象に関連する会話、アイコンタクト、肩をたたく動作のいずれかを第2のトリガとして検出する、
ことを特徴とする請求項1または2に記載の印象推定方法。
【請求項4】
前記設定する処理は、前記第1のユーザについては少なくとも前記第1のトリガを含む期間を設定する、
ことを特徴とする請求項1乃至3のいずれか一項に記載の印象推定方法。
【請求項5】
前記設定する処理は、前記第2のユーザについては少なくとも前記第2のトリガを含む期間を設定する、
ことを特徴とする請求項1乃至4のいずれか一項に記載の印象推定方法。
【請求項6】
前記第1のユーザおよび前記第2のユーザの少なくとも一方の前記対象に対する印象の推定結果を、前記第1のユーザおよび前記第2のユーザに対応付けて表示する処理をさらにコンピュータが実行する、
ことを特徴とする請求項1乃至5のいずれか一項に記載の印象推定方法。
【請求項7】
ユーザそれぞれの動作に基づいて前記ユーザそれぞれの所定の対象に対する印象をコンピュータに推定させる印象推定プログラムであって、
前記ユーザそれぞれの動作を検出し、
検出した前記ユーザそれぞれの動作において、第1のユーザが前記対象に対して行う動作を示す第1のトリガを検出し、
検出した前記ユーザそれぞれの動作において、前記第1のユーザから第2のユーザに対するコミュニケーション動作を示す第2のトリガを検出し、
前記第1のトリガを検出した後の所定時間内に前記第2のトリガを検出した場合に、前記第1のトリガおよび前記第2のトリガに基づき、前記第1のユーザおよび前記第2のユーザの少なくとも一方について前記対象に対する印象を推定する動作の期間を設定し、
設定した前記期間内における前記第1のユーザおよび前記第2のユーザの少なくとも一方の動作を特徴量とし、前記第1のユーザおよび前記第2のユーザの少なくとも一方の前記対象に対する印象を推定する、
処理をコンピュータに実行させることを特徴とする印象推定プログラム。
【請求項8】
ユーザそれぞれの動作に基づいて前記ユーザそれぞれの所定の対象に対する印象を推定する印象推定装置であって、
前記ユーザそれぞれの動作を検出する動作検出部と、
検出した前記ユーザそれぞれの動作において、第1のユーザが前記対象に対して行う動作を示す第1のトリガを検出する第1トリガ検出部と、
検出した前記ユーザそれぞれの動作において、前記第1のユーザから第2のユーザに対するコミュニケーション動作を示す第2のトリガを検出する第2トリガ検出部と、
前記第1のトリガを検出した後の所定時間内に前記第2のトリガを検出した場合に、前記第1のトリガおよび前記第2のトリガに基づき、前記第1のユーザおよび前記第2のユーザの少なくとも一方について前記対象に対する印象を推定する動作の期間を設定する設定部と、
設定した前記期間内における前記第1のユーザおよび前記第2のユーザの少なくとも一方の動作を特徴量とし、前記第1のユーザおよび前記第2のユーザの少なくとも一方の前記対象に対する印象を推定する推定部と、
を有することを特徴とする印象推定装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、印象推定方法、印象推定プログラムおよび印象推定装置に関する。
【背景技術】
【0002】
従来、商品・サービスを対象としたマーケティング調査では、調査対象とする試供品などを試した被験者の状態を捉えて試供品の評価を自動的に収集する手法がある。
【0003】
被験者の評価を収集する従来技術としては、カメラを用いて被験者の映像を撮影し、マイクを用いて被験者の音声を受信して試供品を試したその時をトリガとして被験者の状態を捉え、映像の顔検出区間における表情感情解析データと、音声の音声感情解析データとを試供品の評価情報の一つとすることで、試供品の評価を自動的に取得する装置が知られている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上記の従来技術では、被験者が試供品に対する印象を十分に発露していないタイミングで被験者の状態を捉える場合があり、対象に対する印象推定の精度が十分ではないという問題がある。
【0006】
1つの側面では、対象に対する人の印象を精度よく推定することができる印象推定方法、印象推定プログラムおよび印象推定装置を提供することを目的とする。
【課題を解決するための手段】
【0007】
1つの案では、ユーザそれぞれの動作に基づいてユーザそれぞれの所定の対象に対する印象を推定する印象推定方法であって、動作を検出する処理と、第1のトリガを検出する処理と、第2のトリガを検出する処理と、設定する処理と、推定する処理とをコンピュータが実行する。動作を検出する処理は、ユーザそれぞれの動作を検出する。第1のトリガを検出する処理は、検出したユーザそれぞれの動作において、第1のユーザが対象に対して行う動作を示す第1のトリガを検出する。第2のトリガを検出する処理は、検出したユーザそれぞれの動作において、第1のユーザから第2のユーザに対するコミュニケーション動作を示す第2のトリガを検出する。設定する処理は、第1のトリガを検出した後の所定時間内に第2のトリガを検出した場合に、第1のトリガおよび第2のトリガに基づき、第1のユーザおよび第2のユーザの少なくとも一方について対象に対する印象を推定する動作の期間を設定する。推定する処理は、設定した期間内における第1のユーザおよび第2のユーザの少なくとも一方の動作を特徴量とし、第1のユーザおよび第2のユーザの少なくとも一方の対象に対する印象を推定する。
【発明の効果】
【0008】
本発明の1実施態様によれば、対象に対する人の印象を精度よく推定できる。
【図面の簡単な説明】
【0009】
【
図1】
図1は、実施形態にかかる印象推定装置の機能構成例を示すブロック図である。
【
図2】
図2は、実施形態にかかる印象推定装置の設置例を説明する説明図である。
【
図3】
図3は、印象推定例を説明する説明図である。
【
図4】
図4は、実施形態にかかる印象推定装置の動作例を示すフローチャートである。
【
図5】
図5は、人物における印象データの一例を説明する説明図である。
【
図6】
図6は、人物における印象データの一例を説明する説明図である。
【
図7】
図7は、人物における印象データの一例を説明する説明図である。
【
図8】
図8は、人物における印象データの一例を説明する説明図である。
【
図9】
図9は、人物における印象データの一例を説明する説明図である。
【
図10】
図10は、人物における印象データの一例を説明する説明図である。
【
図11-1】
図11-1は、印象情報収集率のグラフ例を説明する説明図である。
【
図11-2】
図11-2は、回答内容のグラフ例を説明する説明図である。
【
図12】
図12は、プログラムを実行するコンピュータの一例を示すブロック図である。
【発明を実施するための形態】
【0010】
以下、図面を参照して、実施形態にかかる印象推定方法、印象推定プログラムおよび印象推定装置を説明する。実施形態において同一の機能を有する構成には同一の符号を付し、重複する説明は省略する。なお、以下の実施形態で説明する印象推定方法、印象推定プログラムおよび印象推定装置は、一例を示すに過ぎず、実施形態を限定するものではない。また、以下の各実施形態は、矛盾しない範囲内で適宜組みあわせてもよい。
【0011】
図1は、実施形態にかかる印象推定装置の機能構成例を示すブロック図である。
図1に示すように、印象推定装置1は、入力部10、記憶部20、出力部30、制御部40、第1トリガ検出部51、第2トリガ検出部52、印象推定部53およびグループ推定部54を有する。印象推定装置1は、入力部10の音声受信部11および撮影部12よりマーケティング調査において調査対象とするサービス・試供品などを試した被験者(以下、人物)の状態(音声、顔画像など)を捉える。
【0012】
図2は、実施形態にかかる印象推定装置1の設置例を説明する説明図である。
図2に示すように、入力部10における音声受信部11および撮影部12は、マーケティング調査の対象とするワインWを人物Hそれぞれに提供し、ワインWの試飲を行う会場に設置される。
【0013】
例えば、ワインWの提供を受けた人物H1~H7それぞれは、友達、同僚、カップルなどのグループG1~G3ごとに、ワインWを会場にて試飲する。音声受信部11および撮影部12は、会場における人物H1~H7それぞれの状態(音声、顔画像など)を捉えるように設置される。
【0014】
一例として、音声受信部11は、試飲会場内の音声を漏らさずに捉えるように、各テーブルなどに設置される。また、音声受信部11は、人物H1~H7それぞれの音声を漏らさずに拾うように、ワインWを提供した際に人物H1~H7それぞれに設置したピンマイクなどであってもよい。また、撮影部12は、例えばワインWの会場の全体を俯瞰するように設置され、グループG1~G3における人物H1~H7それぞれの動作を撮影する。
【0015】
次いで、印象推定装置1は、捉えた人物H1~H7それぞれの状態(動作)をもとに印象推定部53において対象に対する印象推定を行い、出力部30より推定結果を出力する。これにより、印象推定装置1のユーザは、サービス・試供品などの評価を自動的に取得することができ、商品・サービスを対象としたマーケティング調査を容易に行うことができる。例えば、印象推定装置1としては、パーソナルコンピュータなどを適用できる。
【0016】
入力部10は、音声受信部11および撮影部12の入力を受け付ける。入力部10は、音声受信部11および撮影部12より入力されたデータをもとに、公知の動作認識技術を用いることで、人物Hそれぞれの動作を検出する。すなわち、入力部10は、動作検出部の一例である。
【0017】
具体的には、入力部10は、撮影部12の映像より公知の画像認識技術を用いることで人物H1~H7それぞれを識別する。なお、印象推定装置1は、識別した人物H1~H7それぞれにユニークな識別情報(人物ID)を割り当てることで、人物H1~H7の情報を個別に管理する。次いで、入力部10は、撮影部12の映像の中の、識別した人物H1~H7それぞれの画像領域を切り出し、動作を解析する公知の動作解析エンジンに投入することで、人物H1~H7それぞれの動作を例えば行動タグという形で取得する。
【0018】
また、入力部10は、動作解析エンジンにより解析した人物H1~H7それぞれの動作に関する音を音声受信部11より取得した音声を解析し、行動タグに含める。また、入力部10は、人物H1~H7それぞれの動作に関する音が他の人物への発話(会話)である場合、会話時に音声受信部11より取得した音声を音声認識することで、会話の内容を取得する。
【0019】
このように、入力部10は、人物H1~H7それぞれの動作の内容を示す行動タグを識別情報(人物ID)付きで得る。入力部10は、得られた行動タグを制御部40へ出力する。
【0020】
例えば、行動タグに示される動作内容については、対象に関する匂いの場合、鼻をクンクンする動き、深い吸い込み動作等がある。また、匂いに関する発生単語(会話の内容)には、匂い、香り、臭い等がある。また、匂いに関する動作の音(発生音)には、鼻をクンクンする音、深い吸い込み音等がある。
【0021】
また、対象に関して味見をする場合の動作内容については、対象を舐める動き、食べる動き、飲み込む動き等がある。また、対象に関して味見をする場合の発生単語(会話の内容)には、美味しい、不味い、好き、好きではない等がある。また、対象に関して味見をする場合の動作の音(発生音)には、対象を舐める音、食べる音、飲み込む音等がある。
【0022】
また、対象に関して触れる場合の動作内容については、対象を触る動き等がある。また、対象に関して触れる場合の発生単語(会話の内容)には、手触りがいい、手触りが悪い等がある。また、対象に関して触れる場合の動作の音(発生音)には、対象を触る音、叩く音等がある。
【0023】
また、対象を直視する場合の動作内容については、対象への視点動作(凝視や見渡す動き)等がある。また、対象を直視する場合の発生単語(会話の内容)には、きれい、すごい等がある。また、行動タグに示される動作内容については、上記のコミュニケーション動作(会話の内容)などの他に、他の人物への視点動作(視線移動、アイコンタクト)、他の人物への顔向け、声掛け、名前呼び、肩をたたく動作等もある。
【0024】
記憶部20は、制御部40の制御のもと各種処理の情報を格納するメモリなどである。具体的には、記憶部20は、入力部10が検出した人物H1~H7それぞれの動作内容(行動タグ)、音声受信部11が取得した音声データ、撮影部12が撮影した画像データ、印象推定部53およびグループ推定部54の推定結果などの情報を格納する。
【0025】
出力部30は、制御部40の制御のもと各種処理の結果をディスプレイやファイルなどに出力する処理部である。例えば、出力部30は、印象推定部53による、人物H1~H7それぞれの対象に対する印象推定の結果をディスプレイやファイルなどに出力する。これにより、印象推定装置1のユーザは、人物H1~H7それぞれの対象に対する印象を容易に知ることができる。
【0026】
例えば、出力部30は、撮影部12の画像データ(映像)と、人物H1~H7それぞれの対象に対する印象推定の結果とを記憶部20より読み出す。次いで、出力部30は、撮影部12の映像に対し、識別した人物H1~H7それぞれに識別情報(人物ID)を付与した識別枠を付与するとともに、識別情報に紐付けられた印象推定の結果を例えばアイコン形式で付与する。次いで、出力部30は、人物H1~H7それぞれに識別枠と、印象推定の結果とを付与した撮影部12の映像をディスプレイなどに表示する。このように、出力部30は、人物H1~H7それぞれの対象に対する印象推定の結果を、人物H1~H7それぞれに対応付けて表示する。
【0027】
制御部40は、印象推定装置1の処理を統括制御する処理部である。例えば、制御部40は、入力部10の音声受信部11および撮影部12より入力されたデータ(音声データ、画像データ)を記憶部20に格納する。また、制御部40は、入力部10が検出した人物H1~H7それぞれの動作に関する情報(動作タグ)を記憶部20に格納する。また、制御部40は、記憶部20に格納した各種情報を適宜読み出して出力部30、第1トリガ検出部51、第2トリガ検出部52、印象推定部53およびグループ推定部54へ出力する。また、制御部40は、印象推定部53において、印象データを取得する期間の設定を行う(詳細は後述する)。
【0028】
第1トリガ検出部51は、入力部10が検出した人物H1~H7それぞれの動作において、人物H1~H7のいずれかの人物が所定の対象(例えばワインW)に対して行う動作を示すトリガ(第1のトリガ)を検出する処理部である。
【0029】
具体的には、第1トリガ検出部51には、第1のトリガとして検出する動作(動作内容、発生音など)が予め設定されている。第1トリガ検出部51は、人物H1~H7それぞれの行動タグを逐次監視しており、行動タグの内容が予め設定された動作に該当する場合に第1のトリガを検出する。
【0030】
例えば、第1トリガ検出部51は、人物H1~H7それぞれの行動タグが、鼻をクンクンする動き、深い吸い込み動作、鼻をクンクンする音、深い吸い込み音などの動作または動作で生じる音である場合、対象に関する匂いの動作として第1のトリガを検出する。
【0031】
また、第1トリガ検出部51は、人物H1~H7それぞれの行動タグが、対象を舐める動き、食べる動き、飲み込む動き、対象を舐める音、食べる音、飲み込む音などの動作または動作で生じる音である場合、対象に関する味見の動作として第1のトリガを検出する。
【0032】
また、第1トリガ検出部51は、対象を触る動き、対象を触る音、叩く音などの動作または動作で生じる音である場合、対象に触れる動作として第1のトリガを検出する。
【0033】
また、第1トリガ検出部51は、対象への視点動作(凝視や見渡す動き)である場合、対象を直視する動作として第1のトリガを検出する。
【0034】
第2トリガ検出部52は、入力部10が検出した人物H1~H7それぞれの動作において、人物H1~H7のいずれかの人物から他の人物に対するコミュニケーション動作を示すトリガ(第2のトリガ)を検出する処理部である。
【0035】
具体的には、第2トリガ検出部52には、第2のトリガとして検出する動作(動作内容、会話の内容など)が予め設定されている。第2トリガ検出部52は、人物H1~H7それぞれの行動タグを逐次監視しており、行動タグの内容が予め設定された動作に該当する場合に第2のトリガを検出する。
【0036】
例えば、第2トリガ検出部52は、人物H1~H7それぞれの行動タグが、他の人物への視点動作(視線移動、アイコンタクト)、他の人物への顔向け、声掛け、名前呼び、肩をたたく動作などである場合、コミュニケーション動作として第2のトリガを検出する。
【0037】
なお、第2トリガ検出部52は、第2のトリガとして検出するコミュニケーション動作について、対象に関する会話に限定してもよい。例えば、対象をワインWとする場合、第2トリガ検出部52は、人物H1~H7それぞれの行動タグが、ワイン、商品名、匂い、香り、臭い、美味しい、不味い、好き、好き等を含む会話の内容である場合に第2のトリガを検出する。
【0038】
印象推定部53は、入力された音声データおよび画像データより識別した人物H1~H7それぞれについて、音声および画像に基づく人物H1~H7それぞれの動作を特徴量とし、人物H1~H7それぞれが有する印象(感情)を推定する処理部である。
【0039】
例えば、人物H1~H7それぞれの動作における特徴量としては、表情(しぐさ)として主に顔の表情や体の動き(手の動き)などとして現れる表情特徴量、音声として現れる音声特徴量がある。印象推定部53は、入力された音声データおよび画像データより人物H1~H7それぞれの表情特徴量、音声特徴量を抽出する。次いで、印象推定部53は、教師付きの機械学習により表情特徴量、音声特徴量から印象推定を行うように学習した学習モデルを用いて人物H1~H7それぞれが有する印象を推定する。この印象推定部53における印象推定は、映像および音声の少なくとも1つの特徴量(表情特徴量、音声特徴量の中の1つ)または複数の特徴量の組み合わせで判定してもよい。
【0040】
また、印象推定部53は、肯定的な印象(Positive)~否定的な印象(Negative)の中でどの程度の印象を人物が有しているかを数値として求めるものとする。例えば、印象推定部53は、肯定的な印象を有している場合は、その大きさを正の整数値として求める。また、印象推定部53は、否定的な印象を有している場合は、その大きさを負の整数値として求める。また、印象推定部53は、肯定・否定どちらでもない場合は0として求める。
【0041】
図3は、印象推定例を説明する説明図である。
図3に示すように、印象推定部53は、撮影部12の画像データより、識別した人物H1~H7それぞれについて顔検出531を行う。次いで、印象推定部53は、検出した顔画像の向きや大きさを調整するアライメント調整532を行うことで表情特徴量を得る。なお、本実施形態では顔の表情、しぐさより表情特徴量を得る構成としているが、手の動きを含めるようにアライメント調整532を行うことで、手の動きを含む表情特徴量を得るようにしてもよい。次いで、印象推定部53は、所定の表情特徴量に対して正解とするAU(Action Unit)値を含む教師データにより機械学習した学習モデルを用い、人物H1~H7それぞれの表情特徴量をもとにAU値を推定するAU推定533を行う。次いで、印象推定部53は、推定したAU値を印象を示す数値へ変換する印象推定534を行い、人物H1~H7それぞれが有する印象を示す印象データを得る。
【0042】
図3の例では、表情特徴量より印象データを得る構成を例示したが、音声特徴量についても同様にして印象データが得られる。例えば、印象推定部53は、所定の音声特徴量に対して正解とするAU値を含む教師データにより機械学習した学習モデルを用いることで、人物H1~H7それぞれの表情特徴量をもとに印象データを得ることができる。
【0043】
また、本実施形態では、一人よりも複数人いる時のコミュニケーション動作において表情等の感情(印象)の発露が多いことに着目した。特に、対象(例えばワインW)に対する印象を発露するタイミングとしては、対象に対する動作(例えば匂いを嗅ぐなど)に続いて行われるコミュニケーション動作(例えば会話、アイコンタクトなど)である点に着目した。そこで、制御部40は、第1トリガ検出部51および第2トリガ検出部52の検出結果をもとに、対象に対する印象を発露していると想定されるタイミングに合わせて、印象推定部53より印象データを取得する期間(抽出Window)を設定する。
【0044】
具体的には、制御部40は、第1のトリガを検出した後の所定時間内に第2のトリガを検出した場合に、第1のトリガおよび第2のトリガに基づき、コミュニケーション動作を発した人物およびコミュニケーション動作を受けた人物の少なくとも一方について対象に対する印象を推定する動作の期間(抽出Window)を設定する。
【0045】
例えば、制御部40は、対象に対する動作後にコミュニケーション動作を発した人物については、少なくとも第1のトリガ(対象に対する動作時)を含む期間を印象を推定する動作の期間(抽出Window)として設定する。
【0046】
また、制御部40は、コミュニケーション動作を受けた人物については、少なくとも第2のトリガ(コミュニケーション動作時)を含む期間を印象を推定する動作の期間(抽出Window)として設定する。
【0047】
このように、印象推定装置1は、対象(例えばワインW)に対する印象を発露していると想定されるタイミングに合わせて印象データを取得する期間(抽出Window)を設定することで、対象に対する人物の印象を精度よく推定することができる。
【0048】
グループ推定部54は、撮影部12の画像データより、人物H1~H7それぞれが属するグループG1~グループG3の推定を行う処理部である。具体的には、撮影部12の画像データより識別した人物H1~H7それぞれについて、互いの距離が近い状態を継続している組をグループG1~グループG3として推定する。グループ推定部54は、人物H1~H7それぞれについて推定したグループを示す識別情報(グループID)を付与する。
【0049】
制御部40は、グループ推定部54が推定したグループをもとに、コミュニケーション動作を受けた人物を特定する。具体的には、制御部40は、コミュニケーション動作を発した人物と同一のグループに属する(グループIDが同じ)人物をコミュニケーション動作を受けた人物と特定する。
【0050】
図4は、実施形態にかかる印象推定装置1の動作例を示すフローチャートである。
図4に示すように、処理が開始されると、印象推定装置1は、音声受信部11、撮影部12等の各種センサを起動し(S1)、人物Hの動作検出を開始する。
【0051】
次いで、印象推定装置1は、第1トリガ検出部51による第1のトリガの検出、第2トリガ検出部52による第2のトリガの検出および印象推定部53による印象推定を開始する(S2)。
【0052】
次いで、制御部40は、人物H1~H7いずれかについて、第1トリガ検出部51が第1のトリガを検出したか否かを判定する(S3)。第1のトリガを検出していない場合(S3:No)、制御部40は処理を待機する。
【0053】
第1のトリガを検出した場合(S3:Yes)、第1のトリガを検出した人物に関し、制御部40は、予め設定された所定時間内に第2トリガ検出部52が第2のトリガを検出したか否かを判定する(S4)。第1のトリガを検出した人物に関して所定時間内に第2のトリガを検出していない場合(S4:No)、制御部40はS3へ処理を戻す。
【0054】
第1のトリガを検出した人物に関して所定時間内に第2のトリガを検出した場合(S4:Yes)、制御部40は、第1のトリガおよび第2のトリガをもとに、第1のトリガを検出した人物と、その人物と同一グループの人物とに対して抽出Windowを設定する(S5)。すなわち、制御部40は、コミュニケーション動作を発した人物と、コミュニケーション動作を受けた人物とについて、第1のトリガおよび第2のトリガに応じた抽出Windowを設定する。
【0055】
具体的には、制御部40は、第1のトリガを検出した人物(コミュニケーション動作を発した人物)については、第1のトリガ(対象に対する動作時)を含む所定期間を抽出Windowとする。また、制御部40は、第1のトリガを検出した人物と同一グループの人物(コミュニケーション動作を受けた人物)については、第2のトリガ(コミュニケーション動作時)を含む所定期間を抽出Windowとする。
【0056】
次いで、印象推定部53は、抽出Windowを設定した人物について、抽出Window内の印象推定結果(印象データ)を抽出する(S6)。
【0057】
次いで、制御部40は、予め設定された終了条件を満たすか否かをもとに、処理を終了するか否かを判定する(S7)。終了条件を満たす場合(S7:Yes)、制御部40は処理を終了する。終了条件を満たさない場合(S7:No)、制御部40は、S3へ処理を戻し、処理を継続する。
【0058】
ここで、具体例を用いて、人物における印象推定を説明する。
図5~
図10は、人物H1、H2における印象データの一例を説明する説明図である。
【0059】
図5~
図10の例では、人物H1、H2が対象とするワインWを持って会場に入室し、ワインWの感想を述べ合うまでの時間経過を例示している。具体的には、入室後、人物H1が人物H2にワインWとは無関係の話題を話しかける(t1)。次いで、人物H1は、ワインWの匂いを認識し(t2、t2a)、ワインWの匂いを嗅ぐ動作を行う(t3)。次いで、ワインWの匂いを嗅ぐ動作の後、人物H1は、人物H2に対してワインWに関する会話を行う(t4)。
【0060】
また、
図9は、本実施形態における抽出Windowの設定例であり、
図5~
図8、
図10は、本実施形態とは別の抽出Windowの設定例(比較例)である。
【0061】
図5に示すように、人物H1、H2の印象データは、入室後はワインWとは無関係の話題により否定的な値を示している。その後、人物H1については、ワインWの匂い認識後(t2)にワインWに関する印象を発露し、t2以後の所定期間は肯定的な値を示している。人物H2については、人物H1からのワインWに関する会話(t4)に誘発される形でワインWに関する印象を発露し、t4以後の所定期間は肯定的な値を示している。
【0062】
図6では、提供されたワインWを持って会場に入室したタイミングより所定期間内を抽出Windowとしている。
図6に示すように抽出Windowを設定する場合、ワインWとは無関係の話題の会話に関する印象(否定的な印象)を含めてしまうこととなる。このため、人物H1、H2がワインWに関して本来有している肯定的な印象が打ち消され、印象推定の精度が悪くなることとなる。
【0063】
図7では、提供されたワインWの匂いを認識して、ワインWの匂いを嗅ぐ動作を行ったタイミング(t3)を含む所定期間内を抽出Windowとしている。この場合、ワインWの匂いを嗅ぐ動作を行った人物H1については、ワインWに関する印象を発露するタイミングに合わせて抽出Windowを設定し、精度よく印象推定を行うことができる。しかしながら、人物H2については、ワインWの匂いを嗅ぐ動作を行っていないことから、抽出Windowが設定されない。
【0064】
図8では、単にコミュニケーション動作を行ったタイミング(t1、t4)を含む所定期間内を抽出Windowとしている。この場合、ワインWとは無関係の会話が行われたタイミングで抽出Windowが設定され得ることから、
図6と同様、印象推定の精度が悪くなることとなる。
【0065】
図9では、ワインWの匂いを嗅ぐ動作(t3)に続いて行われるコミュニケーション動作(t4)をもとに、コミュニケーション動作を行った側(人物H1)と、コミュニケーション動作を受けた側(人物H2)の抽出Windowを設定している。
【0066】
具体的には、人物H1については、ワインWの匂いを嗅ぐ動作を行ったタイミング(t3)を基準とし、t3を含む前後の所定期間を抽出Windowとする。また、人物H2については、人物H1からのコミュニケーション動作時(t4)を基準とし、t4を含む前後の所定期間を抽出Windowとする。これにより、人物H1、H2ともに、ワインWに関する印象を発露するタイミングに合わせて抽出Windowが設定されることから、精度よく印象推定を行うことができる。
【0067】
図10では、第2のトリガ後に所定時間内に第1のトリガが検出される(t2a)場合を例示している。すなわち、
図10では、
図9とは逆に、コミュニケーション動作(t1)に続いて行われるワインWの匂いを嗅ぐ動作(t2a)をもとに、コミュニケーション動作を行った側(人物H1)と、コミュニケーション動作を受けた側(人物H2)の抽出Windowを設定している。
【0068】
人の行動は、認知後に、認知に応じた行動をとることが一般的であると言える。例えば、t1の会話のように、最初のトリガとなるコミュニケーション動作は、認知とは関係のないものである可能性がある。したがって、第2のトリガ→第1のトリガを契機に抽出Windowを設定する場合、ワインWに関する印象を発露するタイミングに合わせた抽出Windowの設定とはならず、印象推定の精度が悪くなることとなる。
【0069】
以上のように、印象推定装置1は、入力部10と、第1トリガ検出部51と、第2トリガ検出部52と、制御部40と、印象推定部53とを有する。入力部10は、音声受信部11および撮影部12より入力されたデータをもとに人物Hそれぞれの動作を検出する。第1トリガ検出部51は、入力部10が検出した動作において、第1のユーザが対象(例えばワインW)に対して行う動作を示す第1のトリガを検出する。第2トリガ検出部52は、入力部10が検出した動作において、第1のユーザから第2のユーザに対するコミュニケーション動作を示す第2のトリガを検出する。制御部40は、第1のトリガを検出した後の所定時間内に第2のトリガを検出した場合に、第1のトリガおよび第2のトリガに基づき、第1のユーザおよび第2のユーザの少なくとも一方について対象に対する印象を推定する動作の期間(抽出Window)を設定する。また、印象推定部53は、設定した期間内における第1のユーザおよび第2のユーザの少なくとも一方の動作を特徴量とし、第1のユーザおよび第2のユーザの少なくとも一方の対象に対する印象を推定する。
【0070】
本実施形態では、一人よりも複数人いる時のコミュニケーション動作において表情等の感情(印象)の発露が多いことに着目している。特に、対象に対する印象を発露するタイミングとしては、対象に対する動作(例えば匂いを嗅ぐなど)に続いて行われるコミュニケーション動作(例えば会話、アイコンタクトなど)である点に着目している。例えば、コミュニケーション動作を行った側については、コミュニケーション動作の直前における、対象に対する動作を行った時点から印象を発露している場合がある。また、コミュニケーション動作を受けた側については、対象に対する動作を行うことなく、コミュニケーションを受けることによって対象に対する印象を発露している場合がある。
【0071】
したがって、印象推定装置1は、対象に対して行う動作を示す第1のトリガに続いてコミュニケーション動作を示す第2のトリガを検出した場合に、第1のトリガおよび第2のトリガに基づいて印象を推定する動作の期間を設定することで、対象に対する人の印象を精度よく推定することができる。
【0072】
図11-1は、印象情報収集率のグラフ例を説明する説明図である。
図11-1におけるグラフX1は、アンケート形式で対象(例えばワインW)に対する回答を取得した場合の、総数に対するアンケート回答数を示すグラフである。グラフX2は、印象推定装置1を用いて対象に対する印象を検出した場合の、総数に対する検出できた人の数を示すグラフである。
【0073】
図11-1に示すように、アンケート形式では、総数に対して回答を取得できた数の割合が低くなる傾向があり、一定数の回答を得ようとする場合には情報収集に関するコストが高くなる。これに対し、本実施形態では、グループで来場した人からはほぼ漏れなく印象の検出を行うことができ、情報収集に関するコストを低く抑えることができる。
【0074】
図11-2は、回答内容のグラフ例を説明する説明図である。
図11-2におけるグラフX3は、アンケート形式で対象(例えばワインW)に対する回答を取得した場合の、回答内容の内訳を示すグラフである。グラフX2は、印象推定装置1を用いて対象に対する印象を検出した場合の、印象の内訳を示すグラフである。
【0075】
図11-2に示すように、アンケート形式では、対象に対して強い印象(大変良い、大変悪い)を持つ人が、回答に対する動機が強く、実際に回答するケースが多くなる。逆に、対象に対して強い印象を持たない人は、回答に対する動機が弱く、回答しないケースが多くなる。このため、アンケート形式では、対象に対して強い印象に偏った回答が得られることとなる。これに対し、本実施形態では、回答に対する動機に関係なく、グループで来場した人からはほぼ漏れなく印象の検出を行うことができるので、偏りなく精度のよい結果を得ることができる。
【0076】
また、第1トリガ検出部51は、対象に対する匂いを嗅ぐ動作、味見をする動作、触れる動作および直視する動作の少なくとも1つを第1のトリガとして検出する。このため、印象推定装置1は、対象に対する匂いを嗅ぐ動作、味見をする動作、触れる動作および直視する動作を契機として印象を推定する動作の期間を設定できる。
【0077】
また、第2トリガ検出部52は、少なくとも、対象に関連する会話、アイコンタクト、肩をたたく動作のいずれかを第2のトリガとして検出する。このため、印象推定装置1は、対象に関連する会話、アイコンタクト、肩をたたく動作のいずれかを契機として印象を推定する動作の期間を設定できる。
【0078】
また、制御部40は、第1のユーザについては少なくとも第1のトリガを含む期間を設定する。このため、印象推定装置1は、コミュニケーション動作を行った側(第1のユーザ)については、対象に対する動作を行った時点を印象を推定する動作の期間に含めることができる。
【0079】
また、制御部40は、第2のユーザについては少なくとも第2のトリガを含む期間を設定する。このため、印象推定装置1は、コミュニケーション動作を受けた側(第2のユーザ)については、コミュニケーション動作を受けた時点を印象を推定する動作の期間に含めることができる。
【0080】
また、印象推定装置1は、第1のユーザおよび第2のユーザの少なくとも一方の対象に対する印象の推定結果を、第1のユーザおよび第2のユーザに対応付けて表示する出力部30を有する。このため、印象推定装置1は、複数の人物における印象の推定結果を分かりやすく提示できる。
【0081】
また、図示した各部の各構成要素は、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各部の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、第1トリガ検出部51と第2トリガ検出部52、印象推定部53とグループ推定部54を統合してもよい。また、図示した各処理は、上記の順番に限定されるものでなく、処理内容を矛盾させない範囲において、同時に実施してもよく、順序を入れ替えて実施してもよい。
【0082】
さらに、各装置で行われる各種処理機能は、CPU(またはMPU、MCU(Micro Controller Unit)等のマイクロ・コンピュータ)上で、その全部または任意の一部を実行するようにしてもよい。また、各種処理機能は、CPU(またはMPU、MCU等のマイクロ・コンピュータ)で解析実行されるプログラム上、またはワイヤードロジックによるハードウエア上で、その全部または任意の一部を実行するようにしてもよいことは言うまでもない。
【0083】
ところで、上記の各実施形態で説明した各種の処理は、予め用意されたプログラムをコンピュータで実行することで実現できる。そこで、以下では、上記の各実施形態と同様の機能を有するプログラムを実行するコンピュータの一例を説明する。
図12は、プログラムを実行するコンピュータの一例を示すブロック図である。
【0084】
図12に示すように、コンピュータ100は、各種演算処理を実行するCPU101と、データ入力を受け付ける入力装置102と、モニタ103とを有する。また、コンピュータ100は、記憶媒体からプログラム等を読み取る媒体読取装置104と、各種装置と接続するためのインタフェース装置105と、他の情報処理装置等と有線または無線により接続するための通信装置106とを有する。また、コンピュータ100は、各種情報を一時記憶するRAM107と、ハードディスク装置108とを有する。また、各装置101~108は、バス109に接続される。
【0085】
ハードディスク装置108には、
図1に示した入力部10、出力部30、制御部40、第1トリガ検出部51、第2トリガ検出部52、印象推定部53およびグループ推定部54の各処理部と同様の機能を有するプログラム108Aが記憶される。また、ハードディスク装置108には、入力部10、出力部30、制御部40、第1トリガ検出部51、第2トリガ検出部52、印象推定部53およびグループ推定部54を実現するための各種データが記憶される。入力装置102は、例えば、コンピュータ100の利用者から操作情報等の各種情報の入力を受け付ける。モニタ103は、例えば、コンピュータ100の利用者に対して表示画面等の各種画面を表示する。インタフェース装置105は、例えば印刷装置等が接続される。通信装置106は、図示しないネットワークと接続され、他の情報処理装置と各種情報をやりとりする。
【0086】
CPU101は、ハードディスク装置108に記憶されたプログラム108Aを読み出して、RAM107に展開して実行することで、各種の処理を行う。また、このプログラムは、コンピュータ100を
図1に示した入力部10、出力部30、制御部40、第1トリガ検出部51、第2トリガ検出部52、印象推定部53およびグループ推定部54として機能させることができる。
【0087】
なお、上記のプログラム108Aは、ハードディスク装置108に記憶されていなくてもよい。例えば、コンピュータ100が読み取り可能な記憶媒体に記憶されたプログラム108Aを、コンピュータ100が読み出して実行するようにしてもよい。コンピュータ100が読み取り可能な記憶媒体は、例えば、CD-ROMやDVD(Digital Versatile Disc)、USB(Universal Serial Bus)メモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリ、ハードディスクドライブ等が対応する。また、公衆回線、インターネット、LAN等に接続された装置にプログラム108Aを記憶させておき、コンピュータ100がこれらからプログラム108Aを読み出して実行するようにしてもよい。
【0088】
以上の実施形態に関し、さらに以下の付記を開示する。
【0089】
(付記1)ユーザそれぞれの動作に基づいて前記ユーザそれぞれの所定の対象に対する印象を推定する印象推定方法であって、
前記ユーザそれぞれの動作を検出し、
検出した前記ユーザそれぞれの動作において、第1のユーザが前記対象に対して行う動作を示す第1のトリガを検出し、
検出した前記ユーザそれぞれの動作において、前記第1のユーザから第2のユーザに対するコミュニケーション動作を示す第2のトリガを検出し、
前記第1のトリガを検出した後の所定時間内に前記第2のトリガを検出した場合に、前記第1のトリガおよび前記第2のトリガに基づき、前記第1のユーザおよび前記第2のユーザの少なくとも一方について前記対象に対する印象を推定する動作の期間を設定し、
設定した前記期間内における前記第1のユーザおよび前記第2のユーザの少なくとも一方の動作を特徴量とし、前記第1のユーザおよび前記第2のユーザの少なくとも一方の前記対象に対する印象を推定する、
処理をコンピュータが実行することを特徴とする印象推定方法。
【0090】
(付記2)前記第1のトリガを検出する処理は、前記対象に対する匂いを嗅ぐ動作、味見をする動作、触れる動作および直視する動作の少なくとも1つを第1のトリガとして検出する、
ことを特徴とする付記1に記載の印象推定方法。
【0091】
(付記3)前記第2のトリガを検出する処理は、少なくとも、前記対象に関連する会話、アイコンタクト、肩をたたく動作のいずれかを第2のトリガとして検出する、
ことを特徴とする付記1または2に記載の印象推定方法。
【0092】
(付記4)前記設定する処理は、前記第1のユーザについては少なくとも前記第1のトリガを含む期間を設定する、
ことを特徴とする付記1乃至3のいずれか一に記載の印象推定方法。
【0093】
(付記5)前記設定する処理は、前記第2のユーザについては少なくとも前記第2のトリガを含む期間を設定する、
ことを特徴とする付記1乃至4のいずれか一に記載の印象推定方法。
【0094】
(付記6)前記第1のユーザおよび前記第2のユーザの少なくとも一方の前記対象に対する印象の推定結果を、前記第1のユーザおよび前記第2のユーザに対応付けて表示する処理をさらにコンピュータが実行する、
ことを特徴とする付記1乃至5のいずれか一に記載の印象推定方法。
【0095】
(付記7)ユーザそれぞれの動作に基づいて前記ユーザそれぞれの所定の対象に対する印象をコンピュータに推定させる印象推定プログラムであって、
前記ユーザそれぞれの動作を検出し、
検出した前記ユーザそれぞれの動作において、第1のユーザが前記対象に対して行う動作を示す第1のトリガを検出し、
検出した前記ユーザそれぞれの動作において、前記第1のユーザから第2のユーザに対するコミュニケーション動作を示す第2のトリガを検出し、
前記第1のトリガを検出した後の所定時間内に前記第2のトリガを検出した場合に、前記第1のトリガおよび前記第2のトリガに基づき、前記第1のユーザおよび前記第2のユーザの少なくとも一方について前記対象に対する印象を推定する動作の期間を設定し、
設定した前記期間内における前記第1のユーザおよび前記第2のユーザの少なくとも一方の動作を特徴量とし、前記第1のユーザおよび前記第2のユーザの少なくとも一方の前記対象に対する印象を推定する、
処理をコンピュータに実行させることを特徴とする印象推定プログラム。
【0096】
(付記8)前記第1のトリガを検出する処理は、前記対象に対する匂いを嗅ぐ動作、味見をする動作、触れる動作および直視する動作の少なくとも1つを第1のトリガとして検出する、
ことを特徴とする付記7に記載の印象推定プログラム。
【0097】
(付記9)前記第2のトリガを検出する処理は、少なくとも、前記対象に関連する会話、アイコンタクト、肩をたたく動作のいずれかを第2のトリガとして検出する、
ことを特徴とする付記7または8に記載の印象推定プログラム。
【0098】
(付記10)前記設定する処理は、前記第1のユーザについては少なくとも前記第1のトリガを含む期間を設定する、
ことを特徴とする付記7乃至9のいずれか一に記載の印象推定プログラム。
【0099】
(付記11)前記設定する処理は、前記第2のユーザについては少なくとも前記第2のトリガを含む期間を設定する、
ことを特徴とする付記7乃至10のいずれか一に記載の印象推定プログラム。
【0100】
(付記12)前記第1のユーザおよび前記第2のユーザの少なくとも一方の前記対象に対する印象の推定結果を、前記第1のユーザおよび前記第2のユーザに対応付けて表示する処理をさらにコンピュータに実行させる、
ことを特徴とする付記7乃至11のいずれか一に記載の印象推定プログラム。
【0101】
(付記13)ユーザそれぞれの動作に基づいて前記ユーザそれぞれの所定の対象に対する印象を推定する印象推定装置であって、
前記ユーザそれぞれの動作を検出する動作検出部と、
検出した前記ユーザそれぞれの動作において、第1のユーザが前記対象に対して行う動作を示す第1のトリガを検出する第1トリガ検出部と、
検出した前記ユーザそれぞれの動作において、前記第1のユーザから第2のユーザに対するコミュニケーション動作を示す第2のトリガを検出する第2トリガ検出部と、
前記第1のトリガを検出した後の所定時間内に前記第2のトリガを検出した場合に、前記第1のトリガおよび前記第2のトリガに基づき、前記第1のユーザおよび前記第2のユーザの少なくとも一方について前記対象に対する印象を推定する動作の期間を設定する設定部と、
設定した前記期間内における前記第1のユーザおよび前記第2のユーザの少なくとも一方の動作を特徴量とし、前記第1のユーザおよび前記第2のユーザの少なくとも一方の前記対象に対する印象を推定する推定部と、
を有することを特徴とする印象推定装置。
【0102】
(付記14)前記第1トリガ検出部は、前記対象に対する匂いを嗅ぐ動作、味見をする動作、触れる動作および直視する動作の少なくとも1つを第1のトリガとして検出する、
ことを特徴とする付記13に記載の印象推定装置。
【0103】
(付記15)前記第2トリガ検出部は、少なくとも、前記対象に関連する会話、アイコンタクト、肩をたたく動作のいずれかを第2のトリガとして検出する、
ことを特徴とする付記13または14に記載の印象推定装置。
【0104】
(付記16)前記設定部は、前記第1のユーザについては少なくとも前記第1のトリガを含む期間を設定する、
ことを特徴とする付記13乃至15のいずれか一に記載の印象推定装置。
【0105】
(付記17)前記設定部は、前記第2のユーザについては少なくとも前記第2のトリガを含む期間を設定する、
ことを特徴とする付記13乃至16のいずれか一に記載の印象推定装置。
【0106】
(付記18)前記第1のユーザおよび前記第2のユーザの少なくとも一方の前記対象に対する印象の推定結果を、前記第1のユーザおよび前記第2のユーザに対応付けて表示する出力部をさらに有する、
ことを特徴とする付記13乃至17のいずれか一に記載の印象推定装置。
【符号の説明】
【0107】
1…印象推定装置
10…入力部
11…音声受信部
12…撮影部
20…記憶部
30…出力部
40…制御部
51…第1トリガ検出部
52…第2トリガ検出部
53…印象推定部
54…グループ推定部
100…コンピュータ
101…CPU
102…入力装置
103…モニタ
104…媒体読取装置
105…インタフェース装置
106…通信装置
107…RAM
108…ハードディスク装置
108A…プログラム
109…バス
531…顔検出
532…アライメント調整
533…AU推定
534…印象推定
G1~G3…グループ
H、H1~H7…人物
t1~t4…時刻
W…ワイン
X1~X4…グラフ