(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-04-10
(45)【発行日】2025-04-18
(54)【発明の名称】機械学習装置、データ処理装置、推論装置、機械学習方法、データ処理方法、及び、推論方法
(51)【国際特許分類】
G06N 20/00 20190101AFI20250411BHJP
G06N 3/0895 20230101ALI20250411BHJP
G06Q 50/10 20120101ALI20250411BHJP
【FI】
G06N20/00 130
G06N3/0895
G06Q50/10
(21)【出願番号】P 2021213643
(22)【出願日】2021-12-28
【審査請求日】2024-11-28
【早期審査対象出願】
(73)【特許権者】
【識別番号】512035815
【氏名又は名称】SENSY株式会社
(74)【代理人】
【識別番号】100214248
【氏名又は名称】青山 純
(74)【代理人】
【識別番号】100214260
【氏名又は名称】相羽 昌孝
(72)【発明者】
【氏名】渡辺 祐樹
(72)【発明者】
【氏名】渡辺 淳也
(72)【発明者】
【氏名】鈴木 直人
(72)【発明者】
【氏名】岡本 卓
【審査官】新井 則和
(56)【参考文献】
【文献】特開2020-035409(JP,A)
【文献】国際公開第2020/183979(WO,A1)
【文献】特開2021-121888(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 20/00
G06N 3/0895
G06Q 50/10
(57)【特許請求の範囲】
【請求項1】
1又は複数の観点に基づいて人物の行動を記録した人物データと、前記人物が前記行動を起こす動機となる要因を示す行動要因指標とで構成される学習用データを学習モデルに複数組入力することで、前記人物データと前記行動要因指標との相関関係を機械学習により前記学習モデルに学習させる機械学習部と、
前記機械学習部により前記相関関係を学習させた前記学習モデルを記憶する学習済みモデル記憶部と、を備
え、
前記機械学習部は、
前記人物が前記行動要因指標に適合するか否かを、前記観点の少なくとも一部に基づく前記人物データに対して規定された判定規則に従って前記人物毎に判定し、その判定結果に基づいて前記人物データに前記行動要因指標を付与することで前記学習用データを生成する第1の生成処理部と、
前記第1の生成処理部により生成された前記学習用データを用いて、前記相関関係を前記学習モデルに学習させる第1の学習処理部と、
前記第1の学習処理部により前記相関関係を学習させた前記学習モデルに前記人物データを入力することで前記学習モデルから出力された前記行動要因指標に対して修正指示を受け付けて、その受付結果に基づいて前記人物データに前記行動要因指標を付与することで前記学習用データを生成する第2の生成処理部と、
少なくとも前記第2の生成処理部により生成された前記学習用データを用いて、前記相関関係を前記学習モデルに学習させる第2の学習処理部と、を備える、
機械学習装置。
【請求項2】
前記第2の生成処理部は、
前記第1の学習処理部により前記相関関係を学習させた前記学習モデルに前記人物データを入力することで前記学習モデルから出力された前記行動要因指標を前記人物データと対応付けて前記人物毎に表示させるとともに、その表示させた前記行動要因指標に対して前記修正指示を受け付ける、
請求項
1に記載の機械学習装置。
【請求項3】
前記第2の生成処理部は、
前記第1の学習処理部により前記相関関係を学習させた前記学習モデルに前記人物デ
ータを入力することで前記学習モデルから出力された前記行動要因指標を前記人物データに対して所定の統計処理が行われた情報と対応付けて前記人物毎に表示させるとともに、その表示させた前記行動要因指標に対して前記修正指示を受け付ける、
請求項1に記載の機械学習装置。
【請求項4】
前記第2の生成処理部は、
前記第1の生成処理部により前記判定結果に基づいて前記人物データに付与された前記行動要因指標と、前記第1の学習処理部により前記相関関係を学習させた前記学習モデルに前記人物データを入力することで前記学習モデルから出力された前記行動要因指標とを前記人物データと対応付けて前記人物毎に表示させるとともに、その表示させた前記行動要因指標に対して前記修正指示を受け付ける、
請求項1に記載の機械学習装置。
【請求項5】
前記機械学習部は、
前記第2の学習処理部が前記相関関係を前記学習モデルに学習させたときに、所定の学習終了条件を満たさない場合には、
前記第2の生成処理部が、前記第1の学習処理部に代えて前記第2の学習処理部により前記相関関係を学習させた前記学習モデルに前記人物データを入力することで前記学習モデルから出力された前記行動要因指標に対して前記修正指示を受け付けて、その受付結果に基づいて前記人物データに前記行動要因指標を付与することで前記学習用データを生成する処理と、前記第2の学習処理部が、少なくとも前記第2の生成処理部により生成された前記学習用データを用いて、前記相関関係を前記学習モデルに学習させる処理とを前記学習終了条件を満たすまで繰り返し実行する、
請求項
1乃至請求項4のいずれか一項に記載の機械学習装置。
【請求項6】
1又は複数の観点に基づいて人物の行動を記録した人物データと、前記人物が前記行動を起こす動機となる要因を示す行動要因指標とで構成される学習用データを学習モデルに複数組入力することで、前記人物データと前記行動要因指標との相関関係を機械学習により前記学習モデルに学習させる機械学習部と、
前記機械学習部により前記相関関係を学習させた前記学習モデルを記憶する学習済みモデル記憶部と、を備
え、
前記人物データは、
前記行動の特徴を示す指標であって前記行動要因指標に対応する行動特徴指標が付与された特徴データに関連付けて記録したものであり、
前記機械学習部は、
前記人物データに含まれる前記特徴データに付与された前記行動特徴指標に基づいて、前記人物データを前記学習モデルに入力するための特徴量に変換する前処理を行い、その前処理にて前記人物データから変換された前記特徴量と、前記人物データに含まれる前記行動要因指標とで構成される前記前処理後の学習用データを前記学習モデルに複数組入力することで、前記相関関係を前記学習モデルに学習させるものであり、
前記機械学習部は、
前記人物が前記行動要因指標に適合するか否かを、前記観点の少なくとも一部に基づく前記人物データに対して規定された判定規則に従って前記人物毎に判定し、その判定結果に基づいて前記人物データに前記行動要因指標を付与することで前記学習用データを生成する第1の生成処理部と、
前記第1の生成処理部により生成された前記学習用データであって前記前処理後の学習用データを用いて、前記相関関係を前記学習モデルに学習させる第1の学習処理部と、
前記第1の学習処理部により前記相関関係を学習させた前記学習モデルに、前記前処理にて前記人物データから変換された前記特徴量を入力することで前記学習モデルから出力された前記行動要因指標と、前記人物データに含まれる前記特徴データに付与された前
記行動特徴指標との少なくとも一方に対して修正指示を受け付けて、その受付結果に基づいて前記人物データに前記行動要因指標を付与することで前記学習用データを生成するとともに、前記特徴データに付与された前記行動特徴指標を修正する第2の生成処理部と、
少なくとも前記第2の生成処理部により生成された前記学習用データであって前記前処理後の学習用データを用いて、前記相関関係を前記学習モデルに学習させる第2の学習処理部と、を備える、
機械学習装置。
【請求項7】
前記第2の生成処理部は、
前記第1の学習処理部により前記相関関係を学習させた前記学習モデルに、前記前処理にて前記人物データから変換された前記特徴量を入力することで前記学習モデルから出力された前記行動要因指標と、前記人物データに含まれる前記特徴データに付与された前記行動特徴指標とを前記人物データと対応付けて前記人物毎に表示させるとともに、その表示させた前記行動要因指標と、前記行動特徴指標との少なくとも一方に対して前記修正指示を受け付ける、
請求項
6に記載の機械学習装置。
【請求項8】
前記第2の生成処理部は、
前記第1の学習処理部により前記相関関係を学習させた前記学習モデルに、前記前処理にて前記人物データから変換された前記特徴量を入力することで前記学習モデルから出力された前記行動要因指標と、前記人物データに含まれる前記特徴データに付与された前記行動特徴指標とを前記人物データに対して所定の統計処理が行われた情報と対応付けて前記人物毎に表示させるとともに、その表示させた前記行動要因指標と、前記行動特徴指標との少なくとも一方に対して前記修正指示を受け付ける、
請求項6に記載の機械学習装置。
【請求項9】
前記第2の生成処理部は、
前記第1の生成処理部により前記判定結果に基づいて前記人物データに付与された前記行動要因指標と、前記第1の学習処理部により前記相関関係を学習させた前記学習モデルに、前記前処理にて前記人物データから変換された前記特徴量を入力することで前記学習モデルから出力された前記行動要因指標と、前記人物データに含まれる前記特徴データに付与された前記行動特徴指標とを前記人物データと対応付けて前記人物毎に表示させるとともに、その表示させた前記行動要因指標と、前記行動特徴指標との少なくとも一方に対して前記修正指示を受け付ける、
請求項6に記載の機械学習装置。
【請求項10】
前記機械学習部は、
前記第2の学習処理部が前記相関関係を前記学習モデルに学習させたときに、所定の学習終了条件を満たさない場合には、
前記第2の生成処理部が、前記第1の学習処理部に代えて前記第2の学習処理部により前記相関関係を学習させた前記学習モデルに、前記前処理にて前記人物データから変換された前記特徴量を入力することで前記学習モデルから出力された前記行動要因指標と、前記人物データに含まれる前記特徴データに付与された前記行動特徴指標との少なくとも一方に対して前記修正指示を受け付けて、その受付結果に基づいて前記人物データに前記行動要因指標を付与することで前記学習用データを生成するとともに、前記特徴データに付与された前記行動特徴指標を修正する処理と、前記第2の学習処理部が、少なくとも前記第2の生成処理部により生成された前記学習用データであって前記前処理後の学習用データを用いて、前記相関関係を前記学習モデルに学習させる処理とを前記学習終了条件を満たすまで繰り返し実行する、
請求項
6乃至請求項9のいずれか一項に記載の機械学習装置。
【請求項11】
1又は複数の観点に基づいて人物の行動を記録した人物データと、前記人物が前記行動を起こす動機となる要因を示す行動要因指標とで構成される学習用データを学習モデルに複数組入力することで、前記人物データと前記行動要因指標との相関関係を機械学習により前記学習モデルに学習させる機械学習工程と、
前記機械学習工程により前記相関関係を学習させた前記学習モデルを学習済みモデル記憶部に記憶する学習済みモデル記憶工程と、を備
え、
前記機械学習工程は、
前記人物が前記行動要因指標に適合するか否かを、前記観点の少なくとも一部に基づく前記人物データに対して規定された判定規則に従って前記人物毎に判定し、その判定結果に基づいて前記人物データに前記行動要因指標を付与することで前記学習用データを生成する第1の生成処理工程と、
前記第1の生成処理工程により生成された前記学習用データを用いて、前記相関関係を前記学習モデルに学習させる第1の学習処理工程と、
前記第1の学習処理工程により前記相関関係を学習させた前記学習モデルに前記人物データを入力することで前記学習モデルから出力された前記行動要因指標に対して修正指示を受け付けて、その受付結果に基づいて前記人物データに前記行動要因指標を付与することで前記学習用データを生成する第2の生成処理工程と、
少なくとも前記第2の生成処理工程により生成された前記学習用データを用いて、前記相関関係を前記学習モデルに学習させる第2の学習処理工程と、を備える、
機械学習方法。
【請求項12】
1又は複数の観点に基づいて人物の行動を記録した人物データと、前記人物が前記行動を起こす動機となる要因を示す行動要因指標とで構成される学習用データを学習モデルに複数組入力することで、前記人物データと前記行動要因指標との相関関係を機械学習により前記学習モデルに学習させる機械学習工程と、
前記機械学習工程により前記相関関係を学習させた前記学習モデルを学習済みモデル記憶部に記憶する学習済みモデル記憶工程と、を備
え、
前記人物データは、
前記行動の特徴を示す指標であって前記行動要因指標に対応する行動特徴指標が付与された特徴データに関連付けて記録したものであり、
前記機械学習工程は、
前記人物データに含まれる前記特徴データに付与された前記行動特徴指標に基づいて、前記人物データを前記学習モデルに入力するための特徴量に変換する前処理を行い、その前処理にて前記人物データから変換された前記特徴量と、前記人物データに含まれる前記行動要因指標とで構成される前記前処理後の学習用データを前記学習モデルに複数組入力することで、前記相関関係を前記学習モデルに学習させるものであり、
前記機械学習工程は、
前記人物が前記行動要因指標に適合するか否かを、前記観点の少なくとも一部に基づく前記人物データに対して規定された判定規則に従って前記人物毎に判定し、その判定結果に基づいて前記人物データに前記行動要因指標を付与することで前記学習用データを生成する第1の生成処理工程と、
前記第1の生成処理工程により生成された前記学習用データであって前記前処理後の学習用データを用いて、前記相関関係を前記学習モデルに学習させる第1の学習処理工程と、
前記第1の学習処理工程により前記相関関係を学習させた前記学習モデルに、前記前処理にて前記人物データから変換された前記特徴量を入力することで前記学習モデルから出力された前記行動要因指標と、前記人物データに含まれる前記特徴データに付与された前記行動特徴指標との少なくとも一方に対して修正指示を受け付けて、その受付結果に基づいて前記人物データに前記行動要因指標を付与することで前記学習用データを生成する
とともに、前記特徴データに付与された前記行動特徴指標を修正する第2の生成処理工程と、
少なくとも前記第2の生成処理工程により生成された前記学習用データであって前記前処理後の学習用データを用いて、前記相関関係を前記学習モデルに学習させる第2の学習処理工程と、を備える、
機械学習方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機械学習装置、データ処理装置、推論装置、機械学習方法、データ処理方法、及び、推論方法に関する。
【背景技術】
【0002】
従来、ユーザの個人情報を利用して、そのユーザに合わせた情報を提供することで、ユーザの利便性や情報提供者の有益性を向上させることが行われている。例えば、特許文献1及び特許文献2には、ユーザの名前、性別、年齢等を含む個人情報に基づいて、ユーザの端末に広告情報を配信するシステムが開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2019-211851号公報
【文献】特開2002-366843号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1及び特許文献2に開示されたシステムでは、個人情報が、各ユーザにより入力されることを前提としているため、個人情報が入力されていないユーザに対して適切な情報を提供することができなかった。また、ユーザが何かしらの行動を起こす場合、その行動を起こす動機となる要因を示す行動要因指標(例えば、感性等)が、そのユーザに内在していると考えられる。しかしながら、特許文献1及び特許文献2に開示されたシステムでは、そのような行動要因指標は個人情報として入力されるものではないため、各ユーザに内在する行動要因指標に応じた適切な情報を提供することができなかった。
【0005】
本発明は、上述した課題に鑑みてなされたものであって、人物の行動からその人物が行動を起こす動機となる要因を適切に把握するための機械学習装置、データ処理装置、推論装置、機械学習方法、データ処理方法、及び、推論方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
上記目的を達成するために、本発明の一態様に係る機械学習装置は、
1又は複数の観点に基づいて人物の行動を記録した人物データと、前記人物が前記行動を起こす動機となる要因を示す行動要因指標とで構成される学習用データを学習モデルに複数組入力することで、前記人物データと前記行動要因指標との相関関係を機械学習により前記学習モデルに学習させる機械学習部と、
前記機械学習部により前記相関関係を学習させた前記学習モデルを記憶する学習済みモデル記憶部と、を備える。
【発明の効果】
【0007】
本発明の一態様に係る機械学習装置によれば、1又は複数の観点に基づいて人物の行動を記録した人物データに基づいて、その人物が行動を起こす動機となる要因を示す行動要因指標を推定可能な学習モデルを提供することができる。よって、この学習モデルを利用することにより、例えば、人物(ユーザ)に対して個人情報の入力を要求することなく、その人物に内在する行動要因指標を適切に付与(推論)することできる。
【0008】
上記以外の課題、構成及び効果は、後述する発明を実施するための形態にて明らかにさ
れる。
【図面の簡単な説明】
【0009】
【
図1】人物情報管理システム1の一例を示す全体構成図である。
【
図2】コンピュータ900の一例を示すハードウエア構成図である。
【
図3】人物データベース20の一例を示すデータ構成図である。
【
図4】機械学習装置3の一例を示すブロック図である。
【
図5】判定規則データ310の一例を示す図である。
【
図6】学習用データ11及び学習モデル12の一例を示す図である。
【
図7】機械学習部301の一例を示す機能説明図である。
【
図8】データ処理装置4の一例を示すブロック図である。
【
図9】データ処理装置4の一例を示す機能説明図である。
【
図10】機械学習装置3による機械学習方法の一例を示すフローチャートである。
【
図11】機械学習装置3による機械学習方法の一例を示すフローチャート(
図10の続き)である。
【
図12】データ処理装置4によるデータ処理方法の一例を示すフローチャートである。
【発明を実施するための形態】
【0010】
以下、図面を参照して本発明を実施するための実施形態について説明する。以下では、本発明の目的を達成するための説明に必要な範囲を模式的に示し、本発明の該当部分の説明に必要な範囲を主に説明することとし、説明を省略する箇所については公知技術によるものとする。
【0011】
(人物情報管理システム1)
図1は、人物情報管理システム1の一例を示す全体構成図である。人物情報管理システム1は、人物の行動を記録した人物データに対してその人物が行動を起こす動機となる要因を示す行動要因指標(タグ)を付与することで、各人物の行動要因指標を各種のサービス(商品企画、商品開発、生産管理、仕入れ・発注管理、販売戦略策定、マーケティング、広告等)に提供可能なシステムとして機能する。
【0012】
人物データは、1又は複数の観点に基づいて人物の行動を記録したデータである。人物の行動を記録するときの観点としては、例えば、人物が店舗や電子商取引サイトで商品やサービスを購入したときの購買行動、人物がウェブサイトを閲覧したときのウェブ閲覧行動、人物がウェブサイトで検索したときのウェブ検索行動、人物が任意の移動手段(徒歩、電車、車等)で移動したときの移動行動、人物がウェブサイトや紙面にてアンケートに回答したときのアンケート回答行動等が挙げられる。そのため、人物データには、例えば、購買行動を記録した購買履歴、ウェブ閲覧行動を記録したウェブ閲覧履歴、ウェブ検索行動を記録したウェブ検索履歴、移動行動を記録した移動履歴、アンケート回答行動を記録したアンケート回答履歴等が含まれる。
【0013】
行動要因指標は、人物が特定の行動を起こすときの動機となる要因を示すものである。行動要因指標は、例えば、感性、嗜好性、属性等で分類される複数の種類を有する。感性、及び、嗜好性としては、例えば、健康志向、オーガニック、産地こだわり派、価格(節約)志向、高級志向、安心・安全、美容感度高め、綺麗好き、和食派、洋食派、甘い物好き(甘党)、辛い物好き(辛党)、濃い味好き、酸味好き、炭酸好き、インドア系、アウトドア系等が挙げられる。属性としては、デモグラフィック、ライフスタイル等に関するものとして、年代、性別、独身、既婚、子供あり、持ち家、賃貸、車所有、ペット飼育、ダイエット中等が挙げられる。
【0014】
行動要因指標は、人物データに対して変数の値により付与されるものであり、行動要因指標の種類毎に変数の値がそれぞれ付与される。本実施形態では、「健康志向」の行動要因指標が、2クラスの分類(0又は1の二値分類)で定義される場合を中心に説明するため、「健康志向」の行動要因指標の変数の値は、「0:健康志向でない」及び「1:健康志向である」により付与される。なお、行動要因指標は、多クラスの分類(多値分類)で定義されてもよく、例えば、3クラスの分類で定義される場合には、「健康志向」の行動要因指標の変数の値は、「-1:健康志向でない」、「0:どちらでもない」及び「1:健康志向である」により付与されてもよい。また、行動要因指標の定義は、行動要因指標の種類毎に異なるものでもよい。
【0015】
人物情報管理システム1は、その主要な構成要素として、データベース装置2と、機械学習装置3と、データ処理装置4と、作業者端末装置5とを備える。各装置2~5は、例えば、汎用又は専用のコンピュータ(後述の
図2参照)で構成されるとともに、有線又は無線のネットワーク6に接続されて、各種のデータを相互に送受信可能に構成される。なお、各装置2~5の数やネットワーク6の接続構成は、
図1の例に限られず、適宜変更してもよい。
【0016】
データベース装置2は、各人物の日々の行動を1又は複数の観点に基づいて行動履歴として記録する外部システム(不図示)と連携し、1又は複数の観点に基づく行動履歴を人物データとして人物別に登録可能な人物データベース20を備える。外部システムは、例えば、販売時点情報管理システム(POSシステム)、コンピュータ操作ログ収集システム、ナビゲーションシステム、アンケートシステム等で構成される。外部システムは、各人物の日々の行動に応じて、購買履歴、ウェブ閲覧履歴、ウェブ検索履歴、移動履歴、アンケート回答履歴等を行動履歴として記録し、例えば、データベース装置2からの要求に応じてデータベース装置2に提供する。
【0017】
機械学習装置3は、機械学習の学習フェーズの主体として動作し、人物データベース20に登録された人物データを学習用データ11として用いることで、学習モデル12の機械学習を行う。学習済みの学習モデル12は、ネットワーク6や記録媒体等を介してデータ処理装置4に提供される。機械学習の手法としては、教師あり学習を採用する。
【0018】
データ処理装置4は、機械学習の推論フェーズの主体として動作し、機械学習装置3により生成された学習済みの学習モデル12を用いて、人物データに対して行動要因指標を付与し、その付与結果(本実施形態では、行動要因指標の種類毎の変数の値)をデータベース装置2や作業者端末装置5等に提供する。
【0019】
作業者端末装置5は、学習モデル12の機械学習を行う際に、学習用データ11のアノテーション作業を行う作業者10により使用される端末装置である。作業者端末装置5は、アプリケーションプログラム、ウェブブラウザ等の表示画面を介して各種の入力操作を受け付けるとともに、表示画面を介して各種の情報(例えば、人物データ、行動要因指標等)を表示する。
【0020】
(コンピュータ900)
図2は、コンピュータ900の一例を示すハードウエア構成図である。人物情報管理システム1の各装置2~5は、汎用又は専用のコンピュータ900により構成される。
【0021】
コンピュータ900は、
図2に示すように、その主要な構成要素として、バス910、プロセッサ912、メモリ914、入力デバイス916、出力デバイス917、表示デバイス918、ストレージ装置920、通信I/F(インターフェース)部922、外部機器I/F部924、I/O(入出力)デバイスI/F部926、及び、メディア入出力部
928を備える。なお、上記の構成要素は、コンピュータ900が使用される用途に応じて適宜省略されてもよい。
【0022】
プロセッサ912は、1つ又は複数の演算処理装置(CPU(Central Processing Unit)、MPU(Micro-processing unit)、DSP(digital signal processor)、GPU(Graphics Processing Unit)等)で構成され、コンピュータ900全体を統括する制御部として動作する。メモリ914は、各種のデータ及びプログラム930を記憶し、例えば、メインメモリとして機能する揮発性メモリ(DRAM、SRAM等)と、不揮発性メモリ(ROM)、フラッシュメモリ等とで構成される。
【0023】
入力デバイス916は、例えば、キーボード、マウス、テンキー、電子ペン等で構成され、入力部として機能する。出力デバイス917は、例えば、音(音声)出力装置、バイブレーション装置等で構成され、出力部として機能する。表示デバイス918は、例えば、液晶ディスプレイ、有機ELディスプレイ、電子ペーパー、プロジェクタ等で構成され、出力部として機能する。入力デバイス916及び表示デバイス918は、タッチパネルディスプレイのように、一体的に構成されていてもよい。ストレージ装置920は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)等で構成され、記憶部として機能する。ストレージ装置920は、オペレーティングシステムやプログラム930の実行に必要な各種のデータを記憶する。
【0024】
通信I/F部922は、インターネットやイントラネット等のネットワーク940(
図1のネットワーク6と同じであってもよい)に有線又は無線により接続され、所定の通信規格に従って他のコンピュータとの間でデータの送受信を行う通信部として機能する。外部機器I/F部924は、カメラ、プリンタ、スキャナ、リーダライタ等の外部機器950に有線又は無線により接続され、所定の通信規格に従って外部機器950との間でデータの送受信を行う通信部として機能する。I/OデバイスI/F部926は、各種のセンサ、アクチュエータ等のI/Oデバイス960に接続され、I/Oデバイス960との間で、例えば、センサによる検出信号やアクチュエータへの制御信号等の各種の信号やデータの送受信を行う通信部として機能する。メディア入出力部928は、例えば、DVD(Digital Versatile Disc)ドライブ、CD(Compact Disc)ドライブ等のドライブ装置で構成され、DVD、CD等のメディア(非一時的な記憶媒体)970に対してデータの読み書きを行う。
【0025】
上記構成を有するコンピュータ900において、プロセッサ912は、ストレージ装置920に記憶されたプログラム930をメモリ914に呼び出して実行し、バス910を介してコンピュータ900の各部を制御する。なお、プログラム930は、ストレージ装置920に代えて、メモリ914に記憶されていてもよい。プログラム930は、インストール可能なファイル形式又は実行可能なファイル形式でメディア970に記録され、メディア入出力部928を介してコンピュータ900に提供されてもよい。プログラム930は、通信I/F部922を介してネットワーク940経由でダウンロードすることによりコンピュータ900に提供されてもよい。また、コンピュータ900は、プロセッサ912がプログラム930を実行することで実現する各種の機能を、例えば、FPGA(field-programmable gate array)、ASIC(application specific integrated circuit)等のハードウエアで実現するものでもよい。
【0026】
コンピュータ900は、例えば、据置型コンピュータや携帯型コンピュータで構成され、任意の形態の電子機器である。コンピュータ900は、クライアント型コンピュータでもよいし、サーバ型コンピュータやクラウド型コンピュータでもよい。
【0027】
(人物データベース20)
図3は、人物データベース20の一例を示すデータ構成図である。人物データベース20は、各人物にそれぞれ付与された人物識別情報(ユーザID)に基づいて、人物データを管理するためのデータベースである。人物データベース20は、例えば、購買履歴テーブル、ウェブ閲覧履歴テーブル、ウェブ検索履歴テーブル、移動履歴テーブル、アンケート回答履歴テーブル、行動要因指標テーブル、商品マスタ情報、店舗マスタ情報、ウェブサイトマスタ情報、及び、地図情報から構成される。
【0028】
購買履歴テーブルは、購買行動を記録するための複数のレコードを有し、各レコードには、日時、商品、価格、店舗(電子商取引サイトでもよい)等が登録される。商品には、商品IDが登録されるとともに、その商品IDにより商品マスタ情報と紐付けされることで、商品マスタ情報に登録された商品属性(商品名、商品カテゴリー等)が関連付けられる。店舗には、店舗IDが登録されるとともに、その店舗品IDにより店舗マスタ情報と紐付けされることで、店舗マスタ情報に登録された店舗属性(店舗名、店舗カテゴリー等)が関連付けられる。なお、商品には、行動要因指標に対応する商品指標(行動特徴指標)が付与されていてもよく、例えば、商品属性の一部として商品マスタ情報に登録されていてもよい。また、店舗には、行動要因指標に対応する店舗指標(行動特徴指標)が付与されていてもよく、例えば、店舗属性の一部として店舗マスタ情報に登録されていてもよい。
【0029】
ウェブ閲覧履歴テーブルは、ウェブ閲覧行動を記録するための複数のレコードを有し、各レコードには、日時、ウェブサイト、閲覧時間等が登録される。ウェブ検索履歴テーブルは、ウェブ検索行動を記録するための複数のレコードを有し、各レコードには、日時、検索ワード等が登録される。ウェブサイトには、そのウェブサイトにアクセスするためのURLが登録されるとともに、そのURLによりウェブサイトマスタ情報と紐付けされることで、ウェブサイトマスタ情報に登録されたウェブサイト属性(管理者名、ウェブサイトカテゴリー等)が関連付けられる。なお、ウェブサイトには、行動要因指標に対応するウェブサイト指標(行動特徴指標)が付与されていてもよく、例えば、ウェブサイト属性の一部としてウェブサイトマスタ情報に登録されていてもよい。
【0030】
移動履歴テーブルは、移動行動を記録するための複数のレコードを有し、各レコードには、日時、位置、移動手段等が登録される。位置には、例えば、所定の時間以上滞在したときの滞在地点や滞在地域が登録されるとともに、その滞在地点や滞在地域により地図情報と紐付けされることで、地図情報に登録された地点属性(地点名、地点カテゴリー等)や地域属性(地域名、地域カテゴリー等)が関連付けられる。なお、地点や地域には、行動要因指標に対応する地点指標(行動特徴指標)や地域指標(行動特徴指標)が付与されていてもよく、例えば、地点属性や地域属性の一部として地図情報に登録されていてもよい。
【0031】
アンケート回答履歴テーブルは、アンケート回答行動を記録するための複数のレコードを有し、各レコードには、日時、質問内容、回答内容等が登録される。
【0032】
行動要因指標テーブルは、データ処理装置4により付与された行動要因指標を記憶するための複数のレコードを有し、各レコードには、日時、行動要因指標の変数の値等が登録される。
図3の例では、「健康志向」、「甘党」及び「車所有」という3つの行動要因指標に対応する3つのフィールドが示されているが、他の行動要因指標についても同様に、フィールドがそれぞれ設けられる。
【0033】
人物データベース20では、各テーブルの情報がユーザIDにより関連付けられること
で、複数の観点に基づいて人物の行動を記録した人物データと、行動要因指標とが人物毎に管理される。そして、人物データベース20に登録された情報は、各種の統計処理が実行可能に構成される。なお、人物データは、行動の特徴を示す指標であって行動要因指標に対応する行動特徴指標(本実施形態では、商品指標、店舗指標、ウェブサイト指標、地点指標、地域指標)が付与された特徴データ(本実施形態では、商品、店舗、ウェブサイト、地点、地域)に関連付けて記録したものでもよい。行動特徴指標は、上記以外にも、例えば、時間帯、曜日、季節等の特徴に対しても付与されてもよい。また、人物データベース20のデータ構成は適宜変更してもよく、上記以外のデータが登録可能であってもよいし、上記のデータの一部が省略されていてもよい。
【0034】
(機械学習装置3)
図4は、機械学習装置3の一例を示すブロック図である。機械学習装置3は、プロセッサ等により構成される制御部30と、HDD、SSD、メモリ等により構成される記憶部31と、ネットワーク6との通信インターフェースである通信部32と、キーボード、マウス等により構成される入力部33と、ディスプレイ等により構成される表示部34とを備える。なお、入力部33及び表示部34は省略されてもよい。
【0035】
記憶部31は、学習用データ11、学習モデル12、判定規則データ310、及び、機械学習プログラム311を記憶するとともに、オペレーティングシステム、他のプログラム、各種のデータ等を記憶する。記憶部31は、学習用データ11を記憶する学習用データ記憶部、及び、学習モデル12を記憶する学習済みモデル記憶部として機能する。
【0036】
図5は、判定規則データ310の一例を示す図である。判定規則データ310には、人物が行動要因指標に適合するか否かを判定するための判定規則が、行動要因指標の種類毎に登録される。判定規則データ310は、作業者10が作業者端末装置5を介して編集可能な情報である。
【0037】
判定規則は、観点の少なくとも一部に基づく人物データに対して規定され、例えば、比較、割合、頻度、期間、カテゴリー、行動特徴指標(商品指標、店舗指標、ウェブサイト指標、地点指標、地域指標)等に各種の数値演算を適宜組み合わせることで規定される。また、判定規則は、行動要因指標の種類毎に規定され、
図5の例では、「健康志向」、「甘党」及び「車所有」という3つの行動要因指標の判定規則が、「購買行動」という観点に基づく「購買履歴」に対して規定されている。例えば、「健康志向」の行動要因指標の判定規則では、各ユーザが、過去1年間に「健康食品」の商品カテゴリーが付与された商品や「健康志向」の商品指標が付与された商品を購入したときの購入額を集計し、その集計した購入額がX円以上の場合に、そのユーザに対して「1:健康志向である」という行動要因指標が付与される。
【0038】
図5には、判定規則による判定結果として、「ユーザA」の人物データには、「1:健康志向である」、「0:甘党でない」、「1:車所有である」という行動要因指標が付与され、「ユーザB」の人物データには、「0:健康志向でない」、「0:甘党でない」、「1:車所有である」という行動要因指標が付与され、「ユーザC」の人物データには、「1:甘党である」、「0:車所有でない」という行動要因指標が付与されている。また、「ユーザC」の人物データには、「健康志向」の判定規則に従って判定するための購買履歴が十分に記録されていない等の理由により、「健康志向」の判定規則による判定結果として、「N/A:判定不可」が記録されている。
【0039】
なお、判定規則は、複数の観点に基づく人物データに対して規定されてもよく、例えば、「購買行動」、「移動行動」及び「アンケート回答行動」という複数の観点に基づく「購買履歴」、「移動行動」及び「アンケート回答履歴」に対して規定されてもよい。また
、判定規則は、行動要因指標の種類毎に、異なる観点に基づく人物データに対して規定されてもよく、例えば、「健康志向」の判定規則は、「購買行動」に基づく「購買履歴」に対して規定されて、「車所有」の判定規則は、「移動行動」に基づく「移動履歴」に対して規定されてもよい。
【0040】
制御部30は、
図4に示すように、記憶部41に記憶された機械学習プログラム311を実行することにより、データ取得部300、及び、機械学習部301として機能する。
【0041】
データ取得部300は、例えば、機械学習部301や作業者端末装置5からの要求を受け付けて、通信部32及びネットワーク6を介して人物データベース20にアクセスする。データ取得部300は、人物データベース20から、複数の人物の行動をそれぞれ記録した人物データを人物毎に取得し、機械学習部301に提供したり、記憶部31に記憶したりする。
【0042】
機械学習部301は、人物データと行動要因指標とで構成される学習用データ11を生成し、学習モデル12に複数組入力することで、人物データと行動要因指標との相関関係を機械学習により学習モデル12に学習させる。そして、機械学習部301は、学習済みの学習モデル12(具体的には、調整済みのパラメータ群)を記憶部31に記憶する。
【0043】
なお、機械学習部301は、学習用データ11aを構成する人物データを学習モデル12aの入力層120に入力する際、ワンホットエンコーディングやラベルエンコーディング等の任意の変換手法により、人物データを学習モデル12に入力するための所定の特徴量に変換する前処理を行うようにしてもよい。その場合の前処理としては、例えば、人物データに含まれる購買履歴、ウェブ閲覧履歴、ウェブ検索履歴、移動履歴及びアンケート回答履歴に対して、比較、割合、頻度、期間、カテゴリー、行動特徴指標(商品指標、店舗指標、ウェブサイト指標、地点指標、地域指標)等に各種の数値演算を適宜組み合わせることで、人物データを特徴量に変換するようにすればよい。
【0044】
特に、人物データが、
図3に示すように、行動特徴指標(商品指標、店舗指標、ウェブサイト指標、地点指標、地域指標)が付与された特徴データ(商品、店舗、ウェブサイト、地点、地域)に関連付けて記録したものである場合には、機械学習部301は、人物データに含まれる特徴データに付与された行動特徴指標に基づいて、人物データを特徴量に変換する前処理を行い、その前処理にて人物データから変換された特徴量と、人物データに含まれる行動要因指標とで構成される前処理後の学習用データ11を学習モデル12に複数組入力することで、人物データと行動要因指標との相関関係を学習モデル12に学習させるようにしてもよい。その場合の前処理としては、例えば、購買履歴の一部として記録されている、ユーザが過去に購入した商品に付与された商品指標に基づいて、「健康志向」の行動要因指標が付与された商品の購入額、「甘党」の行動要因指標が付与された商品の購入額、「車所有」の行動要因指標が付与された商品の購入額等をそれぞれ集計し、その集計した各購入額を0~1の範囲の値にそれぞれ正規化することで、特徴量に変換するようにすればよい。
【0045】
図6は、学習用データ11及び学習モデル12の一例を示す図である。学習モデル12の機械学習に用いられる学習用データ11は、人物データと行動要因指標とで構成される。学習用データ11は、教師あり学習における教師データ(トレーニングデータ)、検証データ及びテストデータとして用いられるデータである。また、行動要因指標は、教師あり学習における正解ラベルとして用いられるデータである。
【0046】
学習用データ11を構成する人物データは、人物データベース20から取得される。学習用データ11を構成する行動要因指標は、判定規則データ310に登録された判定規則
による判定結果に基づいて付与されたり、作業者10によるアノテーション作業により付与されたりする。
【0047】
学習モデル12は、例えば、ニューラルネットワークの構造を採用したものであり、入力層120、中間層121、及び、出力層122を備える。各層の間には、各ニューロンをそれぞれ接続するシナプス(不図示)が張られており、各シナプスには、重みがそれぞれ対応付けられている。
【0048】
入力層120は、入力データとしての人物データ(前処理にて人物データから変換された特徴量でもよい)に対応する数のニューロンを有し、人物データの各値が各ニューロンにそれぞれ入力される。出力層122は、出力データとしての行動要因指標に対応するニューロンを有し、人物データに対する行動要因指標の付与結果(推論結果)が、出力データ(本実施形態では、0~1の範囲の値)として出力される。学習用データ11を構成する行動要因指標(正解ラベル)と、出力層122から出力された行動要因指標(推論結果)とを比較し、各シナプスの重み等のパラメータ群を調整する処理(バックプロパゲーション等)を実施することで、学習モデル12の機械学習が行われる。
【0049】
本実施形態では、機械学習部301が、行動要因指標の種類毎に学習モデル12の機械学習を行う場合について説明するため、記憶部31には、行動要因指標の各種類に対応する複数の学習モデル12が記憶されている。
図6に示す学習モデル12は、人物データに対して「健康志向」の行動要因指標を出力するものであり、人物データと、「健康志向」の行動要因指標とで構成される学習用データ11を用いて機械学習が行われる。なお、学習モデル12は、人物データに対して複数の行動要因指標を出力するものでもよく、例えば、人物データに対して「健康志向」、「甘党」及び「車所有」という3つの行動要因指標を出力するものでもよい。その場合には、人物データと、「健康志向」、「甘党」及び「車所有」の行動要因指標とで構成される学習用データ11を用いて機械学習が行われるようにすればよい。
【0050】
なお、機械学習部301により機械学習が行われて記憶部31に記憶される学習モデル12の数や種類は適宜変更してもよく、例えば、機械学習の手法、人物データに含まれるデータの種類、行動要因指標に含まれるデータの種類、人物データに対する前処理の手法等のように、条件が異なる複数の学習モデル12が記憶されてもよい。その場合には、条件が異なる複数の学習モデル12にそれぞれ対応するデータ構成を有する複数の種類の学習用データ11を用いるようにすればよい。
【0051】
機械学習部301は、
図4に示すように、学習モデル12の機械学習を行う各部として、第1の生成処理部301aと、第1の学習処理部301bと、第2の生成処理部301cと、第2の学習処理部301dとを備える。
【0052】
図7は、機械学習部301の一例を示す機能説明図である。以下では、機械学習部301の詳細について、
図7とともに、
図5に示す判定規則データ310、
図6に示す学習用データ11及び学習モデル12を参照しながら説明する。
【0053】
第1の生成処理部301aは、データ取得部300により取得された人物データにて行動が記録された人物が行動要因指標に適合するか否かを判定規則データ310に登録された判定規則に従って人物毎に判定する。第1の生成処理部301aは、その判定結果に基づいて人物データに行動要因指標を付与することで学習用データ11aを生成する。
【0054】
図7の例では、第1の生成処理部301aが、各人物(ユーザA~C)が購買記録に対して規定された判定規則(
図5参照)に従って「健康志向」に適合するか否かを判定し、
その判定結果に基づいて、「ユーザA」の人物データに対して「1:健康志向である」、「ユーザB」の人物データに対して「0:健康志向でない」を行動要因指標(仮の正解ラベル)としてそれぞれ付与することで、学習用データ11aが生成される。なお、購買履歴が十分に記録されていない等の理由により、「健康志向」の判定規則による判定が不可能な「ユーザC」の人物データに対しては、行動要因指標(仮の正解ラベル)が付与されないため、「ユーザC」の人物データに基づく学習用データ11aは生成されない。
【0055】
第1の学習処理部301bは、第1の生成処理部301aにより生成された学習用データ11aを用いて、人物データと行動要因指標との相関関係を学習モデル12aに学習させる。その際、学習用データ11aを構成する人物データには、
図6に示すように、購買履歴だけでなく、ウェブ閲覧履歴、ウェブ検索履歴、移動履歴及びアンケート回答履歴が含まれる。なお、第1の学習処理部301bは、前処理後の学習用データ11aを用いて、人物データ(特徴量)と行動要因指標との相関関係を学習モデル12aに学習させてもよい。
【0056】
第2の生成処理部301cは、第1の学習処理部301bにより相関関係を学習させた学習モデル12aに人物データ(前処理にて人物データから変換された特徴量でもよい)を入力することで学習モデル12aから出力された行動要因指標に対して修正指示を受け付ける。具体的には、第2の生成処理部301cは、上記のように、学習モデル12aから出力された行動要因指標を人物データと対応付けて人物毎に表示させるとともに、作業者10が作業者端末装置5を用いてアノテーション作業を行うことで、その表示させた行動要因指標に対して修正指示を受け付ける。そして、第2の生成処理部301cは、その受付結果に基づいて人物データに行動要因指標を付与することで学習用データ11bを生成する。
【0057】
図7の例では、第2の生成処理部301cが、各人物(ユーザA~C)の人物データを学習モデル12aに入力することで、行動要因指標(推論結果)として、「ユーザA」に対して「0.9」、「ユーザB」に対して「0.6」、「ユーザC」に対して「0.8」が出力されている。第2の生成処理部301cが、学習モデル12aから出力された行動要因指標(推論結果)を人物データに対応付けた評価リストを作業者端末装置5に表示させると、その評価リストを目視した作業者10が、「ユーザB」の人物データを確認し、第1の生成処理部301aにより仮の正解ラベルとして付与された「0:健康志向でない」よりも「1:健康志向である」が適切である判断した場合には、「ユーザB」に対して「1:健康志向である」を付与するように修正指示を行う。また、作業者10が、「ユーザC」の人物データを確認し、「1:健康志向である」よりも「0:健康志向でない」が適切である判断した場合には、「ユーザC」に対して「0:健康志向でない」を付与するように修正指示を行う。そして、第2の生成処理部301cは、それらの修正指示を受け付けて、その受付結果に基づいて、「ユーザB」の人物データに対して「1:健康志向である」、「ユーザC」の人物データに対して「0:健康志向でない」を行動要因指標(修正後の正解ラベル)としてそれぞれ付与することで、学習用データ11bが生成される。
【0058】
なお、前処理後の学習用データ11aに対応する学習モデル12aの機械学習を行う際、第2の生成処理部301cは、第1の学習処理部301bにより相関関係を学習させた学習モデル12aに、前処理にて人物データから変換された特徴量(前処理後の人物データ)を入力することで学習モデル12aから出力された行動要因指標と、人物データに含まれる特徴データに付与された行動特徴指標との少なくとも一方に対して修正指示を受け付けるようにしてもよい。具体的には、第2の生成処理部301cは、上記のように、学習モデル12aから出力された行動要因指標と、人物データに含まれる特徴データに付与された行動特徴指標とを人物データと対応付けて人物毎に表示させるとともに、作業者10が作業者端末装置5を用いてアノテーション作業を行うことで、その表示させた行動要
因指標と、行動特徴指標との少なくとも一方に対して修正指示を受け付ける。そして、第2の生成処理部301cは、その受付結果に基づいて人物データに行動要因指標を付与することで学習用データ11bを生成するとともに、特徴データに付与された行動特徴指標を修正するようにしてもよい。
【0059】
第2の学習処理部301dは、少なくとも第2の生成処理部301cにより生成された学習用データ11bを用いて、人物データと行動要因指標との相関関係を学習モデル12bに学習させる。その際、第2の学習処理部301dは、第2の生成処理部301cにより生成された学習用データ11bだけでなく、第1の生成処理部301aにより生成された学習用データ11a(
図7の例では、「ユーザA」の人物データに基づく学習用データ11a)をさらに用いてもよい。なお、第2の学習処理部301dは、前処理後の学習用データ11bを用いて、人物データ(特徴量)と行動要因指標との相関関係を学習モデル12bに学習させてもよい。
【0060】
機械学習部301は、第2の学習処理部301dが人物データと行動要因指標との相関関係を学習モデル12bに学習させたときに、所定の学習終了条件を満たさない場合には、第2の生成処理部301cが、第1の学習処理部301bに代えて第2の学習処理部301dにより学習させた学習モデル12bに人物データを入力することで学習モデル12bから出力された行動要因指標に対して修正指示を受け付けて、その受付結果に基づいて人物データに行動要因指標を付与することで学習用データ11bを生成する処理と、第2の学習処理部301dが、少なくとも第2の生成処理部301cにより生成された学習用データ11bを用いて学習モデル12bに学習させる処理とを、学習終了条件を満たすまで繰り返し実行するようにしてもよい。学習終了条件を満たすか否かは、例えば、学習モデル12の精度が所定の精度に達したか否か、又は、学習用データ11の数が所定の上限数に達したか否かに応じて判定される。
【0061】
なお、前処理後の学習用データ11bに対応する学習モデル12bの機械学習を行う際、機械学習部301は、第2の学習処理部301dが人物データ(特徴量)と行動要因指標との相関関係を学習モデル12bに学習させたときに、所定の学習終了条件を満たさない場合には、第2の生成処理部301cが、第1の学習処理部301bに代えて第2の学習処理部301dにより学習させた学習モデル12bに、前処理にて人物データから変換された特徴量(前処理後の人物データ)を入力することで学習モデル12bから出力された行動要因指標と、人物データに含まれる特徴データに付与された行動特徴指標との少なくとも一方に対して修正指示を受け付けて、その受付結果に基づいて人物データに行動要因指標を付与することで学習用データ11bを生成するとともに、特徴データに付与された行動特徴指標を修正する処理と、第2の学習処理部301dが、少なくとも第2の生成処理部301cにより生成された学習用データ11bであって前処理後の学習用データ11bを用いて学習モデル12bに学習させる処理とを、学習終了条件を満たすまで繰り返し実行するようにしてもよい。
【0062】
(データ処理装置4)
図8は、データ処理装置4の一例を示すブロック図である。
図9は、データ処理装置4の一例を示す機能説明図である。データ処理装置4は、プロセッサ等により構成される制御部40と、HDD、SSD、メモリ等により構成される記憶部41と、ネットワーク6との通信インターフェースである通信部42と、キーボード、マウス等により構成される入力部43と、ディスプレイ等により構成される表示部44とを備える。なお、入力部43及び表示部44は省略されてもよい。
【0063】
記憶部41は、学習モデル12、及び、データ処理プログラム410を記憶するとともに、オペレーティングシステム、他のプログラム、各種のデータ等を記憶する。記憶部4
1は、学習済みの学習モデル12を記憶する学習済みモデル記憶部として機能する。
【0064】
制御部40は、記憶部41に記憶されたデータ処理プログラム410を実行することにより、データ取得部400、指標付与部401、及び、出力処理部402として機能する。
【0065】
データ取得部400は、例えば、指標付与部401や作業者端末装置5からの要求を受け付けて、通信部42及びネットワーク6を介して人物データベース20にアクセスする。データ取得部400は、人物データベース20から人物データを取得し、指標付与部401に提供したり、記憶部41に記憶したりする。
【0066】
指標付与部401は、記憶部41に記憶された学習済みの学習モデル12に、データ取得部400により取得された人物データ(前処理にて人物データから変換された特徴量でもよい)を入力することで学習モデル12から出力された行動要因指標(推論結果)を人物データに付与する。その際、指標付与部401は、学習モデル12から出力データ(本実施形態では、0~1の範囲の値)として出力された行動要因指標(推論結果)に対する後処理として、行動要因指標の変数の値(
図9では、「0.9」)と、所定の閾値(例えば、「0.5」)とを比較し、閾値以上である場合には、「1:健康志向である」の行動要因指標を人物データに付与し、閾値未満である場合には、「0:健康志向でない」の行動要因指標を人物データに付与する。なお、指標付与部401は、人物データを学習モデル12の入力層120に入力する際、機械学習部301と同様の前処理を行うことで、前処理後の人物データ、すなわち、前処理にて人物データから変換された特徴量を学習モデル12に入力するようにしてもよい。
【0067】
本実施形態では、学習モデル12は、機械学習装置3により行動要因指標の種類毎に生成される場合について説明するため、記憶部41には、行動要因指標の各種類に対応する複数の学習モデル12が記憶されている。
図9に示す学習モデル12は、人物データに対いて「健康志向」の行動要因指標を出力するものである。従って、指標付与部401は、行動要因指標の各種類に対応する複数の学習モデル12に、
図9と同様に、人物データをそれぞれ入力することで出力された「健康志向」以外の行動要因指標についても人物データに付与する。
【0068】
出力処理部402は、指標付与部401により付与された行動要因指標を出力するための出力処理を行う。出力処理部402は、その行動要因指標を、例えば、データベース装置2に提供することで、人物データベース20の行動要因指標テーブルに登録されてもよいし、作業者端末装置5に提供することで、作業者に提示されてもよい。その際、出力処理部402は、指標付与部401による後処理が行われた後の行動要因指標(0又は1)に加えて又は代えて、後処理が行われる前の行動要因指標(0~1の範囲の値)を出力してもよい。
【0069】
なお、記憶部41に記憶される学習モデル12の数は1つに限定されず、例えば、機械学習の手法、人物データに含まれるデータの種類、行動要因指標に含まれるデータの種類、人物データに対する前処理の手法等のように、条件が異なる複数の学習モデル12が記憶され、選択的に利用可能としてもよい。また、学習モデル12は、外部コンピュータ(例えば、サーバ型コンピュータやクラウド型コンピュータ)の記憶部に記憶されていてもよく、その場合には、データ処理装置4は、その外部コンピュータにアクセスすればよい。
【0070】
(機械学習方法)
図10及び
図11は、機械学習装置3による機械学習方法の一例を示すフローチャート
である。以下では、作業者10が、作業者端末装置5を用いてアノテーション作業を含む一連の学習指示操作を行うことで、機械学習装置3が、人物データベース20及び判定規則データ310を参照し、学習モデル12の機械学習を行う場合について説明する。
【0071】
まず、ステップS100にて、作業者端末装置5が、学習モデル12の機械学習を行う学習条件を含む学習指示を作業者10から受け付けると、ステップS101にて、その学習指示を機械学習装置3に送信する。学習条件としては、例えば、学習用データ11を生成するための人物データを人物データベース20から取得するときの人物データ取得条件や学習終了条件が指定される。
【0072】
次に、ステップS110にて、機械学習装置3が、ステップS101で送信された学習モデル12の学習指示を受信すると、データ取得部300が、その学習指示に含まれる学習モデル12の学習条件を満たす人物データを取得するために、人物データベース20にアクセスし、複数人の人物に対応する複数の人物データを取得する。
【0073】
次に、ステップS120にて、第1の生成処理部301aが、ステップS110で取得された複数の人物データに対して、各人物の行動が行動要因指標に適合するか否かを判定規則データ310に登録された判定規則に従って人物毎に判定する。そして、ステップS121にて、第1の生成処理部301aが、その判定結果に基づいて、人物データに行動要因指標を人物毎に付与することで、複数組の学習用データ11aを生成する。
【0074】
次に、ステップS130にて、第1の学習処理部301bが、ステップS121で生成された複数組の学習用データ11a(前処理後の学習用データ11aでもよい)を用いて、人物データと行動要因指標との相関関係を学習モデル12aに学習させる。
【0075】
次に、ステップS140にて、第2の生成処理部301cは、ステップS110で取得された複数の人物データを、ステップS130で学習させた学習モデル12aにそれぞれ入力し、その推論結果として学習モデル12aからそれぞれ出力された行動要因指標を人物データと対応付けて、人物データと行動要因指標とからなる評価リストを作成する。そして、ステップS141にて、第2の生成処理部301cは、その評価リストを作業者端末装置5に送信する。
【0076】
次に、ステップS142にて、作業者端末装置5が、ステップS141で送信された評価リストを受信すると、その評価リストを作業者端末装置5の表示画面に表示させる。その際、作業者端末装置5は、作業者10がアノテーション作業を行うための参考情報として、評価リストに表示された人物に対応する人物データを作業者端末装置5の表示画面に表示させる。
【0077】
なお、表示画面には、例えば、人物データに含まれる購買履歴、ウェブ閲覧履歴、ウェブ検索履歴、移動履歴及びアンケート回答履歴が表示されてもよく、さらに、各履歴に関連付けられた特徴データ(本実施形態では、商品、店舗、ウェブサイト、地点、地域)と、その特徴データに付与された行動特徴指標(本実施形態では、商品指標、店舗指標、ウェブサイト指標、地点指標、地域指標)とが表示されてもよい。例えば、各人物が購入した商品の一覧や各商品の商品属性が表示され、商品属性の一部として、その商品に現在付与されている商品指標(例えば、「高級志向」等)が表示されてもよい。また、表示画面には、人物データの生データだけでなく、人物データに対して所定の統計処理が行われた情報が表示されてもよいし、作業者10の操作に基づいて表示の内容や統計処理の内容が変更可能であってもよい。また、表示画面の評価リストには、ステップS140での学習モデル12aによる推論結果だけでなく、ステップS120での判定規則による判定結果が表示されてもよい。
【0078】
そして、ステップS143にて、作業者端末装置5が、その表示画面において行動要因指標に対する修正指示を作業者10から受け付けると、ステップS144にて、その修正指示を機械学習装置3に送信する。
図11の例では、作業者10のアノテーション作業として、
図7と同様に、「ユーザB」に対して「1:健康志向である」を付与する修正指示と、「ユーザC」に対して「0:健康志向でない」を付与する修正指示とが、作業者端末装置5により受け付けられた場合が示されている。
【0079】
次に、ステップS145にて、第2の生成処理部301cが、ステップS144で送信された修正指示を受信することにより、ステップS140で出力された行動要因指標に対して修正指示を受け付けると、その受付結果に基づいて人物データに行動要因指標を付与することで、複数組の学習用データ11bを生成する。なお、作業者端末装置5は、表示画面において、行動特徴指標に対する修正指示を作業者10から受け付けてもよく、その場合には、第2の生成処理部301cは、その受付結果に基づいて、人物データベース20に登録された特徴データにおける行動特徴指標を修正することで、人物データベース20を更新(修正)すればよい。行動特徴指標(ここでは、商品指標)に対する修正指示は、例えば、「高級志向」の行動特徴指標が現在付与されている商品に対して、「健康使用」の商品指標を追加で付与するものでもよいし、「高級志向」の商品指標を削除したりするものでもよい。
【0080】
次に、ステップS150にて、第2の学習処理部301dは、ステップS145で生成された学習用データ11b(前処理後の学習用データ11bでもよい)を用いて、人物データと行動要因指標との相関関係を学習モデル12bに学習させる。その際、第2の学習処理部301dは、ステップS145で生成された学習用データ11bだけでなく、ステップS121で生成された学習用データ11aをさらに用いてもよい。なお、人物データベース20が、行動特徴指標に対する修正指示に基づいて更新された場合には、更新後の人物データベース20が反映された状態で、学習用データ11bに対する前処理が行われる。
【0081】
次に、ステップS160にて、機械学習部301が、第2の学習処理部301dが人物データと行動要因指標との相関関係を学習モデル12bに学習させたときに、所定の学習終了条件を満たすか否かを判定する。
【0082】
そして、機械学習部301が、所定の学習終了条件を満たさないと判定した場合には(ステップS160で「No」)、ステップS140に戻る。その際、ステップS140にて、第2の生成処理部301cは、ステップS110で取得された複数の人物データを、ステップS130で第1の学習処理部301bにより学習させた学習モデル12aに代えて、ステップS150で第2の学習処理部301dにより学習させた学習モデル12bにそれぞれ入力することで、機械学習部301は、以降の処理(ステップS140~S150)を、ステップS160にて学習終了条件を満たすと判定するまで繰り返し実行する。
【0083】
一方、機械学習部301が、所定の学習終了条件を満たすと判定した場合には(ステップS160で「Yes」)、ステップS170にて、そのときの学習モデル12bを、学習済みの学習モデル12として、記憶部31に記憶する。これにより、
図10及び
図11に示す一連の処理が終了する。機械学習方法において、ステップS110がデータ取得工程、ステップS120~S160が機械学習工程、ステップS170が学習済みモデル記憶工程に相当する。
【0084】
なお、上記では、作業者端末装置5が、作業者10から学習指示を受け付けたときに、
図10及び
図11に示す一連の処理が実行されるものとして説明したが、機械学習装置3
が、所定の実行条件(例えば、前回の実行時から一定時間経過時や人物データベース20の更新時等)を満たすときと判断したときに、
図10及び
図11に示す一連の処理を実行するようにしてもよい。また、上記では、機械学習部301が、所定の学習終了条件を満たさないと判定した場合には(ステップS160で「No」)、ステップS140に戻るものとして説明したが、ステップS120に戻るようにしてもよいし、作業者10の指示や機械学習部301の判断に基づいて、ステップS120に戻るか、ステップS140に戻るかを切り替えるようにしてもよい。そして、ステップS120に戻る場合には、作業者10が、例えば、行動要因指標の判定規則を変更してもよく、機械学習部301は、変更後の判定規則に基づいて、ステップS120以降の処理を実行すればよい。
【0085】
以上のように、本実施形態に係る機械学習装置3及び機械学習方法によれば、1又は複数の観点に基づいて人物の行動を記録した人物データに基づいて、その人物が行動を起こす動機となる要因を示す行動要因指標を推定可能な学習モデル12を提供することができる。よって、この学習モデル12をデータ処理装置4が利用することにより、人物(ユーザ)に対して個人情報の入力を要求することなく、その人物に内在する行動要因指標を適切に付与(推論)することできる。
【0086】
また、機械学習部301が、判定規則による判定結果に基づいて生成された学習用データ11aを用いて機械学習を行い、行動要因指標に対する修正指示の受付結果に基づいて生成された学習用データ11bを用いて機械学習を段階的に行うことで、人物データと行動要因指標との相関関係を学習モデル12に学習させる。そのため、判定規則による学習用データ11aの自動生成と、作業者10のアノテーション作業による学習用データ11bの修正とを介して、学習モデル12の機械学習が段階的に行われるので、作業者10のアノテーション作業の作業負担を軽減しながら、高精度な学習モデル12を生成することができる。
【0087】
さらに、機械学習部301が、行動特徴指標に対する修正指示の受付結果に基づいて、人物データベース20における特徴データに付与された行動特徴指標の更新を行うことで、更新後の人物データベース20が反映された状態で機械学習を行う。そのため、作業者10のアノテーション作業による行動特徴指標の修正を介して、人物データに含まれる特徴データに付与された行動特徴指標の正確性が向上されるので、より高精度な学習モデル12を生成することができる。
【0088】
(データ処理方法)
図12は、データ処理装置4によるデータ処理方法の一例を示すフローチャートである。以下では、作業者10が、作業者端末装置5を用いてタグ付与指示操作を行うことで、データ処理装置4が、人物データベース20及び学習済みの学習モデル12を参照し、人物データに対して行動要因指標を付与する場合について説明する。
【0089】
まず、ステップS200にて、作業者端末装置5が、行動要因指標を付与する際の付与条件を含む付与指示を作業者10から受け付けると、ステップS201にて、その付与指示を機械学習装置3に送信する。付与条件としては、例えば、行動要因指標を付与する対象となる人物データを人物データベース20から取得するときの人物データ取得条件が指定される。
【0090】
次に、ステップS210にて、データ処理装置4が、ステップS201で送信された行動要因指標の付与指示を受信すると、データ取得部400が、その付与指示に含まれる行動要因指標の付与条件を満たす人物データを取得するために、人物データベース20にアクセスし、例えば、複数人の人物に対応する複数の人物データを取得する。
【0091】
次に、ステップS220にて、指標付与部401が、ステップS110で取得された複数の人物データを学習モデル12にそれぞれ入力し、その推論結果として学習モデル12からそれぞれ出力された行動要因指標を人物データにそれぞれ付与する。
図12の例では、指標付与部401により、行動要因指標の変数の値と、所定の閾値との比較に基づく後処理が行われた「健康志向」の行動要因指標として、「ユーザP」及び「ユーザR」に対して「1:健康志向である」が付与され、「ユーザQ」に対して「0:健康志向でない」が付与された場合の付与リストが示されている。なお、付与リストには、指標付与部401による後処理が行われた後の行動要因指標(0又は1)に加えて又は代えて、後処理が行われる前の行動要因指標(0~1の範囲の値)が含まれていてもよい。
【0092】
次に、ステップS230にて、出力処理部402が、ステップS220で人物データに付与された行動要因指標(
図12の付与リスト)を、例えば、データベース装置2に提供することで、人物データベース20の行動要因指標テーブルに登録される。これにより、
図12に示す一連の処理が終了する。データ処理方法において、ステップS210がデータ取得工程、ステップS220が指標付与工程、ステップS230が出力処理工程に相当する。
【0093】
なお、上記では、作業者端末装置5が、作業者10から付与指示を受け付けたときに、
図12に示す一連の処理が実行されるものとして説明したが、データ処理装置4が、所定の実行条件(例えば、前回の実行時から一定時間経過時や人物データベース20の更新時等)を満たすときと判断したときに、
図12に示す一連の処理を実行するようにしてもよい。
【0094】
以上のように、本実施形態に係るデータ処理装置4及びデータ処理方法によれば、人物(ユーザ)に対して個人情報の入力を要求することなく、その人物に内在する行動要因指標を適切に付与(推論)することできる。そして、各人物に対してそれぞれ付与された行動要因指標は、所定の統計処理や可視化処理等により加工されることで、各種のサービス(商品企画、商品開発、生産管理、仕入れ・発注管理、販売戦略策定、マーケティング、広告等)にて利用することができる。
【0095】
(他の実施形態)
本発明は上述した実施形態に制約されるものではなく、本発明の主旨を逸脱しない範囲内で種々変更して実施することが可能である。そして、それらはすべて、本発明の技術思想に含まれるものである。
【0096】
上記実施形態では、データベース装置2、機械学習装置3及びデータ処理装置4は、別々の装置で構成されたものとして説明したが、それら3つの装置が、単一の装置で構成されていてもよいし、それら3つの装置のうち任意の2つの装置が、単一の装置で構成されていてもよい。また、機械学習装置3及びデータ処理装置4の少なくとも一方は、作業者端末装置5に組み込まれていてもよい。
【0097】
上記実施形態では、機械学習部301による機械学習を実現する学習モデルとして、ニューラルネットワークを採用した場合について説明したが、他の機械学習のモデルを採用してもよい。他の機械学習のモデルとしては、例えば、決定木、回帰木等のツリーモデル、バギング、ブースティング等のアンサンブル学習モデル、再帰型ニューラルネットワーク、畳み込みニューラルネットワーク、LSTM等のニューラルネットモデル(ディープ
ラーニングを含む)、階層型クラスタリング、非階層型クラスタリング、k近傍法、k平
均法等のクラスタリングモデル、主成分分析、因子分析、ロジスティク回帰等の多変量解析モデル、サポートベクターマシン等が挙げられる。
【0098】
(推論装置、推論方法又は推論プログラム)
本発明は、上記実施形態に係るデータ処理装置4(データ処理方法又はデータ処理プログラム)の態様によるもののみならず、推論装置(推論方法又は推論プログラム)の態様で提供することもできる。その場合、推論装置(推論方法又は推論プログラム)としては、メモリと、プロセッサとを含み、このうちのプロセッサが、一連の処理を実行するものとすることができる。当該一連の処理とは、人物データを取得するデータ取得処理(データ取得工程)と、データ取得処理にて人物データを取得すると、当該人物データに対して行動要因指標を推論する推論処理(推論工程)とを含む。
【0099】
推論装置(推論方法又は推論プログラム)の態様で提供することで、データ処理装置4を実装する場合に比して簡単に種々の装置への適用が可能となる。推論装置(推論方法又は推論プログラム)が行動要因指標を推論する際、上記実施形態に係る機械学習装置3及び機械学習方法により生成された学習済みの学習モデルを用いて、指標付与部が実施する推論手法を適用してもよいことは、当業者にとって当然に理解され得るものである。
【符号の説明】
【0100】
1…人物情報管理システム、2…データベース装置、3…機械学習装置、
4…データ処理装置、5…作業者端末装置、6…ネットワーク、
10…作業者、11、11a、11b…学習用データ、
12、12a、12b…学習モデル、20…人物データベース、
30…制御部、31…記憶部、32…通信部、33…入力部、34…表示部、
40…制御部、41…記憶部、42…通信部、43…入力部、44…表示部、
120…入力層、121…中間層、122…出力層、
300…データ取得部、301…機械学習部、
301a…第1の生成処理部、301b…第1の学習処理部、
301c…第2の生成処理部、301d…第2の学習処理部、
310…判定規則データ、311…機械学習プログラム、
400…データ取得部、401…指標付与部、402…出力処理部、
410…データ処理プログラム