IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社エクサウィザーズの特許一覧

<>
  • 特許-情報処理方法、装置及びプログラム 図1
  • 特許-情報処理方法、装置及びプログラム 図2
  • 特許-情報処理方法、装置及びプログラム 図3
  • 特許-情報処理方法、装置及びプログラム 図4
  • 特許-情報処理方法、装置及びプログラム 図5
  • 特許-情報処理方法、装置及びプログラム 図6
  • 特許-情報処理方法、装置及びプログラム 図7
  • 特許-情報処理方法、装置及びプログラム 図8
  • 特許-情報処理方法、装置及びプログラム 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2022-06-02
(45)【発行日】2022-06-10
(54)【発明の名称】情報処理方法、装置及びプログラム
(51)【国際特許分類】
   G06Q 50/10 20120101AFI20220603BHJP
   G06Q 10/10 20120101ALI20220603BHJP
【FI】
G06Q50/10
G06Q10/10 322
【請求項の数】 6
(21)【出願番号】P 2021171210
(22)【出願日】2021-10-19
【審査請求日】2022-02-02
【早期審査対象出願】
(73)【特許権者】
【識別番号】517255566
【氏名又は名称】株式会社エクサウィザーズ
(72)【発明者】
【氏名】シャイク・カジャ・モヒディン
【審査官】永野 一郎
(56)【参考文献】
【文献】特開2016-219042(JP,A)
【文献】特開2005-165632(JP,A)
【文献】特開2021-56643(JP,A)
【文献】特開2008-77386(JP,A)
【文献】米国特許出願公開第2019/0244308(US,A1)
【文献】米国特許出願公開第2013/0325879(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
情報処理装置がユーザに対象をレコメンドする情報処理方法であって、
複数のユーザのユーザ情報と、前記複数のユーザの行動履歴情報と、カテゴリカルデータを含む複数の対象の対象情報と、を取得する取得処理と、
前記複数のユーザの行動履歴情報と、前記複数の対象の対象情報と、に基づいて、前記カテゴリカルデータの値間の類似度を算出する類似度算出処理と、
一のユーザの前記行動履歴情報と、前記複数の対象の対象情報と、に基づいて、前記一のユーザのユーザ情報に前記カテゴリカルデータを追加し、前記一のユーザのカテゴリカルデータを前記類似度に基づいて補正する加工処理と、
前記一のユーザのユーザ情報と、前記複数の対象の対象情報と、に基づいて、前記一のユーザに対する各対象の推薦度を算出する推薦度算出処理と、
前記各対象の推薦度に基づいて、前記一のユーザに対象をレコメンドするレコメンド処理と、
を含む情報処理方法。
【請求項2】
前記一のユーザに対する一の対象の前記推薦度は、前記一のユーザの対象情報に含まれる前記カテゴリカルデータと、前記一の対象の対象情報に含まれる前記カテゴリカルデータと、の内積に基づいて算出される
請求項1に記載の情報処理方法。
【請求項3】
前記カテゴリカルデータの値間の類似度は、ユーザごとに算出された、値間の頻度の類似度に基づいて算出される
請求項1又は請求項2に記載の情報処理方法。
【請求項4】
前記カテゴリカルデータは、地域、業種、年齢、性別、又は雇用形態である
請求項1から請求項3までのいずれかに記載の情報処理方法。
【請求項5】
ユーザに対象をレコメンドする情報処理装置であって、
複数のユーザのユーザ情報と、前記複数のユーザの行動履歴情報と、カテゴリカルデータを含む複数の対象の対象情報と、を取得する取得部と、
前記複数のユーザの行動履歴情報と、前記複数の対象の対象情報と、に基づいて、前記カテゴリカルデータの値間の類似度を算出する類似度算出部と、
一のユーザの前記行動履歴情報と、前記複数の対象の対象情報と、に基づいて、前記一のユーザのユーザ情報に前記カテゴリカルデータを追加し、前記一のユーザのカテゴリカルデータを前記類似度に基づいて補正する加工部と、
前記一のユーザのユーザ情報と、前記複数の対象の対象情報と、に基づいて、前記一のユーザに対する各対象の推薦度を算出する推薦度算出部と、
前記各対象の推薦度に基づいて、前記一のユーザに対象をレコメンドするレコメンド部と、
を備える情報処理装置。
【請求項6】
情報処理装置に、
複数のユーザのユーザ情報と、前記複数のユーザの行動履歴情報と、カテゴリカルデータを含む複数の対象の対象情報と、を取得する取得処理と、
前記複数のユーザの行動履歴情報と、前記複数の対象の対象情報と、に基づいて、前記カテゴリカルデータの値間の類似度を算出する類似度算出処理と、
一のユーザの前記行動履歴情報と、前記複数の対象の対象情報と、に基づいて、前記一のユーザのユーザ情報に前記カテゴリカルデータを追加し、前記一のユーザのカテゴリカルデータを前記類似度に基づいて補正する加工処理と、
前記一のユーザのユーザ情報と、前記複数の対象の対象情報と、に基づいて、前記一のユーザに対する各対象の推薦度を算出する推薦度算出処理と、
前記各対象の推薦度に基づいて、前記一のユーザに対象をレコメンドするレコメンド処理と、
を含む情報処理方法を実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理方法、装置及びプログラムに関する。
【背景技術】
【0002】
引用文献1には、求職者の職業適性に合った求人情報を提供する求人求職情報提供装置が記載されている。この装置によれば、求職者がブログサイト上などで公表した内容等に基づいて、その求職者に適した業種及び職種を推定し、それに対応する求人情報を求職者に提示することができる。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2013-186813号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
上記従来技術では、求職者の情報が少ない場合、適切な求人情報を求職者に提示することが困難である。
【0005】
本発明は、上記の課題を鑑みてなされたものであり、ユーザ情報が少ない場合であってもユーザに対象を適切にレコメンドすることを目的とする。
【課題を解決するための手段】
【0006】
一実施形態に係る情報処理方法は、複数のユーザのユーザ情報と、前記複数のユーザの行動履歴情報と、カテゴリカルデータ数を含む複数の対象の対象情報と、を取得する取得処理と、前記複数のユーザの行動履歴情報と、前記複数の対象の対象情報と、に基づいて、前記カテゴリカルデータの値間の類似度を算出する類似度算出処理と、一のユーザの前記行動履歴情報と、前記複数の対象の対象情報と、に基づいて、前記一のユーザのユーザ情報に前記カテゴリカルデータを追加し、前記一のユーザのカテゴリカルデータを前記類似度に基づいて補正する加工処理と、前記一のユーザのユーザ情報と、前記複数の対象の対象情報と、に基づいて、前記一のユーザに対する各対象の推薦度を算出する推薦度算出処理と、前記各対象の推薦度に基づいて、前記一のユーザに対象をレコメンドするレコメンド処理と、を含む。
【発明の効果】
【0007】
一実施形態によれば、ユーザ情報が少ない場合であってもユーザに対象を適切にレコメンドすることができる。
【図面の簡単な説明】
【0008】
図1】情報処理システムの構成の一例を示す図である。
図2】情報処理装置のハードウェア構成の一例を示す図である。
図3】情報処理装置の機能構成の一例を示す図である。
図4】ユーザ情報の一例を示す図である。
図5】対象情報の一例を示す図である。
図6】行動履歴情報の一例を示す図である。
図7】サーバが実行する処理の一例を示すフローチャートである。
図8】サーバが実行する処理の具体例を示す図である。
図9】類似度の算出方法の具体例を説明する図である。
【発明を実施するための形態】
【0009】
以下、本発明の各実施形態について、添付の図面を参照しながら説明する。なお、各実施形態に係る明細書及び図面の記載に関して、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複した説明を省略する。
【0010】
<システム概要>
まず、本実施形態に係る情報処理システムの概要について説明する。本実施形態に係る情報処理システムは、カテゴリカルデータを利用してユーザに対象を適切にレコメンドするレコメンドシステムである。レコメンドシステムは、ユーザに対象をレコメンド(マッチング)するサービスを提供する。ユーザは、レコメンドシステムを利用して対象のレコメンドを受ける人であり、レコメンドサービスの利用者である。対象は、レコメンドシステム上でユーザに対してレコメンドされるものであり、ユーザにレコメンド可能な任意のものであり得る。対象は、例えば、仕事、人、旅行プラン、車、雑貨、家電、食料品、店舗、記事、音楽、動画、又は画像であるが、これに限られない。カテゴリカルデータ(カテゴリカル変数)は、予め設定された分類的な値(離散値)をとるデータである。カテゴリかるデータは、例えば、地域、業種、年齢、性別、又は雇用形態であるが、これに限られない。本実施形態において、カテゴリカルデータは、対象情報に含まれる。なお、対象情報については後述する。
【0011】
図1は、本実施形態に係る情報処理システムの構成の一例を示す図である。図1に示すように、本実施形態に係る情報処理システムは、ネットワークNを介して相互に通信可能に接続された、ユーザ端末1と、登録者端末2と、サーバ3と、を備える。ネットワークNは、例えば、有線LAN(Local Area Network)、無線LAN、インターネット、公衆回線網、モバイルデータ通信網、又はこれらの組み合わせである。図1の例では、情報処理システムは、ユーザ端末1、登録者端末2及びサーバ3を1つずつ備えるが、それぞれ複数備えてもよい。
【0012】
ユーザ端末1は、ユーザが利用する情報処理装置である。ユーザ端末1は、例えば、PC(Personal Computer)、スマートフォン、又はタブレット端末であるが、これに限られない。ユーザは、ユーザ端末1を介して自身のユーザ情報321を登録する。また、ユーザは、ユーザ端末1に対象情報322を表示して、登録された対象の中から所望の条件に一致する対象を検索したり、サーバ3からレコメンドされた対象を確認したりすることにより、自身にとって適切な対象を探す。また、ユーザは、ユーザ端末1を介して、自身にとって適切と判断した対象に申し込みを送る(マッチングを依頼する)。
【0013】
登録者端末2は、ユーザにレコメンドされる対象を登録する登録者が利用する情報処理装置である。登録者端末2は、例えば、PC、スマートフォン、又はタブレット端末であるが、これに限られない。登録者は、登録者端末2を介して、対象情報322を登録する。また、登録者は、登録者端末2を介して、自身が登録した対象に対するユーザからの申し込みの通知を受ける。
【0014】
サーバ3は、ユーザに対象をレコメンドする情報処理装置である。サーバ3は、ユーザ端末1及び登録者端末2からそれぞれ受信したユーザ情報321及び対象情報322を記憶する。また、サーバ3は、ユーザ端末1からの要求に応じて対象情報322をユーザ端末1に送信する。また、サーバ3は、対象に対する申し込みをユーザ端末1から受け付け、その旨を対応する登録者端末2に通知する。また、サーバ3は、ユーザ情報321及び対象情報322に基づいて、ユーザにとって適切な対象を選択し、選択した対象の対象情報322をユーザ端末1に送信することにより、ユーザにとって適切な対象をユーザにレコメンドする。
【0015】
<ハードウェア構成>
次に、情報処理装置100のハードウェア構成について説明する。図2は、情報処理装置100のハードウェア構成の一例を示す図である。図2に示すように、情報処理装置100は、バスBを介して相互に接続された、プロセッサ101と、メモリ102と、ストレージ103と、通信I/F104と、入出力I/F105と、ドライブ装置106と、を備える。
【0016】
プロセッサ101は、ストレージ103に記憶されたプログラムをメモリ102に展開して実行することにより、情報処理装置100の各構成を制御し、情報処理装置100の機能を実現する。プロセッサ101がレコメンドプログラムを実行することにより、本実施形態に係るサーバ3が実現される。プロセッサ101は、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)、ASIC(Application Specific Integrated Circuit)、DSP(Digital Signal Processor)、又はこれらの組み合わせである。
【0017】
メモリ102は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)、又はこれらの組み合わせである。ROMは、例えば、PROM(Programmable ROM)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、又はこれらの組み合わせである。RAMは、例えば、DRAM(Dynamic RAM)、SRAM(Static RAM)、MRAM(Magnetoresistive RAM)、又はこれらの組み合わせである。
【0018】
ストレージ103は、OS、レコメンドプログラム及び各種のデータを記憶する。ストレージ103は、例えば、フラッシュメモリ、HDD(Hard Disk Drive)、SSD(Solid State Drive)、SCM(Storage Class Memories)、又はこれらの組み合わせである。
【0019】
通信I/F104は、情報処理装置100を、ネットワークNを介して外部装置に接続し、通信を制御するためのインタフェースである。通信I/F104は、例えば、Bluetooth(登録商標)、Wi-Fi(登録商標)、ZigBee(登録商標)、Ethernet(登録商標)、又は光通信(例えば、Fibre Channel)に準拠したアダプタであるが、これに限られない。
【0020】
入出力I/F105は、情報処理装置100に入力装置107及び出力装置108を接続するためのインタフェースである。入力装置107は、例えば、マウス、キーボード、タッチパネル、マイク、スキャナ、カメラ、各種センサ、操作ボタン、又はこれらの組み合わせである。出力装置108は、例えば、ディスプレイ、プロジェクタ、プリンタ、スピーカ、バイブレータ、又はこれらの組み合わせである。
【0021】
ドライブ装置106は、ディスクメディア109のデータを読み書きする。ドライブ装置106は、例えば、磁気ディスクドライブ、光学ディスクドライブ、光磁気ディスクドライブ、又はこれらの組み合わせである。ディスクメディア109は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、FD(Floppy Disk)、MO(Magneto-Optical disk)、BD(Blu-ray(登録商標) Disc)、又はこれらの組み合わせである。
【0022】
なお、本実施形態において、レコメンドプログラムは、サーバ3の製造段階でメモリ102又はストレージ103に書き込まれてもよいし、ネットワークNを介してサーバ3に提供されてもよいし、ディスクメディア109などの非一時的でコンピュータ読み取り可能な記録媒体を介してサーバ3に提供されてもよい。
【0023】
<機能構成>
次に、サーバ3の機能構成について説明する。図3は、サーバ3の機能構成の一例を示す図である。図3に示すように、サーバ3は、通信部31と、記憶部32と、制御部33と、を備える。
【0024】
通信部31は、通信I/F104により実現される。通信部31は、ネットワークNを介して、ユーザ端末1及び登録者端末2との間で情報の送受信を行う。通信部31は、ユーザ端末1及び登録者端末2からユーザ情報321及び対象情報322をそれぞれ受信する。また、通信部31は、ユーザ端末1に対象情報を送信する。
【0025】
記憶部32は、メモリ102及びストレージ103により実現される。記憶部32は、ユーザ情報321、対象情報322及び行動履歴情報323を記憶する。
【0026】
ユーザ情報321は、ユーザに関する情報である。ユーザ情報321は、例えば、ユーザ端末1を介してユーザにより登録される。記憶部32には、複数のユーザのユーザ情報321が記憶される。図4は、ユーザ情報321の一例を示す図である。図4のユーザ情報321は、情報項目として「UID」、「年齢」及び「性別」を有する。「UID」は、ユーザの識別情報である。「年齢」は、ユーザの年齢である。「性別」は、ユーザの性別である。「年齢」及び「性別」は、カテゴリカルデータに相当する。図4の例では、例えば、「UID」がU001であるユーザの「年齢」は18であり、「性別」はM(男性)である。これは、ユーザU001が18歳の男性であることを示している。なお、ユーザ情報321は、図4の例に限られない。ユーザ情報321は、図4の情報項目の一部を含んでもよいし、図4に記載された以外の情報項目(生年月日、血液型、業種、職種、勤務先、年収、住所、電話番号、配偶者有無など)を含んでもよい。
【0027】
対象情報322は、対象に関する情報である。対象情報322は、例えば、登録者端末2を介して登録者により登録される。記憶部32には、複数の対象の対象情報322が記憶される。図5は、対象情報322の一例を示す図である。図5は、対象が「仕事」である場合の対象情報322である。図5の対象情報322は、情報項目として「JID」、「業種」及び「地域」を有する。「JID」は、仕事(対象)の識別情報である。「業種」は、仕事の業種である。「地域」は、勤務する地域である。「業種」及び「地域」は、カテゴリカルデータに相当する。図5の例では、例えば、「JID」がJ001である仕事(対象)の「業種」は飲食業であり、「地域」は東京である。これは、求人されている仕事が都内の飲食店であることを示している。なお、対象情報322は、図5の例に限られない。対象情報322は、図5の情報項目の一部を含んでもよいし、図5に記載された以外の情報項目(雇用形態、勤務時間、賃金、シフトなど)を含んでもよい。
【0028】
行動履歴情報323は、情報処理システムにより提供されるオンラインサービス上での対象に対するユーザの行動に関する情報である。ユーザの行動は、例えば、閲覧、申し込み、評価、又はメッセージの送信であるが、これに限られない。行動履歴情報323は、例えば、ユーザが行動するたびに記録される。記憶部32には、複数のユーザの行動履歴情報323が記憶される。記憶部32には、各ユーザについて、複数種類の行動の行動履歴情報323がそれぞれ記録されてもよい。図6は、行動履歴情報323の一例を示す図である。図6は、対象が「仕事」であり、行動が「対象情報の閲覧」である場合の行動履歴情報323である。図6の行動履歴情報323は、情報項目として「J001」、「J002」及び「J003」を有する。「J001」、「J002」及び「J003」は、それぞれ仕事J001,J002,J003の対象情報322を閲覧した回数である。図6の例では、例えば、「UID」がU001であるユーザの「J001」は1であり、「J002」は0であり、「J003」は2である。これは、ユーザU001が仕事J001の対象情報322を1回閲覧し、仕事J002の対象情報322を0回閲覧し、仕事J003の対象情報322を2回閲覧したことを示している。なお、行動履歴情報323は、図6の例に限られない。行動履歴情報323は、図6の情報項目の一部を含んでもよいし、図6に記載された以外の情報項目を含んでもよい。
【0029】
制御部33は、プロセッサ101がメモリ102からプログラムを読み出して実行し、他のハードウェア構成と協働することにより実現される。制御部33は、サーバ3の動作全体を制御する。制御部33は、取得部331と、類似度算出部332と、加工部333と、推薦度算出部334と、レコメンド部335と、を備える。
【0030】
取得部331は、通信部31を介して、外部装置から各種の情報を取得する。具体的には、取得部331は、複数のユーザ端末1から複数のユーザのユーザ情報321を取得する。また、取得部331は、複数の登録者端末2から複数の対象の対象情報322を取得する。また、取得部331は、複数のユーザ端末1によるサーバ3へのアクセスログから複数のユーザの行動履歴情報323を取得する。取得部331は、1つのユーザ端末1から複数のユーザのユーザ情報321を取得してもよいし、1つの登録者端末2から複数の対象の対象情報322を取得してもよい。
【0031】
類似度算出部332は、複数のユーザの行動履歴情報323と、複数の対象の対象情報322と、に基づいて、対象情報322に含まれるカテゴリカルデータの値間の類似度を算出する。また、類似度算出部332は、複数のユーザの行動履歴情報323と、複数のユーザのユーザ情報321と、に基づいて、ユーザ情報321に含まれるカテゴリカルデータの値間の類似度を算出してもよい。類似度の算出方法について、詳しくは後述する。
【0032】
加工部333は、ユーザ情報321及び対象情報322を加工する。具体的には、加工部333は、一のユーザの行動履歴情報323と、複数の対象の対象情報322と、に基づいて、一のユーザのユーザ情報321に対象情報322に含まれるカテゴリカルデータを追加し、一のユーザのユーザ情報321に追加されたカテゴリカルデータを類似度に基づいて補正する。また、加工部333は、一のユーザの行動履歴情報323と、複数のユーザのユーザ情報321と、に基づいて、一の対象の対象情報322にユーザ情報321に含まれるカテゴリカルデータを追加し、一の対象の対象情報322に追加されたカテゴリカルデータを類似度に基づいて補正してもよい。加工部333によるユーザ情報321及び対象情報322の加工方法について、詳しくは後述する。
【0033】
推薦度算出部334は、一のユーザのユーザ情報321と、複数の対象の対象情報322と、に基づいて、一のユーザに対する各対象の推薦度Rを算出する。また、推薦度算出部334は、一の対象の対象情報322と、複数のユーザのユーザ情報321と、に基づいて、一のユーザに対する各対象の推薦度Rを算出してもよい。推薦度Rの算出方法について、詳しくは後述する。
【0034】
レコメンド部335は、一のユーザに対して算出された各対象の推薦度Rに基づいて、一のユーザに対象をレコメンドする。レコメンド方法について、詳しくは後述する。
【0035】
<サーバ装置が実行する処理>
次に、サーバ3が実行する処理について説明する。図7は、サーバ3が実行する処理の一例を示すフローチャートである。図8は、サーバ3が実行する処理の具体例を示す図である。図8の例では、対象は仕事である。図9は、類似度の算出方法の具体例を説明する図である。
【0036】
(ステップS101)
取得部331は、複数のユーザのユーザ情報321、複数の対象の対象情報322及び複数のユーザの行動履歴情報323を取得し、記憶部32に保存する。図8の例では、記憶部32には、ユーザU001,U002,U003のユーザ情報321と、仕事J001,J002,J003の対象情報322と、ユーザU001,U002,U003の行動履歴情報323と、が記憶されている。取得部331は、ユーザ情報321、対象情報322、及び行動履歴情報323を任意のタイミングで取得し得る。
【0037】
(ステップS102)
類似度算出部332は、複数のユーザの行動履歴情報323と、複数の対象の対象情報322と、に基づいて、対象情報322に含まれるカテゴリカルデータの値間の類似度Sを算出し、記憶部32に保存する。類似度算出部332は、類似度Sを任意のタイミングで算出し得る。類似度算出部332は、例えば、以下の方法で類似度Sを算出する。
【0038】
まず、類似度算出部332は、対象情報322に含まれるカテゴリカルデータの値の頻度(登場回数)を、行動履歴情報323に基づいて、ユーザごとに集計する。図9の例では、対象情報322に含まれるカテゴリカルデータである「地域」の値(東京、神奈川、千葉)の頻度が、各仕事の閲覧回数に基づいて、ユーザごとに集計されている。例えば、ユーザU001による仕事J001の閲覧回数は1であり、仕事J001の「地域」は「東京」である。よって、ユーザU001の「東京」の値の頻度は1となっている。
【0039】
次に、類似度算出部332は、ユーザごとに、値間の頻度の類似度sを算出する。類似度sとは、各値の間で頻度が似ている度合いのことである。頻度が近いほど、類似度sは高くなる。図9に示すように、類似度sは、行列の形式で表現される。
【0040】
例えば、図9の例では、ユーザU002の「神奈川」及び「千葉」の頻度は同じ(いずれも1)であるため、ユーザU002の「神奈川」及び「千葉」の頻度の類似度sは高くなる。一方、ユーザU002の「東京」及び「千葉」の頻度は異なる(2と1)ため、ユーザU002の「東京」及び「千葉」の頻度の類似度sは低くなる。これは、ユーザU002から見て、「神奈川」と「千葉」は似ており(同程度に関心があり)、「東京」と「千葉」が似ていない(関心の程度が異なる)ことを意味している。
【0041】
集計された各値の頻度をp,q(ただしp+q=0の場合、s=1)とすると、類似度sは、例えば、以下の式で計算される。
【数1】
【0042】
図9の例では、上記の式によりユーザごとに算出された値間の頻度の類似度sが示されている。例えば、ユーザU002の「神奈川」と「千葉」の類似度sは1であり、「東京」と「千葉」の類似度sは0.66である。
【0043】
その後、類似度算出部332は、ユーザごとに算出された値間の頻度の類似度sに基づいて、値間の類似度Sを算出する。類似度Sは、例えば、ユーザごとに算出された値間の頻度の類似度sの相加平均又は加重平均である。図9に示すように、類似度Sは、行列の形式で表現される。
【0044】
こうして得られた値間の類似度Sは、複数のユーザから見た、各値に対する関心の程度の似ている度合いを示した値となる。よって、例えば、「神奈川」と「千葉」の類似度Sが高い場合、「神奈川」の仕事を閲覧したユーザは、「千葉」の仕事を閲覧していなかったとしても、「千葉」の仕事にも同程度の関心があるものと推測できる。
【0045】
なお、カテゴリカルデータの値の頻度の集計方法、類似度sの算出方法、及び類似度Sの算出方法は上記の例に限られない。例えば、カテゴリカルデータの値の頻度は、ユーザごとに重み付けして集計してもよいし、ユーザの行動ごとに重み付けして集計してもよい。
【0046】
また、類似度算出部332は、対象情報322に複数のカテゴリカルデータが含まれる場合、各カテゴリカルデータに対してそれぞれ類似度Sを算出してもよい。例えば、図8の例では、「業種」の類似度S1と、「地域」の類似度S2と、をそれぞれ算出することが考えられる。
【0047】
また、類似度算出部332は、ユーザ情報321に1又は複数のカテゴリカルデータが含まれる場合、各カテゴリカルデータに対してそれぞれ類似度Sを算出してもよい。例えば、図8の例では、「年齢」の類似度S3と、「性別」の類似度S4と、をそれぞれ算出することが考えられる。なお、「年齢」をカテゴリカルデータとして扱う場合、年齢自体をカテゴリカルデータの値として扱ってもよいし、年齢の区分(20歳以上/20歳未満など)をカテゴリカルデータの値として扱ってもよい。
【0048】
(ステップS103)
加工部333は、一のユーザの行動履歴情報323と、複数の対象の対象情報322と、に基づいて、一のユーザのユーザ情報321に対象情報322を追加する。具体的には、加工部333は、一のユーザの行動履歴情報323に基づいて集計した対象情報322に含まれるカテゴリカルデータを、一のユーザのユーザ情報321に追加する。これにより、ユーザ情報321には、一のユーザの行動(関心)に応じた対象情報322が追加される。
【0049】
図8の例では、各ユーザのユーザ情報321に対して「地域」が追加されている。各ユーザの「地域」の値は、各ユーザの行動履歴情報323に基づいて集計された、地域ごとの仕事の閲覧回数である。例えば、ユーザU001による仕事J001の閲覧回数は1であり、仕事J001の「地域」は「東京」である。よって、ユーザU001の「東京」の値の頻度は1となっている。
【0050】
(ステップS104)
加工部333は、ステップS103で加工したユーザ情報321を補正する。具体的には、加工部333は、一のユーザのユーザ情報321に追加されたカテゴリカルデータを、当該カテゴリカルデータの類似度Sに基づいて補正する。具体的には、加工部333は、一のユーザのユーザ情報321に追加されたカテゴリカルデータに、対応する類似度Sを乗算する。加工部333は、補正したカテゴリカルデータを正規化するのが好ましい。
【0051】
図9の例では、ユーザ情報321に追加された「地域」に、「地域」の類似度Sが乗算されている。ユーザ情報321に「業種」が追加された場合には、ユーザ情報321に追加された「業種」に、「業種」の類似度Sを乗算すればよい。
【0052】
また、加工部333は、ユーザ情報321に元から含まれるカテゴリカルデータの値を数値に置き換える。図9の例では、「年齢」が1(20歳以上)と0(20歳未満)に置き換えられている。また、「性別」が1(M)と0(F)に置き換えられている。
【0053】
(ステップS105)
加工部333は、対象情報322にユーザ情報321を追加する。図8の例では、各対象の対象情報322に対して「年齢」及び「性別」が追加されている。各ユーザの「年齢」及び「性別」の値は、便宜的に0とされている。
【0054】
(ステップS106)
推薦度算出部334は、ステップS103,S104で加工したユーザ情報321と、ステップS105で加工した対象情報322と、に基づいて、推薦度Rを算出する。より詳細には、推薦度算出部334は、一のユーザのユーザ情報321と、複数の対象の対象情報322と、に基づいて、一のユーザに対する各対象の推薦度Rを算出する。推薦度Rは、ユーザ情報321と対象情報322の似ている度合いに相当する。ユーザ情報321と対象情報322とが似ている(推薦度R)ほど、その対象が、ユーザの関心が高い対象に近いことを意味する。
【0055】
ユーザ情報321及び対象情報322は、ステップS105までの処理により、共通のパラメータを含む情報となっているため、いずれもn次元のベクトルで表現できる。ユーザ情報321を(u1,u2,…,un)、対象情報322を(j1,j2,…,jn)とした場合、推薦度Rは、例えば、以下の式で計算される。
【数2】
上記の式において、kiは重み係数である。kiが全て1の場合、推薦度Rは、ユーザ情報321と対象情報322との内積となる。
【0056】
例えば、図8の例では、ユーザU001に対する対象J001の推薦度Rは0.7であり、対象J002の推薦度Rは0.1であり、対象J003の推薦度Rは0.2である。
【0057】
(ステップS107)
レコメンド部335は、一のユーザに対して算出された各対象の推薦度Rに基づいて、一のユーザに対象をレコメンドする。具体的には、レコメンド部335は、推薦度Rに基づいて選択した対象の対象情報323をユーザ端末1に送信し、ユーザ端末1のディスプレイに表示させる。
【0058】
レコメンド部335は、例えば、ユーザに対する推薦度Rが最も高い対象をそのユーザにレコメンドする。この場合、図8の例では、ユーザU001に対象J001がレコメンドされ、ユーザU002に対象J001がレコメンドされ、ユーザU003に対象J002がレコメンドされる。
【0059】
また、レコメンド部335は、ユーザに対する推薦度Rが閾値以上の対象をそのユーザにレコメンドしてもよい。推薦度Rの閾値が0.8である場合、図8の例では、ユーザU001に対象がレコメンドされず、ユーザU002に対象J001がレコメンドされ、ユーザU003に対象J001,J002がレコメンドされる。
【0060】
なお、レコメンドする対象の選択方法は、上記の例に限られない。レコメンド部335は、推薦度Rに基づく任意の方法で対象を選択し、ユーザにレコメンドできる。
【0061】
<まとめ>
以上説明した通り、本実施形態によれば、行動履歴情報323及び対象情報322に基づいて、ユーザの関心に応じた対象情報322がユーザ情報321に追加される。このユーザ情報321に基づいて対象をユーザにレコメンドすることにより、ユーザ情報321が少ない場合であっても、ユーザに対象を適切にレコメンドできる。
【0062】
また、ユーザ情報321に追加された対象情報322は類似度Sにより補正される。これにより、行動履歴情報323から対象情報322を得られない対象に対するユーザの関心の程度を推測し、その関心の程度に基づいて、推薦度Rを算出し、対象をレコメンドできる。結果として、ユーザ情報321に追加される対象情報322が少ない、すなわち、ユーザの行動履歴情報323が少ない場合であっても、ユーザに対象を適切にレコメンドできる。
【0063】
例えば、図8の例では、ユーザU001は対象J002の対象情報322を1回も閲覧していない上、全部で3回しか対象情報322を閲覧していない。このため、ユーザU001がたまたま対象J002の対象情報322を閲覧していないのか、対象J002に関心がないのか、わからない。すなわち、ユーザU001が「神奈川」に関心があるのか否かわからない。しかしながら、ユーザU001の対象情報322を類似度Sで補正することにより、不明であったユーザU001の「神奈川」に対する関心の程度を、0.1と推測することができる。こうして推測した関心の程度を利用することにより、ユーザU001の関心に応じた対象をユーザU001にレコメンドできる。
【0064】
また、推薦度RはΣki・ui・jiで算出できる。重み係数kiを調整することにより、推薦度Rを算出する際に各対象情報322の寄与度を容易に調整することができる。例えば、ある対象情報322の推薦度Rに対する寄与度が小さいと判明した場合、その対象情報322の重み係数kiを小さくするだけで、対象情報322自体に手を加えることなく、その対象情報322の寄与度を反映した推薦度Rを算出することができる。
【0065】
なお、以上の例では、ステップS105において、対象情報322に便宜的にユーザ情報321を追加した。しかしながら、ユーザ情報321に対象情報322を追加するのと同様の方法で、対象情報322にユーザ情報321を追加し、追加したユーザ情報321を類似度Sで補正してもよい。この場合も、上記と同様の方法で推薦度Rを算出することができる。
【0066】
<付記>
本実施形態は、以下の開示を含む。
【0067】
(付記1)
情報処理装置がユーザに対象をレコメンドする情報処理方法であって、
複数のユーザのユーザ情報と、前記複数のユーザの行動履歴情報と、カテゴリカルデータを含む複数の対象の対象情報と、を取得する取得処理と、
前記複数のユーザの行動履歴情報と、前記複数の対象の対象情報と、に基づいて、前記カテゴリカルデータの値間の類似度を算出する類似度算出処理と、
一のユーザの前記行動履歴情報と、前記複数の対象の対象情報と、に基づいて、前記一のユーザのユーザ情報に対象情報を追加し、前記一のユーザの対象情報を前記類似度に基づいて補正する加工処理と、
前記一のユーザのユーザ情報と、前記複数の対象の対象情報と、に基づいて、前記一のユーザに対する各対象の推薦度を算出する推薦度算出処理と、
前記各対象の推薦度に基づいて、前記一のユーザに対象をレコメンドするレコメンド処理と、
を含む情報処理方法。
【0068】
(付記2)
前記一のユーザに対する一の対象の前記推薦度は、前記一のユーザの対象情報に含まれる前記カテゴリカルデータと、前記一の対象の対象情報に含まれる前記カテゴリカルデータと、の内積に基づいて算出される
付記1に記載の情報処理方法。
【0069】
(付記3)
前記カテゴリカルデータの値間の類似度は、ユーザごとに算出された、値間の頻度の類似度に基づいて算出される
付記1又は付記2に記載の情報処理方法。
【0070】
(付記4)
前記カテゴリカルデータは、地域、業種、年齢、性別、又は雇用形態である
付記1から付記3までのいずれかに記載の情報処理方法。
【0071】
(付記5)
ユーザに対象をレコメンドする情報処理装置であって、
複数のユーザのユーザ情報と、前記複数のユーザの行動履歴情報と、カテゴリカルデータを含む複数の対象の対象情報と、を取得する取得部と、
前記複数のユーザの行動履歴情報と、前記複数の対象の対象情報と、に基づいて、前記カテゴリカルデータの値間の類似度を算出する類似度算出部と、
一のユーザの前記行動履歴情報と、前記複数の対象の対象情報と、に基づいて、前記一のユーザのユーザ情報に対象情報を追加し、前記一のユーザの対象情報を前記類似度に基づいて補正する加工部と、
前記一のユーザの対象情報と、前記複数の対象の対象情報と、に基づいて、前記一のユーザに対する各対象の推薦度を算出する推薦度算出部と、
前記各対象の推薦度に基づいて、前記一のユーザに対象をレコメンドするレコメンド部と、
を備える情報処理装置。
【0072】
(付記6)
情報処理装置に、
複数のユーザのユーザ情報と、前記複数のユーザの行動履歴情報と、カテゴリカルデータを含む複数の対象の対象情報と、を取得する取得処理と、
前記複数のユーザの行動履歴情報と、前記複数の対象の対象情報と、に基づいて、前記カテゴリカルデータの値間の類似度を算出する類似度算出処理と、
一のユーザの前記行動履歴情報と、前記複数の対象の対象情報と、に基づいて、前記一のユーザのユーザ情報に対象情報を追加し、前記一のユーザの対象情報を前記類似度に基づいて補正する加工処理と、
前記一のユーザの対象情報と、前記複数の対象の対象情報と、に基づいて、前記一のユーザに対する各対象の推薦度を算出する推薦度算出処理と、
前記各対象の推薦度に基づいて、前記一のユーザに対象をレコメンドするレコメンド処理と、
を含む情報処理方法を実行させるためのプログラム。
【0073】
今回開示された実施形態はすべての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上記した意味ではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内でのすべての変更が含まれることが意図される。また、本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
【符号の説明】
【0074】
1:ユーザ端末
2:登録者端末
3:サーバ装置
31:通信部
32:記憶部
33:制御部
321:ユーザ情報
322:対象情報
323:行動履歴情報
331:取得部
332:類似度算出部
333:加工部
334:推薦度算出部
335:レコメンド部
101:プロセッサ
102:メモリ
103:ストレージ
104:通信I/F
105:入出力I/F
106:ドライブ装置
107:入力装置
108:出力装置
109:ディスクメディア
【要約】
【課題】 ユーザ情報が少ない場合であってもユーザに対象を適切にレコメンドする。
【解決手段】
一実施形態に係る情報処理方法は、複数のユーザのユーザ情報と、複数のユーザの行動履歴情報と、カテゴリカルデータ数を含む複数の対象の対象情報と、を取得する取得処理と、複数のユーザの行動履歴情報と、複数の対象の対象情報と、に基づいて、カテゴリカルデータの値間の類似度を算出する類似度算出処理と、一のユーザの行動履歴情報と、複数の対象の対象情報と、に基づいて、一のユーザのユーザ情報にカテゴリカルデータを追加し、一のユーザのカテゴリカルデータを類似度に基づいて補正する加工処理と、一のユーザのユーザ情報と、複数の対象の対象情報と、に基づいて、一のユーザに対する各対象の推薦度を算出する推薦度算出処理と、各対象の推薦度に基づいて、一のユーザに対象をレコメンドするレコメンド処理と、を含む。
【選択図】図8
図1
図2
図3
図4
図5
図6
図7
図8
図9