IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

特開2024-133864情報処理装置、情報処理方法および情報処理プログラム
<>
  • 特開-情報処理装置、情報処理方法および情報処理プログラム 図1A
  • 特開-情報処理装置、情報処理方法および情報処理プログラム 図1B
  • 特開-情報処理装置、情報処理方法および情報処理プログラム 図1C
  • 特開-情報処理装置、情報処理方法および情報処理プログラム 図2
  • 特開-情報処理装置、情報処理方法および情報処理プログラム 図3
  • 特開-情報処理装置、情報処理方法および情報処理プログラム 図4
  • 特開-情報処理装置、情報処理方法および情報処理プログラム 図5
  • 特開-情報処理装置、情報処理方法および情報処理プログラム 図6
  • 特開-情報処理装置、情報処理方法および情報処理プログラム 図7
  • 特開-情報処理装置、情報処理方法および情報処理プログラム 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024133864
(43)【公開日】2024-10-03
(54)【発明の名称】情報処理装置、情報処理方法および情報処理プログラム
(51)【国際特許分類】
   G06F 16/335 20190101AFI20240926BHJP
【FI】
G06F16/335
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2023043861
(22)【出願日】2023-03-20
(71)【出願人】
【識別番号】500257300
【氏名又は名称】LINEヤフー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】坪内 孝太
(72)【発明者】
【氏名】清水 徹
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175HB03
(57)【要約】
【課題】より良いサービスを提供することができる情報処理装置、情報処理方法および情報処理プログラムを提供すること。
【解決手段】本願に係る情報処理装置は、特定部と、判定部とを備える。特定部は、特定部は、複数の利用者間で行われた会話であって、比較対象となる複数の会話それぞれを構成する各メッセージに対応付けられたセマンティック情報を特定する。前記判定部は、前記複数の会話同士での比較において、各メッセージの類似性と、各メッセージに対応付けられたセマンティック情報の類似性とに基づいて、複数の会話の類似性を判定する。
【選択図】図3
【特許請求の範囲】
【請求項1】
複数の利用者間で行われた会話であって、比較対象となる複数の会話それぞれを構成する各メッセージに対応付けられたセマンティック情報を特定する特定部と、
前記複数の会話同士での比較において、各メッセージの類似性と、各メッセージに対応付けられた前記セマンティック情報の類似性とに基づいて、前記複数の会話の類似性を判定する判定部と、
を備える情報処理装置。
【請求項2】
前記判定部は、
各メッセージの類似性と、各メッセージに対応付けられた前記セマンティック情報の類似性とに基づいて算出したBLEUのスコアにより前記類似性の判定を行う
請求項1に記載の情報処理装置。
【請求項3】
前記判定部は、
前記メッセージと、前記セマンティック情報とが紐付いたシーケンスを、長さがnの部分列に分けて前記部分列の類似性を判定し、すべての前記部分列の類似性の判定結果に基づいて前記BLEUのスコアを算出する
請求項2に記載の情報処理装置。
【請求項4】
前記判定部の判定結果に基づいたコンテンツを提供する提供部をさらに備える
請求項1に記載の情報処理装置。
【請求項5】
前記セマンティック情報は、
前記メッセージの意味や、相手の前記メッセージに対する応答、相手への問いかけ、相手への説明、前記メッセージが示す発話者の感情の少なくとも1つを含む
請求項4に記載の情報処理装置。
【請求項6】
コンピュータが実行する情報処理方法であって、
複数の利用者間で行われた会話であって、比較対象となる複数の会話それぞれを構成する各メッセージに対応付けられたセマンティック情報を特定する特定工程と、
前記複数の会話同士での比較において、各メッセージの類似性と、各メッセージに対応付けられた前記セマンティック情報の類似性とに基づいて、前記複数の会話の類似性を判定する判定工程と
を含む情報処理方法。
【請求項7】
複数の利用者間で行われた会話であって、比較対象となる複数の会話それぞれを構成する各メッセージに対応付けられたセマンティック情報を特定する特定手順と、
前記複数の会話同士での比較において、各メッセージの類似性と、各メッセージに対応付けられた前記セマンティック情報の類似性とに基づいて、前記複数の会話の類似性を判定する判定手順と
をコンピュータに実行させる情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法および情報処理プログラムに関する。
【背景技術】
【0002】
従来、比較対象となる複数の時系列データの類似度を判定する手法として、動的時間伸縮法(Dynamic Time Warping:DTW)が知られている(例えば、特許文献1参照)。このDTWを用いた例として、利用者が出発地から目的地まで移動した経路の類似度を判定する技術がある。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2022-168542号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来技術では、より良いサービスを提供する点で改善の余地があった。
【0005】
本願は、上記に鑑みてなされたものであって、より良いサービスを提供することができる情報処理装置、情報処理方法および情報処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本願に係る情報処理装置は、特定部と、判定部とを備える。前記特定部は、複数の利用者間で行われた会話であって、比較対象となる複数の会話それぞれを構成する各メッセージに対応付けられたセマンティック情報を特定する。前記判定部は、前記複数の会話同士での比較において、各メッセージの類似性と、各メッセージに対応付けられた前記セマンティック情報の類似性とに基づいて、前記複数の会話の類似性を判定する。
【発明の効果】
【0007】
実施形態の一態様によれば、より良いサービスを提供することができるという効果を奏する。
【図面の簡単な説明】
【0008】
図1A図1Aは、実施形態に係る利用者が移動した経路の類似度判定処理を示す図である。
図1B図1Bは、実施形態に係るウェブ上における行動の類似度判定処理を示す図である。
図1C図1Cは、実施形態に係る利用者が行った会話の類似度判定処理を示す図である。
図2図2は、実施形態に係る情報処理システムの構成例を示す図である。
図3図3は、実施形態に係る情報処理装置の構成例を示す図である。
図4図4は、利用者情報の一例を示す図である。
図5図5は、実施形態に係る経路の類似度判定処理の処理手順を示すフローチャートである。
図6図6は、実施形態に係る行動の類似度判定処理の処理手順を示すフローチャートである。
図7図7は、実施形態に係る会話の類似度判定処理の処理手順を示すフローチャートである。
図8図8は、ハードウェア構成の一例を示す図である。
【発明を実施するための形態】
【0009】
以下に、本願に係る情報処理装置、情報処理方法および情報処理プログラムを実施するための形態(以下、「実施形態」と記載する)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法および情報処理プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0010】
(実施形態)
まず、図1A図1Cを用いて、実施形態に係る情報処理装置が実行する処理について説明する。図1Aは、実施形態に係る利用者が移動した経路の類似度判定処理を示す図である。図1Bは、ウェブ上における行動の類似度判定処理を示す図である。図1Cは、実施形態に係る利用者が行った会話の類似度判定処理を示す図である。なお、図1A図1Cでは、実施形態に係る情報処理装置1を含む情報処理システムSの動作例を示している。
【0011】
まず、図1Aを用いて、利用者が移動した経路の類似度判定処理について説明する。図1Aに示すように、実施形態に係る情報処理システムSは、情報処理装置1と、利用者端末100と、ログサーバ200とを含む。
【0012】
ここでいう経路は、例えば、数日間に亘る比較的長いスパンにおいて利用者が移動した経路をすべて含む。つまり、類似度判定の比較対象となる各経路は、出発地および目的地が様々で、かつ、複数の出発地および目的地を含む経路を含む。
【0013】
図1Aにおいて、実施形態に係る情報処理システムSは、比較対象となる複数の経路それぞれを構成する各地点に対応付けられたセマンティック情報の類似性と、各地点の類似性とに基づいて、複数の経路の類似性を判定する。
【0014】
具体的には、まず、利用者端末100は、位置情報を所定間隔でログサーバ200へ送信する(ステップS1)。
【0015】
つづいて、ログサーバ200は、利用者端末100から位置情報を位置ログとして自身の記憶部に記憶する(ステップS2)。具体的には、ログサーバ200は、利用者毎に位置情報の履歴を位置ログとして記憶する。
【0016】
つづいて、情報処理装置1は、ログサーバ200に対して位置ログを要求する(ステップS3)。具体的には、情報処理装置1は、比較対象となる複数の利用者を決定し、決定した利用者それぞれの位置ログを要求する。なお、情報処理装置1は、位置ログの地域や時間等を指定してもよい。また、情報処理装置1は、1人の利用者における位置ログを地域や時間等によって複数の経路に分割し、分割した複数の経路を比較対象としてもよい。
【0017】
つづいて、ログサーバ200は、情報処理装置1の要求に従って、位置ログを抽出し情報処理装置1へ提供する(ステップS4)。
【0018】
つづいて、情報処理装置1は、比較対象となる利用者毎に経路を特定する(ステップS5)。例えば、情報処理装置1は、数日間に亘る位置ログの中から、地域毎や、時間毎における経路を特定する。また、情報処理装置1は、特定した各経路について、出発地や目的地、立寄地等を特定する。例えば、情報処理装置1は、利用者端末100にインストールされたナビゲーションアプリにおいて利用者が入力した情報に基づいて出発地や目的地、立寄地等を特定する。あるいは、情報処理装置1は、位置ログから推定した滞在時間に基づいて出発地や目的地、立寄地等を特定してもよい。
【0019】
つづいて、情報処理装置1は、特定した経路を構成する各地点に対応付けられたセマンティック情報を特定する(ステップS6)。セマンティック情報は、利用者にとって意味がある(セマンティックな)情報であり、例えば、地点に存在する店舗情報(店舗名や店舗種別)、地点に関するウェブでの投稿(利用者や他の利用者を含む)、地点に存在する観光名所、地点に存在する物体、地点で発生しているイベント等の情報を含む。また、セマンティック情報は、例えば、利用者が地点において行った行動(店舗に立ち寄った、地点におけるなにかしらの情報をウェブで投稿した、上記観光名所で写真を撮った、上記物体に触った、上記イベントに参加した等)の情報を含んでもよい。
【0020】
つづいて、情報処理装置1は、比較対象となる複数の経路同士での比較において、各地点の類似性と、各地点に対応付けられたセマンティック情報の類似性とに基づいて、複数の経路の類似性を判定する(ステップS7)。比較対象となる複数の経路は、上記したように、複数の利用者それぞれの経路であってもよく、1人の利用者における複数の経路であってもよい。また、複数の経路の類似性は、自然言語処理におけるn-gramの考え方を用いる。具体的には、経路中に存在するn個の地点(複数の地点を1つの地点としてもよい)からなる部分列をn-gramとみなして利用し、unigram,bigramといった局所的な特徴に基づいて算出した類似度評価指標により類似性を判定する。また、類似度評価指標は、自然文に対する類似度評価指標であるBLEU(Bilingual Evaluation Understudy)スコアを用いる。なお、BLEU(Bilingual Evaluation Understudy)スコアを用いた類似性判定の詳細な数式等については後述する。
【0021】
つづいて、情報処理装置1は、判定結果である複数の類似性に基づいたコンテンツを生成する(ステップS8)。例えば、情報処理装置1は、比較対象となる複数の経路の類似性の判定結果(類似しているか否かや、類似している度合い)を示すコンテンツを生成する。また、情報処理装置1は、対象となる利用者の経路のうち、他の利用者と類似性が高い経路の情報を示すコンテンツを生成する。また、情報処理装置1は、対象となる利用者の経路と類似性が高い経路を移動した他の利用者の特徴(例えば、属性情報から抽出される特徴等)を示すコンテンツを生成する。また、情報処理装置1は、類似性が高い経路を移動した利用者をグルーピングし、グループ毎に経路の情報とグループの特徴(例えば、属性情報から抽出される特徴等)とを紐付けたコンテンツを生成する。また、情報処理装置1は、対象となる利用者の経路と類似性が高い経路を移動した他の利用者の他の経路の情報を提案するコンテンツを生成する。
【0022】
つづいて、情報処理装置1は、生成したコンテンツを、例えば、利用者端末100を介して利用者へ提供する(ステップS9)。また、情報処理装置1は、例えば、利用者の経路を研究している事業者(位置ログを収集した利用者以外のユーザ)等に対して、生成したコンテンツを提供してもよい。
【0023】
このように、実施形態に係る情報処理装置1によれば、各地点に対応付けられたセマンティック情報の類似性を加味して、比較対象となる経路の類似性を判定することで、数日間にわたる長いスパンでの移動経路を比較する場合であっても、経路の類似性判定を高精度に行うことができる。
【0024】
次に、図1Bを用いて、ウェブ上における行動の類似度判定処理について説明する。
【0025】
ウェブ上における行動は、例えば、検索行動や、閲覧行動、購買行動等である。検索行動は、入力した検索クエリや、カテゴリを指定して検索したか否か、検索行動を開始してから終了するまでの時間、検索回数等である。閲覧行動は、閲覧したサイトの種類(ランキングサイト、ショッピングサイト、オークションサイト、広告等)、サイトの閲覧時間、サイトの閲覧数等である。購買行動は、購買したサイトの種類、購買した商品やサービスの種類、購買に至るまでの行動(検索行動等により比較行動をしたか否か等)、購買に至るまでの時間、購買頻度等である。
【0026】
図1Bにおいて、実施形態に係る情報処理システムSは、比較対象となる複数の利用者がウェブ上において行った行動に関連する各動作に対応付けられたセマンティック情報の類似性と、各動作の類似性とに基づいて、複数の利用者における行動の類似性を判定する。
【0027】
具体的には、まず、利用者端末100は、ウェブ上における行動を示す行動情報をログサーバ200へ送信する(ステップS1)。
【0028】
つづいて、ログサーバ200は、利用者端末100から行動情報を行動ログとして自身の記憶部に記憶する(ステップS2)。具体的には、ログサーバ200は、利用者毎に行動情報の履歴を行動ログとして記憶する。
【0029】
つづいて、情報処理装置1は、ログサーバ200に対して行動ログを要求する(ステップS3)。具体的には、情報処理装置1は、比較対象となる複数の利用者を決定し、決定した利用者それぞれの行動ログを要求する。なお、情報処理装置1は、行動ログの種類(検索行動、閲覧行動及び購買行動等)や、行動が行われた時期等を指定してもよい。
【0030】
つづいて、ログサーバ200は、情報処理装置1の要求に従って、行動ログを抽出し情報処理装置1へ提供する(ステップS4)。
【0031】
つづいて、情報処理装置1は、比較対象となる利用者毎の行動を特定する(ステップS5)。例えば、情報処理装置1は、数日間に亘る行動ログの中から、検索行動や、閲覧行動、購買行動等を特定する。
【0032】
つづいて、情報処理装置1は、特定した行動に関連する各動作に対応付けられたセマンティック情報を特定する(ステップS6)。動作とは、検索行動の場合には、入力した検索クエリや、検索時に指定したカテゴリ、検索行動を開始してから終了するまでの時間、検索回数等である。また、動作とは、閲覧行動の場合には、閲覧したサイトの種類(ランキングサイト、ショッピングサイト、オークションサイト、広告等)、サイトの閲覧時間、サイトの閲覧数等である。また、動作とは、購買行動の場合には、購買したサイトの種類、購買した商品やサービスの種類、購買に至るまでの行動(検索行動等により比較行動をしたか否か等)、購買に至るまでの時間、購買頻度等である。また、セマンティック情報は、上記の動作に関する情報であり、例えば、入力した検索クエリの内容(意味)や、カテゴリの内容、閲覧したサイトの内容、購買した商品またはサービスの内容等である。
【0033】
つづいて、情報処理装置1は、比較対象となる複数の利用者同士での比較において、各動作の類似性と、各動作に対応付けられたセマンティック情報の類似性とに基づいて、複数の利用者における行動の類似性を判定する(ステップS7)。行動の類似性は、図1Aで説明したn-gramの考え方に基づく類似度評価指標であるBLEUスコアを用いる。なお、図1Aと同様に、BLEUスコアを用いた類似性判定の詳細については後述する。
【0034】
つづいて、情報処理装置1は、判定結果である行動の類似性に基づいたコンテンツを生成する(ステップS8)。例えば、情報処理装置1は、比較対象となる複数の行動の類似性の判定結果(類似しているか否かや、類似している度合い)を示すコンテンツを生成する。また、情報処理装置1は、対象となる利用者の行動のうち、他の利用者と類似性が高い行動の情報を示すコンテンツを生成する。また、情報処理装置1は、対象となる利用者の行動と類似性が高い行動を行った他の利用者の特徴(例えば、属性情報から抽出される特徴等)を示すコンテンツを生成する。また、情報処理装置1は、類似性が高い行動を行った利用者をグルーピングし、グループ毎に行動の情報とグループの特徴(例えば、属性情報から抽出される特徴等)とを紐付けたコンテンツを生成する。また、情報処理装置1は、対象となる利用者の行動と類似性が高い行動を行った他の利用者の他の行動の情報を提案するコンテンツを生成する。
【0035】
つづいて、情報処理装置1は、生成したコンテンツを、例えば、利用者端末100を介して利用者へ提供する(ステップS9)。また、情報処理装置1は、例えば、利用者の行動を研究している事業者(行動ログを収集した利用者以外のユーザ)等に対して、生成したコンテンツを提供してもよい。
【0036】
このように、実施形態に係る情報処理装置1によれば、各動作に対応付けられたセマンティック情報の類似性を加味して、比較対象となる複数の利用者の行動の類似性を判定することで、数日間にわたる長いスパンでの行動を比較する場合であっても、行動の類似性判定を高精度に行うことができる。
【0037】
次に、図1Cを用いて、会話の類似度判定処理について説明する。
【0038】
ここでいう会話は、複数の利用者間で行われた会話であり、例えば、テキストメッセージを送受信する会話である。また、会話は、音声会話であってもよい。
【0039】
図1Cにおいて、実施形態に係る情報処理システムSは、比較対象となる複数の会話それぞれを構成するメッセージに対応付けられたセマンティック情報の類似性と、各メッセージの類似性とに基づいて、複数の会話の類似性を判定する。
【0040】
具体的には、まず、利用者端末100は、利用者が行った会話を示す会話情報をログサーバ200へ送信する(ステップS1)。利用者端末100は、テキストメッセージを送受信する会話の場合、テキストメッセージに発話者(利用者または会話相手)を紐付けた会話情報を送信する。また、利用者端末100は、音声会話の場合、音声データをテキストに変換し、変換したテキストメッセージに発話者(利用者または会話相手)を紐付けた会話情報を送信する。
【0041】
つづいて、ログサーバ200は、利用者端末100から取得した会話情報を会話ログとして自身の記憶部に記憶する(ステップS2)。具体的には、ログサーバ200は、利用者および会話相手の組毎に会話情報の履歴を会話ログとして記憶する。
【0042】
つづいて、情報処理装置1は、ログサーバ200に対して会話ログを要求する(ステップS3)。具体的には、情報処理装置1は、比較対象となる複数の利用者を決定し、決定した利用者それぞれの会話ログを要求する。なお、情報処理装置1は、会話相手の属性や、会話が行われた時期、会話時間等を指定してもよい。
【0043】
つづいて、ログサーバ200は、情報処理装置1の要求に従って、会話ログを抽出し情報処理装置1へ提供する(ステップS4)。
【0044】
つづいて、情報処理装置1は、会話毎に、会話を構成する各メッセージを特定する(ステップS5)。例えば、情報処理装置1は、利用者のメッセージおよび会話相手のメッセージを特定する。
【0045】
つづいて、情報処理装置1は、特定した各メッセージに対応付けられたセマンティック情報を特定する(ステップS6)。セマンティック情報は、メッセージの意味や、相手のメッセージに対する応答、相手への問いかけ、相手への説明、メッセージが示す発話者の感情等である。
【0046】
つづいて、情報処理装置1は、比較対象となる複数の会話での比較において、各メッセージの類似性と、各メッセージに対応付けられたセマンティック情報の類似性とに基づいて、複数の会話の類似性を判定する(ステップS7)。会話の類似性は、図1Aで説明したn-gramの考え方に基づく類似度評価指標であるBLEUスコアを用いる。なお、図1Aと同様に、BLEUスコアを用いた類似性判定の詳細については後述する。
【0047】
つづいて、情報処理装置1は、判定結果である行動の類似性に基づいたコンテンツを生成する(ステップS8)。例えば、情報処理装置1は、比較対象となる複数の会話の類似性の判定結果(類似しているか否かや、類似している度合い)を示すコンテンツを生成する。また、情報処理装置1は、対象となる利用者の会話のうち、他の利用者と類似性が高い会話の情報を示すコンテンツを生成する。また、情報処理装置1は、対象となる利用者の会話と類似性が高い行動を行った他の利用者の特徴(例えば、属性情報から抽出される特徴等)を示すコンテンツを生成する。また、情報処理装置1は、類似性が高い会話を行った利用者をグルーピングし、グループ毎に会話の情報とグループの特徴(例えば、属性情報から抽出される特徴等)とを紐付けたコンテンツを生成する。また、情報処理装置1は、対象となる利用者の会話と類似性が高い会話を行った他の利用者の他の会話の情報を提案するコンテンツを生成する。
【0048】
つづいて、情報処理装置1は、生成したコンテンツを、例えば、利用者端末100を介して利用者へ提供する(ステップS9)。また、情報処理装置1は、例えば、利用者の会話を研究している事業者(会話ログを収集した利用者以外のユーザ)等に対して、生成したコンテンツを提供してもよい。
【0049】
このように、実施形態に係る情報処理装置1によれば、各メッセージに対応付けられたセマンティック情報の類似性を加味して、比較対象となる複数の会話の類似性を判定することで、会話の類似性判定を高精度に行うことができる。
【0050】
次に、図2を用いて、実施形態に係る情報処理システムSの構成例について説明する。図2は、実施形態に係る情報処理システムSの構成例を示すブロック図である。図2に示すように、実施形態に係る情報処理システムSは、情報処理装置1と、複数の利用者端末100と、複数のログサーバ200とがネットワークNに対して有線又は無線により接続される。ネットワークNは、例えば、インターネット、WAN(Wide Area Network)、LAN(Local Area Network)等のネットワークである。
【0051】
情報処理装置1は、実施形態に係る情報処理方法を実行するサーバ装置である。情報処理装置1は、比較対象となる複数の経路それぞれを構成する各地点に対応付けられたセマンティック情報の類似性と、各地点の類似性とに基づいて、複数の経路の類似性を判定する。また、情報処理装置1は、比較対象となる複数の利用者がウェブ上において行った行動に関連する各動作に対応付けられたセマンティック情報の類似性と、各動作の類似性とに基づいて、複数の利用者における行動の類似性を判定する。また、情報処理装置1は、比較対象となる複数の会話それぞれを構成するメッセージに対応付けられたセマンティック情報の類似性と、各メッセージの類似性とに基づいて、複数の会話の類似性を判定する。
【0052】
また、情報処理装置1は、複数の利用者端末100および複数のログサーバ200と連携し、複数の利用者端末100に対して、各種アプリケーション(以下、アプリ)等に対するAPI(Application Programming Interface)サービス等と、各種データを提供する情報処理装置であり、サーバ装置やクラウドシステム等により実現される。
【0053】
また、情報処理装置1は、複数の利用者端末100に対して、オンラインで何らかのWebサービスを提供する情報処理装置であってもよい。例えば、情報処理装置1は、Webサービスとして、インターネット接続、検索サービス、SNS(Social Networking Service)、電子商取引(EC:Electronic Commerce)、電子決済、オンラインゲーム、オンラインバンキング、オンライントレーディング、宿泊・チケット予約、動画・音楽配信、ニュース、地図、ルート検索、経路案内、路線情報、運行情報、天気予報等のサービスを提供してもよい。実際には、情報処理装置1は、上記のようなWebサービスを提供する各種サーバと連携し、Webサービスを仲介してもよいし、Webサービスの処理を担当してもよい。
【0054】
利用者端末100は、利用者が所持する端末装置である。利用者端末100は、スマートフォン、デスクトップ型PC、ノート型PC、タブレット型PC等の任意のタイプの端末装置を用いることができる。利用者端末100は、情報処理装置1等へ各種情報を送信したり、情報処理装置1等から提供される情報を受信したりする。
【0055】
ログサーバ200は、利用者の各種ログデータを記憶するとともに、当該ログデータを情報処理装置1へ提供するサーバ装置である。ログサーバ200は、サーバ装置に限らず、クラウドシステム等によって実現されてもよい。
【0056】
次に、図3を参照して、情報処理装置1の構成例について説明する。
【0057】
図3は、実施形態に係る情報処理装置1の構成例を示す図である。図3に示されるように、情報処理装置1は、通信部2と、制御部3と、記憶部4とを有する。制御部3は、取得部31と、特定部32と、判定部33と、生成部34と、提供部35とを備える。記憶部4は、利用者情報41を記憶する。
【0058】
通信部2は、例えば、NIC(Network Interface Card)等によって実現される。通信部2は、有線または無線によりネットワーク網と接続される。
【0059】
制御部3は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等のプロセッサによって、情報処理装置1内部の記憶装置に記憶されている各種プログラム(情報処理プログラムの一例に相当)がRAM等を作業領域として実行されることにより実現される。また、制御部3は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)、GPGPU(General Purpose Graphic Processing Unit)等の集積回路により実現されてもよい。
【0060】
記憶部4は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。
【0061】
利用者情報41は、利用者に関する情報である。図4は、利用者情報41の一例を示す図である。図4に示すように、利用者情報41は、「ユーザID」、「属性情報」、「ログ情報」等の項目を含む。
【0062】
「ユーザID」は、利用者を識別する識別情報である。「属性情報」は、利用者の属性に関する情報である。属性情報は、例えば、サイコグラフィック属性や、デモグラフィック属性等を含む。「ログ情報」は、ログサーバ200を介して利用者端末100から取得した各種ログデータであり、例えば、位置ログ、行動ログ、会話ログ等である。
【0063】
次に、情報処理装置1の制御部3の各機能(取得部31、特定部32、判定部33、生成部34および提供部35)について説明する。
【0064】
取得部31は、各種情報を取得する。具体的には、取得部31は、上記した位置ログや、行動ログ、会話ログを取得する。なお、図1A図1Cでは、ログサーバ200から各種ログデータを取得する例を示したが、利用者端末100から直接ログデータを取得してもよい。
【0065】
特定部32は、ログデータに対応付けられたセマンティック情報を特定する。具体的には、特定部32は、位置ログに基づいて、比較対象となる複数の経路それぞれを構成する各地点に対応付けられたセマンティック情報を特定する。特定部32は、例えば、地点に存在する店舗情報(店舗名や店舗種別)、地点に関するウェブでの投稿(利用者や他の利用者を含む)、地点に存在する観光名所、地点に存在する物体、地点で発生しているイベント等の情報をセマンティック情報として特定する。また、セマンティック情報は、例えば、利用者が地点において行った行動(店舗に立ち寄った、地点におけるなにかしらの情報をウェブで投稿した、上記観光名所で写真を撮った、上記物体に触った、上記イベントに参加した等)の情報を含んでもよい。
【0066】
また、特定部32は、行動ログに基づいて、比較対象となる複数の利用者がウェブ上において行った行動に関連する各動作に対応付けられたセマンティック情報を特定する。具体的には、特定部32は、まず、行動に関連する各動作を特定する。具体的には、特定部32は、検索行動、閲覧行動および購買行動を行動として特定する。つづいて、特定部32は、検索行動の場合には、入力した検索クエリや、検索時に指定したカテゴリ、検索行動を開始してから終了するまでの時間、検索回数等を動作として特定する。また、特定部また、閲覧行動の場合には、閲覧したサイトの種類(ランキングサイト、ショッピングサイト、オークションサイト、広告等)、サイトの閲覧時間、サイトの閲覧数等を動作として特定する。また、特定部32は、購買行動の場合には、購買したサイトの種類、購買した商品やサービスの種類、購買に至るまでの行動(検索行動等により比較行動をしたか否か等)、購買に至るまでの時間、購買頻度等を動作として特定する。そして、特定部32は、上記した各動作において、例えば、入力した検索クエリの内容(意味)や、カテゴリの内容、閲覧したサイトの内容、購買した商品またはサービスの内容等をセマンティック情報として特定する。
【0067】
また、特定部32は、会話ログに基づいて、比較対象となる複数の会話を構成する各メッセージに対応付けられたセマンティック情報を特定する。セマンティック情報は、例えば、メッセージの意味や、相手のメッセージに対する応答、相手への問いかけ、相手への説明、メッセージが示す発話者の感情等を含む。
【0068】
なお、特定部32は、シーケンスモデリングを用いてセマンティック情報を特定してもよい。シーケンスモデリングは、例えば、Word2vecや、LSTM(Long Short Term Memory)、Transformerなどのモデルを採用可能である。例えば、特定部32は、位置ログに基づいて、人の移動の経路(トラジェクトリー)を基に、LSTM RNNによるシーケンスモデリングを行い、場所(地点)を表すグリッドセルの表現であるセマンティック情報を特定する。また、特定部32は、行動ログに基づいて、例えば、ニュース記事閲覧 → コメント閲覧 → コメント投稿 → オークション検索 → オークションの商品閲覧等といった系列(連続する行動)があった場合に、「ニュース記事閲覧をあらわすtoken」、「コメント投稿をあらわすtoken」等を定義してシーケンスモデリングを行うことで、それぞれのtokenのベクトル表現であるセマンティック情報を特定でき、さらに行動の系列をベクトルの系列として表すことで、そのベクトルの系列をセマンティック情報として特定できる。また、特定部32は、会話ログに基づいて、例えば、形態素単位のベクトルを作成したり、発話や応答等の一連の会話の塊の単位でベクトルを作成したりする、という粒度の異なる複数パターンでシーケンスモデリングを行うことで、それぞれのベクトルの系列をセマンティック情報として特定する。なお、特定部32は、上記以外にも、例えば、塩基配列等のような系列情報であれば、同様にシーケンスモデリングを行うことで、固定次元のベクトル/embeddingの列にしてセマンティック情報を特定することができる。
【0069】
判定部33は、比較対象の類似性判定を行う。具体的には、判定部33は、複数の経路同士での比較において、各地点の類似性と、各地点に対応付けられたセマンティック情報の類似性とに基づいて、複数の経路の類似性を判定する。また、判定部33は、複数の利用者同士での比較において、各動作の類似性と、各動作に対応付けられたセマンティック情報の類似性とに基づいて、複数の利用者における行動の類似性を判定する。また、判定部33は、複数の会話同士での比較において、各メッセージの類似性と、各メッセージに対応付けられたセマンティック情報の類似性とに基づいて、複数の会話の類似性を判定する。
【0070】
ここで、上記の類似性判定は、自然言語処理におけるn-gramの考え方を用いる。具体的には、経路中に存在するn個の地点(複数の地点を1つの地点としてもよい)からなる部分列をn-gramとみなして利用し、unigram,bigramといった局所的な特徴に基づいて算出した類似度評価指標により類似性を判定する。また、類似度評価指標は、自然文に対する類似度評価指標であるBLEU(Bilingual Evaluation Understudy)スコアを用いる。
【0071】
具体的には、まず、各点に対して座標qと分散表現eとが紐ついているような、空間中の2つのシーケンスvとシーケンスwとを考える。この場合、シーケンスvは下記式(1)に、シーケンスwは下記式(2)によって表すことができる。なお、座標qは、上記した地点、動作およびメッセージに相当し、分散表現eは、上記したセマンティック情報に相当し、シーケンスvおよびシーケンスwは、比較対象である経路、行動および会話に相当する。また、下記式(1)において、シーケンスvの長さをL、シーケンスwの長さをLとする。
【0072】
【数1】
【0073】
【数2】
【0074】
次に、シーケンスvおよびシーケンスwそれぞれから取り出した長さがnの部分列(n-gram)を部分列gおよびgとした場合、部分列gおよびgは、下記式(3)および(4)によって表すことができる。
【0075】
【数3】
【0076】
【数4】
【0077】
つづいて、部分列gおよびgの類似度をs、d(A,B)をユークリッド距離、dを分散表現同士の距離とした場合、類似度sは下記式(5)によって算出する。なお、下記式(5)において、β、γは、座標からの寄与、分散表現からの寄与、および全体のスケールをあわせて調整するための重みである。類似度sの値は、0から1の範囲であり、類似度1が「普通の離散なn-gramがマッチした」状態であり、類似度0が「マッチしていない」状態に相当する。
【0078】
【数5】
【0079】
つづいて、あらためて上記2つのシーケンス(vおよびw)を、シーケンスc(Candidate)およびシーケンスr(Reference)と置き、それらの間でCandidateのn-gram1つ1つからReferenceのn-gramをマッチさせ消し込んでいく。このとき上記類似度sの合計が大きくなるよう最適化する。そして、結果として得られたn-gram同士のペアのセットをPとした場合、Pは下記式(6)によって表される。なお、Pの最適化は、Hungarian algorithm、あるいは類似度の大きいペアから確定していくgreedyな形などで行うことができる。また、下記式(6)において、(gck,grk)は「k番目に消し込まれたペア」を指し、また、式(6)でのLは2つのシーケンス長の短い方を指す。すなわち、L=min(L,L)となる。
【0080】
【数6】
【0081】
つづいて、BLEUにおけるmodified precision相当の式、詳細には、あるnの値におけるc、rの類似度qを下記式(7)によって算出する。
【0082】
【数7】
【0083】
つづいて、複数のnについての modified precisionを総合したGEO-BLEUを下記式(8)によって算出する。
【0084】
【数8】
【0085】
すなわち、式(8)で算出したGEO-BLEUが、比較対象の類似性を示すスコアとなる。なお、判定部33は、算出したスコアを判定結果としてもよく、スコアが閾値以上か否かにより比較対象が類似しているか否かを判定結果としてもよい。
【0086】
生成部34は、判定部33の判定結果に基づいたコンテンツを生成する。例えば、生成部34は、比較対象の類似性の判定結果(類似しているか否かや、GEO-BLEUのスコア)を示すコンテンツを生成する。また、生成部34は、対象となる利用者の経路のうち、他の利用者と類似性が高い経路の情報を示すコンテンツを生成する。また、生成部34は、対象となる利用者の経路と類似性が高い経路を移動した他の利用者の特徴(例えば、属性情報から抽出される特徴等)を示すコンテンツを生成する。また、生成部34は、類似性が高い経路を移動した利用者をグルーピングし、グループ毎に経路の情報とグループの特徴(例えば、属性情報から抽出される特徴等)とを紐付けたコンテンツを生成する。また、生成部34は、対象となる利用者の経路と類似性が高い経路を移動した他の利用者の他の経路の情報を提案するコンテンツを生成する。
【0087】
また、生成部34は、対象となる利用者の行動のうち、他の利用者と類似性が高い行動の情報を示すコンテンツを生成する。また、生成部34は、対象となる利用者の行動と類似性が高い行動を行った他の利用者の特徴(例えば、属性情報から抽出される特徴等)を示すコンテンツを生成する。また、生成部34は、類似性が高い行動を行った利用者をグルーピングし、グループ毎に行動の情報とグループの特徴(例えば、属性情報から抽出される特徴等)とを紐付けたコンテンツを生成する。また、生成部34は、対象となる利用者の行動と類似性が高い行動を行った他の利用者の他の行動の情報を提案するコンテンツを生成する。
【0088】
また、生成部34は、対象となる利用者の会話のうち、他の利用者と類似性が高い会話の情報を示すコンテンツを生成する。また、生成部34は、対象となる利用者の会話と類似性が高い行動を行った他の利用者の特徴(例えば、属性情報から抽出される特徴等)を示すコンテンツを生成する。また、生成部34は、類似性が高い会話を行った利用者をグルーピングし、グループ毎に会話の情報とグループの特徴(例えば、属性情報から抽出される特徴等)とを紐付けたコンテンツを生成する。また、生成部34は、対象となる利用者の会話と類似性が高い会話を行った他の利用者の他の会話の情報を提案するコンテンツを生成する。
【0089】
つづいて、情報処理装置1は、生成したコンテンツを、例えば、利用者端末100を介して利用者へ提供する(ステップS9)。また、情報処理装置1は、例えば、利用者の経路を研究している事業者(位置ログを収集した利用者以外のユーザ)等に対して、生成したコンテンツを提供してもよい。
【0090】
提供部35は、生成したコンテンツを、例えば、利用者端末100を介して利用者へ提供する。また、提供部35は、例えば、比較対象を研究している事業者等に対して、生成したコンテンツを提供してもよい。
【0091】
次に、図5図7を用いて、実施形態に係る情報処理装置1が実行する処理の処理手順について説明する。図5は、実施形態に係る経路の類似度判定処理の処理手順を示すフローチャートである。図6は、実施形態に係るウェブ上における行動の類似度判定処理の処理手順を示すフローチャートである。図7は、実施形態に係る会話の類似度判定処理の処理手順を示すフローチャートである。
【0092】
まず、図5を用いて、経路の類似度判定処理について説明する。図5に示すように、制御部3は、まず、ログサーバ200に対して位置ログを要求し(ステップS101)、ログサーバ200から位置ログを取得する(ステップS102)。
【0093】
つづいて、制御部3は、利用者毎に経路を特定し(ステップS103)、特定した経路を構成する各地点に対応付けられたセマンティック情報を特定する(ステップS104)。
【0094】
つづいて、制御部3は、各地点の類似性と、各地点に対応付けられたセマンティック情報の類似性とに基づいて、複数の経路の類似性を判定する(ステップS105)。
【0095】
つづいて、制御部3は、経路の類似性の判定結果に基づいたコンテンツを生成し(ステップS106)、生成したコンテンツを外部(利用者端末100等)へ提供し(ステップS107)、処理を終了する。
【0096】
次に、図6を用いて、ウェブ上における行動の類似度判定処理について説明する。図6に示すように、制御部3は、まず、ログサーバ200に対して行動ログを要求し(ステップS201)、ログサーバ200から行動ログを取得する(ステップS202)。
【0097】
つづいて、制御部3は、利用者毎の行動を特定し(ステップS203)、特定した行動に関連する各動作に対応付けられたセマンティック情報を特定する(ステップS204)。
【0098】
つづいて、制御部3は、各動作の類似性と、各動作に対応付けられたセマンティック情報の類似性とに基づいて、複数の行動の類似性を判定する(ステップS205)。
【0099】
つづいて、制御部3は、行動の類似性の判定結果に基づいたコンテンツを生成し(ステップS206)、生成したコンテンツを外部(利用者端末100等)へ提供し(ステップS207)、処理を終了する。
【0100】
次に、図7を用いて、会話の類似度判定処理について説明する。図7に示すように、制御部3は、まず、ログサーバ200に対して会話ログを要求し(ステップS301)、ログサーバ200から会話ログを取得する(ステップS302)。
【0101】
つづいて、制御部3は、会話毎に会話を構成するメッセージを特定し(ステップS303)、各メッセージに対応付けられたセマンティック情報を特定する(ステップS304)。
【0102】
つづいて、制御部3は、各メッセージの類似性と、各メッセージに対応付けられたセマンティック情報の類似性とに基づいて、複数の会話の類似性を判定する(ステップS305)。
【0103】
つづいて、制御部3は、会話の類似性の判定結果に基づいたコンテンツを生成し(ステップS306)、生成したコンテンツを外部(利用者端末100等)へ提供し(ステップS307)、処理を終了する。
【0104】
〔その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の一部を手動的に行うこともできる。あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0105】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0106】
例えば、図3に示した記憶部4の一部又は全部は、各装置によって保持されるのではなく、ストレージサーバ等に保持されてもよい。この場合、各装置は、ストレージサーバにアクセスすることで、各種情報を取得する。
【0107】
〔ハードウェア構成〕
また、上述してきた実施形態に係る情報処理装置1は、例えば図8に示すような構成のコンピュータ1000によって実現される。図8は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
【0108】
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一時的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ等により実現される。
【0109】
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。
【0110】
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。
【0111】
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
【0112】
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
【0113】
例えば、コンピュータ1000が情報処理装置1として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部3の機能を実現する。
【0114】
〔効果〕
上述してきたように、実施形態に係る情報処理装置1は、特定部32と、判定部33とを備える。特定部32は、比較対象となる複数の経路それぞれを構成する各地点に対応付けられたセマンティック情報を特定する。判定部33は、複数の経路同士での比較において、各地点の類似性と、各地点に対応付けられたセマンティック情報の類似性とに基づいて、複数の経路の類似性を判定する。このような構成により、経路の類似性判定を高精度に行うことができる。
【0115】
また、実施形態に係る情報処理装置1は、特定部32と、判定部33とを備える。特定部32は、比較対象となる複数の利用者がウェブ上において行った行動に関連する各動作に対応付けられたセマンティック情報を特定する。判定部33は、行動同士での比較において、各動作の類似性と、各動作に対応付けられたセマンティック情報の類似性とに基づいて、複数の行動の類似性を判定する。このような構成により、行動の類似性判定を高精度に行うことができる。
【0116】
また、実施形態に係る情報処理装置1は、特定部32と、判定部33とを備える。特定部32は、比較対象となる複数の会話それぞれを構成する各メッセージに対応付けられたセマンティック情報を特定する。判定部33は、会話同士での比較において、各メッセージの類似性と、各メッセージに対応付けられたセマンティック情報の類似性とに基づいて、複数の会話の類似性を判定する。このような構成により、会話の類似性判定を高精度に行うことができる。
【0117】
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0118】
〔その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0119】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0120】
また、上述してきた実施形態に記載した各処理は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0121】
また、上記してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、制御部3は、制御手段や制御回路に読み替えることができる。
【符号の説明】
【0122】
1 情報処理装置
2 通信部
3 制御部
4 記憶部
31 取得部
32 特定部
33 判定部
34 生成部
35 提供部
41 利用者情報
100 利用者端末
200 ログサーバ
S 情報処理システム
図1A
図1B
図1C
図2
図3
図4
図5
図6
図7
図8