【文献】
澁谷 慧一郎,遠山 元道,自己組織化マップを利用する分類済み階層の自動設定,電子情報通信学会 第18回データ工学ワークショップ論文集 [online],日本,電子情報通信学会データ工学研究専門委員会,2009年 7月 9日,【ISSN】1347-4413
【文献】
加藤 由花,川口 賢二,箱崎 勝也,オンラインショッピングを対象とした正確性と意外性のバランスを考慮したリコメンダシステム,情報処理学会論文誌 第46巻 No.SIG13(TOD27),日本,社団法人情報処理学会,2005年 9月15日,第46巻第SIG13TOD27号【ISSN】0387-5806,p.53-p.64
【文献】
杉本 拓弥,豊田 哲也,延原 肇,完全グラフによる異ジャンル間の嗜好傾向表現と協調フィルタリングの発見性向上への応用,第73回(平成23年)全国大会講演論文集(1) アーキテクチャ ソフトウェア科学・工学 データベースとメディア,日本,一般社団法人情報処理学会,2011年 3月 2日,p.1-621-p.1-622
(58)【調査した分野】(Int.Cl.,DB名)
【発明の概要】
【発明が解決しようとする課題】
【0004】
上記従来技術では、需用者への質問に対する選択肢と、需用者に対して提示する商品との対応付けを予め行っておく必要があった。また、この対応付けを、サービスの提供者が人手で実施すると、そのための多大な手間を必要とすると共に、対応付けに対して提供者によるバイアスがかかることとなる。
【0005】
そこで本発明は、需用者からの回答に応じた商品に関する情報の提示に際して、需用者からの回答と商品との対応付けを、商品の提供者によるバイアスを排除して、人手によらずに容易に行うことを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するために、本発明の一側面に係るレコメンド情報提示装置は、複数の商品に関するテキスト情報から抽出された語句を機械的に分類し、分類された1以上の語句からなるトピックを複数生成するトピック生成手段と、商品に関するテキスト情報に含まれる語句を1以上のトピック別に分類することで求めた、該トピック別の語句の出現頻度を含む商品プロファイルを商品ごとに生成する商品プロファイル生成手段と、トピック生成手段により生成されたトピックのうちの、少なくとも2つのトピックに含まれる語句をトピック毎にユーザ端末に提示するトピック提示手段と、トピック提示手段によるトピックの提示に応じた、ユーザ端末からのトピックの選択を受け付ける受付手段と、受付手段により受け付けられたユーザ端末のユーザによるトピックの選択傾向に応じた商品プロファイルに対応付けられた商品に関する情報をレコメンド情報としてユーザ端末に提示するレコメンド情報提示手段と、を備える。
【0007】
本発明の一側面に係るレコメンド情報提示方法は、商品に関するレコメンド情報をユーザ端末に提示するレコメンド情報提示装置におけるレコメンド情報提示方法であって、複数の商品に関するテキスト情報から抽出された語句を機械的に分類し、分類された1以上の語句からなるトピックを複数生成するトピック生成ステップと、商品に関するテキスト情報に含まれる語句を1以上のトピック別に分類することで求めた、該トピック別の語句の出現頻度を含む商品プロファイルを商品に対応付けて生成する商品プロファイル生成ステップと、トピック生成ステップにおいて生成されたトピックのうちの、少なくとも2つのトピックに含まれる語句をトピック毎にユーザ端末に提示するトピック提示ステップと、提示ステップにおけるトピックの提示に応じた、ユーザ端末からのトピックの選択を受け付ける受付ステップと、受付ステップにおいて受け付けられたユーザ端末のユーザによるトピックの選択傾向に応じた商品プロファイルに対応付けられた商品に関する情報をレコメンド情報としてユーザ端末に提示するレコメンド情報提示ステップと、を有する。
【0008】
本発明の一側面に係るレコメンド情報提示プログラムは、コンピュータを、商品に関するレコメンド情報をユーザ端末に提示するレコメンド情報提示装置として機能させるためのレコメンド情報提示プログラムであって、コンピュータに、複数の商品に関するテキスト情報から抽出された語句を機械的に分類し、分類された1以上の語句からなるトピックを複数生成するトピック生成機能と、商品に関するテキスト情報に含まれる語句を1以上のトピック別に分類することで求めた、該トピック別の語句の出現頻度を含む商品プロファイルを商品ごとに生成する商品プロファイル生成機能と、トピック生成機能により生成されたトピックのうちの、少なくとも2つのトピックに含まれる語句をトピック毎にユーザ端末に提示するトピック提示機能と、提示機能によるトピックの提示に応じた、ユーザ端末からのトピックの選択を受け付ける受付機能と、受付機能により受け付けられたユーザ端末のユーザによるトピックの選択傾向に応じた商品プロファイルに対応付けられた商品に関する情報をレコメンド情報としてユーザ端末に提示するレコメンド情報提示機能と、を実現させる。
【0009】
上記側面によれば、商品に関するテキスト情報から抽出した語句を機械的に分類したトピックをユーザに提示し、商品に関するテキスト情報に含まれる語句のトピックに対する分布の傾向にユーザによるトピックの選択傾向が所定の程度以上一致する商品が抽出され、抽出された商品に関する情報がユーザに対するレコメンド情報として提示される。即ち、トピックは、人手を介さずに機械的に生成される。また、ユーザによるトピックの選択傾向に応じて提示する商品の抽出は、商品に関するテキスト情報に含まれる語句のトピック別の出現頻度に基づき行われる。従って、ユーザにより選択されるトピックとユーザに提示する商品との対応づけが、商品の提供者によるバイアスがかかることなく、人手を介さずに容易に行われることが可能となる。
【0010】
別の側面に係るレコメンド情報提示装置では、トピック提示手段は、2つのトピックを提示し、受付手段は、トピック提示手段により提示された2つのトピックのうちのいずれかのトピックに対する選択を受け付けることとしてもよい。
【0011】
この側面によれば、ユーザは2つのトピックのうちの、より重視するトピックを選択する判断をすれば良いので、ユーザにおける選択の回答が容易である。
【0012】
さらに別の側面に係るレコメンド情報提示装置では、トピック提示手段は、トピック生成手段により生成された1のトピックに含まれる語句と、トピック生成手段により生成された他のトピックに含まれる語句との類似の程度をトピック間の距離として算出し、所定以上の距離を有する1のトピックと他のトピックとを提示してもよい。
【0013】
この側面によれば、互いに距離が遠い2つのトピックがユーザに提示されるので、より効果的にユーザが重視するトピックの選択傾向を取得できる。また、ユーザは、距離が遠いトピックのうちのいずれかを選択するので、ユーザにおける選択の判断が容易である。
【0014】
さらに別の側面に係るレコメンド情報提示装置では、トピック提示手段は、トピック生成手段により生成された1のトピックを選択し、選択した1のトピックに含まれる語句の出現頻度が所定頻度以上である商品プロファイルのいずれにおいても語句の出現頻度が所定頻度未満である他のトピックを特定し、1のトピックと他のトピックとを提示してもよい。
【0015】
この側面によれば、特定された他のトピックに含まれる語句は、1のトピックがユーザによって選択された場合にユーザ端末に提示されるどの商品の商品プロファイルにおいても出現頻度が低い。これにより、他のトピックを選択した場合に提示される商品の集合は、1のトピックを選択した場合に提示される商品の集合とは全く異なるものとなる。従って、そのように選択された1のトピック及び特定された他のトピックを提示することにより、ユーザにおける選択の判断が容易となる。
【0016】
さらに別の側面に係るレコメンド情報提示装置では、トピック提示手段は、3つ以上のトピックを提示し、受付手段は、トピック提示手段により提示された3つ以上のトピックのうちの少なくとも1つ以上のトピックに対する選択を受け付けることとしてもよい。
【0017】
上記側面によれば、3つ以上のトピックがユーザに対して提示されるので、ユーザが重視しているトピックが、提示されたトピックに含まれる可能性が高められる。従って、ユーザが重視しているトピックの特定が容易である。
【0018】
さらに別の側面に係るレコメンド情報提示装置では、受付手段は、1以上のトピックに対する重み付けを含む選択を受け付け、レコメンド情報提示手段は、重み付けを含むトピックに対する選択により示されるユーザによる選択傾向に基づき、レコメンド情報を提示してもよい。
【0019】
上記側面によれば、重み付けを伴うトピックに対する選択が受け付けられるので、ユーザのトピックに対する選択傾向を詳細に特定できる。
【0020】
さらに別の側面に係るレコメンド情報提示装置では、トピック提示手段は、受付手段により1以上のトピックに対する所定程度以上の重みを伴う選択をユーザ端末から受け付けた場合に、当該トピックに含まれる複数の語句が機械的に分類された複数の語句からなる複数のサブトピックを当該ユーザ端末に提示してもよい。
【0021】
上記側面によれば、所定程度以上の重みを伴って選択されたトピックに含まれる語句がサブトピックに更に分類され、サブトピックに対する選択を受け付けることが可能となるので、ユーザのトピックに対する選択傾向をさらに詳細に特定できる。
【0022】
さらに別の側面に係るレコメンド情報提示装置では、トピック提示手段は、ユーザ端末に提示した複数のトピックのうちの、所定程度以上の重みを伴う選択が受け付けられたトピック以外の複数のトピックがマージされた統合トピックを当該ユーザ端末に提示してもよい。
【0023】
この側面によれば、ユーザにより所定程度以上の重みを伴って選択されなかった複数のトピックが統合トピックとしてマージされ、ユーザが重視していないトピックの数が減少されることとなるので、ユーザが重視するトピックの選択が容易となる。
【発明の効果】
【0024】
本発明の一側面によれば、需用者からの回答に応じた商品に関する情報の提示に際して、需用者からの回答と商品との対応付けを、商品の提供者によるバイアスを排除して、人手によらずに容易に行うことが可能となる。
【発明を実施するための形態】
【0026】
以下、添付図面を参照しながら本発明の実施形態を詳細に説明する。なお、図面の説明において同一又は同等の要素には同一の符号を付し、重複する説明を省略する。
【0027】
図1は、本実施形態に係るレコメンド情報提示装置を含むレコメンド情報提示システム100の構成を示す図である。レコメンド情報提示装置1は、例えば、ユーザに商品を提供する電子商取引サイトの一部を構成する。
図1に示すように、レコメンド情報提示システム100は、レコメンド情報提示装置1、ユーザ端末T及びデータベース群20を含む。ユーザ端末Tとレコメンド情報提示装置1とはインターネットなどのネットワークNを介して接続されている。レコメンド情報提示装置1は、インターネットや専用線などのネットワークを介してデータベース群20にアクセスできる。なお、
図1では3台のユーザ端末Tを示しているが、ユーザ端末Tの台数は限定されない。データベース群20は、コンテンツデータベース21,トピック記憶部22及び商品プロファイル記憶部23を含む。
【0028】
コンテンツデータベース21は、ユーザに提供される商品に関する情報を記憶しているデータベースである。商品に関する情報は、商品の特徴や属性を示すテキスト情報を含む。なお、商品は、ユーザに提供される物財全般であって、例えば、物、サービス、旅行予約等を含む概念である。
【0029】
トピック記憶部22は、レコメンド情報提示装置1により生成されたトピックを記憶する記憶手段である。トピックは、商品に関するテキスト情報から機械的に抽出された語句を、例えば、LDA(Latent Dirichlet Allocation)といった機械的なクラスタリング手法により分類した語句のまとまりである。
【0030】
商品プロファイル記憶部23は、商品ごとの商品プロファイルを記憶する記憶手段である。商品プロファイルは、商品に関するテキスト情報に含まれる複数の語句の、トピックに対する分布の傾向を示す情報である。
【0031】
ユーザ端末Tの種類は限定されず、例えば据置型又は携帯型のパーソナルコンピュータでもよいし、高機能携帯電話機(スマートフォン)や携帯電話機、携帯情報端末(PDA)などの携帯端末でもよい。
【0032】
図2は、本実施形態に係るレコメンド情報提示装置1の機能的構成を示すブロック図である。レコメンド情報提示装置1は、商品に関するレコメンド情報をユーザ端末Tに提示する装置であって、例えばサーバといったコンピュータにより構成される。
【0033】
より具体的には、レコメンド情報提示装置1は、ユーザに対して複数のトピックを提示し、ユーザからのトピックの選択を受け付け、受け付けたトピックの選択傾向に応じて、ユーザに商品に関するレコメンド情報を提示する。本実施形態のレコメンド情報提示装置1は、選択を受け付けたトピックと、レコメンド情報を提示する商品との対応付けを、人手を介さずに機械的に実施することにより、提示するレコメンド情報の抽出において商品の提供者によるバイアスを排除し、且つ容易なレコメンド情報の提示を可能にする。
【0034】
本実施形態のレコメンド情報提示装置1は、
図2に示すように、機能的には、トピック生成部11(トピック生成手段)、商品プロファイル生成部12(商品プロファイル生成手段)、トピック提示部13(トピック提示手段)、受付部14(受付手段)、抽出部15(レコメンド情報提示手段)及びレコメンド情報提示部16(レコメンド情報提示手段)を含む。また、レコメンド情報提示装置1の各機能部11〜16は、データベース群20にアクセス可能である。
【0035】
図3は、レコメンド情報提示装置1のハードウェア構成図である。レコメンド情報提示装置1は、物理的には、
図3に示すように、CPU101、RAM及びROMといったメモリにより構成される主記憶装置102、ハードディスク等で構成される補助記憶装置103、ネットワークカード等で構成される通信制御装置104、入力デバイスであるキーボード、マウス等の入力装置105、ディスプレイ等の出力装置106などを含むコンピュータシステムとして構成されている。
【0036】
図2に示した各機能は、
図3に示すCPU101、主記憶装置102等のハードウェア上に所定のコンピュータソフトウェア(レコメンド情報提示プログラム)を読み込ませることにより、CPU101の制御のもとで通信制御装置104、入力装置105、出力装置106を動作させるとともに、主記憶装置102や補助記憶装置103におけるデータの読み出し及び書き込みを行うことで実現される。処理に必要なデータやデータベースは主記憶装置102や補助記憶装置103内に格納される。
【0037】
続いて、レコメンド情報提示装置1の機能部を説明する。トピック生成部11は、1以上の語句からなるトピックを生成する部分である。具体的には、トピック生成部11は、コンテンツデータベース21から取得した複数の商品に関するテキスト情報から、例えば形態素解析といった手法により、機械的に語句を抽出する。抽出される語句は、例えば、名詞及び形容詞等である。商品に関するテキスト情報は、例えば、当該商品に関するユーザによるレビュー、当該商品の説明文、当該商品の属性情報等である。
【0038】
次に、トピック生成部11は、テキスト情報から抽出した語句を、例えば、LDA(Latent Dirichlet Allocation)といったクラスタリング手法により機械的に分類する。そして、トピック生成部11は、分類した語句のまとまりをトピックとしてトピック記憶部22に記憶させる。
【0039】
なお、トピック生成部11は、ほとんどのテキスト情報に含まれるような語句をトピックに分類しないこととしてもよい。商品が例えば、旅行や宿泊のサービスであって、商品に関するテキスト情報が宿泊施設のレビューである場合には、「ホテル」、「レビュー」といった語句はトピックに分類されない。
【0040】
図4は、トピック記憶部22に記憶されているトピックの例を模式的に示す図である。
図4に示すように、トピック記憶部22は、トピックA,B,C,・・・といった複数のトピックを記憶している。トピックAは、料理、夕食、刺身等の語句を含む。トピックBは、温泉、湯、源泉等の語句を含む。トピックCは、シャンプー、ドライヤー、タオル等の語句を含む。これらのトピックは、機械的に生成されるものであるので、商品の提供者のバイアスを含まない。
【0041】
商品プロファイル生成部12は、商品に関するテキスト情報に含まれる語句を1以上の前記トピック別に分類することで求めた、該トピック別の語句の出現頻度を含む商品プロファイルを商品ごとに生成する部分である。具体的には、商品プロファイル生成部12は、コンテンツデータベース21に記憶されている商品に関するテキスト情報に、トピック記憶部22に記憶された各トピックの語句が、どのように含まれるか、商品ごとに集計する。そして、商品プロファイル生成部12は、集計した情報を商品ごとに商品プロファイルとして商品プロファイル記憶部23に記憶させる。
【0042】
図5は、商品が、例えば宿泊施設(ホテル)の宿泊サービスである場合の、商品プロファイル記憶部23に記憶されている商品プロファイルの例を模式的に示す図である。
図5(a)は、宿泊施設としてのホテル1の商品プロファイルを表しており、ホテル1に関するレビュー等のテキスト情報が、各トピックの語句をどのくらい含んでいるのかが棒グラフにより示されている。
図5(a)によれば、ホテル1に関するテキスト情報は、トピックBの語句を比較的多く含んでいることが判る。また、
図5(b)は、宿泊施設としてのホテル2の商品プロファイルを表しており、ホテル2に関するレビュー等のテキスト情報が、各トピックの語句をどのくらい含んでいるのかが棒グラフにより示されている。
図5(b)によれば、ホテル2に関するテキスト情報は、トピックDの語句を比較的多く含んでいることが判る。
【0043】
なお、
図5は、商品プロファイルの例を模式的に示したものであるので、商品プロファイルは、例えば、商品に関するテキスト情報が含む各トピックの語句の数及び割合等を要素とするベクトルデータとして生成されることとしてもよい。また、商品プロファイルに示される、テキスト情報が含む各トピックの語句の数は、適宜、正規化されることとしてもよい。
【0044】
トピック提示部13は、トピック生成部11により生成されたトピックのうちの、少なくとも2つのトピックに含まれる語句をトピック毎にユーザ端末Tに提示する部分である。
【0045】
トピック提示部13は、例えば、2つのトピック及びそれらのトピックに含まれる語句をユーザ端末Tに表示させる。
図6(a)は、ユーザ端末Tにおいて表示されたトピックの例を示す図である。
図6(a)に示すように、トピック提示部13は、例えば、トピックA及びトピックBの2つのトピックを、「どちらを重視しますか?」といったメッセージと共に、ユーザ端末Tに表示させる。なお、図示されていないが、各トピックの枠の中に、トピックに含まれる語句が表示される。
【0046】
なお、トピック提示部13は、1のトピックに含まれる語句と他のトピックに含まれる語句との類似の程度をトピック間の距離として算出し、所定以上の距離を有する1のトピックと他のトピックとを提示することとしてもよい。語句の類似の程度は、周知の言語処理技術を用いて解析することにより得られる。このようにトピックを提示することにより、より効果的にユーザが重視するトピックの選択傾向を取得できる。また、ユーザは、距離が遠いトピックのうちのいずれかを選択するので、ユーザにおける選択の判断が容易である。
【0047】
また、トピック提示部13は、トピック生成部11により生成されたトピックから1のトピックを選択し、選択した1のトピックに含まれる語句の出現頻度が所定頻度以上の商品プロファイルにおいて語句の出現頻度が所定頻度未満の他のトピックを特定し、1のトピックと他のトピックとを提示してもよい。もし任意の2のトピックを提示すると、ユーザにとってはどちらを重視すべきか選択に迷う場合がある。しかし、このように特定された他のトピックに含まれる語句は、1のトピックがユーザによって選択された場合にユーザ端末に提示されるどの商品の商品プロファイルにおいても出現頻度が低い。そのため他のトピックを選択した場合に提示される商品の集合は、1のトピックを選択した場合に提示される商品の集合とは全く異なると考えられる。そのように選択された1のトピック及び特定された他のトピックを提示することにより、ユーザにおける選択の判断が容易となる。
【0048】
また、トピック提示部13は、3つ以上のトピック及びそれらのトピックに含まれる語句をユーザ端末Tに表示させることとしてもよい。
図6(b)は、ユーザ端末Tにおいて表示されたトピックの例を示す図である。
図6(b)に示すように、トピック提示部13は、例えば、トピックA〜Eの5つのトピックを、「重視するトピックを3つ選んでください」といったメッセージと共に、ユーザ端末Tに表示させる。なお、図示されていないが、各トピックの枠の中に、トピックに含まれる語句が表示される。このようにトピックを3つ以上のトピックを提示することにより、提示されたトピックにユーザが重視しているトピックが含まれる可能性を高められる。従って、ユーザが重視しているトピックの特定が容易となる。
【0049】
受付部14は、トピック提示部13によるトピックの提示に応じた、ユーザ端末Tからのトピックの選択を受け付ける部分である。
図7は、トピックの選択の例を模式的に示す図である。
図7(a)に示す例では、ユーザは、トピック提示部13により提示されたトピックA及びトピックBのうち、トピックAを選択している。この選択操作に応じて、受付部14は、トピックAが選択された旨の情報を受け付ける。また、
図7(b)に示す例では、トピック提示部13により提示されたトピックC及びトピックDのうち、ユーザは、トピックDを選択している。この選択操作に応じて、受付部14は、トピックDが選択された旨の情報を受け付ける。
【0050】
このように、受付部14がトピックA及びトピックDに対する選択を受け付けることにより、レコメンド情報提示装置1は、ユーザがトピックA、Dを重視していることを認識できる。そして、トピックA及びトピックDに対する選択を受け付けることにより、後述するように、抽出部15は、そのような選択傾向を示すユーザプロファイルを生成できる。なお、受付部14は、ユーザが重視していないトピックの選択を受け付けることとしてもよい。
【0051】
図8は、3つ以上のトピックがユーザ端末Tに提示された場合におけるトピックの選択の例を模式的に示す図である。
図8(a)に示す例では、ユーザは、トピック提示部13により提示されたトピックA〜Eのうち、トピックA,C,Dを選択している。この選択操作に応じて、受付部14は、トピックA,C,Dが選択された旨の情報を受け付ける。
【0052】
また、受付部14は、3つ以上のトピックの提示に応じた、1以上のトピックに対する重み付けを含む選択を受け付けることとしてもよい。
図8(b)は、トピックに対する、重み付けを含む選択の受け付けの例を模式的に示す図である。この場合には、例えば、トピック提示部13が、トピックA〜Eの5つのトピックを、「重視するトピックに5個の星を割り振ってください」といったメッセージと共に、ユーザ端末Tに表示させる。そして、ユーザ端末Tにおいて、星の数により重み付けが表された選択の操作が行われると、受付部14は、トピックB及びトピックDに対する重み付け「2」を伴う選択、並びにトピックEに対する重み付け「1」を伴う選択を受け付ける。
【0053】
抽出部15は、受付部14により受け付けられたユーザ端末のユーザによるトピックの選択に関する選択傾向に応じた商品プロファイルを取得する部分である。具体的には、例えば、抽出部15は、受付部14により受け付けられたユーザ端末のユーザによるトピックの選択に基づき、ユーザのトピックに対する選択傾向を示す情報であるユーザプロファイルを生成し、ユーザプロファイルに示される選択傾向と、トピック別の語句の出現頻度の分布傾向が所定の程度以上一致する商品プロファイルを抽出する。
【0054】
抽出部15は、例えば、ユーザによるトピックの選択傾向を示すユーザプロファイルを、ベクトルデータとして生成できる。
図7に示す例のようなユーザによるトピックの選択が受付部14により受け付けられた場合には、抽出部15は、トピックA,B,C,D,・・・に対する選択の有無を要素とするベクトルデータ(1,0,0,1,・・・)をユーザプロファイルとして生成する。
【0055】
また、
図8(a)に示す例のようなユーザによるトピックの選択が受付部14により受け付けられた場合には、抽出部15は、トピックA,B,C,D,E,・・・に対する選択の有無を要素とするベクトルデータ(1,0,1,1,0,・・・)をユーザプロファイルとして生成する。
【0056】
また、
図8(b)に示す例のようなユーザによるトピックの選択が受付部14により受け付けられた場合には、抽出部15は、トピックA,B,C,D,E,・・・に対する重み付けを要素とするベクトルデータ(0,2,0,2,1,・・・)をユーザプロファイルとして生成する。
【0057】
なお、ここでは、ユーザプロファイルがベクトルデータとして生成される例を説明したが、ユーザプロファイルは、ベクトルに限定されず、ユーザによるトピックの選択傾向を表すことが可能なデータ形式であればどのような形式であってもよい。
【0058】
そして、抽出部15は、生成したユーザプロファイルに示されるトピックの選択傾向と、所定の程度以上一致する分布傾向を示す商品プロファイルを商品プロファイル記憶部23から抽出する。前述のとおり、商品プロファイル記憶部23は、商品に関するテキスト情報に含まれる語句の各トピックに対する分布傾向を示す情報を商品プロファイルとして当該商品ごとに記憶している。ユーザプロファイル及び商品プロファイルがいずれもベクトルデータとして生成されている場合には、抽出部15は、ベクトル間の距離を算出することにより、ユーザプロファイルと商品プロファイルとの一致の程度を得ることができる。
【0059】
また、抽出部15は、ユーザプロファイルをベクトルデータとして算出せずに、商品プロファイルを抽出することとしてもよい。具体的には、
図8(b)に示すように、受付部14により、トピックB及びトピックDに対する重み付け「2」を伴う選択、並びにトピックEに対する重み付け「1」を伴う選択が受け付けられた場合に、抽出部15は、トピックB,D,Eに含まれる語句を所定の程度以上含むことを示す商品プロファイルを抽出する。そして、トピックB,Dに対する重み付けがトピックEに対する重み付けより多いので、抽出部15は、商品に関するテキスト情報に含まれる各トピックの語句の程度が、トピックB,D,Eの順またはトピックD,B,Eの順に多いことを示す商品プロファイルを検索することとしてもよい。
【0060】
レコメンド情報提示部16は、抽出部15により取得された商品プロファイルに対応付けられた商品に関する情報をレコメンド情報としてユーザ端末Tに提示する部分である。抽出部15において、ユーザのユーザプロファイルに示されるトピックの選択傾向に所定の程度以上一致する商品プロファイルが抽出されるので、抽出された商品プロファイルの商品は、ユーザが重視する要素を多く有するものである蓋然性が高い。レコメンド情報提示部16は、抽出された商品プロファイルの商品に関する情報をコンテンツデータベース21から取得して、取得した情報をレコメンド情報としてユーザ端末Tに提示する。
【0061】
次に、
図9を参照して、トピック提示部13によるトピックの提示の他の例を説明する。トピック提示部13は、受付部14により1以上のトピックに対する所定程度以上の重みを伴う選択をユーザ端末Tから受け付けた場合に、当該トピックに含まれる複数の語句が機械的に分類された複数の語句からなる複数のサブトピックを当該ユーザ端末Tに提示することとしてもよい。
【0062】
具体的には、例えば、
図9(a)に示すように、重み付けを伴うトピックの選択の受付において、ユーザ端末Tにより割り振り可能な重み付けの全てがトピックBに割り振られた場合に、トピック提示部13は、トピックBのサブトピックを当該ユーザ端末Tに提示する。サブトピックを提示する条件としては、例えば、トピックに割り振られる全ての重み付けのうちの所定割合(例えば50%)以上の重み付けが一のトピックに割り振られた場合に、当該一のトピックのサブトピックを生成することとしてもよい。
【0063】
トピック生成部11が、例えばLDAといったクラスタリング手法により複数のトピックを階層的に生成した場合には、トピック提示部13は、トピックBの下位の階層に位置するサブトピック(トピックB1〜B5)をトピック記憶部22から得ることができる。そして、トピック提示部13は、
図9(b)に示すように、次に当該ユーザにトピックを提示する機会に、トピックA,B1〜B5、トピックC,D,Eを提示する。
【0064】
サブトピックは、受付部14が所定程度以上の重みを伴うトピックの選択を受け付けたときに、当該トピックに含まれる語句に対して、例えばLDAといったクラスタリング手法により機械的に再分類を行って生成されることとしてもよい。
【0065】
また、トピック提示部13は、受付部14が所定程度以上の重みを伴うトピックの選択をユーザ端末Tから受け付けた場合に、当該トピックと所定の程度以上類似するトピックをトピック記憶部から抽出して当該ユーザ端末Tに提示することとしてもよい。トピック間の類似の程度は、各トピックに含まれる語句群に対する周知の言語解析手法により得られる。
【0066】
なお、サブトピックが生成された場合には、商品プロファイル生成部12が、生成されたサブトピックに合わせて商品プロファイルを再生成することとしてもよい。
【0067】
また、トピック提示部13は、ユーザ端末Tに提示した複数のトピックのうちの、所定程度以上の重みを伴う選択が受け付けられたトピック以外の複数のトピックがマージされた統合トピックを当該ユーザ端末Tに提示することとしてもよい。
【0068】
例えば、
図9(a)に示されるように、重み付けを伴うトピックの選択の受付において、割り振り可能な重み付けの全てがトピックBに割り振られ、
図9(b)に示されるように、トピックBのサブトピックであるトピックB1〜B5が生成された場合において、
図9(c)に示されるように、トピック提示部13は、トピックA、Cがマージされた統合トピックであるトピックα及びトピックD、Eがマージされた統合トピックであるトピックβを提示することとしてもよい。
【0069】
トピック生成部11が、例えばLDAといったクラスタリング手法により複数のトピックを階層的に生成した場合には、トピック提示部13は、トピックA,C,D,Eの上位の階層に位置するトピックを統合トピックとしてトピック記憶部22から得ることができる。
【0070】
また、トピック生成部11は、受付部14が所定程度以上の重みを伴うトピックの選択を受け付けたときに、2以上のトピックをマージして統合トピックを生成することとしてもよい。統合トピックにマージされるトピックとして、例えば、互いに所定の程度以上類似するトピックが選択されることとしてもよい。トピック間の類似の程度は、各トピックに含まれる語句群に対する周知の言語解析手法により得られる。
【0071】
ユーザ端末Tに提示された統合トピックに対する選択が受け付けられた場合、抽出部15は、当該統合トピックに割り当てられた重み付けを、統合前の各トピックに分配して、ユーザプロファイルを生成することとしてもよい。また、統合トピックが生成された場合には、商品プロファイル生成部12が、生成された統合トピックに合わせて商品プロファイルを再生成することとしてもよい。
【0072】
次に、
図10を参照して、本実施形態のレコメンド情報提示方法について説明する。
図10は、
図2に示したレコメンド情報提示装置1におけるレコメンド情報提示方法の処理内容の例を示すフローチャートである。
【0073】
まず、トピック生成部11は、コンテンツデータベース21から取得した複数の商品(例えば、ホテル等の施設)に関するテキスト情報から、例えば形態素解析といった手法により、機械的に語句を抽出する(S1)。次に、トピック生成部11は、テキスト情報から抽出した語句を、機械的なクラスタリング手法により分類して複数のトピックを生成する(S2)。続いて、商品プロファイル生成部12は、商品に関するテキスト情報に含まれる語句のトピックに対する分布の傾向を示す商品プロファイルを商品ごとに生成する(S3)。
【0074】
次に、トピック提示部13は、トピック生成部11により生成されたトピックのうちの、少なくとも2つのトピックに含まれる語句をトピック毎にユーザ端末Tに提示する(S4)。続いて、受付部14は、トピック提示部13によるトピックの提示に応じた、ユーザ端末Tからのトピックの選択を受け付ける(S5)。
【0075】
次に、抽出部15は、受付部14により受け付けられたトピックの選択に基づき、商品プロファイルを抽出する(S6)。具体的には、例えば、抽出部15は、ユーザによるトピックの選択に基づき、ユーザのトピックに対する選択傾向を示す情報であるユーザプロファイルを生成し、ユーザプロファイルに示される選択傾向と、所定の程度以上一致する分布傾向を示す商品プロファイルを抽出する。
【0076】
そして、レコメンド情報提示部16は、抽出部15により抽出された商品プロファイルに対応付けられた商品に関する情報をレコメンド情報としてユーザ端末Tに提示する(S7)。
【0077】
次に、
図11を参照して、コンピュータをレコメンド情報提示装置1として機能させるためのレコメンド情報提示プログラムを説明する。レコメンド情報提示プログラム1pは、メインモジュール10m、トピック生成モジュール11m、商品プロファイル生成モジュール12m、トピック提示モジュール13m、受付モジュール14m、抽出モジュール15m及びレコメンド情報提示モジュール16mを備える。
【0078】
メインモジュール10mは、レコメンド情報提示処理を統括的に制御する部分である。トピック生成モジュール11m、商品プロファイル生成モジュール12m、トピック提示モジュール13m、受付モジュール14m、抽出モジュール15m及びレコメンド情報提示モジュール16mを実行することにより実現される機能はそれぞれ、
図2に示されるレコメンド情報提示装置1のトピック生成部11、商品プロファイル生成部12、トピック提示部13、受付部14、抽出部15及びレコメンド情報提示部16の機能と同様である。
【0079】
レコメンド情報提示プログラム1pは、例えば、CD−ROMやDVD、ROM等の記憶媒体1dまたは半導体メモリによって提供される。また、レコメンド情報提示プログラム1pは、搬送波に重畳されたコンピュータデータ信号として通信ネットワークを介して提供されてもよい。
【0080】
以上説明した本実施形態のレコメンド情報提示装置1、レコメンド情報提示方法、レコメンド情報提示プログラム1pによれば、商品に関するテキスト情報から抽出した語句を機械的に分類したトピックをユーザに提示し、商品に関するテキスト情報に含まれる語句のトピックに対する分布の傾向にユーザによるトピックの選択傾向が所定の程度以上一致する商品が抽出され、抽出された商品に関する情報がユーザに対するレコメンド情報として提示される。即ち、トピックは、人手を介さずに機械的に生成される。また、ユーザによるトピックの選択傾向に応じて提示する商品の抽出は、商品に関するテキスト情報に含まれる語句のトピックに対する分布に基づき行われる。従って、ユーザにより選択されるトピックとユーザに提示する商品との対応づけが、商品の提供者によるバイアスがかかることなく、人手を介さずに容易に行われることが可能となる。
【0081】
以上、本発明をその実施形態に基づいて詳細に説明した。しかし、本発明は上記実施形態に限定されるものではない。本発明は、その要旨を逸脱しない範囲で様々な変形が可能である。
レコメンド情報提示装置は、複数の商品に関するテキスト情報から抽出された語句を機械的に分類し、分類された複数の語句からなるトピックを複数生成するトピック生成部と、商品のテキスト情報に含まれる語句の各トピックに対する分布の傾向を示す商品プロファイルを商品ごとに生成する商品プロファイル生成部と、少なくとも2つのトピックに含まれる語句をトピック毎にユーザ端末に提示するトピック提示部と、ユーザ端末からのトピックの選択を受け付ける受付部と、トピックの選択に基づき、ユーザのトピックに対する選択傾向を示す情報であるユーザプロファイルを生成し、ユーザプロファイルに示される選択傾向と、所定の程度以上一致する分布傾向を示す商品プロファイルを抽出する抽出部と、抽出された商品プロファイルに対応付けられた商品に関する情報をレコメンド情報としてユーザ端末に提示するレコメンド情報提示部と、を備える。