IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電信電話株式会社の特許一覧 ▶ 学校法人電子学園の特許一覧

特開2023-182172情報推薦システム、情報推薦方法、及び、情報推薦プログラム
<>
  • 特開-情報推薦システム、情報推薦方法、及び、情報推薦プログラム 図1
  • 特開-情報推薦システム、情報推薦方法、及び、情報推薦プログラム 図2
  • 特開-情報推薦システム、情報推薦方法、及び、情報推薦プログラム 図3
  • 特開-情報推薦システム、情報推薦方法、及び、情報推薦プログラム 図4
  • 特開-情報推薦システム、情報推薦方法、及び、情報推薦プログラム 図5
  • 特開-情報推薦システム、情報推薦方法、及び、情報推薦プログラム 図6
  • 特開-情報推薦システム、情報推薦方法、及び、情報推薦プログラム 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023182172
(43)【公開日】2023-12-26
(54)【発明の名称】情報推薦システム、情報推薦方法、及び、情報推薦プログラム
(51)【国際特許分類】
   G06F 16/36 20190101AFI20231219BHJP
【FI】
G06F16/36
【審査請求】未請求
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2022095637
(22)【出願日】2022-06-14
(71)【出願人】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(71)【出願人】
【識別番号】500298060
【氏名又は名称】学校法人電子学園
(74)【代理人】
【識別番号】100083806
【弁理士】
【氏名又は名称】三好 秀和
(74)【代理人】
【識別番号】100129230
【弁理士】
【氏名又は名称】工藤 理恵
(72)【発明者】
【氏名】釘本 健司
(72)【発明者】
【氏名】白井 大介
(72)【発明者】
【氏名】小倉 毅
(72)【発明者】
【氏名】鎌谷 修
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175DA01
5B175KA11
(57)【要約】
【課題】情報推薦システムにおいて情報検索処理の簡素化を実現可能な技術を提供する。
【解決手段】情報を推薦する情報推薦システム1において、キーワードに関連する情報を推薦する情報推薦モデルを生成し、キーワード間の関連性に基づき複数のキーワードを階層構造化した構造化データをナレッジベース20に格納する機械学習モジュール10と、所定のキーワードに関連する関連キーワードを前記ナレッジベース20から検索し、前記関連キーワードに関連する情報を推薦情報として出力するアイテム推薦モジュール30と、を備える。
【選択図】図1
【特許請求の範囲】
【請求項1】
情報を推薦する情報推薦システムにおいて、
キーワードに関連する情報を推薦する情報推薦モデルを生成し、キーワード間の関連性に基づき複数のキーワードを階層構造化した構造化データをナレッジベースに格納する機械学習部と、
所定のキーワードに関連する関連キーワードを前記ナレッジベースから検索し、前記関連キーワードに関連する情報を推薦情報として出力する情報推薦部と、
を備える情報推薦システム。
【請求項2】
前記情報推薦部は、
前記所定のキーワードよりも出現頻度又はスコアの高い上位キーワードを前記ナレッジベースから検索し、前記上位キーワードに関連する情報を推薦情報として出力する請求項1に記載の情報推薦システム。
【請求項3】
前記機械学習部は、
前記情報と前記キーワード間の関連性に基づく前記構造化データとを定期的又は非定期に動的に更新する請求項1に記載の情報推薦システム。
【請求項4】
情報を推薦する情報推薦方法において、
機械学習部が、キーワードに関連する情報を推薦する情報推薦モデルを生成し、キーワード間の関連性に基づき複数のキーワードを階層構造化した構造化データをナレッジベースに格納し、
情報推薦部が、所定のキーワードに関連する関連キーワードを前記ナレッジベースから検索し、前記関連キーワードに関連する情報を推薦情報として出力する、
情報推薦方法。
【請求項5】
請求項1に記載の情報推薦システムとしてコンピュータを機能させる情報推薦プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報推薦システム、情報推薦方法、及び、情報推薦プログラムに関する。
【背景技術】
【0002】
情報通信技術の高度化やクラウドサービスの普及と共に、スマートフォン端末や端末の機能を利用したアプリケーションサービスが拡大している。高速通信ネットワークの拡大も進み、ユーザはいつでもどこでもネットワーク越しに必要な情報にアクセスできる。
【0003】
一方、各種のインターネットコンテンツ提供サービスによりユーザに提供される情報は、特定のユーザを対象とした固有の情報というわけではなく、不特定多数のユーザ向けに構成された一般的な情報として提供されることが多い。また、ソーシャル・ネットワーキングサービスの普及により、各個人ユーザからも様々な形態で情報発信が行われるようになっている。
【0004】
このようなインターネット上に流通する情報量の増加により、ユーザが必要とする適切な情報を見つけ出すことは困難な状況にあり、情報検索サービスの利用が不可欠となっている。しかし、情報検索サービスが提供する情報検索結果についても、不特定多数のユーザ向けに構成された情報を提示する傾向にあり、適切な検索語をそもそも知らない場合や思いつかない場合には、情報を上手く取得することは困難である。
【0005】
そこで、膨大なコンテンツから適切な情報を検索して推薦する情報推薦システムが知られている(非特許文献1参照)。
【先行技術文献】
【非特許文献】
【0006】
【非特許文献1】Dietmar Jannach、外3名、“情報推薦システム入門-理論と実践-(Recommender Systems: An Introduction)”、田中克己・角谷和俊 監訳、共立出版株式会社、2012年12月10日初版2刷発刊
【発明の概要】
【発明が解決しようとする課題】
【0007】
上記情報推薦システムは、対人コミュニケーションの場面でも活用される。
【0008】
対人コミュニケーションにおいて、会話やチャット等を活性化するためには、会話の内容や主たる話題に応じた適切な情報推薦が必要とされる。つまり、会話の状況や主題を把握するためには、会話文から主たる話題をコンテキストとして把握する必要がある。
【0009】
これを実現するためには、会話文から主要なキーワードを抽出し、このキーワードを用いて推薦情報データベースから情報を検索し、その情報を話題として提供する方法が考えられる。しかし、会話から抽出されたキーワードを用いてデータベースを検索しても、適切な検索結果は得られない。そこで、会話に含まれるキーワードから当該キーワードの同義語・類義語・関連語・上位語・下位語・連想語等を含むシノニムを生成し、このシノニムを含むキーワード群で情報検索する方法が考えられる。
【0010】
しかしながら、自然言語におけるキーワード間の関連性を検索するためには、ありとあらゆる会話シーンに対応する大規模なシソーラスデータベースを必要とするため、情報検索処理機能が複雑となり、要求処理数の増加に伴って、検索時間が増加するという課題があった。
【0011】
本発明は、上記事情を鑑みてなされたものであり、本発明の目的は、情報推薦システムにおいて情報検索処理の簡素化を実現可能な技術を提供することである。
【課題を解決するための手段】
【0012】
本発明の一態様の情報推薦システムは、情報を推薦する情報推薦システムにおいて、キーワードに関連する情報を推薦する情報推薦モデルを生成し、キーワード間の関連性に基づき複数のキーワードを階層構造化した構造化データをナレッジベースに格納する機械学習部と、所定のキーワードに関連する関連キーワードを前記ナレッジベースから検索し、前記関連キーワードに関連する情報を推薦情報として出力する情報推薦部と、を備える。
【0013】
本発明の一態様の情報推薦方法は、情報を推薦する情報推薦方法において、機械学習部が、キーワードに関連する情報を推薦する情報推薦モデルを生成し、キーワード間の関連性に基づき複数のキーワードを階層構造化した構造化データをナレッジベースに格納し、情報推薦部が、所定のキーワードに関連する関連キーワードを前記ナレッジベースから検索し、前記関連キーワードに関連する情報を推薦情報として出力する。
【0014】
本発明の一態様の情報推薦プログラムは、上記情報推薦システムとしてコンピュータを機能させる。
【発明の効果】
【0015】
本発明によれば、情報推薦システムにおいて情報検索処理の簡素化を実現可能な技術を提供できる。
【図面の簡単な説明】
【0016】
図1図1は、アイテム推薦システムの構成例を示す図である。
図2図2は、構造化データの例を示す図である。
図3図3は、構造化データ及びアイテムの構成例を示す図である。
図4図4は、構造化データ及びアイテムの生成方法を示す図である。
図5図5は、構造化データ及びアイテムの構成例を示す図である。
図6図6は、アイテム推薦の処理フローを示す図である。
図7図7は、機械学習モジュールのハードウェア構成例を示す図である。
【発明を実施するための形態】
【0017】
以下、図面を参照して、本発明の実施形態を説明する。図面の記載において同一部分には同一符号を付し説明を省略する。
【0018】
[発明の概要]
情報推薦システムにおいては、協調型推薦、内容ベース型推薦、知識ベース型推薦等の方法が知られている。より的確な情報推薦を行うために、各種の方法を結合させて用いたハイブリッド型アプローチが有効とされている。また、情報推薦システムが使用される状況(コンテキスト)やユーザの状況(コンテキスト)に適応して情報を推薦するシステムも検討が進んでいる。
【0019】
特定のユーザを対象として、そのユーザに固有の情報サービスを提供するためには、ユーザの環境データ、プロファイルデータとしてのコンテキスト情報を取得し、そのコンテキストに合わせたサービスを提供する必要がある。
【0020】
また、現在の情報推薦システムは、オンラインショッピング、コンテンツストリーミング等、ユーザに様々な推薦サービスを提供しているが、ユーザの視点からは、推薦される情報が必ずしもユーザが必要とする情報ではないことも多く、ユーザにとって満足度の高いものではないという状況にある。
【0021】
これは、従来の情報推薦方法が、あるユーザと同様の購買履歴を持つユーザとの購買履歴の類似性を参照して推薦したり、購入履歴のあるコンテンツと類似性の高いコンテンツを推薦したりする方法を採用していることが原因であると考えられる。
【0022】
例えば、すでに視聴した映画に対して、同様の視聴傾向や類似の性質を持つとされる映画を推薦したとしても、ユーザの細かい嗜好や気分を反映することは困難であり、ユーザの時間や状況に応じて、よりパーソナルで価値のある情報を提供するサービスが求められている。
【0023】
つまり、ユーザのコンテキストを上手く収集し、そのコンテキストを構造化されたデータとして保存し分析して、より高度な情報検索を提供する必要がある。
【0024】
そこで、本発明では、ユーザ間のコミュニケーションを活性化するために、現在の会話の主たる話題に沿った適切な話題、画像、動画、付帯情報等を提供するための情報推薦方法を開示する。ここでのコミュニケーションとは、対面での会話に加えて、情報端末を用いたチャット等、テキストメッセージによるやり取り等も含む。
【0025】
本発明では、ユーザのコンテキストに応じた情報推薦を行う場合において、まずはユーザやユーザ以外の様々な環境データ、ユーザプロファイルデータを取得し、ナレッジベース(知識ベース)として格納しておく。このようなコンテキストデータは、ナレッジベース内でデータ間の関連性についても明示したデータとして格納しておく。
【0026】
また、本発明では、このようなナレッジベースに格納されるデータとして、構造化データと非構造化データとに大別する。非構造化データは、ログデータのような特にデータ構造を持たないデータとする。
【0027】
構造化データには、データ間の関係性を表現可能なResource Description Framework(RDF)を使用する。RDFでは、トリプルと呼ばれる主語、述語、目的語の組み合わせによってデータ間の関係性を記述し、それらを集めたデータをグラフ構造を持った構造化データとして格納することができる。
【0028】
その他、Web Ontology Language(OWL)では、OWLで表現された知識をコンピュータプログラムによって利用することができる。例えば、その知識の一貫性を検証したり、暗黙の知識を明示したりすることができる。
【0029】
また、本発明では、推薦情報に関連付けられたキーワードの出現傾向を機械学習によって分析し、キーワード間の関連性を判別する方法を適用する。
【0030】
つまり、本発明は、推薦情報とキーワードとのデータセットについて機械学習を行って情報推薦モデルを生成する。また、キーワード間の関係性を定義した構造化データを生成してナレッジベースに格納する。そして、所定キーワードに関連する関連キーワードをナレッジベースから検索し、その関連キーワードに関連する推薦情報を検索する。
【0031】
従来では、キーワード間の関係性をシソーラスデータベースといった大規模なデータベースから検索していたため、情報検索処理機能が複雑となり、要求処理数の増加に伴って、検索時間が増加していた。
【0032】
一方、本発明では、キーワード間の関係性を予め格納したナレッジベースから検索するので、情報検索処理機能を簡素化できる。特に、下位キーワードに対応する上位キーワードを用いて推薦情報を検索するので、適切な推薦情報の検索ヒット率を向上できる。
【0033】
下記実施形態では、情報をアイテムと呼ぶ。
【0034】
[アイテム推薦システムの構成例]
図1は、本実施形態に係るアイテム推薦システム1の構成例を示す図である。
【0035】
アイテム推薦システム1は、機械学習モジュール10と、ナレッジベース20と、アイテム推薦モジュール30と、コンテキスト抽出モジュール40と、推薦アイテム出力モジュール50と、センサ入出力モジュール60と、ユーザ端末70と、表示デバイス80と、各種センサ90と、を備える。
【0036】
本発明は、機械学習モジュール10とナレッジベース20との間で行われるデータの送受信、構造化データの生成、構造化データの格納方法に特徴がある。全体のシステムとしては、機械学習モジュール10及びナレッジベース20が他のモジュールと組み合わせて動作することで、本発明の効果を発揮する。
【0037】
機械学習モジュール(機械学習部)10は、キーワードに関連するアイテムを推薦するアイテム推薦モデルを生成する機能を備える。具体的には、機械学習モジュール10は、アイテムに関連付けられたキーワードの出現傾向を機械学習によって分析し、キーワードからアイテムを検索可能なアイテム推薦モデルを生成する。
【0038】
機械学習モジュール10は、キーワード間の関連性に基づき複数のキーワードを階層構造化した構造化データをナレッジベース20に格納する機能を備える。具体的には、機械学習モジュール10は、キーワード間の関係性を判別し、各キーワードを各キーワードの相互関連性を含めてナレッジベース20に格納する。
【0039】
例えば、機械学習モジュール10は、出現頻度の高いキーワードと他のキーワードとの相互関連性を見出し、この出現頻度の高いキーワードを上位キーワードとし、その上位キーワードの下位にあたるキーワードを下位キーワードとして、ナレッジベース20に格納する。
【0040】
ナレッジベース20は、キーワード間の関連性に基づき複数のキーワードが階層構造化された構造化データを記憶する機能を備える。具体的には、ナレッジベース20は、各キーワードを各キーワードの相互関連性を含めて記憶する。例えば、ナレッジベース20は、出現頻度の高い上位キーワードと当該上位キーワードの下位にあたる下位キーワードとを互いに関連付けて記憶する。
【0041】
ナレッジベース20は、キーワードとアイテムとのデータセットを記憶する機能を備える。例えば、ナレッジベース20は、出現頻度の高い上位キーワードと当該上位キーワードに関連するアイテムとのデータセットを互いに関連付けて記憶する。
【0042】
アイテム推薦モジュール(情報推薦部)30は、所定のキーワードに関連する関連キーワードをナレッジベース20から検索し、その関連キーワードに関連するアイテムをナレッジベース20から検索して推薦アイテムとして出力する機能を備える。
【0043】
例えば、アイテム推薦モジュール30は、所定のキーワードよりも出現頻度又はスコアの高い上位キーワードをナレッジベース20から検索し、その上位キーワードに関連するアイテムを推薦アイテムとして出力する。
【0044】
アイテム推薦モジュール30は、図1に示したように、類似性判定モジュール31と、アイテム検索モジュール32と、を備える。
【0045】
類似性判定モジュール31は、コンテキスト抽出モジュール40で抽出されたキーワードに関連する関連キーワードをナレッジベース20から検索する機能を備える。例えば、類似性判定モジュール31は、抽出されたキーワードを下位キーワードとし、その下位キーワードに関連する上位キーワードを検索する。
【0046】
アイテム検索モジュール32は、類似性判定モジュール31が検索したキーワードに関連するアイテムをナレッジベース20から検索し、そのアイテムを推薦アイテムとして出力する機能を備える。例えば、アイテム検索モジュール32は、上位キーワードに関連するアイテムを検索して出力する。
【0047】
コンテキスト抽出モジュール40は、センサ入出力モジュール60がマイク等の各種センサ90から取得した音声データ、テキストデータ、画像データ等からコンテキストとしてキーワードを抽出する機能を備える。例えば、コンテキスト抽出モジュール40は、コミュニケーション中の会話音声から「家」「ゆれた」というキーワードを抽出する。
【0048】
推薦アイテム出力モジュール50は、アイテム推薦モジュール30から出力された推薦アイテムをユーザ端末70や表示デバイス80に出力する機能を備える。例えば、推薦アイテム出力モジュール50は、「地震」という推薦アイテムを出力する。
【0049】
[ナレッジベースの格納データ]
コミュニケーションにおけるアイテム推薦では、会話の主たる内容をコンテキストとして抽出する必要がある。これは、会話文におけるいわゆるキーワードを抽出することによって実現される。
【0050】
この実現方法としては、出現するキーワードの時間的な遷移をキーワードグループとして判別し、それらのキーワードに対してアイテム検索を行う方法が考えられる。しかし、単なる時間的な遷移に基づくキーワードグループでは、キーワードに対するヒット率が低い。
【0051】
そこで、本実施形態では、会話文から抽出されるキーワードを会話の主たる内容と関連付けるため、キーワード間の関連性について階層構造を明示したオントロジとして定義しておき、より上位の階層に位置する概念を示すキーワードを導出する。
【0052】
具体的には、図2に示すように、キーワード間の関連性を階層構造化した構造化データとしてオントロジを定義し、その階層構造において抽象化された上位キーワードによってアイテムを検索する。
【0053】
図2において、上位のキーワード(Upper Context Keyword)としてKey Xが示されている。下位のキーワード(Lower Context Keyword)としてKey 1、Key 2、Key 3が示されている。上位キーワードは、下位キーワードと関連性を持ち、共通の話題において出現が見込まれるキーワードとなる。
【0054】
上位キーワードは、下位キーワードに対して出現頻度が高くなるようにキーワード選択を行っているので、下位キーワードでは検索ヒットしない場合においても、関連する上位のキーワードによってアイテム検索を確実に行うことができ、ヒット率を上げることができる。
【0055】
このようなキーワードの階層構造を構造化データとしてナレッジベース20のRDFストアに格納しておき、格納されたキーワードに対して検索をかけることにより、適切な推薦アイテムとの関連付けを行うことができる。下位キーワードから上位キーワードを導出・決定し、上位キーワードによってナレッジベース20に格納された推薦アイテムを検索する。
【0056】
上記構造化データは、機械学習モジュール10により定期的又は非定期に動的に更新される。構造化データの作成には、各種機械学習技術を用いる。構造化データの検索には、例えばSPARQLを用いる。SPARQLを用いて検索する場合には、明示されていないデータ間の関連性についても推論可能である。
【0057】
さらに、本実施形態では、図3に示すようなオントロジを定義する。ここでは、ニュースアイテムと、そのニュースアイテムから抽出されたキーワードとを、機械学習のデータセットとして用いる場合を例示している。このオントロジには、ニュースアイテムのURL、ヘッドライン、抽出キーワード、感情分析カテゴリ、感情分析スコア、アイテム提示時刻等が構造化されている。
【0058】
また、図3に示すように、オントロジを静的な構造部分と半固定/動的な構造部分とに分離し、双方を構造化データとして格納する。静的な構造部分には、アイテムに関する構造化データが格納される。半固定/動的な構造部分には、上述したキーワード間の関連性に基づく構造化データが格納される。
【0059】
半固定/動的な構造部分については、新たに追加されたデータセット(アイテムとキーワードとのペア)を含めて機械学習を再度行い、それによる新たなアイテム推薦モデルにより更新される。新たなアイテム推薦モデルを用いて半固定/動的な構造部分を適切な時間間隔で更新することで、より最適なアイテム推薦を行うことができる。静的な構造部分についても、機械学習モジュール10により定期的又は非定期に動的に更新可能である。
【0060】
[階層構造化コンテキストキーワードの生成方法]
図4は、階層構造化されたコンテキストキーワードの生成方法の例を示す図である。対人コミュニケーションにおいて、話題としてニュースアイテムを推薦する場合、階層化されたコンテキストキーワードの生成は、下記の手順によって行うことができる。
【0061】
まず、機械学習モジュール10は、ニュースデータに含まれるニュースアイテムITEM_ID(Item 0, 1, …)と当該ニュースアイテムから抽出した抽出キーワードUSER_ID(Key1, Key2, …)とのデータセットをインタラクションデータとして出現回数等を基準に相互関連性を機械学習する。
【0062】
その後、機械学習モジュール10は、この機械学習結果を基に、抽出キーワード(USER_ID)よりニュースアイテム(ITEM_ID)を推薦するアイテム推薦モデルを作成する。推薦されたニュースアイテムITEM_ID(Item J, Item K, Item L)は、当初のデータセットの抽出キーワードと関連付けが行われている。
【0063】
例えば、Key Xから推薦されたItem Jは、当初のデータセットのKey A, Key B, Key Cと関連付けられている。それゆえ、この場合には、Key Xは、Key A, Key B, Key Cの上位キーワードとして位置付けることができる。
【0064】
このように、出現回数の多い抽出キーワードや感情分析スコアの高いものを上位キーワードとして推薦アイテムを提示させるようにすることで、上位キーワードや推薦アイテムに対して下位キーワードとの関連付けを行うことができる。上位キーワードの選定方法については、機械学習モジュール10の計算機リソースに余裕があれば、全ての抽出キーワードについて行うことも可能である。
【0065】
以上の手順によって、アイテム推薦モデルによって生成された推薦アイテムに対して、関連付けられているキーワードを下位コンテキストとすることができる。
【0066】
図5は、上記の手順によって得られた、機械学習結果を反映したアイテム推薦モデルとオントロジとの関係を示す図である。上位キーワード(Key X, Key Y, …)は、図4に示したアイテム(Item 0, 1, …)との関係性を機械学習することにより、下位キーワード(Key A, Key B, …)との関係性を構造化することができる。
【0067】
この上位キーワードと下位キーワードとの間の関係性については、‘Upper Context Keyword’と‘Lower Context Keyword’との間のプロパティを例えば‘otsp:hasLowContextKey’と規定することにより明示できる。
【0068】
上記の手順により、階層化されたコンテキストキーワードの階層構造をアイテムを含めてナレッジベース20に格納することができる。一般的に、ニュースアイテムから抽出されるキーワードは、いわゆるロングテール分布となることが多く、ほとんどのキーワードの出現回数は、数回未満という傾向にある。
【0069】
この場合、ニュースアイテムの取得を異なるニュースソースから行い、それら複数のニュースソースから取得したデータセットを、組み合わせて機械学習に用いることで、上位キーワードと下位キーワードの組み合わせを、増やすことができる。
【0070】
[データワークフロー]
対人コミュニケーションにおいて、話題としてニュースアイテムを推薦する場合、階層化されたコンテキストキーワードの生成及び推薦アイテムの提示は、図6に示すような下記のワークフローによって行うことができる。
【0071】
ステップS1;
機械学習モジュール10は、ニュースソースからニュースアイテムを取得する。
【0072】
ステップS2;
次に、機械学習モジュール10は、取得したニュースアイテムからURLとキーワードを抽出し、抽出したURLとキーワードとのデータセットを生成する。
【0073】
ステップS3;
次に、機械学習モジュール10は、生成したデータセットを用いて、取得ニュースアイテムと抽出キーワードとをインタラクションデータとして機械学習を行い、その機械学習によりキーワードからアイテムを検索可能なアイテム推薦モデルを生成する。
【0074】
ステップS4;
次に、機械学習モジュール10は、上位コンテキストキーワードから推薦アイテムの提示によって、推薦アイテムと関連した下位コンテキストキーワードを検索する。この手順により、機械学習モジュール10は、各キーワードの上位下位の相互関連性を生成してアイテムを含めてナレッジベース20に格納する。
【0075】
ステップS5;
その後、アイテム推薦モジュール30の類似性判定モジュール31は、会話音声やチャットテキストから抽出されたキーワードに一致する下位コンテキストキーワードをナレッジベース20から検索する。
【0076】
ステップS6;
次に、アイテム推薦モジュール30の類似性判定モジュール31は、検索した下位コンテキストキーワードに関連する上位キーワードをナレッジベース20から検索する。
【0077】
ステップS7;
最後に、アイテム推薦モジュール30のアイテム検索モジュール32は、検索した上位キーワードに関連するアイテムをナレッジベース20から検索し、検索したアイテムを推薦アイテムとして出力する。
【0078】
なお、アイテム推薦モデルについては、自然言語処理や音声認識で一般的に用いられる様々な方法を用いて生成できる。例えば、再帰型ニューラルネットワーク(Recurrent Neural Network(RNN))や階層的再帰型ニューラルネットワーク(Hierarchical Recurrent Neural Network)を用いる。
【0079】
外部の機械学習サービスとして、RNNとバンディットアルゴリズムを効果的に組み合わせることで、より高精度・高効率なレコメンデーションを実現可能なUSER_PERSONALIZATIONレシピを用いることもできる。他の方法やWEB APIを利用した外部サービスを用いて生成してもよい。
【0080】
[上位キーワードの選定方法]
図4に示したワークフローには、出現回数の多い抽出キーワードや感情分析スコアの高いものを上位キーワードとする手順がある。この上位キーワードの選定方法については、さまざまな方法が考えられる。
【0081】
抽出されるキーワードの出現頻度の分布は、いわゆるロングテールと呼ばれる分布となることが知られている。この場合、出現頻度の平均値を基にするのではなく、中央値を参照する方が出現頻度の分布を適切に示すことが多い。
【0082】
例として、抽出キーワードの出現回数の順位を算出し、出現回数について中央値Nを算出する。中央値から、上下にk個のキーワードを選択し、N+k番目のキーワードからN-k番目のキーワードまでの2k個を上位キーワードとして選択する方法がある。あるいは、中央値以外にも、上位1/4、上位3/4等、他の選択方法をとることもできる。
【0083】
感情分析スコアを用いる場合には、感情分析カテゴリが「Positive」に分類されたキーワードから、感情分析スコアの高いものN個を選択して、上位キーワードとして設定することができる。また、キーワードとして使用するのにはふさわしくないキーワードのリストを作成しておき、そのリストに含まれるキーワードの使用を除外することも考えられる。
【0084】
[応用例]
本実施形態では、キーワードの出現回数や感情分析スコア等、キーワード間の関連性が上位下位の関係にある場合について説明した。キーワード間の関連性については、上位下位の関連性以外に、同義語・類義語・関連語・連想語等にも適用可能である。
【0085】
[実施形態の効果]
本実施形態によれば、アイテム推薦システム1が、キーワードに関連するアイテムを推薦するアイテム推薦モデルを生成し、キーワード間の関連性に基づき複数のキーワードを階層構造化した構造化データをナレッジベース20に格納する機械学習モジュール10と、所定のキーワードに関連する関連キーワードをナレッジベース20から検索し、その関連キーワードに関連するアイテムを推薦アイテムとして出力するアイテム推薦モジュール30と、を備えるので、アイテム推薦システム1において情報検索処理の簡素化を実現可能な技術を提供できる。
【0086】
すなわち、従来では、キーワード間の関係性をシソーラスデータベースといった大規模なデータベースから検索していたが、本実施形態では、キーワード間の関係性を予め格納したナレッジベース20から検索するので、情報検索処理機能を簡素化できる。
【0087】
また、本実施形態によれば、アイテム推薦モジュール30は、所定のキーワードよりも出現頻度又はスコアの高い上位キーワードをナレッジベース20から検索し、上位キーワードに関連するアイテムを推薦アイテムとして出力するので、推薦アイテムのヒット率を向上できる。
【0088】
すなわち、出現頻度やスコアの高い上位キーワードを用いたことにより、推薦アイテムのヒット率の向上が可能となる。
【0089】
また、本実施形態によれば、機械学習モジュール10は、アイテムとキーワード間の関連性に基づく構造化データとを定期的又は非定期に動的に更新するので、推薦アイテムのヒット率の向上と、よりユーザの関心の高いタイムリーなアイテム推薦が可能となるような検索と、を実現可能となる。
【0090】
[その他]
本発明は、上記実施形態に限定されない。本発明は、本発明の要旨の範囲内で数々の変形が可能である。本実施形態に係るアイテム推薦システム1は、コンピュータとプログラムによっても実現でき、プログラムを記録媒体に記録することも、ネットワークを通して提供することも可能である。
【0091】
例えば、本実施形態に係る機械学習モジュール10は、図7に示すように、CPU901と、メモリ902と、ストレージ903と、通信装置904と、入力装置905と、出力装置906と、を備えた汎用的なコンピュータシステムを用いて実現できる。メモリ902及びストレージ903は、記憶装置である。当該コンピュータシステムにおいて、CPU901がメモリ902上にロードされた所定のプログラムを実行することにより、機械学習モジュール10の各機能が実現される。
【0092】
機械学習モジュール10は、1つのコンピュータで実装されてもよい。機械学習モジュール10は、複数のコンピュータで実装されてもよい。機械学習モジュール10は、コンピュータに実装される仮想マシンであってもよい。
【0093】
機械学習モジュール10用のプログラムは、HDD、SSD、USBメモリ、CD、DVD等のコンピュータ読取り可能な記録媒体に記憶できる。機械学習モジュール10用のプログラムは、通信ネットワークを介して配信することもできる。
【0094】
機械学習モジュール10以外についても同様である。
【符号の説明】
【0095】
1…アイテム推薦システム
10…機械学習モジュール
20…ナレッジベース
30…アイテム推薦モジュール
31…類似性判定モジュール
32…アイテム検索モジュール
40…コンテキスト抽出モジュール
50…推薦アイテム出力モジュール
60…センサ入出力モジュール
70…ユーザ端末
80…表示デバイス
90…各種センサ
901…CPU
902…メモリ
903…ストレージ
904…通信装置
905…入力装置
906…出力装置
図1
図2
図3
図4
図5
図6
図7