(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5754057
(24)【登録日】2015年6月5日
(45)【発行日】2015年7月22日
(54)【発明の名称】ユーザ生成コンテンツ項目とエンティティのマッチング
(51)【国際特許分類】
G06F 17/30 20060101AFI20150702BHJP
【FI】
G06F17/30 340A
G06F17/30 170A
G06F17/30 310Z
G06F17/30 350C
【請求項の数】15
【全頁数】15
(21)【出願番号】特願2013-534936(P2013-534936)
(86)(22)【出願日】2011年10月4日
(65)【公表番号】特表2013-545180(P2013-545180A)
(43)【公表日】2013年12月19日
(86)【国際出願番号】US2011054761
(87)【国際公開番号】WO2012054232
(87)【国際公開日】20120426
【審査請求日】2013年6月24日
(31)【優先権主張番号】12/909,766
(32)【優先日】2010年10月21日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】500257300
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】100089118
【弁理士】
【氏名又は名称】酒井 宏明
(72)【発明者】
【氏名】カカデ ヴィナイ
(72)【発明者】
【氏名】パン ボ
(72)【発明者】
【氏名】ダルヴィ ニレシュ
(72)【発明者】
【氏名】ラヴィクマール シャンムガスンダラム
【審査官】
鹿野 博嗣
(56)【参考文献】
【文献】
特開2008−046987(JP,A)
【文献】
特開2002−055919(JP,A)
【文献】
特開2006−065535(JP,A)
【文献】
石山,ニュース特捜便 Google “つぶやき”を検索できるグーグルリアルタイム検索が登場,アスキー ドットPC 第13巻 第13号,日本,株式会社アスキー・メディアワークス,2010年 7月24日,p.15〜15
【文献】
新里 祐教,Xperia、Desire対応 Android本格開発 タッチパネル、GPS、カメラをフル活用! 第4章 GPS本格活用アプリを作ろう ツイートした場所をGoogle Maps上に表示,WEB+DB PRESS Vol.57 初版,日本,(株)技術評論社,2010年 8月 1日,p.32〜41
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/30
(57)【特許請求の範囲】
【請求項1】
複数のユーザ生成コンテンツ項目にアクセスするステップと、
前記複数のユーザ生成コンテンツ項目の各項目に関し、属性の組を有するエンティティの1又はそれ以上の属性に対する前記項目の関連度を決定するステップと、
前記エンティティの1又はそれ以上の属性に対する各項目の前記決定された関連度に少なくとも部分的に基づいて、前記複数のユーザ生成コンテンツ項目から前記エンティティに関連付けるための項目の組を選択するステップと、
前記選択された項目の組が、前記エンティティに関する情報と同時にインターフェイス上に表示されるようにするステップと、
を含み、1又はそれ以上のコンピュータ装置により実行される、
ことを特徴とする方法。
【請求項2】
前記複数のユーザ生成コンテンツ項目は、2又はそれ以上のソーシャルネットワーキングサービスのユーザによる公開投稿を含み、前記方法は、前記2又はそれ以上のソーシャルネットワーキングサービスの第1のユーザを、前記2又はそれ以上のソーシャルネットワーキングサービスの別のソーシャルネットワーキングサービスの第2のユーザと同じ作成者として識別するステップをさらに含む、
ことを特徴とする請求項1に記載の方法。
【請求項3】
前記1又はそれ以上の属性は、前記エンティティの物理的位置を含み、前記エンティティの1又はそれ以上の属性に対する前記項目の関連度を決定するステップは、前記エンティティの物理的位置と、前記項目の作成者の予測される物理的位置との間の物理的距離を求めるステップを含む、
ことを特徴とする請求項1又は2に記載の方法。
【請求項4】
前記エンティティは、前記項目の組内の1又はそれ以上の用語によって参照され、前記エンティティの1又はそれ以上の属性に対する前記項目の関連度を決定するステップは、前記項目内の1又はそれ以上の用語が前記エンティティを参照する前記項目の組内の前記1又はそれ以上の用語に含まれている可能性を求めるステップを含む、
ことを特徴とする請求項1から3のいずれか1項に記載の方法。
【請求項5】
前記1又はそれ以上の属性は、前記エンティティの名前又はニックネーム、前記エンティティの物理的位置、前記エンティティのカテゴリ、前記エンティティに関連する単語又は語句、前記エンティティに関連するユーザ又はユーザの組、又は前記エンティティに関連する別のエンティティ、のうちの1又はそれ以上を含む、
ことを特徴とする請求項1、2又は4に記載の方法。
【請求項6】
前記複数の項目のうちの特定の項目に関して、前記エンティティの1又はそれ以上の属性に対する前記特定の項目の関連度を決定するステップは、前記特定の項目と同じ作成者によって生成された1又はそれ以上の他の項目に少なくとも部分的に基づく、
ことを特徴とする請求項1から5のいずれか1項に記載の方法。
【請求項7】
作成者により生成された複数のコンテンツ項目にアクセスするステップと、
前記複数のコンテンツ項目の少なくとも2つによってもたらされる前記作成者の予測される属性を決定するステップと、
エンティティの特定の属性と前記作成者の予測される属性との間の距離に少なくとも部分的に基づいて、特定の属性を有する前記エンティティに関連付けるための前記作成者の特定のコンテンツ項目を選択するステップと、
前記選択された特定のコンテンツ項目が、前記エンティティに関する情報と同時にインターフェイス上に表示されるようにするステップと、
を含み、1又はそれ以上のコンピュータ装置により実行される、
ことを特徴とする方法。
【請求項8】
前記予測される属性は、前記作成者の予測される物理的位置であり、前記特定の属性は、前記エンティティの物理的位置である、
ことを特徴とする請求項7に記載の方法。
【請求項9】
前記予測される属性は、前記作成者の1又はそれ以上の予測されるカテゴリであり、前記特定の属性は、前記エンティティのカテゴリである、
ことを特徴とする請求項7に記載の方法。
【請求項10】
前記複数のコンテンツ項目の第1の項目が、第1のソーシャルネットワーキングサービスを使用する第1のユーザにより生成され、前記複数のコンテンツ項目の第2の項目が、第2のソーシャルネットワーキングサービスを使用する第2のユーザにより生成され、前記第1の項目及び前記第2の項目が同じ作成者によって生成されたものであると判断するステップをさらに含む、
ことを特徴とする請求項7から9のいずれか1項に記載の方法。
【請求項11】
前記複数のユーザ生成コンテンツ項目は、2又はそれ以上のソーシャルネットワーキングサービスのユーザによる公開投稿を含む、
ことを特徴とする請求項1から10のいずれか1項に記載の方法。
【請求項12】
前記複数のユーザ生成コンテンツ項目は、テキストコンテンツを含み、前記エンティティの1又はそれ以上の属性に対する前記項目の関連度を決定するステップは、前記テキストコンテンツに基づく、
ことを特徴とする請求項1から11のいずれか1項に記載の方法。
【請求項13】
前記複数のコンテンツ項目は、前記ソーシャルネットワーキングサービスのユーザによる160文字未満の長さの投稿を含む、
ことを特徴とする請求項1から12のいずれか1項に記載の方法。
【請求項14】
1又はそれ以上のコンピュータ装置により実行された時に、該1又はそれ以上のコンピュータ装置に請求項1から13のいずれか1項に記載の方法を実行させる命令を記憶する、
ことを特徴とするコンピュータ読取可能非一時的記憶媒体。
【請求項15】
請求項1から13のいずれか1項に記載の方法を実行する手段を備える、
ことを特徴とするコンピュータシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ユーザ生成コンテンツ項目をエンティティにマッチさせることに関する。
【背景技術】
【0002】
様々なソーシャルネットワーキングサービスでは、ユーザは、ほとんどどこからでもコンテンツを生成して互いに共有することができる。例えば、Twitter(登録商標)では、ユーザは、携帯電話からテキストメッセージを送信し、パーソナルコンピュータからウェブサイトにアクセスし、又はiPhone(登録商標)又はAndroid(登録商標)フォンなどのスマートフォンからのアプリケーションを使用することにより、分単位のツイート(ステータスアップデート)を行うことができる。同様に、Facebook(登録商標)、Myspace(登録商標)、及びLinkedIn(登録商標)でも、ユーザは、自身のステータスをアップデートし、或いはユーザの友人、友人グループ、又は一般の人々とコンテンツを共有することができる。Foursquare(登録商標)及びGowalla(登録商標)では、ユーザは、ステータスアップデートの1つの形として特定の場所にチェックインすることができる。
【発明の概要】
【発明が解決しようとする課題】
【0003】
これらのサービスは、無料でしかも容易に利用できるので、ユーザは、多くの場合160文字未満の短いコンテンツ項目を頻繁に投稿する傾向にある。これらのコンテンツの大半は、俗語、頭字語、及び/又は不完全な語句を含む。ソーシャルネットワーキングサービスでは、作成者は、このソーシャルネットワーキングのコンテキストにおける曖昧なコンテンツを自由に投稿することができる。一般に、これらの投稿は、作成者の友人及び作成者の投稿の購読者に届く。読者は、コンテンツを理解することもあるが、これらのコンテンツが常に読者によって理解され、又は読者に関連するものであるとは限らない。これらの投稿は、コンテンツが最も役に立つ読者に届かないことが多い。
【課題を解決するための手段】
【0004】
本節で説明する方法は、追求できる方法ではあるが、必ずしも以前に想到又は追求されたことのある方法ではない。従って、他に指示がない限り、本節で説明する方法を、いずれも本節に含まれているという理由だけで先行技術として見なすべきではない。
【図面の簡単な説明】
【0005】
【
図1】コンテンツ項目とエンティティの間の関連度に少なくとも部分的に基づいてコンテンツ項目を選択する例を示す図である。
【
図2】作成者の予測される属性とエンティティの属性との間の距離に少なくとも部分的に基づいて作成者のコンテンツ項目を選択する例を示す図である。
【
図3】エンティティに関する情報及びエンティティに関連するコンテンツ項目を含むユーザインターフェイス例を示す図である。
【
図4】特定のエンティティ及びエンティティに関連する特定のコンテンツ項目を参照する、
図3と同様の図である。
【
図5】エンティティの1又はそれ以上の属性に対する項目の関連度に少なくとも部分的に基づいて、エンティティに関連付けるためのユーザ生成コンテンツ項目の組を選択する処理を示す図である。
【
図6】エンティティの特定の属性と、ユーザの予測される属性との間の距離に少なくとも部分的に基づいて、特定の属性を有するエンティティに関連付けるためのユーザの特定のコンテンツ項目を選択する処理を示す図である。
【
図7】本明細書で説明する実施形態を実装できるコンピュータシステムを示すブロック図である。
【発明を実施するための形態】
【0006】
以下の説明では、本発明を完全に理解できるようにするために、説明を目的として数多くの特定の詳細を記載する。しかしながら、これらの特定の詳細を伴わずに本発明を実施できることが明らかになるであろう。その他の場合、本発明を不必要に曖昧にしないために、周知の構造及び装置についてはブロック図形式で示す。
【0007】
全体的概要
ユーザ生成コンテンツ項目をエンティティにマッチさせるための方法、装置、及びコンピュータ可読媒体を提供する。ステータスアップデートなどのユーザ生成コンテンツ項目を収集する。これらの各項目に関し、機械が、エンティティに対する項目の関連度を決定する。1つの態様では、項目のコンテンツをエンティティの属性にマッチさせることにより、項目をエンティティにマッチさせる。別の態様では、項目の作成者の属性を予測し、作成者の予測される属性とエンティティの属性との間の距離を求めることにより、項目をエンティティにマッチさせる。この距離は、エンティティの位置と作成者の位置との間の物理的距離、又はエンティティのカテゴリと作成者による投稿との間のコンテキストの距離とすることができる。エンティティにマッチする項目を、エンティティに関する情報とともにインターフェイス上に表示することができる。
【0008】
1つの実施形態では、ユーザ生成コンテンツ項目が、ソーシャルネットワーキングサービスのユーザによる投稿である。これらの投稿は、長さを160文字未満とすることができ、俗語、頭字語、及び/又は不完全な語句を含む。1つの実施形態では、共通プロファイル情報に基づいて、1つのソーシャルネットワーキングサービスのユーザと、別のソーシャルネットワーキングサービスのユーザとが同じ作成者として、又はグローバルユーザとして識別される。このようにして、たとえ異なるソーシャルネットワーキングサービス上にコンテンツ項目が提出されたとしても、これらのコンテンツ項目を同じ作成者に関連付けることができる。
【0009】
1つの実施形態では、コンテンツ項目の作成者の予測される物理的位置が、エンティティの物理的位置に近く又はその位置である。別の実施形態では、作成者による投稿の予測されるカテゴリが、エンティティのカテゴリに近く又はそのカテゴリに含まれる。このようにして、たとえユーザからの各個々のコンテンツ項目がエンティティに対して曖昧であったとしても、ユーザのコンテンツ項目をエンティティに関連付けることができる。
【0010】
本明細書で説明する技術は、コンテンツ項目とエンティティの間でマッチングできる属性のタイプに関して制限を受けるものではない。1つの実施形態では、コンテンツ項目内の単語、語句又はタグが、エンティティに関連する名前、ニックネーム、又はその他の単語又は語句に関連付けられる。別の実施形態では、コンテンツ項目自体が、エンティティの物理的位置に近い又はその位置である物理的位置に言及する。さらに別の実施形態では、コンテンツ項目が、エンティティにも関連するユーザ又はユーザグループに関連付けられる。他の態様では、エンティティに関連する別のエンティティにコンテンツ項目が関連付けられるように、エンティティが互いに参照し合うことができる。
【0011】
1つの実施形態では、1又はそれ以上のコンピュータ装置が、コンテンツ項目内の用語に基づいてエンティティとコンテンツ項目の間の関連度を決定するための言語モデルを使用して、コンテンツ項目をエンティティにマッチさせる。同様に、1又はそれ以上のコンピュータ装置は、エンティティと、コンテンツ項目に関連する位置との間の距離に基づいて、エンティティとコンテンツ項目の間の関連度を決定するための距離モデルを使用することにより、この方法を実行することができる。ある実施形態では、エンティティに対する明確な参照において頻繁に言及される単語又は語句に基づいて、この言語モデルが自動的に学習される。別の実施形態では、ユーザ又はユーザグループが明確に参照したエンティティの位置に基づいて、ユーザ又はユーザグループの位置が予測され、この予測されるユーザの位置及びユーザが明確に参照するエンティティの位置に基づいて、距離モデルが自動的に学習される。モデルが学習されたら、このモデルを定期的に更新し、これを使用してコンテンツ項目をエンティティにマッチさせることができる。
【0012】
コンテンツ項目
本明細書で説明するコンテンツ項目は、ユーザのネットワークの1又はそれ以上のユーザにより投稿されたあらゆるユーザ生成コンテンツ項目を含む。ユーザがほとんどどこからでもコンテンツを生成してこれを互いに共有できるようにする複数のソーシャルネットワーキングサービスが存在する。Twitter(登録商標)では、ユーザは、携帯電話からテキストメッセージを送信し、パーソナルコンピュータからウェブサイトにアクセスし、又はiPhone(登録商標)又はAndroid(登録商標)フォンなどのスマートフォン用のアプリケーションを使用することにより、分単位のツイート(ステータスアップデート)を行うことができる。同様に、Facebook(登録商標)、Myspace(登録商標)、及びLinkedIn(登録商標)でも、ユーザは、自身のステータスをアップデートし、或いはユーザの友人、友人グループ、又は一般の人々とコンテンツを共有することができる。Foursquare(登録商標)及びGowalla(登録商標)では、ユーザは、ステータスアップデートの1つの形として特定の場所にチェックインすることができる。
【0013】
個々のコンテンツ項目は、短くて曖昧な場合がある。ソーシャルネットワーキングサービスによっては、コンテンツ項目を最大160文字に制限しているものもある。たとえコンテンツ項目の大半が短いものであるとしても、大きなコンテンツ項目を投稿できるソーシャルネットワーキングサービスもある。多くの場合、これらのコンテンツは、俗語、頭字語、及び/又は不完全な語句を含む。
【0014】
コンテンツ項目は、複数の異なるソーシャルネットワーキングサービスから収集することができる。1つの実施形態では、共通の電子メールアドレス、共通の住所、共通の名前、共通の電話番号、及び/又は他の何らかの共通の識別情報などの共通のプロファイル情報に基づいて、1つのソーシャルネットワーキングサービスのユーザと、別のソーシャルネットワーキングサービスのユーザとが同じ作成者として識別される。このようにして、たとえ異なるソーシャルネットワーキングサービス上にコンテンツ項目が提出されたとしても、これらのコンテンツ項目を同じ作成者に関連付けることができる。
【0015】
エンティティ
本明細書で説明するエンティティは、以下を含む必要性があるわけではなく、以下に限定されるわけでもないが、エンティティの名前又はニックネーム、エンティティの物理的位置、エンティティのカテゴリ、エンティティに関連する単語又は語句、エンティティに関連するユーザ又はユーザの組、又はエンティティに関連する別のエンティティなどの、関連する属性を有する。1つの実施形態では、エンティティが、名前及び物理的位置を有する実在のエンティティである。別の実施形態では、エンティティが、複数の参照エントリの説明又は属性を提供する参照ソース内の参照エントリである。
【0016】
1つの実施形態では、この参照ソースが、オンライン辞書又は百科事典である。1つの例では、この百科事典エントリがユーザにより作成され修正される。Wikipedia(登録商標)は、参照エントリがユーザにより作成され修正される1つの良く知られている百科事典である。Wikipedia(登録商標)エントリは、エンティティの説明、他のエンティティへの参照、及びエンティティのカテゴリ及びニックネームを含むことができる。エンティティに関連する単語又は語句は、Wikipedia(登録商標)エントリ内にそれらの単語が出現する頻度又は注目度(タイトル対本文、活字書体など)に基づいて決定することができる。Wikipedia(登録商標)の例では、所与のWikipedia(登録商標)エントリの属性を、所与のWikipedia(登録商標)エントリ内で、又は所与のWikipedia(登録商標)エントリを参照するための他のWikipedia(登録商標)エントリ内で使用されている単語又は語句とすることができる。これらの属性は、所与のWikipedia(登録商標)エントリのカテゴリ、所与のWikipedia(登録商標)エントリの名前及びニックネーム、及び/又は所与のWikipedia(登録商標)エントリを参照する、及びこれにより参照される他のWikipedia(登録商標)エントリを含むこともできる。
【0017】
別の実施形態では、エンティティが、企業又は人々の名簿内の名簿エントリである。例えば、Yahoo!(登録商標)Localは、企業の名簿エントリを含む。各名簿エントリは、企業名、住所、電話番号、電子メールアドレス、企業カテゴリ、営業時間、利用可能な商品又はサービスのメニュー又はリスト、及びエンティティと単語又は語句を関連付ける記述又はタグなどのいくつかの属性を含むことができる。
【0018】
項目とエンティティのマッチング
コンテンツ項目の組を収集し、この組からの1又はそれ以上のコンテンツ項目をエンティティにマッチさせる。これらの各項目に関し、機械が、エンティティに対する項目の関連度を決定する。1つの態様では、項目のコンテンツをエンティティの属性にマッチさせることにより、項目をエンティティにマッチさせる。別の態様では、項目の作成者の属性を予測し、作成者の予測される属性とエンティティの属性との間の距離を求めることにより、項目をエンティティにマッチさせる。この距離は、エンティティの位置と作成者の位置との間の物理的距離、又はエンティティのカテゴリと作成者による投稿との間のコンテキストの距離とすることができる。エンティティにマッチする項目は、エンティティに関する情報とともにインターフェイス上に表示することができる。
【0019】
図1に、コンテンツ項目とエンティティの間の関連度に少なくとも部分的に基づいてコンテンツ項目を選択する例を示す。図示のように、ソーシャルネットワーキングサービスからコンテンツ項目102が収集される。コンテンツ項目102からは、コンテンツ項目の組104が、複数のエンティティ106のうちのエンティティ108の属性110に関連付けられる。1又はそれ以上のコンピュータ装置上で動作する関連付けモジュール112が、エンティティ108とコンテンツ項目の組104内の項目との間の様々な関連度114を決定する。1つの実施形態では、コンテンツ項目の組104の各項目がタイムスタンプに関連付けられ、より最近のコンテンツ項目には、それほど最近のものでないコンテンツ項目よりも高い関連度が与えられる。
【0020】
1つの実施形態では、関連付けモジュール112が、コンテンツ項目の組104内の項目の1又はそれ以上の属性とエンティティ108の1又はそれ以上の属性を関連付けて、関連度114を決定する。1つの実施形態では、コンテンツ項目とエンティティの間の関連度が、コンテンツ項目がエンティティを参照する可能性又は確率を考慮する。様々な実施形態では、この関連度が、エンティティの名前又はニックネーム、エンティティに関連する単語又は語句、又はエンティティの位置にコンテンツ項目が言及しているどうか、コンテンツ項目の作成者がエンティティの物理的位置の近くに存在すると予測されるかどうか、コンテンツ項目の作成者の他のコンテンツ項目がエンティティと同じカテゴリに分類されるかどうか、コンテンツ項目のコンテンツがエンティティと同じカテゴリに分類されるかどうか、エンティティに関連するユーザ又はユーザの組を含むスレッド内にコンテンツ項目が存在するかどうか、及び/又はコンテンツ項目が、エンティティに関する別のエンティティに関連するかどうかに基づくことができる。
【0021】
1つの実施形態では、1又はそれ以上のコンピュータ装置が、コンテンツ項目内の用語に基づいてエンティティとコンテンツ項目の間の関連度を決定するための言語モデルを使用して、コンテンツ項目をエンティティにマッチさせる。ある実施形態では、エンティティに対する明確な参照において頻繁に言及される単語又は語句に基づいて、この言語モデルが自動的に学習される。このモデルは定期的にアップデートすることができ、またエンティティへの参照において言及される可能性が高い単語又は語句のリストに新たな単語又は語句を追加することができる。
【0022】
1又はそれ以上のコンピュータ装置は、関連度114に基づいて、エンティティに関連付けるための選択するコンテンツ項目の組116を決定する。1つの例では、コンテンツ項目の組104からの最も高い関連度114を有する、又は特定の閾値を上回る関連度114を有する項目が、エンティティ108に関連するものとして識別される。この結果、選択された項目の組116を、エンティティ108に関する情報と関連付けて記憶することができる。図示のように、選択された項目の組116は、エンティティ108に関する情報と同時にインターフェイス118上に表示される。例えば、インターフェイス118は、エンティティ108に関するさらなる情報を求める閲覧ユーザに提供されるインターフェイスとすることができる。この結果、選択されたコンテンツ項目の組116は、閲覧ユーザに、エンティティ108に関する有益な情報を提供することができ、閲覧ユーザは、選択されたコンテンツ項目の組116に基づいてエンティティ108から商品又はサービスを購入する決定を行うことができる。
【0023】
図2に、ユーザの予測される属性とエンティティの属性との間の距離に少なくとも部分的に基づいてユーザのコンテンツ項目を選択する例を示す。収集されたコンテンツ項目202から、あるユーザにより提出されたコンテンツ項目の組204を決定する。図示していない実施形態では、このコンテンツ項目の組を、あるユーザグループにより提出されたコンテンツ項目の組とすることができる。例えば、特定の地域からのユーザを1つのグループにまとめることができる。1又はそれ以上のコンピュータ装置上で動作するユーザ属性予測モジュール206が、コンテンツ項目の組204に少なくとも部分的に基づいてユーザの属性208を予測する。1つの例では、コンテンツ項目の組204の2又はそれ以上のコンテンツ項目が、属性208の予測に寄与する。この2又はそれ以上のコンテンツ項目は、異なる時間に又は異なるソーシャルネットワーク上に提出されたものであってもよい。
【0024】
ユーザ属性予測モジュール206は、ユーザの属性を予測する際に、ユーザからの一部又は全部のコンテンツ項目を考慮することができる。1つの実施形態では、コンテンツ項目の組104の各項目がタイムスタンプに関連付けられ、より最近のコンテンツ項目は、それほど最近のものでないコンテンツ項目よりも、属性208の予測に大きく寄与する。一定の期間を超えた古いコンテンツ項目は、ユーザの属性を予測する前に廃棄することができる。
【0025】
1つの実施形態では、ユーザ属性予測モジュール206が、コンテンツ項目の組204において参照されるエンティティの位置、又はコンテンツ項目の組204において参照される他の位置に基づいて、ユーザの物理的位置を予測する。1つの例では、コンテンツ項目の組204の中のコンテンツ項目が、エンティティの物理的位置に言及せずに明確にエンティティを参照する。例えば、ディズニーワールドについて言及していれば、これがフロリダ州のブエナビスタ湖内に存在するディズニーワールドというエンティティに明確に結び付けられるようにするために、フロリダ州ブエナビスタ湖について言及する必要はない。エンティティを明確に参照するコンテンツ項目は、これらがエンティティの物理的位置に言及しているかのように取り扱うことができる。別の例では、コンテンツ項目の組204のコンテンツが、全地球測位システム(GPS)の場所又は他の何らかの物理座標の参照を含むことができる。例えば、Foursquare(登録商標)及びGowalla(登録商標)などのソーシャルネットワーキングアプリケーションは、コンテンツ項目に物理的位置情報を挿入し、又はコンテンツ項目に物理的位置情報を添付していることが多い。別の例として、ユーザは、コンテンツ項目のコンテンツ内で、住所、近隣、市、州、又は郵便番号などの物理的位置に言及することもできる。
【0026】
属性予測モジュール206は、ユーザの物理的位置を予測することに加え、ユーザの中心的な物理的位置から離れた様々な距離に存在するエンティティに関するコンテンツをユーザが投稿する可能性又は確率を予測することもできる。1つの実施形態では、予測されるユーザの位置及びユーザが明確に参照するエンティティの位置に基づいて、距離モデルが自動的に学習される。距離モデルが学習されたら、この距離モデルを定期的に更新し、これを使用して、予測されるユーザの位置から離れた一定の距離に存在するエンティティをユーザが参照している可能性又は確率を求めることができる。
【0027】
別の実施形態では、ユーザ属性予測モジュール206が、コンテンツ項目204内で話題になったカテゴリ、又はコンテンツ項目204が明確に参照したエンティティのカテゴリに基づいて、ユーザが話題にする可能性の高い1又はそれ以上のカテゴリを予測する。カテゴリは、カテゴリ及びサブカテゴリの階層又はツリー内で互いに関連する。ツリー内のカテゴリの近接性に基づいて、カテゴリ間の距離を計算することができる。この距離は、2つのカテゴリが同じユーザによって言及される頻度に基づいて計算することもできる。1つの実施形態では、ユーザが話題にする予測されるカテゴリに基づいて、距離モデルが自動的に学習される。距離モデルが学習されたら、この距離モデルを定期的に更新し、これを使用して、予測されるカテゴリから離れた距離に存在する別のカテゴリ内のエンティティをユーザが参照している可能性を求めることができる。
【0028】
図5に、エンティティの1又はそれ以上の属性に対する項目の関連度に少なくとも部分的に基づいて、エンティティに関連付けるためのユーザ生成コンテンツ項目の組を選択する処理を示す。この処理は、1又はそれ以上のコンピュータ装置によって行われる。ステップ502において、ユーザ生成コンテンツ項目にアクセスする。ステップ504は、各項目に関し、エンティティの1又はそれ以上の属性に対する項目の関連度を決定するステップを含む。次に、ステップ506は、エンティティの1又はそれ以上の属性に対する各項目の決定された関連度に少なくとも部分的に基づいて、エンティティに関連付けるための項目の組を選択するステップを含む。
【0029】
図6に、エンティティの特定の属性とユーザの予測される属性との間の距離に少なくとも部分的に基づいて、特定の属性を有するエンティティに関連付けるためのユーザの特定のコンテンツ項目を選択する処理を示す。この処理は、1又はそれ以上のコンピュータ装置によって行われる。ステップ602において、作成者により生成されたコンテンツ項目にアクセスする。ステップ604は、これらのコンテンツ項目に少なくとも部分的に基づいて作成者の予測される属性を決定するステップを含む。次に、ステップ606は、エンティティの特定の属性と作成者の予測される属性との間の距離に少なくとも部分的に基づいて、特定の属性を有するエンティティに関連付けるための作成者の特定のコンテンツ項目を選択するステップを含む。
【0030】
インターフェイス
図3に、エンティティに関する情報及びエンティティに関連するコンテンツ項目を含むユーザインターフェイス例を示す。コンピュータモニタ又はその他のディスプレイ装置などのディスプレイ302が、閲覧ユーザにブラウザ304を表示する。ブラウザ304は、以下に限定されるわけではないが、Mozilla(登録商標)Firefox(登録商標)、Microsoft(登録商標)Internet Explorer(登録商標)、又はGoogle(登録商標)Chrome(登録商標)を含むことができ、これらの各々は、アプリケーションの閲覧ユーザにウェブコンテンツを表示するように構成されたアプリケーションである。ブラウザ304内には、図示のようなユーザインターフェイス306が表示される。ユーザインターフェイス306をブラウザ内に表示する必要はなく、別個のアプリケーションとして又はブラウザ以外のアプリケーションによってユーザに提示してもよい。ユーザインターフェイス306は、エンティティ308に関する情報、及びエンティティ308に関連して表示されるコンテンツ項目310〜316を含む。閲覧ユーザは、コンテンツ項目310〜316の収集元であるソーシャルネットワークのいずれかに属していてもよく、又は属していなくてもよい。
【0031】
図4に、特定のエンティティ及びエンティティに関連する特定のコンテンツ項目を参照する、
図3のインターフェイスと同様のユーザインターフェイスを示す。図示の特定の非限定的な例では、ディスプレイ402が、ブラウザ404内にユーザインターフェイス406を表示する。ユーザインターフェイス406は、エンティティ408に関する情報を含む。この例では、エンティティ408が、サンタクララのYuki Sushiである。エンティティ408は、複数の属性に関連することができる。図示のように、エンティティ408は、物理的位置(図示の住所)、電話番号、及びYuki Sushiで提供される料理のメニューに関連する。このエンティティは、レストラン又は寿司レストランとして分類することもできる。1つの例では、寿司レストランが、「ロール」、「魚」、「ツナ」、「サーモン」、「うなぎ」などの用語に関連することができる。図示の例では、Yukiが、「ジャズロール」を含むメニューからの用語に関連する。閲覧ユーザが、Yuki Sushiに関する情報を検索すると、Yuki Sushiに関する情報とともにコンテンツ項目410〜412が表示される。ここでは、コンテンツ項目410〜412内に反映されるjohn_1及びjane_1というユーザからの肯定的な体験が、Yuki Sushiに行ってみるように、又はYuki Sushiの特定のメニュー項目を注文してみるように閲覧ユーザを促すことができる。
【0032】
ハードウェアの概要
1つの実施形態によれば、本明細書で説明する技術が、1又はそれ以上の専用コンピュータ装置により実装される。この専用コンピュータ装置は、これらの技術を実行するためのハードウェア組み込み型とすることもでき、或いはこれらの技術を実行するように永続的にプログラムされた1又はそれ以上の特定用途向け集積回路(ASIC)又はフィールドプログラマブルゲートアレイ(FPGA)などのデジタル電子装置を含むこともでき、或いはファームウェア、メモリ、その他の記憶装置、又はこれらの組み合わせに含まれるプログラム命令に従ってこれらの技術を実行するようにプログラムされた1又はそれ以上の汎用ハードウェアプロセッサを含むこともできる。このような専用コンピュータ装置は、カスタムハードワイヤードロジック、ASIC又はFPGAを、これらの技術を実現するためのカスタムプログラミングと組み合わせることもできる。この専用コンピュータ装置は、デスクトップコンピュータシステム、ポータブルコンピュータシステム、ハンドヘルド装置、ネットワーク装置、又はこれらの技術を実装するようにハードワイヤードロジック及び/又はプログラムロジックを組み込んだ他のいずれの装置であってもよい。
【0033】
例えば、
図7は、本発明の実施形態を実装できるコンピュータシステム700を示すブロック図である。コンピュータシステム700は、情報を通信するためのバス702又はその他の通信機構、及びバス702に結合された、情報を処理するためのハードウェアプロセッサ704を含む。ハードウェアプロセッサ704は、例えば汎用マイクロプロセッサであってもよい。
【0034】
コンピュータシステム700は、バス702に結合された、情報及びプロセッサ704により実行される命令を記憶するためのランダムアクセスメモリ(RAM)又はその他の動的記憶装置などのメインメモリ706も含む。メインメモリ706は、プロセッサ704により実行される命令の実行中に一時的変数又はその他の中間情報を記憶するために使用することもできる。このような命令は、プロセッサ704がアクセス可能な非一時的記憶媒体に記憶された場合、コンピュータシステム700を、命令内で指示される動作を実行するようにカスタマイズされた専用機械の状態にする。
【0035】
コンピュータシステム700は、バス702に結合された、静的情報及びプロセッサ704のための命令を記憶する読み出し専用メモリ(ROM)708又はその他の静的記憶装置をさらに含む。情報及び命令を記憶するための磁気ディスク又は光学ディスクなどの記憶装置710も提供され、バス702に結合される。
【0036】
コンピュータシステム700は、バス702を介して、コンピュータユーザに情報を表示するためのブラウン管(CRT)などのディスプレイ712に結合することができる。バス702には、プロセッサ704に情報及びコマンド選択を通信するための英数字キー及びその他のキーを含む入力装置714も結合される。別の種類のユーザ入力装置には、プロセッサ704に方向情報及びコマンド選択を通信してディスプレイ712上のカーソルの動きを制御するためのマウス、トラックボール又はカーソル方向キーなどのカーソル制御716がある。通常、この入力装置は、第1の軸(例えば、x)と第2の軸(例えば、y)からなる2つの軸内の2つの自由度を有して、装置が平面上の位置を指定できるようにする。
【0037】
コンピュータシステム700は、カスタマイズされたハードワイヤードロジック、1又はそれ以上のASIC又はFPGA、ファームウェア、及び/又はコンピュータシステムと組み合わせてコンピュータシステム700を専用機械にする、又はそのようにプログラムするプログラム論理を使用して、本明細書で説明した技術を実装することができる。1つの実施形態によれば、プロセッサ704が、メインメモリ706に含まれる1又はそれ以上の命令の1又はそれ以上のシーケンスを実行することに応答して、本明細書の技術がコンピュータシステム700により実行される。このような命令は、記憶装置710などの別の記憶媒体からメインメモリ706に読み込むことができる。メインメモリ706に含まれる命令シーケンスを実行することにより、本明細書で説明した処理ステップをプロセッサ704が実行するようになる。代替の実施形態では、ソフトウェア命令の代わりに又はこれと組み合わせてハードワイヤード回路を使用することができる。
【0038】
本明細書で使用する「記憶媒体」という用語は、データ及び/又は機械を特定の方法で動作させる命令を記憶するあらゆる非一時的媒体を意味する。このような記憶媒体は、不揮発性媒体及び/又は揮発性媒体を含むことができる。不揮発性媒体は、例えば、記憶装置710などの光学又は磁気ディスクを含む。揮発性媒体は、メインメモリ706などの動的メモリを含む。一般的な記憶媒体としては、例えば、フロッピー(登録商標)ディスク、フレキシブルディスク、ハードディスク、固体ドライブ、磁気テープ、又はその他のあらゆる磁気データ記憶媒体、CD−ROM、その他のあらゆる光学データ記憶媒体、穴パターンを有するあらゆる物理媒体、RAM、PROM、及びEPROM、FLASH−EPROM、NVRAM、その他のあらゆるメモリチップ又はカートリッジが挙げられる。
【0039】
記憶媒体は、送信媒体とは異なるが、これとともに使用することができる。送信媒体は、記憶媒体間の情報の転送に関与する。例えば、送信媒体として、バス702を含む配線を含む、同軸ケーブル、銅線及び光ファイバが挙げられる。送信媒体は、電波及び赤外線データ通信中に生成されるような音波又は光波の形をとることもできる。
【0040】
実行のためにプロセッサ704に1又はそれ以上の命令の1又はそれ以上のシーケンスを運ぶことには、様々な形の媒体が関与することができる。例えば、最初に遠隔コンピュータの磁気ディスク又は固体ドライブで命令を運ぶことができる。遠隔コンピュータは、その動的メモリにこれらの命令をロードし、モデムを使用して電話回線を介してこの命令を送信することができる。コンピュータシステム700のローカルなモデムが、電話回線上でデータを受信し、赤外線送信機を使用してデータを赤外線信号に変換することができる。この赤外線信号内で運ばれたデータを赤外線検出器が受信し、このデータを適当な回路によってバス702上に配置することができる。バス702は、このデータをメインメモリ706に運び、ここからプロセッサ704が命令を取り出して実行する。任意に、メインメモリ706が受け取った命令を、プロセッサ704による実行前又は実行後のいずれかに記憶装置710に記憶することもできる。
【0041】
コンピュータシステム700は、バス702に結合された通信インターフェイス718も含む。通信インターフェイス718は、ローカルネットワーク722に接続されたネットワークリンク720に結合して双方向データ通信を提供する。例えば、通信インターフェイス718は、総合デジタル通信網(ISDN)カード、ケーブルモデム、衛星モデム、又は対応する種類の電話回線へのデータ通信接続を提供するモデムとすることができる。別の例として、通信インターフェイス718を、互換性のあるLANにデータ通信接続を提供するためのローカルエリアネットワーク(LAN)カードとすることもできる。無線リンクを実装することもできる。あらゆるこのような実装では、通信インターフェイス718が、様々な種類の情報を表すデジタルデータストリームを運ぶ電気、電磁又は光学信号を送信及び受信する。
【0042】
通常、ネットワークリンク720は、1又はそれ以上のネットワークを介して他のデータ装置にデータ通信を提供する。例えば、ネットワークリンク720は、ローカルネットワーク722を介したホストコンピュータ724への、又はインターネットサービスプロバイダ(ISP)726によって動作するデータ機器への接続を提供することができる。さらに、ISP726は、今では一般的に「インターネット」728と呼ばれるワールドワイドパケットデータ通信ネットワークを介してデータ通信サービスを提供する。ローカルネットワーク722及びインターネット728はいずれも、デジタルデータストリームを運ぶ電気、電磁又は光学信号を使用する。コンピュータシステム700との間でデジタルデータを運ぶ、様々なネットワークを介した信号及びネットワークリンク720上の通信インターフェイス718を介した信号は、送信媒体の形態の例である。
【0043】
コンピュータシステム700は、(単複の)ネットワーク、ネットワークリンク720及び通信インターフェイス718を介してメッセージを送信し、プログラムコードを含むデータを受信することができる。インターネットの例では、サーバ730が、インターネット728、ISP726、ローカルネットワーク722及び通信インターフェイス718を介して、アプリケーションプログラムのための要求されたコードを送信することができる。
【0044】
プロセッサ704は、この受信コードを受信時に実行することもでき、及び/又は後で実行できるように記憶装置710又はその他の不揮発性記憶装置に記憶することもできる。
【0045】
上述した明細書では、実施構成によって異なり得る数多くの特定の詳細に関連して本発明の実施形態を説明した。従って、明細書及び図面については、限定的な意味ではなく例示的な意味でとらえるべきである。本発明の範囲、及び出願人が何を発明の範囲として意図しているかを示す唯一かつ排他的なものは、本出願から特定の形で生じる請求項の組の逐語的及び等価的な範囲であり、これにはあらゆる今後の補正が含まれる。
【符号の説明】
【0046】
402 ディスプレイ
404 ブラウザ
406 ユーザインターフェイス
408 エンティティに関する情報
410 コンテンツ項目
412 コンテンツ項目