(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0011】
本出願に添付された図面を参照して実施形態に関して詳しく説明する。添付の図面では、同じ及び/又は対応する要素が、同じ参照番号明細書によって示されている。
【0012】
本明細書では様々な実施形態が開示するが、開示する実施形態は、様々な形式で実施することができる開示内容を単に例示するものであることを理解すべきである。更に、様々な実施形態に関して与えられる実施例の各々は、例示を意図し、制限を意図するものではない。更に、図は、必ずしも縮尺通りではなく、いくつかの特徴は、特定の構成要素の詳細を示すために誇張されていることがある(及び図に示すいずれのサイズ、材料、及び類似の詳細も、例示を意図し、制限を意図するものではない)。従って、本明細書に開示する特定の構造的及び機能的詳細は、制限として解釈すべきでなく、当業者に開示する実施形態を多様に利用することを教示するための単なる代表的な基礎として解釈すべきである。
【0013】
図1は、「インターネット」のようなネットワーク115を通じてサーバコンピュータ110と通信するコンピュータ装置105の実施形態のブロック図である。
図2は、
図1のコンピュータ装置105によって実行される段階の実施形態を示す流れ図である。コンピュータ装置105のユーザは、例えば、サービスプロバイダ(カリフォルニア州サニーベールのYahoo!インコーポレーテッドなど)に関連付けられるウェブページ(Yahoo!のホームページ−www.yahoo.comなど)にナビゲートするためにコンピュータ装置105で実行されるウェブブラウザ118を使用する。一実施形態では、ユーザは、サービスプロバイダとのユーザアカウントにログイン(又は作成)する。一実施形態では、サーバコンピュータ110は、アカウントにログインするユーザの要求を受信し、ログイン情報が正確である場合、ユーザをユーザアカウントにログインする。
【0014】
一実施形態では、コンピュータ装置105は、サーバコンピュータ110からクライアント側モジュール125をダウンロードする要求を送信する。クライアント側モジュール125は、ブラウザのどの領域(例えば、ブラウザ118の左側、ブラウザ118の右側、ブラウザ118の上部、及び/又はブラウザ118の下部)にも表示することができる。一実施形態では、クライアント側モジュール125はサイドバーである。別の実施形態では、クライアント側モジュール125はツールバーである。一実施形態では、クライアント側モジュール125は、ウェブページアドレスバーによって(例えば、下に)表示されたコンテンツを修正する。一実施形態では、クライアント側モジュール125は、コンピュータ装置105によってダウンロードされ(段階205)、クライアント側モジュール125がダウンロードされた状態で、ブラウザ118がウェブページ(サービスプロバイダに関連付けられるか又は関連付けられない)にナビゲートした時にクライアント側モジュール125に関連付けられるグラフィカルユーザインタフェース(UI)が表示される。一実施形態では、ユーザがUIの表示を選択した場合にグラフィカルUIが表示される。一実施形態では、クライアント側モジュール125(サイドバー又はツールバーなど)は、2次コンテンツ呈示フレームワークがウェブに基づくようにウェブに基づくことができる。これは、ドメインリンクを通じて共有することができ、受信者がダウンロードを必要とすることなくサイドバー/ツールバー体験を得られることを意味する。
【0015】
例えば、クライアント側モジュール125をダウンロードした後、ユーザは、ウェブブラウザ118を使用して特定のウェブページにナビゲートすることができる(段階210)。一実施形態では、ウェブブラウザ118は、ブラウザ118の第1のコンテンツ区域130にウェブページを表示し、ブラウザ118の第2のコンテンツ区域135にクライアント側モジュール125に関連付けられるコンテンツを表示する。第1のコンテンツ区域130の大きさは、第2のコンテンツ区域135の大きさよりも大きくすることができ、又は小さくすることができる。一実施形態では、いずれかの又は両方のコンテンツ区域の大きさをユーザによって調節することができる。一実施形態では、コンピュータ装置105のユーザが特定のウェブページドメイン名を入力した時にクライアント側モジュール125はブラウザによってアクセスされる。
【0016】
一実施形態では、コンピュータ装置105は、ブラウザ118がナビゲートしたウェブページに関連付けられるトピックに対する要求140を送信する(段階215)。トピックに対する要求140は、コンピュータ装置105がナビゲートしたウェブページのURLを送信することができる。トピックに対する要求140は、ユーザがナビゲートしたウェブページのコンテンツの複製をサーバコンピュータ110に送信することができる。
【0017】
一実施形態では、サーバコンピュータ110は、トピック及びカテゴリ判断モジュール145を含む。一実施形態では、トピック及びカテゴリモジュール145は、ユーザがナビゲートしたウェブページを予め分析しており、サーバストレージ155(データベースなど)にその分析の結果を格納している。次に、サーバコンピュータ110(トピック及びカテゴリモジュール145)は、この以前の分析を使用して、ウェブページに関連付けられる1つ又はそれよりも多くのトピックを即座に判断することができる。代替的に、トピック及びカテゴリモジュール145がウェブページを分析し、要求140を受信した後にウェブページに関連付けられる1組のトピックを判断する。ウェブページに関連付けられる1組のトピックは、ウェブページに関連付けられる1つ又はそれよりも多くのトピックとして本明細書で定義される。トピックは、ウェブページのタイトル、URL、グラフィックのような一部とすることができ、又はそうでなくてもよく、一般的にはウェブページのテキストの少なくとも一部分を分析することによって判断される。
【0018】
一実施形態では、トピック及びカテゴリモジュール145はまた、サーバストレージ155に格納されたデータから又はウェブページの分析からウェブページに関連付けられる1組のカテゴリを判断する。トピックに比べてカテゴリは、抽象の高いレベルである。例えば、ウェブページがニコンのデジタルカメラを話題にしている場合、ウェブページのトピックはデジタルカメラであり、ウェブページのカテゴリは購入可能な製品とすることができる。ウェブページに関連付けられる1組のカテゴリは、ウェブページに関連付けられる1つ又はそれよりも多くのカテゴリとして本明細書では定義される。
【0019】
サーバコンピュータ110は、ウェブページに関連付けられるトピックの組及びカテゴリ150の組をコンピュータ装置105に送信する。一実施形態では、トピック及びカテゴリ150の組は、ウェブページ自体に対するその関連度に従って順序付け又は格付けされる。例えば、ニコンデジタルカメラに関するウェブページに関連付けられる1組のトピックは以下のように列挙することができる。
1.デジタルカメラ
2.カメラ
3.写真
【0020】
一実施形態では、ニコンデジタルカメラに関するウェブページに関連付けられる1組のカテゴリは以下のように列挙することができる。
1.購入可能な製品
2.消費者商品
【0021】
一実施形態では、サーバコンピュータ110(トピック及びカテゴリモジュール145など)は、トピックの組全体及びカテゴリ150の組全体をコンピュータ装置105に送信する。別の実施形態では、サーバ110は、判断されたトピック及びカテゴリの所定の数(各セットにおける第1のトピック及び第1のカテゴリなど)を送信する。コンピュータ装置105は、トピック及びカテゴリ150を受信する(段階220)。一実施形態では、コンピュータ装置105は、ストレージ157(メモリ又はデータベースなど)にトピック及びカテゴリ150を格納する。コンピュータ装置105は、ウェブブラウザ118の第1のコンテンツ区域130にウェブページを表示し(段階225)ウェブブラウザ118の第2のコンテンツ区域135にトピック及び/又はカテゴリの1つ又はそれよりも多くを表示する(段階230)。一実施形態では、コンピュータ装置105は、受信したカテゴリに従ってウェブブラウザ118の第2のコンテンツ区域135を構成する(段階235)。例えば、ウェブページに関連付けられるカテゴリが「スポーツ」である場合、一実施形態では、コンピュータ装置105は、受信したトピックに加えて第2のコンテンツ区域135にスポーツに関する広告を表示する。別の一例として、コンピュータ装置105は、受信したトピックに加えて第2のコンテンツ区域135にスポーツに関するグラフィックを表示することができる。更に、一実施形態では、特定のトピックのカテゴリに基づいて様々なユーザインタフェースが表示される。
【0022】
図3は、コンピュータ装置105によって実行される段階の実施形態を示す流れ図である。一実施形態では、サーバコンピュータ110は、トピックに関連付けられる1つ又はそれよりも多くのエンティティ160をコンピュータ装置105に送信する。本明細書で使用されるエンティティ(本明細書では項目とも呼ぶ)は、ウェブページから判断されたトピックに関連付けられるテキスト、グラフィック、アイコン、ビデオ、リンク、構造化情報、記事、フィードなどである。一実施形態では、コンピュータ装置105は、エンティティを受信し(段階310)ブラウザ118の第2のコンテンツ区域135にエンティティ又は複数のエンティティ160を表示する(例えば、ユーザがブラウザ118の第1のコンテンツ区域130のウェブページを見ている間)(段階315)。一実施形態では、コンピュータ装置105は、受信したカテゴリ(トピックと共に受信した又はエンティティと共に受信した)に従って第2のコンテンツ区域135を構成する(段階320)。
【0023】
本発明の開示の目的のために(
図20に関して以下に詳しく説明するように)、コンピュータ装置105及び/又はサーバ110のようなコンピュータ又はコンピュータ装置は、非制限的な一例として、磁気又は光学ディスク又はRAMディスク又はテープのようないずれかのタイプの又は様々な公知のコンピュータ可読ストレージ媒体から有形で格納又は読み取ることができるプログラムコード、データ、及びソフトウエアを格納及び実行するためのプロセッサ及びメモリを含む。データを読み取るためにソフトウエアアプリケーションの実行を可能にするオペレーティングシステムをコンピュータに提供することができる。パーソナルコンピュータ、携帯情報端末(PDA)、無線装置、セルラー電話、「インターネット」機器、媒体プレーヤ、ホームシアターシステム、サーバ、及びメディアセンターは、コンピュータ装置のいくつかの非制限的例である。コンピュータ装置105及びサーバ110は、一実施形態では、スクリーン又はモニタのようなディスプレイを含むことができる。更に、サーバ及び/又はコンピュータ装置は、1つ又はそれよりも多くのコンピュータを含むことができる。
【0024】
トピックを検出するためにコンピュータ装置105によって実行される疑似コードの実施形態は、以下の通りである。
【0025】
トピックを検出するためにサーバコンピュータ110によって実行される疑似コードの実施形態は、以下の通りである。
【0026】
一実施形態では、サーバコンピュータ110は、第1のコンテンツ区域130でブラウザ118によって表示された検索入力領域に入力された検索問合せに関連付けられるトピックに対する要求を受信する。サーバコンピュータ110は、検索問合せに関連付けられるトピックをブラウザ118の第2のコンテンツ区域135に表示するためにブラウザ118に送信する。一実施形態では、検索問合せに関連付けられる各トピックは、カテゴリに対応する。
【0027】
図4は、サーバコンピュータ110によって実行される段階の実施形態の流れ図である。
図5は、サーバコンピュータ110及びクライアント側モジュール125で実行されるモジュール及びアプリケーションプログラミングインタフェース(API)の実施形態のブロック図である。一実施形態では、サーバコンピュータ110は、コンピュータ装置105がナビゲートしたウェブページのURLを受信する(段階405)。サーバコンピュータ110は、ウェブページに対する1組のトピック及び1組のカテゴリを判断する(段階410)。次に、サーバコンピュータ110は、各トピックに対して(段階412)、段階410で判断された各カテゴリが一般的なものである(すなわち、サーバコンピュータ110によって格納されたカテゴリの所定のセットの1つではない)か否かを判断する(段階415)。
図7に関して以下に詳しく説明するように、カテゴリが一般的なものである場合、サーバコンピュータ110は、一般的なデータ(例えば、1つ又はそれよりも多くの知識収集ウェブサイトデータファイル(Wikipedia(登録商標)データファイルなど)を格納しているデータベース502から検索された)をコンピュータ装置105に送信する(段階418)。
【0028】
カテゴリが一般的でない場合、サーバコンピュータ110は、コンピュータ装置105に送信するためのデータを取得するために使用する適切なカテゴリ固有のアプリケーションプログラミングインタフェース(API)を選択する(段階420)。サーバコンピュータ110は、様々なカテゴリのための個別のAPIを含むことができる。例えば、サーバコンピュータ110は、スポーツAPI505、ショッピングAPI510、映画API515、及びいずれかの他のカテゴリのためのAPIを表す「いずれかの他のカテゴリAPI」520を含むことができる。一実施形態では、サーバコンピュータ110は、ウェブページに関連付けられる送信されたエンティティ160の一部になるデータを取得するために特定のAPI505、510、515、520を使用する。一実施形態では及び以下に詳しく説明するように、サーバコンピュータ110は、特定のカテゴリに対するドメインアクションを判断する(段階425)。サーバコンピュータ110は、アクションデータベース525からカテゴリに関連付けられるドメインアクションを検索することができる。次に、サーバコンピュータ110は、カテゴリ固有のデータ532(カテゴリに関連付けられるエンティティ及び/又はアクション項目など)をコンピュータ装置105に送信するためにデータ送信モジュール530を使用する(段階430)。
【0029】
図6は、トピック詳細ビューを提供するためにコンピュータ装置105によって実行される段階の実施形態の流れ図である。コンピュータ装置105は、サーバコンピュータ110からウェブページに関連付けられる1つ又はそれよりも多くのトピック及びカテゴリを受信する(段階605)。一実施形態では、コンピュータ装置105は、各トピックに対して(段階608)、カテゴリが一般的なものであるか否かを段階610で判断する。カテゴリが一般的なものである場合、コンピュータ装置105は、一般的なレンダラー535を使用してウェブブラウザ118の第2のコンテンツ区域135に一般的なデータを表示する(段階615)。カテゴリが一般的なものでない場合、コンピュータ装置105は、カテゴリに基づいて適切なカテゴリ固有のレンダリングモジュールを選択する(段階620)。例えば、コンピュータ装置105は、アスリートレンダラー540(例えば、スポートカテゴリに対する)、製品レンダラー545(例えば、ショッピングカテゴリに対する)、映画レンダラー550(例えば、映画カテゴリに対する)、及びいずれかの他のカテゴリレンダラー555(例えば、別のカテゴリに対する)を含むことができる。カテゴリ固有のレンダラー540、545、550、555は、ブラウザ118の第2のコンテンツ区域135にカテゴリ固有のコンテンツをレンダリングする(段階625)。これらのレンダラーの1つ又はそれよりも多くは、サービスプロバイダによって提供することができ、又は1つ又はそれよりも多くの第三者によって提供することができる。
【0030】
一実施形態では及び
図15に関して以下に詳しく説明するように、コンピュータ装置105は、カテゴリに対する1つ又はそれよりも多くのドメインアクションを判断する(段階630)。コンピュータ装置105は、アクションレンダラー560によってアクションをレンダリングする(段階635)。カテゴリに関連付けられるアクションは、例えば、カテゴリが映画である場合にユーザがオンラインで映画をレンタルすることを可能にするBlockbusterのウェブページへのリンクを含むことができる。更に別の実施形態では、アクションは、ユーザがオンラインで映画をレンタルすることを可能にするウェブページ上のBlockbusterのウェブ形式に記入する段階を含むことができる。これらのアクションは、例えば、ユーザがリンクを選択することにより、ユーザがチェックボックスを選択することなどによってレンダリングすることができる。
【0031】
詳細なビューにトピックを表示するためのコンピュータ装置105によって実行される疑似コードの実施形態は、以下の通りである。
詳細なビューにトピックを表示するためのサーバコンピュータ110によって実行される疑似コードの実施形態は、以下の通りである。
【0032】
図7は、ブラウザ118の第2のコンテンツ区域135に表示されるサイドバー705のスクリーンショットである。サイドバー705は、トピックが特定の所定のカテゴリに分類できない時に表示される一般的なビューである(上述の
図4、段階418及び
図6、段階615を参照されたい)。サイドバー705の一般的なビューは、スポーツ情報へのリンク710、ビジネスページへのリンク715、及びニュースへのリンク720のような一般的な情報を含む。
【0033】
図8は、コンピュータ装置105がウェブページ812にナビゲートした時の第1のコンテンツ区域810及びトピック情報を表示している第2のコンテンツ区域815を表示するブラウザ805のスクリーンショットである。一実施形態では、第2のコンテンツ区域815は、ユーザがトピック情報を見ることを可能にするトピックタブ820を含む。一実施形態では、ユーザによって選択された時に、トピックタブは、セーブされた又は以前にフォローされたトピック830を表示する。以下に更に詳しく説明するように、これは、ユーザのトピック履歴と呼び、ユーザが(例えば、コンピュータ装置105にローカルに又はコンピュータ装置105に関連付けられるストレージ157に)セーブしたトピックを示している。
【0034】
一実施形態では、トピックタブ820はまた、最新トピックセクション840を含む。最新トピックセクション840は、最近見られたトピック(すなわち、ユーザにトピックが通知された後にコンピュータ装置105のユーザによって最近選択されたトピック)を含む。一実施形態では、最新トピックセクション840に列挙されたトピックはまた、ユーザがトピックを見た日又は日付を表示する。一実施形態では、トピックタブ820はまた、どれが現在一般的な(例えば、1つ又はそれよりも多くの検索エンジンを通じて検索された頻度が高い)トピックであるかというトピック提案850を含む。一実施形態では、ユーザがトピックタブ820に表示されたトピックの1つを選択した時に、ユーザは、詳細なビューに連れていかれる。一実施形態では(及び
図8に示すように)、ウェブページ812は、「Nintendo Wii(登録商標)」コンソールのレビューに関するウェブページである。
【0035】
図8では、2次コンテンツは、現在のウェブページに関連付けられていない。「私の興味」ユーザインタフェースは、ユーザがフォローしているトピック、ユーザがビューした最新トピック、及び提案されるトピックを表示するユーザダッシュボードである。一実施形態では、ユーザは、走査検索セッションの間のいずれの時間にも2次コンテンツ区域の地球的ボタンを通じて(及び可能であればブラウザクロムから)このユーザインタフェースにアクセスする。
【0036】
図9は、ユーザが「Nintendo Wii(登録商標)」コンソールをレビューするウェブページ812にナビゲートした後にサイドバー910に詳細ビューを表示するブラウザ905の実施形態のスクリーンショットである。一実施形態では、詳細ビューは、ウェブページ812に関するエンティティ915を含む。一実施形態では、エンティティ915は、テキスト(Nintendo Wii(登録商標))、グラフィック(「Nintendo Wii(登録商標)」グラフィック)、価格範囲(199.99ドル−299.99ドル)、及びレビュー格付け(5スター内で4)を含む。
【0037】
一実施形態では、サイドバー910の詳細ビューは、ウェブページのトピック(この例では、「Nintendo Wii(登録商標)」コンソール)に関連付けられる他のトピックである関係トピック920を提供する。一実施形態では、ユーザが関係トピック920を選択した場合、ユーザは、選択されたトピックに対する詳細ビューに(サイドバー910で)ナビゲートする。サイドバー910に表示された詳細ビューは、「少し見る」タブ925を含む。選択された時に「少し見る」タブ925は、見出されたトピックに対するコンテクスト固有のビューを表示する。この例では、「ニンテンドーWii」が製品としてカテゴライズされる。従って、少し見るタブ925は、ショッピング情報930(例えば、価格情報、オンラインストアへのリンク、eBayへのリンク、Craiglistへのリンクなど)を表示する。サイドバー910はまた、ニュースタブ940を含む。
【0038】
ユーザは、「私の興味」ユーザインタフェースからウェブページ812にナビゲートすることができ、コンテンツが第2のコンテンツ区域910に表示された場合は個人化検索使用ケース、及び/又は関連のトピックが第2のコンテンツ区域910に表示され更に共有リンクからの場合は走査検索使用ケースである。
【0039】
図10は、ニュースタブ1020がユーザによって選択されているサイドバー1010を表示するブラウザ1005のスクリーンショットである。一実施形態では、ニュースタブ1020は、ウェブページ812に関連付けられるトピック1025に対応する記事、写真、及び/又はビデオを表示することができる。記事ボタン1040は、ニュースタブ1020で選択される。一実施形態では、記事ボタン1040が選択された時に表示される記事は、プロバイダ毎にグループ分けされ、1)このプロバイダから見出された記事の数、2)これらの記事の関連度、3)結果に出てきた記事にユーザが行った訪問の数、4)ユーザがドメインに行った訪問の数、及び/又は5)ドメインがユーザによって「お気に入り」としてマーク付けされているか否かのうちの1つ又はそれよりも多くを考慮に入れた計算に基づいて並べ替えることができる。
【0040】
トピックに対する記事を表示するためのコンピュータ装置105の疑似コードの実施形態は、以下の通りである。
【0041】
疑似コードで上記に引用のされた「記事」は、写真、ビデオなどで置換することができることに注意すべきである。
【0042】
トピックに対する記事を表示するためのサーバコンピュータ110の疑似コードの実施形態は、以下の通りである。
【0043】
疑似コードで上記に引用のされた「記事」は、写真、ビデオなどで置換することができることに注意すべきである。
【0044】
図11は、アスリート詳細ビューを含むサイドバー1110を表示するブラウザ1105のスクリーンショットである。アスリート詳細ビューでは、「少し見る」タブ1120の下で異なるコンテンツを利用することができる。ユーザが
図8のフォロートピック830から「Kobe Bryant」を選択した時にこのビューに到達する。Kobe Bryantは、この詳細ビューにおけるトピック1130である。トピック1130は、Kobe Bryantの写真、並びに彼のポジション(シューティングガード)、彼のチーム(ロサンジェルス・レイカーズ)、及び彼の統計データ(1ゲームにつき26.8ポイントなど)のKobe Bryantに関する情報を含む。第1のコンテンツ区域では、ブラウザ118は、「Nintendo Wii(登録商標)」コンソールレビューに関するウェブページ812を表示している。「少し見る」タブ1120の下に表示された情報は、
図8−10に表示された情報とは異なる。特に、トピック1130がアスリートでありカテゴリがスポーツである時に、一実施形態では、アスリート(Kobe Bryantなど)に関する情報が表示されスポーツウェブサイトへのリンク(Sports Illustrated、ESPNなど)が表示される。一実施形態では、ユーザは、最新又は「お気に入り」トピックを引き出すために
図8に示す「「私の興味」」ビューを使用することができ、それによってユーザは、以前にビューされたトピックの情報を取得するためにユーザインタフェースを使用するために、そのトピックが見出されたウェブページに行く必要はない。これは、ニンテンドーWiiページ812のままで
図11におけるKobe Bryantを見ている理由である。
【0045】
図12は、映画「ディストリクト9」を説明するウェブページ1210にナビゲートしたブラウザ1205のスクリーンショットである。ウェブページ1210に対するエンティティ1215が判断され、サイドバー1220に表示される。エンティティ1215は、ウェブページ1210に対するトピック(「ディストリクト9」)、映画のグラフィック及びいくつかのレビューを含む。サイドバー1220は、例えば、トレーラ1230、1240、Netflixへのリンク1250、及び映画レビュー1260を含む。
【0046】
一実施形態では、ブラウザ118に関連付けられるブラウザ履歴は、トピックに関連付けられる。従って、一実施形態では、それらのタイトルに基づいて関連付けられるように即座には思われない2つのウェブページは、ウェブページの主なトピックに基づいて関連付けられることを実際に見出すことができる。トピックに基づくブラウザ履歴は、ユーザが現在閲覧しているトピックに基づいて表示することができる。従って、ユーザがフォローしているトピックに関する情報又はユーザが現在ナビゲートしているウェブページに関連付けられるものにアクセスした時に、このようなトピックに相関付けられるユーザの履歴からのウェブページが表示されるようにブラウザ履歴がアクセスされる。
【0047】
図13は、トピックに基づくブラウザ履歴を判断するためにクライアント側モジュール125によって実行される段階の実施形態を示す流れ図である。ユーザは、ブラウザ118を使用して特定のウェブページにナビゲートする(段階1305)。一実施形態では、クライアント側モジュール125は、ユーザがナビゲートしたウェブページに関連付けられる1組のトピックを取得する(段階1310)。これらの1組のトピックは、ストレージ157から検索することができ、又はサーバコンピュータ110から受信することができる。次に、クライアント側モジュール125は、ウェブページに関連付けられる1組のトピックに関連付けられる他のトピックを判断する(段階315)。次に、クライアント側モジュール125は、ブラウザ118が所定の期間内に(例えば、設定時間数内、設定日数内などに)ナビゲートした他のトピックに関連付けられるウェブページを判断する(段階1320)。ブラウザ118は、第1のコンテンツ区域130にウェブページを(段階1325)及び第2のコンテンツ区域135に1組のトピックに関連付けられる他のトピック及び他のトピックに関連付けられるウェブページへの1つ又はそれよりも多くのリンクを(段階1330)表示する。
【0048】
一実施形態では、クライアント側モジュール125は、ウェブページのURLをサーバコンピュータ110に送信する。サーバコンピュータ110はURLを受信し、ウェブページに関連付けられる1組のトピックを取得(例えば、サーバストレージ155から検索)する。一実施形態では、サーバコンピュータ110は、ウェブページに関連付けられる1組のトピックに関連付けられる他のトピックを判断し、所定の期間内にブラウザがナビゲートした他のトピックに関連付けられるウェブページを判断する。サーバコンピュータ110は、他のトピック及び他のトピックに関連付けられるウェブページへのリンクをブラウザ118の第2のコンテンツ区域135に表示するためにクライアント側モジュール125に送信する。別の実施形態では、クライアント側モジュール125は、ウェブページに関連付けられる1組のトピックに関連付けられる他のトピックを判断し、所定の期間内にブラウザがナビゲートした他のトピックに関連付けられるウェブページを判断する。
【0049】
図14は、トピックに基づくブラウザ履歴を収集するためにクライアント側モジュール125によって実行される段階を示す流れ図である。クライアント側モジュール125は、新しいウェブページがロードされるウェブブラウザからの通信を受信する(段階1405)。上述のように、クライアント側モジュール125は、サーバコンピュータ110からウェブページに関連付けられるトピック(エンティティなど)を受信する(段階1410)。上述のように、サーバコンピュータ110は、そのサーバストレージ155からこのトピック情報(エンティティなど)を検索することができ、又はサーバコンピュータ110がウェブページに関連付けられるトピックに対する要求140を受信したら(例えば、サーバコンピュータ110がURLを受信したら)新しいウェブページを分析することができる。クライアント側モジュール125は、ウェブページのURL及び受信したトピックをクライアント側モジュール125に関連付けられるトピック履歴データベース(又はメモリ)(ストレージ157など)に追加する(段階1415)。次に、クライアント側モジュール125は、トピック履歴に現在表示されるトピックに関連付けられる別のURLがあるか否かを判断する(段階1420)。ない場合、処理は終了する(段階1425)。
【0050】
現在表示されるトピックに関連付けられる別のURLがトピック履歴データベース157に存在する場合、クライアント側モジュール125は、トピック履歴データベース157から次のURLを検索する(段階1430)。次に、クライアント側モジュール125は、見出されたURLへのリンクをブラウザ118の第2のコンテンツ区域135に表示する(段階1435)。これは、
図8の最新トピックセクション840の上方に表示されている。一実施形態では、クライアント側モジュール125は、第2のコンテンツ区域(サイドバーなど)が開いている場合は段階1435だけを実行する。更に別の実施形態では、クライアント側モジュール125は、表示する新しいトピックがあるという警報を表示する。ユーザが警報を受け入れた場合、新しいトピックが表示される。一実施形態では、ストレージ157に格納されたトピックエンカウンタは、ユーザに通知を表示する時の合図として使用される。
【0051】
一実施形態では、特定の期間に特定のトピックに関係する他のユーザが訪問したウェブページを判断するために、URLに関連付けられるトピックがデータベースに格納される。それによってデータベースのコンテンツがキー入力され、従って、トピック毎に検索することができるようになる。従って、そのトピックに関連付けられるユーザが以前に訪問したURLを判断することができる。一実施形態では、各格納されたURLに対するスコアが計算される。一実施形態では、このスコアは、総訪問数及び/又は最後の訪問の日付に基づいている。一実施形態では、ウェブページに関連付けられるトピックは、ユーザのトピック履歴に自動的に追加される。別の実施形態では、ユーザは、ユーザのトピック履歴に項目を追加するために明示的なアクションを実行すべきである(例えば、トピックにアクセス/ビューすべきである)。
【0052】
図15は、トピック履歴データベース157にトピックに基づくブラウザ履歴を格納するのに使用されるデータベース方式の実施形態を示している。データベース方式は、トピック記録1510にリンクするURL記録1505を含む。URL記録1505は、URLフィールド1515(一実施形態では、URL記録1505のキーである)、ユーザがURLを訪問した回数を表す訪問カウントフィールド1520、URLに関連付けられるトピック又は複数のトピックを表すトピックフィールド1525、URLに関連付けられるウェブページのタイトルを表すページタイトルフィールド1530、ユーザが最後にURLを訪問したことを表す最終訪問タイムスタンプフィールド1535、及びURLに関連付けられるウェブページのドメインを表すページドメインフィールド1540を含む。一実施形態では、トピックフィールド1525は、トピック記録1510にリンクする。トピック記録1510は、トピックに関連付けられる1つ又はそれよりも多くの項目を表す項目1545及びトピックに関連付けられる1つ又はそれよりも多くのカテゴリを表すカテゴリ1550を含む。
【0053】
URL及びトピックをトピック履歴データベース157に追加するためのコンピュータ装置105の疑似コードの実施形態は、以下の通りである。
【0054】
図7を再度参照すると、ユーザのトピックに基づくブラウザ履歴からのリンクが示されている。例えば、「amazon kindle」、「Kobe Bryant」、及び「kobe bryant」というタイトルを備えたリンクは、ユーザのブラウザ履歴からのリンクである。これらのリンクはまた、最終訪問タイムスタンプフィールド1535からのデータを表示する(例えば、「44分前」、「48分前」、及び「49分前」)。従って、クライアント側モジュール125は、ウェブページのトピックに関連付けられるブラウザ履歴を維持することができる。
【0055】
一実施形態では、クライアント側モジュール125は、特定のユーザが頻繁にナビゲートする様々なカテゴリにわたってウェブサイトを走査する。次に、クライアント側モジュール125は、この情報を使用して履歴に基づいてこれらのカテゴリに対するアクションを提案することができる。
【0056】
例えば、サービスプロバイダ(カリフォルニア州サニーベールのYahoo!インコーポレーテッドなど)が、販売又はレンタルすることができる映画に基づいてユーザインタフェースを呈示しているとする。一実施形態では、クライアント側モジュール125は、ユーザが多くナビゲートした映画販売に含まれるドメインを判断する。次に、クライアント側モジュール125は、ユーザの履歴に基づいてこれらのウェブサイトから購入又はレンタルするためのボタンを提供することができる。
【0057】
図16は、ユーザが頻繁にナビゲートするウェブサイトに基づいてクライアント側モジュール125がユーザに1つ又はそれよりも多くのアクションを提案するためにサーバコンピュータ110によって実行される段階の実施形態を示す流れ図である。一実施形態では、サーバコンピュータ110は、アクション情報が提供される1組のカテゴリを識別する(段階1605)。一実施形態では、カテゴリの組が事前に判断される。代替的に、ユーザは、ユーザがアクション提案を受けたいと希望する1つ又はそれよりも多くのカテゴリを選択する。
【0058】
次に、サーバコンピュータ110は、各識別されたカテゴリにおける特定のウェブサイト(「最善の」サイトとも呼ぶ)を識別する(段階1610)。次に、サーバコンピュータ110は、識別されたウェブサイトにわたっていくつかの共通アクションを実行する方法を判断する(段階1615)。次に、この情報は、サーバストレージ155に格納される(段階1620)。一実施形態では、次に、サーバコンピュータ110は、クライアント側モジュール125に情報を送信し、それによってクライアント側モジュール125は格納されたアクションを表示することができる(段階1625)。
【0059】
一実施形態では、提案されたアクションは、カテゴリにわたって利用することができるサイト(Facebook及び/又はTwitterなど)からのアクションを含む。例えば、ユーザは映画トピックをビューすることができ、Twitterがユーザの履歴及び関心プロフィールに格納されているのでTwitterアクションが表示されることになる。
【0060】
図17は、ドメイン履歴データベース(又はメモリ/ストレージ)(ストレージ157など)をポピュレートするためにクライアント側モジュール125によって実行される段階の実施形態を示す流れ図である。クライアント側モジュール125は、ウェブブラウザ118から(次の)訪問されたURLを取得する(段階1705)。次に、クライアント側モジュール125は、トピック履歴データベース157に付加的な履歴があるか否かを判断する(段階1710)。付加的な履歴がない場合、処理は終了する(段階1715)。付加的な履歴がある場合、クライアント側モジュール125は、URLからドメインを抽出する(段階1720)。クライアント側モジュール125は、このドメインが既に処理されているか否かを段階1725で判断する。処理されていない場合、このドメインは、ドメイン履歴データベース(トピック履歴データベース157と同じものとすることができ、又は異なるものでもよい)に格納される(段階1730)。処理されている場合、
図15の訪問カウントフィールド1520がドメイン履歴データベース157で増分される(段階1735)。次に、処理は、段階1705に戻る。一実施形態では、ドメインに基づくブラウザ履歴及びトピック履歴は異なるデータセットである。
【0061】
図18は、ユーザの最も頻繁に訪問されたウェブサイトに関連付けられるアクションを提案するためにブラウザ履歴を使用するためクライアント側モジュール125によって実行される段階の実施形態を示す流れ図である。クライアント側モジュール125は、アクションデータベース(ストレージ157と同じか又は異なるものでもよい)から次のアクションを取得する(段階1805)。
図19は、アクションデータベース157にアクション記録1905のようなアクション記録を格納するのに使用されるデータベース方式の実施形態を示している。
【0062】
アクション記録1905は、アクションタイプフィールド1910を含む。アクションタイプフィールド1910は、アクションのタイプ(「チケットを買う」、「アスリートプレーヤプロフィールを表示する」など)を固有に識別する列記された値に対応する。アクション記録1905はまた、このアクションが有効である1つ又はそれよりも多くのユーザインタフェースカテゴリのリストに対応するカテゴリタイプフィールド1915を含む。アクション記録1905はまた、プロバイダの名称(「Amazon.com」、「ESPN」、「NetFlix」など)に対応するプロバイダ名フィールド1920を含む。アクション記録1905はまた、プロバイダのウェブサイトのドメイン名(ドメインに基づくブラウザ履歴に相関付けることができる)に対応するプロバイダドメイン1925を含む。アクション記録1905はまた、このアクションを実行するためにURLにナビゲートするためのテンプレートを含むストリングに対応するアクションURLテンプレートフィールド1930を含む。ストリングは、考えられる特定の項目、現在のユーザのジップコードのようなこのアクションが出現する特定のインスタンスに関連付けられるライブ値に対する代理コードを含むことができる。例えば、FoxSports.comは、次のURL:http://msn.foxsports.com/<league>/player?statsId=<playerID>によってアクション「アスリートプレーヤプロフィールを表示する」をサポートする。一実施形態では、このURLは、これらのアクションが呈示される時にクライアント側モジュール125によって得られた生データから書き込まれるleague及びplayerIDに対する代理コードと共にアクションURLテンプレートフィールド1930に格納される。
【0063】
図18を再度参照すると、クライアント側モジュール125は、アクションデータベース157に付加的なアクションがあるか否かを判断する(段階1810)。付加的なアクションがある場合、クライアント側モジュール125は、アクション記録1905のアクションタイプフィールド1910がクライアント側モジュール125によって表示された現在のユーザインタフェース(UI)カテゴリに対して有効か否かを判断する(段階1820)。付加的なアクションがない場合、処理は段階1805に戻りアクションデータベース157から次のアクションを取得する。アクションタイプフィールド1910が現在のUIに対して有効である場合、クライアント側モジュール125は、アクション記録1905のプロバイダドメインフィールド1925がドメイン履歴にあるか否かを判断する(段階1825)。ドメイン履歴にない場合、処理は段階1805に戻りアクションデータベース157から次のアクションを取得する。ドメイン履歴にある場合、クライアント側モジュール125は、アクション及び対応するドメイン訪問カウントをアクションデータベース157におけるアクションリストに追加する(段階1830)。
【0064】
段階1810に付加的なアクションがない場合、クライアント側モジュール125は、アクションデータベース157における現在のアクションリストを並べ替える(段階1840)。一実施形態では、次に、クライアント側モジュール125は、1つよりも多いアクションを表示するか否かを判断する(段階1850)。表示しない場合、クライアント側モジュール125は、第1のアクションに対するUIを形成しリンクを提供する(段階1855)。次に、処理は終了する(段階1860)。表示する場合、クライアント側モジュール125は、並べ替えられたリストから次のアクションを検索する(段階1865)。次に、クライアント側モジュール125は、付加的なアクションがあるか否かを判断する(段階1870)。付加的なアクションがない場合、処理は終了する(段階1860)。付加的なアクションがある場合、クライアント側モジュール125は、現在のアクションに対するUI及びリンクを形成する(段階1880)。次に、処理は段階1865に戻る。
【0065】
ドメインに基づく履歴を読み取るためのコンピュータ装置105の疑似コードの実施形態は、以下の通りである。
【0066】
アクションベースのUIを読み取るためのコンピュータ装置105の疑似コードの実施形態は、以下の通りである。
【0067】
例えば、
図9を再度参照すると、ユーザが「Nintendo Wii(登録商標)」のリストをeBayで見ることを可能にするアクション950が示されている。ユーザが「Nintendo Wii(登録商標)」のリストをCraiglistで見ることを可能にする別のアクション960が示されている。
図11を参照すると、チケットを買うための単一プロバイダのドメインに基づくアクションがアクション1160で示されている。複数のプロバイダのドメインに基づくアクションは、SportsIllustratedに関連付けられるアクション1170及びESPNに関連付けられるアクション1180のようなアクションプロバイダ毎にグループ分けすることができる。
【0068】
一実施形態では、ユーザは、これらの段階を実行するためのサービスにログインすべきである。本明細書に説明する段階の1つ又はそれよりも多くは、特に断りのない限りいずれの順序でも、及び特に断りのない限り第2のコンテンツ区域が開いているか閉じている時に実行することができることに注意すべきである。
【0069】
図20は、
図1のサーバコンピュータにおけるトピック及びカテゴリ判断モジュール145の実施形態のブロック図である。一実施形態では、トピック及びカテゴリ判断モジュール145は、訓練モジュール2005、索引付けモジュール2010及びランタイムモジュール2015を含む。
図21は、
図20のモジュール2005、2010、2015によって実行される段階を示す流れ図である。訓練モジュール2005は、2つの監視下機械学習モデル(以下では分類器と呼ぶ)を生成するためにオフライン訓練段階を実行する(段階2105)。以下に更に詳しく説明するように、オフライン訓練段階は、ウェブページに対する1組のトピック及びカテゴリを判断するためにウェブページに適用することができる1つ又はそれよりも多くの分類器を生成することを可能にするようにデータを検索する段階及び検索されたデータを分析する段階を含む。索引付けモジュール2010は、訓練段階で生成された分類器を使用して索引付け段階を実行する。索引付け段階は、ウェブページに対する1組のトピック及びカテゴリを判断するためにウェブページを検索する段階及びウェブページを分析する段階を含む。索引付け段階は、各ウェブページに対する判断されたトピック及びカテゴリを格納する。ランタイムモジュール2015は、ユーザがナビゲートした特定のウェブページに対するトピックをユーザが要求した時に、索引付け段階で判断されたトピック及びカテゴリを提供する。これらのモジュール2005、2010、2015は、ソフトウエア、ハードウエア、又はソフトウエアとハードウエアの組合せとすることができる。例えば、一実施形態では、モジュール2005、2010、2015の1つ又はそれよりも多くは、コンピュータ装置である。更に、各モジュール2005、2010、2015の機能は、単一のソフトウエアモジュール又はコンピュータ装置に結合することができる。
【0070】
図22は、訓練モジュール2005の実施形態のブロック図である。
図23は、訓練モジュール2005によって実行される段階の実施形態の流れ図である。一実施形態では、訓練モジュール2005は、1つ又はそれよりも多くのウェブ記事2205を検索する(段階2305)。
【0071】
一実施形態では、ウェブ記事2205は、www.wikipedia.orgからのデータファイルのような1つ又はそれよりも多くの知識収集ウェブサイトデータファイルから検索された外部文書である。Wikipedia(登録商標)は、多数の記事を有し、各記事は、リンク構造を含み少なくとも1つのカテゴリに属する。更に、「リディレクトページ」は、記事との同義語の解決を可能にする。記事の各リンクは、曖昧性をなくした記事を示している。更に、Wikipedia(登録商標)におけるカテゴリ階層は、広範囲で深く、Wikipedia(登録商標)記事のリンク構造は、以下に説明するように、曖昧性除去及び選択のためのラベル付き訓練データの貴重なソースである。
【0072】
一実施形態では、訓練モジュール2005は、各ウェブ記事2205から情報を抽出するために記事情報抽出モジュール2210を含む(段階2310)。一実施形態では、記事情報抽出モジュール2210は、Wikipedia(登録商標)分類法においてデータ(ウェブ記事など)をノードのセットに分解するモジュールである。記事情報抽出モジュール2205はまた、抽出された情報に関連付けられるリンクデータを判断することができる(段階2315)。各ウェブ記事から得られたリンクデータは、例えば、そのインリンク(他のウェブ記事からのリンク)、そのアウトリンク(他のウェブ記事へのリンク)、いずれかのリディレクト(同義語から)、カテゴリ階層、及び/又は曖昧性除去(以下に定義されるように)を含むことができる。抽出モジュール2210は、リンクデータ及び抽出された情報(記事のテキスト、インリンク、アウトリンク、いずれかのリディレクト、カテゴリ階層、及び/又は曖昧性除去)をストレージ媒体/複数の媒体2215(データベースなど)に格納する。Wikipedia(登録商標)リンク構造は、曖昧性除去分類器及び選択分類器を生成するのに使用されるラベル付き訓練インスタンスを形成する。
【0073】
一実施形態では、曖昧性除去学習モジュール2220は、ストレージ媒体/複数の媒体2215に格納された情報に対して作動する。本明細書で使用される曖昧性除去は、複数の意味を有することができる語句(1つ又はそれよりも多くの隣接する語)の意味を判断する処理である。一実施形態では、語句は、語句が1つよりも多いウェブ記事にリンクしている場合に複数の意味を有する。曖昧性の除去は、特定の使用において適切なものである意味を判断する処理である。例えば、「木」という語は、樹木に関連付けることができ、又はデータ構造に関連付けることができる。「木」という語が使用される方法、木の周りの語などは、所定の語句に対して正しい木の使用を判断する。
【0074】
曖昧性除去学習モジュール2220は抽出された情報及び/又はリンクデータから学習し、抽出された情報の曖昧性を除去する(段階2320)。特に、一実施形態では、曖昧性除去学習モジュール2220は、その関連(曖昧でないトピック)を使用して曖昧な語句の意味の可能性を予想するように学習する。語句は、単に1つの意味を有する場合に曖昧でないと考えられる。語句の曖昧性を除去するために、共起する曖昧でない語句のセットに対する特徴ベクトルが作成される。次に、曖昧性除去学習モジュール2220は、その学習から曖昧性除去分類器2225を生成する(段階2325)。一実施形態では、曖昧性除去分類器2225は、C4.5アルゴリズムを使用して作成される勾配ブースト判断ツリーである。曖昧性除去の特徴は、例えば、1)意味の事前確率又は共通性(意味の発生の数/意味の総数など)、2)同系性、及び/又は3)コンテクスト品質(コンテクスト記事の平均同系性など)を含む。
【0075】
2つのトピックの間の同系性(概念とも呼ぶ)は、両方のトピックにリンクする共通の記事(概念)対いずれかにリンクするものの数の比である。一実施形態では、2つのWikipedia(登録商標)記事に対して、同系性は、各記事へのインリンクのセットである関数を備えた標準化グーグル距離(NGD)である。基本的に、NGDは、2つの語の間の関係の強さを定量化する。例えば、「スピーカ」と「サウンド」は、「スピーカ」と「象」よりも近くに関連付けられる。一実施形態では、曖昧性除去学習モジュール420は、2つの語が検索で一緒に使用される時にYahoo!又はGooglePageCountを見出す(「スピーカ」と「サウンド」は、「スピーカ」と「象」に比べて相対的に高い数の結果ページを有することになる)。従って、検索距離は、所定のキーワードのセットに対してGoogle検索エンジンによって戻されるヒットの数から得られた意味的相関性の尺度である。自然言語意味において同じか又は類似の意味を有するキーワードは、検索距離の単位で「近い」傾向があり、類似しない意味を有する語は、遠くに離れている傾向がある。
【0076】
曖昧性除去学習モジュール2220は、選択学習モジュール2230と通信する。選択学習モジュール2230は、トピックが文書(ウェブ記事2205など)のテーマをどのように確実に説明するかでトピック(概念)に順序付ける。本明細書で使用される文書のテーマは、概念の順序付けられたリストとして本明細書で定義される。リストは、このような文書に対する概念の重要度で順序付けされる。一実施形態では、トピックは、Wikipedia(登録商標)内の記事(ノード)のサブジェクトである文書に出現する1つ又はそれよりも多くの隣接する語である。特に、選択学習モジュール2230は、ウェブ記事のテーマに関連するものとして抽出された情報の一部分を選択することを学習する(段階2330)。選択学習モジュール2230がトピックの選択を学習した状態で、選択分類器2235が生成される(段階2335)。選択分類器2235は、トピックがアンカーになる可能性を予想することを学習する。一実施形態では、選択分類器2235は、勾配ブースト判断ツリーである。一実施形態では、曖昧性除去分類器の関連出力が与えられると、選択学習モジュール2230は、これらが文書(ウェブページなど)のテーマをどのように確実に説明するかでトピックを順序付ける。Wikipedia(登録商標)記事におけるアンカーは、例えば、Wikipedia(登録商標)などからのリンク指針のセットをフォローすることによって作成される。選択分類器2235の特徴は、「キーフレーズであること」、曖昧性除去の可能性、コンテクスト項目に対する関連性、Wikipedia(登録商標)分類法における深さ、カウント、分散(発生を備えた段落の数/段落の総数)を含む。
【0077】
以下に更に詳しく説明するように、選択分類器2235は、ウェブページのトピック及び1組のカテゴリを判断するために、曖昧性除去分類器2225による索引付け段階で使用される(段階2340)。
図22の各モジュール2210、2215、2220、2225、2230、2235をソフトウエア、ハードウエア、又はソフトウエアとハードウエアの組合せとすることができることに注意すべきである。更に、モジュールの1つ又はそれよりも多くの機能は、1つ又はそれよりも多くの付加的なモジュールによって結合することができる。
【0078】
図24は、索引付けモジュール2010の実施形態のブロック図である。
図25は、索引付けモジュール2010によって実行される段階の実施形態を示す流れ図である。オフライン訓練段階が実行された後、トピック及びカテゴリ判断モジュール145が索引付け段階を実行する。一実施形態では、トピック及びカテゴリ判断モジュール145は、ウェブを「クロール」するためにウェブ検索ソフトウエア(スパイダーと呼ぶことが多い)を送信する。この結果、サーバは1つ又はそれよりも多くのウェブページ2405を検索し(段階2505)、各ウェブページ2405を索引付けモジュール2010に送信する。
【0079】
索引付けモジュール2010は、トークン化モジュール2410を含む。一実施形態では、トークン化モジュール2410は、各クロールされたウェブページ2405をトークン化し、Wikipedia(登録商標)名2415などによって格納されたデータに関連付けられるウェブページ2405における語句(1つ又はそれよりも多くの隣接する語)を判断する(段階2510)。一実施形態では、トークン化モジュール2410は、ウェブページ2405で見出されたWikipedia(登録商標)名2420を曖昧性除去分類器2225に送信する。上述のように、曖昧性除去分類器2225は、コンテクスト(曖昧でないトピック)を使用して曖昧な語句の意味の可能性を予想し、クロールされたウェブページ2405の各トークン化された語句に対するコンテクスト2430を出力する(段階2515)。
【0080】
図26は、曖昧性除去の例示的な実施形態のスクリーンショットである。曖昧性除去分類器2225は、記事のタイトル「タタが1.15億ポンドでジャガーを買収」2605で見出された「ジャガー」という語を分析し、「ジャガー」は、動物(ボックス2610に示されている)、自動車銘柄のジャガー(ボックス2615に示されている)、又はジャガーファイタージェット(ボックス2620に示されている)のレファレンスとすることができると判断する。
【0081】
図27Aは、曖昧性除去の例における更に別の実施形態のスクリーンショット2700である。曖昧性除去分類器2225は、記事2605を分析して記事2605における語句の多くがジャガー自動車銘柄2615に関連していると判断する。曖昧性除去分類器2225は、ウェブ記事2605における「ジャガー」という語の適切な意味を判断している。曖昧性除去分類器2225の出力の一実施形態は、
図27Bの出力ウィンドウ2705に示されている。出力ウィンドウ2705は、ウェブ記事2605の概念又はトピックが「ジャガーの車」であると曖昧性除去分類器2225が判断していることを示している。出力ウィンドウ2705はまた、概念又はトピック「ジャガーの車」は、イギリス銘柄、自動車メーカ、タタ群、コベントリモータカンパニー、及び英国の自動車メーカのような多くの関連付けられるカテゴリを有することを曖昧性除去分類器2225が判断していることを示している。各カテゴリは、ウェブ記事2605にカテゴリがどのように関連付けられるかを表す対応する重みを有する。一実施形態では、重みは、曖昧でない語句に対して1及び複数の意味を有する語句に対して1よりも小さい値とすることができる曖昧性除去信頼値である。
【0082】
上述のように、選択分類器2235は、語句のコンテクストに適用され、ウェブ文書2405のテーマをどのくらい確実に説明しているかに対してトピックを順序付けるか又は格付ける。
図28Aは、選択例示的な実施形態のスクリーンショット2800である。選択分類器2235は、ウェブ記事2605における語句のコンテクストを受信し、更にトピックがウェブ文書2605のテーマをどのくらい確実に説明しているかに基づいて語句から判断されたトピック2805(
図28Bに示されている)を格付ける。選択分類器2235の出力ウィンドウ2810(
図28Cに示されている)は、見出されたトピック及びそのそれぞれの重みの例を示している。
【0083】
図24及び25を再度参照すると、一実施形態では、選択分類器2235は、ウェブページ2405に関連付けられたトピック及びカテゴリ2435をトピック順序付けモジュール2440に送信する。トピック順序付けモジュール2440は、アバウト性モジュール2445及び「検索誘導」性モジュール2450を含む。アバウト性モジュール2445は、コヒーレントトピックの最大クラスターに対して重要でないトピックを濾過する。一実施形態では、アバウト性モジュール2445は、関連性の第2のレベルフィルタである。一実施形態では、アバウト性モジュール2445は、コンテクスト2430において他のトピックとの低関連性を有するトピックを取り除く。一実施形態では、アバウト性モジュール2445は、ウェブページに存在する他のトピックに対するトピックの優勢性としてモデル化される。一実施形態では、トピックの優勢性は、そのアウトリンクによってコンテクストトピックの範囲として定義される。式として、トピックの優勢性は、次式のように定義される。
【0084】
一実施形態では、アバウト性モジュール2445は、アバウト性において選択されたトピックを格付けし、ゼロの値を有するトピックを廃棄する。一実施形態では、アバウト性モジュール2445は、ウェブページ2405で識別された各トピックに対するスコアを提供する。スコアは、トピックがウェブページ2405に対して見出された他のトピックと比べてどのくらい優勢であるかを表している。更に別の実施形態では、アバウト性モジュール2445は、スコア(トピックがどのくらい優勢であるかを表す)及びスコアに対する重み(特定のスコア値に対してどのくらいの重みを与えるべきかを表す)を提供する。一実施形態では、アバウト性モジュール2445は、分類器を生成し、大きな記事における単一の優勢トピックを選択することを学習する。
【0085】
一実施形態では、トピック順序付けモジュール2440はまた、「検索誘導」性モジュール2450を含む。「検索誘導」性は、項目が明示的にウェブ検索される可能性を説明する。一実施形態では、このモジュール2450は、選択分類器2235から送信されたトピック2435を再格付ける。「検索誘導」性は、各トピックに対して計算することができ、検索問合せとしてその表面形式を扱い、1)現在のページ2405に辿り着く問合せの数、2)問合せの総数、及び3)バズスコアの変化のうちの1つ又はそれよりも多くの関数であり、従って、バズは、一般的に、考察中のトピックが「インターネット」上で多くの注意を向けられているか(例えば、トピックが現在どのように報道価値があるか)を意味する。
【0086】
トピック順序付けモジュール2440からのトピック及びカテゴリ出力2452は、次に、カテゴリ格付けモジュール2455に適用される。一実施形態では、カテゴリ格付けモジュール2455は、カテゴリ2452を更に格付ける。一実施形態では、各トピックは、多くの異なるカテゴリに属する。一実施形態では、カテゴリ格付けモジュール2455は、現在のコンテクストに関係がある各トピックに対するカテゴリを格付ける。一実施形態では、カテゴリ2452は、他の選択されたトピックのカテゴリとWikipedia(登録商標)カテゴリ階層における深度を備えたその協定の関数の通りに格付けされる。例えば、カテゴリ格付けモジュール2455は、アーノルド・シュワルツネッガーに対してウェブページ対話男優では「カリフォルニア州知事」より高く「アメリカフィルムアクター」のカテゴリを格付ける。一実施形態では、カテゴリ格付けモジュール2455は、各ウェブページ2405に関連付けられるトピック及びカテゴリ文書2460(例えば、XMLで)出力する。
図24の各モジュール2410、2415、2225、2235、2440、2445、2450、及び2455は、ソフトウエア、ハードウエア、又はソフトウエアとハードウエアの組合せとすることができることに注意すべきである。更に、モジュールの1つ又はそれよりも多くの機能を1つ又はそれよりも多くの付加的なモジュールに結合することができる。
【0087】
上述の段階が完了した後、ランタイム段階が実行される。ユーザは、特定のウェブページにナビゲートするために、コンピュータ装置105によって表示されたウェブブラウザ(
図1に示されている)を使用する。
図29は、ユーザがナビゲートしたウェブページ2905及びサイドバー2910の実施形態のスクリーンショットを示している。ウェブページ2905は、ブラウザ2920の第1のコンテンツ区域2915に表示される。サイドバー2910は、ブラウザ2920の第2のコンテンツ区域2925に表示される。一実施形態では、ウェブページ2905のURL2930は、サーバコンピュータ110に送信される(
図1に示されている)。一実施形態では、サーバコンピュータ110は、ウェブページ2905に関連付けられるトピックに対応するエンティティを検索するためにそのストレージ155(
図1に示されている)に問い合わせるためにURL2930を使用する。一実施形態では、エンティティにおけるトピックの新鮮さを検証するためにハッシュが使用される。エンティティは、ブラウザ2920の第2のコンテンツ区域2925にコンピュータ装置によって表示される。例えば、エンティティ2940、2945、及び2950は、ウェブページ2905に対して表示される。エンティティは、例えば、トピックの組のトピックに関連付けられるテキスト、アイコン、グラフィック、リンク、ビデオなどを含むことができる。
【0088】
一実施形態では、サーバ110は、そのストレージ155に問い合わせて、特定のURL2930に対してエンティティが存在しないと判断する。これが起こった時に、一実施形態では、サーバ110がウェブページ2905をダウンロードし、ウェブページ2905において上述の索引付け段階を実行する。索引付け段階に関連付けられる処理がURL2930に対して終了した時に、サーバ110は、ウェブページ2905に関連付けられる1つ又はそれよりも多くのエンティティを表示のためにコンピュータ装置105に送信する。
【0089】
図30は、本発明の開示の1つ又はそれよりも多くの実施形態によりサーバ110及び/又はコンピュータ装置105のようなコンピュータ装置の例の内部アーキテクチャを示すブロック図である。
図30に示すように、内部アーキテクチャ3000は、少なくとも1つのコンピュータバス3002にインタフェースする1つ又はそれよりも多くの処理ユニット(本明細書ではCPUとも呼ぶ)3012を含む。コンピュータバス3002にインタフェースするのは、永続ストレージ媒体/複数の媒体3006、ネットワークインタフェース3014、メモリ3004、例えば、ランダムアクセスメモリ(RAM)、ランタイム一時メモリ、読取専用メモリ(ROM)のようなフロッピー(登録商標)、CD−ROM、DVDのような取外し可能媒体を含む媒体を読み取る及び/又は書き込むことができるドライブのためのインタフェースとしての媒体ディスクドライブインタフェース3008、媒体、モニタ又は他の表示装置のためのインタフェースとしてのディスプレイインタフェース3010、キーボードのためのインタフェースとしてのキーボードインタフェース3016、マウス又は他のポインティング装置のためのインタフェースとしてのポインティング装置インタフェース3018、及び並列及び直列ポートインタフェース、及びユニバーサルシリアルバス(USB)インタフェースなどのような個々に示されていない様々な他のインタフェースである。
【0090】
メモリ3004は、オペレーティングシステム、アプリケーションプログラム、装置ドライバ、及びプログラムコード、及び/又はコンピュータ実行可能処理段階、本明細書に説明する組込み機能、例えば、本明細書に説明する処理フローの1つ又はそれよりも多くなどを含むソフトウエアモジュールのようなソフトウエアプログラムの実行中に、メモリ3004に格納された情報をCPU3012に提供するためにコンピュータバス3002にインタフェースする。CPU3012は、最初に、ストレージから、例えば、メモリ3004、ストレージ媒体/複数の媒体3006、取外し可能媒体ドライブ、及び/又は他のストレージからコンピュータ実行可能処理段階をロードする。次に、CPU3012は、ロードされたコンピュータ実行可能処理段階を実行するために、格納された処理段階を実行することができる。格納されたデータ、例えば、ストレージによって格納されたデータは、コンピュータ実行可能処理段階の実行中にCPU3012によってアクセス可能である。
【0091】
永続ストレージ媒体/複数の媒体3006は、ソフトウエア及びデータ、例えば、オペレーティングシステム及び1つ又はそれよりも多くのアプリケーションプログラムを格納するために使用することができるコンピュータ可読ストレージ媒体である。永続ストレージ媒体/複数の媒体3006はまた、デジタルカメラドライバ、モニタドライバ、プリンタドライバ、スキャナドライバ、又は他の装置ドライバ、ウェブページ、コンテンツファイル、プレイリスト及び他のファイルの1つ又はそれよりも多くのような装置ドライバを格納するために使用することができる。永続ストレージ媒体/複数の媒体3006は、本発明の開示の1つ又はそれよりも多くの実施形態を実施するのに使用されるプログラムモジュール及びデータファイルを更に含むことができる。永続ストレージ媒体/複数の媒体3006は、コンピュータ装置と通信するリモートストレージ又はローカルストレージのいずれかとすることができる。
【0092】
本発明の開示の目的のために、コンピュータ可読ストレージ媒体は、機械可読形式でコンピュータによって実行可能なコンピュータプログラムコードをデータが含むことができるコンピュータデータを格納する。コンピュータストレージ媒体は、コンピュータ可読命令、データ構造、プログラムモジュール、又は他のデータのような情報の格納のためのいずれの方法又は技術に実施される揮発性及び不揮発性、取外し可能及び取外し不能媒体を含む。コンピュータストレージ媒体は、以下に限定されるものではないが、RAM、ROM、EPROM、EEPROM、フラッシュメモリ又は他の固体メモリ技術、CD−ROM、DVD、又は他の光学ストレージ、磁気カセット、磁気テープ、磁気ディスクストレージ又は他の磁気ストレージ、又は望ましい情報を格納するのに使用することができコンピュータによってアクセス可能ないずれかの他の媒体を含む。
【0093】
当業者は、本発明の開示の方法及びシステムを多くの方式で実施することができ、これらが上述の例示的な実施形態及び実施例によって制限されないことを認識するであろう。換言すると、ハードウエア及びソフトウエア又はファームウエアの様々な組合せにおいて単一の又は複数の構成要素によって実行される機能的な要素、及び個々の機能は、クライアント又はサーバのいずれかで又はこれらの両方においてソフトウエアアプリケーション間で分散させることができる。これに関して、本明細書に説明するいずれの数の様々な実施形態の特徴も単一の又は複数の実施形態に結合することができ、本明細書に説明する特徴の全てよりも少なく又は多い特徴を有する他の実施形態も可能である。機能は、全体的に又は部分的に現在公知の又は公知になる方式で複数の構成要素間で分散させることができる。従って、本明細書に説明する機能、特徴、インタフェース、及びプリファレンスを達成する場合に、無数のソフトウエア/ハードウエア/ファームウエアの組合せが可能である。更に、本発明の開示の範囲は、説明する特徴及び機能及びインタフェース、並びに当業者によって理解される及び以下の本明細書に説明するハードウエア又はソフトウエア又はファームウエア構成要素に対して行うことができる変形及び修正を実行するための従来から公知の方式を網羅する。
【0094】
本発明のシステム及び方法は、1つ又はそれよりも多くの実施形態に関して説明したが、本発明の開示を開示する実施形態に制限する必要はないことは理解されるものとする。特許請求の範囲の精神及び範囲に含まれる様々な修正及び類似の構成を網羅することを意図しており、その範囲は、全てのこのような修正及び類似の構造を包含するために様々な解釈に従わなくてはならない。本発明の開示は、以下の特許請求の範囲のいずれか及び全ての実施形態を含む。