特許第6058705号(P6058705)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ サーチ エンジン テクノロジーズ リミテッド ライアビリティ カンパニーの特許一覧

<>
  • 特許6058705-検索方法及び検索システム 図000002
  • 特許6058705-検索方法及び検索システム 図000003
  • 特許6058705-検索方法及び検索システム 図000004
  • 特許6058705-検索方法及び検索システム 図000005
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6058705
(24)【登録日】2016年12月16日
(45)【発行日】2017年1月11日
(54)【発明の名称】検索方法及び検索システム
(51)【国際特許分類】
   G06F 17/30 20060101AFI20161226BHJP
【FI】
   G06F17/30 380D
   G06F17/30 340A
【請求項の数】26
【全頁数】17
(21)【出願番号】特願2015-2067(P2015-2067)
(22)【出願日】2015年1月8日
(62)【分割の表示】特願2012-135003(P2012-135003)の分割
【原出願日】2006年2月28日
(65)【公開番号】特開2015-72721(P2015-72721A)
(43)【公開日】2015年4月16日
【審査請求日】2015年2月6日
(31)【優先権主張番号】60/657,371
(32)【優先日】2005年2月28日
(33)【優先権主張国】US
(31)【優先権主張番号】11/364,617
(32)【優先日】2006年2月27日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】508365115
【氏名又は名称】サーチ エンジン テクノロジーズ リミテッド ライアビリティ カンパニー
(74)【代理人】
【識別番号】100067736
【弁理士】
【氏名又は名称】小池 晃
(74)【代理人】
【識別番号】100096677
【弁理士】
【氏名又は名称】伊賀 誠司
(72)【発明者】
【氏名】タン、マイケル
(72)【発明者】
【氏名】ユンシャン、ルー
(72)【発明者】
【氏名】カーシュ、ブルース、ディー
【審査官】 早川 学
(56)【参考文献】
【文献】 特開2004−013323(JP,A)
【文献】 特開2001−350794(JP,A)
【文献】 特開2001−052003(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/30
(57)【特許請求の範囲】
【請求項1】
a.ユーザによって開始された第1の検索クエリのタームに関連したウェブページ検索結果及び補足的情報を表示するウェブサーバと、
データベースにクエリを発し、該クエリに応じたウェブページ検索結果及び補足的情報を提供する検索エンジンと、
関連性フィードバックを含む複数のユーザ入力に応じて、上記補足的情報を管理するコンテンツマネージャとを備え、
上記ウェブページ検索結果は、上記第1の検索クエリのタームに関連した複数のウェブページを含み、該複数のウェブページが表示される順番は、ユーザ又は1人以上の他のユーザによって入力される関連性フィードバックによって影響され、該関連性フィードバックは、該ウェブページ検索結果内のウェブページへのリンクの選択とは異なり、
上記補足的情報は、ドキュメント又は上記第1の検索クエリに関連したウェブページへの1つ以上のユーザ提供ハイパーリンクを含む検索システムが実行する検索方法において、
上記補足的情報は、上記第1の検索クエリに関連した異なる概念のリストを含み、
上記データベースは、上記第1の検索クエリに関連した第1の概念のユーザ入力説明を含む補足的情報を有し、該第1の概念のユーザ入力説明は、該第1の概念に関連した第2の概念の説明へのリンクと、該第1の概念に関連したドキュメントへのリンクとのうちの1つを含み、
上記コンテンツマネージャは、上記ユーザ入力を受信して、上記第2の概念の説明に対する上記リンクを追加、編集又は削除し、該第2の概念の説明は、上記補足的情報の一部であり、
上記コンテンツマネージャは、上記ユーザ入力を受信して、上記リンクを編集又は削除し、上記リンクを編集又は削除するユーザは、該リンクを追加したユーザとは異なり
上記コンテンツマネージャによって、ユーザ又は1人以上の他のユーザによって入力された関連性フィードバックとユーザ又は1人以上の他のユーザによって提供された補足的情報とを有し、該補足的情報が、ドキュメント又は上記第1の検索クエリに関連したウェブページへの1つ以上のユーザ提供ハイパーリンクを有するユーザ入力を含むウェブサーバの上記データベースを管理するステップと、
b.ウェブサーバによって、ユーザによって開始された上記第1の検索クエリに応じた、上記データベースからのウェブページ検索結果を表示するステップとを有し、
上記ウェブページ検索結果は、上記補足的情報の上記ユーザ提供ハイパーリンクと上記第1の検索クエリに関連したウェブページのリストを有するウェブページ結果リストとを含み、どのウェブページを最初に表示し、及びウェブページを表示する順番は、上記関連性フィードバックによって影響され、該関連性フィードバックは、上記ウェブページ結果リスト内のウェブページへのリンクの選択とは異なることを特徴とする検索方法。
【請求項2】
上記コンテンツマネージャによって上記データベースを管理するステップは、上記ユーザによって上記第1の検索クエリを開始する前に、上記ウェブページ結果リスト内の結果を格付けするときの関連性フィードバックが有する上記影響を計算するステップを含むことを特徴とする請求項1記載の検索方法。
【請求項3】
上記関連性フィードバックは、上記ウェブページ結果リスト内の1つ以上のエントリを、ブロッキングメカニズムの選択によって、ブロックしなければならない指示を含むことを特徴とする請求項1記載の検索方法。
【請求項4】
上記コンテンツマネージャによって上記データベースを管理するステップは、上記ウェブページ結果リスト内の結果の適合度に関連したユーザフィードバック情報を保存するステップ、上記ウェブページ結果リスト内のリンクをブロックするステップ及び上記第1の検索クエリに関連したドキュメントへのリンクを保存するステップに対応することを特徴とする請求項1記載の検索方法。
【請求項5】
上記データベースは、上記第1の検索クエリに関連した上記第1の概念のユーザ入力説明と、該第1の検索クエリに関連したドキュメントに対するハイパーリンクとのうちの少なくとも1つを含む上記補足的情報を有し、
上記コンテンツマネージャによって上記データベースを管理するステップは、上記第1の概念の説明又は上記ハイパーリンクを追加したユーザと異なるユーザによって、該第1の概念を追加するステップと、該第1の概念の説明を編集するステップと、該第1の概念の説明を削除するステップとのうちの1つを含むことを特徴とする請求項1記載の検索方法。
【請求項6】
上記補足的情報は、上記第1の検索クエリに関連した概念のリストを含むことを特徴とする請求項1記載の検索方法。
【請求項7】
上記第2の概念は、上記第1の概念のサブカテゴリと、該第1の概念の共起と、出現が該第1の概念の出現に統計的に関連した概念とのうちの1つであることを特徴とする請求項1記載の検索方法。
【請求項8】
上記第1の概念と上記第2の概念の関係は、所定の基準と、ユーザ入力カテゴリと、統計的関係とのうちの1つを選択することによって、決定されることを特徴とする請求項7記載の検索方法。
【請求項9】
上記データベースは、上記第1の検索クエリに関連した第2の検索クエリを自動的に実行するリンクを含む補足的情報を更に有することを特徴とする請求項1記載の検索方法。
【請求項10】
上記第2の検索クエリのタームは、ユーザによって入力されることを特徴とする請求項9記載の検索方法。
【請求項11】
上記第2の検索クエリのタームは、コンピュータによって決定されることを特徴とする請求項9記載の検索方法。
【請求項12】
上記コンピュータによって決定されるタームは、上記第1の検索クエリのタームを含むドキュメントにおける該タームの共起と、該第1の検索クエリのタームを含むドキュメント内の該タームの位置と、該第1の検索クエリのタームを含むドキュメントにおける該タームの出現頻度とのうちの1つから導出されることを特徴とする請求項11記載の検索方法。
【請求項13】
上記ウェブサーバによって、停止基準を用い、該ウェブサーバに関連性フィードバックを入力するユーザの資格を停止するステップを更に有する請求項1記載の検索方法。
【請求項14】
a.ユーザによって開始された第1の検索クエリのタームに関連したウェブページ検索結果及び補足的情報を表示するウェブサーバと、
b.データベースにクエリを発し、該クエリに応じたウェブページ検索結果及び補足的情報を提供する検索エンジンと、
c.関連性フィードバックを含む複数のユーザ入力に応じて、上記補足的情報を管理するコンテンツマネージャとを備え、
上記ウェブページ検索結果は、上記第1の検索クエリのタームに関連した複数のウェブページを含み、該複数のウェブページが表示される順番は、ユーザ又は1人以上の他のユーザによって入力される関連性フィードバックによって影響され、該関連性フィードバックは、該ウェブページ検索結果内のウェブページへのリンクの選択とは異なり、
上記補足的情報は、ドキュメント又は上記第1の検索クエリに関連したウェブページへの1つ以上のユーザ提供ハイパーリンクを含み、
上記補足的情報は、上記第1の検索クエリに関連した異なる概念のリストを含み、
上記データベースは、上記第1の検索クエリに関連した第1の概念のユーザ入力説明を含む補足的情報を有し、該第1の概念のユーザ入力説明は、該第1の概念に関連した第2の概念の説明へのリンクと、該第1の概念に関連したドキュメントへのリンクとのうちの1つを含み、
上記コンテンツマネージャは、上記ユーザ入力を受信して、上記第2の概念の説明に対する上記リンクを追加、編集又は削除し、該第2の概念の説明は、上記補足的情報の一部であり、
上記コンテンツマネージャは、上記ユーザ入力を受信して、上記リンクを編集又は削除し、上記リンクを編集又は削除するユーザは、該リンクを追加したユーザとは異なることを特徴とする検索システム。
【請求項15】
上記コンテンツマネージャに接続され、上記検索クエリに関連した上記補足的情報を保存する第1のデータ格納装置を更に備え、
上記ウェブページ検索結果は、上記補足的情報を含み、複数のユーザは、該補足的情報の同じ部分を変更することができることを特徴とする請求項14記載の検索システム。
【請求項16】
上記コンテンツマネージャは、上記補足的情報を更新するためのユーザ入力を受信することを特徴とする請求項14記載の検索システム。
【請求項17】
上記補足的情報を表示する表示領域を更に備えることを特徴とする請求項14記載の検索システム。
【請求項18】
上記補足的情報は、第1の概念のユーザ入力説明を含み、上記コンテンツマネージャは、上記ユーザ入力を受信して、該第1の概念の説明を追加、編集又は削除することを特徴とする請求項15記載の検索システム。
【請求項19】
上記第1の検索クエリに関連した第2の検索クエリを自動的に実行するリンクを表示する領域を更に備える請求項14記載の検索システム。
【請求項20】
上記検索エンジンは、上記ユーザ入力に基づいて、上記ウェブページ検索結果を組織化することを特徴とする請求項14記載の検索システム。
【請求項21】
上記検索エンジンは、上記ウェブページ検索結果を格付けすることにより、上記ユーザ入力に基づいて、該ウェブページ検索結果を組織化することを特徴とする請求項20記載の検索システム。
【請求項22】
上記ウェブサーバにアクセスするユーザ機器を更に備える請求項14記載の検索システム。
【請求項23】
上記ユーザ機器は、ハイパーテキスト転送プロトコルとワイヤレスアプリケーションプロトコルとのうちの1つ以上を用いて、上記ウェブサーバと通信することを特徴とする請求項22記載の検索システム。
【請求項24】
上記ユーザ機器は、パーソナルコンピュータ、携帯電話機及び携帯情報端末のうちの1つであることを特徴とする請求項22記載の検索システム。
【請求項25】
上記コンテンツマネージャは、上記ユーザ入力を受信して、上記第1の概念の説明を編集又は削除し、
上記第1の概念の説明を編集又は削除するユーザは、該第1の概念の説明を追加したユーザとは異なることを特徴とする請求項17記載の検索システム。
【請求項26】
ユーザによって編集された補足的情報が、他のユーザによって所定の回数元に戻された場合、上記コンテンツマネージャは、該ユーザによる補足的情報の更なる編集又は削除を、所定の期間ブロックすることを特徴とする請求項25記載の検索システム。
【発明の詳細な説明】
【関連出願】
【0001】
本出願は、米国特許法第119条(e)項に基づき、2005年2月28日に出願された係属中の米国仮特許出願番号第60/657,371号、発明の名称、「ユーザ入力情報を組み込む検索エンジン(Search Engine that Incorporates User-Entered Information)」の優先権を主張する。この文献は、引用によって本願に援用される。
【技術分野】
【0002】
本発明は、検索エンジンに関する。詳しくは、本発明は、ユーザ入力情報を組み込むことによって、インターネットを検索する検索方法及び検索システムに関する。
【背景技術】
【0003】
インターネット検索エンジンは、インターネットに含まれている膨大な情報から、所望の情報を見つけるように設計されている。ユーザは、自らが探している検索タームを含むクエリを入力することによって、情報を記述する。検索エンジンは、ユーザが探している情報に関連する可能性が高いウェブページを識別する目的で、様々な関連性に関する演算を用いて、ウェブページのインデックスに対して検索タームを照合する。そして、検索エンジンは、これらのウェブページへのハイパーリンクの格付けされたリストを返し、このリストでは、関連性が高いと判定されたリンクが上位に格付けされている。
【0004】
検索エンジンを使用するために、各ユーザは、自らが求めている情報を提供するソースへのリンクを含む結果リストを検索エンジンに返させるために、クエリをどのように組み立て、入力するかを自ら考えなくてはならない。伝統的に、精巧で正確な論理式クエリを作成することに熟練した検索の専門家が検索を行っていた。この技術は、報道機関、図書館及び合衆国特許庁等において今も活用されている。しかしながら、インターネットでは、殆どのユーザは、このような技術に通じておらず、通常、特別な論理式を用いず、幾つかの単語を入力するだけで、自らが探している情報を検索エンジンが提供することを望む。
【0005】
今日の殆どの検索エンジンは、ユーザインタラクション設計の目的で、関連性に関する他の根拠を分析することによって、正確なクエリなしで、関連の検索結果を提供する必要がある。例えば、検索エンジンは、ウェブページ間のハイパーリンクを解析し、又はクエリ内のタームと意味的に類似するタームを含むドキュメントを検索し、又はドキュメントのコーパスに亘って、クエリ内のタームのハイレベルの共起(high level of co-occurrence)を示してもよい。
【0006】
また、検索エンジンによって返される結果を操作することもできる。ウェブサイトのオーナは、彼らのウェブページが、ユーザのクエリへの関連性が高い情報を含んでいなくても、これらのウェブページが結果リストの上位に表示されるように、コンテンツ、メタデータ、又は他のウェブサイトから自らのウェブサイトへのハイパーリンクを追加することができる。この手法は、多くの場合、検索エンジン最適化(Search Engine Optimization:SEO)と呼ばれる。
【発明の概要】
【発明が解決しようとする課題】
【0007】
検索技術に制約があるので、また、検索エンジンが、検索を行うユーザの意図を把握できないので、ユーザは、多くの場合、検索エンジンが返す結果に対して満足できず、又は不満を抱くことがある。また、ユーザが、偶然、満足できる結果をもたらすクエリを作成した場合、同じ又は同様の検索を望む他のユーザと、そのクエリを共有できるメカニズムは存在しない。更に、ユーザが、検索エンジンに所望の結果を返させるクエリの作成を試みる際に、他の情報から入力を見直すメカニズムは存在しない。検索エンジンでは、ユーザは、相互に学習を行うことができず、また、他のユーザが実行し、成功した検索を利用することができない。
【0008】
検索エンジンの目的は、単に、ドキュメントへのリンクのリストを提供することだけではなく、最終的に、クエリに応じて、最も関連した情報へのアクセスをユーザに提供することである。従来の検索エンジンは、主に、コンピュータアルゴリズムによって、関連していると判定されたウェブページへのハイパーリンクの格付けされたリストを提供する。対象領域に関する質問の回答を探すユーザは、ハイパーリンクに従い、彼らが探している情報を見つけるウェブサイトの周りを探さなくてはならない。検索エンジンは、ウェブサイトへのリンク以外には、対象領域に関する情報又は質問に対する直接の回答は返さない。例えば、ユーザが「Calgary Alberta」のクエリを入力しても、結果ページには、「カルガリー市」のウェブページへのリンクを含む従来の結果リストに加えて、位置「北緯51度1分、西経114度1分」及び人口「92万2315人」といった情報が含まれない。
【0009】
更に、検索エンジンでは、同じクエリタームによって記述できる異なる概念間で曖昧さをなくすことは困難である。例えば、クエリ「star wars」は、映画「スターウォーズ(Star Wars、商標)」と、「戦略防衛構想(Strategic Defense Initiative)」の両方を指している可能性がある。例えば、ユーザがクエリを入力したときに、ユーザが検索している概念を判定するために、アルゴリズム、例えばクラスタリング又は意味解析を開発する試みもなされているが、この試みも成功しているとは言い難い。多くの場合、ユーザは、彼らのクエリに関係する概念の知識を有している。ユーザがこの関連情報を入力できれば、関連情報は、ユーザが意図する概念と他の関連した概念間の曖昧さを検索エンジンが除去するのを助ける。また、この関連情報は、他のユーザが概念を理解する助けとなり、また、概念に関する情報を検索する処理の助けとなる。
【課題を解決するための手段】
【0010】
本発明は、検索エンジンのユーザから入力を受信し、システムのユーザにより優れた検索結果を提供するシステム及び方法を提供する。本発明では、ユーザのコミュニティが検索に関連した検索結果及び他の情報が生成されるデータベースを管理する。特に、ユーザは、結果リスト内の要素の関連性に関する投票を行い、例えば、関連したウェブサイトへのリンク等の補足的情報を追加し、ユーザが入力した検索ターム及びコンピュータが生成した検索タームを用いて、他の検索を実行することができる。これにより、検索結果は、より関連性が高い情報をユーザに提供することができる。
【0011】
本発明の第1の側面である検索方法は、さらに、ユーザによって開始された第1の検索クエリのタームに関連したウェブページ検索結果及び補足的情報を表示するウェブサーバと、データベースにクエリを発し、クエリに応じたウェブページ検索結果及び補足的情報を提供する検索エンジンと、関連性フィードバックを含む複数のユーザ入力に応じて、補足的情報を管理するコンテンツマネージャとを備える。また、ウェブページ検索結果は、第1の検索クエリのタームに関連した複数のウェブページを含み、複数のウェブページが表示される順番は、ユーザ又は1人以上の他のユーザによって入力される関連性フィードバックによって影響され、関連性フィードバックは、ウェブページ検索結果内のウェブページへのリンクの選択とは異なる。また、補足的情報は、ドキュメント又は第1の検索クエリに関連したウェブページへの1つ以上のユーザ提供ハイパーリンクを含む。また、補足的情報は、第1の検索クエリに関連した異なる概念のリストを含む。また、データベースは、第1の検索クエリに関連した第1の概念のユーザ入力説明を含む補足的情報を有し、第1の概念のユーザ入力説明は、第1の概念に関連した第2の概念の説明へのリンクと、第1の概念に関連したドキュメントへのリンクとのうちの1つを含む。また、コンテンツマネージャは、ユーザ入力を受信して、第2の概念の説明に対するリンクを追加、編集又は削除し、第2の概念の説明は、補足的情報の一部である。また、コンテンツマネージャは、ユーザ入力を受信して、リンクを編集又は削除し、リンクを編集又は削除するユーザは、リンクを追加したユーザとは異なる。コンテンツマネージャによって、ユーザ又は1人以上の他のユーザによって入力された関連性フィードバックとユーザ又は1人以上の他のユーザによって提供された補足的情報とを有し、補足的情報が、ドキュメント又は第1の検索クエリに関連したウェブページへの1つ以上のユーザ提供ハイパーリンクを有するユーザ入力を含むウェブサーバのデータベースを管理するステップと、ウェブサーバによってユーザによって開始された第1の検索クエリに応じた、データベースからのウェブページ検索結果を表示するステップとを有する。ウェブページ検索結果は、補足的情報のユーザ提供ハイパーリンクと第1の検索クエリに関連したウェブページのリストを有するウェブページ結果リストとを含み、どのウェブページを最初に表示し、及びウェブページを表示する順番は、関連性フィードバックによって影響され、関連性フィードバックは、ウェブページ結果リスト内のウェブページへのリンクの選択とは異なる。
関連性フィードバックは、ウェブページ結果リスト内の1つ以上のエントリを、ブロッキングメカニズムの選択によって、ブロックしなければならない指示を含んでいてもよい。
【0012】
本発明により、ユーザが関連性が高いと考えるサイトにユーザ自身がタグ付けすることによって、検索結果を格付けすることができ、この格付けは、ユーザが検索のコンテキスト内にないサイトを閲覧しているときにも行ってもよく、又は第1の検索における検索クエリ以外のタームをタグ付けしてもよい。
【0013】
一実施の形態においては、補足的情報は、第1の検索クエリに関連した第1の概念の説明を含む。一実施の形態においては、データベースは、第1の検索クエリに関連した第1の概念のユーザ入力説明と、第1の検索クエリに関連したドキュメントに対するハイパーリンクとのうちの少なくとも1つを含む補足的情報を有し、コンテンツマネージャによってデータベースを管理するステップは、第1の概念の説明又はハイパーリンクを追加したユーザと異なるユーザによって、第1の概念を追加するステップと、第1の概念の説明を編集するステップと、第1の概念の説明を削除するステップとのうちの1つを含む。一実施の形態においては、データベースは、第1の検索クエリに関連した第1の概念のユーザ入力説明を含む補足的情報を有し、第1の概念のユーザ入力説明は、第1の概念に関連した第2の概念の説明へのリンクと、第1の概念に関連したドキュメントへのリンクとのうちの1つを含む。他の実施の形態においては、補足的情報は、第1の検索クエリに関連した第1の概念のリストを含む。第2の概念は、第1の概念のサブカテゴリと、第1の概念の共起と、出現が第1の概念の出現に統計的に関連した概念とのうちの1つであってもよい。第1の概念と第2の概念の関係は、所定の基準と、ユーザ入力カテゴリと、統計的関係とのうちの1つを選択することによって決定してもよい。
【0014】
他の実施の形態においては、データベースは、第1の検索クエリに関連した第2の検索クエリを自動的に実行するリンクを含む補足的情報を更に有する。第2の検索クエリのタームは、ユーザによって入力してもよく、コンピュータによって決定されてもよい。コンピュータによって決定されるタームは、第1の検索クエリのタームを含むドキュメントにおけるタームの共起と、第1の検索クエリのタームを含むドキュメント内のタームの位置と、第1の検索クエリのタームを含むドキュメントにおけるタームの出現頻度とのうちの1つから導出してもよい。一実施の形態においては、検索方法は、ウェブサーバに関連性フィードバックを入力するユーザの資格を停止するステップを更に有する。
【0015】
本発明の第2の側面である検索システムは、ユーザによって開始された第1の検索クエリのタームに関連したウェブページ検索結果及び補足的情報を表示するウェブサーバと、データベースにクエリを発し、クエリに応じたウェブページ検索結果及び補足的情報を提供する検索エンジンと、関連性フィードバックを含む複数のユーザ入力に応じて、補足的情報を管理するコンテンツマネージャとを備える。ウェブページ検索結果は、第1の検索クエリのタームに関連した複数のウェブページを含み、複数のウェブページが表示される順番は、ユーザ又は1人以上の他のユーザによって入力される関連性フィードバックによって影響され、関連性フィードバックは、ウェブページ検索結果内のウェブページへのリンクの選択とは異なる。補足的情報は、ドキュメント又は第1の検索クエリに関連したウェブページへの1つ以上のユーザ提供ハイパーリンクを含む。また、補足的情報は、第1の検索クエリに関連した異なる概念のリストを含む。また、データベースは、第1の検索クエリに関連した第1の概念のユーザ入力説明を含む補足的情報を有し、第1の概念のユーザ入力説明は、第1の概念に関連した第2の概念の説明へのリンクと、第1の概念に関連したドキュメントへのリンクとのうちの1つを含む。また、コンテンツマネージャは、ユーザ入力を受信して、第2の概念の説明に対するリンクを追加、編集又は削除し、第2の概念の説明は、補足的情報の一部である。また、コンテンツマネージャは、ユーザ入力を受信して、リンクを編集又は削除し、リンクを編集又は削除するユーザは、リンクを追加したユーザとは異なる。検索システムは、好ましくは、コンテンツマネージャに接続され、検索クエリに関連した補足的情報を保存する第1のデータ格納装置を更に備える。
【0016】
一実施の形態においては、コンテンツマネージャは、補足的情報を更新するための複数のユーザ入力を受信する。検索システムは、好ましくは、補足的情報を表示する表示領域を更に備える。この補足的情報は、第1の検索クエリに関連した第1の概念の説明を含む。また、補足的情報は、第1の検索クエリに関連した異なる概念のリストを含んでいてもよい。一実施の形態においては、コンテンツマネージャは、ユーザ入力を受信して、第2の概念の説明に対するリンクを追加、編集又は削除し、第2の概念の説明は、補足的情報の一部である。他の実施の形態においては、補足的情報は、第1の概念のユーザ入力説明を含み、コンテンツマネージャは、ユーザ入力を受信して、第1の概念の説明を追加、編集又は削除する。
【0017】
他の実施の形態においては、検索システムは、第1の検索クエリに関連した第2の検索クエリを自動的に実行するリンクを表示する領域を更に備える。検索エンジンは、好ましくは、複数のユーザ入力に基づいて、ウェブサーバ検索結果を組織化する。検索エンジンは、ウェブページ検索結果を格付けすることにより、複数のユーザ入力に基づいて、ウェブページ検索結果を組織化する。検索システムは、ウェブサーバにアクセスするユーザ機器を更に備えていてもよい。ユーザ機器は、ハイパーテキスト転送プロトコル及びワイヤレスアプリケーションプロトコルのうちの1つ以上を用いてウェブサーバと通信する。
【図面の簡単な説明】
【0018】
図1】ユーザ入力情報を含む検索結果のリストを表示する、本発明に基づく、グラフィカルユーザインタフェースを示す図である。
図2】本発明に基づくインターネット検索アプリケーションの動作のフローチャートである。
図3】本発明に基づくインターネット検索アプリケーションを実行するシステムの構成を示す図である。
図4】本発明に基づくインターネット検索アプリケーションシステムの構成を示す図である。
【発明を実施するための形態】
【0019】
本発明の実施の形態は、従来の検索エンジンと異なり、特に、ユーザによって入力された補足的情報を用いて、インターネット検索を行うユーザに対して、より関連性が高い情報を提供する。例えば、本発明では、検索を実行する第1のユーザは、クエリによって参照された概念に関する情報の検索を実行することに関して、ユーザ入力情報(user-entered information)を追加することができる。第1のユーザは、(1)クエリに関連した概念の説明、(2)その概念に関連した検索を実行するためのアドバイス、(3)関連した概念に関するクエリタームへの「ここも参照(see also)」ハイパーリンク、(4)関連した又は提案されたクエリタームと、(5)ユーザの検索に対する結果の関連性に関するフィードバック、又は(6)他の何らかの情報を入力することができる。
【0020】
更に、この情報の一部又は全部は、コンピュータアルゴリズム、ウェブクローラ又は他の技術によって生成することができる。そして、同様の又は関連した検索を実行する第2のユーザは、検索エンジンが提供する結果リストに加えて、この補足的情報を見ることができ、これによって、第2のユーザにより可能性があり、より関連した検索結果が得られる。また、この第2のユーザも、ユーザ入力情報を追加することができる。両方のユーザは、検索の対象に関連した情報を共有することができる。したがって、ユーザのコミュニティは、検索結果を速やかに評価し、検索結果をより正確に使用及び提供するためにユーザを補助する情報を共有することができる。
【0021】
データベースは、検索結果リストを補うために用いられる情報のコーパスと、検索インデックスリスト自体と、検索のユーザが有用であることを見出したデータ、例えばデータの保存、格付け、ブロック、書込、編集又は削除によって検索のユーザが入力したデータの記録の任意の組合せとを含む。データベースは、1つ以上のデータ格納装置及びシステム内に分散される。また、後述するように、データベースは、ユーザ入力に応じて管理される。
【0022】
本発明の他の実施の形態では、検索結果は、以下に限定されるものではないが、(1)結果リストのリンクの関連性に関してフィードバックを提供するメカニズムと、(2)個人的な検索ページ上に表示できるリンクを削減し、又は関連したリンクに投票するメカニズムと、(3)検索結果に関係ない又は本質的に不快なウェブページへのリンクを「ブロックする」メカニズムとを表示する選択された項目を含む。他の実施の形態では、関連した検索ターム及びスポンサリンクへの表示及びリンクを含む。
【0023】
以下の説明では、「検索エンジン」という用語は、クエリが入力され、電子文書又はウェブページへのハイパーリンクの結果リストを返す装置(又は汎用コンピュータで実行されるプログラム)を指す。検索エンジンは、そのコーパス内のドキュメントのインデックスと、各ドキュメントの関連性を決定するコード及びアルゴリズムと、結果リストをユーザに提供するグラフィカルユーザインタフェースとを含む。
【0024】
以下の説明において、「クエリ」という用語は、タイピングされ、発話され、既に検索タームのセットを埋め込んだ「リンク」を介して提供され、又は他の何らかのインタフェースによって、検索エンジンに提供されるタームのセットを指す。クエリは、単一の単語、複数の単語又は語句を含むことができる。クエリは、質問(例えば「自然言語」によるクエリ)、タームの曖昧なセット、又は体系化された論理式として表すことができる。実際には、クエリは、検索文字を含み又は検索文字に関連した電子文書又はウェブページを検索するために、検索エンジンで用いられるシンボル又は他の如何なる文字を含んでいてもよい。
【0025】
以下の説明では、「ウェブサイト」という用語は、互いにリンクされ、ワールドワイドウェブで閲覧可能なウェブページの集合を指す。「ウェブページ」という用語は、任意の数のホストからワールドワイドウェブを介してアクセス可能な公開された情報を指し、これらの情報は、以下に限定されるわけではないが、テキスト、ビデオ、画像、音楽及びグラフィクスを含む。
【0026】
以下の説明において、「結果リスト」という用語は、ハイパーテキスト転送プロトコル(Hypertext Transfer Protocol:HTTP)、又は以下に限定されるわけではないが、ドキュメントのタイトルと、ドキュメントの要約と、ドキュメントのキャッシュコピーへのリンクと、ドキュメントが最後にインデックスを付され又は最後に更新された日時と、ドキュメントに関連し又はドキュメントに含まれる画像と、ドキュメントから抽出された情報とを含む各リンクの他の関連した情報と共に、ウェブページ又は他の電子文書にアクセスするための他のプロトコルを用いてアクセス可能なドキュメント又はウェブページを参照するハイパーリンクのリストを指す。
【0027】
本明細書で用いるように、「ドキュメント」という用語は、広義に定義され、通常の意味に加えて、実際に保存されているか、表示の要求に応じて動的に生成されるかにかかわらず、コンピュータファイルと、ウェブページとを含む。「ドキュメント」という用語は、テキストを含むコンピュータファイルに限定されず、グラフィクス、オーディオ、ビデオ及び他のマルチメディアデータを含むコンピュータファイルも含んでいる。
【0028】
後に詳細に説明するように、検索エンジンは、ユーザによって入力されたクエリを受信し、ユーザが探している情報に関連する可能性が高いウェブページを識別する目的で、様々な関連性に関する演算を用いて、ウェブページのインデックスに対して検索タームを照合する。そして、検索エンジンは、これらのウェブページへのハイパーリンクの格付けされたリストを返し、このリストでは、関連性が高いと考えられるリンクがリストの最上部に近いところにある。本発明に基づく検索エンジンは、ユーザ入力に基づいて結果リストを返し、ユーザは、例えば、ドキュメント又は結果リストに示されたリンクの順序に影響を与える情報をシステムに入力する資格(ability)を有する。
【0029】
本発明に基づいて、結果リストを含むページがユーザに供給されたとき、ユーザは、補足的情報をページに追加することを選択することができ、この補足的情報は、同じ又は同様のクエリを入力することによって次に検索エンジンにアクセスする他のユーザにも見える。
【0030】
図1は、本発明に基づいて、クエリに応じて返された結果ページ100を表示する例示的なグラフィカルユーザインタフェース(graphical user interface:GUI)を示している。このGUIによって、ユーザは、クエリタームに関連した1つ以上の概念に関する説明を追加、編集及び見ることができ、概念に関する情報をどのように検索したらよいかを示すアドバイスを追加、編集及び見ることができる。
【0031】
結果ページ100は、クエリタームを挿入するボックス110と、クエリタームに関連した概念の説明を表示する領域120と、クエリタームに関連した異なる概念の説明を含む領域130と、他のクエリタームに関連した概念への「ここも参照(see also)」リンクを含む領域(以下、「ここも参照」リンクとも言う。)140と、関連したクエリタームを実行するリンクのリストを含む領域150と、スポンサリンクの領域180とを備える。また、結果ページ100は、検索エンジンによって返された結果リストを含む領域(以下、結果リストとも言う。)160を備える。また、領域160は、ユーザフィードバックを入力するユーザフィードバックメカニズム170と、検索エンジンによって返された各結果に関連したリンクを保存するメカニズム190を備える。後に詳細に説明するように、好ましい実施の形態では、領域120、130、140、150は、同じ又は類似するクエリを実行する他のユーザに提示する情報を表示するために、ユーザによって編集、追加又は変更することができる。
【0032】
図1の具体例に示すように、ユーザがボックス110内にクエリターム「U2」を入力し、検索を要求したとき、結果ページ100がユーザに返される。領域120は、ユーザによって入力されたクエリターム「U2」に関連した1つの概念の説明、この具体例では、バンド「U2(商標)」の説明を表示する。領域130は、ユーザによって入力されたクエリターム「U2」の異なる概念の説明、この具体例では、U2偵察機(U2 spy plane)の説明を表示する。領域150は、ユーザによって入力され又はアルゴリズムによって導出されるような、ユーザが検索エンジンに実行させる興味がある関連した検索のためのクエリターム、例えば「U2コンサートチケット」又は「U2iPod(商標)」を表示する。領域140は、ユーザによって入力され又はアルゴリズムによって導出されるような他のクエリターム、例えば「バンドU2」の概念のための「ボノ(Bono)」又は「偵察機U2」の概念のための「ドラゴンレディ(Dragon Lady)」に関連した概念への「ここも参照」ハイパーリンクを含んでいる。
【0033】
領域160は、ユーザフィードバックメカニズム170だけではなく、検索の結果を含んでいる。ユーザは、ユーザフィードバックメカニズム170を用いて、対応するウェブページが、探している情報にどれ程一致しているかを格付けすることができる。換言すれば、領域160にリストされた第1のウェブページが、ユーザが検索したロックバンドU2に関する関連情報を含んでいる場合、ユーザは、ユーザフィードバックメカニズム170を用いて、このリンクを高いスコア(例えば5つ星)で格付けすることができる。一方、領域160にリストされている「U2」と呼ばれる洋服のライン(clothing line)の名前を専門とする第2のウェブページは、ユーザが探している概念とは無関係であり、低いスコア(例えば1つ星)で格付けすることができる。本発明に基づいて、またバンド「U2」に興味を有する後のユーザが、クエリターム「U2」で検索を行ったとき、このユーザに返される結果リストは、第1のウェブページ(5つ星で格付けされている。)を結果リストの最上部の近くに、第2のウェブページ(1つ星で格付けされている。)を結果リストの最下部の近くに含み、又は全く表示しない。このように、ユーザには、最初に一覧表示された関連性が高い結果だけを有する結果リストが提供される。結果リスト内のサイトを順次訪問するユーザは、自らが検索している概念に関連性が高いサイトを見る可能性が高くなる。したがって、結果リストにおける項目の順序は、ユーザが入力しないメタデータ及び他の情報に加えて、ユーザフィードバックに基づいている。
【0034】
ユーザは、クエリタームに関連した概念に関する説明を領域120に追加し、この説明は、クエリによって調べられる概念に関する幾つかの背景情報、あるいはその概念に関してどのように情報を検索するかに関するアドバイスを提供することができる。また、ユーザは、自らが又は他のユーザが以前に追加又は変更したクエリタームに関連した概念に関する説明を変更、強調又は削除することができる。
【0035】
ユーザは、他の概念が既に入力されていても、検索タームに関連した更なる概念の説明を追加することができる。例えば、クエリターム「スターウォーズ」に対して、例えば脚本(plot)、俳優及びプロデューサような情報を含む映画「スターウォーズ」の概念の説明を追加することができる。その後、ユーザは、領域130のリンクをクリックし、これにより、ユーザは、同じクエリターム「スターウォーズ」に関連した説明、例えば「戦略防衛構想(Strategic Defense Initiative)、すなわちSDI」の異なる概念を記述した説明を追加することができる。
【0036】
他の実施の形態では、本発明に基づいて追加、変更又は削除された概念は、ドキュメント内に同時に出現する(co-occur)又は統計的に関連して出現する互いのサブカテゴリ(例えばサブトピック)である。例えば、概念「オペレーティングシステム」と概念「リナックス(商標)」は、トピックと関連したサブトピックである。また、他の実施の形態では、2つの概念は、所定の基準、ユーザ入力カテゴリ及び統計計算(例えば、2つの概念がドキュメントにどれくらいの頻度で共に出現するか)から、関連していると判定される。
【0037】
また、ユーザは、ハイパーリンク、すなわち異なるクエリタームに関連した概念にリンクする「ここも参照」リンク140を追加することができる。一具体例として、ユーザは、映画「スターウォーズ」の概念の「ここも参照」の部分に、クエリターム「ジョージルーカス」に対する脚本家/プロデューサ「ジョージルーカス(George Lucas)」の概念へのハイパーリンクを追加することができる。ユーザは、「ここも参照(see also)」リンク140の参照を変更、追加又は削除することができる。
【0038】
ユーザは、クリックされたときに検索エンジンに提出される、概念に対する提案クエリ(suggested queries)を追加することができ、検索エンジンは、結果リスト160を含む結果ページ100を、関連した補足的情報の領域120、140、150によって返す。
【0039】
また、検索エンジンは、コンピュータアルゴリズムを用いて、提案クエリタームを生成することができる。例えば、このようなコンピュータアルゴリズムは、ドキュメントを検索し、互いから所定の距離内で又は所定の密度で(すなわち、少なくとも所定の回数出現する)同じドキュメント内に頻繁に出現する(共起)タームを判定する。このように、コンピュータアルゴリズムは、タームが関連していると判定し、検索エンジンは、クエリタームを提案として提示する。あるいは、コンピュータアルゴリズムは、クエリタームのリスト、例えば同義語又は単語の変化を維持し、また、これもユーザに提案される。
【0040】
ユーザは、概念に非常に関連すると思われるドキュメントへのリンクを追加又は保存することもできる。これは、リンクを手動で入力することによって、あるいはハイパーリンク、すなわちメカニズム190の「セーブ(Save)」のマークが付されたアイコンをクリックすることによって行われ、あるいは他のターム、例えば「ブックマーク(Bookmark)」、「タグ(Tag)」又は「お気に入りに追加(Add to Favorites)」を指すことによって行うことができる。ユーザが異なれば、どのサイトが最も関連するかに関する考えも異なるので、本発明に基づくアルゴリズムは、一覧表示するサイトの順序を決定する。一実施の形態においては、アルゴリズムは、「多数決」処理を用いて、最も多くの「票」が投票された(例えば最も多くのユーザによって「保存」された)ドキュメントを結果リストの上位に表示する。
【0041】
また、「保存」されたドキュメントへのリンクが、検索エンジンによって生成された結果リストに現れる場合、アイコン165を用いて、このリンクも、また、ユーザによって投票されたリンクであることを示すことができる。また、各検索結果の下には、結果リストの一部としてリンクを追加したユーザ名を示す「By」エントリ167と、ユーザがリンクにタグを付け、又は以前の検索で生成されたタームを示す「タグ」エントリ168とが表示される。
【0042】
本発明に基づくウェブサイトへのリンクは、2つの方法で、(1)結果リスト(アルゴリズムによって生成される。)及びユーザ入力リンクと、(2)上述したようにアイコンが付けられたユーザ入力リンクを有する1つのリストに統合されたリストとの2つの独立したリストのいずれかとして、一覧表示することができる。
【0043】
2人以上のユーザは、ここに記載されたあらゆる情報を変更することができる。一具体例として、第1のユーザが書き込み、第2のユーザが第1のユーザの書込を変更する。第1のユーザは、第2のユーザの書込を「元に戻し(revert)」又は再編集することができる。2人以上のユーザが、どのような情報を入力すべきかに関して、意見が合わない場合、これらのユーザは、競合を解決し、何を入力すべきかを同意するために、幾つかの他の手段(例えばディスカッションフォーラム、電子メール、インスタントメッセンジャ)によって通信することができる。
【0044】
2人以上のユーザが、何を入力すべきかについて同意することができなかった場合、ユーザは、彼らの相違点を、不同意を解決できる「編集者(editor)」に任せることができる。「編集者」は、幾つかの対象領域に責任があり、論争を解決し、情報を追加又は削除し、最終的には、協力を拒否するユーザを排除する権限を有する。
【0045】
ユーザが、他のユーザが繰り返し戻した情報を入力した場合、そのユーザは、人々が掲示したい情報を入力していないと見なすことができる。例えば、ユーザは、対象領域の情報を読みにくくし(defacing)又は荒している(vandalizing)可能性がある。ある期間内に所定の回数入力が元に戻されたユーザに、所定の期間入力を停止(suspended)させることを要求する規則を強制することができる。この規則は、荒しの行為を減少させることを意図したものである。
【0046】
ユーザは、ここに提案した特定の種類の情報だけではなく、あらゆる種類の情報も入力することができる。一具体例として、全ての俳優について、インターネット映画データベース(www.imdb.com)におけるその俳優のページへのリンクを入力する。また、都市について、現在の気温及び天候を示すWeather.comのページへのリンクを入力する。また、楽曲について、その楽曲、歌詞、同じアーチストによる他の楽曲を販売するサイトへのリンクを入力し、あるいはその楽曲の一部又は全部を再生するサイトへのリンクさえも入力する。
【0047】
なお、本発明に基づいて、多くの変更ができることは言うまでもない。例えば、ユーザが生成したフィードバックは、端末装置からユーザが直接入力するのではなく、ファイルから読み込むことができる。更に、結果ページ100は、領域、例えば「ここも参照」リンク140を表示しているが、本発明に基づき、ユーザ入力情報を含む結果ページは、図1に示す領域を含む又はこれらの領域以外の領域の如何なる組合せと共に、表示できることは言うまでもない。この情報は、検索結果をより包括的に、正確に及び有意義にするために用いられる。
【0048】
図2は、本発明の一実施の形態に基づくインターネット検索アプリケーション200の動作を示すフローチャートである。インターネット検索アプリケーション200によって、ユーザは、システムに情報を入力する資格を有し、それによって、他のユーザは、ユーザ入力に基づくより有意義な検索結果を受信することができる。この情報は、特定のクエリに応じて生成された結果リストにおけるドキュメントを格付し(例えば、最初に検索エンジンが返した結果を再格付し)、あるいは同じ又は類似する検索を実行するユーザにとって有意義な情報を追加するために用いられる。したがって、結果リストは、より有意義な結果を返すために、また、クエリの対象に関連した追加的情報を返すために、ユーザフィードバックに応じて「調整」することができる。
【0049】
ステップ205において、ユーザは、クエリを検索エンジンに提出する。そして、処理は、ステップ210、220に進み、これらの2つのステップは、同時に実行することができる。ステップ210において、検索結果リストが算出され、ステップ220において、補足的情報(例えば図1における領域120、130、140、150)が検索される。両方のステップ210、220から、処理は、ステップ230に進み、ここで、結果ページ(例えば図1に示す結果ページ100)がユーザに送信される。そして、処理は、ステップ230から、ステップ240、250、260、270のうちの1つに進む。
【0050】
ステップ240において、ユーザは、補足的情報(例えば図1における領域120、130、140、150)を追加又は編集することが許可される。あるいは、ユーザは、ステップ250において、提案された検索リンク(例えば図1の領域130)をクリックすることができ、又はステップ260において、「ここも参照」リンク(例えば図1の領域140)をクリックすることができ、又はステップ270において、ウェブサイト(例えば図1の領域150内のリンクうちの1つ)を訪問することができる。処理は、ステップ240からは、ステップ230に戻り、ステップ250、260及びオプションであるステップ270からは、戻り経路280を介して、ステップ205に戻る。これに代えて、ステップ270からは、ステップ290に進み、ユーザがクエリを終了することもできる。
【0051】
図3は、本発明に基づくシステム300の構成を示している。システム300は、ウェブサーバ310に接続されたユーザクライアント305を備える。ウェブサーバ310は、コンテンツマネージャ320と、検索エンジン340との両方に接続されている。コンテンツマネージャ320は、補足的コンテンツを保存するデータレポジトリ330に接続されている。検索エンジン340は、ドキュメントインデックスを含むデータレポジトリ(以下、ドキュメントインデックスとも言う。)350に接続されており、次に、データレポジトリ350は、インデックス生成器360に接続されている。インデックス生成器360は、ウェブコンテンツデータベース370に接続されており、ウェブコンテンツデータベース370は、ウェブクローラ380に接続されている。ウェブクローラ380は、インターネット390上の1つ以上のウェブサイト399に接続されている。
【0052】
動作において、ウェブクローラ380は、インターネット390上をナビゲートし、ウェブサイト399を訪問して、ウェブコンテンツデータベース370に入れる。インデックス生成器360は、ウェブコンテンツデータベース370を用いて、ドキュメントインデックス350を生成する。ユーザがユーザクライアント305上でクエリを生成したとき、ウェブサーバ310は、検索要求を検索エンジン340に送信する。検索エンジン340は、どのウェブページがクエリに最も関連している可能性が高いかを判定し、上述したユーザ生成フィードバックを用いて、結果リストを生成する。検索エンジン340は、上述したように、ユーザ生成ランキングを用いて、結果リストを順序付けて、表示のために、結果リストをユーザに返す。
【0053】
また、コンテンツマネージャ320は、概念説明、他の概念説明、「ここも参照」リンク及び関連したクエリタームを含むデータレポジトリ330から、クエリに応じて、クエリに関連した補足的情報を検索する。これらの情報は、それぞれ、例えば、図1に示す領域120、130、140、150に表示される。また、コンテンツマネージャ320は、ユーザに、補足的情報を追加、編集又は削除することを許可する。ウェブサーバ310は、検索エンジン340からの結果リストを、コンテンツマネージャ320からの情報と組み合わせて、これらの組合せをユーザに返す。コンテンツマネージャ320は、ユーザが補足的情報を変更したかを判定し、該当する場合、この変更をデータレポジトリ330に保存する。新たな又は更新された情報は、同じ又は類似した検索を行う後のユーザに対して、直ちに利用可能になる。
【0054】
図4は、ユーザ405が使用する、本発明に基づくインターネット検索アプリケーションシステム400のハードウェア構成を示している。インターネット検索アプリケーションシステム400は、インターネット420を介してウェブサーバ430に接続されるクライアント機器410を備えている。クライアント機器410は、インターネットプロトコル、例えば、以下に限定されるわけではないが、ハイパーテキスト転送プロトコル(Hypertext Transfer Protocol:HTTP)及びワイヤレスアプリケーションプロトコル(Wireless Application Protocol:WAP)を用いて、ウェブサーバ430にアクセスし、通信するように構成されたあらゆる機器である。クライアント機器410は、好ましくは、パーソナルコンピュータである。あるいは、クライアント機器410は、以下に限定されるわけではないが、携帯型機器、例えば、携帯電話機又は規格、例えばハイパーテキストマークアップランゲージ(Hypertext Markup Language:HTML)、ハンドヘルドデバイスマークアップランゲージ(Handheld Device Markup Language:HDML)、ワイヤレスマークアップランゲージ(Wireless Markup Language:WML)を用いて情報を提供できる携帯情報端末(Personal Digital Assistant:PDA)を含む他の機器である。
【0055】
ウェブサーバ430は、コンテンツサーバ440と検索サーバ460との両方に接続されている。コンテンツサーバ440は、データ格納装置450に接続されており、検索サーバ460は、データ格納装置470に接続されている。
【0056】
添付の特許請求の範囲によって定義されている本発明の精神及び範囲から逸脱することなく、実施の形態を変更できることは、当業者にとって明らかである。
図2
図3
図4
図1