(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-01-20
(45)【発行日】2022-01-28
(54)【発明の名称】視覚化可能な結果リストを提供するシステム及び方法
(51)【国際特許分類】
G06F 16/338 20190101AFI20220121BHJP
【FI】
G06F16/338
(21)【出願番号】P 2018553106
(86)(22)【出願日】2017-03-28
(86)【国際出願番号】 US2017024527
(87)【国際公開番号】W WO2017176505
(87)【国際公開日】2017-10-12
【審査請求日】2020-03-19
(32)【優先日】2016-04-07
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2016-09-15
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】507061029
【氏名又は名称】レクシスネクシス ア ディヴィジョン オブ リード エルザヴィア インコーポレイテッド
(74)【代理人】
【識別番号】100094569
【氏名又は名称】田中 伸一郎
(74)【代理人】
【識別番号】100088694
【氏名又は名称】弟子丸 健
(74)【代理人】
【識別番号】100103610
【氏名又は名称】▲吉▼田 和彦
(74)【代理人】
【識別番号】100067013
【氏名又は名称】大塚 文昭
(74)【代理人】
【識別番号】100086771
【氏名又は名称】西島 孝喜
(74)【代理人】
【識別番号】100109070
【氏名又は名称】須田 洋之
(74)【代理人】
【識別番号】100109335
【氏名又は名称】上杉 浩
(74)【代理人】
【識別番号】100120525
【氏名又は名称】近藤 直樹
(74)【代理人】
【識別番号】100139712
【氏名又は名称】那須 威夫
(74)【代理人】
【識別番号】100122563
【氏名又は名称】越柴 絵里
(72)【発明者】
【氏名】ミラー リチャード ディー
(72)【発明者】
【氏名】マイヤーズ ジェイコブ アーロン
(72)【発明者】
【氏名】フラスコーン トッド ジェイ
(72)【発明者】
【氏名】メーラ ガウラヴ
(72)【発明者】
【氏名】ヘインズ ロナルド シー
(72)【発明者】
【氏名】ウィットマー フィリップ
(72)【発明者】
【氏名】リ ヤングァン
【審査官】鹿野 博嗣
(56)【参考文献】
【文献】米国特許出願公開第2012/0204104(US,A1)
【文献】特開2004-199696(JP,A)
【文献】特表2014-532239(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/338
(57)【特許請求の範囲】
【請求項1】
視覚化可能な結果リストを表示する方法であって、
処理装置が、複数の検索語を含む検索クエリを受け取るステップと、
前記処理装置が、前記複数の検索語を、それぞれが前記複数の検索語のうちの関連する1又は2以上の検索語を含む複数のユニットにグループ化するステップと、
前記処理装置が、前記複数のユニットの数が閾値よりも多いかを判定するステップと、
前記複数のユニットの数が閾値よりも多いとき、
各ユニットの特性に基づき各ユニットに1以上のポイントを割りあてることによって、前記複数のユニットのそれぞれにユニット低減スコアでスコアリングするステップが実行され、前記各ユニットの特性は、前記検索クエリを入力したユーザに使用された検索語、意味的に類似する1以上の文書に関連する検索語、特定の法律的トピックスに関係する検索語、特定の文書コーパスに関係する検索語、及び1以上の他のユーザによって行われる検索に関係する検索語を含み、
ランク付けされた複数のユニットを得るため、前記複数のユニットの各ユニットに関する前記ユニット低減スコアに基づき前記複数のユニットをランキングするステップが実行され、
最も高いユニット低減スコアを有する前記ランク付けされた複数のユニットの数であって、前記閾値に対応する当該数を選択するステップが実行され、
前記処理装置が、前記検索クエリに対応する複数の検索結果内の各文書のメタデータにアクセスするステップと、
前記処理装置が、前記メタデータに基づいて、前記
ランク付けされた複数のユニットの第1のユニット内の前記1又は2以上の検索語の各々のための第1の指示子と、前記
ランク付けされた複数のユニットの第2のユニット内の前記1又は2以上の検索語の各々のための第2の指示子とを各文書内の1又は2以上の位置に注釈付けするステップと、
前記処理装置が、前記第1の指示子及び前記第2の指示子を伴う前記複数の検索結果を含む視覚化可能な結果リストを表示するステップと、
前記視覚化可能な結果リスト内の各文書に関するヒットパターンを表示するステップであって、前記ヒットパターンは、
前記文書内の部分に対応する1又は2以上の部分と、
各第1の指示子に対応する第1の1又は2以上のハッシュと、
各第2の指示子に対応する第2の1又は2以上のハッシュと、を含む当該ステップとを含み、
前記第1の1又は2以上のハッシュ及び前記第2の1又は2以上のハッシュは、各文書内の前記検索語の前記位置に対応する前記ヒットパターン内の位置に位置付けられ、
前記第1の1又は2以上のハッシュは、前記第2の1又は2以上のハッシュとは視覚的に区別される、ことを特徴とする方法。
【請求項2】
視覚化可能な結果リストを表示する方法であって、
処理装置が、複数の検索語を含む検索クエリを受け取るステップと、
前記処理装置が、前記複数の検索語を、それぞれが前記複数の検索語のうちの関連する1又は2以上の検索語を含む複数のユニットにグループ化するステップと、
前記処理装置が、前記検索クエリに対応する複数の検索結果内の各文書のメタデータにアクセスするステップと、
前記処理装置が、前記メタデータに基づいて、前記複数のユニットの第1のユニット内の1又は2以上の
最高ランクの検索語の各々のための第1の指示子と、前記複数のユニットの第2のユニット内の前記1又は2以上の検索語の各々のための第2の指示子とを各文書内の1又は2以上の
最高ランクの位置に注釈付けするステップ
であって、前記第1のユニット内の前記最高ランクの検索語は、他の用語と比べて前記検索クエリに最も関連するとして前記処理装置により判定された用語であり、
前記処理装置が、視覚化可能な結果リストを表示するステップと、
を含み、前記視覚化可能な結果リストは、
前記複数の検索結果と、
前記複数の検索結果内の各文書についての対応するヒットパターンと、
を含み、前記ヒットパターンは、
前記文書の1又は2以上の部分と、
各第1の指示子に対応する第1の1又は2以上のハッシュと、
各第2の指示子に対応する第2の1又は2以上のハッシュと、
を含み、前記第1の1又は2以上のハッシュ及び前記第2の1又は2以上のハッシュは、前記文書内の前記検索語の前記1又は2以上の位置に対応する前記ヒットパターン内の1又は2以上の位置に位置付けられ、
前記第2の1又は2以上のハッシュは、前記第1の1又は2以上のハッシュとは視覚的に区別され、
前記第1の1又は2以上のハッシュ及び前記第2の1又は2以上のハッシュのうちの少なくとも1つのハッシュを取り囲むように前記ヒットパターンに対して移動可能であるボックスと、
前記ヒットパターンの下方に位置付けられたオーバレイ領域であって、前記オーバレイ領域は、前記ボックスの位置に対応する前記文書からテキストを表示し、且つ表示されたテキスト内の前記検索語をハイライト化し、その結果、前記ヒットパターン上の前記ボックスで示された特定の位置に対応する前記文書の部分が、前記オーバレイ領域内でハイライト化された前記検索語により視認できる、ことを特徴とする方法。
【請求項3】
前記テキストは、前記第1の1又は2以上のハッシュ及び前記第2の1又は2以上のハッシュのうちの、前記ボックスによって取り囲まれた前記少なくとも1つのハッシュに対応する注釈を含む、請求項
2に記載の方法。
【請求項4】
前記ボックスは、前記第1の1又は2以上のハッシュ及び前記第2の1又は2以上のハッシュのうちの少なくとも1つのハッシュの第2の領域を取り囲むように前記ヒットパターンに対して移動可能であり、前記オーバレイ領域は、前記ボックスによって取り囲まれた前記第2の領域に対応する前記文書からの最新のテキストを表示する、
請求項
2に記載の方法。
【請求項5】
前記ヒットパターンは、前記第1の1又は2以上のハッシュ及び前記第2の1又は2以上のハッシュの第1の1又は2以上のクラスタに対応する1又は2以上のヒットクラスタ指示子をさらに含み、
前記ヒットクラスタ指示子が表示される前記第1の1又は2以上のクラスタは、前記第1の1又は2以上のハッシュ及び前記第2の1又は2以上のハッシュの第2の1又は2以上のクラスタ
よりも前記複数の検索語
との関連
性が高いことを示している、
請求項
2~
4の何れか1項に記載の方法。
【請求項6】
視覚化可能な結果リストを表示する方法であって、
処理装置が、複数の検索語を含む検索クエリを受け取るステップと、
前記処理装置が、前記複数の検索語を、それぞれが前記複数の検索語のうちの関連する1又は2以上の検索語を含む複数のユニットにグループ化するステップと、
前記処理装置が、前記複数のユニットの数が閾値よりも多いかを判定するステップと、
前記複数のユニットの数が閾値よりも多いとき、
各ユニットの特性に基づき各ユニットに1以上のポイントを割りあてることによって、前記複数のユニットのそれぞれにユニット低減スコアでスコアリングするステップが実行され、前記各ユニットの特性は、前記検索クエリを入力したユーザに使用された検索語、意味的に類似する1以上の文書に関連する検索語、特定の法律的トピックスに関係する検索語、特定の文書コーパスに関係する検索語、及び1以上の他のユーザによって行われる検索に関係する検索語を含み、
ランク付けされた複数のユニットを得るため、前記複数のユニットの各ユニットに関する前記ユニット低減スコアに基づき前記複数のユニットをランキングするステップが実行され、
最も高いユニット低減スコアを有する前記ランク付けされた複数のユニットの数であって、前記閾値に対応する当該数を選択するステップが実行され、
前記処理装置が、前記検索クエリに対応する複数の検索結果内の各文書のメタデータにアクセスするステップと、
前記処理装置が、前記メタデータに基づいて、前記ランク付けされた複数のユニットの第1のユニット内の前記1又は2以上の検索語の各々のための第1の指示子と、前記ランク付けされた複数のユニットの第2のユニット内の前記1又は2以上の検索語の各々のための第2の指示子とを各文書内の1又は2以上の位置に注釈付けするステップと、
前記処理装置が、前記第1の指示子及び前記第2の指示子を伴う前記複数の検索結果を含む視覚化可能な結果リストを表示するステップと、
を含む、方法。
【請求項7】
視覚化可能な結果リストを表示する方法であって、
処理装置が、複数の検索語を含む検索クエリを受け取るステップと、
前記処理装置が、前記複数の検索語を、それぞれが前記複数の検索語のうちの関連する1又は2以上の検索語を含む複数のユニットにグループ化するステップと、
前記処理装置が、前記検索クエリに対応する複数の検索結果内の各文書のメタデータにアクセスするステップと、
前記処理装置が、前記メタデータに基づいて、前記複数のユニットの第1のユニット内の1又は2以上の最高ランクの検索語の各々のための第1の指示子と、前記複数のユニットの第2のユニット内の前記1又は2以上の検索語の各々のための第2の指示子とを各文書内の1又は2以上の最高ランクの位置に注釈付けするステップであって、前記第1のユニット内の前記最高ランクの検索語は、他の用語と比べて前記検索クエリに最も関連するとして前記処理装置により判定された用語であり、
前記処理装置が、視覚化可能な結果リストを表示するステップと、
を含み、前記視覚化可能な結果リストは、
前記複数の検索結果と、
前記複数の検索結果内の各文書についての対応するヒットパターンと、
を含み、各検索結果の前記ヒットパターンは、
複数のバーを含む棒グラフであって、各バーが前記複数の検索語のうちの各検索語に関するヒット数に対応し、各バーのサイズが各検索語に関するヒット数に基づいており、
前記検索結果が前記視覚化可能な結果リスト内で表示される順序は、複数の並べ替えボタンのうちの一つを選択し、特定の用語に関する大きなバーを有する検索結果を前記視覚化可能な結果リストのトップ又はボトムに移動させることでユーザによる調整が可能である、ことを特徴とする方法。
【請求項8】
視覚化可能な結果リストを表示するシステムであって、
処理装置と、
前記処理装置と通信する非一時的プロセッサ可読記憶媒体と、
を備え、前記非一時的プロセッサ可読記憶媒体は、前記処理装置に、請求項1~
7の何れか1項に記載の方法のステップを実行させる1又は2以上のプログラム命令を含む、システム。
【発明の詳細な説明】
【技術分野】
【0001】
〔関連出願への相互参照〕
本出願は、2016年4月7日に出願された「視覚化可能な結果リストを提供するシステム及び方法(Systems and Methods for Providing a Visualizable Results Lists)」という名称の米国仮特許出願第15/092,999号に対する優先権を主張する、2016年9月15日に出願された「視覚化可能な結果リストを提供するシステム及び方法」という名称の米国特許出願第15/266,573号に対する優先権を主張するものであり、これらの文献はその全体が引用により本明細書に組み入れられる。
【0002】
本明細書は、一般に検索結果を提供することに関し、具体的には、結果がユーザの所望のニーズに厳密に一致することをユーザが判断するのに役立つ視覚要素(visuals)を含む検索結果を提供するシステム及び方法に関する。
【背景技術】
【0003】
現在では、調査員が特定のデータベースの検索を行うと、日付、ヒット数、確認された関連性及び/又は結果タイプなどの一定の基準に従ってランク付けできる検索結果が提示される。しかしながら、この決定された結果のランキングは、調査員が望むランク付け方法に対応していないことがある。また、これらの結果は、調査員が望むランク付け方法に従ってランキングを並べ替える可視的手段を調査員に提供しないこともある。さらに、これらの結果は、ヒットしたものに関連性があるかどうかをユーザが判断できるような、結果リスト内の各ヒットからの十分な関連情報をユーザに提供しない。
【発明の概要】
【発明が解決しようとする課題】
【0004】
従って、柔軟性(malleability)の高い検索結果と、特定の調査員が望むランク付け方法に対応する結果を並べ替えてランク付けし直す視覚化可能な手段とを提供するとともに、ヒットしたものが自身の検索に関連するかどうかをユーザが判断できるような、結果リスト内の各ヒットからの十分な関連情報をユーザに提供するシステム及び方法が必要とされている。
【課題を解決するための手段】
【0005】
1つの実施形態では、電子的検索要求に応答して視覚化可能な結果リストを表示する方法が、処理装置が、検索クエリに起因する複数の検索結果の各々のメタデータにアクセスするステップと、処理装置が、メタデータに基づいて、検索クエリ内の1又は2以上のグループ化された検索語の各々のための第1の指示子と、検索クエリの第2のユニット内の1又は2以上のグループ化された検索語の各々のための第2の指示子とを各検索結果内の1又は2以上の位置に注釈付けするステップと、処理装置が、複数の検索結果と、各検索結果についての対応するヒットパターンとを含む視覚化可能な結果リストを表示するステップとを含む。ヒットパターンは、第1の指示子及び第2の指示子を含む。
【0006】
別の実施形態では、検索要求に応答して視覚化可能な結果リストを表示する方法が、処理装置が、複数の検索語を含む検索クエリを受け取るステップと、処理装置が、複数の検索語を、それぞれが複数の検索語のうちの関連する1又は2以上の検索語を含む複数のユニットにグループ化するステップと、処理装置が、検索クエリに対応する複数の検索結果内の各文書のメタデータにアクセスするステップと、処理装置が、メタデータに基づいて、複数のユニットの第1のユニット内の1又は2以上の検索語の各々のための第1の指示子と、複数のユニットの第2のユニット内の1又は2以上の検索語の各々のための第2の指示子とを各文書内の1又は2以上の位置に注釈付けするステップと、処理装置が、視覚化可能な結果リストを表示するステップとを含む。視覚化可能な結果リストは、複数の検索結果と、複数の検索結果内の各文書についての対応するヒットパターンとを含む。ヒットパターンは、文書の1又は2以上の部分と、各第1の指示子に対応する第1の1又は2以上のハッシュと、各第2の指示子に対応する第2の1又は2以上のハッシュとを含む。第1の1又は2以上のハッシュ及び第2の1又は2以上のハッシュは、文書内の検索語の1又は2以上の位置に対応するヒットパターン内の1又は2以上の位置に位置付けられる。
【0007】
別の実施形態では、視覚化可能な結果リストを表示するシステムが、処理装置と、処理装置と通信する非一時的プロセッサ可読記憶媒体とを含む。非一時的プロセッサ可読記憶媒体は、実行時に、処理装置に、複数の検索語を含む検索クエリを受け取ることと、複数の検索語を複数のユニットにグループ化することとを行わせる1又は2以上のプログラム命令を含む。複数のユニットの各々は、複数の検索語のうちの関連する1又は2以上の検索語を含む。非一時的プロセッサ可読記憶媒体は、実行時に、処理装置に、検索クエリに対応する複数の検索結果内の各文書のメタデータにアクセスすることと、メタデータに基づいて、複数のユニットの第1のユニット内の1又は2以上の検索語の各々のための第1の指示子と、複数のユニットの第2のユニット内の1又は2以上の検索語の各々のための第2の指示子とを各文書内の1又は2以上の位置に注釈付けすることと、視覚化可能な結果リストを表示することとを行わせる1又は2以上のプログラム命令をさらに含む。視覚化可能な結果リストは、複数の検索結果と、複数の検索結果内の各文書についての対応するヒットパターンとを含む。ヒットパターンは、文書の1又は2以上の部分と、各第1の指示子に対応する第1の1又は2以上のハッシュと、各第2の指示子に対応する第2の1又は2以上のハッシュとを含む。第1の1又は2以上のハッシュ及び第2の1又は2以上のハッシュは、文書内の検索語の1又は2以上の位置に対応するヒットパターン内の1又は2以上の位置に位置付けられる。
【0008】
以下の詳細な説明を図面と共に考慮すれば、本明細書で説明する実施形態によって提供されるこれらの及びさらなる特徴が十分に理解されるであろう。
【0009】
図面に示す実施形態は、説明的かつ例示的なものであり、特許請求の範囲に定める主題を限定するものではない。以下の例示的な実施形態についての詳細な説明は、同じ構造を同じ参照数字によって示す以下の図面と共に読むことによって理解することができる。
【図面の簡単な説明】
【0010】
【
図1】本明細書において図示し説明する1又は2以上の実施形態による、視覚化可能な結果リストを提供するシステムのための例示的なコンピュータネットワークの概略図である。
【
図2】本明細書において図示し説明する1又は2以上の実施形態による、視覚化可能な結果リストの提供において使用できるハードウェア及びソフトウェアをさらに示す
図1のサーバコンピュータ装置の概略図である。
【
図3】本明細書において図示し説明する1又は2以上の実施形態による、視覚化可能な結果表示を生成してレンダリングする例示的な概要のブロック図である。
【
図4】本明細書において図示し説明する1又は2以上の実施形態による、検索のための例示的なユーザインターフェイスのスクリーンショットである。
【
図5】本明細書において図示し説明する1又は2以上の実施形態による、用語をユニットにグループ化する例示的な方法のフロー図である。
【
図6】本明細書において図示し説明する1又は2以上の実施形態による、上位スコアのユニットを選択する例示的な方法のフロー図である。
【
図7】本明細書において図示し説明する1又は2以上の実施形態による、ユニットスコアの例示的なテーブルを示す図である。
【
図8】本明細書において図示し説明する1又は2以上の実施形態による、ユニットを注釈付けした結果を表示する例示的な方法のフロー図である。
【
図9】本明細書において図示し説明する1又は2以上の実施形態による、ユニットを注釈付けした検索結果を表示する例示的なユーザインターフェイスのスクリーンショットである。
【
図10】本明細書において図示し説明する1又は2以上の実施形態による、例示的な検索結果の詳細なスクリーンショットである。
【
図11】本明細書において図示し説明する1又は2以上の実施形態による、例示的な完全文書ビューのスクリーンショットである。
【
図12】本明細書において図示し説明する1又は2以上の実施形態による、ユニットを注釈付けした検索結果を表示する別の例示的なユーザインターフェイスのスクリーンショットである。
【
図13】本明細書において図示し説明する1又は2以上の実施形態による、検索結果を並べ替えた
図12の別のユーザインターフェイスのスクリーンショットである。
【
図14】本明細書において図示し説明する1又は2以上の実施形態による、ポップアップ表示を含む
図12の別のユーザインターフェイスのスクリーンショットである。
【
図15】本明細書において図示し説明する1又は2以上の実施形態による、
図12の別のユーザインターフェイスの例示的な検索結果の詳細なスクリーンショットである。
【
図16】本明細書において図示し説明する1又は2以上の実施形態による、複数の拡張バーを含む
図12の別のユーザインターフェイスのスクリーンショットである。
【
図17】本明細書において図示し説明する1又は2以上の実施形態による、プロトタイプ変数コントローラポップアップボックスを含む
図12の別のユーザインターフェイスのスクリーンショットである。
【発明を実施するための形態】
【0011】
図を大まかに参照すると、本明細書で説明する実施形態は、ユーザの検索クエリに基づく視覚化可能な検索結果リストをユーザに提供するシステム及び方法に関する。特に、本明細書で説明するシステム及び方法は、クエリから戻される一群の文書を、集約リストレベル及び/又は文書レベルでの「ヒットパターン」を示す視覚表現と共に提供する。本明細書で説明するシステム及び方法は、ユーザが1又は2以上の文書属性に基づいて結果リストを別様にランク付けできるようにする1又は2以上の相互作用的特徴をさらに提供する。また、本明細書で説明するシステム及び方法は、ユーザが入手しようとする情報と文書とが密接に関連しているかどうかについてのユーザの判断が容易になるように、ユーザが取得した各文書からの関連情報を検索結果として提供する。
【0012】
本明細書でさらに詳細に説明するように、本明細書で説明するシステム及び方法を使用する調査員は、検索フレーズ(ブール型又は非ブール型)を入力して、検索フレーズからの1又は2以上のトークンを使用した結果とすることができる、検索フレーズに対応する結果リストを受け取ることができる。本明細書で説明するシステム及び方法は、結果リスト内の結果毎に、文書へのリンクと、文書内の検索語の位置、文書内の特定の検索語グループの位置及び/又は文書段落などに関する追加情報を提供するヒットパターンとを提供することができる。また、本明細書で説明するシステム及び方法は、1又は2以上の入力に応答して、ヒットパターンに関連する文書の抜粋を調査員に提供することができる。このような抜粋は、ユーザが各文書に個別にアクセスする必要なく提供することができる。従って、調査員は、文書の残り部分に目を通すのに過度の時間を費やす必要なく、その文書が自身の検索に密接に関連するものであるかどうかを素早く判断することができる。
【0013】
本開示から明らかになるように、本明細書で説明するシステム及び方法は、とりわけ検索結果に関して情報に基づく判断を行う必要がある調査員に関連情報を正確に提供するとともに、結果内で発見された特定の文書が関連性を有するかどうかを判断するように構成された柔軟性の高いユーザインターフェイスを提供することによって、検索を行う際の調査員の生産性を高めるように構成することができる。すなわち、特定の予め設定した条件に基づいて結果リストの再グループ化及び/又はフィルタリングを可能にしていたにすぎないこれまでの結果表示手段とは異なり、必要な情報を入手する必要性に応じて表示を変更する能力をユーザに提供する、ユーザに直感的に理解できる形で結果が表示される。また、本明細書で説明するシステム及び方法は、さらなる計算能力を必要とせずに、コンピュータ装置が特定のユーザに検索結果を提供する方法をカスタマイズすることによって、コンピュータ装置の機能を高める。従って、さらなる計算能力を必要とせずに、コンピュータ装置が複数のユーザの各々に合わせて全て同時に個別にカスタマイズされるようになる。
【0014】
本明細書で説明するシステム及び方法は、判例法、制定法及び/又は法律論文の調査を含む法律検索に関する具体例を参照することができるが、このような例は例示にすぎず、本開示はこのような事例に限定されるものではないと理解されたい。むしろ、本明細書で説明するシステム及び方法は、本明細書に実装分野を具体的に記載しているかどうかに関わらず、あらゆる調査分野で実装することができる。例えば、このシステム及び方法は、学術調査、科学調査、及び/又は一般的なインターネット調査などの範囲内で実装することができる。
【0015】
本明細書で使用する「調査員」という用語は、一般に本明細書で説明するシステム及び方法を用いて調査を行うあらゆるユーザを意味する。従って、本明細書では、「調査員」及び「ユーザ」という用語を同義的に使用することができる。調査員の例としては、以下に限定するわけではないが、法律調査員、学術調査員、科学調査員及び/又は一般調査員などを挙げることができる。
【0016】
本明細書で使用する「文書」は、一般に検索結果内の一群のテキストを意味する。文書は、電子文書又は物理的文書に対応することができるが、(ウェブブラウザ画面などの)ユーザインターフェイス内にテキストとしてユーザに表示することができる。従って、一般に本明細書において文書という用語を使用している時には、このような文書は一群の検索結果内の単一の検索結果のことである。例示的な文書は、例えば特定の報告者によって報告がなされた法廷意見のテキストを含むことができる。
【0017】
ここで図面を参照すると、
図1に、本明細書において図示し説明する実施形態による、検索インターフェイス及び視覚化可能な結果リストを提供するシステムの構成要素を示す例示的なコンピュータネットワークを示している。
図1に示すように、コンピュータネットワーク10は、インターネット、ローカルエリアネットワーク(LAN)、移動通信ネットワーク、公衆サービス電話網(PSTN)、パーソナルエリアネットワーク(PAN)、都市エリアネットワーク(MAN)、仮想私設ネットワーク(VPN)、及び/又は別のネットワークなどのワイドエリアネットワーク(WAN)を含むことができる。一般に、コンピュータネットワーク10は、1又は2以上のコンピュータ装置及び/又はその構成要素を電子的に接続するように構成することができる。例示的なコンピュータ装置は、以下に限定するわけではないが、ユーザコンピュータ装置12a、サーバコンピュータ装置12b、及び管理者コンピュータ装置12cを含むことができる。
【0018】
一般に、ユーザコンピュータ装置12aは、ユーザ(例えば、調査員)とコンピュータネットワーク10に接続された他の構成要素との間のインターフェイスとして使用することができる。従って、本明細書でさらに詳細に説明するように、ユーザコンピュータ装置12aは、ユーザから1又は2以上の入力を受け取ることや、又はユーザに情報を提供することなどの、1又は2以上のユーザ対応機能を実行するために使用することができる。従って、本明細書でさらに詳細に説明するように、ユーザコンピュータ装置12aは、少なくともディスプレイ及び/又は入力ハードウェアを含むことができる。また、
図1には管理者コンピュータ装置12cも含まれる。管理者コンピュータ装置12cは、サーバコンピュータ装置12bが監視、更新又は修正を要求した場合に所望の監視、更新及び/又は修正を行うように構成することができる。管理者コンピュータ装置12cは、サーバコンピュータ装置12bに記憶されているコーパスに追加データを入力するために使用することもできる。
【0019】
サーバコンピュータ装置12bは、1又は2以上のソースからデータを受け取り、データを記憶し、データにインデックス付けし、データを検索し、及び/又は検索結果、ヒットパターンなどの視覚表現、文書、及び/又は1又は2以上の文書からの抜粋などの形でユーザコンピュータ装置12aにデータを提供することができる。
【0020】
なお、ユーザコンピュータ装置12a及び管理者コンピュータ装置12cをパーソナルコンピュータとして示し、サーバコンピュータ装置12bをサーバとして示しているが、これらは非限定的な例であると理解されたい。具体的に言えば、いくつかの実施形態では、これらのいずれかの構成要素には、あらゆるタイプのコンピュータ装置(例えば、モバイルコンピュータ装置、パーソナルコンピュータ、サーバなど)を使用することができる。また、
図1にはこれらの各コンピュータ装置を単体のハードウェアとして示しているが、これも一例にすぎない。具体的に言えば、ユーザコンピュータ装置12a、サーバコンピュータ装置12b及び管理者コンピュータ装置12cの各々は、複数のコンピュータ、サーバ、データベース及び/又は構成要素などを表すこともできる。
【0021】
図2に、1又は2以上のソースからデータを受け取り、データを記憶し、データにインデックス付けし、データを検索し、及び/又はデータを提供するシステムをさらに示した
図1のサーバコンピュータ装置12bを示す。また、サーバコンピュータ装置12bは、本明細書に図示し説明する実施形態による、ハードウェア、ソフトウェア及び/又はファームウェアとして具体化される、データを検索して提供する非一時的コンピュータ可読媒体を含むこともできる。サーバコンピュータ装置12bは、いくつかの実施形態では、必須ハードウェア、ソフトウェア及び/又はファームウェアを含む汎用コンピュータとして構成することができ、いくつかの実施形態では、本明細書で説明する機能を実行するように特異的に設計された専用コンピュータとして構成することもできる。
【0022】
やはり
図2に示すように、サーバコンピュータ装置12bは、プロセッサ30と、入力/出力ハードウェア32と、ネットワークインターフェイスハードウェア34と、(分析データ38a、文書コーパスデータ38b及びその他のデータ38cを記憶することができる)データストレージ要素36と、非一時的メモリ要素40とを含むことができる。メモリ要素40は、揮発性及び/又は不揮発性コンピュータ可読媒体として構成することができ、従って(SRAM、DRAM及び/又はその他のタイプのランダムアクセスメモリを含む)ランダムアクセスメモリ、フラッシュメモリ、レジスタ、コンパクトディスク(CD)、デジタル多用途ディスク(DVD)及び/又はその他のタイプのストレージ要素を含むことができる。また、メモリ要素40は、オペレーティングロジック42、検索ロジック44、リスト表示ロジック46、及び/又は詳細表示ロジック48(これらの各々は、一例としてコンピュータプログラム、ファームウェア又はハードウェアとして具体化することができる)などの様々な処理ロジックを記憶するように構成することもできる。
図2には、サーバコンピュータ装置12bの構成要素間の通信を容易にするバス又はその他のインターフェイスとして実装できるローカルインターフェイス50も含まれる。
【0023】
プロセッサ30は、(データストレージ要素36及び/又はメモリ要素40などから)命令を受け取って実行するように構成されたいずれかの処理要素を含むことができる。入力/出力ハードウェア32は、モニタ、キーボード、マウス、プリンタ、カメラ、マイク、スピーカ、タッチ画面、及び/又はデータの受信、送信及び/又は提示を行うその他の装置を含むことができる。ネットワークインターフェイスハードウェア34は、モデム、LANポート、ワイヤレスフィディリティー(Wi-Fi)カード、WiMaxカード、モバイル通信ハードウェア、及び/又は他のネットワーク及び/又は装置と通信するその他のハードウェアなどの、いずれかの有線又は無線ネットワーキングハードウェアを含むことができる。
【0024】
なお、データストレージ要素36は、サーバコンピュータ装置12bの局所及び/又は遠隔に存在することができ、1又は2以上のデータを記憶し、1又は2以上のデータへのアクセスを選択的に提供するように構成することができると理解されたい。
図2に示すように、データストレージ要素36は、本明細書でさらに詳細に説明するような分析データ38a、文書コーパスデータ38b及び/又はその他のデータ38cを記憶することができる。
【0025】
メモリ要素40には、オペレーティングロジック42、検索ロジック44、リスト表示ロジック46、及び/又は詳細表示ロジック48が含まれる。オペレーティングロジック42は、サーバコンピュータ装置12bのオペレーティングシステム、及び/又はサーバコンピュータ装置12bの構成要素を管理する他のソフトウェアを含むことができる。検索ロジック44は、グラフィカルユーザインターフェイス内のユーザ入力から検索クエリを生成するように構成することができる。リスト表示ロジック46は、以下で詳細に説明するように、検索ロジック44から明らかになった検索ヒット又は文書のリストと、ユーザ操作のための視覚表現とを生成して表示することができる。詳細表示ロジック48は、以下で詳細に説明するように、リスト表示ロジック46によって生成され表示される、文書、ヒットパターン及び/又は文書内のヒットリストを含むリストの特定の要素に関するさらなる詳細を生成して表示するように構成することができる。
【0026】
なお、
図2に示す構成要素は例示的なものにすぎず、本開示の範囲を限定するものではないと理解されたい。具体的に言えば、
図2の構成要素は、サーバコンピュータ装置12b内に存在するように示しているが、これは非限定的な例である。いくつかの実施形態では、これらの構成要素のうちの1つ又は2つ以上が、サーバコンピュータ装置12bの外部に存在することもできる。同様に、
図2は、サーバコンピュータ装置12bに関するものであるが、ユーザコンピュータ装置12a及び管理者コンピュータ装置12cなどの他の構成要素も同様のハードウェア、ソフトウェア及び/又はファームウェアを含むことができる。
【0027】
図3は、視覚化可能な結果リストを提供する例示的な方法のブロック図である。ステップ300において、クエリが受け取られる。一般に、クエリは、ユーザが入力した1又は2以上の検索語(例えば、単語)である。具体的に言えば、ユーザは、特定の主題及び/又は特定の一連の状況などに関連する1又は2以上の検索結果(例えば、文書など)を発見したいと望むことができる。従って、ユーザは、自身が望む検索結果を検索して取得するであろうと思われる1又は2以上の検索語の組としてクエリを入力する。このクエリは、例えば自然言語クエリ又はブールクエリなどの現在知られている又はこれから開発されるいずれかのクエリフォーマットとすることができる。自然言語クエリは、英語、スペイン語、フランス語又はドイツ語などの自然言語で記述されるデータ要求である。従って、ユーザは、単語又はフレーズのいずれかの組み合わせを入力することによって自然言語クエリを入力することができる。いくつかの実施形態では、ユーザが、自然言語クエリを質問の形で入力することができ、すなわちユーザは、入力した質問に答える検索結果を取得したいと望むことができる。ブールクエリは、用語間の関係を指示する特定の構文によって1又は2以上の用語を区切った形で記述されるデータ要求である。例示的な構文としては、「AND」及び「OR」という単語を挙げることができる。
【0028】
システム(又はコンピュータ装置などのシステムの構成要素)は、クエリを受け取るためにユーザインターフェイス内に検索フィールドを提供することができ、ユーザは、ユーザインターフェイス装置を介してこの検索フィールドにクエリを入力することができる。例えば、
図4に示すように、ユーザコンピュータ装置は、ユーザに対してディスプレイ装置上などに表示されるユーザインターフェイス400内に、ユーザ修正可能なテキストボックス405として検索フィールドを提供することができる。ユーザは、本明細書で説明する入力/出力ハードウェア32(
図2)などの1又は2以上のユーザ入力装置を介してテキストボックス405にテキストを入力することができる。テキストボックス405に入力されるクエリの非限定的な例は、「sport(スポーツ)」、「antitrust(独占禁止)」及び「exemption(適用除外)」という用語とすることができる。このようなクエリは、例えばユーザがスポーツに関連する独占禁止法適用除外に関する検索結果を取得したいと望んでいることを示すことができる。
【0029】
いくつかの実施形態では、コンピュータ装置が、ユーザの検索クエリをさらに適合させるために、ユーザ修正可能なテキストボックス405に加えて、ユーザインターフェイス400を介してさらなるユーザ選択可能なメニュー項目410を提供することもできる。ユーザは、このようなユーザ選択可能なメニュー項目410によって、例えば全ての利用可能なリソース、特定のデータベース及び/又は文書カテゴリ内のみ、及び/又は特定の文書部分内などの、クエリ語を検索すべき特定の位置を指定することができる。
図4に具体的に示すように、ユーザ選択可能なメニュー項目410は、ユーザが選択できる様々なオプションを列挙するドロップダウンボックスとして提示することができる。ユーザは、テキストボックス405にテキストを入力してユーザ選択可能なメニュー項目410を選択すると、検索クエリの提出をトリガすることができる。このようなトリガは、例えばユーザがキーボード上の「改行」ボタンを押して、ユーザインターフェイス400を介して提示された検索ボタン415を選択した時などとすることができる。
【0030】
なお、
図4に示すユーザインターフェイス400は、1つの考えられるクエリ受け取り手段の説明例にすぎないと理解されたい。従って、本開示の範囲から逸脱することなく他のクエリ受け取り手段も検討され実施可能である。例えば、音声入力などを介してクエリを入力することもできる。
【0031】
再び
図3を参照すると、ステップ305に示すように、システムは、クエリに基づいて検索を実行することができる。検索の実行は、検索クエリを受け取った後のあらゆる時点で行うことができ、本明細書で
図3に関して説明する他の1又は2以上のプロセスと同時に行うこともできる。検索の実行は、現在知られている又はこれから開発されるいずれかの検索方法を通じて行うこともでき、本開示に限定されるものではない。
【0032】
ステップ310において、システムは、受け取ったクエリがブールクエリであるかどうかを判断することができる。このような判断は、クエリを分析して、一般にブール構文として認識されている特定の構文がクエリに含まれているかどうかを判断することによって行うことができる。本明細書で上述したように、このような構文は、限定するわけではないが、「AND」及び「OR」などの単語を含む。いくつかの実施形態では、特定の構文が特定のフォーマット(例えば、全て大文字、特定の連結詞、ブール構文など)である場合にのみクエリをブールとして認識することができる。
【0033】
この判断によってクエリがブールであることが示された場合、クエリの構造に基づいてクエリの様々な単語をグループ化することができる。具体的に言えば、「OR」という用語によって分離された単語又はフレーズは、検索結果を表示する目的で単一要素としてグループ化できる別の検索語として認識することができる。すなわち、ユーザが「basketball OR football(バスケットボールORフットボール)」というブールフレーズを入力した場合、システムは、(ブールクエリで典型的なように)いずれかの単語を含む文書を検索することができるが、以下で詳細に説明するように、結果を表示する目的で、「basketball(バスケットボール)」という単語と「football(フットボール)」という単語とを、これらがあたかも視覚化可能な検索結果の提供を目的とする同じ用語、特定の意味に関連する同じユニット、及び/又は同義語であるかのように共にグループ化することができる。
【0034】
クエリがブールではないと判断された場合、システムは、ステップ315をスキップして直接ステップ320に進むことができる。また、ブールクエリについてステップ315が行われても、システムはステップ320に進むことができる。ステップ320において、結果を表示する目的で、特定の用語が同義又は代用可能であるという認識に基づいて検索語(例えば単語及びフレーズ)をグループ化する。すなわち、ステップ315に関して説明した内容と同様に、グループ化は、結果を表示するという目的のみで行われ、検索に影響を与えることはない。従って、検索は典型的な形で行われる(すなわち、検索は、現在知られている又はこれから開発されるいずれかの検索手段によって行われる)。
【0035】
ステップ320では、1又は2以上のデータベースにアクセスしてグループを決定することによってクエリの用語をグループ化することができる。このようなデータベースは、限定するわけではないが、ワイルドカードシソーラスデータベース325、同義語データベース330、及びフレーズデータベース335を含む。本明細書で説明するように、ワイルドカードシソーラスデータベース325は、検索結果をグループ化する目的で同義であると認識される特定のワイルドカード用語を含むデータベースである。例えば、クエリが「sport(スポーツ)」という用語を含む場合、ワイルドカードシソーラスデータベース325は、以下に限定するわけではないが、「sports」、「sporting」、「sportsmanship」、「sporty」、「sportscast」、「sportswear」、「multisport」、「transport」、「passport」などを含む、「sport*」、「sport!」、「!sport」又は「*sport」などの用語とのワイルドカード関係を有する用語を含むことができる。同義語データベース330は、正確な同義語ではないかもしれないがその用語と同様の意味を伝える単語を含む、単語の認定同義語(recognized synonyms of words)を含むデータベースである。例えば、同義語データベース330は、「sport(スポーツ)」という用語について、「athletics(運動競技)」、「game(試合)」、「recreation(レクレーション)」又は「pastime(娯楽)」などの正確な同義語に加え、「football(フットボール)」、「basketball(バスケットボール)」、「tennis(テニス)」、「hockey(ホッケー)」、「baseball(野球)」などの同様の意味を伝える他の単語を含むこともできる。フレーズデータベース335は、たとえ(例えば、引用符などの)一般的なフレーズ指示子によって結ばれていない時であっても認識されるフレーズを含むデータベースである。例えば、フレーズデータベース内のいくつかのフレーズは、クエリ内に「basketball(バスケットボール)」という単語及び「game(試合)」という単語が連続して出現した時に、たとえこれらの単語がフレーズ指示子を用いて入力されたものでなくても、これらの単語を「Basketball game(バスケットボールの試合)」というフレーズとして扱うという認識を可能にする。いくつかの実施形態では、フレーズデータベース335が、クエリが検索されている特定の分野に特化することができる。例えば、検索が法律データベース(例えば、判例法、制定法及び/又は法律論文などを検索する検索エンジン)に関連する場合、フレーズデータベース335は、「単純不動産権」又は「合理的疑いの余地なし」などの特定の法律用語に特化することができる。このような用語は、法律的文脈外のフレーズとして認識することも、又は認識しないこともできる。
図5に、結果の表示を目的としたクエリ語のグループ化に関するさらなる詳細を示す。
【0036】
ステップ500において、クエリから用語を決定することができる。用語は、単語及び/又はフレーズなどとすることができる。クエリがブールクエリである場合、各用語を構文用語/構文単語の一方によって分離することができる。従って、例えば、ブールクエリが「antitrust exemptions AND sports OR basketball OR football(独占禁止法適用除外ANDスポーツORバスケットボールORフットボール)」である場合、この用語が「独占禁止法適用除外」というフレーズと、「スポーツ」、「バスケットボール」及び「フットボール」という各単語とを含むと判断することができる。クエリが自然言語クエリである場合、クエリ内に特定の句読点が存在しない限り、最初はクエリの各単語を1つの用語として見なすことができる。従って、自然言語クエリが、「what “antitrust exemptions” exist in sports, particularly football and basketball?(スポーツ、特にフットボール及びバスケットボールにはどのような「独占禁止法適用除外」が存在するか?)」である場合、引用符で囲まれている「antitrust exemptions(独占禁止法適用除外)」を除く用語がクエリ内の各単語であると見なされる。
【0037】
ステップ505において、決定された用語をグループ化の目的で選択する。例えば、クエリからの用語の決定が「独占禁止法適用除外」及び「スポーツ」である場合には、「独占禁止法適用除外」又は「スポーツ」のいずれかを選択することができる。本明細書でさらに詳細に説明するように、最終的にはクエリ内の全ての用語がグループ化のために選択され、従ってステップ505における用語の選択は、特定の選択方法に限定されるものではない。例えば、用語は、クエリ内の最初に出現するという理由で、又は(前の用語が既に選択されている時には)クエリ内の次の用語であるという理由で選択することができる。
【0038】
ステップ510において、用語がノイズ単語又はノイズフレーズであるかどうかを判断することができる。一般に、ノイズ単語/ノイズフレーズとは、その共通性に起因して、検索された場合でも検索結果を狭める可能性が低い非キーワード/非キーフレーズである単語/フレーズのことである。従って、ノイズ単語及びノイズフレーズは、一般に文書の主題を識別する役に立たない用語及びフレーズである。非限定的なノイズ単語の例としては、「a」、「the」、「an」、「of」、「to」及び「on」などが挙げられる。用語がノイズ単語又はノイズフレーズである場合には、ステップ515においてこれらを廃棄して、処理はステップ505に戻ることができる。本明細書にさらに詳細に説明するように、一般にノイズ単語及びノイズフレーズを廃棄する理由は、検索結果を視覚化した時にユーザがノイズ単語/ノイズフレーズに関心を示さない可能性が高いからである。
【0039】
用語がノイズ単語又はノイズフレーズでない場合、処理はステップ520に進むことができる。ステップ520において、1又は2以上のデータベース内で用語を検索することができる。上述したように、これらのデータベースは、一般に検索結果を表示する目的で似通っている用語のグループを決定することに特化したデータベースとすることができる。すなわち、これらのデータベースは、ワイルドカードシソーラスデータベース、同義語データベース及びフレーズデータベースを含む、クエリグループを決定するために使用される特定のデータベースである。
【0040】
ステップ525において、1又は2以上のデータベース内で用語の一致が見つかったかどうかを判定する。一致が見つからなかった場合、ステップ530において、この用語をグループ化されない用語として戻す。すなわち、この用語は、本明細書で説明するような検索結果を表示する目的で他の用語と共にグループ化されない。むしろ、本明細書でさらに詳細に説明するように、この用語は、他のユニットとは異なるものとして単独で示すことができる。
【0041】
一致が見つかった場合、ステップ535においてその用語の同義語リストを解析し、ステップ540において残りの用語と比較して一致が存在するかどうかを判定する。例えば、クエリが「スポーツ」という用語と、「バスケットボール」という用語と、「フットボール」という用語とを含み、データベース内で「スポーツ」という用語について一致が見つかった場合、そのデータベース内の「スポーツ」という用語の同義語を解析して、いずれかの同義語が「バスケットボール」という用語及び「フットボール」という用語に一致するかどうかを判定することができる。ステップ545における一致が見つからなかった旨の判定に基づいて、ステップ530において、その用語をグループ化されないものとして戻す。
【0042】
ステップ545においてクエリ内の残りの用語と同義語リストとの間に一致が見つかったと判定された場合、この判定に基づいてステップ550においてこれらの用語をグループ化する。すなわち、本明細書で説明するように、グループ化された用語は、検索結果を表示する際に共に同様の色の指示子などの形で表示される。しかしながら、本明細書で説明するように、これらの用語は、検索を行う目的では別個に適用される。非限定的な例では、「スポーツ」という用語の同義語リスト内に「フットボール」という用語と「バスケットボール」という用語とがいずれも出現した場合、3つの全ての用語が共にグループ化されて、検索結果には、これらの3つの用語の各々が別個の色の指示子として個別に示されるのではなく、これらの3つの用語のグループ化のみが単一色の指示子で表示されるようになる。
【0043】
ステップ555において、未だグループ化されていない、又はグループ化されないものとして戻されたさらなる用語がクエリ内に残っているかどうかを判定することができる。さらなる用語が残っている場合、プロセスはステップ505に戻ることができる。さらなる用語が残っていない場合、ステップ560において、グループ化された用語及びグループ化されていない用語の(単複の)リストを提供することができる。本明細書で詳細に説明するように、これらの(単複の)リストの提供は、一般に将来的にアクセスできるようにリストをメモリに記憶するステップを含むことができる。
【0044】
再び
図3を参照すると、用語がグループ化されるか、又はグループ化されないものとして決定されると、ステップ340において、クエリに含まれているユニットの数が特定の閾値を上回るか、それとも下回るかを判定することができる。ユニットは、用語のグループを意味し、又は用語がグループ化されない場合には単一の用語を意味する。このような判定が望ましい理由は、ユニットの量が過剰になる(例えば、量が閾値数を超える)と、結果リストが雑然としたものに見える(すなわち、異なる色の指示子が多すぎる)とともに、ユーザが自身の検索目的と密接に関連する特定の結果を見つけ出すのが困難になり得るからである。ステップ340には5ユニットという閾値を示しているが、このような数は例示にすぎず、本開示はこのように限定されるものではない。すなわち、閾値は、本開示の範囲から逸脱することなくあらゆる数のユニットとすることができる。例示的な閾値は、例えば2ユニット、3ユニット、4ユニット、5ユニット、6ユニット又は7ユニットとすることができる。
【0045】
クエリが閾値を上回る数のユニットを有している場合、ステップ360において、クエリを分析してユニット低減スコアを決定することができる。本明細書で使用するユニット低減スコアとは、1又は2以上の基準に基づいて各ユニットに割り当てられるスコアのことである。いくつかの実施形態では、ユニット低減スコアの高いユニットの方が、ユニット低減スコアの低いユニットよりも、検索結果を視覚化する目的で表示されるユニットである可能性が高い。
【0046】
各ユニットのユニット低減スコアは、1又は2以上のデータベースにアクセスし、データベースに含まれている情報に基づいてスコアを割り当てることによって決定することができる。例示的なデータベースは、限定するわけではないが、ユーザ分析データベース365、結果メタデータデータベース370、個人ユーザ履歴データベース375、トピック分類データベース380、文書コーパスデータベース385、及び類似ユーザ履歴データベース390を含む。
【0047】
図6に、低減スコアの決定に関するさらなる詳細を示す。ステップ605において、スコア付けするユニットを選択し、ステップ610において、そのユニットが希なユニットであるか、それともユーザがよく使用しているユニットであるかを判定する。すなわち、ユーザの検索履歴などの様々な検索履歴を再検討して、そのユニットが過去に使用されたことがある用語又は用語グループであるかどうかを判定することができる。検索履歴は、例えばユーザ分析データベース365及び/又は個人ユーザ履歴データベース375などの1又は2以上のデータベースにアクセスし、データベースエントリとユニットからの1又は2以上の用語とを比較することによって再検討することができる。そのユニットがあまり使用されていない(すなわち、稀な用語である)場合、ステップ615において、ユニットに1又は2以上のポイントを割り当てる。割り当てるポイントの数は、本開示によって限定されるものではなく、あらゆるスコア付け方法に基づくことができる。非限定的な例では、ユニット(又はユニットからの検索語)が稀なものである場合には1ポイントを割り当てることができる。別の非限定的な例では、使用頻度の高いユニットが受け取るポイントが使用頻度の低いユニットよりも少なくなるように、ユニット(又はユニットからの検索語)が過去にどれほど頻繁に使用されたかについての規模に従ってポイントを割り当てることができる。
図7に、特定の用語の組み合わせがどれほど頻繁に使用されているかに基づいて割り当てられるポイントの例示的な表を示す。いくつかの実施形態では、ユーザがそのユニットをよく使用している場合にはポイントを割り当てないことができる。
【0048】
再び
図3及び
図6を参照すると、ステップ620において、ユニットが構文的類似性を有する用語に密接に関連するかどうかを判断する。例えば、あるユニットが「不法占有」という用語を含み、検索結果から取得されたメタデータが、検索結果の大部分が「不法占有」と意味的に類似する不動産に関するものであることを示し、「不法占有」という用語が他の不動産用語と密接に関連して(例えば、同じ文、同じフレーズ又は同じ段落などで)使用されている場合、その用語が意味的に類似する用語と話題的に(例えば、空間的に)密接しているという理由で高い値を有すると判断することができる。このような判断は、例えば結果メタデータデータベース370、トピック分類データベース380及び/又は文書コーパスデータベース385などの1又は2以上のデータベースにアクセスすることによって行うことができる。ステップ625において、高い値の用語(例えば、意味的に類似する用語と密接に関連する用語)である場合には、ユニットに1又は2以上のポイントを割り当てることができる。上述したように、割り当てるポイントの数は本開示によって限定されるものではなく、あらゆるスコア付け方法に基づくことができる。ユニットが意味的に類似する用語と密接に関連しない場合には、ポイントを割り当てないことができる。
【0049】
いくつかの実施形態、特に検索が法律関連の検索(例えば、制定法検索、判例法検索及び/又は法律論文検索など)である実施形態では、ユニットが特定の法的話題に関連するかどうかを判断することができる。例えば、「不法占有」という用語を含むユニットは、別の法的話題よりもむしろ不動産法に関連するものとして認識することができる。このような判断は、例えばトピック分類データベース380及び/又は文書コーパスデータベース385などの1又は2以上のデータベースを検索してデータベース内のエントリとユニットからの1又は2以上の用語とを比較することによって行うことができる。ユニットが特定の法的話題に関連する場合、ステップ635において、ユニットに1又は2以上のポイントを割り当てることができる。上述したように、割り当てるポイントの数は本開示によって限定されるものではなく、あらゆるスコア付け方法に基づくことができる。ユニットが特定の法的話題に関連しない場合には、ポイントを割り当てないことができる。
【0050】
ステップ640において、ユニットが文書コーパスに関連するかどうかを判断する。例えば、ユニットが「バスケットボール」という用語と「フットボール」という用語とを含む場合には、このユニットをスポーツ文書コーパスに関連するものとして認識することができる。このような判断は、例えばトピック分類データベース380及び/又は文書コーパスデータベース385などの1又は2以上のデータベースを検索してデータベース内のエントリとユニットからの1又は2以上の用語とを比較することによって行うことができる。いくつかの実施形態では、トピック分類データベース380及び/又は文書コーパスデータベース385からの用語に、これらの用語が他の文書内の密接に関連する他のクエリ語とどの程度同時に出現したかに従って重み付けすることができる。ユニットが文書コーパスに関連する場合、ステップ645において、ユニットに1又は2以上のポイントを割り当てることができる。上述したように、割り当てるポイントの数は本開示によって限定されるものではなく、あらゆるスコア付け方法に基づくことができる。ユニットが文書コーパスに関連しない場合には、ポイントを割り当てないことができる。
【0051】
ステップ650において、ユニットが他のユーザによって検索されたユニットに関連するかどうかを判断する。例えば、「バスケットボール」、「フットボール」及び「スポーツ」という用語を複数のユーザが検索していた場合、これらの用語のうちの1つ又は2つ以上を含むこのようなユニットは、他のユーザによって検索されたユニットに関連すると判断することができる。このような判断は、例えば類似ユーザ履歴データベース390などの1又は2以上のデータベースを検索してデータベース内のエントリとユニットからの1又は2以上の用語とを比較することによって行うことができる。ユニットが同様のユーザの検索に関連する場合、ステップ655において、ユニットに1又は2以上のポイントを割り当てることができる。しかしながら、このような判断は本開示によって限定されるものではなく、本開示の範囲から逸脱することなく他の資産を用いた他の分析を使用することもできる。上述したように、割り当てるポイントの数は本開示によって限定されるものではなく、あらゆるスコア付け方法に基づくことができる。ユニットが同様のユーザの検索に関連しない場合には、ポイントを割り当てないことができる。
【0052】
ステップ660において、ユニットに割り当てられるポイント数を集計してファイルにログ記録することができる。その後、ステップ665において、さらなるユニットにポイントを割り当てるべきかどうかを判断することができる。さらなるユニットにポイントを割り当てるべきである場合、全てのユニットにポイントが割り当てられるまでステップ605においてプロセスを繰り返すことができる。
【0053】
さらなるユニットが存在しない場合、ステップ670において、各ユニットに割り当てられるポイント数の集計を含む文書をそのスコアに従って並べ替えてランク付けすることができる。例えば、ポイントの量が多いユニットは、ポイントの量が少ないユニットよりも上位にランク付けすることができる。しかしながら、本開示の範囲から逸脱することなく他の集計方法を行うこともできる。例えば、集計は、ポイントの合計ではなく特定の公式に従うこともできる。ステップ675において、閾値量までの上位スコアのユニットを、表示すべきユニットとして選択することができる。例えば、閾値が5ユニットである場合、上位5つのユニットを選択することができる。同様に、閾値が3ユニットである場合、上位3つのユニットを選択することができる。
【0054】
図3を参照すると、ステップ395において、上位スコアのユニットを保持する。一般に、ステップ395は
図6のステップ675と同等であると理解されたい。ステップ395には5つの上位スコアのユニットを示しているが、本明細書で上述したように、閾値は5ユニットよりも多く又は少なくすることもできると理解されたい。従って、閾値が3である場合、ステップ395において、3つの上位スコアのユニットのみを維持することができる。
【0055】
ユニット数が閾値又はそれ未満になると、ステップ345において、結果メタデータデータベース355にアクセスすることによって、検索結果内の各文書のメタデータを取得することができる。一般に、結果メタデータデータベース355は、検索結果内に出現する各文書のメタデータを含むデータベースである。すなわち、本明細書で説明したステップ(例えば、ステップ305)と同時に行われる検索では、1又は2以上の結果が戻される。いくつかの実施形態では、結果メタデータデータベース355を、本明細書で上述した結果メタデータデータベース370と同じデータベースとすることができる。結果メタデータデータベース355には、各結果のメタデータが記憶される。
図8に、メタデータの取得に関するさらなる詳細を示す。
【0056】
ステップ805においてユニットを選択し、ステップ810において結果メタデータデータベースにアクセスする。結果メタデータデータベースには、本明細書で説明したようなインターフェイスを介してアクセスすることができる。ステップ815において、検索結果のメタデータを検索し、ステップ820において、検索結果の各文書内のユニットからの各用語の1又は2以上の位置を決定する。1又は2以上の位置を決定すると、ステップ825において、検索結果内の各文書に(単複の)位置を示すように注釈付けすることができる。ステップ805では、ステップ830におけるさらなるユニットが存在するかどうかの判定によって示される通りに各ユニットについてプロセスを繰り返すことができる。従って、文書内の各ユニットには、ユニット同士が注釈に基づいて区別されるように一意の注釈(例えば、第1の指示子、第2の指示子など)が付けられる。全てのユニットを使用して結果メタデータを検索して結果リストに注釈付けすると、ステップ835において、注釈と共に結果を表示することができる。再び
図3を参照すると、これらの注釈付きの結果は、ステップ350において表示をレンダリングする一部として表示することができる。
【0057】
図9に、レンダリングできる例示的な表示を示す。一般に、この表示は、検索バー905、結果スナップショット部分910及び/又は結果表示915を有するユーザインターフェイス900を含むことができる。検索バー905は、本明細書で
図4に関して説明した様々な要素を含むことができる。
【0058】
結果スナップショット部分910は、一般に文書のタイプに分類された検索結果の概要を示すことができる。例えば、
図9に示す結果スナップショット部分910は、検索結果を、訴訟、制定法及び立法、管理コード及び規制、行政資料、二次資料、形式、弁論趣意書、申立書及び動議、陪審説示、陪審評決及び和解、鑑定人分析、訴訟事件一覧表、住所氏名録、ニュース、法律ニュース、科学、企業及び金融、並びにウェブカテゴリなどのカテゴリ912に分類する。カテゴリ912は、非限定的な例である。従って、本開示の範囲から逸脱することなく他のカテゴリを提示することもできる。また、結果スナップショット部分910は、カテゴリ912の各々に存在する検索ヒット数914を表示することもできる。例えば、結果スナップショット部分910は、1,530の検索結果がフォームとして分類されていることを示す。いくつかの実施形態では、表示すべき特定の結果をユーザが選択できるように、結果スナップショット部分910を相互作用型とすることができる。例えば、本明細書でさらに詳細に説明するように、ユーザは、制定法及び立法に関する検索結果のみを見たいと望む場合、カテゴリ912の「制定法及び立法」を選択(例えば、クリック)すると、この特定のカテゴリからの検索結果のみを結果表示915に表示させることができる。
【0059】
一般に、結果表示915は、ユーザが提出したクエリに従って行われた検索の結果リストを含む。結果表示915内の1又は2以上の行には、各検索結果920を表示することができる。各検索結果920について表示される内容は本開示によって限定されるものではなく、タイトル、引用、詳細な説明に関するテキスト及び/又は概要に関するテキストなどを含むあらゆるタイプ及び量の内容とすることができる。法律データベースを検索する実施形態では、各検索結果920が、例えば訴訟名921及び/又は報告者引用922を含むことができる。各検索結果920と共に含めることができる他の情報としては、例えば管轄923及び/又は日付924などを挙げることができる。いくつかの実施形態では、各検索結果920を、追加情報を公開するようにユーザによって拡張可能とすることができる。例えば、ユーザは、検索結果920のリンクを選択(例えば、クリック)して結果に関する追加テキスト(例えば、完全文書など)を表示し、及び/又は検索結果920の一部にマウスポインタを重ねて追加情報を見ることができる。従って、本明細書では、「検索結果」という用語を「文書」という用語と同義的に使用することができる。すなわち、検索結果920は、本明細書で説明したような検索の結果として発見された文書とすることができる。
【0060】
各検索結果920は、本明細書で
図3、
図6及び
図8に関して説明したステップの結果としてヒットパターン925を含むこともできる。一般に、ヒットパターン925は、検索結果920内のプログラム的に決定された最も関連性の高い文書部分の様々な検索語の位置を示す視覚化をユーザに提供する。
図9に示すように、ヒットパターン925は、検索結果の様々な部分の内訳を含むことができる。例えば、検索結果920が法廷意見である場合、ヒットパターン925は、要約部分、頭注(例えば、キーワード)部分、意見部分及び/又は他の様々な部分などの、法廷意見の様々な部分を表示することができる。このような部分は例示にすぎず、別の部分、さらなる部分又はこれよりも少ない部分を使用することもできると理解されたい。ヒットパターン925は、1又は2以上の部分内に1又は2以上のハッシュ926を表示することもできる。ハッシュ926は、一般に文書内の注釈を付けられた指示子に対応して各部分内の検索語の位置を示すことにより、文書内のどこに検索語が出現しているか、及び検索語のクラスタリングをユーザが素早く容易に視覚化できるようにすることができる。すなわち、検索語のクラスタは、他の用語から分離された単一の検索語ではなく、ユーザにとって最も関心の高い文書領域を示すことができる。
【0061】
本明細書で説明したように、ユニットの数は、特定の閾値数まで表示することができる。ハッシュ926は、ヒットパターン925内の各ユニットを他のユニットと区別するために色分けすることができ、又は各ハッシュ926が表すユニットに従う際立った特徴を別様に含むことができる。従って、ユーザインターフェイス900は、どの色が各ユニットに対応するかを示す選択可能な凡例930をさらに含むことができる。例えば、
図9に示すように、凡例930は、「sport(スポーツ)」という用語のための第1の色、「antitrust(独占禁止)」という用語のための第2の色、及び「exemption(適用除外)」という用語のための第3の色を示すことができ、本明細書でさらに詳細に説明するように、これらのオン又はオフを切り替えて対応する強調部分を検索結果920内に表示することができる。従って、各検索結果920に関する特定の情報のみを表示する第1のビュー(例えば、検索の結果として発見された複数の事例の各事例の高水準スナップショット)では、各検索結果920内のいくつかの用語が対応する色で強調表示されることにより、これらの用語が文書に関してどこに出現しているか、これらの用語がクラスタリングされているか、それとも散らばっているか、及びこれらの用語が互いに関連してどこに出現しているかを示すこともできる。また、あるユニットが複数の用語を含む時には、そのユニット内の各用語が同じ際立った特徴でコード化される(例えば、「football(フットボール)」、「basketball(バスケットボール)」及び「sport(スポーツ)」という用語は、全て同じカラーハッシュ926を有することができ、各検索結果920内で同様に強調表示することができる)。
【0062】
様々な実施形態では、
図9に示す第1のビューにおいて、ハッシュ及び強調表示された用語が、文書内の最高ランクの用語又は文書の特定の部分などのみを示すことができる。すなわち、「最高ランク」の用語は、本明細書でさらに詳細に説明したような(
図8のステップ825を参照)、特定のユーザの検索に関連する可能性が高いと判定されて検索結果920内で注釈を付けられた用語である。従って、後述するように、最高ランクの用語は、検索結果920の情報を全て含んでいるわけではない特定の検索結果920の高水準ビューにおいてユーザに表示されることが必要となり得る。いくつかの実施形態では、第1の最高ランクの部分を際立った特徴928でさらに区別することができる。一般に、第1の最高ランクの用語は、本明細書でさらに詳細に説明するように決定できる、全ての最高ランクの用語のうちのユーザの検索に関連する可能性が最も高い(すなわち、他の最高ランクの用語よりもさらに高いランクを有する)用語とすることができる。すなわち、ユーザの注意が第1の最高ランクの用語に引き付けられるように、第1の最高ランクの用語を残りの最高ランクの用語よりも目立つようにする。第1の最高ランクの用語を示す目的で使用される際立った特徴928は、本開示によって限定されるものではなく、あらゆる際立った特徴とすることができる。例えば、
図9に示すように、際立った特徴928は星形などとすることができる。
【0063】
いくつかの実施形態では、特に検索結果920が多くのヒットを含む事例では、
図9に表示されるヒットパターン925が、検索結果920内の全てのヒットを示さないこともできる。むしろ、ヒットパターン925は、他のヒット及び/又は最高ランクの用語などに比べてユーザにとっての関心が高い可能性があると判断されたヒットなどの、所定数の「最も関連性の高い」ヒットのみを表示することができる。このような実施形態では、本明細書でさらに詳細に説明するように、ユーザが検索結果920を選択して検索結果920全体を閲覧した時に、ヒットパターン925内に全てのヒットを示すことができる。
【0064】
一般に、
図9は、文書内のユニット同士を区別できるように色付きハッシュ926を用いて色分けされたヒットパターン925に関するが、本開示はこのように限定されるものではない。例えば、いくつかの実施形態では、本開示の範囲から逸脱することなく、ヒットパターン925が、ユニット同士を区別するために様々な異なる陰影付きのハッシュ926を利用することも、或いはユニット同士を区別する他の手段を利用することもできる。
【0065】
いくつかの実施形態では、ユーザが、検索結果920内の文書に関する追加情報を入手したいと望むものの、文書全体にアクセスしてスクロールさせてヒットを発見することはしたくないと思う場合、ハッシュ926のうちの1つ又は2つ以上、及び/又はハッシュ926のクラスタ(例えば、ボックス927によって囲まれたクラスタ)を選択(例えば、クリック又はマウスオーバ)して、結果表示915上にオーバレイ領域935が出現するようにすることができる。オーバレイ領域935は、例えば検索語を強調表示する文書のテキストの抜粋版を示すことにより、ユーザが前の画面に戻る操作及び/又は検索の再実行などを行ったりする必要なく、抜粋された範囲が検索に関連するかどうかを素早く判断して他の部分又は文書に進めるようにすることができる。
【0066】
いくつかの実施形態では、ユーザがヒットパターン925上の所望の位置にボックス927を選択的に移動できるように、ボックス927をヒットパターン925に対して移動可能とすることができる。例えば、ユーザは、スライダタイプのボックスであるボックス927を作動させ、ボックス927がヒットパターン925内の特定の関心領域を取り囲むようにヒットパターン925に沿って動かすことができる。すなわち、ユーザは、ハッシュ926が特に集中している領域、特定の色/陰影のハッシュ926が集中している領域、特定の一群の異なる色/陰影のハッシュ926を有する領域、及び/又は際立った特徴928で示されている領域などの特定の関心領域にボックス927をスライドさせることができる。オーバレイ領域935の内容は、ボックス927によって囲まれた様々なハッシュ926に対応する検索結果920の最新のテキストを表示するようにリアルタイムで更新することができる。すなわち、このシステムは、結果表示915の全ての結果から検索結果920を選択し、検索結果920の全文が表示されるのを待ってから特定の関心領域まで下にスクロールする必要なく、ハッシュ926のクラスタリング(又はその他の要因)に基づいてボックス927を介して検索結果920内の1又は2以上の特定の関心領域を瞬時に選択して、検索結果920内の対応するテキストを瞬時に確認することをユーザに対して可能にするように構成される。いくつかの実施形態では、特定の文書が完全に開かれた(すなわち、検索結果リスト内の文書のプレビューではない)時にのみ、ボックス927を動作可能(すなわち、移動可能)にすることができる。
【0067】
ボックス927の初期位置(すなわち、ユーザが動かす前に提示されているボックス927の位置)は、例えばユニットのクラスタ、検索結果920の特定の部分、影響力の大きな訴訟及び/又は画期的な訴訟において広く認識されている検索結果920の部分、公共政策についての議論を含む検索結果920の部分、及び/又は含めるための閾値を上回る関連性を有する検索結果920の部分などに基づいて「最良の抜粋」として自動的に決定された検索結果920の抜粋部分を示すことができる。いくつかの実施形態では、オーバレイ領域935内に表示されるテキストの一部を残りのテキストと視覚的に区別(例えば、強調表示、太字テキストなど)し、又は目立たせる(例えば、エンティティ、フレーズ、文書参照など)ことができる。
図10に示すように、複数の異なるユニットを含むクラスタをユーザが選択する実施形態では、オーバレイ領域935内の強調表示部分の際立った特徴(例えば、色)が、特定のユニットに使用されるハッシュ926の色に対応することができる。従って、ユーザは、オーバレイ領域935内の用語同士を素早く区別して必要な情報を入手することができる。
【0068】
再び
図9を参照すると、いくつかの実施形態では、凡例930が、ユーザによる特定のユニットの選択又は選択解除を可能にするチェックボックスなどを含むことができる。例えば、ユーザは、凡例930から(例えば、ユニットをクリックすることによって)特定のユニットを選択解除することにより、このユニットに対応するヒットパターン925のハッシュ926を消滅させることができる。同様に、オーバレイ領域935においても、そのユニットからの用語の強調表示部分がもはや強調表示されなくなる。しかしながら、凡例930から特定のユニットを選択又は選択解除しても、影響を受けるのは結果の表示のみであって実際の検索が変化するものではない(すなわち、そのユニットからの用語は依然として検索語として存在し、検索結果には依然としてその用語が含まれている)と理解されたい。
【0069】
いくつかの実施形態では、ユーザが、文書からの特定の抜粋ではなく文書全体を見たいと望むことができる。このような実施形態では、
図11に示すように、ユーザが検索結果920(例えば、文書名など)を選択(例えば、クリック)することによって、全体文書ビュー1100を生じさせることができる。いくつかの実施形態では、ユーザがオーバレイ領域935をクリック又は別の方法で選択することにより、オーバレイ領域935内の抜粋されたテキストを含む文書内の部分に、
図11に示すような全体文書ビュー1100を開くことができる。
図11の全体文書ビュー1100も、
図9及び
図10に示す結果ビューと同様にヒットパターン925をハッシュ926で表示し、文書表示領域940内の検索語をハッシュ926に対応する色で強調表示する。しかしながら、後述するように、
図9に表示されるヒットパターン925が(例えば、検索結果920が多くのヒットを有するという理由で)検索結果920内の全てのヒットを示すわけではない実施形態では、
図11に示すビューが、検索結果920内の全てのヒットを示すようにヒットパターン925を更新することができる。従って、検索結果920内のヒットに関するさらなる詳細がユーザに提供される。
【0070】
いくつかの実施形態では、全体文書ビュー1100が、特定の検索結果との関連性が検索結果920内の他のヒットよりも高いヒットを示すハッシュ926のクラスタに対応するヒットパターン925上に又はこれに隣接して、1又は2以上のヒットクラスタ指示子929をさらに表示することができる。従って、ユーザは、ヒットクラスタ指示子929により、検索されている情報との対応性がさらに高い可能性のある検索結果920の領域を発見できるようになる。従って、ユーザは、ヒットクラスタ指示子929によって示されているハッシュ926の領域を囲むようにボックス927を動かして、検索結果920内の対応するテキストを見ることができる。この結果、ユーザは、検索結果920をスクロールして関心領域を発見するのにそれほど多くの時間及び/又は労力を費やす必要なく、このような領域を素早く特定することができる。
【0071】
本明細書で
図9~
図11に関して説明したユーザインターフェイス900を提供することにより、ユーザは、各検索結果920がなぜ選択及び/又はランク付けされ表示されているかをより良好に視覚化し、ユーザが入力した検索語に基づいてユーザとの関連性が最も(又はより)高い各検索結果920の部分を視覚化し、1つの特定の検索結果をなぜ別の特定の検索結果よりも結果リストの上位にランク付けできるかを視覚化し、どれのほどの抜粋が閾値を上回ったかを視覚化し、及び/又は抜粋内にどれほど多くの用語が存在するかを視覚化することができる(すなわち、用語の数が多いほどランクが高くなる)。このことは、ランク付けの理由がユーザに分からなかったと思われる場合に特に可能である。また、ユーザインターフェイス900は、特定の検索結果920の内容と、特定のユーザが実際に自身の調査においてその内容をどのように使用できるかとの間の差分も示す。
【0072】
なお、
図9~
図11に関して説明したユーザインターフェイス900は例示にすぎず、本明細書で説明したステップから取得された情報を利用して秩序だった検索結果をユーザに提供する他のユーザインターフェイスも検討され実施可能であると理解されたい。例えば、いくつかの実施形態では、
図12に示すように、別のユーザインターフェイス1200が、1又は2以上の検索結果1220の各々についての別のヒットパターン部分1225を含むことができる。具体的に言えば、別のヒットパターン部分1225は、1又は2以上の検索結果1220の各々における総ヒット数をユニット毎に示す、「スパークライン」視覚化と呼ぶこともできる棒グラフとすることができる。すなわち、第1のバー1250は、第1のユニットの総ヒット数を示すことができ、第2のバー1255は、第2のユニットの総ヒット数を示すことができ、第3のバー1260は、第3のユニットの総ヒット数を示すことができる。バーが大きければ大きいほど(すなわちバーの長さが高ければ高いほど)、特定の検索結果内に存在するヒット数も多くなる。例えば、
図12に示すように、「J.S.v.Blue Mt.Sch.Dist」という検索結果は、第2のバー1255が第1のバー1250及び第3のバー1260よりも多くのヒットの数を有する別のヒットパターン部分1225を示す。凡例1230によって示すように、第2のバー1255は「school(学校)」という検索語に対応する。従って、ユーザは、別のヒットパターン部分1225を見た時に、「J.S.v.Blue Mt.Sch.Dist」という検索結果において「school」という用語が多く使用されていると認識することができる。いくつかの実施形態では、バー1250、1255、1260のサイズをそれぞれの釣り合いに従って決定することができる。すなわち、ある検索結果が「school」という用語を「internet(インターネット)」という用語の2倍多く使用している場合には、(用語「school」に対応する)第2のバー1255を(用語「internet」に対応する)第3のバー1260の2倍の高さとすることができる。いくつかの実施形態では、バー1250、1255、1260が、文書全体でのヒット及び/又は特定の部分又は複数の部分におけるヒットなどに関連することができる。
【0073】
図13を参照すると、いくつかの実施形態では、別のユーザインターフェイス1200が、どの用語の関心が高いかを別のヒットパターン部分1225に示すことによって検索結果1220を並べ替える能力をユーザにもたらすことができる。すなわち、ユーザは、「school」という用語についての言及を最も多く含む検索結果1220が結果の最上位に見えるようにしたいと望む場合、並べ替えボタン1265のうちの対応するボタン(例えば、並べ替えボタン1265のうちの中央のボタン)を選択することによって検索結果1220を並べ替えることができる。同様に、ユーザは、「school」という用語及び「internet」という用語についての言及を最も多く含む検索結果を結果の最上位に示すように検索結果を並べ替えたいと望む場合、並べ替えボタン1265のうちの対応する2つのボタンを選択することによって検索結果1220を並べ替えることができる。なお、並べ替えボタン1265を使用して、最もヒットの少ないものを結果の最上位に示すように検索結果1220を並べ替えることも、用語の量が最も均一に分散している(例えば、様々な用語が相対的にほぼ等しい量だけ出現する)結果を結果の最上位に示すように検索結果1220を並べ替えることもできると理解されたい。いくつかの実施形態では、並べ替えボタン1265を使用して、デフォルトの又はオリジナルの関連性ランク(すなわち、最初にユーザに提供された初期関連性ランク)を復元することもできる。
【0074】
次に
図14を参照すると、いくつかの実施形態では、別のユーザインターフェイス1200が、ユーザによる作動時にポップアップ表示1270を提示することができる。ポップアップ表示1270は、例えば検索結果1220のうちの1つなどの、別のユーザインターフェイス1200の特定の領域にユーザがマウスオーバした時に作動することができる。ポップアップ表示1270を作動させる他の手段も検討され実施可能である。一般に、ポップアップ表示1270は、ユーザが内容を見るために文書を完全に開く必要なく、検索結果1220のうちの特定の結果に関する追加情報を提示することができる。例えば、
図14に示すように、ポップアップ表示1270は、検索結果1220内に提示された文書の概要部分に関する情報を提供することができる。いくつかの実施形態では、ポップアップ表示1270のテキスト内の様々な用語を強調表示することができる。
【0075】
いくつかの実施形態では、ポップアップ表示1270の代替例として、
図15に示すように、別のユーザインターフェイス1200が、詳細な結果部分1275を表示するように拡大することができる。詳細な結果部分1275は、ポップアップ表示1270(
図14)及び/又はオーバレイ領域935(
図9)に類似することができる。すなわち、詳細な結果部分1275は、ユーザが内容を見るために文書を完全に開く必要なく、検索結果1220のうちの特定の結果に関する追加情報を提供することができる。例えば、
図15に示すように、詳細な結果部分1275は、例えば本明細書でさらに詳細に説明したように強調表示できる検索語を含む部分などの、検索結果1220からの文書のテキストの1又は2以上の選択部分を提供することができる。また、ユーザは、バー1250、1255、1260のうちの1つを選択して、バー1250、1255、1260のうちの選択されたバーに対応するキーワードを含む文書のテキストを詳細な結果部分1275に表示させることもできる。例えば、ユーザが「internet」という検索語に対応する第3のバー1260を選択した場合、詳細な結果部分1275は、「internet」という用語を含むテキスト部分を表示することができる。また、表示されたテキスト内で用語「internet」を強調表示することもできる。
【0076】
いくつかの実施形態では、別のユーザインターフェイス1200が、
図16に示すような操作可能な拡大された詳細な結果部分1275を提供することができる。具体的に言えば、バー1250、1255、1260は、詳細な結果部分1275の拡大時にそれぞれ複数のバーへと展開することにより、ユーザが複数の拡張バー1280、1285、1290のうちの1つ又は2つ以上を選択して詳細な結果部分1275内の文書の様々なテキスト部分を表示できるようにすることができる。このような実施形態では、ユーザが、抜粋及び/又は文書内の様々な位置間の操作を行うことにより、ただし依然として文書の内容を見るために文書全体を開く必要なく、検索リストからの文書をさらに効率的に調査することができる。しかしながら、このようなユーザインターフェイス1200は例示にすぎず、対応する内容を示すために視覚要素との相互作用をユーザに提供する他の手段も本開示の範囲に含まれると理解されたい。
【0077】
複数の展開されたバー1280、1285、1290は例示にすぎず、本開示によって限定されるものではない。従って、拡大された詳細な結果部分1275内のテキスト部分をユーザが視覚化してこれらの間の操作を行えるようにする他の手段も検討され実施可能である。例えば、いくつかの実施形態では、(
図9~
図11に関して上述したものと同様の)クラスタ内に出現する1又は2以上のハッシュを使用することができる。また、別のユーザインターフェイス1200は、ユーザが文書内への操作を行う必要なく、ヒットの量、ヒットの割合及び/又はヒットの位置などを含む他のタイプの情報をユーザに伝えることもできる。
【0078】
いくつかの実施形態では、
図17に示すように、別のユーザインターフェイス1200を、検索語の相対的な近接度のみに基づいて結果を表示するようにユーザによる構成が可能にすることができる。このような実施形態は、ユニットのクラスタ文書内で互いに近接している文書の方が、文書内のユニットの配置が散らばっている文書よりも検索結果1220内の上位に表示されるように保証することができる。或いは、散らばった配置を有する文書を完全に除外することもできる。いくつかの実施形態では、ユーザインターフェイス1200が、ユーザによる(例えば、文書のテキスト内でクラスタがどれほど「散らばっている」かを示す)クラスタリング感度の制御を可能にする。非限定的な例では、ユーザが、100単語のテキスト内の5つのヒットがクラスタの最小閾値であることを示すことによってクラスタリング感度を調整することができる。別の非限定的な例では、ユーザが、段落内の3つのヒットがクラスタの最小閾値であることを示すことによってクラスタリング感度を調整することができる。いくつかの実施形態では、ユーザがプロトタイプ変数コントローラポップアップウィンドウ1295にアクセスしてスライダ1297を調整することによって感度の調整を行うことができる。例えば、スライダ1297を左に動かすと、閾値を「緩く」してテキスト内に散らばっているクラスタを示すことができる。同様に、スライダ1297を右に動かすと、閾値を「厳しく」して互いに近接するヒットのクラスタを示すことができる。なお、このようなプロトタイプ変数コントローラポップアップウィンドウ1295は例示にすぎず、他の感度調整手段も検討され実施可能であると理解されたい。このような特徴は、ユーザ制御設定又はデフォルト表示設定として現れることができる。
【0079】
いくつかの実施形態では、本明細書で説明した様々なユーザインターフェイスが、あらゆる検索エンジンアルゴリズムによって自動的に生成されるソート順とは無関係な別のソート順をユーザが決定できるようにして、必ずしも検索アルゴリズムが予測するとは限らないカスタマイズされた有用な検索ランクをユーザが発見できるようにすることができる。従って、特定のユーザのニーズに合わせた視覚化のカスタマイズ性は、検索エンジン及び/又は検索アルゴリズムと共に抑制と均衡のアプローチを使用可能にする。従って、ランク(例えば、本明細書で説明したプロセス)によって決定される検索結果と、特定の尺度(例えば、典型的な検索エンジンプロセス)によって決定される検索結果とをうまく両立させることができる。
【0080】
なお、様々なユーザインターフェイスは例示にすぎないと理解されたい。従って、本開示の範囲から逸脱することなく、
図9~
図17に関して説明した様々な特徴と、本明細書で具体的に説明していない特徴とのあらゆる組み合わせも検討され実施可能である。
【0081】
また、本明細書で説明したシステム及び方法は、ユーザによる検索の提出を可能にし、検索が行われるのとほぼ同時に検索語をユニットにグループ化して(必要な場合には)ユニット数を閾値未満に低減すると理解されたい。このようなグループ化は、ユーザに表示及び提示を行う目的でユニットにグループ化すべき類似性をどの用語が含んでいるかを決定することを含む。このような低減は、再調査すべき文書をユーザが決定する上でどのユニットが有用である可能性が最も高いかを決定することを含む。一般に、これらのグループ化及び低減は、ユーザが検索を行う際に遅延を体験しないように検索とほぼ同じ時間内で行われる。検索、グループ化及び低減が完了すると、ユーザに表示がレンダリングされる。この表示は、従来の結果リストの有効性を超越するように小型チャートを組み込むことによって、ユーザが検索結果内のヒットパターンを文書レベルと収集レベルの両方で視覚化できるようにする。従って、ユーザは、文書全体を見る必要なく、結果リストからのどの文書に関連性及び/又は関心があるかをより素早く効率的に判断することができる。
【0082】
本明細書では特定の実施形態を図示し説明したが、特許請求する主題の趣旨及び範囲から逸脱することなく、他の様々な変更及び修正を行うことができると理解されたい。さらに、本明細書では、特許請求する主題の様々な態様を説明したが、このような態様を組み合わせて利用する必要はない。従って、添付の特許請求の範囲は、特許請求する主題の範囲内に収まる全てのこのような変更及び修正を対象とするものである。
【符号の説明】
【0083】
900 ユーザインターフェイス
905 検索バー
910 結果スナップショット部分
912 カテゴリ
914 検索ヒット数
915 結果表示
920 検索結果
923 管轄
924 日付
925 ヒットパターン
926 ハッシュ
927 ボックス
928 際立った特徴
930 凡例
935 オーバレイ領域