特許7356973 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ インターナショナル・ビジネス・マシーンズ・コーポレーションの特許一覧

特許7356973複数の文書をランキングするための方法、コンピュータ・プログラムおよびコンピュータ・システム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-09-27

(45)【発行日】2023-10-05

(54)【発明の名称】複数の文書をランキングするための方法、コンピュータ・プログラムおよびコンピュータ・システム

(51)【国際特許分類】

G06F 16/33 20190101AFI20230928BHJP

【ＦＩ】

G06F16/33

【請求項の数】 15

(21)【出願番号】P 2020522673

(86)(22)【出願日】2018-10-19

(65)【公表番号】

(43)【公表日】2021-01-14

(86)【国際出願番号】 IB2018058140

(87)【国際公開番号】W WO2019086996

(87)【国際公開日】2019-05-09

【審査請求日】2021-03-23

【審判番号】

【審判請求日】2022-10-19

(31)【優先権主張番号】15/796,950

(32)【優先日】2017-10-30

(33)【優先権主張国・地域又は機関】US

(73)【特許権者】

【識別番号】390009531

【氏名又は名称】インターナショナル・ビジネス・マシーンズ・コーポレーション

【氏名又は名称原語表記】ＩＮＴＥＲＮＡＴＩＯＮＡＬＢＵＳＩＮＥＳＳＭＡＣＨＩＮＥＳＣＯＲＰＯＲＡＴＩＯＮ

【住所又は居所原語表記】ＮｅｗＯｒｃｈａｒｄＲｏａｄ，Ａｒｍｏｎｋ，ＮｅｗＹｏｒｋ１０５０４，ＵｎｉｔｅｄＳｔａｔｅｓｏｆＡｍｅｒｉｃａ

(74)【代理人】

【識別番号】100112690

【弁理士】

【氏名又は名称】太佐種一

(74)【代理人】

【識別番号】100120710

【弁理士】

【氏名又は名称】片岡忠彦

(72)【発明者】

【氏名】クルドル、ミシェル

(72)【発明者】

【氏名】ペローヌ、アントニオ

【合議体】

【審判長】須田勝巳

【審判官】山崎慎一

【審判官】吉田美彦

(56)【参考文献】

【文献】特開２００３－１５７２７０（ＪＰ，Ａ）

【文献】特表２００９－５０１９７４（ＪＰ，Ａ）

【文献】翠輝久、外１名，限定されたドメインにおける質問応答機能を備えた文書検索・提示型対話システム，情報処理学会研究報告，日本，社団法人情報処理学会，２００６年０７月０８日，第２００６巻，第７３号，ｐ．６９－７４

【文献】渡邊博之，ニューラルネットワークを用いた実習レポート評価支援システムの開発，電子情報通信学会技術研究報告，日本，社団法人電子情報通信学会，２００８年０７月１２日，第１０８巻，第１４６号，ｐ．７－１２

(58)【調査した分野】(Int.Cl.，ＤＢ名)

G06F16/33

(57)【特許請求の範囲】

【請求項1】

プロセッサが実行する、複数の文書用語を各々含む複数の文書をランキングするための方法であって、
前記文書を選択するための１つまたは複数のクエリ用語を含む、クエリを受信するステップと、
前記クエリ用語と前記複数の文書のうちの対応する文書の前記文書用語との間の比較により前記クエリと前記対応する文書との間の対応する類似度指数の各々を計算するステップと、
前記文書の各々に関連付けられた前記複数の文書用語に基づいて、前記文書ごとの意味的豊富度指標を決定するステップであって、前記意味的豊富度指標を決定するステップが、少なくとも特殊性指標を計算するステップを含み、前記特殊性指標を計算するステップが、前記複数の文書用語に基づく文書の希少な用語を識別するステップと、前記文書内の前記希少な用語に関連する密度を決定するステップとを含み、前記希少な用語は、所定の頻度しきい値より低い頻度で文書のコーパス内に存在する前記文書用語である、前記意味的豊富度指標を決定するステップと、
前記意味的豊富度指標により、前記複数の文書の各々について前記類似度指数を調整するステップと、
調整された前記類似度指数により、前記複数の文書の少なくとも一部を前記文書の選択のためにランキングするステップと、
を含む、方法。

【請求項2】

前記意味的豊富度指標の各々を計算する前記ステップが、
前記所定の頻度しきい値を、前記文書のコーパス内の前記文書用語の分布の統計的分析により計算するステップを含む、
請求項１に記載の方法。

【請求項3】

前記意味的豊富度指標の各々を計算する前記ステップが、
前記文書のコーパスのうちの前記文書用語が存在する割合の逆数に基づいて、前記文書用語の逆頻度指標を計算するステップと、
前記逆頻度指標の中心傾向変数に基づいて特殊性しきい値を計算するステップと、
前記文書内に存在する前記文書用語の特殊性しきい値よりも大きい前記逆頻度指標により、前記意味的豊富度指標の各々を計算するステップとを含む、
請求項２に記載の方法。

【請求項4】

前記逆頻度指標を計算するステップが、
前記文書用語が存在する前記割合の前記逆数に対数変換を適用するステップを含む、
請求項３に記載の方法。

【請求項5】

前記意味的豊富度指標を決定するステップが、
前記文書の統語的複雑性により前記意味的豊富度指標の各々を計算するステップを含む、
請求項１に記載の方法。

【請求項6】

前記意味的豊富度指標の各々を計算する前記ステップが、
前記文書内に存在する、複雑性しきい値を超える複雑性を有する統語的単位からなる複雑統語的単位により、前記文書の各々の前記統語的複雑性を定量化するステップを含む、
請求項５に記載の方法。

【請求項7】

前記文書の各々の前記統語的複雑性を定量化する前記ステップが、
前記複雑統語的単位を定義する、前記文書の各々内に存在する動詞句を識別するステップを含む、
請求項６に記載の方法。

【請求項8】

前記所定の頻度しきい値より低い頻度で前記文書のコーパス内に存在する前記文書用語から構成される希少な用語に各々応じて、前記特殊性指標である、前記意味的豊富度指標の特殊性成分を計算するステップと、
前記文書の統語的複雑性に各々応じて、前記意味的豊富度指標の複雑性成分を計算するステップと、
前記特殊性成分と前記複雑性成分との組合せにより、前記類似度指数の各々を調整するステップとをさらに含む、
請求項１に記載の方法。

【請求項9】

前記文書の前記意味的豊富度指標を決定するステップが、
前記文書の長さ指標により前記意味的豊富度指標の各々を正規化するステップを含む、
請求項１に記載の方法。

【請求項10】

前記類似度指数を調整する前記ステップが、
前記類似度指数の各々に、前記意味的豊富度指標に基づく少なくとも１つのピボット正規化関数を乗じるステップを含む、
請求項１に記載の方法。

【請求項11】

前記類似度指数を計算するステップが、
ベクトル空間モデル技術により前記類似度指数を計算するステップを含む、
請求項１に記載の方法。

【請求項12】

調整された前記類似度指数が減少する順序で前記複数の文書の少なくとも一部を表示させるために、前記クエリに応答して、ランキングされた前記複数の文書の少なくとも一部のリストを返すステップをさらに含む、
請求項１に記載の方法。

【請求項13】

前記文書の意味的豊富度指標を決定するステップは、複雑性指標を計算するステップをさらに含み、
前記複雑性指標を計算するステップは、前記文書に関連する統語的複雑性を決定するために、前記複数の文書に基づく前記文書に関連する動詞句の数および固有の句の数を決定するステップを含む、
請求項１に記載の方法。

【請求項14】

複数の文書用語を各々含む複数の文書をランキングするためのコンピュータ・プログラムであって、プロセッサに、請求項１から請求項１３のいずれか一項に記載の方法における各ステップを実行させる、
コンピュータ・プログラム。

【請求項15】

複数の文書用語を各々含む複数の文書をランキングするためのコンピュータ・システムであって、
プロセッサと、
コンピュータ・プログラムを記録したメモリと、
を備え、
前記コンピュータ・プログラムは、前記プロセッサに、請求項１から請求項１３のいずれか一項に記載の方法における各ステップを実行させる、
コンピュータ・システム。

【発明の詳細な説明】

【技術分野】

【0001】

本開示の背景を、以下にそのコンテキストに関する技術を説明することで紹介することとする。ただし、この説明が文書、行為、製品などを示す場合でも、説明される技術は、本開示に関連する分野の、従来技術の一部または共通の一般的認識であることを示唆または表現するものではない。

【0002】

本開示は、情報技術分野に関する。より具体的には、本開示は、文書のランキングに関する。

【背景技術】

【0003】

文書のランキングは、任意の特定の要求に関連し得る文書を、選択するコンピュータ・システムにおいて、常套手段である。典型的な例は、情報検索（ＩＲ）に関連するものであり、ランキングは、異なるトピックに関する文書（検索エンジンによるインターネットのウェブ・ページなど）の識別を支援するために使用される。実際、ある文書が別の文書より関連性があることを、数学的に証明することは不可能であり、関連する文書の選択は、経験的性質の行為であることから、文書のランキングが、その関連性を推定し、次にそれに応じて、（たとえば、人ユーザによる文書の手動選択のために）文書を順序づけまたはソートするために使用される。

【0004】

通常、ランキングは、各々が一連の用語（たとえば単語）からなる多数の文書によって形成される、文書のコーパス（またはコレクション）に適用される。所望の文書を選択するためのクエリは、（たとえば、ユーザによって検索エンジンに送信される）それらを特徴づけると考えられる１つまたは複数の用語を含む。類似度指数が、クエリの用語と文書の用語との比較に応じて、文書毎に計算される。文書は次に、所望の文書を選択するために、その類似度指数に応じてランキングされる（たとえば、実際に対象となるそれらの文書を手動選択するために、類似度指数の減少していく順序で並べられた最も関連するページのリストをユーザに返すことによって）。

【0005】

文書をランキングする普及した技術は、ベクトル空間モデル（ＶＳＭ）に基づいている。簡単に説明すれば、ＶＳＭ技術では、各文書および各クエリが、それらの用語およびその出現に応じて、単純にインデックスが付される。文書およびクエリは次に、（共通語彙の用語によって定義される）対応する多次元空間ベクトルによって表現される。各次元の用語が、文書／クエリ内に存在するとき、その値が、対応する用語の重みに設定される。たとえば、用語の重みは、ｔｆ－ｉｄｆ重み付け方式に従って定義される。具体的には、各用語の用語重みは、（文書／クエリ内の用語の）用語頻度ｔｆに（文書コーパス内の用語の）逆文書頻度ｉｄｆを乗じた積に設定される。クエリに関する文書の類似度指数が次に、それらのベクトルの角度差に応じて計算される。この方法では、類似度指数は、共通する用語によって決まり、繰り返される用語（それらの用語頻度による）、および／または希少である用語（それらの逆文書頻度による）に、より重い重要度を付与する。

【0006】

任意のランキング技術の品質は、実際上関連する（最上位にランキングされるものによって識別される）文書を、いかに良好に選択できるかによって決まる。たとえば、（選択された文書の総数を基準にして選択された、関連する文書によって定義される）精度は、できるだけ高くすべきである。実際に、情報ニーズに対して関連しない（関連性のない）文書、すなわち誤検出結果を制限することが望ましい（理想的には関連性のない文書を選択しない）。同時に、（関連する文書の総数を基準にして選択された、関連する文書によって定義される）再現率は、できるだけ高くすべきである。実際に、選択されない関連する文書、すなわち検出漏れ結果を制限することが望ましい（理想的には全ての関連する文書を選択する）。さらに簡潔に述べれば、ランキング技術は、何らかの関連する文書を選択できなければならない。たとえば、さらに詳細な検査をもたらすこともあり、もたらさないこともある選択された文書の関連性の迅速な検証に基づき、ランキング技術がブラウジングの状況に適用される場合（インターネットのページを検索する場合など）がこの事例である。実際この状況では、少なくとも何らかの選択された文書が適切であるならば、精度および再現率は、あまり重要でないこともある。

【0007】

ランキングの低品質は、コンピュータ・システムの性能に悪影響を及ぼし得る。詳細には、何らかの関連する文書を選択する低精度および再現率、または簡潔に述べれば、低確率であることで、本当に関連する文書を見つけるために、１つまたは複数の追加のクエリを送信することが必要となり得る。これらの追加のクエリは、（たとえば、追加のクエリを供給するための計算用電力、追加のクエリを受信し、それらの結果を返信するためのネットワーク・トラフィックなどの）関連するコンピュータ・システム資源の追加消費を伴う。

【発明の概要】

【発明が解決しようとする課題】

【0008】

文書の意味的豊富度に応じて文書をランキングする。

【課題を解決するための手段】

【0009】

本開示の簡易化された概要が、その基礎的な理解を提供するために、本明細書で提示される。ただし、本概要の唯一の目的は、本開示のいくつかの技術概念を、それに続くより詳細な説明への序文として、簡易化した形態で紹介することであり、その重要な構成要素の識別として、またはその範囲の記述として解釈されるべきではない。

【0010】

大まかに述べれば、本開示は、文書の意味的豊富度に応じて文書をランキングする概念に基づく。

【0011】

具体的には、ある態様は、コンピュータ・システム内で複数の文書をランキングするための方法を提供し、文書とそれらを選択するためのクエリとの間の対応する類似度指数が、文書の対応する意味的豊富度指標によって調整される。

【0012】

さらなる態様は、本方法を実装するための対応するコンピュータ・プログラムを提供する。

【0013】

さらなる態様は、本方法を実装するための対応するコンピュータ・プログラム製品を提供する。

【0014】

さらなる態様は、対応するシステムを提供する。

【0015】

より具体的には、本開示の１つまたは複数の態様は、独立請求項で提示され、その有益な特徴は、従属請求項で提示され、全ての請求項の表現を用いて引用により逐語的に本明細書に組み込まれる（特定の態様を参照して提示される有益な特徴は他の全ての態様に対しても必要に応じて適用され得る）。

【0016】

本開示の解決策、およびそのさらなる特徴および利点は、あくまで非制限的な表示によって提示され、添付図面と併せて読まれることになる、以下のその詳細な説明を参照することにより、最良に理解されよう（ここでは、簡単にするために、対応する要素は、同一または類似の参照を用いて示され、それらの説明は繰り返されず、各構成要素の名前は、値、内容物、および表示などの、その種類およびその属性の両方を示すために通常用いられる）。

【図面の簡単な説明】

【0017】

【図1】本開示の一実施形態による解決策の概略的原理を示す図である。

【図2】本開示の一実施形態による解決策の概略的原理を示す図である。

【図3】本開示の一実施形態による解決策の概略的原理を示す図である。

【図4】本開示の一実施形態による解決策の概略的原理を示す図である。

【図5】本開示の一実施形態による解決策の概略的原理を示す図である。

【図6】本開示の一実施形態による解決策が適用され得る、コンピュータ・システムの概略ブロック図である。

【図7】本開示の一実施形態による解決策を実装するために使用され得る主要ソフトウェア構成要素の役割を表すコラボレーション図である。

【図8】本開示の一実施形態による解決策の実装に関するアクティビティのフローを説明するアクティビティ図である。

【図9】本開示の一実施形態による解決策の実装に関するアクティビティのフローを説明するアクティビティ図である。

【発明を実施するための形態】

【0018】

特に図１～図５を参照すると、本開示の一実施形態による解決策の概略的原理が示されている。

【0019】

図１から始めると、文書のコーパスが、たとえばインターネットの（ウェブ）ページなどの、コンピュータ・システム内で利用可能であり、各文書は、たとえば対応するテキストの単語などの、複数の（文書）用語を含む。クエリは、コンピューティング・マシン内で、たとえば、所望の文書を選択するためのクライアント・コンピューティング・マシンまたは簡潔に表現すればクライアント１１０から、（ウェブ）サーバ・コンピューティング・マシンまたは簡潔に表現すればサーバ１０５内で受信される。クエリは、たとえばクライアント１１０のユーザによって特定のトピックに関する最も関連するページを検索するために、コーパスの文書の文書用語とマッチングされることになる、（所望の文書を特徴づけると考えられる）１つまたは複数の（クエリ）用語を含む。

【0020】

それに応答して、文書の関連性に応じて文書をランキングするために、以下の動作が実行される。これらの動作は、それらが全く人間に不向きであるため、コンピューティング・マシン（すなわち説明している実施例ではサーバ１０５）によって実行されることになる。実際、このことは、（通常、たとえばインターネット内の数十億オーダーの非常に多数の）コーパスの全ての文書を読むことを必要とするであろう。それゆえそれを実行する人間によって費やされる時間は、あまりにも莫大であり、それは絶対に現実的でないであろう。逆に述べれば、コーパスの全ての文書を読むことこそ、それらのランキングが避けようと目指すことである。実際のところ、この処理の目的こそ、実際に対象のものを比較的短時間で、手動で選択することが可能となるように、関連するであろう文書をコーパス内の多数の文書の中から自動的に識別することである。

【0021】

図２に移ると最初に、類似度指数がクエリと各文書との間で計算され、類似度指数は、文書がどれ程クエリに（意味的に）類似している（すなわちクエリに関連すると想定される）かを、すなわち、文書の意味がどれ程クエリと関係するか（たとえば１から０までで類似性の減少していく順序で数値的スコアによって定義される）を表す。類似度指数は、たとえばＶＳＭ技術を適用することによって、クエリ用語と文書の文書用語との間の比較により計算される。

【0022】

図３に移ると、本開示の一実施形態による解決策では、意味的豊富度指標が、文書毎に決定される。意味的豊富度指標は、文書が伝えると想定される情報の総量（すなわちその情報性）を表す。言い換えれば、意味的豊富度指標は、文書の認知的内容物を、すなわちそれがいかにその概念を表現するために有意義であるかを表す。たとえば、文書の意味的豊富度指標は、文書の希少な文書用語、すなわち希少用語（たとえば、コーパスの文書内に頻度しきい値より低い頻度で存在する文書用語によって定義される）により、または統語的複雑性（たとえば、文書内に存在する動詞句の数によって定義される）により、あるいはその両方によって計算される。

【0023】

図４に移ると、（クエリに関する）文書の類似度指数は、対応する意味的豊富度指標により調整される。たとえば、各類似度指数は、意味的豊富度指標が、高い場合または低い場合、それぞれ、類似度指数を増加させるまたは減少させるように、対応する意味的豊富度指標のピボット正規化関数が乗じられる。

【0024】

図５に移ると、複数の文書またはその少なくとも一部（たとえば、所定の数の最も関連する文書）が、対応する（調整済みの）類似度指数によりランキングされる。文書のランキングは、次にそれらの選択に使用され得る。たとえば、（文書の類似度指数の減少していく順序で並べられた）最も関連する文書のリストが、クエリに応答して、サーバ１０５からクライアント１１０へ返信される。このリストは次に、クライアント１１０のユーザが、実際に対象である文書を選択するために、上位からリストをブラウジングできるように、クライアント１１０上に表示される。文書は次に、それらを開くことによって検分され得る。説明している実施例では、これは、通信ネットワークを介したインターネットの対応するウェブ・サイトからページを取得し、それらを一時的にクライアント１１０のウェブ・ブラウザのキャッシュ・メモリ内に格納することを伴う。ページは次に、クライアント１１０の大容量メモリにダウンロードされ得、ことによるとそれらを読みやすくするためにプリントされ得る。あるいは、文書をランキングする同一の処理は、たとえば、ｅメール・サーバまたはｅメール・クライアントのアンチスパム・プログラム内で、アプリケーションをフィルタリングすることに適用されることもある。この場合には、（ｅメール・サーバまたはｅメール・クライアントによって）取得された全てのｅメールは、管理者によって事前定義されたまたはユーザの挙動（上記の対応するクエリ用語を含む）から自動的に学習されたアンチスパム・ルールに対して検証され、ｅメールの内容がこれらのアンチスパム・ルールのいずれかにマッチする場合、アンチスパム・プログラムは自動的にそれをスパムとして識別する。アンチスパム・プログラムは次に、（手動検証のために）ｅメールにスパムとしてフラグを立て、ｅメールを隔離または削除し得る。

【0025】

このようにして、文書のランキングは、認知的推論能力を対応する処理に注入するために、それらの意味的豊富度にも依存する。

【0026】

これが、ランキングの品質を著しく向上させる。たとえば、（文書のブラウジングのために）いくつかの関連する文書を選択するために、精度の向上（これにより、関連しない文書が選択されることを制限する）、再現率の向上（これにより、関連する文書が選択されないことを制限する）、または簡潔に述べれば確率の向上を可能にする。

【0027】

上述の結果は、（たとえば、ＶＳＭ技術の簡潔性を維持することによって）非常に簡潔な方法で達成され得る。

【0028】

詳細には、文書の意味的豊富度指標（クエリに依存せずに文書を特徴づける）は、オフラインで決定され得、それゆえ、提案する解決策の（クエリに応答する）リアルタイム性能に関しての影響は、実際上無視できる。

【0029】

上述の全ては、コンピュータ・システムの性能を著しく改善する。詳細には、何らかの関連する文書を選択する、結果的に向上された精度および再現率、または簡潔に述べれば、改善された確率は、本当に関連する文書を見つけるために、追加のクエリを送信する必要性を低減する。このことは、対応するコンピュータ・システム資源の消費の低減を伴い、たとえば、サーバの計算用電力が、（追加のクエリが用いられない、または少なくとも低減された追加のクエリが用いられることになるので）節約され、ネットワーク・トラフィックが、（サーバによって、追加のクエリが受信されない、または少なくとも低減された追加のクエリが受信され、それらの結果がクライアントに返信されるので）低減される。

【0030】

ここで、図６を参照すると、本開示の一実施形態による解決策が適用され得る、コンピュータ・システム２００の概略ブロック図が示されている。

【0031】

コンピュータ・システム２００は、通常インターネットに基づく、分散化されたアーキテクチャを有し、インターネットは、互いにグローバル電気通信ネットワーク２１０を介して接続される、数百万のサーバ２０５によって形成される。文書のランキング用に上述のサーバ１０５を含むサーバ２０５のサブセット（ワールド・ワイド・ウェブまたは簡潔にウェブとして知られている）が、各々が（ウェブ）ページの集合からなる対応するウェブ・サイトへのアクセスを可能にする。（ＨＴＭＬ言語にフォーマットされたハイパーテキスト文書によって定義される）各ページは、対応する（ＨＴＴＰプロトコルを介してそれに接続するための標準的シンタックスに従ってフォーマットされた固有の文字列から構成される）ＵＲＬによって識別される。クライアント１１０のユーザは、サーバ２０５によって提供されるサービスを利用するために、（アクセス・プロバイダとして動作する、図示されていないコンピューティング・マシンを介して）インターネットにアクセスする。具体的には、本開示に関連する限りでは、クライアント１１０のユーザは、所望のページを検索するためにサーバ１０５にアクセスし、次いで当該ページが対応するサーバ２０５からダウンロードされ得る。

【0032】

上述のシステム２００のコンピューティング・マシンの各々（すなわちサーバ２０５およびクライアント１１０）は、たとえば、１つまたは複数の水準を有するバス構造２１５を介して、いくつかの互いに接続されたユニットを含む。具体的には、１つまたは複数のマイクロプロセッサ（μＰ）２２０は、コンピューティング・マシン２０５、１１０の動作を制御し、不揮発性メモリ（ＲＯＭ）２２５は、コンピューティング・マシン２０５、１１０のブートストラップのための基本コードを格納し、揮発性メモリ（ＲＡＭ）２３０は、マイクロプロセッサ２２０によって、作業メモリとして使用される。コンピューティング・マシン２０５、１１０は、（たとえば、サーバ２０５が実装される、対応するサーバ・ファームのストレージ・デバイス、またはクライアント１１０用のハード・ディスクなどの）プログラムおよびデータを格納するための大容量メモリ２３５を装備する。さらに、コンピューティング・マシン２０５、１１０は、周辺機器または入出力（Ｉ／Ｏ）ユニット用の多数のコントローラ２４０を備える。たとえば、各サーバ２０５の周辺機器は、（グローバル電気通信）ネットワーク２１０へのアクセスを提供する、対応するサーバ・ファームのスイッチ／ルータ・サブシステムと通信するためのネットワーク・インターフェース・カード（ＮＩＣ）と、サーバ・ファームのコンソールによって実装される、（光ディスク、ＤＶＤ類などの）取り外し可能な記憶装置に、読み出し／書き込みを行うためのドライブとを備え、一方、各クライアント１１０の周辺機器は、モニタと、キーボードと、マウスと、（対応するアクセス・プロバイダを介して）ネットワーク２１０にアクセスするためのＷｉ－Ｆｉ型などの無線ＮＩＣ（ＷＮＩＣ）とを備える。

【0033】

図７を参照すると、本開示の一実施形態による解決策を実装するために使用され得る主要ソフトウェア構成要素の役割を表すコラボレーション図が示されている。

【0034】

全てのソフトウェア構成要素（プログラムおよびデータ）は、全体として、参照符号３００を用いて示されている。ソフトウェア構成要素３００は、典型的には大容量メモリ内に格納されており、プログラムが実行されるとき、オペレーティング・システムおよび他のアプリケーション・プログラム（図示せず）と共に、各コンピューティング・マシンの作業メモリ内に（少なくとも部分的に）ロードされる。プログラムは、たとえば取り外し可能な記憶装置から、またはネットワークから、最初に大容量メモリ内にインストールされる。詳細には、図は、ソフトウェア構成要素３００の静的構造と、一連の交換されるメッセージによるそれらの動的挙動との両方を表しており、メッセージの各々は、対応するコンピューティング・マシン上で指定された論理的機能を実行するための１つまたは複数の実行可能な命令（モジュール、セグメント、またはコードの一部分）に対応し得る、対応する作業（符号「Ａ」が先頭のシーケンス番号で示される）を表している。

【0035】

具体的には、サーバ１０５は、以下の構成要素を備える。コレクタ３０５は、対応するコーパス内に含まれることになる、任意の新しい文書を収集する。たとえば、コレクタ３０５は、インターネット内で付加または更新されたページの少なくとも一部分をダウンロードする、ウェブ・クローラ（またはスパイダ）である－作業「Ａ１．収集」。インデクサ３１０は、コーパスの文書にそれらのランキングのためのインデックスをつける。たとえば、インデクサ３１０は、「ＢａｇｏｆＷｏｒｄｓ（語の袋）」モデルを適用し、各文書が単にその用語によって表現され、用語の順序を考慮しない（しかし用語の多重性は考慮する）。この目的のために、インデクサ３１０は、語彙リポジトリ３１５に（読出し／書込みモードで）アクセスする。語彙リポジトリ３１５は、文書のコーパスに関連する情報を、逆インデックス・データ構造（内容物から位置にマッピングする）内に格納する。詳細には、語彙リポジトリ３１５は、文書のコーパスの（共通）語彙の全ての用語について、対応するエントリを備え、各々が、用語が出現する文書に関する情報を有するリストを格納する。新しい文書が加えられたか、または（古い）文書が削除されると、いつでも文書のコーパスは変更され、インデクサ３１０は、それに応じて語彙リポジトリ３１５を更新する。詳細には、新しい文書のために、インデクサ３１０は、（その長さに従って正規化された）文書ｄ内の用語ｔの反復に相当する、（新しい）文書ｄの各用語ｔの用語頻度ｔｆ_ｔ，ｄを決定し、
ｔｆ_ｔ，ｄ＝Ｔ_ｔ，ｄ／Ｔ_ｄ
となり、このとき、Ｔ_ｔ，ｄは、用語ｔが文書ｄ内に出現する回数であり、Ｔ_ｄは、文書ｄ内に存在する用語の総数である（すなわち０＜ｔｆ_ｔ，ｄ≦１）。用語頻度ｔｆ_ｔ，ｄは、文書ｄ内の用語ｔの反復と共に増加し、それゆえ用語頻度ｔｆ_ｔ，ｄは、文書ｄにおける用語ｔの重要性を表している。文書ｄ内の用語ｔ毎に、インデクサ３１０は、文書ｄの識別子（たとえばページのＵＲＬ）に関連付けて用語ｔの用語頻度ｔｆ_ｔ，ｄを、語彙リポジトリ３１５内の用語ｔのエントリ内に、必要であればエントリを作成して、保存する（逆に、古い文書では、インデクサ３１０は、対応する情報を語彙リポジトリ３１５から除去する）－作業「Ａ２．ｔｆ_ｄ計算」。いずれの場合でも（文書のコーパスが変化するときはいつも）インデクサ３１０は、変化によって影響を受けた文書のコーパスの各用語ｔの逆文書頻度ｉｄｆ_ｔを計算する（新しい文書または古い文書が、それを含んでいるからである）。逆文書頻度ｉｄｆ_ｔは、対数スケールにおける、用語ｔが出現する文書の割合の逆数に等しく、Ｄをコーパス内の文書数、ｄｆ_ｔを用語ｔが出現する文書の数とすると、
ｉｄｆ_ｔ＝ｌｏｇ_１０（Ｄ／ｄｆ_ｔ）
となる（ここでｉｄｆ_ｔ≧０）。逆文書頻度ｉｄｆ_ｔは、用語ｔが共通のとき、非常に低く、用語ｔがコーパスの全ての文書内に存在するとき、ｉｄｆ_ｔ＝０に低下し、一方、用語ｔが希少であるほど、その逆文書頻度ｉｄｆ_ｔは高くなり、それゆえ逆文書頻度ｉｄｆ_ｔは、概して用語ｔの特殊性を表している。インデクサ３１０は、そのように計算された各逆文書頻度ｉｄｆ_ｔを、語彙リポジトリ３１５内の対応する用語ｔのエントリ内に保存する－作業「Ａ３．ｉｄｆ計算」。

【0036】

本開示の実施形態による解決策では、計算器３２０および／または（統語的）パーサ３２５が、それらの類似度指数を調整するための、コーパスの文書の意味的豊富度指標の対応する成分を決定する。この目的のため、計算器３２０およびパーサ３２５は、関連情報を格納する文書豊富度リポジトリ３３０に（読出し／書込みモードで）アクセスする。

【0037】

詳細には、文書のコーパスが変化するときに、計算器３２０は、それらの（語彙リポジトリ３１５から抽出される）逆文書頻度ｉｄｆ_ｔの平均ａｖｇ（ｉｄｆ）に等しい、文書のコーパスの用語ｔの特殊性しきい値を計算する。Ｔを文書のコーパス内に存在する用語ｔの総数とすると、

【数1】

となる。平均ａｖｇ（ｉｄｆ）より大きい逆文書頻度ｉｄｆ_ｔを有する用語ｔは、より希少であり、よって特殊であり、一方、平均ａｖｇ（ｉｄｆ）より小さい逆文書頻度ｉｄｆ_ｔを有する用語ｔは、より普通であり、よって一般的である。計算器３２０は、逆文書頻度ｉｄｆ_ｔの平均ａｖｇ（ｉｄｆ）を文書豊富度リポジトリ３３０内に保存する－作業「Ａ４．ａｖｇ（ｉｄｆ）計算」。さらに、新しい文書毎に、計算器３２０は、その意味的豊富度指標の特殊性成分（特殊性指標と呼ばれる）を計算する。（新しい）文書ｄの特殊性指標ＳＲｓ_ｄは、（文書ｄの長さによって正規化された）希少であるその用語ｔの数に等しく、Ｎｓ_ｔ，ｄを文書ｄ内の希少な用語ｔの数、すなわち（可能な限り厳密に）その平均ａｖｇ（ｉｄｆ）より大きい逆文書頻度ｉｄｆ_ｔを有する用語ｔの数とし、Ｔ_ｄは、やはり文書ｄ内に存在する用語の総数であるとすると、
ＳＲｓ_ｄ＝Ｎｓ_ｔ，ｄ／Ｔ_ｄ
となる（ここで０≦ＳＲｓ_ｄ≦１）。文書ｄ内の希少な用語ｔの密度が高いほど、その特殊性指標ＳＲｓ_ｄはより大きくなり、それゆえその特殊性指標ＳＲｓ_ｄは、文書ｄの語彙的多様性を表している。計算器３２０は、文書ｄの特殊性指標ＳＲｓ_ｄを、（その識別子によって示された）豊富度文書リポジトリ３３０内の文書ｄ用のエントリ内に、必要であればそれを作成し、保存する（逆に、古い文書では、計算器３２０は、対応する情報を、意味的豊富度リポジトリ３３０から除去する）－作業「Ａ５．ＳＲｓ計算」。いずれの場合でも（文書のコーパスが変化するときはいつも）計算器３２０は、文書のコーパスの特殊性指標ＳＲｓ_ｄの平均ａｖｇ（ＳＲｓ）を計算し、Ｄをやはりコーパス内の文書の数とすると、

【数2】

となる。計算器３２０は、特殊性指標ＳＲｓ_ｄの平均ａｖｇ（ＳＲｓ）を文書豊富度リポジトリ３３０内に保存する－作業「Ａ６．ａｖｇ（ＳＲｓ）計算」。

【0038】

加えてまたは代替として、新しい文書毎にパーサ３２５は、新しい文書をパースして句（すなわち、対応する言語のシンタックスにより、文の完全な文法上の単位を定義する、１つまたは複数の単語のグループ）を識別する。句は、その動詞句（すなわち、少なくとも１つの動詞およびその従属句からなる任意の句）を含む。たとえば、この結果は、発言の各部分に関する情報がタグの形態で付加される、自然言語処理（ＮＬＰ）品詞（ＰＯＳ）タグ付けを適用することによって達成される。パーサ３２５は次に、新しい文書の意味的豊富度指標の複雑性成分（複雑性指標と呼ばれる）を計算する。（新しい）文書ｄの複雑性指標ＳＲｃ_ｄは、（その長さにより正規化された）文書ｄの動詞句の数に等しく、Ｎ_ＶＰ，ｄを文書ｄ内の動詞句の数、ＶＰ_ｄを文書ｄ内の（固有の）句の数とすると、
ＳＲｃ_ｄ＝Ｎ_ＶＰ，ｄ／ＶＰ_ｄ
となる（ここで０≦ＳＲｓ_ｄ≦１）。文書ｄ内の動詞句の数が多いほど、その複雑性指標ＳＲｃ_ｄは大きく、それゆえ複雑性指標ＳＲｃ_ｄは、その表現度を表す文書ｄの統語的複雑性を定量化する。パーサ３２５は、文書ｄの複雑性指標ＳＲｃ_ｄを、豊富度文書リポジトリ３３０内の対応するエントリ内に、保存する（逆に、古い文書では、パーサ３２５は、対応する情報を、意味的豊富度リポジトリ３３０から除去する）－作業「Ａ７．ＳＲｃ計算」。いずれの場合でも（文書のコーパスが変化するときはいつも）パーサ３２５は、文書のコーパスの複雑性指標ＳＲｃ_ｄの平均ａｖｇ（ＳＲｃ）を計算し、Ｄをやはりコーパス内の文書の数とすると、

【数3】

となる。パーサ３２５は、複雑性指標ＳＲｃ_ｄの平均ａｖｇ（ＳＲｃ）を文書豊富度リポジトリ３３０内に保存する－作業「Ａ８．ａｖｇ（ＳＲｃ）計算」。

【0039】

通常のように、ウェブ・サーバ３３５は、（図中では１台のみ示されている）クライアント１２０によって、サーバ１０５に、（インターネットをサーフィンするために通常用いられる）ブラウザ３４０を用いてアクセスしながら、送信される、任意の要求を処理する。本開示に関連する限りでは、クライアント１２０のユーザは、文書を検索するためのクエリをタイプし、次に送信する。各クエリは、所望される文書の内容を識別するために適合された、ユーザが考える（たとえばキーワードなどの）１つまたは複数の用語によって、定められる。ブラウザ３４０は、クエリを、結果としてそれを（ウェブ）検索エンジン３４５に渡すことになる、ウェブ・サーバ３３５に送信する－作業「Ａ９．クエリ」。

【0040】

検索エンジン３４５は、ＶＳＭ技術によってコーパスの各文書とクエリとの間の類似度指数を計算する比較器３５０を利用する。この目的のために、比較器３５０は、同様にその長さにより正規化されたクエリｑ内の用語ｔの反復に等しい、クエリｑの各用語ｔの用語頻度ｔｆ_ｔ，ｑを決定する。Ｔ_ｔ，ｑを用語ｔがクエリｑ内に出現する回数とし、Ｔ_ｑをクエリｑ内に存在する用語の総数とすると、
ｔｆ_ｔ，ｑ＝Ｔ_ｔ，ｑ／Ｔ_ｑ
となる（ここで０＜ｔｆ_ｔ，ｑ≦１）－作業「Ａ１０．ｔｆ_ｑ計算」。比較器３５０は次に、文書ｄ内の用語ｔの用語頻度ｔｆ_ｔ，ｄに（語彙リポジトリ３１５から抽出される）文書のコーパス内の用語ｔの逆文書頻度ｉｄｆ_ｔを乗じた積と等しい、文書ｄの各用語ｔのｔｆ－ｉｄｆ重みｗ_ｔ，ｄを計算すると、
ｗ_ｔ，ｄ＝ｔｆ_ｔ，ｄ・ｉｄｆ_ｔ
となる。ｔｆ－ｉｄｆ重みｗ_ｔ，ｄは、文書ｄのみによって決まる局所変数（用語頻度ｔｆ_ｔ，ｄ）と、文書の全コーパスによって決まるグローバル変数（逆文書頻度ｉｄｆ_ｔ）との組合せによる、文書ｄ内の用語ｔの実際の重要性を表し、詳細には、ｔｆ－ｉｄｆ重みｗ_ｔ，ｄは、文書ｄ内の用語ｔの反復により（比例的に）、または文書のコーパス内で用語ｔがいかに希少かにより（その効果を放出するように対数的に）、あるいはその両方により増加する。同様に、比較器３５０は、（クエリｑ内の用語ｔの用語頻度ｔｆ_ｔ，ｑに、文書のコーパス内の用語ｔの逆文書頻度ｉｄｆ_ｔを乗じた積と等しい）クエリｑの各用語ｔのｔｆ－ｉｄｆ重みｗ_ｔ，ｑを計算すると、
ｗ_ｔ，ｑ＝ｔｆ_ｔ，ｑ・ｉｄｆ_ｔ
となる。文書ｄおよびクエリｑはこのとき、（文書のコーパス内に存在する用語ｔの総数Ｔに等しい次元数を有する）Ｔ次元ベクトル空間内で表現される。用語ｔは、ベクトル空間の軸であり、一方、文書ｄおよびクエリｑは、文書ベクトル

【数4】

およびクエリ・ベクトル

【数5】

をそれぞれ定義し、それらは、対応するｔｆ－ｉｄｆ重みｗ_ｔ，ｄおよびｗ_ｔ，ｑによって示される点によって、それぞれ識別される（用語ｔが、文書ｄ内またはクエリｑ内に存在しない場合は０に設定される）。この時点で、比較器３５０は、クエリｑと文書ｄとの間の類似度指数を、（共通であるそれらの用語ｔにより決まる）それらのベクトルの角度差に応じて計算する。詳細には、類似度指数ＳＩＭ（ｑ，ｄ）は、文書ベクトル

【数6】

とクエリ・ベクトル

【数7】

との間の角度Θの余弦に設定され、ベクトル

【数8】

と

【数9】

との長さで正規化されたスカラ積に等しく、

【数10】

となる。類似度指数ＳＩＭ（ｑ，ｄ）は、角度Θと共に、ベクトル

【数11】

およびベクトル

【数12】

が整列している（クエリｑの全ての用語ｔが、文書ｄ内に存在しているので、文書ｄが、クエリｑに非常に類似していることを意味する）ときの１から、ベクトル

【数13】

およびベクトル

【数14】

が直交する（クエリｑの用語ｔが、文書ｄ内に存在しないので、文書ｄが、クエリｑと非常に異なることを意味する）ときの０まで、単調に減少する－作業「Ａ１１．ＳＩＭ計算」。

【0041】

本開示の実施形態による解決策では、アジャスタ３５５は、コーパスの文書の類似度指数を、それらの意味的豊富度により調整する。詳細には、アジャスタ３５５は、その特殊性指標ＳＲｓ_ｄ（文書豊富度リポジトリ３３０から抽出される）のピボット正規化関数に等しい、コーパスの各文書ｄの特殊性（を調整する）因子ＡＤＪｓ_ｄを計算すると、
ＡＤＪｓ_ｄ＝１－ｋ＋ｋ・ＳＲｓ_ｄ／ａｖｇ（ＳＲｓ）
となり、ここでｋは、調整変数（０＜ｋ≦１）である。特殊性因子ＡＤＪｓ_ｄは、文書ｄの特殊性指標ＳＲｓ_ｄがその平均ａｖｇ（ＳＲｓ）に等しいとき、１に等しく、一方、文書ｄの特殊性指標ＳＲｓ_ｄがその平均ａｖｇ（ＳＲｓ）より大きいとき、１より大きくなり、文書ｄの特殊性指標ＳＲｓ_ｄがその平均ａｖｇ（ＳＲｓ）より低いとき、１より低くなる。調整変数ｋは、（ｋ＝０のときの０からｋ＝１のときの最大まで）特殊性因子ＡＤＪｓ_ｄに対する特殊性指標ＳＲｓ_ｄの効果を強調する－作業「Ａ１２．ＡＤＪｓ計算」。

【0042】

加えて、または代替として、同様に、アジャスタ３５５は、その複雑性指標ＳＲｃ_ｄ（文書豊富度リポジトリ３３０から抽出される）のピボット正規化関数に等しい、コーパスの各文書ｄの複雑性（を調整する）因子ＡＤＪｃ_ｄを計算すると、ｋ’を上述と同様の、または上述とは異なる調整変数とし、
ＡＤＪｃ_ｄ＝１－ｋ’＋ｋ’・ＳＲｃ_ｄ／ａｖｇ（ＳＲｃ）
となる（０＜ｋ’≦１である）。この場合も同様に、複雑性因子ＡＤＪｃ_ｄは、文書ｄの複雑性指標ＳＲｃ_ｄがその平均ａｖｇ（ＳＲｃ）に等しいとき、１に等しく、一方、文書ｄの複雑性指標ＳＲｃ_ｄがその平均ａｖｇ（ＳＲｃ）より大きいとき、１より大きくなり、文書ｄの複雑性指標ＳＲｃ_ｄがその平均ａｖｇ（ＳＲｃ）より低いとき、１より低くなる。調整変数ｋ’はやはり、（ｋ’＝０のときの０からｋ’＝１のときの最大まで）複雑性因子ＡＤＪｃ_ｄに対する複雑性指標ＳＲｃ_ｄの効果を強調する－作業「Ａ１３．ＡＤＪｃ計算」。

【0043】

この時点で、アジャスタ３５５は、各文書ｄの類似度指数ＳＩＭ（ｑ，ｄ）を、（アジャスタ３５５の構成により）それに特殊性因子ＡＤＪｓ_ｄまたは複雑性因子ＡＤＪｃ_ｄ、あるいはそれらの両方を乗じて、（事前に比較器３５０によって計算された）クエリｑに関して調整して、
ＳＩＭ（ｑ，ｄ）＝ＡＤＪｓ_ｄ・ＳＩＭ（ｑ，ｄ）、
ＳＩＭ（ｑ，ｄ）＝ＡＤＪｃ_ｄ・ＳＩＭ（ｑ，ｄ）、
または、
ＳＩＭ（ｑ，ｄ）＝ＡＤＪｓ_ｄ・ＡＤＪｃ_ｄ・ＳＩＭ（ｑ，ｄ）
となる。このようにして、（語彙的により多様であることで）１より大きいその特殊性因子ＡＤＪｓ_ｄを有するまたは（統語的により複雑であることで）１より大きいその複雑性因子ＡＤＪｃ_ｄを有する、あるいはその両方を有する、各文書ｄの類似度指数ＳＩＭ（ｑ，ｄ）は、増加し、一方、（語彙的により多様でないことで）１より小さいその特殊性因子ＡＤＪｓ_ｄを有するまたは（統語的により複雑でないことで）１より小さいその複雑性因子ＡＤＪｃ_ｄを有する、あるいはその両方を有する、各文書ｄの類似度指数ＳＩＭ（ｑ，ｄ）は、減少する（その特殊性因子ＡＤＪｓ_ｄおよび複雑性因子ＡＤＪｃ_ｄが１に等しい各文書ｄの類似度指数ＳＩＭ（ｑ，ｄ）は、変化しないままである）。上述した類似度指数ＳＩＭ（ｑ，ｄ）の異なる調整の選択は、簡潔性と精度との相反する要件間の（いずれの場合も、特に複雑性因子ＡＤＪｃ_ｄの決定のために、該当する処理は、オフラインで実行されるので、実際上問題があってはならない、計算用資源に関する追加の要件と共に）トレードオフとなる－作業「Ａ１４．ＳＩＭ調整」。

【0044】

この時点で、通常のように検索エンジン３４５は、コーパスの文書を、それらの（ことによると更新された）類似度指数ＳＩＭ（ｑ，ｄ）が減少していく順序でランキングする。検索エンジン３４５は次に、クエリｑに最も適切であろう、より大きい類似度指数ＳＩＭ（ｑ，ｄ）（たとえば、先頭の１０～２０）を有する文書を選択する－作業「Ａ１５．ランキング」。検索エンジン３４５はそれから、そのように選択された（最も関連する）文書のリストを、クライアント１２０にクエリｑへの回答として、（ウェブ・サーバ３３５を通して）返す。クライアント１２０のブラウザ３４０は、ユーザが（もしあるなら）実際に目的の文書を選択できるように、このリストを受信し、それをそのモニタに表示する－作業「Ａ１６．返送」。

【0045】

ここで図８～図９を参照すると、本開示の一実施形態による解決策の実装に関するアクティビティのフローを説明するアクティビティ図が示されている。

【0046】

詳細には、図は、方法４００を用いて文書をランキングするために使用され得る、例示的な処理を示す。この点で、各ブロックは、指定された論理的機能を、サーバ上で実行するための、１つまたは複数の実行可能な命令に対応し得る。

【0047】

ループは、文書のコーパスにインデックスをつけるために継続的に実行され、ブロックＳ４０２において開始されると、コレクタが、コーパス内に含められることになる任意の新しい文書を収集する（たとえば、先行のループの繰り返しに関して、インターネット内で付加または更新済みのページの少なくとも一部をダウンロードすることによって）。内側のループが次に、インデクサによって（付加または更新される）任意の新しい文書、または（削除される）任意の古い文書を処理するために、実行される。この目的のために、インデクサはブロックＳ４０４で、新しい／古い文書がさらにそれによって処理されることになるか否かを確認する。もしそうである場合、アクティビティのフローはブロックＳ４０６で、処理されることになる文書の種類により、分岐する。文書が新しい場合（すなわち、それが付加または更新済みである）、インデクサはブロックＳ４０８で、新しい文書の各用語ｔの用語頻度ｔｆ_ｔ，ｄを決定し、それを、新しい文書ｄの識別子に関連して、（必要であればそれを作成して）語彙リポジトリ内の用語ｔのエントリ内に保存する。逆に、文書が古い場合（すなわち、それが削除済みである）、インデクサはブロックＳ４１０で、語彙リポジトリから対応する情報を除去する。どちらの場合も、処理は次にブロックＳ４０４に戻り、さらに処理されることになる新しい／古い文書がなくなり次第（文書のコーパスが、ループの先行の繰り返しに関して、変化しなくなったら速やかに）、処理はブロックＳ４１２内に降りる。この時点で、インデクサは、その変化によって影響を受けた文書のコーパスの各用語ｔがもしあれば（いずれかの新しい／古い文書がそれを含んでいることによる）、各用語ｔの逆文書頻度ｉｄｆ_ｔを計算し、そのように計算された各逆文書頻度ｉｄｆ_ｔを、語彙リポジトリ内の対応する用語ｔのエントリ内に保存する。

【0048】

本開示の実施形態による解決策では、アクティビティのフローはブロックＳ４１４で、検索エンジンの構成により、分岐する。検索エンジンが、文書の意味的豊富度指標を、それらの特殊性指標により定義するように構成された場合、計算器はブロックＳ４１６で、文書のコーパスの用語ｔの逆文書頻度ｉｄｆ_ｔの平均ａｖｇ（ｉｄｆ）を計算し、それを文書豊富度リポジトリ内に保存する。

【0049】

処理は次に、ブロックＳ４１６から、または検索エンジンが文書の意味的豊富度指標をそれらの特殊性指標により定義するように構成されない場合は直接ブロックＳ４１４から、ブロックＳ４１８へと続く。さらなる内側のループがここで、コーパスの文書の意味的豊富度指標の対応する成分を決定するために、実行される。この目的のために、この時点で計算器は、新しい／古い文書が、ループの先行の繰り返しに関して、それによってさらに処理されることになるか否かを確認する。もしそうである場合、アクティビティのフローはブロックＳ４２０で、検索エンジンの構成により、分岐する。検索エンジンが、文書の意味的豊富度指標をそれらの特殊性指標により定義するように構成されている場合、アクティビティのフローはブロックＳ４２２で、処理されることになる文書の種類により、再び分岐する。文書が新しい場合、計算器はＳ４２４で、新しい文書ｄの特殊性指標ＳＲｓ_ｄを計算し、それを豊富度文書リポジトリ内の文書ｄ用エントリ内に（必要であればそれを作成し）保存する。逆に、文書が古い場合、計算器はブロックＳ４２６で、意味的豊富度リポジトリから対応する情報を除去する。アクティビティのフローはブロックＳ４２８で、ブロックＳ４２４から、ブロックＳ４２６から、または、検索エンジンが文書の意味的豊富度指標をそれらの特殊性指標により定義するように構成されない場合は直接ブロックＳ４２０から、再び合流する。この時点で、アクティビティのフローは、検索エンジンの構成により、さらに分岐する。検索エンジンが、文書の意味的豊富度指標をそれらの複雑性指標により定義するように構成されている場合、アクティビティのフローはブロックＳ４３０で、処理されることになる文書の種類により、再び分岐する。文書が新しい場合、パーサはブロックＳ４３２で、新しい文書ｄの複雑性指標ＳＲｃ_ｄを（その動詞句を含むその句を識別するために、新しい文書をパースすることによって）計算し、それを豊富度文書リポジトリ内の対応するエントリ内に保存する。逆に、文書が古い場合、パーサはブロックＳ４３４で、意味的豊富度リポジトリから対応する情報を除去する。

【0050】

処理は次に、ブロックＳ４３２から、ブロックＳ４３４から、または検索エンジンが文書の意味的豊富度指標をそれらの複雑性指標により定義するように構成されない場合は直接ブロックＳ４２８から、ブロックＳ４１８へと戻り、さらに処理されることになる新しい／古い文書がなくなり次第（文書のコーパスが、ループの先行の繰り返しに関して、変化しなくなったら速やかに）、処理はブロックＳ４３６内に降りる。この時点で、アクティビティのフローは、検索エンジンの構成により、さらに分岐する。検索エンジンが、文書の意味的豊富度指標をそれらの特殊性指標により定義するように構成されている場合、計算器はブロックＳ４３８で、文書のコーパスの特殊性指標ＳＲｓ_ｄの平均ａｖｇ（ＳＲｓ）を計算し、それを文書豊富度リポジトリ内に保存する。処理は次に、ブロックＳ４３８から、または検索エンジンが文書の意味的豊富度指標をそれらの特殊性指標により定義するように構成されない場合は直接ブロックＳ４３６から、ブロックＳ４４０へと続く。この時点で、アクティビティのフローは、検索エンジンの構成により、さらに分岐する。検索エンジンが、文書の意味的豊富度指標を、それらの複雑性指標により、定義するように構成された場合、計算器はブロックＳ４４２で、文書のコーパスの複雑性指標ＳＲｃ_ｄの平均ａｖｇ（ＳＲｃ）を計算し、それを文書豊富度リポジトリ内に保存する。

【0051】

処理は次に、ブロックＳ４４２から、または検索エンジンが文書の意味的豊富度指標をそれらの複雑性指標により定義するように構成されていない場合は、同一の動作を継続的に繰り返すために直接ブロックＳ４４０から、ブロックＳ４０２へと戻る。

【0052】

完全に別個の方法で、処理は、検索エンジンが任意のクライアントのブラウザによってそれに送信されるクエリを受信するときはいつも、ブロックＳ４４４からブロックＳ４４６へ渡される。それに応答して、比較器は、クエリｑの各用語ｔの用語頻度ｔｆ_ｔ，ｑを決定する。比較器はブロックＳ４４８で、クエリｑの各用語ｔのｔｆ－ｉｄｆ重みｗ_ｔ，ｑを計算する。

【0053】

ループは次に、ＶＳＭ技術によってコーパスの各文書とクエリとの間の類似度指数を計算するために実行される。ループは、ブロックＳ４５０で開始され、コーパスの（現在の）文書が、考慮される（先頭のものから任意の恣意的な順序で開始する）。比較器はブロックＳ４５２で、文書ｄの各用語ｔのｔｆ－ｉｄｆ重みｗ_ｔ，ｄを計算する。比較器はブロックＳ４５４で次に、クエリｑと文書ｄとの間の類似度指数ＳＩＭ（ｑ，ｄ）を、（共通であるそれらの用語ｔにより決まる、それらのベクトルの角度差に応じて）計算する。

【0054】

本開示の実施形態による解決策では、アクティビティのフローはブロックＳ４５６で、検索エンジンの構成により、分岐する。検索エンジンが、文書の意味的豊富度指標をそれらの特殊性指標により定義するように構成された場合、アジャスタはブロックＳ４５８で、文書ｄの特殊性因子ＡＤＪｓ_ｄ（文書豊富度リポジトリから抽出されるその特殊性指標ＳＲｓ_ｄのピボット正規化関数と等しい）を計算する。アジャスタはブロックＳ４６０で、クエリｑに関する文書ｄの類似度指数ＳＩＭ（ｑ，ｄ）に、特殊性因子ＡＤＪｓ_ｄを乗じる。処理は次に、ブロックＳ４６０から、または検索エンジンが文書の意味的豊富度指標をそれらの特殊性指標により定義するように構成されない場合は、直接ブロックＳ４５６から、ブロックＳ４６２へと続く。この時点で、アクティビティのフローは、検索エンジンの構成により、さらに分岐する。検索エンジンが、文書の意味的豊富度指標をそれらの複雑性指標により定義するように構成されている場合、アジャスタはブロックＳ４６４で、文書ｄの複雑性因子ＡＤＪｃ_ｄ（文書豊富度リポジトリから抽出されるその複雑性指標ＳＲｃ_ｄのピボット正規化関数と等しい）を計算する。アジャスタはブロックＳ４６６で、（ことによると既に特殊性因子ＡＤＪｃ_ｄが乗じられている）クエリｑに関する文書ｄの類似度指数ＳＩＭ（ｑ，ｄ）に、複雑性因子ＡＤＪｃ_ｄを乗じる。処理は次に、ブロックＳ４６６から、または検索エンジンが文書の意味的豊富度指標を、それらの複雑性指標により定義するように構成されない場合は、直接ブロックＳ４６２から、ブロックＳ４６８へと続く。この時点で、テストが、コーパスの最後の文書が処理されたか否かを確認するために、実施される。もしそうでない場合、アクティビティのフローは、コーパスの次の文書上で同一の動作を繰り返すために、ブロックＳ４５０に戻る。逆の場合（コーパスの全ての文書が処理されたとき）、ブロックＳ４７０内に降りることによって、ループから抜ける。

【0055】

この時点で、通常のように検索エンジンは、コーパスの文書を、それらの（ことによると更新された）類似度指数ＳＩＭ（ｑ，ｄ）が減少していく順序でランキングし、より高いその値を有する文書を選択する。検索エンジンはブロックＳ４７２で次に、そのように選択された（最も関連する）文書のリストを、クライアントにクエリｑへの回答として、（ウェブ・サーバを通して）返す（ユーザが、もしあるなら、実際に目的の文書を選択できるように、このリストを受信してそれをそのモニタに表示するクライアントのブラウザを用いて）。処理は次に、さらなるクエリの送信を待つ、ブロックＳ４４４に戻る。

【0056】

本来、ローカルの特定の要件を満足するために、当業者ならば、本開示への多くの論理的または物理的あるいはその両方の変形および変更を適用するであろう。より具体的には、本開示は、その１つまたは複数の実施形態を用いて、ある程度の特異性と共に説明されたが、形態および詳細における多様な省略、置換、および変更が、他の実施形態と同様に、可能であることが理解されるべきである。特に、本開示の異なる実施形態はいっそう、そのより完全な理解を提供するために、上述の説明内で表明された、（数値的値などの）特定の詳細なしで、実施され得る。逆に、周知の特徴は、不必要な詳細により、説明を不明瞭にしないように、省略または簡易化された可能性がある。また、本開示の任意の実施形態に関連して説明される、特定の構成要素または方法のステップ、あるいはその両方は、他の任意の実施形態内に、全体の設計選択の事柄として、組み込まれ得ることが、明確に意図されている。いずれの場合でも、各数値的値は、（既にそうなっていない限り）およそという用語によって修飾されたものとして、読まれるべきであり、数値的値の各範囲は、（その終点を含む）範囲内の連続体に沿った任意の可能な数字を明確に指定することとして、意図されるべきである。また、順序を示すまたは他の修飾語句は単に、ラベルとして同一の名前を有する要素を区別するために使用され、しかしそれら自体で、何ら優先度、優先順位、または順序を暗示しない。用語、含む、備える、有する、収容する、および包含する（およびその任意の変化形）は、開いた非網羅的な意味をもつ（すなわち、記載された項目に限定されない）ことを意図されるべきであり、用語、に基づいて、に依存して、に従って、の機能（およびその任意の変化形）は、非排他的な関係（すなわち包含される可能性のあるさらなる変項を有する）として意図されるべきであり、用語ａ／ａｎは、１つまたは複数の項目（明確にそうでないと示されない限り）として意図されるべきであり、用語、ための手段（または任意のミーンズ・プラス・ファンクション形式）は、関連する機能を実行するために、適合または構成された任意の構造として意図されるべきである。

【0057】

たとえば、一実施形態は、コンピュータ・システムにおける複数の文書をランキングするための方法を提供する。ただし、文書は、任意の数および任意の種類（たとえば、文字、画像、音声、マップ）で存在し得る。さらに、文書は、任意のコンピュータ・システムで、任意の方法で利用可能（たとえば、ローカルに格納された任意のソースからダウンロード可能）であり得る（以下を参照のこと）。

【0058】

ある実施形態では、文書の各々が、複数の文書用語を含む。ただし、用語は、任意の数および任意の種類（たとえば、語、句、メタデータ）で存在し得る。さらに、考慮される用語は、文書の全ての用語、または（たとえば、対応する言語の最も一般的な語からなるａなどのストップワードをフィルタリングで除外することによる）その一部のみである。

【0059】

ある実施形態では、方法は、以下のコンピューティング・マシン制御下のステップを含む。ただし、これらのステップは、任意のコンピューティング・マシンによって実行され得る（以下を参照のこと）。

【0060】

ある実施形態では、方法は、クエリを受信することを含む。ただし、クエリは、任意の方法で（たとえば、手動入力、自動作成、事前定義、ローカルでも、またはリモートでも）受信され得る。

【0061】

ある実施形態では、クエリは、１つまたは複数のクエリ用語を含む。ただし、クエリ用語は、任意の数および任意の種類（文書用語に関して同一または異なる）で存在し得る。さらに、クエリは、任意の構造（たとえば、キーワードの簡潔なリスト、任意の論理演算子と組み合わされたキーワード）を有し得る。

【0062】

ある実施形態では、クエリ用語は、文書選択用である。ただし、クエリは、任意の目的（たとえば、インターネットまたは図書館の本内のページの検索などの任意の情報検索用途、アンチスパム・プログラムなどの任意のフィルタリング用途）のためのものであり得る。

【0063】

ある実施形態では、方法は、クエリと文書との間の対応する類似度指数を計算することを含む。ただし、類似度指数は、（たとえば、任意の連続的または離散的値を有する）任意の種類のものであり得る。

【0064】

ある実施形態では、類似度指数の各々は、クエリ用語と対応する文書の文書用語との間の比較により計算される。ただし、類似度指数は、（たとえば、ＶＳＭ、集合論モデル、確率モデルなどの任意の代数的モデルによる）任意の方法で計算され得る。

【0065】

ある実施形態では、方法は、文書の対応する意味的豊富度指標を決定することを含む。ただし、意味的豊富度指標は、任意の種類（たとえば、量的測定基準、質的レベル）のものであってもよく、任意の方法（たとえば、語彙的多様性、統語的複雑性、特徴数、意味的近傍密度、意味的多様性、具体性、感情価、イメージアビリティ、またはその任意の組合せ）で決定されてもよい。

【0066】

ある実施形態では、方法は、対応する意味的豊富度指標による類似度指数を調整することを含む。ただし、類似度指数は、任意の方法（たとえば、乗算機能または加算機能で、線形にまたは任意の非線形の方法で、連続的または離散的に）で調整され得る。

【0067】

ある実施形態では、方法は、文書の少なくとも一部分を対応する調整済みの類似度指数により、ランキングすることを含む。ただし、文書は、任意の数および任意の方法（たとえば、最も関連する文書のリストまたはそれらを直接返す、単一の文書のみを選択する、将来の利用のために全ての文書を単純に順序付ける）でランキングされ得る。

【0068】

ある実施形態では、対応する意味的豊富度指標を決定する当該ステップは、意味的豊富度指標の各々を、対応する文書の任意の希少な用語により、計算することを含む。ただし、意味的豊富度指標は、希少な用語による任意の方法（たとえば、それらの数の任意の線形または非線形関数に基づく、文書のコーパスに特化して、または対応する言語に一般に、関連するそれらの特殊性の任意の測定など）で計算され得る。

【0069】

ある実施形態では、希少な用語は、頻度しきい値より低い頻度で文書内に存在する、文書用語からなる。ただし、頻度しきい値は、任意の方法（たとえば、対応する言語により予め定義された値に設定された、文書用語の分布の任意の統計的変数により）で定義され得る。

【0070】

ある実施形態では、意味的豊富度指標の各々を、対応する文書の任意の希少な用語により計算する当該ステップは、頻度しきい値を、文書内の文書用語の分布の統計的分析により計算することを含む。ただし、頻度しきい値は、（たとえば、任意の数および種類の、任意の方法で組み合わされる統計的変数による）任意の方法で計算され得る。

【0071】

ある実施形態では、意味的豊富度指標の各々を、対応する文書の任意の希少な用語により計算する当該ステップは、文書用語の対応する逆頻度指標を計算することを含む。ただし、各用語の逆頻度指標は、任意の方法（たとえば、Ｄ／ｄｆ_ｔ、Ｄ／（１＋ｄｆ_ｔ）、

【数15】

、（Ｄ－ｄｆ_ｔ）／ｄｆ_ｔに線形または非線形に基づいて）で計算され得る。

【0072】

ある実施形態では、逆頻度指標の各々は、文書の、対応する文書用語が存在する割合の逆数を示す。ただし、逆頻度指標は、任意の方法（たとえば、対数関数、他の任意の非線形関数、または線形関数でも）で定義され得る。

【0073】

ある実施形態では、意味的豊富度指標の各々を、対応する文書の任意の希少な用語により計算する当該ステップは、特殊性しきい値を、逆頻度指標の中心傾向変数に基づいて、計算することを含む。ただし、中心傾向変数は、任意の種類（たとえば、算術的、幾何学的、または調和的なもの、中央値、最頻値）のものであり得る。さらに、特殊性しきい値は、任意の方法（たとえば、特殊性しきい値を、中心傾向変数またはその割合に等しく設定すること）で、中心傾向変数に基づき得る。

【0074】

ある実施形態では、意味的豊富度指標の各々を、対応する文書の任意の希少な用語により計算する当該ステップは、文書内に存在する文書用語の特殊性しきい値よりも大きい逆頻度指標により、意味的豊富度指標の各々を計算することを含む。ただし、各意味的豊富度指標は、任意の方法で（たとえば、対応する逆頻度指標の合計、積、または他の任意の関数により）計算され得る。

【0075】

ある実施形態では、対応する逆頻度指標を計算する当該ステップは、対数変換を逆頻度指標に適用することを含む。ただし、対数変換は、任意の種類のもの（たとえば、任意の底を有する対数に基づく）であり得る。

【0076】

ある実施形態では、対応する意味的豊富度指標を決定する当該ステップは、意味的豊富度指標の各々を、対応する文書の統語的複雑性により、計算することを含む。ただし、意味的豊富度指標は、統語的複雑性による任意の方法（たとえば、その任意の定量化の任意の線形または非線形関数に基づいて、複雑統語的単位、動詞、前置詞、副詞、形容詞、またはその任意の組合せに基づくなど）で計算され得る。

【0077】

ある実施形態では、意味的豊富度指標の各々を、対応する文書の統語的複雑性により計算する当該ステップは、文書の各々の統語的複雑性を、文書内に存在する任意の複雑統語的単位により、定量化することを含む。ただし、複雑統語的単位は、統語的複雑性を定量化するために、任意の方法（たとえば、それらの数に応じて、重み関数を、それらの長さなどの複雑統語的単位の任意の特性に基づいて適用する）で使用され得る。

【0078】

ある実施形態では、複雑統語的単位は、複雑性しきい値を超える複雑性を有する、任意の統語的単位からなる。ただし、複雑統語的単位は、任意の方法（たとえば、あらゆる動詞句、あらゆる前置詞句、所定の長さを超える動詞／前置詞句、またはその任意の組合せ）で定義され得る。

【0079】

ある実施形態では、文書の各々の統語的複雑性を定量化する当該ステップは、対応する複雑統語的単位を定義する文書の各々内に存在する、任意の動詞句を識別することを含む。ただし、各文書の動詞句は、任意の方法で（たとえば、マルコフモデルまたは動的計画法を用いるなど、任意の方法で文書をタグ付けすることによって、あるいはより一般的に、任意の注釈、抽象化、またはその分析あるいはその組合せによって）識別され得る。

【0080】

ある実施形態では、方法は、対応する文書内に存在する希少な用語に各々応じて、意味的豊富度指標の対応する特殊性成分を計算することを含む。ただし、各文書の特殊性成分は、任意の方法でその希少な用語により、計算され得る（上記参照のこと）。

【0081】

ある実施形態では、方法は、対応する文書の統語的複雑性に各々応じて、意味的豊富度指標の対応する複雑性成分を計算することを含む。ただし、各文書の複雑性成分は、任意の方法でその統語的複雑性により、計算され得る（上記参照のこと）。

【0082】

ある実施形態では、方法は、類似度指数の各々を、対応する特殊性成分と複雑性成分との組合せにより、調整することを含む。ただし、各類似度指数は、対応する特殊性成分と複雑性成分との任意の組合せにより（たとえば、乗算関数または加算関数あるいはその両方、線形的または任意の非線形的あるいはその両方の方法を用いて）、調整され得る。

【0083】

ある実施形態では、文書の対応する意味的豊富度指標を決定する当該ステップは、意味的豊富度指標の各々を、対応する文書の長さ指標により、正規化することを含む。ただし、各文書の長さ指標は、任意の方法で（たとえば、その全ての用語、そのストップワードのない用語、その句、その文の数により）定義されてもよく、意味的豊富度指標を、任意の方法で（たとえば、そのままでまたはその任意の関数により、それを個別に、意味的豊富度指標の構成要素の少なくとも一部に、または全体の意味的豊富度指標に包括的に、適用することによって）正規化するために使用され得る。いずれの場合でも、この特徴も、簡易化された実施態様（たとえば、コーパスの文書が均一の長さを有する場合）では、省略され得る。

【0084】

ある実施形態では、類似度指数を調整する当該ステップは、類似度指数の各々に、対応する意味的豊富度指標に基づく、少なくとも１つのピボット正規化関数を乗じることを含む。ただし、ピボット正規化関数は、任意の数（たとえば、次に任意の方法で組み合わせる意味的豊富度指標の構成要素毎に１つ、または意味的豊富度指標の構成要素を任意の方法で組み合わせ、次に単一のピボット正規化関数をそれらの組合せに適用することによって、あるいはその両方）で、任意の種類のもの（たとえば、その調整変数をカスタマイズする可能性を有するまたは有さない）であり得る。

【0085】

ある実施形態では、対応する類似度指数を計算する当該ステップは、類似度指数をベクトル空間モデル技術により計算することを含む。ただし、ＶＳＭ技術は、任意の種類の（たとえば、標準的、一般化された、トピックに基づいた）ものであり得る。

【0086】

ある実施形態では、方法は、クエリに応答してランキングされた文書のリストを返すことを含む。ただし、リストは、任意の種類の（たとえば、インターネット内のページのＵＲＬなどのそれらのアドレスによって、または他の任意の方法では、データベース内のそれらの名称、ファイル・システム内のそれらのパスなどによって、文書を識別する）ものであってよく、任意の方法で（たとえば、ローカルでまたはリモートで）返され得る。

【0087】

ある実施形態では、リストは、調整中の対応する類似度指数の減少していく順序で、少なくともその一部分を表示させるために使用される。ただし、リストの文書は、任意の数で（たとえば、数ページで分割してまたは全て一緒に）、任意の目的のために（たとえば、それらをブラウジング、ダウンロード、読み出すために）表示され得る。

【0088】

一般に、類似する考察は、同一の解決策が同等の方法（より多くのステップまたはその一部分の同一の機能を有する類似したステップを用いること、本質的でないいくつかのステップを除去すること、またはさらなるオプションのステップを付加することによって）を用いて実施される場合、適合する。さらに、ステップは、異なる順序で、並行して、または（少なくとも部分的に）交互方式で実行され得る。

【0089】

ある実施形態は、コンピュータ・システムに、上述の方法を実行させるように構成された、コンピュータ・プログラムを提供する。ある実施形態は、それに内蔵されたプログラム命令を含むコンピュータ可読記憶媒体を備える、コンピュータ・プログラム製品を提供し、プログラム命令は、コンピュータ・システムによって実行可能であり、コンピュータ・システムに同一の方法を実行させる。ただし、コンピュータ・プログラムは、任意のコンピュータ・システム上で実行され得る（以下を参照のこと）。また、ソフトウェア・プログラムは、独立型のモジュールとして、前から存在するソフトウェア・プログラム用のプラグイン（たとえば、検索エンジン）として、または後者の場合は直接的にも、実装され得る。いずれの場合でも、本発明の一実施形態による解決策は、（たとえば、半導体材料の１つまたは複数のチップ内に集積化された電子回路による）ハードウェア構造と共にでも、またはソフトウェアと適切にプログラムされたもしくは他の方法で構成されたハードウェアとの組合せと共にでも、実装されることに役立つ。

【0090】

ある実施形態は、上述の方法のステップを実行するために構成された手段を含むシステムを提供する。ある実施形態は、同方法の各ステップを実行するための回路（すなわち、たとえばソフトウェアによって、適切に構成された任意のハードウェア）を含むシステムを提供する。ただし、方法は、任意の数および種類の、それらの間で任意のネットワーク（たとえば、ローカル、広域、グローバル、セルラー方式、またはサテライト型の）を介して通信する、クライアント（たとえば、デスクトップ、ラップトップ、スマートフォン、タブレット）による利用のために、任意のサーバ（たとえば、物理的コンピューティング・マシン、仮想コンピューティング・マシン、クラウドサービス）上で、または任意の独立型のコンピューティング・マシン上で実行され得る。

【0091】

一般に、類似する考察は、システムが、異なる構造を有する、または同等の構成要素を含む場合、あるいはそれが他の動作特性を有する場合、適合する。いずれの場合でも、あらゆるその構成要素が、より多くの構成要素に分離され得、または２つ以上の構成要素が、単一の要素に合体され得る。さらに、各構成要素は、対応する動作を並列に実行することを支援するために、複製され得る。また、そうでないことを明示しない限り、異なる構成要素間の任意の相互作用は一般に、連続であることを必要とせず、それは、直接的でも１つまたは複数の中間体を介して間接的でもあり得る。

【0092】

本発明は、任意の可能な技術的に詳細な統合化レベルにおける、システム、方法、またはコンピュータ・プログラム製品、あるいはその組合せであり得る。コンピュータ・プログラム製品は、プロセッサに本発明の態様を実施させるための、コンピュータ読み取り可能なプログラム命令を備えた、コンピュータ可読記憶媒体（複数も可）を含み得る。コンピュータ可読記憶媒体は、命令実行装置による利用のために、命令を保持、格納可能である、有形の装置であり得る。コンピュータ可読記憶媒体は、たとえば、限定はされないが、電子ストレージ・デバイス、磁気記憶装置、光学記憶装置、電磁記憶装置、半導体記憶装置、または任意の好適な前述の組合せであり得る。コンピュータ可読記憶媒体のさらに具体的な例の非網羅的リストは、以下の、ポータブル・コンピュータ・ディスク、ハード・ディスク、ランダム・アクセス・メモリ（ＲＡＭ）、読み出し専用メモリ（ＲＯＭ）、消去可能プログラマブル読み出し専用メモリ（ＥＰＲＯＭまたはフラッシュ・メモリ）、静的ランダム・アクセス・メモリ（ＳＲＡＭ）、ポータブル・コンパクト・ディスク読み出し専用メモリ（ＣＤ－ＲＯＭ）、デジタル多用途ディスク（ＤＶＤ）、メモリ・スティック、フロッピー（Ｒ）ディスク、パンチカードまたは命令をその上に記録させた溝中の隆起構造などの機械的エンコード装置、および任意の好適な前述の組合せを含む。コンピュータ可読記憶媒体は、本明細書で用いられるとき、それ自体は、高周波または他の自由伝播する電磁波、導波路または他の伝達媒体を介して伝播する電磁波（たとえば、光ファイバ・ケーブルを通過する光パルス）、あるいは導電線を介して伝達される電気的信号などの、過渡的な信号であると解釈されてはならない。本明細書で説明される、コンピュータ読み取り可能なプログラム命令は、それぞれの演算／処理装置に、コンピュータ可読記憶媒体から、または外部コンピュータもしくは外部記憶装置に、ネットワーク、たとえばインターネット、ローカル・エリア・ネットワーク、広域ネットワーク、または無線ネットワーク、あるいはその組合せを介して、ダウンロードすることができる。ネットワークは、銅の伝送ケーブル、光伝送ファイバ、無線伝達、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、またはエッジ・サーバ、あるいはその組合せを備え得る。各演算／処理装置内の、ネットワーク・アダプタ・カードまたはネットワーク・インターフェースは、コンピュータ読み取り可能なプログラム命令を、ネットワークから受け取り、コンピュータ読み取り可能なプログラム命令を、格納のために、それぞれの演算／処理装置内部のコンピュータ可読記憶媒体内に渡す。本発明の動作実行用の、コンピュータ読み取り可能なプログラム命令は、アセンブラ命令、命令セット・アーキテクチャ（ＩＳＡ）命令、機械命令、機械従属命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路用構成データ、または、Ｓｍａｌｌｔａｌｋ（Ｒ）、Ｃ＋＋などのオブジェクト指向プログラミング言語および「Ｃ」プログラミング言語などの手続き型プログラミング言語を含む、１つまたは複数のプログラミング言語の任意の組合せで、あるいは同様のプログラミング言語で、記述されたソース・コードもしくはオブジェクト・コードであり得る。コンピュータ読み取り可能なプログラム命令は、完全にユーザのコンピュータ上で、一部ユーザのコンピュータ上で、独立型ソフトウェア・パッケージとして、一部ユーザのコンピュータ上でかつ一部リモート・コンピュータ上で、または完全にリモート・コンピュータもしくはサーバ上で、実行され得る。後者の筋書きでは、リモート・コンピュータは、ユーザのコンピュータに、ローカル・エリア・ネットワーク（ＬＡＮ）または広域ネットワーク（ＷＡＮ）を含む、任意の種類のネットワークを介して接続され得る、あるいは接続は、（たとえば、インターネット・サービス・プロバイダを使うインターネットを介して）外部コンピュータにもたらされ得る。いくつかの実施形態では、たとえば、プログラマブル論理回路、フィールド・プログラマブル・ゲート・アレイ（ＦＰＧＡ）、またはプログラマブル・ロジック・アレイ（ＰＬＡ）を含む電子回路は、本発明の態様を実行するために、コンピュータ読み取り可能なプログラム命令を、コンピュータ読み取り可能なプログラム命令の状態情報を利用し、電子回路をパーソナライズすることによって、実行し得る。本発明の態様は、本発明の実施形態による、方法、装置（システム）、およびコンピュータ・プログラム製品の、フローチャート図解またはブロック図あるいはその両方を用いて、本明細書で説明された。フローチャート図解またはブロック図あるいはその両方の各ブロック、およびフローチャート図解またはブロック図あるいはその両方内のブロックの組合せは、コンピュータ読み取り可能なプログラム命令によって、実行され得ることが、理解されよう。これらのコンピュータ読み取り可能なプログラム命令は、コンピュータまたは他のプログラム可能なデータ処理装置のプロセッサを介して実行する命令が、フローチャートまたはブロック図あるいはその両方のブロック内で指定された機能／動作を実行するための手段を生み出すべく、汎用コンピュータ、専用コンピュータ、または他のプログラム可能なデータ処理装置のプロセッサに提供され、装置を作り出し得る。これらのコンピュータ読み取り可能なプログラム命令はさらに、その内部に格納された命令を含むコンピュータ可読記憶媒体が、フローチャートまたはブロック図あるいはその両方のブロック内で指定された機能／動作の態様を実行する命令を含む製造物を含むべく、コンピュータ、プログラム可能なデータ処理装置または特定の方式で機能する他の装置あるいはその組合せを管理し得るコンピュータ可読記憶媒体内に格納され得る。コンピュータ読み取り可能なプログラム命令はさらに、コンピュータ、他のプログラム可能な装置または他の装置上で実行する命令が、フローチャートまたはブロック図あるいはその両方のブロック内で指定された機能／動作を実施すべく、コンピュータ、他のプログラム可能なデータ処理装置または他の装置上に、一連の操作上のステップがコンピュータ、他のプログラム可能な装置または他の装置上で実行され、コンピュータ実施処理を作り出すように、装填され得る。図中のフローチャートおよびブロック図は、本発明の各種実施形態によるシステム、方法、およびコンピュータ・プログラム製品の可能な実施態様の、アーキテクチャ、機能、および動作を示す。この点に関して、フローチャートまたはブロック図内の各ブロックは、指定された論理的機能を実施するための１つまたは複数の実行可能な命令を含む、命令のモジュール、セグメント、または部分に相当し得る。いくつかの代替の実施態様では、ブロック内に示された機能は、図中で示された順序から外れて発生し得る。たとえば、連続して示された２つのブロックは、事実上、実質的に並行して実行され得る、またはブロックは、ときには、包含される機能により、逆の順序で実行され得る。ブロック図またはフローチャート図解あるいはその両方の各ブロック、およびブロック図またはフローチャート図解あるいはその両方内のブロックの組合せは、指定された機能または動作を実行する、または専用ハードウェアとコンピュータ命令との組合せを実行する、専用のハードウェア・ベースのシステムによって実施され得る。

【0093】

上述の特徴は、任意の方法で組み合わされ得る。たとえば、上述した特徴の可能な組合せは、以下の、請求項１と請求項２、請求項２と請求項３、請求項３と請求項４、請求項４と請求項５、請求項１ないし５のいずれかと請求項６、請求項６と請求項７、請求項７と請求項８、請求項２ないし５のいずれかの特徴と請求項６ないし８のいずれかと請求項９、請求項１ないし９のいずれかと請求項１０、請求項１ないし１０のいずれかと請求項１１、請求項１ないし１１のいずれかと請求項１２、請求項１ないし１２のいずれかと請求項１３、請求項１ないし１３のいずれかの方法を実行する命令と請求項１４、請求項１ないし１３のいずれかの各ステップを実行するための手段（または回路）と請求項１５、である。

【図1】