(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-07-22
(45)【発行日】2022-08-01
(54)【発明の名称】評価装置、及び評価方法
(51)【国際特許分類】
G06F 16/95 20190101AFI20220725BHJP
G06F 16/90 20190101ALI20220725BHJP
G06F 16/28 20190101ALI20220725BHJP
【FI】
G06F16/95
G06F16/90
G06F16/28
(21)【出願番号】P 2017199973
(22)【出願日】2017-10-15
【審査請求日】2020-10-01
(73)【特許権者】
【識別番号】513084229
【氏名又は名称】データ・サイエンティスト株式会社
(74)【代理人】
【識別番号】230104019
【氏名又は名称】大野 聖二
(74)【代理人】
【識別番号】100167933
【氏名又は名称】松野 知紘
(74)【代理人】
【識別番号】100174137
【氏名又は名称】酒谷 誠一
(72)【発明者】
【氏名】榊原 直也
(72)【発明者】
【氏名】廣部 祐樹
【審査官】松尾 真人
(56)【参考文献】
【文献】国際公開第2007/074172(WO,A1)
【文献】特開2006-127529(JP,A)
【文献】米国特許出願公開第2007/0239729(US,A1)
【文献】特開2003-006221(JP,A)
【文献】特開2010-117893(JP,A)
【文献】特開2000-172707(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06F 13/00
(57)【特許請求の範囲】
【請求項1】
評価対象のwebページと前記評価対象のwebページを検索する際に用いられるであろう検索語とを指定する指定手段と、
前記評価対象のwebページと、前記評価対象のwebページに直接リンクされるwebページである直接リンクページと、1または複数の他のwebページを介して前記評価対象のwebページにリンクされるwebページである間接リンクページの各々のwebページデータを解析し、webページ間のリンク関係を特定する特定手段と、
前記評価対象のwebページと前記直接リンクページと前記間接リンクページの各々について、前記検索語との関連性を示す指標をwebページ毎に設定する設定手段と、
前記特定手段により特定されたリンク関係に含まれる内部アウトバウンドリンクまたは外部アウトバウンドリンクのリンク先の直接リンクページもしくは間接リンクページに設定された前記指標を少なくとも用いて、前記設定手段により前記評価対象のwebページに設定された前記指標を補正する補正手段と、
を有することを特徴とする評価装置。
【請求項2】
前記指定手段は、
前記評価対象のwebページと前記直接リンクページと前記間接リンクページのリンク関係における階層数Nを指定することを特徴とする請求項1に記載の評価装置。
【請求項3】
前記設定手段は、
前記評価対象のwebページと前記直接リンクページと前記間接リンクページの各々のwebページデータを解析してwebページ毎に前記指標を設定することを特徴とする請求項1または請求項2に記載の評価装置。
【請求項4】
評価対象のwebページと前記評価対象のwebページを検索する際に用いられるであろう検索語とを指定する指定手段と、
前記評価対象のwebページと、前記評価対象のwebページに直接リンクされるwebページである直接リンクページと、1または複数の他のwebページを介して前記評価対象のwebページにリンクされるwebページである間接リンクページの各々のwebページデータを解析し、webページ間のリンク関係を特定する特定手段と、
前記評価対象のwebページと前記直接リンクページと前記間接リンクページの各々について、前記検索語との関連性を示す指標をwebページ毎に設定する設定手段と、
前記設定手段によりwebページ毎に設定された指標を、前記特定手段により特定されたリンク関係に応じて補正する補正手段と、
を有し、
前記補正手段は、
webページ毎に前記設定手段により設定された指標を対角要素に配列した対角行列Cと、前記評価対象のwebページを最上流とする第n階層目のリンク構造を表す行列A
n-1と前記第n階層目のリンクの重みであるスカラーw
n-1を用いて、補正後の前記指標を要素とする行列C´を式(10)にしたがって算出し、
【数10】
行列A
nと行列A
n-1の間には式(8)の関係があり、
【数8】
前記式(8)における行列Lは、
リンク元のwebページとリンク先のwebページとのドメインが異なり、リンク元のwebページからリンク先のwebページへ向かう方向のリンクを表す行列L
oeと、前記行列L
oeの転置行列L
ieと、リンク元のwebページとリンク先のwebページのドメインが同じであり、リンク元のwebページからリンク先のwebページへ向かう方向のリンクを表す行列L
oiと、前記行列L
oiの転置行列L
iiのうちの複数を重み付け加算して得られる行列、または前記行列L
oeと前記行列L
ieと前記行列L
oiと前記行列L
iiの何れかを重み付けした行列である、
ことを特徴とする評価装置。
【請求項5】
指定手段が、評価対象のwebページと前記評価対象のwebページを検索する際に用いられるであろう検索語とを指定する指定ステップと、
特定手段が、前記評価対象のwebページと、前記評価対象のwebページに直接リンクされるwebページである直接リンクページと、1または複数の他のwebページを介して前記評価対象のwebページにリンクされるwebページである間接リンクページの各々のwebページデータを解析し、webページ間のリンク関係を特定する特定ステップと、
設定手段が、前記評価対象のwebページと前記直接リンクページと前記間接リンクページの各々について、当該webページと前記検索語との関連性を示す指標をwebページ毎に設定する設定ステップと、
補正手段が、前記特定ステップにて特定されたリンク関係に含まれる内部アウトバウンドリンクまたは外部アウトバウンドリンクのリンク先の直接リンクページもしくは間接リンクページに設定された前記指標を少なくとも用いて、前記設定手段により前記評価対象のwebページに設定された前記指標を補正する補正ステップと、
を含むことを特徴とする評価方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、webページの評価をする技術に係り、特に当該評価にあたり、あるwebページが、より関連性の高い内容をもった他のwebページとリンク関係を有する場合に、より高く評価されるようにすることによって、検索エンジン等が、より好ましいリンク関係を有するwebページを高く評価するようにし、それらをユーザに優先的に表示しやすくする技術に関する。
【背景技術】
【0002】
今日、Google(登録商標)に代表される大手運営会社の検索エンジンは、検索によるwebページへの訪問者(以下、検索訪問者)による閲覧時間が長いwebページや、1訪問あたりの閲覧ページ数(以下、閲覧ページ数)が多いwebサイトほど、当該検索語における検索順位を高くする傾向があることが、マーケティング関係者の間で経験値的に知られている。このことから、検索エンジン運営者は、検索訪問者の検索語ごとの各webサイトにおけるサイト内行動の傾向を、アクセス解析ツール等によって計測または収集した上で、検索順位決定指標の一部として活用しているものと推察される。
【0003】
このような情勢下において、webサイト制作者等が、検索エンジンにおいて特定の検索語の検索結果で上位表示を実現すべく、検索訪問者のwebページ閲覧時間や閲覧webページ数を増加させるには、当該webページの記述内容を検索語に適した内容にしておくことが望ましい。そして、検索訪問者が当該webページからリンクされた他のwebページに遷移した際、引き続きそのリンク先のwebページにおいても、何らかの内容の関連性が保たれていることが更に望ましい。具体的には、検索訪問者が最初に閲覧した第1のwebページの内容と、当該ページからリンクをクリックして遷移した第2のwebページの内容とを、自然言語処理技術によって計測し比較した場合、双方の内容に、より高い関連性が確認されることが望ましく、さらに、双方の内容が検索語に対してより適した内容であることが望ましい。逆に、双方の内容が関連性に乏しく、検索訪訪問者が、検索目的に合致しないリンク先ページに誘導されてしまったとの印象を持つことは好ましくない。このように、検索訪問者の便益からwebページ同士のリンク関係を考える視点から、検索結果を改善するための種々の技術が提案されている。
【0004】
例えば、特許文献1では、検索結果を改善するために、webサイトのwebページを処理する技術が開示されている。より詳細には、識別された検索クエリ用語を含む検索クエリに対して、第2のウェブページが、高い検索結果を持つことになるように、識別された用語と第2のウェブページとの関係付けを保存する動作として、検索スコアのページランク成分を増加させる処理を実行している。
【先行技術文献】
【特許文献】
【0005】
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1に開示された発明は、検索語が第2のwebページに適しているかもしれないと決定された場合、第2のテストを実施し、当該検索語を第2のwebページに関係付けるか否かを決定しているが、第2のテストとは、第2のwebページのページタイプを決定し、所定のタイプのwebページである場合には、関係付けから除外するものである。つまり、同文献開示の技術は、所定のテストをクリアした場合に、検索語を第2のweページに関係付けるべく、検索スコアのページランク成分を増加させるもので、あくまでも検索語と第2のwebページの関連性を検索スコアに反映させるにすぎず、第1のwebページと第2のwebページの関連性を、当該第1のwebページの各種指標に反映させるものではない。従って、検索語が「ソファベッド」である場合に、当該「ソファベッド」と第2のwebページとの関連性を測り、所定のテストをクリアしたときは当該検索語との関連性を第2のwebページの検索スコアに反映させるだけにとどまる。
【0007】
一般に、検索語と、当該検索者が検索結果をクリックすることによって訪問するwebページの内容との関連性が如何に高くとも、検索訪問者はさらに詳細な情報や関連情報を得るべく、当該webページに記載されたサイト内メニューや外部リンク等をたどって、他のwebページ、すなわち第2のwebページに遷移することも多い。そのような場合に、リンク元である第1のwebページ記載された内容の全部または一部と全く関係のない内容のリンク先webページに遷移してしまった場合には、検索目的を果たすために、再び第1のwebページに戻るか、他のwebページを検索エンジン等によって探し直さなくてはならなくなる。すなわち、検索訪問者が当初用いた検索語や第1のwebページの内容と、第2のwebページの内容との関連性が低いほど、検索訪問者が検索目的を果たせる確率が低下する恐れがあると考えられる。
【0008】
したがって、任意の検索語にふさわしい内容をもったwebページを発見したり評価したりする際には、検索訪問者が最初に訪問する第1のwebページの内容のみならず、そのwebページとリンク関係にある第2のwebページのコンテンツ内容についても評価しておき、これを第1のwebページの評価に加えておくことが望ましいと考えられるが、このような評価を実現する技術は従来無かった。
【0009】
本発明は、このような課題に鑑みて為されたものであり、評価対象webページと、これとリンク関係にある他のwebページとの内容の関連性を自然言語処理技術によって評価することで、より好ましいリンク関係を有するwebページをより高く評価する技術を提供することを目的とする。
【課題を解決するための手段】
【0010】
上記課題を解決するために本発明は、評価対象のwebページと、前記評価対象のwebページを検索する際に用いられるであろう検索語とを指定する指定手段と、前記評価対象のwebページと、前記評価対象のwebページに直接リンクされるwebページである直接リンクページと、1または複数の他のwebページを介して前記評価対象のwebページにリンクされるwebページである間接リンクページの各々のwebページデータを解析し、webページ間のリンク関係を特定する特定手段と、前記評価対象のwebページと前記直接リンクページと前記間接リンクページの各々について、前記検索語との関連性を示す指標をwebページ毎に設定する設定手段と、前記設定手段によりwebページ毎に設定された指標を、前記特定手段により特定されたリンク関係に応じて補正する補正手段と、を有することを特徴とする評価装置、を提供する。
【0011】
本発明においては、評価対象のwebページ、直接リンクページ、及び間接リンクページの各々に設定された上記指標が、評価対象のwebページと当該webページに直接または間接的にリンクされるwebページのリンク関係に応じて補正される。このため、本発明によれば、評価対象のwebページにリンクされる他のwebページとのリンク関係を含めてwebページの良否を評価することが可能になる。
【0012】
より好ましい態様の評価装置では、前記指定手段は、前記評価対象のwebページと前記直接リンクページと前記間接リンクページのリンク関係の階層数Nを指定することを特徴とする。一般に、階層数Nが大きな値となるほど、間接リンクページの数が増加し、特定手段、設定手段、及び補正手段の各手段における処理負荷が重くなる。本態様によれば、上記処理負荷との見合いで好適な階層数Nを指定して評価することが可能になる。
【0013】
上記設定手段により設定される指標の具体例としては、webページの掲載情報とそのwebページを検索する際に用いられるであろう検索語の両者を見比べた被験者の主観に基づく値であっても良いし、webページの掲載情報を客観的に解析して得られた値であっても良い。
【0014】
また、上記課題を解決するために本発明は、評価対象のwebページを指定する指定手段と、前記評価対象のwebページと、前記評価対象のwebページに直接リンクされるwebページである直接リンクページと、1または複数の他のwebページを介して前記評価対象のwebページにリンクされるwebページである間接リンクページの各々のwebページデータを解析し、webページ間のリンク関係を特定する特定手段と、前記特定手段により特定されたリンク関係における予め定められた複数種のリンクパターンの各々の出現頻度に応じて、リンク関係の良否を示す指標を算出する算出手段と、を有することを特徴とする評価装置、を提供する。本発明によれば、評価対象ページと当該評価対象ページに直接または間接的にリンクされる他のwebページの間のリンク関係の良否を評価することが可能になる。
【0015】
また、上記課題を解決するために本発明は、評価対象のwebページと前記評価対象のwebページを検索する際に用いられるであろう検索語とを指定する指定ステップと、前記評価対象のwebページと、前記評価対象のwebページに直接リンクされるwebページである直接リンクページと、1または複数の他のwebページを介して前記評価対象のwebページにリンクされるwebページである間接リンクページの各々のwebページデータを解析し、webページ間のリンク関係を特定する特定ステップと、前記評価対象のwebページと前記直接リンクページと前記間接リンクページの各々について、当該webページと前記検索語との関連性を示す指標をwebページ毎に設定する設定ステップと、前記設定ステップにてwebページ毎に設定された指標を、前記特定ステップにて特定されたリンク関係に応じて補正する補正ステップと、を含むことを特徴とする評価方法、を提供する。本発明によっても、評価対象のwebページにリンクされる他のwebページとのリンク関係を含めてコンテンツ力を評価することが可能になる。
【0016】
また、上記課題を解決するために本発明は、評価対象のwebページを指定する指定ステップと、前記評価対象のwebページと、前記評価対象のwebページに直接リンクされるwebページである直接リンクページと、1または複数の他のwebページを介して前記評価対象のwebページにリンクされるwebページである間接リンクページの各々のwebページデータを解析し、webページ間のリンク関係を特定する特定ステップと、前記特定ステップにて特定されたリンク関係における予め定められた複数種のリンクパターンの各々の出現頻度に応じて、リンク関係の良否を示す指標を算出する算出ステップと、を有することを特徴とする評価方法、を提供する。本発明によっても、評価対象のwebページと当該webページにリンクされる他のwebページのリンク関係の良否を評価することが可能になる。
【発明の効果】
【0017】
本発明によれば、評価対象webページと、これとリンク関係にある他のwebページとの内容の関連性を自然言語処理技術によって評価することで、より好ましいリンク関係を有するwebページをより高く評価する技術を提供することができる。
【図面の簡単な説明】
【0018】
【
図1】本発明の第1実施形態による評価装置20Aを含む評価システム1Aの全体構成を示す図である。
【
図2】評価装置20AのCPU22が評価プログラム26Aにしたがって実行する評価方法の流れを示すフローチャートである。
【
図3】本実施形態の指定処理を説明するための図である。
【
図4】本実施形態の補正処理を説明するための図である。
【
図5】本実施形態の評価装置による評価結果の表示例を示す図である。
【
図6】本発明の第2実施形態による評価装置20Bを含む評価システム1Bの全体構成を示す図である。
【
図7】評価装置20BのCPU22が評価プログラム26Bにしたがって実行する評価方法の流れを示すフローチャートである。
【
図8】本実施形態の指定処理を説明するための図である。
【
図9】本実施形態の算出処理を説明するための図である。
【発明を実施するための形態】
【0019】
以下、図面を参照しつつ本発明の実施形態を説明する。
(A:第1実施形態)
図1は、本発明の一実施形態である評価装置20Aを含む評価システム1Aの全体構成を示す図である。評価システム1Aは、webページとそのwebページをweb検索する際に用いられるであろう検索語との関連性(更に相性がよい関係性を意味する親和性を概念的に含む、以下同じ)、当該webページにリンクされる他のwebページの内容、及びリンク関係を含めて評価する。
図1に示すように、評価システム1Aは、利用者端末10、及び評価装置20Aを有する。利用者端末10、及び評価装置20Aは、例えばインターネットなどのネットワーク90を介して接続されている。
【0020】
利用者端末10は、パーソナルコンピュータである。利用者端末10のユーザには、固有のIDとパスワードが付与されている。ユーザは、自らの利用者端末10から評価装置20Aにアクセスして認証手続きを行い、サービスを利用する。
【0021】
図1では図示を省略したが、ネットワーク90には、検索エンジンサービスを提供する役割を果たす1または複数の検索エンジンサーバ装置が接続されている。検索エンジンサービスとは、ネットワーク90に接続されているコンピュータから検索語を含むHTTP(Hypertext Transfer Protocol)リクエスト(検索リクエスト)を受信し、上記検索語を含むwebサイトのタイトル、URL、スニペット(Snippet)のセットを検索順位が上位のものから順に配した検索結果を返信するネットワークサービスのことを言う。
【0022】
評価装置20Aは、
図1に示すように、通信インターフェース21、CPU(Central Processing Unit)22、RAM(Random Access Memory)23、ROM(Read Only Memory)24、ハードディスク25を有する。通信インターフェース21は、ネットワーク90に接続された装置との間でデータを送受信する。CPU22は、RAM23をワークエリアとして利用しつつ、ROM24やハードディスク25に記憶された各種プログラムを実行する。ROM24には、IPL(Initial Program Loader)などが記憶されている。ハードディスク25には、本実施形態に特有の機能をCPU22に実現させる評価プログラム26Aが記憶されている。
【0023】
次に、本実施形態の動作について説明する。CPU22は、評価装置20Aの電源投入を契機としてIPLを実行し、このIPLにしたがって評価プログラム26Aをハードディスク15からRAM23に読み出し、その実行を開始する。
図2は、CPU22が評価プログラム26Aにしたがって実行する評価方法の流れを示すフローチャートである。CPU22は、評価プログラム26Aを実行することで、指定処理(ステップSA100)を実行する指定手段、特定処理(ステップSA110)を実行する特定手段、設定処理(ステップSA120)を実行する設定手段、及び補正処理(ステップSA130)を実行する補正手段として機能する。
【0024】
ステップSA100の指定処理では、CPU22は、
図3に示すように、認証手続きを済ませた利用者端末10に対し、入力画面の関係をHTML(HyperText Markup Language)により記述したwebページデータを送信する。利用者端末10は、このwebページデータを受信すると、入力画面をユーザに提示する。入力画面には、「評価対象のwebページを指定してください」という文字列が表示される。その下には、URL入力欄51がある。URL入力欄51には、利用者端末10のユーザによって、検索語との関連性の評価対象となるwebページ(以下、評価対象ページ:例えば、上記ユーザの運営するサイトのwebページ)のURLが入力される。
【0025】
図3に示すように、URL入力欄51の下には、「検索語を指定してください」などという文字列が表示され、その下には、検索語入力欄52があり、検索語入力欄52の下には、送信ボタン53がある。検索語入力欄52には、評価対象ページのweb検索の際に利用されるであろう検索語が利用者端末10のユーザによって入力される。
【0026】
URL入力欄51、及び検索語入力欄52への情報入力を済ませたユーザは、送信ボタン53を押下する。送信ボタン53が押下されると、利用者端末10は、URL入力欄51、及び検索語入力欄52の各々に入力された情報を入力情報として評価装置20Aへ送信する。CPU22は、ネットワーク90を介して利用者端末10から入力情報を受信すると、受信した入力情報をRAM23に書き込む。
【0027】
次に、CPU22は、特定処理(ステップSA110)を実行する。この特定処理では、CPU22は、評価対象ページと、当該評価対象ページに直接リンクされるwebページである直接リンクページと、1または複数の他のwebページを介して評価対象ページにリンクされるwebページである間接リンクページの各webページ間のリンク関係を特定する。ここで、評価対象ページに直接リンクされるwebページとは、当該webページのURLがハイパーリンクとして上記評価対象ページに埋め込まれているwebページのことを言う。評価対象ページに間接リンクされるwebページとは、当該webページのURLが評価対象ページには埋め込まれていないwebページのことであり、例えば、直接リンクページ或いは直接リンクページに直接リンクされた他の間接リンクページに、当該webページのURLが埋め込まれているwebページが挙げられる。
【0028】
より詳細に説明すると、CPU22は、まず、ステップSA100にてRAM23に書き込んだ入力情報の含まれているURLにアクセスし、当該URLの示すwebページデータ(すなわち、評価対象ページのwebページデータ)を取得してRAM23に書き込む。CPU22は、このwebページデータにハイパーリンクとして埋め込まれているURLを当該webページデータから抽出することで、直接リンクページのURLを取得する。CPU22は、評価対象ページのURLと直接リンクページのURLとを対応付けて両webページのリンク関係を示すリンク関係データを生成し、RAM23に書き込む。次いで、CPU22は、上記の要領で取得した直接リンクページのURLにアクセスして当該直接リンクページのwebページデータを取得し、RAM23に書き込む。
【0029】
次いで、CPU22は、直接リンクページのwebページデータにハイパーリンクとして埋め込まれているURLを抽出することで、当該直接リンクページに直接リンクされている間接リンクページのURLを取得する。CPU22は、直接リンクページのURLと当該間接リンクページのURLとを対応付けて両webページのリンク関係を示すリンク関係データを生成し、RAM23に書き込む。
【0030】
CPU22は、RAM23に書き込んだ間接リンクページのURLにアクセスして当該間接リンクページのwebページデータを取得しRAM23に書き込み、当該間接陸ページのwebページデータにハイパーリンクとして埋め込まれているURLを抽出することで当該間接リンクページに直接リンクされている他の間接リンクページのURLを取得し、間接リンクページのURLと当該他の間接リンクページのURLとを対応付けて両webページのリンク関係を示すリンク関係データを生成してRAM23に書き込む処理を、(N-1)回または末端の間接リンクページに到達するまで繰り返す。ここで、Nは評価プログラム26Aにおいて予め定められた1以上の自然数であり、評価対象ページ、直接リンクページ、及び間接リンクページの各webページ間のリンク関係の階層数を表す。
【0031】
次に、CPU22は、設定処理(ステップSA120)を実行する。この設定処理では、CPU22は、評価対象ページ、直接リンクページ、及び間接リンクページの各々について、ステップSA100に入力処理にて指定された検索語または評価対象ページとの関連性を示す指標をwebページ毎に設定する。本実施形態の設定処理では、CPU22は、評価対象ページ、直接リンクページ、及び間接リンクページを特許第6164436号公報における解析対象webページとし、当該特許第6164436号公報に開示のアルゴリズムにしたがって算出されるポータル度に関する評価スコアを上記指標として設定する。なお、本実施形態では、ポータル度に関する評価スコアを上記指標として設定するが、webページの内容とそのwebページの検索の際に用いられるであろう検索語との関連性を示す値であれば、他のアルゴリズムにしたがって算出される値であっても良い。
【0032】
設定処理(ステップSA120)に後続する補正処理(ステップSA130)では、CPU22は、設定処理(ステップSA120)にてwebページ毎に設定した指標を、特定処理(ステップSA110)にて特定されたリンク関係に応じて補正する。以下、この補正処理の処理内容について説明する。
【0033】
例えば、評価対象ページP1に、直接リンクページP2と直接リンクページP3のURLがハイパーリンクとして埋め込まれており、直接リンクページP2には、直接リンクページP3と間接リンクページP4のURLがハイパーリンクとして埋め込まれており、直接リンクページP3には、直接リンクページP2のURLがハイパーリンクとして埋め込まれていたとする。この場合、評価対象ページP1、直接リンクページP2、直接リンクページP3、及び間接リンクページP4のリンク関係は、
図4のように表される。
図4では、各webページが丸印で表さており、webページ間のリンクが矢印で表されている。
図4において丸印内に記された数値(480、400、320、及び130の各々)は、当該丸印に対応するwebページに対して上記設定処理にて設定された指標の値である。なお、
図4に示す例では、直接リンクページP2、直接リンクページP3及び間接リンクページP4のドメインは同一であり、評価対象ページP1のみドメインが異なる。
図4において符号P2、P3及びP4の各々の指す丸印には同一のハッチングが付与されており、符号P1の示す丸印にハッチングが付与されていないのは、上記ドメインの関係を表している。
【0034】
webページ毎に設定処理(ステップSA120)にて設定された指標を対角要素に配列した対角行列C(式(1)参照)と、リンク関係に応じた補正を表す行列Aと、を用いて、補正後の指標の行列C´を以下の式(2)により表す。行列C、行列C´、及び行列Aにおけるi列j行成分(i≠j)には、webページPiとwebページPjのリンク関係が反映される。設定処理(ステップSA120)では、リンク関係を考慮せいずに指標の設定を行っているため、行列Cにおける対角成分以外の成分は全て0となっている。
【数1】
【数2】
【0035】
リンク関係に応じた補正を表す行列Aは、外部アウトバウンドリンクを表す行列L
oe、内部アウトバウンドリンクを表す行列L
oi、外部インバウンドリンクを表す行列L
ie、内部インバウンドリンクを表す行列L
iiと、外部アウトバウンドリンクの重み付け係数であるスカラーw
oe、内部アウトバウンドリンクの重み付け係数であるスカラーw
oi、外部インバウンドリンクの重み付け係数であるスカラーw
ie、内部インバウンドリンクの重み付け係数であるスカラーw
iiと、行列Cを用いて以下の式(3)により表される。
【数3】
【0036】
外部アウトバウンドリンクとは、リンク元のwebページとリンク先のwebページとのドメインが異なり、リンク元のwebページからリンク先のwebページへ向かう方向のリンクである。外部アウトバウンドリンクを表す行列L
oeのi列j行成分には、webページPiとwebページPjのドメインが異なり、かつwebページPiからwebページPjへ向かう方向のリンクが有る場合に1がセットされ、その他の場合は0がセットされる。外部インバウンドリンクとは、リンク元のwebページとリンク先のwebページとのドメインが異なり、外部アウトバウンドリンクとは逆方向のリンクである。外部インバウンドリンクを表す行列L
ieは、外部アウトバウンドリンクを表す行列L
oeの転置行列である。
図4に示すリンク関係では、評価対象ページP1から、当該評価対象ページP1とはドメインが異なる直接リンクページP2と直接リンクページP3の各々にリンクが向かっている。このため、外部アウトバウンドリンクを表す行列L
oeは、以下の式(4)により表され、外部インバウンドリンクを表す行列L
ieは、以下の式(5)により表される。
【数4】
【数5】
【0037】
内部アウトバウンドリンクとは、リンク元のwebページとリンク先のwebページとのドメインが同じであり、リンク元のwebページからリンク先のwebページへ向かう方向のリンクである。内部アウトバウンドリンクを表す行列L
oiのi列j行成分には、webページPiとwebページPjのドメインが同じであり、かつwebページPiからwebページPjへ向かう方向のリンクが有る場合に1がセットされ、その他の場合は0がセットされる。内部インバウンドリンクとは、リンク元のwebページとリンク先のwebページとのドメインが同じであり、内部アウトバウンドリンクとは逆方向のリンクである。内部インバウンドリンクを表す行列L
iiは、外部アウトバウンドリンクを表す行列L
oiの転置行列である。
図4に示すリンク関係では、直接リンクページP2から、同じドメインに属する直接リンクページP3と間接リンクページP4にリンクが向かっており、また、直接リンクページP3から直接リンクページP2にリンクが向かっている。このため、内部アウトバウンドリンクを表す行列L
oiは、以下の式(6)により表され、内部インバウンドリンクを表す行列L
iiは、以下の式(7)により表される。
【数6】
【数7】
【0038】
webページのリンク関係おいては、豊富なリンクを有するwebページからのリンクであるほど高い
評価が為されると考えられる。このような評価を可能にするため、本実施形態では式(2)を拡張し、まず、以下の式(8)の漸化式を定義する。式(8)における行列A
n(n≧1)は、webページのリンク関係において評価対象ページを第0階層とした場合における第n階層のリンク関係に応じた補正を表す行列であり、行列Lは以下の式(9)により表される。この場合、第n層のリンク関係の重み付け係数であるスカラーをw
nとすると、前掲式(2)は、以下の式(10)のように拡張される。
【数8】
【数9】
【数10】
【0039】
本実施形態の補正処理(ステップSA130)では、CPU22は、設定処理(ステップSA120)にてwebページ毎に設定された指標の行列Cと、特定処理(ステップSA110)にて特定されたリンク関係に応じた行列An(n=0~N)を用いて、補正後の指標に関する行列C´を上記式(10)にしたがって算出し、当該行列C´を評価対象ページの指定元の利用者端末10へ返信する。
【0040】
式(10)の右辺第1項には、評価対象ページ、直接リンクページ、及び間接リンクページの各webページの内容と上記評価対象ページを検索する際に用いられるであろう検索語の関連性が反映されており、右辺第2項には各webページ間のリンク関係が反映されている。したがって、評価対象ページの指定元の利用者端末10のユーザは当該指標C´を参照することで、評価対象のwebページとそのwebページを検索する際に用いられるであろう検索語との関連性について、当該評価対象のwebページにリンクされる他のwebページとのリンク関係、及び当該他のwebページの内容を加味した評価結果を得ることができる。このように、本実施形態によれば、評価対象のwebページとそのwebページを検索する際に用いられるであろう検索語との関連性を、当該評価対象のwebページにリンクされる他のwebページとのリンク関係、及び当該他のwebページの内容を加味した評価することが可能になる。
【0041】
実際の評価結果の表示例は、例えば
図5に示される通りである。ここでは、一例として検索キーワード「ソファベッド 価格」について検索した結果を示しているが、評価対象のwebページの総合評価が示されると共に、その内訳、即ち1)評価対象のwebページ単体の評価、2)リンク関係のwebページ評価、がそれぞれスコアで示される。そして、リンク関係のwebページ評価では、実際のリンク先のURLと、各リンク先の評価スコアが確認可能となっている。このように、評価対象のwebページとそのwebページを検索する際に用いられるであろう検索語との関連性をリンク関係を加味して評価することが可能になる。
【0042】
(B:第2実施形態)
次いで、本発明の第2実施形態を説明する。
図6は、本発明の第2実施形態による評価装置20Bを含む評価システム1Bの全体構成を示す図である。評価システム1Bは、評価対象ページと当該評価対象ページに直接または間接的にリンクされる他のwebページの間のリンク関係を評価するものである。前掲
図1と
図6とを比較すれば明らかなように、評価システム1Bは、評価装置20Aに代えて評価装置20Bを有する点が評価システム1Aと異なる。そして、評価装置20Bは、評価装置20Aと同じハードウェア構成を有するものの、評価プログラム26Aに代えて評価プログラム26Bがハードディスク25に記憶されている点が評価装置20Aと異なる。
【0043】
本実施形態においても、CPU22は、評価装置20Bの電源投入を契機としてIPLを実行し、このIPLにしたがって評価プログラム26Bをハードディスク15からRAM23に読み出し、その実行を開始する。
図7は、評価装置20BのCPU22が評価プログラム26Bにしたがって実行する評価方法の流れを示すフローチャートである。前掲
図2と
図7とを対比すれば明らかなように、本実施形態における評価方法は、指定処理(ステップSA100)に代えて指定処理(ステップSB100)を設けた点と、設定処理(ステップSA120)、及び補正処理(ステップSA130)に代えて算出処理(ステップSB120)を設けた点が第1実施形態における評価方法と異なる。つまり、評価装置20BのCPU22は、評価プログラム26Bを実行することで、指定処理(ステップSB100)を実行する指定手段、特定処理(ステップSA110)を実行する特定手段、及び算出処理(ステップSB120)を実行する算出手段として機能する。以下、第1実施形態との相違点である指定処理(ステップSB100)と算出処理(ステップSB120)を中心に説明する。
【0044】
ステップSB100の指定処理では、CPU22は、
図8に示すように、認証手続きを済ませた利用者端末10に対し、入力画面の関係をHTMLにより記述したwebページデータを送信する。利用者端末10は、このwebページデータを受信すると、入力画面をユーザに提示する。この入力画面には、「評価対象のwebページを指定してください」という文字列が表示される。その下には、URL入力欄51がある。URL入力欄51には、利用者端末10のユーザによって、リンク関係の良否の評価対象となるwebページのURLが入力される。そして、URL入力欄51の下には、送信ボタン53がある。前掲
図3と
図8とを対比すれば明らかなように、本実施形態の入力画面には、「検索語を入力してください」という文字列は含まれておらず、検索語入力欄52も設けられていない。本実施形態の入力画面は、これらの点が第1実施形態における入力画面(
図3参照)と異なる。本実施形態では、評価対象ページと当該評価対象ページに直接または間接的にリンクされる他のwebページの間のリンク関係が評価対象となり、検索語を指定する必要はないからである。
【0045】
URL入力欄51への情報入力を済ませたユーザは、送信ボタン53を押下する。送信ボタン53が押下されると、利用者端末10は、URL入力欄51に入力された情報(すなわち、評価対象ページのURL)を入力情報として評価装置20Bへ送信する。CPU22は、ネットワーク90を介して利用者端末10から入力情報を受信すると、受信した入力情報をRAM23に書き込む。
【0046】
指定処理(ステップSB100)に後続して実行される特定処理(ステップSA100)の処理内容は、第1実施形態における特定処理の処理内容と同一である。つまり、この特定処理(ステップSA110)では、CPU22は、評価対象ページ、直接リンクページ、及び間接リンクページの各々のwebページデータを取得し、それらwebページデータを解析して各webページのリンク関係を特定し、当該リンク関係を示すリンク関係データをRAM23に書き込む。
【0047】
特定処理(ステップSA110)に後続する算出処理(ステップSB120)では、CPU22は、特定処理にて特定されたリンク関係において、予め定められた複数種のリンクパターンの各々の出現頻度を算出し、当該リンク関係の良否を示す指標Sを当該出現頻度に応じて算出し、評価対象ページの指定元の利用者端末10へ当該指標Sを返信する。本実施形態において上記予め定められた複数種のリンクパターンとは、トライアドに含まれる特定の1つのノードを親ノード(
図9ではハッチングを付与)とした場合の他の2つのノードのリンクパターンPT01~PT33である(
図9参照)。
図9に示すリンクパターンPT01~PT33の各々には、当該リンクパターンに含まれるリンク(
図9では、矢印でリンクを表記)の数が多いほど、大きな評価値が予め割り当てられている。これは、リンクの数が多いリンク関係ほど好ましいと考えられるからである。
【0048】
算出処理(ステップSB120)の処理内容の詳細は、次の通りである。CPU22は、まず、指標Sに初期値(例えば、0)をセットする。次いで、CPU22は、RAM23に記憶されているリンク関係データの表すリンク関係において、評価対象ページを最上流のwebページとし、上流側から順にwebページを1つずつ選択して上記親ノードとし、当該親ノードとその1つ下流側に直接リンクされているwebページのリンク関係がリンクパターンPT01~PT33の何れに該当するのかを判定し、該当すると判定されたリンクパターンの評価値を指標Sに加算する。
【0049】
上記選択したwebページが評価対象ページである場合には、評価対象ページと直接リンクページのリンク関係は、
図9に示すリンクパターンPT01~PT33の何れに該当し、該当するリンクパターンの評価値が指標Sに加算される。例えば、直接リンクページが1つであれば、
図9におけるリンクパターンPT01~PT03の何れかの評価値が指標Sに加算され、直接リンクページが2つであれば、
図9におけるリンクパターンPT04~PT09、PT13~PT18、PT22~PT24、及びPT28~PT33の何れかの評価値が指標Sに加算される。直接リンクページが3つ以上であれば、リンクパターンPT01~PT03の何れかの評価値とリンクパターンPT04~PT09、PT13~PT18、PT22~PT24、及びPT28~PT33の何れかの評価値が指標Sに加算される。直接リンクページと当該直接リンクページに直接リンクされている間接リンクページのリンク関係、間接リンクページと当該間接リンクページに直接リンクされている間接リンクページのリンク関係についても同様に、該当するリンクパターンの評価値が指標Sに加算される。
【0050】
本実施形態によれば、評価対象ページと当該評価対象ページに直接または間接的にリンクされる他のwebページの間のリンク関係の良否を示す指標Sが、当該評価対象ページの指定元の利用者端末10へ返信され、当該利用者端末10のユーザは当該指標Sを参照することで、上記リンク関係の良否を把握することができる。
【0051】
(C:変形例)
以上本発明の第1実施形態、及び第2実施形態について説明した。しかし、これら実施形態に以下の変形を加えても勿論良い。
(1)上記第1実施形態では、評価対象ページ、直接リンクページ、及び間接リンクページの各webページ間のリンク関係における階層数Nが固定であったが、指定処理にて階層数Nをユーザに指定させても良い。具体的には、
図3に示す入力画面に階層数入力欄を設け、当該階層数入力欄に入力された階層数Nを含む入力情報を評価装置20Aへ送信する処理を、送信ボタン53のクリックを契機として利用者端末10に実行させるようにすれば良い。一般に、階層数Nが大きな値となるほど、特定処理(ステップSA110)、設定処理(ステップSA120)、及び補正処理(ステップSA130)の処理負荷が重くなる。特定処理(ステップSA110)、設定処理(ステップSA120)、及び補正処理(ステップSA130)の処理負荷との見合いで好適な階層数Nを指定して評価することが可能になる。
【0052】
(2)上記第1実施形態における行列Lは、行列Loe、行列Lie、行列Loi、及び行列Liiを重み付け加算した行列であった。しかし、リンク元のwebページとリンク先のwebページとのドメインが異なるリンクのみを対象として検索語との関連性を評価する場合には、行列Lは、行列Loeと行列Lieを重み付け加算した行列であれば良い。同様にリンク元のwebページとリンク先のwebページとのドメインが同じリンクのみを対象として検索語との関連性を評価する場合には、行列Lは、行列Loiと行列Liiを重み付け加算した行列であれば良い。また、アウトバウンドリンクのみを対象として検索語との関連性を評価する場合には、行列Lは、行列Loeと行列Loiを重み付け加算した行列であれば良く、インバウンドリンクのみを対象として検索語との関連性を評価する場合には、行列Lは、行列Lieと行列Liiを重み付け加算した行列であれば良い。さらに、外部アウトバウンドリンクのみを対象として検索語との関連性を評価する場合には、行列Lは、行列Loeを重み付けした行列であれば良く、外部インバウンドリンクのみを対象として検索語との関連性を評価する場合には、行列Lは、行列Lieを重み付けした行列であれば良い。同様に、内部アウトバウンドリンクのみを対象として検索語との関連性を評価する場合には、行列Lは、行列Loiを重み付けした行列であれば良く、内部インバウンドリンクのみを対象として検索語との関連性を評価する場合には、行列Lは、行列Liiを重み付けした行列であれば良い。また、行列Lを、行列Loe、行列Lie、Loi、及び行列Liiの何れの重み付け加算により生成するのか、或いは行列Lを、行列Loe、行列Lie、Loi、及び行列Liiの何れの重み付けにより生成するのかを、webページの評価の都度ユーザに指定させるようにしても良い。
【0053】
(3)上記第1実施形態では、本発明の特徴を顕著に示す評価方法を評価装置20AのCPU22に実行させる評価プログラム26Aが当該評価装置20Aのハードディスク25に予め記憶されていた。しかし、DVDなどのコンピュータ読み取り可能な記録媒体に評価プログラム26Aを書き込んで配布しても良く、また、インターネットなどの電気通信回線経由のダウンロードにより評価プログラム26Aを配布しても良い。このようにして配布される評価プログラム26Aにしたがって一般的なコンピュータを作動させることで当該コンピュータを評価装置20Aとして機能させることが可能になるからである。第2実施形態における評価プログラム26Bについても同様に、DVDなどのコンピュータ読み取り可能な記録媒体に評価プログラム26Bを書き込んで配布しても良く、また、インターネットなどの電気通信回線経由のダウンロードにより評価プログラム26Bを配布しても良い。
【0054】
(4)上記第1実施形態では、本発明の特徴を顕著に示す指定処理、特定処理、設定処理、及び補正処理をソフトウェアにより実現したが、これら各処理を実行するハードウェアの組み合わせにより評価装置20Aを実現しても良い。具体的には、
図2におけるステップSA100の指定処理を実行する指定手段、同ステップSA110の特定処理を実行する特定手段、同ステップSA120の設定処理を実行する設定手段、及び同ステップSA130の補正処理を実行する補正手段の各手段をASICなどの電子回路で構成し、これら電子回路を組み合わせて評価装置20Aを実現しても良い。第2実施形態の評価装置20Bについても同様である。すなわち、
図7におけるステップSB100の指定処理を実行する指定手段、同ステップSA110の特定処理を実行する特定手段、及び同ステップSB130の算出処理を実行する算出手段の各手段をASICなどの電子回路で構成し、これら電子回路を組み合わせて評価装置20Bを実現しても良い。
【符号の説明】
【0055】
1A,1B…評価システム、10…利用者端末、20A、20B…評価装置、21…通信インターフェース、22…CPU、23…RAM、24…ROM、25…ハードディスク、26A、26B…評価プログラム。