特許5959308 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ＫＤＤＩ株式会社の特許一覧

特許5959308ＩＤ割当装置、方法及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】5959308

(24)【登録日】2016年7月1日

(45)【発行日】2016年8月2日

(54)【発明の名称】ＩＤ割当装置、方法及びプログラム

(51)【国際特許分類】

G06F 17/30 20060101AFI20160719BHJP

【ＦＩ】

G06F17/30 419B

G06F17/30 210D

【請求項の数】14

【全頁数】20

(21)【出願番号】特願2012-116893(P2012-116893)

(22)【出願日】2012年5月22日

(65)【公開番号】特開2013-242804(P2013-242804A)

(43)【公開日】2013年12月5日

【審査請求日】2015年1月22日

(73)【特許権者】

【識別番号】000208891

【氏名又は名称】ＫＤＤＩ株式会社

(74)【代理人】

【識別番号】100106002

【弁理士】

【氏名又は名称】正林真之

(74)【代理人】

【識別番号】100120891

【弁理士】

【氏名又は名称】林一好

(72)【発明者】

【氏名】本庄勝

(72)【発明者】

【氏名】田上敦士

(72)【発明者】

【氏名】長谷川亨

【審査官】樋口龍弥

(56)【参考文献】

【文献】特開２０１１−２３７９７８（ＪＰ，Ａ）

【文献】中田豊久，個人ホームページのハイパーリンク分析による暗示的コミュニティの抽出，第53回知識ベースシステム研究会資料，日本，社団法人人工知能学会，２００１年９月１４日，19〜24頁

【文献】大野成義他，ＭａｘＦｌｏｗアルゴリズムを用いたＷｅｂページのクラスタリング方法とその評価，情報処理学会論文誌，日本，社団法人情報処理学会，２００６年３月１５日，第47巻Ｎｏ．ＳＩＧ4（ＴＯＤ29），ｐ．65〜75

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｆ１７／３０

(57)【特許請求の範囲】

【請求項1】

複数の個人ウェブサイト、及び当該複数の個人ウェブサイト間におけるハイパーリンクによる隣接関係を示したリンク情報を記憶する記憶部と、
前記リンク情報に基づいて、２つの個人ウェブサイトが共通の隣接する個人ウェブサイトを有する程度を示す第１の指標を算出する算出部と、
前記第１の指標に基づいて、１以上の個人ウェブサイトからなるクラスタの集合を生成する第１の生成部と、
前記複数の個人ウェブサイトに対して、前記クラスタ毎に異なり、かつ、当該クラスタ内で同一の管理者ＩＤを割り当てる割当部と、を備えるＩＤ割当装置。

【請求項2】

前記算出部は、前記隣接する個人ウェブサイトとして自身を含めて、前記第１の指標を算出する請求項１に記載のＩＤ割当装置。

【請求項3】

前記第１の生成部は、前記第１の指標が所定以上に大きい個人ウェブサイトの組み合わせを同一のクラスタに含める請求項１又は請求項２に記載のＩＤ割当装置。

【請求項4】

前記第１の生成部は、前記クラスタに属する個人ウェブサイトと当該クラスタ外の個人ウェブサイトとの組み合わせに関する前記第１の指標を、所定の規則に従ってクラスタとクラスタ、又はクラスタと個人ウェブサイトの組み合わせに関する第２の指標に統合し、前記第１の指標又は前記第２の指標に基づいて、個人ウェブサイトと個人ウェブサイト、個人ウェブサイトとクラスタ、又はクラスタとクラスタとを結合したクラスタを生成する処理を、前記第１の指標及び前記第２の指標が所定値に満たなくなるまで繰り返す請求項１又は請求項２に記載のＩＤ割当装置。

【請求項5】

前記第１の生成部は、前記クラスタに属する個人ウェブサイトと当該クラスタ外の個人ウェブサイトとの組み合わせに関する前記第１の指標の最大値を前記第２の指標とする請求項４に記載のＩＤ割当装置。

【請求項6】

前記複数の個人ウェブサイトそれぞれのＵＲＬに基づいて分類される利用形態を表す所定数の種別、及び前記ハイパーリンクの入出力関係の構造に基づいて、予め設定されている所定の入出力の関係にある所定種別の個人ウェブサイトの組み合わせを結合して前記クラスタを生成する第２の生成部を備える請求項１から請求項５のいずれかに記載のＩＤ割当装置。

【請求項7】

前記複数の個人ウェブサイトそれぞれのＵＲＬにより識別可能なサービスプロバイダのアカウントに基づいて、当該アカウントが同一の個人ウェブサイトを結合して前記クラスタを生成する第３の生成部を備える請求項１から請求項６のいずれかに記載のＩＤ割当装置。

【請求項8】

前記算出部は、前記ハイパーリンクの入次数及び出次数が所定の条件を満たす個人ウェブサイト、及び当該個人ウェブサイトに関する前記リンク情報を除いて、前記第１の指標を算出する請求項１から請求項７のいずれかに記載のＩＤ割当装置。

【請求項9】

前記入次数又は前記出次数は、隣接する個人ウェブサイトが当該個人ウェブサイトのＵＲＬに基づいて分類される利用形態を表す所定の種別である場合のハイパーリンクの数である請求項８に記載のＩＤ割当装置。

【請求項10】

前記算出部は、前記リンク情報のうち、所定の期間以外に発生したハイパーリンクを除いて、前記第１の指標を算出する請求項１から請求項９のいずれかに記載のＩＤ割当装置。

【請求項11】

前記算出部は、前記リンク情報のうち、所定の期間に同一の個人ウェブサイト間で発生したハイパーリンクの数が所定数に満たない場合、当該ハイパーリンクを除いて、前記第１の指標を算出する請求項１から請求項１０のいずれかに記載のＩＤ割当装置。

【請求項12】

前記所定数は、前記ハイパーリンクのリンク元の個人ウェブサイトのＵＲＬに基づいて分類される利用形態を表す種別毎に設定される請求項１１に記載のＩＤ割当装置。

【請求項13】

複数の個人ウェブサイトそれぞれに対して、コンピュータが管理者ＩＤを割り当てるＩＤ割当方法であって、
前記コンピュータが前記複数の個人ウェブサイト、及び当該複数の個人ウェブサイト間におけるハイパーリンクによる隣接関係を示したリンク情報を記憶し、
前記リンク情報に基づいて、２つの個人ウェブサイトが共通の隣接する個人ウェブサイトを有する程度を示す第１の指標を算出する算出ステップと、
前記第１の指標に基づいて、１以上の個人ウェブサイトからなるクラスタの集合を生成する生成ステップと、
前記複数の個人ウェブサイトに対して、前記クラスタ毎に異なり、かつ、当該クラスタ内で同一の管理者ＩＤを割り当てる割当ステップと、を実行する方法。

【請求項14】

複数の個人ウェブサイトそれぞれに対して、コンピュータに管理者ＩＤを割り当てさせるためのＩＤ割当プログラムであって、
前記コンピュータは、前記複数の個人ウェブサイト、及び当該複数の個人ウェブサイト間におけるハイパーリンクによる隣接関係を示したリンク情報を記憶し、
前記リンク情報に基づいて、２つの個人ウェブサイトが共通の隣接する個人ウェブサイトを有する程度を示す第１の指標を算出する算出ステップと、
前記第１の指標に基づいて、１以上の個人ウェブサイトからなるクラスタの集合を生成する生成ステップと、
前記複数の個人ウェブサイトに対して、前記クラスタ毎に異なり、かつ、当該クラスタ内で同一の管理者ＩＤを割り当てる割当ステップと、を実行させるためのＩＤ割当プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、ウェブサイトにＩＤを割り当てる装置、方法及びプログラムに関する。

【背景技術】

【0002】

従来、インターネット上で公開されているウェブサイトの中には、オフラインの個人が設定した１又は複数のオンラインの個人により管理される個人ウェブサイトが存在する。
ここで、オフラインの個人とは、ネットワーク（インターネット）を利用する現実のユーザそれぞれをいい、ネットワーク上でオンラインの個人を管理している。オンラインの個人とは、ネットワークを通じて所定のサービス群の提供を受ける仮想のユーザをいい、オフラインの個人とオンラインの個人とは、１対１又は１対多の関係にある。
近年、特に中学生や高校生の間では、各人が複数のオンラインの個人を操り、それぞれのオンラインの個人で複数の個人ウェブサイトを作成し、自身のサイト間のみならず、他者とのサイト間で互いにハイパーリンクを設け、情報やメッセージの公開及び交換を行うことが多い。

【0003】

ところで、このように相互にリンクが設けられているウェブサイトのリンク構造を解析する技術も提案されている。例えば、特許文献１では、リンク構造を解析してコミュニティの境界を判定することが示されている。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】特開２００６−３３１０７０号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

特許文献１の手法は、ウェブサイトのリンクを抽出し、リンク先のウェブサイトを再帰的に、リンクがなくなるまで収集するものであるため、リンクで紐付けられている全てのウェブサイトが同一のコミュニティとみなされる。

【0006】

ところが、上述のオンラインの個人は、互いにリンクされた複数の個人ウェブサイトを管理しているが、これらの個人ウェブサイトには、同一のオンラインの個人を特定する情報（ＩＤ）が含まれていない。また、個人ウェブサイトは、上述のように、他のオンラインの個人が管理する個人ウェブサイトともリンクで紐付けられている。したがって、リンクの有無からだけでは、同一のオンラインの個人が管理する個人ウェブサイトを特定することはできなかった。

【0007】

そこで、オンラインの個人による複数の個人ウェブサイトの管理方法に関する事例に基づいて、ある条件を仮定することにより、複数の個人ウェブサイトを管理者であるオンラインの個人毎に分類する手法も考えられる。
しかしながら、この仮定された条件に合致しない事例が出現すると、分類の精度が低下してしまうという課題があった。

【0008】

本発明は、複数の個人ウェブサイトを、管理者であるオンラインの個人毎に分類できるＩＤ割当装置、方法及びプログラムを提供することを目的とする。

【課題を解決するための手段】

【0009】

本発明では、以下のような解決手段を提供する。

【0010】

（１）複数の個人ウェブサイト、及び当該複数の個人ウェブサイト間におけるハイパーリンクによる隣接関係を示したリンク情報を記憶する記憶部と、前記リンク情報に基づいて、２つの個人ウェブサイトが共通の隣接する個人ウェブサイトを有する程度を示す第１の指標を算出する算出部と、前記第１の指標に基づいて、１以上の個人ウェブサイトからなるクラスタの集合を生成する第１の生成部と、前記複数の個人ウェブサイトに対して、前記クラスタ毎に異なり、かつ、当該クラスタ内で同一の管理者ＩＤを割り当てる割当部と、を備えるＩＤ割当装置。

【0011】

このような構成によれば、ＩＤ割当装置は、２つの個人ウェブサイトが共通の隣接する個人ウェブサイトを有する程度を示す指標に基づいて、複数の個人ウェブサイトからクラスタの集合を生成する。ＩＤ割当装置は、これらのクラスタに対して別々の管理者ＩＤを割り当てることにより、複数の個人ウェブサイトを、管理者であるオンラインの個人毎に分類できる。したがって、ＩＤ割当装置は、普遍的な指標を用いることにより、同一管理者の個人ウェブサイトを、より正確に推定できる。
この結果、ＩＤ割当装置は、同一のオンラインの個人が管理する個人ウェブサイトに関する情報を容易に取得できるので、教師や保護者等は、このＩＤ割当装置を子供達（特に中高生）が作成した個人ウェブサイトの監視に役立てることができる。

【0012】

（２）前記算出部は、前記隣接する個人ウェブサイトとして自身を含めて、前記第１の指標を算出する（１）に記載のＩＤ割当装置。

【0013】

このような構成によれば、ＩＤ割当装置は、隣接する個人ウェブサイトとして自身を含める。同一管理者の個人ウェブサイトは、互いに隣接していることが多いので、隣接している個人ウェブサイトのペアに対して重み付けされることにより、ＩＤ割当装置は、同一管理者の個人ウェブサイトを、より正確に推定できる。

【0014】

（３）前記第１の生成部は、前記第１の指標が所定以上に大きい個人ウェブサイトの組み合わせを同一のクラスタに含める（１）又は（２）に記載のＩＤ割当装置。

【0015】

このような構成によれば、ＩＤ割当装置は、第１の指標が所定以上に大きい個人ウェブサイトの組み合わせを同一のクラスタに含めるので、所定以上に類似した隣接関係を持つ個人ウェブサイトの管理者が同一であるとして、容易にクラスタを生成できる。

【0016】

（４）前記第１の生成部は、前記クラスタに属する個人ウェブサイトと当該クラスタ外の個人ウェブサイトとの組み合わせに関する前記第１の指標を、所定の規則に従ってクラスタとクラスタ、又はクラスタと個人ウェブサイトの組み合わせに関する第２の指標に統合し、前記第１の指標又は前記第２の指標に基づいて、個人ウェブサイトと個人ウェブサイト、個人ウェブサイトとクラスタ、又はクラスタとクラスタとを結合したクラスタを生成する処理を、前記第１の指標及び前記第２の指標が所定値に満たなくなるまで繰り返す（１）又は（２）に記載のＩＤ割当装置。

【0017】

このような構成によれば、ＩＤ割当装置は、第１の指標を、クラスタとクラスタ、又はクラスタと個人ウェブサイトの組み合わせに関する第２の指標に統合し、この第２の指標に基づいて、これらの組み合わせを結合したクラスタを生成できる。したがって、ＩＤ割当装置は、第１の指標を基にして、管理者が同一のクラスタを順次生成、拡大させることにより、管理者ＩＤを割り当てることができる。

【0018】

（５）前記第１の生成部は、前記クラスタに属する個人ウェブサイトと当該クラスタ外の個人ウェブサイトとの組み合わせに関する前記第１の指標の最大値を前記第２の指標とする（４）に記載のＩＤ割当装置。

【0019】

このような構成によれば、ＩＤ割当装置は、クラスタが生成された際に、このクラスタとの組み合わせに関する第２の指標を、クラスタに属する個人ウェブサイトとの組み合わせに関する指標の最大値として容易に求めることができる。

【0020】

（６）前記複数の個人ウェブサイトそれぞれのＵＲＬに基づいて分類される利用形態を表す所定数の種別、及び前記ハイパーリンクの入出力関係の構造に基づいて、予め設定されている所定の入出力の関係にある所定種別の個人ウェブサイトの組み合わせを結合して前記クラスタを生成する第２の生成部を備える（１）から（５）のいずれかに記載のＩＤ割当装置。

【0021】

このような構成によれば、ＩＤ割当装置は、予め設定されている所定の入出力の関係にある所定種別の個人ウェブサイトの組み合わせを結合してクラスタを生成する。したがって、ＩＤ割当装置は、事例に基づく所定の条件を加味して、より正確に管理者ＩＤを割り当てることができる。

【0022】

（７）前記複数の個人ウェブサイトそれぞれのＵＲＬにより識別可能なサービスプロバイダのアカウントに基づいて、当該アカウントが同一の個人ウェブサイトを結合して前記クラスタを生成する第３の生成部を備える（１）から（６）のいずれかに記載のＩＤ割当装置。

【0023】

このような構成によれば、ＩＤ割当装置は、サービスプロバイダのアカウントが同一の個人ウェブサイトを結合してクラスタを生成するので、より正確に管理者ＩＤを割り当てることができる。

【0024】

（８）前記算出部は、前記ハイパーリンクの入次数及び出次数が所定の条件を満たす個人ウェブサイト、及び当該個人ウェブサイトに関する前記リンク情報を除いて、前記第１の指標を算出する（１）から（７）のいずれかに記載のＩＤ割当装置。

【0025】

このような構成によれば、ＩＤ割当装置は、ハイパーリンクの入次数及び出次数が所定の条件によって、特定の種類の個人ウェブサイト及び隣接するハイパーリンクを除外して指標を算出する。したがって、ＩＤ割当装置は、管理者ＩＤの割り当て対象外であるサイトをノイズとして除去できるので、より正確に管理者ＩＤを割り当てることができる。

【0026】

（９）前記入次数又は前記出次数は、隣接する個人ウェブサイトが当該個人ウェブサイトのＵＲＬに基づいて分類される利用形態を表す所定の種別である場合のハイパーリンクの数である（８）に記載のＩＤ割当装置。

【0027】

このような構成によれば、ＩＤ割当装置は、サイトの種別に基づいて管理者ＩＤの割り当て対象外であるサイトをノイズとして、より確実に除去できる。

【0028】

（１０）前記算出部は、前記リンク情報のうち、所定の期間以外に発生したハイパーリンクを除いて、前記第１の指標を算出する（１）から（９）のいずれかに記載のＩＤ割当装置。

【0029】

このような構成によれば、ＩＤ割当装置は、所定の期間以外に発生したハイパーリンクを除いて指標を算出するので、最近の情報、又は特定の期間等に限定して精度を向上させると共に、処理負荷を低減できる。

【0030】

（１１）前記算出部は、前記リンク情報のうち、所定の期間に同一の個人ウェブサイト間で発生したハイパーリンクの数が所定数に満たない場合、当該ハイパーリンクを除いて、前記第１の指標を算出する（１）から（１０）のいずれかに記載のＩＤ割当装置。

【0031】

このような構成によれば、ＩＤ割当装置は、所定の期間に同一の個人ウェブサイト間で発生したハイパーリンクの数が所定数に満たない場合、これらのハイパーリンクを除いて指標を算出する。したがって、ＩＤ割当装置は、所定以上の強さで結び付いているハイパーリンクを対象としてノイズを除去するので、より確実に管理者の同一を判定できる。

【0032】

（１２）前記所定数は、前記ハイパーリンクのリンク元の個人ウェブサイトのＵＲＬに基づいて分類される利用形態を表す種別毎に設定される（１１）に記載のＩＤ割当装置。

【0033】

このような構成によれば、ＩＤ割当装置は、リンク元の種別毎にハイパーリンクの強さの閾値を設定するので、利用形態によって異なるハイパーリンクの発生傾向に対応して、より確実にノイズを除去できる。

【0034】

（１３）複数の個人ウェブサイトそれぞれに対して、コンピュータが管理者ＩＤを割り当てるＩＤ割当方法であって、前記コンピュータが前記複数の個人ウェブサイト、及び当該複数の個人ウェブサイト間におけるハイパーリンクによる隣接関係を示したリンク情報を記憶し、前記リンク情報に基づいて、２つの個人ウェブサイトが共通の隣接する個人ウェブサイトを有する程度を示す第１の指標を算出する算出ステップと、前記第１の指標に基づいて、１以上の個人ウェブサイトからなるクラスタの集合を生成する生成ステップと、前記複数の個人ウェブサイトに対して、前記クラスタ毎に異なり、かつ、当該クラスタ内で同一の管理者ＩＤを割り当てる割当ステップと、を実行する方法。

【0035】

このような構成によれば、ＩＤ割当方法をコンピュータが実行することにより、（１）と同様の効果が期待できる。

【0036】

（１４）複数の個人ウェブサイトそれぞれに対して、コンピュータに管理者ＩＤを割り当てさせるためのＩＤ割当プログラムであって、前記コンピュータは、前記複数の個人ウェブサイト、及び当該複数の個人ウェブサイト間におけるハイパーリンクによる隣接関係を示したリンク情報を記憶し、前記リンク情報に基づいて、２つの個人ウェブサイトが共通の隣接する個人ウェブサイトを有する程度を示す第１の指標を算出する算出ステップと、前記第１の指標に基づいて、１以上の個人ウェブサイトからなるクラスタの集合を生成する生成ステップと、前記複数の個人ウェブサイトに対して、前記クラスタ毎に異なり、かつ、当該クラスタ内で同一の管理者ＩＤを割り当てる割当ステップと、を実行させるためのＩＤ割当プログラム。

【0037】

このような構成によれば、ＩＤ割当プログラムをコンピュータに実行させることにより、（１）と同様の効果が期待できる。

【発明の効果】

【0038】

本発明によれば、複数の個人ウェブサイトを、管理者であるオンラインの個人毎に分類できる。

【図面の簡単な説明】

【0039】

【図1】実施形態に係る個人ウェブサイトと、その管理者との関係を示す図である。

【図2】実施形態に係るＯｎＩＤが割り当てられた結果を示す概要図である。

【図3】実施形態に係るＩＤ割当装置の機能構成を示すブロック図である。

【図4】実施形態に係る収集履歴管理テーブルを示す図である。

【図5】実施形態に係るサイト間リレーションテーブルを示す図である。

【図6】実施形態に係る個人ウェブサイト間のＳｉｍｉｌａｒｉｔｙの算出例を示す図である。

【図7】実施形態に係るクラスタ間のＳｉｍｉｌａｒｉｔｙの算出例を示す図である。

【図8】実施形態に係る制御部における処理を示すフローチャートである。

【図9】実施形態に係るＩＤ割当処理の手順を示す第１の図である。

【図10】実施形態に係るＩＤ割当処理の手順を示す第２の図である。

【図11】実施形態に係るＩＤ割当処理の手順を示す第３の図である。

【図12】実施形態に係るＩＤ割当処理の手順を示す第４の図である。

【図13】実施形態に係るＩＤ割当処理の手順を示す第５の図である。

【発明を実施するための形態】

【0040】

以下、本発明の実施形態の一例について説明する。
本実施形態に係るＩＤ割当装置１は、オンラインの個人が管理する個人ウェブサイトに対して、このオンラインの個人を識別するオンラインＩＤを割り当てる装置である。なお、ＩＤ割当装置１は、サーバ装置やＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）等、様々な情報処理装置（コンピュータ）であってよい。

【0041】

図１は、本実施形態に係る個人ウェブサイトと、その管理者との関係を示す図である。
現実の人物であるオフラインの個人は、ネットワーク（インターネット）上で、１又は複数のオンラインの個人を管理している。また、オンラインの個人は、１又は複数の個人ウェブサイトを管理している。

【0042】

各オンラインの個人は、例えば、同じ学校の生徒であったり、同じ趣味を持つグループの一員であったり、オンラインの他者と一定の人間関係を持っている。そのため、複数のオンラインの個人がそれぞれ管理している個人ウェブサイトの間は、ハイパーリンクで参照されていることも多い。

【0043】

ここで、個人ウェブサイトとは、オンラインの個人が、自身に関する情報を公開したり、オンラインの他者とメッセージを交換したりするためのウェブサイトをいう。例えば、以下のタイプの個人ウェブサイトがそれぞれ複数のサービスプロバイダにより提供されている。

【0044】

プロフ（プロフィール）・・・個人のプロフィールを公開できるサイト。
ゲスブ（ゲストブック）・・・訪問者が履歴としてコメントを投稿できるサイト。
リアル（リアルタイム）・・・個人の現況を短い文章で投稿できるサイト。
ブログ・・・日々更新される日記を公開できるサイト。
マイリンク・・・他者の個人ウェブサイトへのリンクを掲載できるサイト。
ホムペ（ホームページ）・・・個人用のサイト。

【0045】

オンラインの個人は、上記の複数のタイプの個人ウェブサイトを、サービスプロバイダ毎に異なるアカウントで作成しているため、同一のＩＤによる紐付け（名寄せ）ができていないことが多い。例えば、「オンラインＩＤ（ＯｎＩＤ）＝１」であるオンラインの個人は、プロフ、ゲスブ及びリアルを管理している。これらの個人ウェブサイトは、「ＯｎＩＤ＝１」の情報を有しておらず、異なるアカウントＩＤ（１及び２）で管理されている。

【0046】

ＩＤ割当装置１は、後述の処理により、管理者であるオンラインの個人が同一である個人ウェブサイトに対して、同一のオンラインＩＤ（ＯｎＩＤ）を割り当て、複数の個人ウェブサイトをオンラインの個人毎に分類する。

【0047】

図２は、本実施形態に係るＩＤ割当装置１によりオンラインＩＤが割り当てられた結果を示す概要図である。

【0048】

以下、本実施形態においてＩＤの割り当ての対象とする個人ウェブサイトは、サイトの利用形態を表す次の３種類の種別（クラスＡ、クラスＢ及びクラスＣ）に分類されるものとする。なお、これらのクラス及び上記のタイプは、個人ウェブサイトのＵＲＬから判別できるものとする。

【0049】

クラスＡ（プロフ、ホムペ）・・・オンラインの個人が他者と識別するために作成する個人ウェブサイト。
クラスＢ（ゲスブ、マイリンク）・・・オンラインの個人がクラスＡのサイトに付随して作成する個人ウェブサイト。
クラスＣ（リアル、ブログ）・・・オンラインの個人が他者と識別するために単体で、又はクラスＡのサイトに付随して作成する個人ウェブサイト。

【0050】

なお、同一の個人ウェブサイトがクラスＡを含んで複数のタイプ（例えば、プロフとマイリンク等）を持つ場合もある。この場合、ＵＲＬから判別されるクラスは、クラスＡとなる。

【0051】

図３は、本実施形態に係るＩＤ割当装置１の機能構成を示すブロック図である。
ＩＤ割当装置１は、制御部１０と、記憶部２０と、通信部３０と、入力部４０と、出力部５０とを備える。

【0052】

制御部１０は、ＩＤ割当装置１の全体を制御する部分であり、記憶部２０に記憶された各種プログラムを適宜読み出して実行することにより、上記のハードウェアと協働し、本実施形態における各種機能を実現している。制御部１０は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）であってよい。なお、制御部１０が備える各部の機能は後述する。

【0053】

記憶部２０は、ハードウェア群をＩＤ割当装置１として機能させるための各種プログラム、及び各種データ等の記憶領域であり、ハードディスク（ＨＤＤ）であってよい。具体的には、記憶部２０には、本実施形態の各種機能を実現させるため制御部１０に実行させるプログラム（ＩＤ割当プログラム）が記憶される。

【0054】

さらに、記憶部２０は、サイト保存ＤＢ２１と、サイト管理ＤＢ２２とを備える。サイト保存ＤＢ２１は、プログラムにて取得される個人ウェブサイトのページデータ（ＨＴＭＬファイル群）を記憶する。また、サイト管理ＤＢ２２は、プログラムにて作成又は編集される後述の収集履歴管理テーブル及びサイト間リレーションテーブルを記憶する。

【0055】

通信部３０は、ＩＤ割当装置１が他の装置と情報を送受信する場合のネットワーク・アダプタであり、ネットワーク（インターネット）を介して個人ウェブサイトを管理しているサーバ１００にアクセスし、個人ウェブサイトのページデータを取得して制御部１０へ提供する。

【0056】

入力部４０は、ＩＤ割当装置１に対する利用者からの指示入力を受け付けるインタフェース装置である。入力部４０は、例えば、キーボード、マウス及びタッチパネル等により構成される。

【0057】

出力部５０は、利用者にデータの入力を受け付ける画面を表示したり、ＩＤ割当装置１による処理結果の画面を表示したりするディスプレイ装置を含む。さらに、出力部５０は、ブラウン管表示装置（ＣＲＴ）や液晶表示装置（ＬＣＤ）等のディスプレイ装置の他、プリンタ等の各種出力装置を含んでよい。

【0058】

次に、制御部１０の機能を詳述する。
まず、本実施形態において使用する記号を説明する。
−個人ウェブサイトのネットワーク（有向グラフ）：Ｇ＝（Ｖ，Ｅ）
・個人ウェブサイト（ノード）：ｖ_ｉ∈Ｖ，（ｉ＝１，２，・・・，｜Ｖ｜）
個人ウェブサイトの数（グラフのサイズ）：｜Ｖ｜
・ｖ_ｉからｖ_ｊへのハイパーリンク：（ｖ_ｉ，ｖ_ｊ）∈Ｅ，（ｖ_ｉ，ｖ_ｊ∈Ｖ）
ハイパーリンクの数：｜Ｅ｜
−個人ウェブサイトの属性
・ＵＲＬ：ＵＲＬ（ｖ_ｉ）
・タイプ：ＴＹＰＥ（ｖ_ｉ）
・クラス：Ｃ（ｖ_ｉ）
・サービスプロバイダ：ＳＰ（ｖ_ｉ）
・アカウントＩＤ：ＡＣＩＤ（ｖ_ｉ）
・管理者のＩＤ（ＯｎＩＤ）：ＯＮＩＤ（ｖ_ｉ）
−ハイパーリンクの属性
・ハイパーリンクの強さ：｜（ｖ_ｉ，ｖ_ｊ）｜
具体的には、ｖ_ｉからｖ_ｊへのハイパーリンクの本数を表す。
・時刻ｔ０，ｔ１間のハイパーリンクの強さ：｜（ｖ_ｉ，ｖ_ｊ）｜_{ｔ０→ｔ１}
ブログ、リアル、ゲスブでのコメント投稿で発生するハイパーリンク等、時刻情報を持つハイパーリンクのうち、指定された期間内（時刻ｔ０からｔ１まで）のハイパーリンクの本数を表す。ただし、プロフ、ホムペ、マイリンクで発生するハイパーリンク等、時刻情報を持たないハイパーリンクは、全期間において発生しているものとみなす。

【0059】

制御部１０は、サイト収集部１１（収集部）と、メトリック算出部１２（算出部）と、アカウントクラスタ生成部１３ａ（第３の生成部）と、種別クラスタ生成部１３ｂ（第２の生成部）と、メトリッククラスタ生成部１３ｃ（第１の生成部）と、ＩＤ割当部１４（割当部）と、アプリケーション部１５とを備える。各部は、ＩＤ割当プログラムを実行することにより実現される機能ブロックである。

【0060】

サイト収集部１１は、個人ウェブサイトに含まれるハイパーリンクを抽出し、さらにこのハイパーリンクの参照先である別の個人ウェブサイトのページデータを取得する。そして、サイト収集部１１は、サイト保存ＤＢ２１にページデータを記憶すると共に、複数の個人ウェブサイトのリスト（収集履歴管理テーブル）、並びに複数の個人ウェブサイト間におけるハイパーリンクによる隣接関係及び入出力関係を示したリンク情報のリスト（サイト間リレーションテーブル）にそれぞれデータ追加し、サイト管理ＤＢ２２を更新する。

【0061】

例えば、サイト収集部１１は、まず、収集処理の元になるルートの個人ウェブサイトのＵＲＬと、このルートの個人ウェブサイトからハイパーリンク（ＨＴＭＬにおける＜ａ＞リンク）を幾つ辿るか（リンクホップ数）等の収集範囲の指定とを受け付ける。

【0062】

次に、サイト収集部１１は、インターネットにアクセスし、ルートの個人ウェブサイトのページデータをサイト保存ＤＢ２１に記憶する。さらに、このルートの個人ウェブサイトのＵＲＬを、収集履歴管理テーブルに追加する。

【0063】

また、サイト収集部１１は、個人ウェブサイトからハイパーリンクを取得し、リンク先が個人ウェブサイトでないものを除いて、リンク元のＵＲＬとリンク先のＵＲＬとの組合せをサイト間リレーションテーブルに追加する。

【0064】

さらに、サイト収集部１１は、リンク先のＵＲＬから取得した個人ウェブサイトのページデータをサイト保存ＤＢ２１に、このＵＲＬを収集履歴管理テーブルにそれぞれ記憶する。そして、サイト収集部１１は、指定された収集範囲まで、全てのＵＲＬが収集履歴管理テーブルに記憶されると収集処理を終了する。また、サイト収集部１１は、指定された収集範囲までＵＲＬを収集できていない場合には、ハイパーリンクの取得、サイト間リレーションテーブルの更新、ページデータの記憶及び収集履歴管理テーブルの更新を繰り返す。

【0065】

図４は、本実施形態に係るサイト管理ＤＢ２２に格納される収集履歴管理テーブルを示す図である。

【0066】

収集履歴管理テーブルは、収集ＩＤ、ルートＵＲＬ、リンク元ＵＲＬ、個人ウェブサイトＵＲＬ、個人ウェブサイトのクラス、保存先、サイトホップ数、管理者ＩＤ（ＯｎＩＤ）及び収集日時を記憶する。

【0067】

ここで、収集ＩＤは、上記の収集処理毎に付与される識別番号である。ルートＵＲＬは、収集処理を行うために指定された個人ウェブサイトのＵＲＬである。保存先は、サイト保存ＤＢ２１内における対象の個人ウェブサイトの記憶場所を示すＵＲＬである。ＯｎＩＤは、後述のＩＤ割当部１４によって割り当てられるオンラインの個人を識別するＩＤである。

【0068】

また、サイトホップ数は、指定された個人ウェブサイトをルートノードとし、リンクされた隣接する個人ウェブサイト間のハイパーリンクを１ホップとしたときの、ルートノードからのホップ数である。

【0069】

図５は、本実施形態に係るサイト管理ＤＢ２２に格納されるサイト間リレーションテーブルを示す図である。

【0070】

サイト間リレーションテーブルは、収集ＩＤと、リンク元の個人ウェブサイト及びリンク先の個人ウェブサイトそれぞれのＵＲＬ、タイプ、クラス、サービスプロバイダの識別データ（ＳＰ）、及びサービスプロバイダにおけるアカウントＩＤ（ＡＣＩＤ）と、ハイパーリンクの発生日時と、収集日時とを記憶する。

【0071】

なお、ＳＰ及びＡＣＩＤは、個人ウェブサイトのＵＲＬによって識別される。ここで、同一のＳＰにおいてＡＣＩＤが同一であれば、管理者（オンラインの個人）は同一であると見なせるが、ＳＰが異なれば、ＡＣＩＤが同一であっても管理者が同一であるとは限らない。

【0072】

また、ハイパーリンクの発生日時は、個人ウェブサイトへのコメント投稿等によりハイパーリンクが書き込まれた日時である。なお、個人ウェブサイトの作成時から存在するハイパーリンク等、時刻情報が紐付いていないハイパーリンクの場合、発生日時は特定されないが、全期間において発生しているものとみなして後述の処理で利用する。

【0073】

メトリック算出部１２は、サイト間リレーションテーブルのリンク情報に基づいて、２つの個人ウェブサイトが共通の隣接する個人ウェブサイトを有する程度を示すメトリック（第１の指標）を算出する。

【0074】

具体的には、ｖ_ｉとｖ_ｊのメトリックとして、以下に示す２種類の類似度（Ｓｉｍｉｌａｒｉｔｙ）のいずれかが用いられる。
（１）Ｓｉｍｉｌａｒｉｔｙ＝｜Γ（ｖ_ｉ）∩Γ（ｖ_ｊ）｜／｜Ｖ｜
ただし、
Γ（ｖ_ｉ）＝｛ｗ｜（ｖ_ｉ，ｗ）∈Ｅｏｒ（ｗ，ｖ_ｉ）∈Ｅ｝
は、隣接する個人ウェブサイト（隣接ノード）の集合であり、ハイパーリンクの向きに依存しない。また、
｜Γ（ｖ_ｉ）∩Γ（ｖ_ｊ）｜
は、共通の隣接ノードの数である。

【0075】

（２）Ｓｉｍｉｌａｒｉｔｙ＝｜Γ^＋（ｖ_ｉ）∩Γ^＋（ｖ_ｊ）｜／｜Ｖ｜
ただし、
Γ^＋（ｖ_ｉ）＝｛ｗ｜（ｖ_ｉ，ｗ）∈Ｅｏｒ（ｗ，ｖ_ｉ）∈Ｅ｝∪｛ｖ_ｉ｝
は、Γ（ｖ_ｉ）と同様に隣接ノードの集合であるが、自ノード（ｖ_ｉ）を含む。また、
｜Γ^＋（ｖ_ｉ）∩Γ^＋（ｖ_ｊ）｜
は、共通の隣接ノードの数である。

【0076】

図６は、本実施形態に係る個人ウェブサイト間のＳｉｍｉｌａｒｉｔｙの算出例を示す図である。
７つのノードが図のようにハイパーリンクによって隣接している。具体的には、算出方法（１）の場合、ノードｖ_１及びノードｖ_２の隣接ノードは、
Γ（ｖ_１）＝｛ｖ_２，ｖ_３，ｖ_４，ｖ_５，ｖ_６｝
Γ（ｖ_２）＝｛ｖ_１，ｖ_３，ｖ_４，ｖ_５｝
である。このとき、共通の隣接ノードは、
Γ（ｖ_１）∩Γ（ｖ_２）＝｛ｖ_３，ｖ_４，ｖ_５｝
である。したがって、
Ｓｉｍｉｌａｒｉｔｙ＝３／７
となる。

【0077】

また、算出方法（２）の場合、ノードｖ_１及びノードｖ_２の隣接ノードは、
Γ^＋（ｖ_１）＝｛ｖ_１，ｖ_２，ｖ_３，ｖ_４，ｖ_５，ｖ_６｝
Γ^＋（ｖ_２）＝｛ｖ_１，ｖ_２，ｖ_３，ｖ_４，ｖ_５｝
である。このとき、共通の隣接ノードは、
Γ^＋（ｖ_１）∩Γ^＋（ｖ_２）＝｛ｖ_１，ｖ_２，ｖ_３，ｖ_４，ｖ_５｝
である。したがって、
Ｓｉｍｉｌａｒｉｔｙ＝５／７
となる。

【0078】

なお、いずれの算出方法も、同一管理者の個人ウェブサイトは、共通の隣接ノードを多数保有する傾向があることに基づいている。
以下、自ノードを含む（２）の算出方法を用いて説明する。

【0079】

また、メトリック算出部１２は、ハイパーリンクの入次数及び出次数が所定の条件を満たす個人ウェブサイト、及びこの個人ウェブサイトに関するリンク情報を除いて、Ｓｉｍｉｌａｒｉｔｙを算出する。
ここで、入次数又は出次数は、隣接する個人ウェブサイトが所定のクラス又はタイプである場合のハイパーリンクの数に限定してもよい。

【0080】

また、メトリック算出部１２は、リンク情報のうち、所定の期間（例えば、過去１年間）以外に発生したハイパーリンクを除いて、Ｓｉｍｉｌａｒｉｔｙを算出する。
さらに、メトリック算出部１２は、リンク情報のうち、所定の期間に同一の個人ウェブサイト間で発生したハイパーリンクの強さが所定値に満たない場合、このハイパーリンクを除いて、Ｓｉｍｉｌａｒｉｔｙを算出する。なお、所定値は、ハイパーリンクのリンク元のクラス又はタイプ毎に設定される。

【0081】

アカウントクラスタ生成部１３ａは、複数の個人ウェブサイトそれぞれのＵＲＬにより識別可能なサービスプロバイダのアカウントＩＤ（ＡＣＩＤ）に基づいて、このＡＣＩＤが同一の個人ウェブサイトを結合してクラスタを生成する。

【0082】

種別クラスタ生成部１３ｂは、複数の個人ウェブサイトそれぞれのクラス、及びハイパーリンクの入出力関係の構造に基づいて、予め設定されている所定の入出力の関係にある所定クラスの個人ウェブサイトの組み合わせを結合してクラスタを生成する。

【0083】

例えば、種別クラスタ生成部１３ｂは、経験則に基づく以下の仮説（Ａ）、（Ｂ）に基づいて、クラスＡからクラスＢへのハイパーリンクがある場合に、このハイパーリンクのリンク元及びリンク先の個人ウェブサイトを結合してクラスタを生成する。
（Ａ）管理者は、クラスＡの個人ウェブサイトから他者の個人ウェブサイトへハイパーリンクを張らない。
（Ｂ）管理者は、自身の個人ウェブサイトから他者のクラスＢの個人ウェブサイトへハイパーリンクを張らない。

【0084】

メトリッククラスタ生成部１３ｃは、メトリックに基づいて、Ｓｉｍｉｌａｒｉｔｙが所定以上に大きい個人ウェブサイトの組み合わせを同一のクラスタに含めることにより、１以上の個人ウェブサイトからなるクラスタの集合を生成する。

【0085】

具体的には、メトリッククラスタ生成部１３ｃは、クラスタに属する個人ウェブサイトと、このクラスタ外の個人ウェブサイトとの組み合わせに関するＳｉｍｉｌａｒｉｔｙ（第１の指標）を、所定の規則に従ってクラスタとクラスタ、又はクラスタと個人ウェブサイトの組み合わせに関するＳｉｍｉｌａｒｉｔｙ（第２の指標）に統合する。そして、メトリッククラスタ生成部１３ｃは、これら第１の指標又は前記第２の指標が大きいものから順に、個人ウェブサイトと個人ウェブサイト、個人ウェブサイトとクラスタ、又はクラスタとクラスタとを結合したクラスタを生成する処理を、第１の指標及び前記第２の指標が所定値に満たなくなるまで繰り返す。

【0086】

なお、本実施形態において、第２の指標は、クラスタに属する個人ウェブサイトと、このクラスタ外の個人ウェブサイトとの組み合わせに関する第１の指標の最大値とする。

【0087】

図７は、本実施形態に係るクラスタ間のＳｉｍｉｌａｒｉｔｙの算出例を示す図である。
ノードｖ_１及びｖ_２からなるクラスタＣＬ（ｖ_１，ｖ_２）と、ノードｖ_３及びｖ_４からなるクラスタＣＬ（ｖ_３，ｖ_４）との組み合わせに関するＳｉｍｉｌａｒｉｔｙ（第２の指標）は、各ノード間のＳｉｍｉｌａｒｉｔｙ（第１の指標）から求められる。

【0088】

ここで、各ノード間のＳｉｍｉｌａｒｉｔｙは、
｜Γ^＋（ｖ_１）∩Γ^＋（ｖ_３）｜／｜Ｖ｜＝４／７
｜Γ^＋（ｖ_２）∩Γ^＋（ｖ_３）｜／｜Ｖ｜＝４／７
｜Γ^＋（ｖ_１）∩Γ^＋（ｖ_４）｜／｜Ｖ｜＝５／７
｜Γ^＋（ｖ_２）∩Γ^＋（ｖ_４）｜／｜Ｖ｜＝５／７
である。したがって、これらの最大値を用いて、クラスタ間のＳｉｍｉｌａｒｉｔｙは、
Ｓｉｍｉｌａｒｉｔｙ＝５／７
となる。

【0089】

ＩＤ割当部１４は、複数の個人ウェブサイトに対して、クラスタ毎に異なり、かつ、クラスタ内で同一の管理者ＩＤ（ＯｎＩＤ）を割り当て、収集履歴管理テーブルを更新する。

【0090】

アプリケーション部１５は、入力部４０を介して利用者からの指示入力を受け付け、サイト管理ＤＢ２２に蓄積された情報を出力部５０へ出力して利用者に提供する。具体的には、アプリケーション部１５は、収集履歴管理テーブル及びサイト間リレーションテーブルに基づいて、個人ウェブサイト間のハイパーリンク、又はクラスタ間のハイパーリンク、さらにはその強さを可視化して出力する。これにより、管理者であるオンラインの個人のネットワークが可視化される。

【0091】

次に、ＯｎＩＤを割り当てる処理の手順を詳述する。
図８は、本実施形態に係る制御部１０における処理を示すフローチャートである。
なお、処理対象とする範囲の個人ウェブサイトの収集は終了し、サイト管理ＤＢ２２に記憶されているものとする。ただし、収集履歴管理テーブルのＯｎＩＤは空欄である。

【0092】

ステップＳ１において、制御部１０は、サイト管理ＤＢ２２からＧ（Ｖ，Ｅ）のデータを取得する。

【0093】

ステップＳ２において、制御部１０（メトリック算出部１２）は、ステップＳ１で取得したＧ（Ｖ，Ｅ）の中から、入次数がＡＤ＿Ｄｅｇ＿｛ｉｎ｝以上で、かつ出次数がＡＤ＿Ｄｅｇ＿｛ｏｕｔ｝以下のノード及び接するリンクを除去する。

【0094】

ここで、広告サイト等、不特定の相手に自身がリンク先となるハイパーリンクを多数発生させるが、逆向きのハイパーリンクはほとんど発生しないサイトを除去するために、例えば、「ＡＤ＿Ｄｅｇ＿｛ｉｎ｝＝１０００」、「ＡＤ＿Ｄｅｇ＿｛ｏｕｔ｝＝５」といった値が用いられる。このとき、リンク元をクラスＢ又はクラスＣに限定してもよい。

【0095】

また、詩や歌詞等を公開しているサイトは、不特定の相手のクラスＡの個人ウェブサイトから多数の参照を受けるため、例えば、「ＡＤ＿Ｄｅｇ＿｛ｉｎ｝＝５００」、「ＡＤ＿Ｄｅｇ＿｛ｏｕｔ｝＝１０」といった値が用いられる。このとき、リンク元をクラスＡに限定してもよい。

【0096】

ステップＳ３において、制御部１０（メトリック算出部１２）は、ステップＳ１で取得したＧ（Ｖ，Ｅ）の中から、出次数がＣＥＬＥＢ＿Ｄｅｇ＿｛ｏｕｔ｝以上のノード及び接するリンクを除去する。また、入次数がＣＥＬＥＢ＿Ｄｅｇ＿｛ｉｎ｝以下の条件を付加してもよい。

【0097】

ここで、有名人の個人ウェブサイトは、特にクラスＢ又はクラスＣの個人ウェブサイトに不特定の相手から多数のコメントを受けるため、自身がリンク元となるハイパーリンクが多数発生する。そこで、例えば、「ＣＥＬＥＢ＿Ｄｅｇ＿｛ｏｕｔ｝＝１００００」、「ＣＥＬＥＢ＿Ｄｅｇ＿｛ｉｎ｝＝１００」といった値が用いられる。このとき、リンク元をクラスＢ又はクラスＣに限定してもよい。

【0098】

ステップＳ４において、制御部１０（メトリック算出部１２）は、ステップＳ１で取得したＧ（Ｖ，Ｅ）の中から、指定した期間（例えば、過去１年間）でのハイパーリンクの強さがＳｔｒｅｎｇｔｈ以下のリンクを除去する。このＳｔｒｅｎｇｔｈは、リンク元のクラス毎に予め設定される。

【0099】

ステップＳ５において、制御部１０（メトリック算出部１２）は、Ｇ（Ｖ，Ｅ）内の全てのノードのペアについて、Ｓｉｍｉｌａｒｉｔｙを算出する。

【0100】

ステップＳ６において、制御部１０（アカウントクラスタ生成部１３ａ）は、個人ウェブサイトのＵＲＬから識別されるアカウントＩＤ（ＡＣＩＤ）が共通のノードがある場合、これらのノードを含む新たなクラスタを生成する。このとき、ノードが既にクラスタに属している場合、制御部１０（アカウントクラスタ生成部１３ａ）は、このクラスタに属している全てのノードを含む新たなクラスタを生成する。

【0101】

ステップＳ７において、制御部１０（種別クラスタ生成部１３ｂ）は、クラスＡからクラスＢへのハイパーリンクがある場合、このハイパーリンクの両端のノードを含む新たなクラスタを生成する。このとき、ノードが既にクラスタに属している場合、制御部１０（種別クラスタ生成部１３ｂ）は、このクラスタに属している全てのノードを含む新たなクラスタを生成する。

【0102】

ステップＳ８において、制御部１０（メトリッククラスタ生成部１３ｃ）は、全てのノード及びクラスタのペアの中で最もＳｉｍｉｌａｒｉｔｙが高いペアを結合し、新たなクラスタを生成する。

【0103】

ステップＳ９において、制御部１０（メトリッククラスタ生成部１３ｃ）は、全てのノード及びクラスタのペアのＳｉｍｉｌａｒｉｔｙが閾値Ｔｈ未満か否かを判定する。この判定がＹＥＳの場合、処理はステップＳ１０に移り、判定がＮＯの場合、処理はステップＳ８に戻ってクラスタの生成が繰り返される。

【0104】

ステップＳ１０において、制御部１０（ＩＤ割当部１４）は、各ノード及びクラスタに対して、それぞれに固有のＯｎＩＤを割り当てる。

【0105】

なお、上記のＴｈ、ＡＤ＿Ｄｅｇ＿｛ｉｎ｝、ＡＤ＿Ｄｅｇ＿｛ｏｕｔ｝、ＣＥＬＥＢ＿Ｄｅｇ＿｛ｏｕｔ｝、ＣＥＬＥＢ＿Ｄｅｇ＿｛ｉｎ｝、期間、Ｓｔｒｅｎｇｔｈは、入力部４０を介して利用者から予め受け付ける。

【0106】

図９〜図１３は、本実施形態に係るＯｎＩＤの割当処理の手順を示す図である。
図９のように、７つの個人ウェブサイト（ノード）がハイパーリンクによってリンクされているものとする。
Ｖ＝｛ｖ_１，ｖ_２，ｖ_３，ｖ_４，ｖ_５，ｖ_６，ｖ_７｝
ただし、ｖ_１，ｖ_７：クラスＡ、ｖ_２，ｖ_６：クラスＢ、ｖ_３，ｖ_４，ｖ_５：クラスＣ
Ｅ＝｛（ｖ_１，ｖ_２），（ｖ_２，ｖ_３），（ｖ_２，ｖ_４），（ｖ_２，ｖ_５），（ｖ_３，ｖ_１），（ｖ_３，ｖ_４），（ｖ_４，ｖ_１），（ｖ_４，ｖ_５），（ｖ_５，ｖ_１），（ｖ_６，ｖ_１），（ｖ_６，ｖ_７），（ｖ_７，ｖ_６）｝

【0107】

このとき、各ノードの組み合わせ２１通りのＳｉｍｉｌａｒｉｔｙは、表のように、「０／７」から「５／７」の範囲で算出される。
以下、クラスタ生成時の閾値は、「Ｔｈ＝５／７」であるとする。

【0108】

まず、図１０のように、クラスＡからクラスＢへのハイパーリンク（ｖ_１，ｖ_２）について、両端のノードを結合したクラスタＣＬ（ｖ_１，ｖ_２）が生成される。
このとき、Ｓｉｍｉｌａｒｉｔｙの表において、ノードｖ_１及びｖ_２が削除されると共に、これらがクラスタＣＬ（ｖ_１，ｖ_２）に結合される。

【0109】

また、ＣＬ（ｖ_１，ｖ_２）に関するＳｉｍｉｌａｒｉｔｙは、ｖ_１，ｖ_２に関するＳｉｍｉｌａｒｉｔｙの最大値が採用される。例えば、ＣＬ（ｖ_１，ｖ_２）とｖ_３とのペアに対しては、「４／７」となり、ＣＬ（ｖ_１，ｖ_２）とｖ_６とのペアに対しては、「２／７」及び「１／７」の最大値である「２／７」となる。

【0110】

さらに、図１１のように、クラスＡからクラスＢへのハイパーリンク（ｖ_７，ｖ_６）について、両端のノードを結合したクラスタＣＬ（ｖ_６，ｖ_７）が生成される。
このとき、Ｓｉｍｉｌａｒｉｔｙの表において、ノードｖ_６及びｖ_７が削除されると共に、これらがクラスタＣＬ（ｖ_６，ｖ_７）に結合される。

【0111】

次に、図１１において、Ｓｉｍｉｌａｒｉｔｙが最も高いペアであるＣＬ（ｖ_１，ｖ_２）とｖ_４との組み合わせが結合され、図１２のように、新たなクラスタＣＬ（ｖ_１，ｖ_２，ｖ_４）が生成される。

【0112】

この結果、図１２において、Ｓｉｍｉｌａｒｉｔｙが全て閾値Ｔｈ＝５を下回ったので、クラスタの生成は終了する。
そして、図１３のように、各ノード及びクラスタに対して、４つのＯｎＩＤが割り当てられる。

【0113】

以上のように、本実施形態によれば、ＩＤ割当装置１は、２つの個人ウェブサイトが共通の隣接する個人ウェブサイトを有する程度を示す指標（メトリック）であるＳｉｍｉｌａｒｉｔｙに基づいて、複数の個人ウェブサイトからクラスタの集合を生成する。ＩＤ割当装置１は、これらのクラスタに対して別々の管理者ＩＤを割り当てることにより、複数の個人ウェブサイトを、管理者であるオンラインの個人毎に分類できる。したがって、ＩＤ割当装置１は、普遍的なメトリックを用いることにより、同一管理者の個人ウェブサイトを、より正確に推定できる。
この結果、ＩＤ割当装置１は、同一のオンラインの個人が管理する個人ウェブサイトに関する情報を容易に取得できるので、教師や保護者等は、このＩＤ割当装置１を子供達（特に中高生）が作成した個人ウェブサイトの監視に役立てることができる。

【0114】

また、ＩＤ割当装置１は、隣接する個人ウェブサイトとして自身を含める。同一管理者の個人ウェブサイトは、互いに隣接していることが多いので、隣接している個人ウェブサイトのペアに対して重み付けされることにより、ＩＤ割当装置１は、同一管理者の個人ウェブサイトを、より正確に推定できる。

【0115】

また、ＩＤ割当装置１は、第１の指標が所定以上に大きい個人ウェブサイトの組み合わせを同一のクラスタに含めるので、所定以上に類似した隣接関係を持つ個人ウェブサイトの管理者が同一であるとして、容易にクラスタを生成できる。

【0116】

また、ＩＤ割当装置１は、第１の指標を、クラスタとクラスタ、又はクラスタと個人ウェブサイトの組み合わせに関する第２の指標に統合し、この第２の指標に基づいて、これらの組み合わせを結合したクラスタを生成できる。したがって、ＩＤ割当装置１は、第１の指標を基にして、管理者が同一のクラスタを順次生成、拡大させることにより、ＯｎＩＤを割り当てることができる。
さらに、ＩＤ割当装置１は、クラスタが生成された際に、このクラスタとの組み合わせに関する第２の指標を、クラスタに属する個人ウェブサイトとの組み合わせに関する指標の最大値として容易に求めることができる。

【0117】

また、ＩＤ割当装置１は、予め設定されている所定の入出力の関係にある所定クラスの個人ウェブサイトの組み合わせを結合してクラスタを生成する。したがって、ＩＤ割当装置１は、事例に基づく所定の条件を加味して、より正確にＯｎＩＤを割り当てることができる。

【0118】

また、ＩＤ割当装置１は、サービスプロバイダのアカウントが同一の個人ウェブサイトを結合してクラスタを生成するので、より正確にＯｎＩＤを割り当てることができる。

【0119】

また、ＩＤ割当装置１は、ハイパーリンクの入次数及び出次数が所定の条件によって、特定の種類の個人ウェブサイト及び隣接するハイパーリンクを除外してＳｉｍｉｌａｒｉｔｙを算出する。したがって、ＩＤ割当装置１は、ＯｎＩＤの割り当て対象外であるサイトをノイズとして除去できるので、より正確にＯｎＩＤを割り当てることができる。
さらに、ＩＤ割当装置１は、サイトのクラスに基づいてＯｎＩＤの割り当て対象外であるサイトをノイズとして、より確実に除去できる。

【0120】

また、ＩＤ割当装置１は、所定の期間以外に発生したハイパーリンクを除いてＳｉｍｉｌａｒｉｔｙを算出するので、最近の情報、又は特定の期間等に限定して精度を向上させると共に、処理負荷を低減できる。

【0121】

また、ＩＤ割当装置１は、所定の期間に同一の個人ウェブサイト間で発生したハイパーリンクの強さが所定値Ｓｔｒｅｎｇｔｈに満たない場合、これらのハイパーリンクを除いてＳｉｍｉｌａｒｉｔｙを算出する。したがって、ＩＤ割当装置１は、所定以上の強さで結び付いているハイパーリンクを対象としてノイズを除去するので、より確実に管理者の同一を判定できる。
さらに、ＩＤ割当装置１は、リンク元の種別毎にハイパーリンクの強さの閾値であるＳｔｒｅｎｇｔｈを設定するので、利用形態によって異なるハイパーリンクの発生傾向に対応して、より確実にノイズを除去できる。

【0122】

以上、本発明の実施形態について説明したが、本発明は前述した実施形態に限るものではない。また、本実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本実施形態に記載されたものに限定されるものではない。

【0123】

前述の実施形態では、ノードｖ_ｉ及びｖ_ｊに関するメトリックとして、２種類のＳｉｍｉｌａｒｉｔｙのいずれかを用いることとしたが、メトリックは、これらには限られない。例えば、Ｊａｃｃａｒｄ係数を採用して、
（３）Ｓｉｍｉｌａｒｉｔｙ＝｜Γ（ｖ_ｉ）∩Γ（ｖ_ｊ）｜／｜Γ（ｖ_ｉ）∪Γ（ｖ_ｊ）｜
又は、
（４）Ｓｉｍｉｌａｒｉｔｙ＝｜Γ^＋（ｖ_ｉ）∩Γ^＋（ｖ_ｊ）｜／｜Γ^＋（ｖ_ｉ）∪Γ^＋（ｖ_ｊ）｜
としてもよい。このように、分母をｖ_ｉ又はｖ_ｊに隣接したノードの総数とすることにより、ＩＤ割当装置１は、収集したノードの数｜Ｖ｜に依存しない閾値を設定することができる。

【符号の説明】

【0124】

１ＩＤ割当装置
１０制御部
１１サイト収集部（収集部）
１２メトリック算出部（算出部）
１３ａアカウントクラスタ生成部（第３の生成部）
１３ｂ種別クラスタ生成部（第２の生成部）
１３ｃメトリッククラスタ生成部（第１の生成部）
１４ＩＤ割当部（割当部）
１５アプリケーション部
２０記憶部
２１サイト保存ＤＢ
２２サイト管理ＤＢ
３０通信部
４０入力部
５０出力部

【図1】