【課題を解決するための手段】
【0009】
本発明は、上記の課題を解決するために、以下の事項を提案している。なお、理解を容易にするために、本発明の実施形態に対応する符号を付して説明するが、これに限定されるものではない。
【0010】
(1) 本発明は、Web上のコミュニケーションネットワークに投稿された投稿情報、前記コミュニケーションネットワークのユーザのプロフィール情報、および前記投稿情報を介した前記コミュニケーションネットワークにおけるユーザの交流関係を示す交流情報を用いて、ユーザの潜在的プロフィール情報を分析するユーザ分析装置であって、前記交流情報に基づいて、前記コミュニケーションネットワークを小集団に分割する小集団分割手段(例えば、
図1の小集団分割部130に相当)と、前記小集団分割手段で分割された小集団から、一の小集団の構成ユーザそれぞれが属する他の小集団を当該一の小集団の隣接小集団として特定する隣接小集団特定手段(例えば、
図1の隣接小集団特定部140に相当)と、分析対象ユーザが属する小集団の構成ユーザの投稿情報およびプロフィール情報から抽出した単語と、当該小集団について前記隣接小集団特定手段で特定された隣接小集団の構成ユーザの投稿情報およびプロフィール情報から抽出した単語との比較に基づいて、当該小集団に特有のキーワードを抽出するキーワード抽出手段(例えば、
図1のキーワード抽出部160に相当)と、を備え、抽出されたキーワードを前記分析対象ユーザの潜在的プロフィール情報とすることを特徴とするユーザ分析装置を提案している。
【0011】
この発明によれば、分析対象ユーザが属する小集団とその小集団の隣接小集団との単語を比較して、分析対象ユーザが属する小集団に特有の単語をキーワードとして抽出することにより、分析対象ユーザの潜在的なプロフィール情報を、高精度に分析することができる。
【0012】
(2) 本発明は、(1)のユーザ分析装置において、前記交流情報に基づいて算出された、前記小集団の各構成ユーザの当該小集団内での他構成ユーザとの接続状態に基づいて、分割された小集団の中から、当該小集団の構成ユーザ同士の交流が密接である小集団を抽出する小集団抽出手段(例えば、
図6の小集団抽出部170に相当)を備え、前記隣接小集団特定手段が、前記小集団抽出手段で抽出された小集団から、一の小集団の構成ユーザが属する他の小集団を当該一の小集団の隣接小集団として特定することを特徴とするユーザ分析装置を提案している。
【0013】
この発明によれば、構成ユーザの同質性が高い小集団および隣接小集団について抽出され単語を用いてキーワードを抽出することにより、分析対象ユーザの潜在的なプロフィール情報を、より高精度に分析することができる。
【0014】
(3) 本発明は、(2)のユーザ分析装置において、前記小集団抽出手段が、Smirnov−Grubbs検定またはTietjen−Moore検定を用いて、各構成ユーザの接続数について1つも外れ値を持たない小集団を、前記分割された小集団の中から、当該小集団の構成ユーザ同士の交流が密接である小集団として抽出することを特徴とするユーザ分析装置を提案している。
【0015】
この発明によれば、各構成ユーザの接続数の外れ値に基づいて、一部の構成ユーザを中心としていて各構成ユーザの交流が密でない小集団以外を抽出することにより、構成メンバーの同質性が高い小集団を判断することができる。
【0016】
(4) 本発明は、(2)のユーザ分析装置において、前記小集団抽出手段が、他の構成ユーザとの接続数が1である構成ユーザの割合が閾値以下の小集団を、前記分割された小集団の中から、当該小集団の構成ユーザ同士の交流が密接である小集団として抽出することを特徴とするユーザ分析装置を提案している。
【0017】
この発明によれば、接続数が1である構成ユーザの割合に基づいて、一部の構成ユーザを中心としていて各構成ユーザの交流が密でない小集団以外を抽出することにより、構成メンバーの同質性が高い小集団を判断することができる。
【0018】
(5) 本発明は、(1)から(4)のユーザ分析装置において、分析対象ユーザが属する小集団の構成ユーザの投稿情報およびプロフィール情報から抽出した単語の出現頻度と、当該小集団について前記隣接小集団特定手段で特定された隣接小集団の構成ユーザの投稿情報およびプロフィール情報から抽出した単語の出現頻度との比較に基づいて、当該小集団に特有のキーワードを抽出することを特徴とするユーザ分析装置を提案している。
【0019】
この発明によれば、出現頻度に基づいて、分析対象ユーザが属する小集団に特有の単語をキーワードとして抽出することにより、分析対象ユーザの潜在的なプロフィール情報を、より高精度に分析することができる。
【0020】
(6) 本発明は、(1)から(5)のユーザ分析装置において、前記小集団分割手段が、階層的リンククラスタリング法またはファジーC平均法を用いて、前記コミュニケーションネットワークを小集団に分割することを特徴とするユーザ分析装置を提案している。
【0021】
この発明によれば、コミュニケーションネットワークを、階層的リンククラスタリング法またはファジーC平均法を用いて、小集団に分割することができる。
【0022】
(7) 本発明は、(1)から(6)のユーザ分析装置において、前記コミュニケーションネットワークを提供するコミュニケーションサーバから前記交流情報を取得する交流情報取得手段(例えば、
図1の交流情報取得部120に相当)と、前記コミュニケーションサーバから前記投稿情報および前記プロフィール情報を取得するユーザ情報取得手段(例えば、
図1のユーザ情報取得部150に相当)と、を備えることを特徴とするユーザ分析装置を提案している。
【0023】
この発明によれば、分析に用いる交流情報、投稿情報、およびプロフィール情報を、コミュニケーションネットワークを提供するコミュニケーションサーバから取得することができる。
【0024】
(8) 本発明は、Web上のコミュニケーションネットワークに投稿された投稿情報、前記コミュニケーションネットワークのユーザのプロフィール情報、および前記投稿情報を介した前記コミュニケーションネットワークにおけるユーザの交流関係を示す交流情報を用いて、ユーザの潜在的プロフィール情報を分析するユーザ分析装置におけるユーザ分析方法であって、前記ユーザ分析装置が、小集団分割手段、隣接小集団特定手段、およびキーワード抽出手段を備え、前記小集団分割手段が、前記交流情報に基づいて、前記コミュニケーションネットワークを小集団に分割する第1のステップ(例えば、
図5のステップS2に相当)と、前記隣接小集団特定手段が、前記第1のステップで分割された小集団から、一の小集団の構成ユーザそれぞれが属する他の小集団を当該一の小集団の隣接小集団として特定する第2のステップ(例えば、
図5のステップS3に相当)と、前記キーワード抽出手段が、分析対象ユーザが属する小集団の構成ユーザの投稿情報およびプロフィール情報から抽出した単語と、当該小集団について前記第2のステップで特定された隣接小集団の構成ユーザの投稿情報およびプロフィール情報から抽出した単語との比較に基づいて、当該小集団に特有のキーワードを抽出する第3のステップ(例えば、
図5のステップS5に相当)と、を含み、抽出されたキーワードを前記分析対象ユーザの潜在的プロフィール情報とすることを特徴とするユーザ分析方法を提案している。
【0025】
この発明によれば、分析対象ユーザが属する小集団とその小集団の隣接小集団との単語を比較して、分析対象ユーザが属する小集団に特有の単語をキーワードとして抽出することにより、分析対象ユーザの潜在的なプロフィール情報を、高精度に分析することができる。
【0026】
(9) 本発明は、Web上のコミュニケーションネットワークに投稿された投稿情報、前記コミュニケーションネットワークのユーザのプロフィール情報、および前記投稿情報を介した前記コミュニケーションネットワークにおけるユーザの交流関係を示す交流情報を用いて、ユーザの潜在的プロフィール情報を分析するユーザ分析装置におけるユーザ分析方法をコンピュータに実行させるためのプログラムであって、前記ユーザ分析装置が、小集団分割手段、隣接小集団特定手段、およびキーワード抽出手段を備え、前記小集団分割手段が、前記交流情報に基づいて、前記コミュニケーションネットワークを小集団に分割する第1のステップ(例えば、
図5のステップS2に相当)と、前記隣接小集団特定手段が、前記第1のステップで分割された小集団から、一の小集団の構成ユーザそれぞれが属する他の小集団を当該一の小集団の隣接小集団として特定する第2のステップ(例えば、
図5のステップS3に相当)と、前記キーワード抽出手段が、分析対象ユーザが属する小集団の構成ユーザの投稿情報およびプロフィール情報から抽出した単語と、当該小集団について前記第2のステップで特定された隣接小集団の構成ユーザの投稿情報およびプロフィール情報から抽出した単語との比較に基づいて、当該小集団に特有のキーワードを抽出する第3のステップ(例えば、
図5のステップS5に相当)と、を含み、抽出されたキーワードを前記分析対象ユーザの潜在的プロフィール情報とすることを特徴とするユーザ分析方法をコンピュータに実行させることを特徴とするプログラムを提案している。
【0027】
この発明によれば、分析対象ユーザが属する小集団とその小集団の隣接小集団との単語を比較して、分析対象ユーザが属する小集団に特有の単語をキーワードとして抽出することにより、分析対象ユーザの潜在的なプロフィール情報を、高精度に分析することができる。