IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 大日本印刷株式会社の特許一覧 ▶ 学校法人慶應義塾の特許一覧

特開2025-108131情報処理装置、情報処理方法及びプログラム
<>
  • 特開-情報処理装置、情報処理方法及びプログラム 図1
  • 特開-情報処理装置、情報処理方法及びプログラム 図2
  • 特開-情報処理装置、情報処理方法及びプログラム 図3
  • 特開-情報処理装置、情報処理方法及びプログラム 図4
  • 特開-情報処理装置、情報処理方法及びプログラム 図5
  • 特開-情報処理装置、情報処理方法及びプログラム 図6
  • 特開-情報処理装置、情報処理方法及びプログラム 図7
  • 特開-情報処理装置、情報処理方法及びプログラム 図8
  • 特開-情報処理装置、情報処理方法及びプログラム 図9
  • 特開-情報処理装置、情報処理方法及びプログラム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025108131
(43)【公開日】2025-07-23
(54)【発明の名称】情報処理装置、情報処理方法及びプログラム
(51)【国際特許分類】
   H04L 41/044 20220101AFI20250715BHJP
【FI】
H04L41/044
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2024001840
(22)【出願日】2024-01-10
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り (1)ウェブサイトの掲載日 令和5年1月12日 ウェブサイトのアドレス https://ken_ieice.org/ken/paper/20230120LCqi/ (2)開催日 令和5年1月20日 集会名、開催場所 電子情報通信学会 愛知県産業労働センター15階 愛知県立大学サテライトキャンパス
(71)【出願人】
【識別番号】000002897
【氏名又は名称】大日本印刷株式会社
(71)【出願人】
【識別番号】598121341
【氏名又は名称】慶應義塾
(74)【代理人】
【識別番号】110002952
【氏名又は名称】弁理士法人鷲田国際特許事務所
(72)【発明者】
【氏名】中野 修平
(72)【発明者】
【氏名】山下 剛志
(72)【発明者】
【氏名】松本 直己
(72)【発明者】
【氏名】金子 晋丈
(72)【発明者】
【氏名】シン アンドリュー
(72)【発明者】
【氏名】原 豪紀
(72)【発明者】
【氏名】天目 隆平
(57)【要約】
【課題】複数のネットワークを合成したマルチレイヤネットワークのネットワーク解析技術を提供することである。
【解決手段】本開示の一態様は、第1のネットワークと第2のネットワークとを取得する取得部と、反映度に従って前記第1のネットワークと前記第2のネットワークとを重ね合わせ、第3のネットワークを生成する重畳部と、前記第3のネットワークにおいてシードノードのコミュニティを抽出する抽出部と、を有し、前記抽出されるコミュニティは、前記反映度の変化に応じて拡張又は縮小する、情報処理装置に関する。
【選択図】図1
【特許請求の範囲】
【請求項1】
第1のネットワークと第2のネットワークとを取得する取得部と、
反映度に従って前記第1のネットワークと前記第2のネットワークとを重ね合わせ、第3のネットワークを生成する重畳部と、
前記第3のネットワークにおいてシードノードのコミュニティを抽出する抽出部と、
を有し、
前記抽出されるコミュニティは、前記反映度の変化に応じて拡張又は縮小する、情報処理装置。
【請求項2】
前記重畳部は、前記反映度に従って前記第1のネットワークと前記第2のネットワークとを重み付けして前記第3のネットワークを生成し、
前記抽出部は、前記シードノードと前記第3のネットワークの各ノードとの間に回帰エッジを付加する、請求項1に記載の情報処理装置。
【請求項3】
前記抽出部は、前記回帰エッジに基づいて前記コミュニティを抽出する、請求項2に記載の情報処理装置。
【請求項4】
前記抽出部は、前記反映度に従って前記第1のネットワークの第1のコミュニティと前記第2のネットワークの第2のコミュニティとの間で前記コミュニティのノードを制御する、請求項1に記載の情報処理装置。
【請求項5】
第1のネットワークと第2のネットワークとを取得することと、
反映度に従って前記第1のネットワークと前記第2のネットワークとを重ね合わせ、第3のネットワークを生成することと、
前記第3のネットワークにおいてシードノードのコミュニティを抽出することを有し、
前記抽出されるコミュニティは、前記反映度の変化に応じて拡張又は縮小する、1つ以上のコンピュータが実行する情報処理方法。
【請求項6】
第1のネットワークと第2のネットワークとを取得することと、
反映度に従って前記第1のネットワークと前記第2のネットワークとを重ね合わせ、第3のネットワークを生成することと、
前記第3のネットワークにおいてシードノードのコミュニティを抽出することを1つ以上のコンピュータに実行させ、
前記抽出されるコミュニティは、前記反映度の変化に応じて拡張又は縮小する、プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、情報処理装置、情報処理方法及びプログラムに関する。
【背景技術】
【0002】
コミュニティ抽出は、最もよく用いられるネットワーク解析のアプローチの1つである。ソーシャルメディア上での友達推薦、ユーザへの製品推薦、世論分析、テロリストグループのクラスタ特定などの広範な応用がある。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】Lawrence Page, Sergey Brin, Rajeev Motwani, and Terry Winograd. The pagerank citation ranking: Bringing order to the web. In The Web Conference, 1999.
【非特許文献2】Reid Andersen, Fan Chung, and Kevin Lang. Local graph partitioning using pagerank vectors. In 2006 47th Annual IEEE Symposium on Foundations of Computer Science (FOCS ’06), pp. 475-486, 2006.
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来のコミュニティ抽出では、単一のネットワークが対象とされてきた。しかしながら、単一のネットワークは現実世界における複雑なネットワークを断片的に切り取った情報に過ぎない。そのため、その断片的な情報に基づいて行ったコミュニティ抽出では、ネットワーク構造や各ノードの振る舞いを分析するための手法として十分でないこともある。
【0005】
近年では、1つのネットワークを1つのレイヤとして、複数のレイヤを重ねるマルチレイヤネットワークを対象とした研究が行われている。例えば、実世界におけるマルチレイヤネットワークの一例として、航空網(空港間の輸送網)などがある。これは、空港をノード、空港間の直行便をエッジとしてモデル化したものであり、異なる航空会社の航空網を異なるレイヤと考えることでマルチレイヤネットワークとして扱うことができる。
【0006】
本開示の課題は、複数のネットワークを合成したマルチレイヤネットワークのネットワーク解析技術を提供することである。
【課題を解決するための手段】
【0007】
本開示の一態様は、第1のネットワークと第2のネットワークとを取得する取得部と、反映度に従って前記第1のネットワークと前記第2のネットワークとを重ね合わせ、第3のネットワークを生成する重畳部と、前記第3のネットワークにおいてシードノードのコミュニティを抽出する抽出部と、を有し、前記抽出されるコミュニティは、前記反映度の変化に応じて拡張又は縮小する、情報処理装置に関する。
【発明の効果】
【0008】
本開示によると、複数のネットワークを合成したマルチレイヤネットワークのネットワーク解析技術を提供することができる。
【図面の簡単な説明】
【0009】
図1図1は、本開示の一実施例による複数のネットワークを重ね合わせることによって構成されるマルチレイヤネットワークを示す概略図である。
図2図2は、本開示の一実施例による反映度を示す概略図である。
図3図3は、本開示の一実施例による反映度に応じたマルチレイヤネットワークにおけるコミュニティを示す概略図である。
図4図4は、本開示の一実施例による情報処理装置のハードウェア構成を示すブロック図である。
図5図5は、本開示の一実施例による情報処理装置の機能構成を示すブロック図である。
図6図6は、本開示の一実施例による追加レイヤとベースレイヤとの重ね合わせを示す概略図である。
図7図7は、本開示の一実施例による反映度に応じて重ね合わせされたマルチレイヤネットワークを示す概略図である。
図8図8は、本開示の一実施例によるAPPRアルゴリズムを示す擬似コードを示す図である。
図9図9は、本開示の一実施例によるWAPPRアルゴリズムを示す擬似コードを示す図である。
図10図10は、本開示の一実施例による始点回帰エッジを示す概略図である。
【発明を実施するための形態】
【0010】
以下、図面を参照して本開示の実施の形態を説明する。
【0011】
以下の実施例では、複数のネットワークを合成することによって生成されたマルチレイヤネットワークに対してネットワーク解析を実行する情報処理装置が開示される。
【0012】
[本開示の概略]
以下の実施例による情報処理装置100は、複数のネットワークを重ね合わせたマルチレイヤネットワークを生成し、生成したマルチレイヤネットワークにおけるシードノードとの密接度が所定の閾値以上のノード群を当該シードノードのコミュニティとして抽出する。情報処理装置100は、以下で詳細に説明される反映度パラメータrに従って重畳対象のネットワークを重み付けし、重み付けされたネットワークからマルチレイヤネットワークを生成する。そして、情報処理装置100は、生成したマルチレイヤネットワークにおけるシードノードのコミュニティを抽出する。
【0013】
後述される反映度パラメータrは、2つのネットワークを重畳する際の各ネットワークの重みを付与するものである。rが0に近いほど、マルチレイヤネットワークにおいて抽出されるコミュニティは、マルチレイヤネットワークを構成する一方のネットワークのコミュニティに近いものとなり、rが1に近いほど、マルチレイヤネットワークにおいて抽出されるコミュニティは、マルチレイヤネットワークを構成する他方のネットワークのコミュニティに近いものとなるよう反映度パラメータが設計される。
【0014】
一般にマルチレイヤネットワークでは、ネットワーク解析者によって2つのレイヤの意味するところが異なり、各レイヤのコミュニティをどの程度反映して重ね合わせ後のコミュニティを決定するかが重要となる。反映度パラメータrは、各レイヤのコミュニティの反映度を示すものと考えうる。反映度パラメータrに対して、2分探索等による最適な反映度の高速な探索のため、
(1)反映度が単調に増加することと、
(2)ユーザが最適と考える反映度がどれほど大きい/小さいものであっても対応できるように、反映度が広い値の範囲をとること、
が重要である。反映度パラメータrを大きくしながらコミュニティ抽出を行った際に、反映度が広い変動幅を単調に増加/減少するような手法を以降において開示する。
【0015】
具体的には、コミュニティ抽出手法としてはAPPR(Approximate Personalized PageRank)を用い、コミュニティに帰属させるノードを決定する密接度指標DNPPR(Degree-Normalized PPR)がエッジへの重み付けによって制御可能であることを利用して反映度を制御する。WAPPRSは、(1)反映度が単調に増加し、かつ、(2)反映度が広い幅を変化することを示しうる。
【0016】
重畳対象の複数のネットワークとして、例えば、図1に示されるようなベースレイヤと追加レイヤとがあるとする。図示されるように、ベースレイヤは、黒色の7個のノードと、図示されるようなノード間を接続する6本のエッジとから構成される。なお、ベースレイヤにおいて破線で示されるノードは、当該ベースレイヤに存在せず、追加レイヤのみに存在する。ベースレイヤにおけるシードノードSに対して、破線で包囲されるような3個のノードがコミュニティとして抽出できる。
【0017】
他方、追加レイヤは、黒色の6個のノードと、図示されるようなノード間を接続する7本のエッジとから構成される。追加レイヤにおいて破線で示されるノードは、当該追加レイヤに存在せず、ベースレイヤのみに存在する。追加レイヤにおけるシードノードSに対して、破線で包囲されるような4個のノードがコミュニティとして抽出できる。
【0018】
情報処理装置100は、図示されるように、ベースレイヤと追加レイヤとを合成し、マルチレイヤネットワークする。すなわち、ベースレイヤのノード集合と追加レイヤのノード集合との和集合をマルチレイヤネットワークのノード集合とし、ベースレイヤのエッジ集合と追加レイヤのエッジ集合との和集合をマルチレイヤネットワークのエッジ集合となるように、ベースレイヤと追加レイヤとは重畳される。マルチレイヤネットワークの図示されたシードノードSに対するコミュニティは、例えば、破線により図示されるノード群となりうる。
【0019】
マルチレイヤネットワークにおけるシードノードSのコミュニティは、反映度パラメータr(0≦r≦1)の値に応じて変動しうる。すなわち、情報処理装置100は、図2に示されるように、ベースレイヤの各エッジに(1-r)を乗算し、追加レイヤの各エッジにrを乗算する。換言すると、マルチレイヤネットワークの各エッジには、当該エッジがベースレイヤにある場合に(1-r)が乗算され、当該エッジが追加レイヤにある場合にはrが乗算されることになる。
【0020】
反映度パラメータrの値を変化させることによって、マルチレイヤネットワークにおけるシードノードのコミュニティも変動しうる。例えば、図3に示されるように、反映度パラメータrが0に近い値であるとき、マルチレイヤネットワークにおけるシードノードSのコミュニティは、ベースレイヤにおけるシードノードSのコミュニティと同一又は類似したものとなる。他方、反映度パラメータrが1に近い値であるとき、マルチレイヤネットワークにおけるシードノードSのコミュニティは、追加レイヤにおけるシードノードSのコミュニティと同一又は類似したものとなる。
【0021】
このようにして反映度パラメータrの値を変化させることによって、ベースレイヤと追加レイヤとを重ね合わせることによって生成されたマルチレイヤネットワークのシードノードに対するコミュニティを拡張及び縮小することができうる。
【0022】
ここで、情報処理装置100は、サーバ、パーソナルコンピュータ(PC)、スマートフォン、タブレット等の計算装置によって実現されてもよく、例えば、図4に示されるようなハードウェア構成を有してもよい。すなわち、情報処理装置100は、バスBを介し相互接続されるドライブ装置101、ストレージ装置102、メモリ装置103、プロセッサ104、ユーザインタフェース(UI)装置105及び通信装置106を有する。
【0023】
情報処理装置100における各種機能及び処理を実現するプログラム又は指示は、CD-ROM(Compact Disk-Read Only Memory)、フラッシュメモリ等の着脱可能な記憶媒体に格納されてもよい。当該記憶媒体がドライブ装置101にセットされると、プログラム又は指示が記憶媒体からドライブ装置101を介しストレージ装置102又はメモリ装置103にインストールされる。ただし、プログラム又は指示は、必ずしも記憶媒体からインストールされる必要はなく、ネットワークなどを介し何れかの外部装置からダウンロードされてもよい。
【0024】
ストレージ装置102は、ハードディスクドライブなどによって実現され、インストールされたプログラム又は指示と共に、プログラム又は指示の実行に用いられるファイル、データ等を格納する。
【0025】
メモリ装置103は、ランダムアクセスメモリ、スタティックメモリ等によって実現され、プログラム又は指示が起動されると、ストレージ装置102からプログラム又は指示、データ等を読み出して格納する。ストレージ装置102、メモリ装置103及び着脱可能な記憶媒体は、非一時的な記憶媒体(non-transitory storage medium)として総称されてもよい。
【0026】
プロセッサ104は、1つ以上のプロセッサコアから構成されうる1つ以上のCPU(Central Processing Unit)、GPU(Graphics Processing Unit)、処理回路(processing circuitry)等によって実現されてもよく、メモリ装置103に格納されたプログラム、指示、当該プログラム若しくは指示を実行するのに必要なパラメータなどのデータ等に従って、情報処理装置100の各種機能及び処理を実行する。
【0027】
ユーザインタフェース(UI)装置105は、キーボード、マウス、カメラ、マイクロフォン等の入力装置、ディスプレイ、スピーカ、ヘッドセット、プリンタ等の出力装置、タッチパネル等の入出力装置から構成されてもよく、ユーザと情報処理装置100との間のインタフェースを実現する。例えば、ユーザは、ディスプレイ又はタッチパネルに表示されたGUI(Graphical User Interface)をキーボード、マウス等を操作し、情報処理装置100を操作してもよい。
【0028】
通信装置106は、外部装置、インターネット、LAN(Local Area Network)、セルラーネットワーク等の通信ネットワークとの有線及び/又は無線通信処理を実行する各種通信回路により実現される。
【0029】
しかしながら、上述したハードウェア構成は単なる一例であり、本開示による情報処理装置100は、他の何れか適切なハードウェア構成により実現されてもよい。
【0030】
[情報処理装置]
次に、本開示の一実施例による情報処理装置100を説明する。図5は、本開示の一実施例による情報処理装置100の機能構成を示すブロック図である。図5に示されるように、情報処理装置100は、取得部110、重畳部120及び抽出部130を有する。取得部110、重畳部120及び抽出部130の各機能部は、情報処理装置100のメモリ装置103に格納されているコンピュータプログラムがプロセッサ104によって実行されることによって実現されてもよい。
【0031】
取得部110は、複数のネットワークを取得する。具体的には、取得部110は、グラフ構造としてモデル化可能な重畳対象の各ネットワークに関するレイヤ情報を取得する。例えば、追加レイヤLとベースレイヤLとによってマルチレイヤネットワークMを構成するケースを考える。ここで、追加レイヤLとベースレイヤLは、L=(V,E)及びL=(V,E)として定式化され、V及びVはそれぞれ追加レイヤL及びベースレイヤLのノード集合であり、E及びEはそれぞれ追加レイヤL及びベースレイヤLのエッジ集合である。取得部110は、追加レイヤLとベースレイヤLとのレイヤ情報として、L=(V,E)及びL=(V,E)を取得しうる。
【0032】
また、追加レイヤL及びベースレイヤLのノードvに対して、当該ノードが表す対象aをアクタと呼ぶことにする。例えば、追加レイヤL及びベースレイヤLは、航空会社A及びBの航空網(空港間の輸送網)、すなわち、空港をノード、空港間の直行便をエッジとしてモデル化できる。追加レイヤLのアクタの集合を、
【数1】
と定義し、ベースレイヤLのアクタの集合を、
【数2】
と定義すると、取得部110は、追加レイヤL及びベースレイヤLのノードとアクタとの変換を取得してもよい。具体的には、取得部110は、
【数3】
を取得してもよい。ここで、vはノード集合からアクタ集合への変換を表し、aはアクタ集合からノード集合への変換を表す。
【0033】
重畳部120は、反映度に従って複数のネットワークを重ね合わせ、マルチレイヤネットワークを生成する。具体的には、重畳部120は、反映度パラメータr(0≦r≦1)に従って追加レイヤLとベースレイヤLとを重ね合わせ、以下のようなマルチレイヤネットワークMを生成する。
【数4】
重ね合わせ手法fによって生成されるマルチレイヤネットワークMは、以下のように表しうる。
【数5】
ここで、Vはノード集合、Eはエッジ集合、Wは反映度パラメータrによる重みの集合を表す。
【0034】
また、マルチレイヤネットワークのアクタ集合について、
【数6】
となる。図6に示される追加レイヤLとベースレイヤLとの間において破線で結ばれたノードは、同一アクタを表す。他方、破線で結ばれたノードは、一方のレイヤにしかアクタを表すノードが存在しないことを示す。
【0035】
あるアクタが追加レイヤLとベースレイヤLとの双方にノードを有するとき、当該アクタを共有アクタと呼ぶ。
【数7】
として表す。他方、一方のレイヤにしかノードが存在しないアクタを固有アクタと呼び、
【数8】
として表す。このようにして、重畳部120は、図6に示されるようなマルチレイヤネットワークMを生成しうる。
【0036】
また、ノードとアクタとの変換については、
【数9】
と表しうる。
【0037】
反映度パラメータrについて、重畳部120は、図7に示されるように、追加レイヤLの全てのエッジe∈Eにrを重み付けし、ベースレイヤLの全てのエッジe∈Eに1-rを重み付けする。
【0038】
抽出部130は、マルチレイヤネットワークにおいてシードノードのコミュニティを抽出する。ここで、追加レイヤL上の共有アクタ
【数10】
に対応するノードv(s)をシードとしたコミュニティをC(s)と表し、sをシードアクタと呼ぶ。
【0039】
また、マルチレイヤネットワークMにおいてシードアクタsに対応するシードノードv(s)に対して、密接度の上位kこのノードの集合をT(s,k)で表す。マルチレイヤネットワークMへのシードアクタsに関する反映度指標は、
【数11】
として定義できる。直感的には、反映度指標TKSは、追加レイヤL単体でのシードアクタsに対応するノードをシードノードとしたときのコミュニティ内のノードのうち、いくつのノードがマルチレイヤネットワークMにおいてもコミュニティに残るかを表していると考えられる。なお、追加レイヤLに対する反映度指標TKSA,M(s)を単に反映度と呼ぶこともある。このように、抽出部130によって抽出されるコミュニティは、反映度の変化に応じて拡張又は縮小する。
【0040】
また、反映度パラメータrに対して、
【数12】
に対するマルチレイヤネットワークをそれぞれ、
【数13】
とする。また、反映度rに対する反映度指標
【数14】
を単にTKS(s)と表現する。このとき、i=1,2,・・・,N-1に対して、
【数15】
となったiの個数をN-1で除した値を単調増加度(FMI)として定義する。
【数16】
【0041】
このような反映度指標TKSは、rが0に近づけるほど、ベースレイヤLにおけるシードアクタsのコミュニティに近くなり、rを1に近づけるほど、追加レイヤLにおけるシードアクタsのコミュニティに近くなるよう変化する。
【0042】
また、TKS(s)の最大値と最小値との差を反映幅(WR)として定義する。
【数17】
本実施例では、単調増加度FMIが大きく、かつ、反映幅WRも大きくなる重ね合わせ手法fを提供する。
【0043】
このように規定した反映度は、密接度指標としてDegree-Normalized PPR(DNPPR)を用いることを前提として、共有アクタ
【数18】
をシードアクタとする追加レイヤL上のコミュニティC(s)内のノードのDNPPRを変化させることで反映度を制御できうる。また、DNPPRの計算に必要となるPPRと重み次数は、エッジへの重み付けによって変化させることができる。抽出部130は、DNPPRの大きいノードをコミュニティに入れる。
【0044】
例えば、抽出部130は、既知のコミュニティ抽出アルゴリズムAPPR(Reid Andersen, Fan Chung, and Kevin Lang. Local graph partitioning using pagerank vectors. In 2006 47thAnnual IEEE Symposium on Foundations of Computer Science (FOCS ’06), pp. 475-486, 2006)を利用してもよい。図8のアルゴリズム1に示されるように、APPRでは、アルゴリズム2のようにランダムウォークを行ってシードノードをuとするPPRベクトル
【数19】
を求める。このPPRを各ノードについて、当該ノードの重み次数で除したものがDNPPRであり、このベクトルは、
【数20】
で表される。これは、ノードvのPPRをPPR(v)として、重み次数d(v)を
【数21】
として(ただし、N(v)はvの隣接ノード集合)、vのDNPPRのDNPPR(v)は、
【数22】
で表されることと等価である。さらに、このようにして求められたDNPPRが大きい順にノードをソートする。i番目にDNPPRが大きいノードをvとして、ノード集合
【数23】
にノードvを順次追加し(i=1,2,・・・)、Sのコンダクタンスφ(S)を計算する。ここで、S⊂Vに対して、コンダクタンスφ(S)は、
【数24】
として定義される。ただし、V\SはVからSを除外した集合であり、vol(S)はS内のノードの重み次数の総和であり、cut(S)は、
【数25】
である。最後に、抽出部130は、最小のコンダクタンスの集合Sをコミュニティとして決定する。
【0045】
PPR及び重み次数は、エッジへの重みによって可変とでき、DNPPRもまた重みによって可変とすることができる。ここでは、PPRが重み付けによってどのように変化するかをアルゴリズム2に説明される。PPRは、ランダムウォークにおける各ノードの訪問確率である。ランダムウォークは、ランダムウォーカが始点から出発し、確率αで隣接ノードの何れかに遷移し、確率1-αで始点に戻るモデルである。あるノードvから隣接ノードxに遷移する確率p(x)は、
【数26】
であることから、重みw(v,x)を変化させることでp(x)を変化させることができる。ランダムウォーカのそのノードへの遷移確率が上昇すれば、訪問確率も上昇する(逆も同様)ため、重みを変化させることでPPRを変化させることができる。
【0046】
本実施例では、追加レイヤLの全てのエッジe∈EとベースレイヤLの全てのエッジe∈Eとにそれぞれ重みr,1-rを付与することと、マルチレイヤネットワークMの全てのノードv∈Vからシードノードv(s)への始点回帰エッジを導入することによって、図9に示されるアルゴリズム3に従って反映度TKSを制御する。
【0047】
シードとする共有アクタ
【数27】
のコミュニティを考える際、ある共有アクタ
【数28】
のMにおけるノードv(a)のv(s)との密接度DNPPRs,M(a)は、以下のように表すことができる。
【数29】
ただし、PPRs,A(a)及びPPRs,B(a)をそれぞれ追加レイヤL及びベースレイヤLのエッジに由来するPPRとする。これは、
【数30】
で表される。ここで、
【数31】
である。ここで、
【数32】
である。
【0048】
ここで、rが0に近づくほど、d (v(a))はd (v(a))に近づき、rが1に近づくほど、d (v(a))はd (v(a))に近づく。さらに、rが0に近づくほど、PPRs,A(a)が小さくなることで、PPRs,M(a)はPPRs,B(a)に近づき、rが1に近づくほど、PPRs,B(a)が小さくなることで、PPRs,M(a)はPPRs,A(a)に近づくことがわかる。
【0049】
これは、rの値により、d (v(a))が追加レイヤLでの次数に近いか、ベースレイヤLでの次数に近いか、また、PPRs,M(a)が追加レイヤLでのPPRに近いか、ベースレイヤLでのPPRに近いかを連続的に制御できることを意味する。例えば、
【数33】
である場合、
【数34】
と近似することができる。これは、重ね合わせ後のDNPPRが、追加レイヤLのみで計算されるDNPPRに近似されることを意味する。逆に、0<r<<1のときも重ね合わせ後のDNPPRがベースレイヤLのみで計算されるDNPPRに近似される。このようにして、反映度を高くしたいレイヤの重みを上げることで、もう一方のレイヤがPPR及び重み次数に与える影響を相対的に小さくし、重ね合わせ後のDNPPRを追加レイヤLのDNPPRに近い値にするか、ベースレイヤLに近い値にするかを連続的に変化させることができる。
【0050】
抽出部130は、上述したように反映度に従って重畳されたマルチレイヤネットワークMにおいて所定の密接度以上のノードを決定し、決定したノード群に基づいてシードノードのコミュニティを抽出することができる。
【0051】
なお、固有アクタについては、反映度パラメータrによってDNPPRの値を小さくできないことがある。このため、抽出部130は、始点回帰エッジを導入し、固有アクタにおいても反映度を小さい値に制御可能である。
【0052】
例えば、共有アクタについては上述したようなDNPPRの近似が可能であるが、これは、
【数35】
となるためである。一方、aがベースレイヤLの固有アクタである場合には、この近似は成り立たず、
【数36】
となる。この式では、分子のPPRs,B(a)及び分母の(1-r)・d (v(a))は小さくなるが、分子と分母とも小さい値になるため、全体のDNPPRが大きくなるか小さくなるかは事前には判断できない。ベースレイヤLの反映度を下げ、追加レイヤLの反映度を上げたいにもかかわらず、ベースレイヤLにしかノードを有しないアクタaのMにおけるノードv(a)のDNPPRが上昇した結果Cに入ってしまうことがある。その結果、ベースレイヤLの反映度が上がり、追加レイヤLの反映度が下がってしまう可能性がある。これは、反映度が制御できないことを意味する。
【0053】
一実施例では、抽出部130は、シードノードからマルチレイヤネットワークMの全てのノードに始点回帰エッジを導入し、シードノードのコミュニティを抽出してもよい。固有アクタについては、影響を小さく抑えたいはずのPPRs,B(a)及び(1-r)・d (v(a))がPPRs,A(a)及びr・d (v(a))によって相対化できないことが共有アクタの場合と異なる。
【0054】
始点回帰エッジとは、図9に示されるように、マルチレイヤネットワークM上の任意のノードv∈Vからシードノードv(s)に生成される重みがrのエッジと1-rの有向エッジのことである。重みがrのエッジと1-rの有向エッジとをそれぞれγ本ずつ生成することによって、固有アクタにおいても重み次数を相対化することができる。これにより、DNPPRは以下のように規定できうる。
【数37】
【0055】
これによって、以下となる。
【数38】
例えば、0<<r<1のとき、
【数39】
となり、反映度を小さくしたいレイヤに固有なアクタaのMにおけるノードv(a)のDNPPRを小さく制御できる。
【0056】
上述した実施例によると、反映度パラメータrを導入することによって、マルチレイヤネットワークにおけるDNPPRが追加レイヤのDNPPRに近い値になるか、あるいは、ベースレイヤのDNPPRに近い値になるかを制御することが可能となり、これにより、マルチレイヤネットワークにおけるシードノードのコミュニティを調整できる。また、始点回帰エッジを導入することによって、固有アクタにおいても反映度を制御することができる。この結果、反映度TKSと単調増加度FMI及び広い反映幅WRとを実現することができる。
【0057】
なお、上述した実施例では、異なる航空会社の航空網を重畳させる実施例を述べたが、本開示はこれに限定されず、SNSやメッセージングサービスなど異なるデータベースを有する複数のサービスが共通のノード(例えば、アカウント、ファイルなど)を格納しているケースにも適用可能である。ノードの属性が分かっている場合、コミュニティ抽出によってSNSの友達推薦やストリーミングサービスの楽曲推薦のようなアプリケーションを異なるサービス間でも実行でき、また、どの属性に注目するかによってその実現の具体的な形態も制御できる。
【0058】
ここで記載する共通のノードとは、以下の4つのパターンを含む。
・グローバルに一意に識別できるIDが予め付与されているケース(航空ネットワークにおけるIATA 3-letterコード、インターネットワークにおけるURL)
・グローバルに識別はできないものの、別々のIDが予め付与されていて、何らかの名寄せにより同一であると識別できるケース(複数のSNSにそれぞれ異なるメールアドレスで設定されているが、同一人物であるアカウント)
・そもそもIDが付与されていないものの、IDを付与することにより、同一性を識別できるようになるケース(観光地などの物理空間内のエンティティ)
・上記3つのパターンの組み合わせ(例えば、片方のネットワークではグローバルに一意に識別できるIDが付与されているが、もう片方のネットワークではIDが付与されていないようなケース)
【0059】
以上、本開示の実施例について詳述したが、本開示は上述した特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本開示の要旨の範囲内において、種々の変形・変更が可能である。
【符号の説明】
【0060】
100 情報処理装置
110 取得部
120 重畳部
130 抽出部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10