特許6101985 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ＫＤＤＩ株式会社の特許一覧

特許6101985プログラム、端末装置およびデータ処理方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6101985

(24)【登録日】2017年3月10日

(45)【発行日】2017年3月29日

(54)【発明の名称】プログラム、端末装置およびデータ処理方法

(51)【国際特許分類】

G06F 17/30 20060101AFI20170316BHJP

【ＦＩ】

G06F17/30 360Z

G06F17/30 340B

G06F17/30 350C

【請求項の数】4

【全頁数】19

(21)【出願番号】特願2013-3657(P2013-3657)

(22)【出願日】2013年1月11日

(65)【公開番号】特開2014-135017(P2014-135017A)

(43)【公開日】2014年7月24日

【審査請求日】2015年8月28日

【前置審査】

(73)【特許権者】

【識別番号】000208891

【氏名又は名称】ＫＤＤＩ株式会社

(74)【代理人】

【識別番号】100114258

【弁理士】

【氏名又は名称】福地武雄

(72)【発明者】

【氏名】石先広海

(72)【発明者】

【氏名】服部元

(72)【発明者】

【氏名】小野智弘

【審査官】川▲崎▼ 博章

(56)【参考文献】

【文献】特開２００５−３３８９３２（ＪＰ，Ａ）

【文献】武田塁、後藤文太朗，電子メール高度利用支援のための電子メールコミュニケーション視覚化ツール，情報処理学会研究報告，日本，社団法人情報処理学会，２００７年３月２２日，Ｖｏｌ．２００７、Ｎｏ．３２，p．１３９−１４３

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｆ１７／３０

(57)【特許請求の範囲】

【請求項1】

ユーザの操作スキルに対応するサービスを示す情報を提示するプログラムであって、
ユーザにより操作され、少なくとも一つのユーザ変数に基づいてラベリングされたユーザ操作データを取得する処理と、
前記取得したユーザ操作データのユーザ変数をパラメータとして、ユーザの操作スキルを示す操作スキル特徴ベクトルを生成する処理と、
ネットワーク上で操作されたネットワークデータのネットワーク変数をパラメータとして生成されたネットワークデータ特徴ベクトルを取得する処理と、
前記操作スキル特徴ベクトルと前記ネットワークデータ特徴ベクトルとの類似度を算出する処理と、
前記算出した類似度に基づいて、表示候補とする少なくとも一つのネットワークデータ特徴ベクトルを選出する処理と、
前記選出したネットワークデータ特徴ベクトルを多次元空間にマッピングする処理と、
前記マッピングされたネットワークデータ特徴ベクトルを画面に表示する処理と、の一連の処理を、コンピュータに実行させ、
前記ユーザ変数は、ユーザ操作データがどのようなユーザの態度で取り扱われたかを示し、前記ユーザの態度を特徴としたユーザ態度スキルベクトルに基づいて、前記操作スキル特徴ベクトルを生成することを特徴とするプログラム。

【請求項2】

ユーザの操作スキルに対応するサービスを示す情報を提示する端末装置であって、
ユーザにより操作され、少なくとも一つのユーザ変数に基づいてラベリングされたユーザ操作データを取得するデータ取得部と、
前記取得したユーザ操作データのユーザ変数をパラメータとして、ユーザの操作スキルを示す操作スキル特徴ベクトルを生成する操作スキル特徴ベクトル生成部と、
ネットワーク上で操作されたネットワークデータのネットワーク変数をパラメータとして生成されたネットワークデータ特徴ベクトルを取得し、前記操作スキル特徴ベクトルと前記ネットワークデータ特徴ベクトルとの類似度を算出する類似度算出部と、
前記算出した類似度に基づいて、表示候補とする少なくとも一つのネットワークデータ特徴ベクトルを選出し、前記選出したネットワークデータ特徴ベクトルを多次元空間にマッピングするマッピング部と、
前記マッピングされたネットワークデータ特徴ベクトルを画面に表示する表示する表示部と、を備え、
前記ユーザ変数は、ユーザ操作データがどのようなユーザの態度で取り扱われたかを示し、前記ユーザの態度を特徴としたユーザ態度スキルベクトルに基づいて、前記操作スキル特徴ベクトルを生成することを特徴とする端末装置。

【請求項3】

入力したユーザ操作データに対して、少なくとも一つのユーザ変数に基づいてラベリングを行なう識別器を更に備えることを特徴とする請求項２記載の端末装置。

【請求項4】

ユーザの操作スキルに対応するサービスを示す情報を提示するデータ処理方法であって、
ユーザにより操作され、少なくとも一つのユーザ変数に基づいてラベリングされたユーザ操作データを取得するステップと、
前記取得したユーザ操作データのユーザ変数をパラメータとして、ユーザの操作スキルを示す操作スキル特徴ベクトルを生成するステップと、
ネットワーク上で操作されたネットワークデータのネットワーク変数をパラメータとして生成されたネットワークデータ特徴ベクトルを取得するステップと、
前記操作スキル特徴ベクトルと前記ネットワークデータ特徴ベクトルとの類似度を算出するステップと、
前記算出した類似度に基づいて、表示候補とする少なくとも一つのネットワークデータ特徴ベクトルを選出するステップと、
前記選出したネットワークデータ特徴ベクトルを多次元空間にマッピングするステップと、
前記マッピングされたネットワークデータ特徴ベクトルを画面に表示するステップと、を少なくとも含み、
前記ユーザ変数は、ユーザ操作データがどのようなユーザの態度で取り扱われたかを示し、前記ユーザの態度を特徴としたユーザ態度スキルベクトルに基づいて、前記操作スキル特徴ベクトルを生成することを特徴とするデータ処理方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、データの特徴を可視化する技術に関し、特に、ネットワーク上のコミュニケーションにおいて送信または受信されるデータの特徴を可視化する技術に関する。

【背景技術】

【0002】

従来から、コミュニケーションを可視化する技術が提案されている。例えば、特許文献１記載の技術では、組織内での生産性向上のため、実際に対面コミュニケーションを観察し、組織に属する個人のコミュニケーションスタイル、組織のコミュニケーションスタイル組織に含まれる会組織のコミュニケーションスタイルを可視化している。具体的には、センサから収集したインタラクションデータに基づいて、個人のコミュニケーションスタイルを２次元マップにプロットすることでコミュニケーションの可視化を実現している。

【0003】

また、特許文献２では、会話の返答に使用される語句の同意または非同意の強度を用いて、コミュニケーション相手との価値観の相違、およびその会話トピックに対する肯定度を推定し、肯定度をアイコンの表示属性に変換することで可視化を実現している。

【0004】

また、特許文献３では、組織内もしくは組織間における電子メールのログや会議の記録などの複数の手段によって行なわれたコミュニケーションを記録し、情報取り込み時間という共通指標に統合してコミュニケーションの可視化を実現する技術が開示されている。

【0005】

また、非特許文献１では、携帯電話によるコミュニケーションを送受信履歴から分析し、人間関係をネットワークとして可視化する技術が開示されている。

【先行技術文献】

【特許文献】

【0006】

【特許文献1】特開２０１２−１２８８８２号公報

【特許文献2】特開２００６−２０９３３２号公報

【特許文献3】特開２００６‐１２７１４２号公報

【非特許文献】

【0007】

【非特許文献1】イーグルＮ、ペントランドＡ、「リアリティ・マイニング：センシング・コンプレックス・ソーシャル・システムズ」、Ｊ・オブ・パーソナル・アンド・ユビキタス・コンンピューティング、２００５年７月（Eagle, N., and Pentland, A., "Reality Mining: Sensing Complex Social Systems", J. of Personal and Ubiquitous Computing, July 2005）

【発明の概要】

【発明が解決しようとする課題】

【0008】

しかしながら、特許文献１記載の技術では、実際にコミュニケーションが観測できる状態であることが前提となっているため、ＳＮＳやコミュニケーションツール上で発生したコミュニケーション特徴を可視化する目的に適合させることは容易ではない。

【0009】

また、特許文献２記載の技術では、ユーザ間のコミュニケーションインタラクションにおける価値観の差異評価に特化しているため、ＳＮＳなどのコミュニケーション特徴を可視化することには適していない。

【0010】

また、特許文献３記載の技術では、コミュニケーションの時間的な推移に基づいて組織コミュニケーションの推移を表示し、診断しているが、コミュニケーションの質・状況等、詳細なパラメータを含む分析に適応することができない。さらに、複数の視点での特徴を同時に扱うことができない。この点は、非特許文献１についても同様である。

【0011】

従来は、個人ユーザがＳＮＳにおいて、どのようなコミュニケーションをしているのかを検出し、それに基づいて個人ユーザのコミュニケーションの技能を測定することは容易ではなかった。

【0012】

本発明は、このような事情に鑑みてなされたものであり、個人ユーザのコミュニケーション技能を可視化し、ユーザの操作スキルに対応するサービスを示す情報を提示することができるプログラム、端末装置およびデータ処理方法を提供することを目的とする。

【課題を解決するための手段】

【0013】

（１）上記の目的を達成するために、本発明は、以下のような手段を講じた。すなわち、本発明のプログラムは、ユーザの操作スキルに対応するサービスを示す情報を提示するプログラムであって、ユーザにより操作され、少なくとも一つのユーザ変数に基づいてラベリングされたユーザ操作データを取得する処理と、前記取得したユーザ操作データのユーザ変数をパラメータとして、ユーザの操作スキルを示す操作スキル特徴ベクトルを生成する処理と、ネットワーク上で操作されたネットワークデータのネットワーク変数をパラメータとして生成されたネットワークデータ特徴ベクトルを取得する処理と、前記操作スキル特徴ベクトルと前記ネットワークデータ特徴ベクトルとの類似度を算出する処理と、前記算出した類似度に基づいて、表示候補とする少なくとも一つのネットワークデータ特徴ベクトルを選出する処理と、前記選出したネットワークデータ特徴ベクトルを多次元空間にマッピングする処理と、前記マッピングされたネットワークデータ特徴ベクトルを画面に表示する処理と、の一連の処理を、コンピュータに実行させることを特徴とする。

【0014】

このように、ユーザにより操作され、少なくとも一つのユーザ変数に基づいてラベリングされたユーザ操作データを取得し、その取得したユーザ操作データのユーザ変数をパラメータとして、ユーザの操作スキルを示す操作スキル特徴ベクトルを生成し、ネットワーク上で操作されたネットワークデータのネットワーク変数をパラメータとして生成されたネットワークデータ特徴ベクトルを取得し、操作スキル特徴ベクトルとネットワークデータ特徴ベクトルとの類似度を算出し、算出した類似度に基づいて、表示候補とする少なくとも一つのネットワークデータ特徴ベクトルを選出し、選出したネットワークデータ特徴ベクトルを多次元空間にマッピングし、マッピングされたネットワークデータ特徴ベクトルを画面に表示するので、個人ユーザのコミュニケーション技能を可視化することが可能となる。これにより、ユーザの操作スキルに対応するサービスを示す情報を提示することが可能となる。

【0015】

（２）また、本発明のプログラムにおいて、前記ユーザ変数は、ユーザ操作データがどのようなシステム上の機能で取り扱われたかを示し、前記システム上の機能を特徴としたシステム機能特徴スキルベクトルに基づいて、前記操作スキル特徴ベクトルを生成することを特徴とする。

【0016】

このように、ユーザ変数は、ユーザ操作データがどのようなシステム上の機能で取り扱われたかを示し、システム上の機能を特徴としたシステム機能特徴スキルベクトルに基づいて、操作スキル特徴ベクトルを生成するので、各カテゴリから得られたテキストに対して付与されたラベルデータに基づいて、ある特定のユーザが投稿したテキストのシステム特徴に対する親和度合いをスキルとして抽出することが可能となる。例えば、ユーザが“SYNCHRONOUS”なコミュニケーションツール（チャットなど）に対して多くのコメントを投稿していた場合、“SYNCHRONOUS”なサービスに対して慣れ親しんでいると把握することができる。この頻度情報に基づいて、ユーザのシステム機能スキルベクトルを生成することによって、各システム機能特徴変数の頻度を表現することが可能となる。

【0017】

（３）また、本発明のプログラムにおいて、前記ユーザ変数は、ユーザ操作データがどのようなシステム上の状況で取り扱われたかを示し、前記システム上の状況を特徴とした状況特徴スキルベクトルに基づいて、前記操作スキル特徴ベクトルを生成することを特徴とする。

【0018】

このように、ユーザ変数は、ユーザ操作データがどのようなシステム上の状況で取り扱われたかを示し、システム上の状況を特徴とした状況特徴スキルベクトルに基づいて、操作スキル特徴ベクトルを生成するので、各カテゴリから得られたテキストに対して付与されたラベルデータに基づいて、ある特定のユーザが投稿したテキストの状況特徴に対する親和度合いをスキルとして抽出することが可能となる。例えば、ユーザが“PUBLIC”なコミュニケーションツール（チャットなど）に対して多くのコメントを投稿していた場合、“PUBLIC”なサービスに対して慣れ親しんでいると把握することができる。この頻度情報に基づいて、ユーザの状況特徴スキルベクトルを生成することによって、各状況特徴変数の頻度を表現することが可能となる。

【0019】

（４）また、本発明のプログラムにおいて、前記ユーザ変数は、ユーザ操作データがどのようなユーザの態度で取り扱われたかを示し、前記ユーザの態度を特徴としたユーザ態度スキルベクトルに基づいて、前記操作スキル特徴ベクトルを生成することを特徴とする。

【0020】

このように、ユーザ変数は、ユーザ操作データがどのようなユーザの態度で取り扱われたかを示し、ユーザの態度を特徴としたユーザ態度スキルベクトルに基づいて、操作スキル特徴ベクトルを生成するので、各カテゴリから得られたテキストに対して付与されたラベルデータに基づいて、ある特定のユーザが投稿したテキストのユーザ態度特徴に対する親和度合いをスキルとして抽出することが可能となる。例えば、ユーザが“THANK”や“GREET”に対して多くのコメントを投稿していた場合、社交的なコメント投稿に対して多くの経験・スキルを持つと把握することができる。この頻度情報に基づいて、ユーザの態度スキルベクトルを生成し、各ユーザ態度スキルベクトル変数の頻度を表現することが可能となる。

【0021】

（５）また、本発明のプログラムは、ユーザ操作データに含まれる重要語を選定し、重要度の高い単語を要素とする重要語ベクトルに基づいて、前記操作スキル特徴ベクトルを生成することを特徴とする。

【0022】

このように、ユーザ操作データに含まれる重要語を選定し、重要度の高い単語を要素とする重要語ベクトルに基づいて、操作スキル特徴ベクトルを生成するので、個人ユーザのコミュニケーション技能を明確に表現することが可能となる。これにより、ユーザの操作スキルに対応するサービスを示す情報を提示することが可能となる。

【0023】

（６）また、本発明のプログラムは、ユーザ操作データを入力する処理と、前記入力したユーザ操作データに対して、少なくとも一つのユーザ変数に基づいてラベリングを行なう処理と、を更に含むことを特徴とする。

【0024】

このように、ユーザ操作データを入力する処理と、前記入力したユーザ操作データに対して、少なくとも一つのユーザ変数に基づいてラベリングを行なう処理と、を更に含むので、入力したデータに対するラベリングを自動的に行なうことが可能となる。

【0025】

（７）また、本発明の端末装置は、ユーザの操作スキルに対応するサービスを示す情報を提示する端末装置であって、ユーザにより操作され、少なくとも一つのユーザ変数に基づいてラベリングされたユーザ操作データを取得するデータ取得部と、前記取得したユーザ操作データのユーザ変数をパラメータとして、ユーザの操作スキルを示す操作スキル特徴ベクトルを生成する操作スキル特徴ベクトル生成部と、ネットワーク上で操作されたネットワークデータのネットワーク変数をパラメータとして生成されたネットワークデータ特徴ベクトルを取得し、前記操作スキル特徴ベクトルと前記ネットワークデータ特徴ベクトルとの類似度を算出する類似度算出部と、前記算出した類似度に基づいて、表示候補とする少なくとも一つのネットワークデータ特徴ベクトルを選出し、前記選出したネットワークデータ特徴ベクトルを多次元空間にマッピングするマッピング部と、前記マッピングされたネットワークデータ特徴ベクトルを画面に表示する表示する表示部と、を備えることを特徴とする。

【0026】

【0027】

（８）また、本発明の端末装置は、入力したユーザ操作データに対して、少なくとも一つのユーザ変数に基づいてラベリングを行なう識別器を更に備えることを特徴とする。

【0028】

このように、入力したユーザ操作データに対して、少なくとも一つのユーザ変数に基づいてラベリングを行なう識別器を更に備えるので、入力したデータに対するラベリングを自動的に行なうことが可能となる。

【0029】

（９）また、本発明のデータ処理方法法は、ユーザの操作スキルに対応するサービスを示す情報を提示するデータ処理方法であって、ユーザにより操作され、少なくとも一つのユーザ変数に基づいてラベリングされたユーザ操作データを取得するステップと、前記取得したユーザ操作データのユーザ変数をパラメータとして、ユーザの操作スキルを示す操作スキル特徴ベクトルを生成するステップと、ネットワーク上で操作されたネットワークデータのネットワーク変数をパラメータとして生成されたネットワークデータ特徴ベクトルを取得するステップと、前記操作スキル特徴ベクトルと前記ネットワークデータ特徴ベクトルとの類似度を算出するステップと、前記算出した類似度に基づいて、表示候補とする少なくとも一つのネットワークデータ特徴ベクトルを選出するステップと、前記選出したネットワークデータ特徴ベクトルを多次元空間にマッピングするステップと、前記マッピングされたネットワークデータ特徴ベクトルを画面に表示するステップと、を少なくとも含むことを特徴とする。

【0030】

【発明の効果】

【0031】

本発明によれば、個人ユーザのコミュニケーション技能を可視化することが可能となる。これにより、ユーザの操作スキルに対応するサービスを示す情報を提示することが可能となる。

【図面の簡単な説明】

【0032】

【図1】本実施形態に係るデータ処理システムの概略構成を示す図である。

【図2】ＧＵＩイメージを示す図である。

【図3】コーディング（ラベリング）の動作を示すフローチャートである。

【図4】特徴ベクトル生成モジュールの動作を示すフローチャートである。

【図5】各システム機能特徴変数の頻度を表わした図である。

【図6】システム機能ベクトル抽出処理を示すフローチャートである。

【図7】各状況特徴変数のラベリング結果の頻度を表わした図である。

【図8】状況特徴ベクトル抽出処理を示すフローチャートである。

【図9】各ユーザ態度スキルベクトル変数の頻度を表わした図である。

【図10】ユーザ態度ベクトル抽出処理を示すフローチャートである。

【図11】特徴ベクトルをクラスタリングによってグルーピングする様子を示す図である。

【図12】特徴ベクトルを階層的に可視化した様子を示す図である。

【図13】サービス特徴抽出・提示モジュールの動作を示すフローチャートである。

【図14】類似度計算処理を示すフローチャートである。

【図15】システム機能スキルベクトルを表現した図である。

【図16】Ｍ１からＭ４までのシステム特徴をまとめて可視化した例を示している。

【図17】状況特徴スキルベクトルを表現した図である。

【図18】Ｓ１からＳ２までのシステム特徴をまとめて可視化した例を示している。

【図19】ユーザ態度スキルベクトルを表現した図である。

【図20】Ａ１からＡ１６までのシステム特徴をまとめて可視化した例を示している。

【発明を実施するための形態】

【0033】

以下、本発明の実施形態について図面を参照して説明する。図１は、本実施形態に係るデータ処理システムの概略構成を示す図である。このデータ処理システムは、コミュニケーションデータ収集モジュール５、データベース７、ラベリングモジュール９、特徴ベクトル生成モジュール１１、サービス特徴抽出・提示モジュール２１、類似度計算・提示モジュール２５、個人スキル抽出モジュール２７、および表示モジュール２３から構成されている。

【0034】

コミュニケーションデータ収集モジュール５は、ＳＮＳ（Social Networking Service）１や、電子メール・通話データ３からデータを収集する。例えば、ＡＰＩ（Application Programming Interface）を利用したクローリングなどによりデータを収集することができる。この場合、インターネットラジオ局のＡＰＩや、Ｔｗｉｔｔｅｒ（登録商標）のＡＰＩを利用することができる。

【0035】

入力は、例えば、ＳＮＳのある期間の投稿テキスト情報、マルチメディアサービスのコメントデータ、電子メールのインタラクションデータ、チャットデータなどを利用することができる。また、同一のＳＮＳ内で、チャット機能やブログ機能などが存在していた場合には同一データとして扱うこともできるし、機能ごとに分割することもできる。このようにして収集されたデータは、データベース７に格納される。

【0036】

ラベリングモジュール９は、コミュニケーションデータ収集モジュール５が収集したデータに対して、コーディング（ラベリング）を実施する。このコーディングは、ＷＥＢ上でＧＵＩ（Graphical User Interface）を提供し、オペレータが手作業で行ない、ＤＢに格納することができる。例えば、コーディング規準は関連文献１に記載されているコミュニケーション分類スキームを利用することができる。

【0037】

［関連文献１］
Susan C. Herring(2007), A Faceted Classification Scheme for Computer-Mediated Discourse. Language@Internet.http://www.languageatinternet.org/articles/2007/761
本発明では、以下のような変数に基づいてコーディングを実施する。

【0038】

［システム特徴変数］
M1(Synchronicity)、M2(Message transmission)、M3(Persistence of transcript)、M4(Size of message buffer)、 M5(Channels of communication)、M6(Anonymous messaging)、M7(Private messaging)、M8(Filtering)、M9(Quoting)、M10(Message format)
これらのシステム特徴変数においては、各変数に対して値を設定することができる。例えば、Ｍ１であれば１の際にＳｙｎｃｈｒｏｎｕｓ、２の際にＡｓｙｎｃｈｒｏｎｏｕｓといったラベルを付与することができる。

【0039】

［状況特徴変数]
S1(Participation Structure)、S2(Participant characteristics)、S3(Purpose)、S4 (Topic or Theme)、S5(Tone)、S6(Activity)、S7(Norms)、S8(Code)
これらの状況特徴変数については、自由記述とすることもできるし、あらかじめ選択肢を与えることもできる。

【0040】

図２は、ＧＵＩイメージを示す図である。例えば、図２に示すように、画面の左側にはコミュニケーションデータが表示され、右側にてコーディング結果を入力することができる。入力方法は、チェックボックスで入力をしたり、タッチパネルにて選択したりすることも可能である。コーディング自体は複数人で実施することもできる。その際には、複数の結果を比較し、結果の一致率や、相違のある結果をコーディング者に再提示することもできる。

【0041】

なお、変数は、上記の他にも情景変数、ユーザ態度変数などを自由に設定することも可能である。例えば、情景変数は、季節、時間帯、天候などを利用することができる。例えば、ユーザ態度変数としては話者の態度（提示・賛同、拒絶）などを利用することができ、例えば、以下の関連文献２の技術を利用して以下のように設定することができる。

【0042】

［関連文献２］
Herring, S. C., Das, A., & Penumarthy, S. (2005). CMC act taxonomy. http://www.slis.indiana.edu/faculty/herring/cmc.acts.html
A1(Inquire)、A2(Request)、A3(Invite)、A4(Desire)、A5(React)、A6(Manage)、A7(Direct)、A8(Accept)、A9(Apologize)、A10(Repair)、A11(Reject)、A12(Elaborate)、A13(Thank)、A14(Inform)、A15(Claim)、A16(Greet)
なお、ラベリングモジュール９にＳＶＭ（Support vector machine）などの識別器としての機能を持たせて、コーディングを自動で行なうことも可能である。自動でコーディングを実施する場合には、あらかじめシステムに登録した事前情報を利用したり、事前に学習データを収集・コーディングを実施し、識別器により自動ラベリングを実施したりすることができる。例えば、ＳＮＳ（Ａ）によって得られた情報がＭ１―Ｍ１０まで固定であった場合、ＳＮＳ（Ａ）によって得られた他のデータについても同様の情報を自動で付与することができる。

【0043】

また、Ｓ１−Ｓ８などについて、自動でラベリングを付与することもできる。例えば、学習データとして、大量のコミュニケーションデータに対するコーディング結果が蓄積できた場合、識別器により自動でラベルを付与することができる。例えば、コーディング結果Ｓ１が付与されたコミュニケーションデータをＴＦＩＤＦにより特徴ベクトル化し、ＳＶＭによりＳ１の正否を判断することよって、自動でラベルを付与することができる。

【0044】

図３は、コーディング（ラベリング）の動作を示すフローチャートである。まず、コミュニケーションデータ収集モジュール５を介してデータを取得し（ステップＳ１）、識別器があるかどうかを判断する（ステップＳ２）。識別器がある場合は、ステップＳ７に遷移する。一方、ステップＳ２において、識別器が無い場合は、ラベルデータがあるかどうかを判断し（ステップＳ３）、ラベルデータがある場合は、ステップＳ６に遷移する。ラベルデータが無い場合は、ラベルデータを取得し（ステップＳ４）、ＧＵＩ表示され（ステップＳ５）、オペレータからラベリングされたデータに基づいて、識別器が生成される（ステップＳ６）。

【0045】

ここで、識別器は、例えば、“Support Vector Machine”を利用してラベルＡであるかどうかを識別する場合、ラベルＡが付与されたテキストデータ群から重要語を抽出し、重要語の頻度に基づいて特徴ベクトル化する。（例えば、TF/IDFに基づくBag of Words）ラベルＡが付与された学習データ群とその特徴ベクトル群を正データ、ラベルデータＡが付与されていない学習データとその特徴ベクトル群を負データとして学習に利用することで、ラベルＡであるかどうかの識別器を生成することができる。そして、ラベルが付与されて（ステップＳ７）、終了する。

【0046】

図１において、特徴ベクトル生成モジュール１１は、状況特徴スキル抽出機能１３と、システム機能スキル抽出機能１５と、ユーザ態度スキル抽出機能１７と、重要語抽出機能１９とを備えており、コーディング結果とコミュニケーションデータに基づいて、コミュニケーションデータを特徴量化する。例えば、入力したコーディング結果は、各変数の入力値をパラメータとして、多次元ベクトルとして表現することができる。例えば、システム機能特徴、状況特徴、ユーザ態度特徴をベクトルとして抽出することができる。また、これらのベクトルを一つにまとめて特徴ベクトルとして抽出することもできる。さらに、蓄積されたコミュニケーションデータより、ＴＦＩＤＦ法に基づいて重要語を選定し、重要度の高い単語をベクトルの要素として、データ中の各要素となった単語の頻度を計算することによって、コミュニケーションデータをベクトル化することができる。

【0047】

図４は、特徴ベクトル生成モジュールの動作を示すフローチャートである。まず、コーディング結果とコミュニケーションデータを入力する（ステップＴ１）。次に、システム機能特徴ベクトルを抽出する（ステップＴ２）。次に、状況特徴ベクトルを抽出する（ステップＴ３）。次に、ユーザ態度ベクトルを抽出する（ステップＴ４）。次に、重要語ベクトルを抽出する（ステップＴ５）。そして、抽出したベクトルを統合して（ステップＴ６）、終了する。次に、上記のようにベクトルを抽出する処理について説明する。

【0048】

［システム機能ベクトル抽出処理］
各カテゴリから得られたテキストに対して付与されたラベルデータに基づいて、コミュニケーションデータがどのようなシステム機能上で為されたかを特徴として抽出する。例えば、あるひとつのコミュケーションサービスを分析単位とした場合、ユーザが“SYNCHRONOUS”なコミュニケーションツール（チャットなど）に対して多くのコメントを投稿していた場合、該当のサービス上では、“SYNCHRONOUS”なサービスがよく利用されていると把握することができる。この情報に基づいて、ユーザのシステム機能ベクトルを生成する。

【0049】

図５は、各システム機能特徴変数の頻度を表わした図である。このように視覚化する場合、分析データ数の違いを軽減するために、全ての分析単位数で正規化することもできる。また、必ずしもサービス単位で処理を実施する必要はなく、あるサービス内で発生したマクロなコミュニケーションデータを一つの分析単位としても良い。

【0050】

図６は、システム機能ベクトル抽出処理を示すフローチャートである。まず、ラベルデータを取得し（ステップＰ１）、要素数をカウントする（ステップＰ２）。次に、すべてのシステム機能変数について、カウントしたかどうかを判断し（ステップＰ３）、すべてのシステム機能変数について、カウントしていない場合は、ステップＰ２に遷移する。すべてのシステム機能変数について、カウントした場合は、全ての分析単位数で正規化を行なって（ステップＰ４）、ベクトルを生成する（ステップＰ５）。

【0051】

［状況特徴ベクトル抽出処理］
各カテゴリから得られたテキストに対して付与されたラベルデータに基づいて、コミュニケーションがどのような状況で為されたかを特徴として抽出する。例えば、分析単位を一つのコミュニケーションサービスとした場合を考える。ユーザ群が、第三者に閲覧できないコミュニケーション機能（プライベートチャットなど）に対して多くのコメントを投稿していた場合、コミュニケーションサービスを特徴づける機能として、プライベートチャットが重要であると把握することができる。この情報に基づいて、ユーザの状況特徴ベクトルを生成する。

【0052】

図７は、各状況特徴変数のラベリング結果の頻度を表わした図である。このように視覚化する場合、分析データ数の違いを軽減するために、全ての分析単位数で正規化することもできる。例えば、Ｓ２等、事前に要素が設定できない項目については、ユーザが利用しているＳＮＳ・コミュニティの年齢や、性別分布を事前に抽出し、パターン登録することもできる。例えば、ＳＮＳ１でのコミュニティが女性、３０代のみのコミュニティであった場合をパターン１として登録し、ＳＮＳ２でのコミュニティが男女比率７：３、年齢分布として、２０代：３０代：４０代＝３：３：４をパターン２として登録することで頻度計算を実施することができる。

【0053】

図８は、状況特徴ベクトル抽出処理を示すフローチャートである。まず、ラベルデータを取得し（ステップＱ１）、パターンの登録を行なう（ステップＱ２）。次に、要素数をカウントし（ステップＱ３）、すべての状況変数について、カウントしたかどうかを判断する（ステップＱ４）。すべての状況変数について、カウントしていない場合は、ステップＱ３に遷移する一方、すべてのシステム機能変数について、カウントした場合は、全ての分析単位数で正規化を行なって（ステップＱ５）、ベクトルを生成する（ステップＱ６）。

【0054】

［ユーザ態度ベクトル抽出処理］
各カテゴリから得られたテキストに対して付与されたラベルデータに基づいて、ユーザが投稿したテキストがどのような態度を示唆しているのかを特徴として抽出する。例えば、ユーザが“THANK”や“GREET”に対して多くのコメントを投稿していた場合、該当のコミュニケーションサービス（分析単位）上で社交的な行動が多くなされていると把握することができる。この情報に基づいて、ユーザの態度ベクトルを生成する。

【0055】

図９は、各ユーザ態度スキルベクトル変数の頻度を表わした図である。このように視覚化する場合、分析データ数の違いを軽減するために、全ての分析単位数で正規化することもできる。

【0056】

図１０は、ユーザ態度ベクトル抽出処理を示すフローチャートである。まず、ラベルデータを取得し（ステップＲ１）、要素数をカウントする（ステップＲ２）。次に、すべてのユーザ態度変数について、カウントしたかどうかを判断し（ステップＲ３）、すべてのユーザ態度変数について、カウントしていない場合は、ステップＲ２に遷移する。すべてのユーザ態度変数について、カウントした場合は、全ての分析単位数で正規化を行なって（ステップＲ４）、ベクトルを生成する（ステップＲ５）。

【0057】

図１において、サービス特徴抽出・提示モジュール２１は、特徴ベクトル生成モジュール１１によって作成された特徴ベクトルに基づいて、多次元空間上へマッピングする。例えば、主成分分析を適用し、第１主成分・第２主成分を表現軸として利用することで２次元平面上のプロットとして表現することができる。また、第３主成分を加えることで三次元表示が可能となる。また、そのほかにも、ＳＯＭ（Self-Organizing Map）などの可視化技術を利用することが可能である。

【0058】

図１１は、特徴ベクトルをクラスタリングによってグルーピングする様子を示す図である。グルーピングの最大枠１００の範囲内で、複数のグループ１０１が形成されている。各グループ１０１には、特徴ベクトル１０２が少なくとも１つ含まれている。また、特徴ベクトル１０２のように、分類の基準によって、異なる特徴を有する特徴ベクトルは、異なるグループに属することとなる。図１１に示すように、特徴ベクトルによって表現されたコミュニケーションデータは、さらにクラスタリング手法を適用することによって、グルーピングして表示することが可能である。クラスタリング方式は、例えば、Ｋ−ｍｅａｎｓ法などにより分類することができる。画面上でプロットをクリックすることによって、各ＳＮＳ上のコミュニケーションデータの分類結果を閲覧することができる。なお、この処理は、主成分分析を適用する前にも実施することができる。

【0059】

図１２は、特徴ベクトルを階層的に可視化した様子を示す図である。図１２では、グルーピングの最大枠２００の範囲内で、最上位の階層２０１で複数のグループ２０６、２０７、２２０が形成されている。最上位の各グループ２０６、２０７、２２０は、それぞれ第２階層のグループ２０２、２０３、２０４を有している。第２階層のグループ２０２には、特徴ベクトル２０８、２０９が含まれており、さらに特徴ベクトル２０８、２０９は、第３階層のグループ２１０、２１１を有している。第２階層のグループ２０３、２０４も同様である。すなわち、第２階層のグループ２１４、２１５は、それぞれ、第３階層のグループ２１２、２１３を有している。また、第２階層のグループ２１８、２１９は、それぞれ、第３階層のグループ２１６、２１７を有している。

【0060】

図１２に示すように、サービス特徴抽出・提示モジュール２１は、システム特徴変数による特徴ベクトル、状況特徴変数による特徴ベクトル、コミュニケーションデータの重要語に基づく特徴ベクトルについて、階層的に可視化することも可能である。図１２では、システム特徴変数による空間を第１の空間としているが、順番は可変である。さらに、コミュニケーションデータの重要語に基づく特徴ベクトルについては、クラスタリングの結果に基づいて、代表的な重要語を空間上に表示することもできる。

【0061】

図１３は、サービス特徴抽出・提示モジュールの動作を示すフローチャートである。まず、特徴ベクトルを抽出し（ステップＶ１）、Ｋ−ｍｅａｎｓ法における次元圧縮を行なうかどうかを判断する（ステップＶ２）。次元圧縮を行なわない場合は、ステップＶ５に遷移する一方、次元圧縮を行なう場合は、主成分分析を行ない（ステップＶ３）、第Ｎ主成分を抽出する（ステップＶ４）。次に、クラスタリングを行ない（ステップＶ５）、クラスタリング結果を可視化するために表示処理を行なう（ステップＶ６）。次に、すべての特徴ベクトルについて処理したかどうかを判断し（ステップＶ７）、すべての特徴ベクトルについて処理していない場合は、ステップＶ１に遷移する。一方、すべての特徴ベクトルについて処理した場合は、代表的な重要語を抽出し（ステップＶ８）、抽出した重要語に基づく特徴ベクトルを空間上に表示する処理を行なって（ステップＶ９）、終了する。

【0062】

次に、図１における個人スキル抽出モジュール２７について説明する。個人スキル抽出モジュール２７は、システム機能スキル抽出機能を有している。システム機能スキル抽出機能は、各カテゴリから得られたテキストに対して付与されたラベルデータに基づいて、ある特定のユーザが投稿したテキストのシステム特徴に対する親和度合いをスキルとして抽出する。例えば、ユーザが“SYNCHRONOUS”なコミュニケーションツール（チャットなど）に対して多くのコメントを投稿していた場合、“SYNCHRONOUS”なサービスに対して慣れ親しんでいると把握することができる。この頻度情報に基づいて、ユーザのシステム機能スキルベクトルを生成する。例えば、図３に示した様に、各システム機能特徴変数の頻度によって表現することができる。

【0063】

また、個人スキル抽出モジュール２７は、状況特徴スキル抽出機能を有している。状況特徴スキル抽出機能は、各カテゴリから得られたテキストに対して付与されたラベルデータに基づいて、ある特定のユーザが投稿したテキストの状況特徴に対する親和度合いをスキルとして抽出する。例えば、ユーザが“PUBLIC”なコミュニケーションツール（チャットなど）に対して多くのコメントを投稿していた場合、“PUBLIC”なサービスに対して慣れ親しんでいると把握することができる。この頻度情報に基づいて、ユーザの状況特徴スキルベクトルを生成する。例えば、図４に示した様に各状況特徴変数の頻度などを利用することにより計算することができる。

【0064】

Ｓ２については、ユーザが利用しているＳＮＳ・コミュニティの年齢や、性別分布を事前に抽出し、パターン登録することが出来る。例えば、ＳＮＳ１でのコミュニティが女性、３０代のみのコミュニティであった場合をパターン１として登録し、ＳＮＳ２でのコミュニティが男女比率７：３、年齢分布として、２０代：３０代：４０代＝３：３：４をパターン２として登録することで頻度計算を実施することができる。

【0065】

また、個人スキル抽出モジュール２７は、ユーザ態度スキル抽出機能を有している。ユーザ態度スキル抽出機能は、各カテゴリから得られたテキストに対して付与されたラベルデータに基づいて、ある特定のユーザが投稿したテキストのユーザ態度特徴に対する親和度合いをスキルとして抽出する。例えば、ユーザが“THANK”や“GREET”に対して多くのコメントを投稿していた場合、社交的なコメント投稿に対して多くの経験・スキルを持つと把握することができる。この頻度情報に基づいて、ユーザの態度スキルベクトルを生成する。例えば、図５に示した様に、各ユーザ態度スキルベクトル変数の頻度などを利用することにより計算することができる。

【0066】

図１において、類似度計算・提示モジュール２５は、個人スキル抽出モジュール２７、サービス特徴抽出・提示モジュール２１によって得られた特徴ベクトル同士を比較することによって、個人スキルとの類似度を計算する。類似度はコサイン距離などを利用することで計算することができる。類似度に基づいて、上位N件をユーザに提示することによって、個人スキルに適合したサービスを推薦することができる。

【0067】

図１４は、類似度計算処理を示すフローチャートである。まず、個人スキル抽出モジュール２７を介して、個人スキルベクトルを抽出し（ステップＷ１）、サービス特徴抽出・提示モジュール２１を介して、サービス特徴ベクトルを抽出する（ステップＷ２）。次に、抽出した２つのベクトルの類似度を計算し（ステップＷ３）、すべてのＳＮＳについて、類似を計算したかどうかを判断する（ステップＷ４）。すべてのＳＮＳについて、類似度を計算していない場合は、ステップＷ２に遷移する。一方、すべてのＳＮＳについて、類似度を掲載した場合は、類似度の高い方からＮ件抽出し（ステップＷ５）、ユーザに提示して（ステップＷ６）、終了する。

【0068】

図１において、表示モジュール２３は、個人スキル抽出モジュール２７によって得られたシステム機能スキルベクトルに基づいて、部分的な分布を計算し、可視化することが可能である。図１５は、システム機能スキルベクトルを表現した図である。図１５に示すように、例えば、Ｍ１の“SYNCHRONISITY”についての頻度をグラフ化することができる。また、その他に、複数のシステム特徴変数をまとめて表示することもできる。図１６は、Ｍ１からＭ４までのシステム特徴をまとめて可視化した例を示している。

【0069】

また、表示モジュール２３は、個人スキル抽出モジュール２７によって得られた状況特徴スキルベクトルに基づいて、部分的な分布を計算し、可視化することが可能である。図１７は、状況特徴スキルベクトルを表現した図である。図１７に示すように、例えば、S１のユーザ参加形態についての投稿頻度をグラフ化することができる。また、その他に、複数のシステム特徴変数をまとめて表示することもできる。図１８は、Ｓ１からＳ２までのシステム特徴をまとめて可視化した例を示している。

【0070】

また、表示モジュール２３は、個人スキル抽出モジュール２７によって得られたユーザ態度スキルベクトルに基づいて、部分的な分布を計算し、可視化することができる。図１９は、ユーザ態度スキルベクトルを表現した図である。図１９に示すように、例えば、Ａ１−Ａ３のユーザ参加形態についての投稿頻度をグラフ化することができる。また、その他に、複数のシステム特徴変数をまとめて表示することもできる。図２０は、Ａ１からＡ１６までのシステム特徴をまとめて可視化した例を示している。

【0071】

また、表示モジュール２３は、以上の全てのスキルベクトルをカテゴリ毎にカテゴリベクトルとしてスキル表現空間を生成することによって、ユーザがどのようなスキルを多く利用しているかを可視化することができる。図１１に示したように、例えば、主成分分析を適用し、第１主成分・第２主成分を表現軸として利用することによって、２次元平面上のプロットとして表現することができる。第３主成分を加えることで三次元表示が可能となる。また、そのほかにもＳＯＭなどの可視化技術を利用することが可能である。

【0072】

特徴ベクトルによって表現されたコミュニケーションデータは、さらにクラスタリング手法などを適用することでグルーピングして表示することもできる。クラスタリング方式は例えばＫ−ｍｅａｎｓ法などにより分類することができる。画面上でプロットをクリックすることによって、各ＳＮＳ上のコミュニケーションデータの分類結果や投稿頻度を閲覧することができる。また、本システムにより得られたユーザのスキル分布を利用して、ユーザに対して特定のＳＮＳを推薦することもできる。本実施形態に係るデータ処理システムを利用することによって、ユーザのスキルに応じた新規ＳＮＳを推薦することができる。

【0073】

以上説明したように、本実施形態によれば、実際にデータを取得することが困難なＳＮＳに対してもコミュニケーション状況を可視化することができため、ユーザは、ＳＮＳ上でどのようなコミュニケーションが行われているのかを事前に把握することが可能となる。これにより、ユーザは、自身に適したＳＮＳを容易に選ぶことが可能となる。本実施形態によれば、従来技術では実現できなかった、複数の観点での特徴量（システム変数・状況変数・コミュニケーション変数など）を統一的に表示することができる。

【符号の説明】

【0074】

５コミュニケーションデータ収集モジュール
７データベース
９ラベリングモジュール
１１特徴ベクトル生成モジュール
１３状況特徴スキル抽出機能
１５システム機能スキル抽出機能
１７ユーザ態度スキル抽出機能
１９重要語抽出機能
２１サービス特徴抽出・提示モジュール
２３表示モジュール
２５類似度計算・提示モジュール
２７個人スキル抽出モジュール

【図1】