(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6663944
(24)【登録日】2020年2月19日
(45)【発行日】2020年3月13日
(54)【発明の名称】ユーザに対するコンテンツの共感影響力を推定するプログラム、装置及び方法
(51)【国際特許分類】
G06F 16/9536 20190101AFI20200302BHJP
【FI】
G06F16/9536
【請求項の数】7
【全頁数】14
(21)【出願番号】特願2018-37000(P2018-37000)
(22)【出願日】2018年3月1日
(65)【公開番号】特開2019-153013(P2019-153013A)
(43)【公開日】2019年9月12日
【審査請求日】2019年12月18日
(73)【特許権者】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】100135068
【弁理士】
【氏名又は名称】早原 茂樹
(72)【発明者】
【氏名】松本 一則
(72)【発明者】
【氏名】帆足 啓一郎
(72)【発明者】
【氏名】池田 和史
【審査官】
早川 学
(56)【参考文献】
【文献】
米国特許出願公開第2014/0156582(US,A1)
【文献】
韓国公開特許第10−2008−0083248(KR,A)
【文献】
徳永正和、外1名,情報推薦システムにおける項目応答理論の利用可能性について,第4回データ工学と情報マネジメントに関するフォーラム論文集 (第10回日本データベース学会年次大会),電子情報通信学会データ工学研究専門委員会 日本デー,2012年 7月13日,[検索日:2012.08.30], Internet<URL:http://db-event.jpn.org/deim2012/proceedings/final-pdf/a5-4.pdf>
【文献】
橋間智博,Webサイトにおける項目反応理論を用いたおすすめコンテンツの提示,FIT2007 第6回情報科学技術フォーラム 一般講演論文集 第4分冊 ネットワーク・セキュリティ,社団法人情報処理学会、社団法人電子情報通信学会,2007年 8月22日,pp.451,452
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00−16/958
(57)【特許請求の範囲】
【請求項1】
ユーザに対する推定対象コンテンツcEの共感影響力Mを推定する装置に搭載されたコンピュータを機能させるプログラムであって、
学習機能として、
コンテンツcl(c1〜cL)毎に、各ユーザ(s1〜sN)の共感度(t11〜t1N,〜,tL1〜tLN)を対応付けた共感度行列Tlnを記憶する共感度行列記憶手段と、
前記コンテンツcl毎に、所定の各コンテンツ特徴要素(v1〜vJ)の特徴量(f11〜f1J,〜,fL1〜fLJ)を対応付けたコンテンツ特徴量行列Fljを記憶するコンテンツ特徴量行列記憶手段と、
前記コンテンツcl毎に、ユーザの共感度行列Tlnを入力し、項目反応理論IRT(Item Response Theory)に基づく識別度αl及び難易度βlを算出する項目反応理論算出手段と、
前記コンテンツcl毎に、前記コンテンツ特徴量行列Fljと識別度αl及び難易度βlとを対応付けた教師データとして学習する機械学習エンジンと
として機能させ、
運用機能として、
推定対象コンテンツcEについて、所定の各コンテンツ特徴要素(v1〜vJ)の特徴量(fE1〜fEJ)を対応付けたコンテンツ特徴量行列FEを算出するコンテンツ特徴量行列算出手段と
して機能させると共に、
前記機械学習エンジンは、前記推定対象コンテンツcEの前記特徴量行列FEを入力し、識別度αE及び難易度βEを、共感影響力Mとして出力する
ようにコンピュータを機能させることを特徴とするプログラム。
【請求項2】
前記共感度は、
前記コンテンツの登場人物又は著作者の感情を理解する認知度tRと、
前記コンテンツの登場人物又は著作者と同じ感情を生じる情動度tEと
からなり、
前記項目反応理論算出手段は、2母数ロジスティックモデルとして算出する
ようにコンピュータを機能させることを特徴とする請求項1に記載のプログラム。
【請求項3】
前記コンテンツが、テキストである場合、
前記コンテンツ特徴要素は、複数のコンテンツのテキストを、述語項構造解析に基づいて、述語項構造の分布からLDA(Latent Dirichlet Allocation)によって分類した複数個のトピックグループであり、
前記特徴量は、各コンテンツのテキストについて、分類された各トピックグループに属するトピック比率(確からしさ)である
ようにコンピュータを機能させることを特徴とする請求項1又は2に記載のプログラム。
【請求項4】
前記コンテンツは、不特定多数の第三者からWebサーバに投稿されたものであり、
前記共感影響力Mは、ユーザがWebサーバの当該コンテンツを閲覧した際に受ける感情に基づくものである
ようにコンピュータを機能させることを特徴とする請求項1から3のいずれか1項に記載のプログラム。
【請求項5】
前記機械学習エンジンは、線形回帰、サポートベクターマシン(Support Vector Machine)、又は、深層学習の回帰学習に基づくものである
ようにコンピュータを機能させることを特徴とする請求項1から4のいずれか1項に記載のプログラム。
【請求項6】
ユーザに対する推定対象コンテンツcEの共感影響力Mを推定する装置であって、
学習機能として、
コンテンツcl(c1〜cL)毎に、各ユーザ(s1〜sN)の共感度(t11〜t1N,〜,tL1〜tLN)を対応付けた共感度行列Tlnを記憶する共感度行列記憶手段と、
前記コンテンツcl毎に、所定の各コンテンツ特徴要素(v1〜vJ)の特徴量(f11〜f1J,〜,fL1〜fLJ)を対応付けたコンテンツ特徴量行列Fljを記憶するコンテンツ特徴量行列記憶手段と、
前記コンテンツcl毎に、ユーザの共感度行列Tlnを入力し、項目反応理論IRT(Item Response Theory)に基づく識別度αl及び難易度βlを算出する項目反応理論算出手段と、
前記コンテンツcl毎に、前記コンテンツ特徴量行列Fljと識別度αl及び難易度βlとを対応付けた教師データとして学習する機械学習エンジンと
を有し、
運用機能として、
推定対象コンテンツcEについて、所定の各コンテンツ特徴要素(v1〜vJ)の特徴量(fE1〜fEJ)を対応付けたコンテンツ特徴量行列FEを算出するコンテンツ特徴量行列算出手段を有し、
前記機械学習エンジンは、前記推定対象コンテンツcEの前記特徴量行列FEを入力し、識別度αE及び難易度βEを、共感影響力Mとして出力する
ことを特徴とする装置。
【請求項7】
ユーザに対する推定対象コンテンツcEの共感影響力Mを推定する装置の推定方法であって、
前記装置は、
学習機能として、
コンテンツcl(c1〜cL)毎に、各ユーザ(s1〜sN)の共感度(t11〜t1N,〜,tL1〜tLN)を対応付けた共感度行列Tlnを記憶する共感度行列記憶部と、
前記コンテンツcl毎に、所定の各コンテンツ特徴要素(v1〜vJ)の特徴量(f11〜f1J,〜,fL1〜fLJ)を対応付けたコンテンツ特徴量行列Fljを記憶するコンテンツ特徴量行列記憶部と、
前記コンテンツcl毎に、ユーザの共感度行列Tlnを入力し、項目反応理論IRT(Item Response Theory)に基づく識別度αl及び難易度βlを算出する第11のステップと、
機械学習エンジンを用いて、前記コンテンツcl毎に、前記コンテンツ特徴量行列Fljと識別度αl及び難易度βlとを対応付けた教師データとして学習する第12のステップと
を実行し、
運用機能として、
推定対象コンテンツcEについて、所定の各コンテンツ特徴要素(v1〜vJ)の特徴量(fE1〜fEJ)を対応付けたコンテンツ特徴量行列FEを算出する第21のステップと、
前記機械学習エンジンが、前記推定対象コンテンツcEの前記特徴量行列FEを入力し、識別度αE及び難易度βEを、共感影響力Mとして出力する第22のステップと
を実行することを特徴とする装置の推定方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ユーザに対するコンテンツの共感影響力を推定する技術に関する。
【背景技術】
【0002】
近年、人と対話する対話システムが、スマートフォンアプリケーションやロボットにも搭載されてきている。
古くはELIZAやSHRDLUのように、ユーザ発話に対して一問一答形式で返答する技術がある(例えば非特許文献1参照)。この技術によれば、事前に蓄積された質問例の集合の中から、パターンマッチによってユーザ発話に近い質問例を検出する。
これに対し、現在の対話システムは、「タスク指向対話機能」及び「雑談対話機能」に大別でき、これらの機能を組み合わせて構成されている。
また、対人関係の確立と維持を目的として、「社会的対話」に注目した対話システムの技術もある(例えば非特許文献2参照)。
更に、社会的対話に共感性を適用した対話システムによって、ユーザの親近感を高めようとする技術もある(例えば非特許文献3参照)。
更に、ユーザの興味分野の情報レコメンド機能を、対話システムに適用した技術もある(例えば非特許文献4参照)。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】奥村学、他、「対話システム」、コロナ社、2017年、ISBN:978-4-339-02757-0
【非特許文献2】T. W. Bickmore and R. W. Picard, “Establishing and maintaining long-term human-computer relationships”, ACM Tran. on Computer-Human Interaction ‘TOCHI), 12(2):293-327, 2005.、[online]、[平成30年2月12日検索]、インターネット<URL:http://www.ccs.neu.edu/home/bickmore/publications/toCHI.pdf>
【非特許文献3】東中竜一郎, 堂坂浩二, 磯崎秀樹, “対話システムにおける共感と自己開示の効果”, 言語処理学会第15回年次大会,446-449, 2009.、[online]、[平成30年2月12日検索]、インターネット<URL:http://www.kecl.ntt.co.jp/icl/lirg/members/rh/pdf/NLP2009.pdf>
【非特許文献4】五十島志織,富永和人,亀田弘之,“対話からの興味をもとに情報を推薦するボットの作成”, 第11 回情報科学技術フォーラム, F-024, 2012.、[online]、[平成30年2月12日検索]、インターネット<URL:https://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=151579&item_no=1&attribute_id=1&file_no=1>
【非特許文献5】戸田弘二,”心理測定尺度集II 人間と社会のつながりをとらえる<対人関係・価値観> 3共感性・他者意識”, 吉田富二雄編,堀洋道監修,サイエンス社,pp. 118-137
【非特許文献6】鈴木有美, 木野和代, “多次元共感性尺度(MES)の作成 −自己志向・他者志向の弁別に焦点をあてて−”, 教育心理学研究, 56, 487-497, 2008.、[online]、[平成30年2月12日検索]、インターネット<URL:https://ci.nii.ac.jp/naid/110007028208>
【非特許文献7】項目応答理論、[online]、[平成30年2月12日検索]、インターネット<URL:https://ja.wikipedia.org/wiki/%E9%A0%85%E7%9B%AE%E5%BF%9C%E7%AD%94%E7%90%86%E8%AB%96>
【発明の概要】
【発明が解決しようとする課題】
【0004】
前述した従来技術によれば、対話システムにおけるユーザの親近感を高めようとしているが、心理学の知見に基づいた社会的対話については何ら検討されていない。
心理学の分野によれば、他者の気持ちを認知し、他者と同じ情動を持つ体験する性質として、「共感性(Empathy)」がある(例えば非特許文献5参照)。但し、共感性は、単一の観点のみから判断することできない。具体的には、共感性は、「他者の心理状態を正確に認知する能力(認知度)」と「他者の心理状態に対する代理的な反応の強さ(情動度)」との多元的な観点から判断する必要がある(例えば非特許文献6参照)。
【0005】
例えば、ある記事を閲覧したユーザは、その記事の登場人物(擬人化された物も含む)や著作者の思考及び感情を理解し、何らかの感情を抱く。これは、ユーザに対して、そのコンテンツが持つ共感影響力に基づく。ユーザが持つ共感性は、その話題(内容)に限られず、その表現方法によっても変わる。例えば同じ話題であっても、表現方法によっては、ユーザの共感性に対する影響力は違ってくる。
【0006】
そこで、本発明は、ユーザに対するコンテンツの共感影響力を推定するプログラム、装置及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明によれば、ユーザに対する推定対象コンテンツc
Eの共感影響力Mを推定する装置に搭載されたコンピュータを機能させるプログラムであって、
学習機能として、
コンテンツc
l(c
1〜c
L)毎に、各ユーザ(s
1〜s
N)の共感度(t
11〜t
1N,〜,t
L1〜t
LN)を対応付けた共感度行列T
lnを記憶する共感度行列記憶手段と、
コンテンツc
l毎に、所定の各コンテンツ特徴要素(v
1〜v
J)の特徴量(f
11〜f
1J,〜,f
L1〜f
LJ)を対応付けたコンテンツ特徴量行列F
ljを記憶するコンテンツ特徴量行列記憶手段と、
コンテンツc
l毎に、ユーザの共感度行列T
lnを入力し、項目反応理論IRT(Item Response Theory)に基づく識別度α
l及び難易度β
lを算出する項目反応理論算出手段と、
コンテンツc
l毎に、コンテンツ特徴量行列F
ljと識別度α
l及び難易度β
lとを対応付けた教師データとして学習する機械学習エンジンと
として機能させ、
運用機能として、
推定対象コンテンツc
Eについて、所定の各コンテンツ特徴要素(v
1〜v
J)の特徴量(f
E1〜f
EJ)を対応付けたコンテンツ特徴量行列F
Eを算出するコンテンツ特徴量行列算出手段と
して機能させると共に、
機械学習エンジンは、推定対象コンテンツc
Eの特徴量行列F
Eを入力し、識別度α
E及び難易度β
Eを、共感影響力Mとして出力する
ようにコンピュータを機能させる。
【0008】
本発明のプログラムにおける他の実施形態によれば、
共感度は、
コンテンツの登場人物又は著作者の感情を理解する認知度t
Rと、
コンテンツの登場人物又は著作者と同じ感情を生じる情動度t
Eと
からなり、
項目反応理論算出手段は、2母数ロジスティックモデルとして算出する
ようにコンピュータを機能させることも好ましい。
【0009】
本発明のプログラムにおける他の実施形態によれば、
コンテンツが、テキストである場合、
コンテンツ特徴要素は、複数のコンテンツのテキストを、述語項構造解析に基づいて、述語項構造の分布からLDA(Latent Dirichlet Allocation)によって分類した複数個のトピックグループであり、
特徴量は、各コンテンツのテキストについて、分類された各トピックグループに属するトピック比率(確からしさ)である
ようにコンピュータを機能させることも好ましい。
【0010】
本発明のプログラムにおける他の実施形態によれば、
コンテンツは、不特定多数の第三者からWebサーバに投稿されたものであり、
共感影響力Mは、ユーザがWebサーバの当該コンテンツを閲覧した際に受ける感情に基づくものである
ようにコンピュータを機能させることも好ましい。
【0011】
本発明のプログラムにおける他の実施形態によれば、
機械学習エンジンは、線形回帰、サポートベクターマシン(Support Vector Machine)、又は、深層学習の回帰学習に基づくものである
ようにコンピュータを機能させることも好ましい。
【0012】
本発明によれば、ユーザに対する推定対象コンテンツc
Eの共感影響力Mを推定する装置であって、
学習機能として、
コンテンツc
l(c
1〜c
L)毎に、各ユーザ(s
1〜s
N)の共感度(t
11〜t
1N,〜,t
L1〜t
LN)を対応付けた共感度行列T
lnを記憶する共感度行列記憶手段と、
コンテンツc
l毎に、所定の各コンテンツ特徴要素(v
1〜v
J)の特徴量(f
11〜f
1J,〜,f
L1〜f
LJ)を対応付けたコンテンツ特徴量行列F
ljを記憶するコンテンツ特徴量行列記憶手段と、
コンテンツc
l毎に、ユーザの共感度行列T
lnを入力し、項目反応理論IRT(Item Response Theory)に基づく識別度α
l及び難易度β
lを算出する項目反応理論算出手段と、
コンテンツc
l毎に、コンテンツ特徴量行列F
ljと識別度α
l及び難易度β
lとを対応付けた教師データとして学習する機械学習エンジンと
を有し、
運用機能として、
推定対象コンテンツc
Eについて、所定の各コンテンツ特徴要素(v
1〜v
J)の特徴量(f
E1〜f
EJ)を対応付けたコンテンツ特徴量行列F
Eを算出するコンテンツ特徴量行列算出手段を有し、
機械学習エンジンは、推定対象コンテンツc
Eの特徴量行列F
Eを入力し、識別度α
E及び難易度β
Eを、共感影響力Mとして出力する
ことを特徴とする。
【0013】
本発明によれば、ユーザに対する推定対象コンテンツc
Eの共感影響力Mを推定する装置の推定方法であって、
装置は、
学習機能として、
コンテンツc
l(c
1〜c
L)毎に、各ユーザ(s
1〜s
N)の共感度(t
11〜t
1N,〜,t
L1〜t
LN)を対応付けた共感度行列T
lnを記憶する共感度行列記憶部と、
コンテンツc
l毎に、所定の各コンテンツ特徴要素(v
1〜v
J)の特徴量(f
11〜f
1J,〜,f
L1〜f
LJ)を対応付けたコンテンツ特徴量行列F
ljを記憶するコンテンツ特徴量行列記憶部と、
コンテンツc
l毎に、ユーザの共感度行列T
lnを入力し、項目反応理論IRT(Item Response Theory)に基づく識別度α
l及び難易度β
lを算出する第11のステップと、
機械学習エンジンを用いて、コンテンツc
l毎に、コンテンツ特徴量行列F
ljと識別度α
l及び難易度β
lとを対応付けた教師データとして学習する第12のステップと
を実行し、
運用機能として、
推定対象コンテンツc
Eについて、所定の各コンテンツ特徴要素(v
1〜v
J)の特徴量(f
E1〜f
EJ)を対応付けたコンテンツ特徴量行列F
Eを算出する第21のステップと、
機械学習エンジンが、推定対象コンテンツc
Eの特徴量行列F
Eを入力し、識別度α
E及び難易度β
Eを、共感影響力Mとして出力する第22のステップと
を実行することを特徴とする。
【発明の効果】
【0014】
本発明のプログラム、装置及び方法によれば、ユーザに対するコンテンツの共感影響力を推定することができる。
【図面の簡単な説明】
【0015】
【
図2】本発明における推定装置の機能構成図である。
【
図4】トピックグループをコンテンツ特徴要素としたコンテンツ特徴量行列を表す説明図である。
【
図5】コンテンツに対してユーザが持つ認知度及び情動度を表す説明図である。
【
図6】共感度として認知度及び情動度を適用した説明図である。
【
図7】共感度行列として認知度及び情動度を適用した説明図である。
【
図8】コンテンツ毎の項目反応カテゴリ特性曲線を表す説明図である。
【発明を実施するための形態】
【0016】
以下、本発明の実施の形態について、図面を用いて詳細に説明する。
【0017】
図1は、本発明におけるシステム構成図である。
【0018】
インターネットに接続されるWebサーバ2は、様々なコンテンツを公開する。Webサーバ2は、例えば、ニュースサイトや、ブログ(Web log)サイト、ミニブログサイト(例えばtwitter(登録商標)、SNS(Social Networking Service)サイト(例えばfacebook(登録商標)やLINE(登録商標))、掲示板サイトのようなものであってもよい。コンテンツは、不特定多数の第三者からWebサーバに投稿されたものであってもよい。
端末3は、アクセスネットワーク及びインターネットを介して、Webサーバ2へアクセスし、それらコンテンツをユーザに閲覧させる。
本発明における推定装置1は、ユーザに対するコンテンツの共感影響力を推定する。即ち、心理学的な共感性の高いコンテンツを発見することができる。
【0019】
図2は、本発明における推定装置の機能構成図である。
【0020】
本発明における推定装置1は、ユーザに対する推定対象コンテンツc
Eの共感影響力Mを推定する。
図2によれば、推定装置1は、<学習機能>及び<運用機能>に大別され、両機能に共通して、機械学習エンジン12を有する。
推定装置1は、学習機能として、コンテンツ蓄積部101と、共感度行列記憶部102と、コンテンツ特徴量行列記憶部103と、項目反応理論算出部11とを有する。
また、運用機能として、コンテンツ特徴量行列算出部13を有する。
これら機能構成部は、装置に搭載されたコンピュータを機能させるプログラムを実行することによって実現される。また、これら機能構成部の処理の流れは、装置の推定方法として理解できる。
【0021】
<学習機能>
学習機能は、教師データとしてのコンテンツc
l(c
1〜c
L)毎に、複数のユーザs
n(s
1〜s
N)の項目反応理論結果(識別度a
n及び難易度b
n)と、コンテンツ特徴量とに基づいて、機械学習エンジン12内に学習モデルを構築する。
【0022】
[コンテンツ蓄積部101]
コンテンツ蓄積部101は、教師データとして、複数のコンテンツ(c
1〜c
L)を蓄積したものである。コンテンツとしては、例えばテキスト(記事やブログなど)、画像、映像など、ユーザに閲覧される形式のものであればよい。
【0023】
[共感度行列記憶部102]
共感度行列記憶部102は、コンテンツc
l毎に、各ユーザ(s
1〜s
N)の共感度(t
11〜t
1N,〜,t
L1〜t
LN)を対応付けた共感度行列T
lnを記憶する。
【0024】
図3は、共感度行列を表す説明図である。
【0025】
図3によれば、教師データとしてのコンテンツc
l毎に、例えばアンケートによって主観評価としての共感度の回答を得ている。例えば、被験者(s
1〜s
N)それぞれに、各コンテンツ(c
1〜c
L)を明示し、その共感度について例えば3段階(w=3)の回答を得る。これによって作成された共感度行列T
ln(t
11〜t
1N,〜,t
L1〜t
LN)が記憶されている。
【0026】
[コンテンツ特徴量行列記憶部103]
コンテンツ特徴量行列記憶部103は、コンテンツc
l毎に、所定の各コンテンツ特徴要素(v
1〜v
J)の特徴量(f
11〜f
1J,〜,f
L1〜f
LJ)を対応付けたコンテンツ特徴量行列F
lj(L行J列)を記憶する。
【0027】
コンテンツがテキストである場合、コンテンツ特徴要素は、一般的に、「名詞・形容詞・動詞」のような要約に役立つ単語であってもよい。これによって、テキストの論旨や趣旨を反映しようとすることができる。勿論、特徴要素に更に、助動詞、形容詞、感嘆詞などを含めたものであってもよい。
【0028】
また、共感性を考慮した場合、コンテンツ特徴量は、登場人物や著作者の意図を表す表現である「様相(modality)・時制(aspect)・肯定/否定極性(polarity)」のような付加情報を、コンテンツ特徴量することが好ましい。
具体的には、コンテンツ特徴量を、動詞(原形X)と、その動詞に後続する助動詞や終助詞等から抽出した様相等の付加情報を動詞に付加したX'とにする。
例えば「誰も動けなかった」から、「動く」と「動く+可能+過去+否定」といった2つの単語(素性)が出現する。これは、ベクトル形式でありながら、汎用性の高い「動く」の語が特徴量に反映される一方で、情報が付加された動詞によって話題内容をより詳細に表現することができる。
【0029】
更に、コンテンツ特徴要素は、複数のコンテンツc
lのテキストを、述語項構造解析に基づいて、述語項構造の分布からLDA(Latent Dirichlet Allocation)によって分類した複数個のトピックグループであることも好ましい。
特に、述語項構造に、助動詞や形容詞、感嘆詞を含ませることによって、テキストから情緒的な成分を取り出すことができ、共感度の推定精度が改善する。
【0030】
LDAは、単語文章行列を次元圧縮する技術(LSI(latent Semantic Indexin))に対して、単語の特徴ベクトルに揺らぎに基づく確率的な枠組みを導入したものである。その圧縮した次元の集合をトピックという。
また、「述語項構造」とは、文章中の述語に対して「項」となる名詞句等を当てたものである。述語項構造を用いることによって、文章の意味の骨格を把握することができる。述語項構造解析として、例えばフリーソフトであるSyncha等の述語項構造解析器を用いることができる。述語項構造は、「述語」に対する「目的語」とその格とから構成される。
【0031】
特徴量は、各コンテンツのテキストについて、分類された各トピックグループに属するトピック比率(確からしさ)である。
各コンテンツは、LDAによっていずれか1つのトピックグループに分類される。
【0032】
図4は、トピックグループをコンテンツ特徴要素としたコンテンツ特徴量行列を表す説明図である。
【0033】
図4によれば、例えば「携帯を探す」の述語項構造は、述語「探す」に対して目的語「携帯」及び格「ヲ」からなる。また、例えば「サービスに申し込む」の述語項構造は、述語「申し込む」に対して目的語「サービス」及び格「ニ」からなる。
(S41)教師データとなるコンテンツのテキストから、述語項構造毎の出現頻度(出現回数)をLDA処理へ入力する。そして、テキスト毎に、各述語項構造の出現頻度を計数する。
(S42)次に、本件でのLDA処理では、トピック毎の述語項構造分布や、テキスト毎のトピック比率を取得する。このトピック比率によって、テキストが属するトピックグループに分類する。そして、トピックグループ毎に、全てのテキストに含まれる各述語項構造の出現頻度を計数する。
(S43)次に、テキスト毎に、各トピックグループに属する述語項構造を計数する。そして、テキストを計数値の高いトピックグループに分類する。
【0034】
[項目反応理論算出部11]
項目反応理論算出部11は、コンテンツc
l毎に、ユーザの共感度行列T
lnを入力し、項目反応理論IRT(Item Response Theory)に基づく識別度α
l及び難易度β
lを算出する。
【0035】
項目反応理論とは、評価項目群へのユーザの応答に基づいて、識別度α・難易度β(及びユーザ能力θ)を測定するための試験理論をいう(例えば非特許文献7参照)。これは、評価項目に対するユーザの離散的な回答から、確率論的に、識別度・難易度(及びユーザ能力)を算出する。ユーザに対する試験項目のストックを保守し、複数の試験の難易度を同等とみなすコンピュータ適応型テスト(Computerized Adaptive Testing)に適する。
識別度a
l :コンテンツlがユーザの能力を識別する力を表す実数値
難易度b
l :コンテンツlの難しさを表す実数値
(ユーザ能力θ
l:コンテンツlに対するユーザnの能力の大きさを表す実数値)
基本的に、ユーザ能力と識別度及び難易度との差を、ロジスティック曲線に当てはめて、回答の確率を求める。例えばコンテンツc
lがユーザs
nにとって共感度が高い場合、その確率は限りなく1に近づき、逆に共感度が低い場合、その確率は限りなく0に近づく。
2母数ロジスティックモデルの場合、以下のように確率が算出される。
p(θ)=1/(1+e
−Da(θ−b))
【0036】
[学習機能の機械学習エンジン12]
学習機能の機械学習エンジン12は、コンテンツc
l毎に、コンテンツ特徴量行列F
ljと識別度α
l及び難易度β
lとを対応付けた教師データとして学習する。
機械学習エンジン12は、線形回帰、サポートベクターマシン(Support Vector Machine)、又は、深層学習の回帰学習に基づくものであってもよい。
【0037】
<運用機能>
運用機能は、未知の推定対象コンテンツc
Eを入力し、共感影響力Mを出力する。
【0038】
[コンテンツ特徴量行列算出部13]
コンテンツ特徴量行列算出部13は、推定対象コンテンツc
Eについて、所定の各コンテンツ特徴要素(v
1〜v
J)の特徴量(f
E1〜f
EJ)を対応付けたコンテンツ特徴量行列F
Eを算出する。
ここで、コンテンツ特徴量行列算出部13は、前述したコンテンツ特徴量行列記憶部103と全く同じ方法で、コンテンツ特徴量行列F
Eを算出する。
【0039】
[運用機能の機械学習エンジン12]
運用機能の機械学習エンジン12は、推定対象コンテンツ(未知)c
Eの特徴量行列F
Eを入力し、識別度α
E及び難易度β
Eを、共感影響力Mとして出力する。
【0040】
図5は、コンテンツに対してユーザが持つ認知度及び情動度を表す説明図である。
【0041】
心理学の知見によれば、共感度は、「認知度」と「情動度」とによって表される。
「共感度」:他者の感情を理解し、他者と同じ感情を持つ人の性質
「認知度」:他者の感情(心理状態)を理解する度合い
「情動度」:他者と同じ感情(代理的な反応の強さ)を持つ度合い
ここでの「他者」とは、コンテンツの登場人物又は著作者を意味することとなる。
【0042】
図5によれば、多数のユーザ(被験者)に同一の記事を閲覧してもらい、各ユーザが「興味を引く話題か?」「心に響く話題か?」を質問して得られた、主観評価としての回答結果である。
興味を引く話題か?:引かない=認知度が低い
:引く =認知度が高い
心に響く話題か? :響かない=情動度が低い
:響く =情動度が高い
図5の表によれば、同一の記事に対して、「興味を引く」と感じる一方で「心に響かない」と感じるユーザがおり、また、「興味を引かない」と感じる一方で「心に響く」と感じるユーザもいる。
【0043】
図6は、共感度として認知度及び情動度を適用した説明図である。
図7は、共感度行列として認知度及び情動度を適用した説明図である。
【0044】
図6によれば、共感度行列記憶部102は、
図2と比較して、共感度行列Tとして、認知度T
1と情動度T
2とが別々に記憶されている。
図7によれば、被験者群 (s
1〜s
N)のN人にそれぞれに、各コンテンツ(c
1〜c
L)を明示し、その認知度及び情動度について例えば3段階(w=3)の回答を得る。これによって、評価項目数=2の共感度行列T
1ln(t
111〜t
11N,〜,t
1L1〜t
1LN)及びT
2ln(t
211〜t
21N,〜,t
2L1〜t
2LN)が、項目反応理論算出部11へ入力される。
【0045】
これに対し、項目反応理論算出部11は、2母数ロジスティックモデルとして、以下のように、識別度α及び情動度βを算出する。
認知度の識別度:α
11〜α
1L
認知度の難易度:β
11〜β
1L
情動度の識別度:α
21〜α
2L
情動度の難易度:β
21〜β
2L
尚、一部のユーザが、ランダムに回答することができる場合、項目反応理論算出部11は、3母数ロジスティックモデルとして算出するものであってもよい。
【0046】
機械学習エンジン12は、コンテンツc
l毎に、特徴量行列F
lと、認知度に対する識別度α
11及び難易度β
11と、情動度に対する識別度α
12及び難易度β
12とを対応付けた教師データによって学習する。そして、以下のように学習モデルを構築する。
認知度の識別度α
11に対する学習モデル:Ma
1
認知度の難易度β
11に対する学習モデル:Mb
1
情動度の識別度α
12に対する学習モデル:Ma
2
情動度の難易度β
12に対する学習モデル:Mb
2
【0047】
そして、機械学習エンジン12は、推定対象コンテンツc
Eの特徴量行列F
Eを入力すると、識別度に対する認知度α
1E及び難易度β
1Eと、情動度に対する認知度α
2E及び難易度β
2Eとを、影響力Mとして出力する。
【0048】
図8は、コンテンツ毎の項目反応カテゴリ特性曲線を表す説明図である。
【0049】
項目反応カテゴリ特性曲線(IRCCC(Item Response Category Characteristic Curve))は、以下のように作成される。
横軸:能力値 (左側:共感度が低い、右側:共感度が高い)
(左側:識別度が低い、右側:識別度が高い)
(左側:情動度が低い、右側:情動度が高い)
縦軸:確率p
曲線:各選択肢(「共感しない」「わからない」「共感する」)
(「興味を引かない」「わからない」「興味を引く」)
(「心に響かない」「わからない」「心に響かない」)
【0050】
図8の項目反応カテゴリ特性曲線は、100件のコンテンツ(c
1〜c
100)について、300名のユーザ(s
1〜s
300)に対する認知度及び情動度の共感度行列T
1及びT
2と、8次元のコンテンツ特徴量行列Fとから得られたものである。
難易度bは、ユーザ能力θと同じスケール上にあり、識別度aは、項目反応カテゴリ特性曲線の傾きを決定する。曲線の傾きが大きいほど、難易度bとユーザ能力θとの差が大きいほど、回答がくっきり分かれることを表す。
【0051】
図8によれば、4件のコンテンツ(ID36,ID72,ID82,ID94)について、認知度及び情動度の共感度行列それぞれの項目反応カテゴリ特性曲線が表されている。ID82及びID94は、ID72と比較して、認知度が高いことがわかる。また、ID82は、ID94及びID72と比較して、情動度が高いことがわかる。
これによって、ID82は、認知度が高く且つ情動度も高いことがわかる。また、ID94及びID72は、情動度が低いことがわかる。
【0052】
以上、詳細に説明したように、本発明のプログラム、推定装置及び方法によれば、ユーザに対するコンテンツの共感影響力を推定することができる。
【0053】
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
【符号の説明】
【0054】
1 推定装置
101 コンテンツ蓄積部
102 共感度行列記憶部
103 コンテンツ特徴量行列記憶部
11 項目反応理論算出部
12 機械学習エンジン
13 コンテンツ特徴量行列算出部
2 Webサーバ
3 端末