(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024168178
(43)【公開日】2024-12-05
(54)【発明の名称】信頼性評価装置、プログラム
(51)【国際特許分類】
G06Q 50/10 20120101AFI20241128BHJP
【FI】
G06Q50/10
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2023084627
(22)【出願日】2023-05-23
(71)【出願人】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】宮崎 勝
【テーマコード(参考)】
5L049
5L050
【Fターム(参考)】
5L049CC11
5L050CC11
(57)【要約】
【課題】情報の信頼性を評価する技術を提供すること。
【解決手段】本開示は、情報を表示する端末装置30とネットワークを介して通信できる信頼性評価装置10であって、情報が被引用情報を引用する関係を1回以上繰り返す第1の情報系列のうち、前記端末装置が表示した第1の情報を取得する投稿情報取得部と、情報が被引用情報を引用する関係を1回以上繰り返す第2の情報系列から、前記第1の情報と類似する第2の情報を特定する類似情報特定部と、前記第1の情報を起点に前記第1の情報系列の中で引用される第1の被引用情報が、前記第2の情報を起点に前記第2の情報系列の中で引用される第2の被引用情報と重複するか否かに基づいて、前記第1の情報の信頼性を評価する信頼性評価部と、を有する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
情報を表示する端末装置とネットワークを介して通信できる信頼性評価装置であって、
情報が被引用情報を引用する関係を1回以上繰り返す第1の情報系列のうち、前記端末装置が表示した第1の情報を取得する投稿情報取得部と、
情報が被引用情報を引用する関係を1回以上繰り返す第2の情報系列から、前記第1の情報と類似する第2の情報を特定する類似情報特定部と、
前記第1の情報を起点に前記第1の情報系列の中で引用される第1の被引用情報が、前記第2の情報を起点に前記第2の情報系列の中で引用される第2の被引用情報と重複するか否かに基づいて、前記第1の情報の信頼性を評価する信頼性評価部と、
を有する信頼性評価装置。
【請求項2】
前記第2の情報系列及び前記第2の情報が複数あり、
前記信頼性評価部は、前記第1の情報系列及び複数の前記第2の情報系列において、被引用情報が重複しない情報系列の数に基づいて、前記第1の情報の信頼性を評価する請求項1に記載の信頼性評価装置。
【請求項3】
前記情報は、該情報を投稿した投稿者の識別情報を有し、
前記信頼性評価部は、前記第1の情報系列及び複数の前記第2の情報系列において、被引用情報を引用しない情報源に対応づけられた前記投稿者の識別情報が同じ情報系列がある場合、前記投稿者の識別情報が同じ情報系列の情報源の数だけ、被引用情報が重複しない情報系列の数を減じ、
被引用情報を引用しない情報源がWebサイトであり、同じWebサイトを情報源とする情報系列がある場合、前記情報源が同じWebサイトである情報系列の情報源の数だけ、被引用情報が重複しない情報系列の数を減じる請求項2に記載の信頼性評価装置。
【請求項4】
前記情報は、該情報が投稿された投稿時刻を有し、
前記類似情報特定部は、前記投稿情報取得部が取得した前記第1の情報と類似する第2の情報であっても、前記第1の情報の投稿時刻に対し閾値以内に投稿されていない前記第2の情報を、情報系列の起点から除外する請求項1~3のいずれか1項に記載の信頼性評価装置。
【請求項5】
前記類似情報特定部は、前記投稿情報取得部が取得した前記第1の情報と類似する第2の情報であっても、前記第1の情報が直接、引用する前記第2の情報を除外する請求項1に記載の信頼性評価装置。
【請求項6】
前記信頼性評価部が評価した前記第1の情報の信頼性に関する情報を、前記端末装置が表示する前記情報に対応づけて表示する旨と共に前記端末装置に送信する請求項1に記載の信頼性評価装置。
【請求項7】
前記第1の情報の信頼性に関する情報を、前記端末装置が表示する前記情報に対応づけて表示する旨と共に前記端末装置に送信し、一定時間が経過した後、
再度、前記類似情報特定部は、前記第2の情報系列から、前記第1の情報と類似する第2の情報を特定し、
前記信頼性評価部は、前記第1の情報を起点に前記第1の情報系列の中で引用される第1の被引用情報が、前記第2の情報を起点に前記第2の情報系列の中で引用される第2の被引用情報と重複するか否かに基づいて、前記第1の情報の信頼性を評価し、
前記第1の情報の信頼性に関する情報を、再度、前記端末装置が表示する前記情報に対応づけて表示する旨と共に前記端末装置に送信する請求項6に記載の信頼性評価装置。
【請求項8】
前記信頼性評価部が、前記第1の情報系列及び複数の前記第2の情報系列において、被引用情報が重複しない情報系列の数が1つのみと判断した場合、
前記第1の情報系列及び複数の前記第2の情報系列に共通する情報源を前記端末装置に送信する請求項2に記載の信頼性評価装置。
【請求項9】
一方の投稿者が他方の投稿者の投稿情報を見守る設定が可能であり、
前記第2の情報系列及び前記第2の情報が複数あり、
前記信頼性評価部は、前記第1の情報系列及び複数の前記第2の情報系列において、被引用情報が重複しない情報系列の情報源を特定し、一方の情報源を投稿した投稿者が他方の情報源を投稿した投稿者の投稿情報を見守る関係に関する経路の距離に基づいて、前記第1の情報の信頼性を評価する請求項1に記載の信頼性評価装置。
【請求項10】
情報を表示する端末装置とネットワークを介して通信できる信頼性評価装置を、
情報が被引用情報を引用する関係を1回以上繰り返す第1の情報系列のうち、前記端末装置が表示した第1の情報を取得する投稿情報取得部と、
情報が被引用情報を引用する関係を1回以上繰り返す第2の情報系列から、前記第1の情報と類似する第2の情報を特定する類似情報特定部と、
前記第1の情報を起点に前記第1の情報系列の中で引用される第1の被引用情報が、前記第2の情報を起点に前記第2の情報系列の中で引用される第2の被引用情報と重複するか否かに基づいて、前記第1の情報の信頼性を評価する信頼性評価部、
として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、信頼性評価装置、及びプログラムに関する。
【背景技術】
【0002】
事件、事故など情報がインターネット(以下、ネット情報という)上で配信される場合がある。テレビなどのマスメディアよりも先に、SNS(Social Networking Service)からネット情報を得る、というユーザーも増えてきた。例えば、火災など特定地域で起こった出来事について、マスメディアでの報道より前に、その地域に住んでいる投稿者からの投稿でSNSのユーザーが知る、といった状況は多い。ネット情報が「信頼性が高い」と認識されている報道機関からの情報であればよいが、見ず知らずの匿名の投稿者からのネット情報を不特定のユーザーが閲覧した場合、ネット情報の真偽を判断することは多くの場合容易ではない。ネット情報を閲覧したユーザーが安易にそのネット情報を真実と判断し、ネット情報を再投稿するなどの行為は、フェイクニュースなどのまん延につながる恐れがある。
【0003】
報道機関のジャーナリストなどは、情報を信用できるかどうかを判断するルールを自身に課していることもある。例えば、「匿名の情報源から得られた情報について、別の情報源で裏付けが取れなければ記事にしない」といった「二つの情報源ルール」などがある(非特許文献1)。ただし、このようなルールが有効と考えていても、ユーザーが実際にルールを適用する際には、自身で複数の情報源を突き止め、情報源が異なっていることを確認しなければならず、手間がかかる。
【0004】
複数の情報源からの情報に基づいて実際の状況を判断する技術が提案されている(例えば、特許文献1参照)。また、特定の対象に対してネットワーク上で公開されている風評情報を抽出する技術が提案されている(例えば、特許文献2参照)。また、SNS上などでは、投稿された情報に関して、投稿者以外のユーザーからのアクション(例:再投稿や「いいね」付与など)が数値などで表示されているものがある(例えば、非特許文献2参照)。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2021-140644号公報
【特許文献2】特開2008-165599号公報
【非特許文献】
【0006】
【非特許文献1】ビル・コヴァッチ、トム・ローゼンスティール,奥村信幸 訳,『インテリジェンス・ジャーナリズム』,ミネルヴァ書房 2015年
【非特許文献2】https://twitter.com/
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、従来の技術は情報の信頼性を必ずしも適切に評価する方法とは言えない。例えば特許文献1に記載の技術は、複数の情報源からの情報に矛盾するような内容が含まれている場合にその差を活用して災害の状況を判断するものであり、ネット情報の信頼性を評価する技術ではない。特許文献2に記載の技術は、インターネット上から抽出したデータの素性が風評情報かどうかを機械学習で判断するものであり、素性が新しい場合は信頼性を評価することが困難である。非特許文献2に記載の技術は、ネット情報の注目度判断することは可能だが、その値が信頼性を示しているとは言えない。
【0008】
本開示は、上記課題に鑑み、情報の信頼性を評価する技術を提供する。
【課題を解決するための手段】
【0009】
上記課題に鑑み、本開示は、情報を表示する端末装置とネットワークを介して通信できる信頼性評価装置であって、情報が被引用情報を引用する関係を1回以上繰り返す第1の情報系列のうち、前記端末装置が表示した第1の情報を取得する投稿情報取得部と、情報が被引用情報を引用する関係を1回以上繰り返す第2の情報系列から、前記第1の情報と類似する第2の情報を特定する類似情報特定部と、前記第1の情報を起点に前記第1の情報系列の中で引用される第1の被引用情報が、前記第2の情報を起点に前記第2の情報系列の中で引用される第2の被引用情報と重複するか否かに基づいて、前記第1の情報の信頼性を評価する信頼性評価部と、を有する。
【発明の効果】
【0010】
本開示は、情報の信頼性を評価する技術を提供できる。
【図面の簡単な説明】
【0011】
【
図1】情報を投稿するアプリケーションの画面例を示す図である。
【
図2】信頼性評価装置がネット情報の信頼性を評価する処理の該略を説明する図である。
【
図3】信頼性評価システムのシステム構成図の一例である。
【
図4】信頼性評価装置、SNSサーバ及び端末装置の一例のハードウェア構成を示す図である。
【
図5】信頼性評価システム、SNSサーバ及び端末装置の機能構成の一例を示す図である。
【
図6】SNSサーバに投稿される投稿情報を模式的に示す図である。
【
図7】信頼性が高いと評価される場合の評価例を説明する図である。
【
図8】信頼性が低いと評価される場合の評価例を説明する図である。
【
図9】系列の生成と信頼性の評価の詳細な処理を説明する図である。
【
図10】信頼性が低いと評価される系列の探索例を示す図である。
【
図11】信頼性評価装置が投稿情報の信頼性を評価する処理の流れを説明するシーケンス図の一例である。
【
図12】
図11のステップS7の処理を詳細に説明するフローチャート図の一例である。
【
図13】ユーザーが端末装置で表示した投稿情報表示画面等の一例を示す図である。
【
図14】投稿情報の信頼性が低いと評価された場合に表示されるメッセージの一例を示す図である。
【
図15】端末装置が表示した投稿情報と類似する投稿情報の数を絞り、信頼性評価装置が投稿情報の信頼性を評価する処理の流れを説明するフローチャート図の一例である。
【
図16】SNS空間上での距離について模式的に説明する図である。
【
図17】ユーザーから別のユーザーまでのエッジ数を信頼度とする根拠を説明する図である。
【
図18】独立した系列の情報源を投稿した投稿者間の距離に基づいて、信頼性評価装置が投稿情報の信頼性を評価する処理の流れを説明する一例のフローチャート図である。
【発明を実施するための形態】
【0012】
以下、本発明を実施するための形態の一例として、信頼性評価システムと信頼性評価システムが行う信頼性評価方法について説明する。
【0013】
<信頼性評価の概略>
まず、
図1を参照して、ネット情報の拡散例として、情報を投稿するアプリケーションの一例を説明する。このようなアプリケーションは例えばSNSで使用されており、ユーザーは簡単な操作で文章や画像を投稿することができる。
【0014】
図1は、情報を投稿するアプリケーションの画面例を示す。ユーザーは、「○○に来ています」という投稿文101を入力した。ユーザーが投稿ボタン103を押下すると、その投稿文101がSNSサーバに送信される。
【0015】
図1の画面にはタイムライン104が表示されている。タイムライン104には自分が投稿した投稿文や、自分がフォローしているユーザーが投稿した投稿文が表示される。タイムライン104には、ユーザーがフォローしている投稿者Aが、投稿者Bが投稿した投稿文102を再投稿している。したがって、ユーザーは投稿者Aをフォローすることにより、投稿者Bの投稿文102を閲覧できる。このように、アプリケーションは情報の共有や拡散性に優れている。
【0016】
なお、再投稿には以下の2つの態様がある。本実施形態では、両者を単に「再投稿」と称することにする。
・他人の投稿内容をそのまま再投稿する再投稿
・他人の投稿内容にコメント付けて投稿する引用再投稿
このような再投稿機能は情報の共有や拡散に有効な反面、フェイクニュース(オンライン上で広く共有されるように作成された偽のニュース記事)が混在することも知られており、情報の真偽を判断することは多くの場合容易ではない。そこで、本実施形態では、非特許文献1にて説明されている「二つの情報源ルール」に有効性があると考え、以下のようにネット情報の信頼性を評価する。
【0017】
図2は、本実施形態の信頼性評価装置10がネット情報の信頼性を評価する処理の該略を説明する図である。
【0018】
(1) ユーザー9が端末装置30で投稿情報PA(第1の情報の一例)を表示した。信頼性評価装置10は、一例として、投稿情報PAが表示されたタイミングに、投稿情報PAの信頼性評価処理を行う。
【0019】
(2) 信頼性評価装置10は、投稿情報PAと投稿内容が類似している他の投稿情報PB(第2の情報の一例)を文書間類似度などの指標を用いて検索し、その投稿情報PBを「類似投稿」と判断する。
【0020】
(3) 信頼性評価装置10は、投稿情報PAの中に含まれる引用情報(引用元の投稿文IDや引用URL等)を参照して、投稿情報PAにより引用される被引用投稿情報Pa1(第1の被引用情報の一例)を特定する。信頼性評価装置10は、同様に、被引用投稿情報Pa1の中に含まれる引用情報を参照して、被引用投稿情報Pa1により引用される被引用投稿情報Pa2を特定する。信頼性評価装置10は、この被引用投稿情報をたどる処理を最初の投稿情報(以下、情報源RAという)まで繰り返し、投稿情報の系列(第1の情報系列の一例)を生成する。情報源RAは投稿情報を引用していない情報(投稿情報でもWebサイト等でもよい)。信頼性評価部16は、投稿情報PBについても同様に被引用投稿情報Pb1、Pb2(第2の被引用情報の一例)をたどる処理を情報源RBまで繰り返し、投稿情報の系列(第2の情報系列の一例)を生成する。情報源RBまでたどっても、投稿情報PAが引用する投稿情報の系列と、投稿情報PBが引用する投稿情報の系列の被引用投稿情報が重複しない場合、信頼性評価装置10は、投稿情報PA、PBの情報源RA,RBは異なっており、投稿情報PAの信頼性が高いと評価する。
【0021】
(4) 投稿情報PA又はPBの被引用投稿情報をたどる過程で被引用投稿情報が重複した場合(図では被引用投稿情報Pb2の引用元が情報源RAと重複している)、信頼性評価装置10は、投稿情報PA、PBの情報源RAは同じであり、投稿情報PAの信頼性が低いと評価する。
【0022】
このように、信頼性評価装置10は、ユーザー9が投稿情報を表示した際に、信頼性をユーザー9に提示することができる。ユーザー9はその信頼性を参考に、その投稿情報がどれほど信頼できるかを評価し、行動を起こす際などの参考とすることができる。例えば、信頼性の低い投稿情報を再投稿するといった行動を回避することが可能となる。
【0023】
<用語について>
情報が被引用情報を引用するとは、情報が被引用情報を引用している旨が含まれていることをいう。単に、情報が被引用情報の一部又は全体をそのまま含む、又は、類似していることまではいわない。また、引用とは、ある情報のなかで、他の情報を用いることをいう。
【0024】
信頼性とは、期待された役割を果たすことができる能力である。情報の信頼性の場合は、情報が真実かどうかを判断する尺度でよい。また信頼性の大きさを何らかの指標で数値化したものを信頼度という。
【0025】
<システム構成例>
図3は、信頼性評価システム100のシステム構成図の一例である。信頼性評価システム100は、信頼性評価装置10と、端末装置30と、を有する。ただし、端末装置30は汎用的なコンピュータでよく、信頼性評価システム100に含まれない場合がある。また、信頼性評価システム100に含まれる場合とそうでない場合があるが、
図3にはSNSサーバ50が示されている。
【0026】
信頼性評価装置10、端末装置30及びSNSサーバ50は、インターネット等の広域的なネットワークN1を介して通信可能に接続されている。信頼性評価装置10とSNSサーバ50は、データセンターなどに設置されていることが想定される。信頼性評価装置10とSNSサーバ50は、クラウドコンピューティングに対応していてもよい。クラウドコンピューティングとは、特定ハードウェア資源が意識されずにネットワーク上のリソースが利用される利用形態をいう。したがって、信頼性評価装置10とSNSサーバ50は、1つの筐体に収納されていたり一まとまりの装置として備えられていたりする必要はない。
【0027】
SNSサーバ50は、投稿情報を処理するSNSのサーバ装置である。SNSサーバ50は、ユーザーのログインを受け付け、このユーザーがフォローしている投稿者の投稿情報をタイムラインとしてユーザーに提供する。また、SNSサーバ50は、このユーザーをフォローしているフォロワーのタイムラインに、ユーザーが投稿した投稿情報を提供する。この繰り返しにより投稿情報が拡散される。
【0028】
信頼性評価装置10は、ネットワークN1を介してSNSサーバ50と通信する。信頼性評価装置10は、ユーザーが投稿情報を閲覧する際に該投稿情報の信頼性を評価し、端末装置30に送信する。信頼性評価装置10は、このようにSNSサーバ50に投稿される投稿情報を使用して処理するので、SNSサーバ50と一体でもよい。あるいは、SNSサーバ50が信頼性評価装置10の機能を有していてもよい。
【0029】
信頼性評価装置10は、それぞれ複数の情報処理装置にその機能が分散されていてもよいし、複数の情報処理装置がそれぞれ信頼性評価装置10の全ての機能を有し、負荷分散などにより処理する情報処理装置が切り替えられてもよい。
【0030】
信頼性評価装置10は、端末装置30からの要求に応じて、処理結果を端末装置30に返すWebサーバであってよい。サーバとは、クライアントからの要求に対して情報や処理結果を提供する機能を果たすコンピュータやソフトウェアである。
【0031】
ユーザーは信頼性評価装置10を使用する旨の契約を信頼性評価装置10又はSNSサーバ50と締結してもよい。すなわち、ユーザーは信頼性評価装置10の使用料を支払う。ユーザーとしては投稿情報の信頼性が分かることはメリットがあり、信頼性評価装置10やSNSサーバ50も信頼性を評価するリソースに使用料を充当させることができる。したがって、ユーザーは信頼性評価装置10にもログインする場合がある。
【0032】
端末装置30は、投稿情報を閲覧したり投稿したりするユーザーが使用する汎用的な情報処理装置である。端末装置30は、ネットワークN2に接続されている。ネットワークN2は、LAN、Wi-Fi(登録商標)、広域イーサネット(登録商標)、4G、5G、6G等の携帯電話網、などでよい。ここでユーザーとは、SNSサーバ50が提供するSNSを使用する者である。
【0033】
端末装置30ではWebブラウザやSNSサーバ50に専用のネイティブアプリが動作する。端末装置30がWebブラウザを実行する場合、端末装置30とSNSサーバ50はWebアプリを実行する。Webアプリとは、Webブラウザ上で動作するプログラミング言語(例えばJavaScript(登録商標))によるプログラムとWebサーバ(ここでは信頼性評価装置10)側のプログラムが協調することによって動作するアプリケーションである。
【0034】
これに対し、端末装置30にインストールされなければ実行されないアプリケーションをネイティブアプリという。本実施形態に関しても、端末装置30で実行されるアプリケーションはWebアプリでもネイティブアプリでもよい。この場合、画面構成はネイティブアプリが有しているが、表示するための情報はネイティブアプリがSNSサーバ50と信頼性評価装置10から取得する。したがって、処理の流れはWebアプリとネイティブアプリで大きな相違はない。
【0035】
端末装置30は、例えば、ユーザーが使用するデスクトップPC、ノート型PC、スマートフォン、PDA(Personal Digital Assistant)、タブレット端末等である。この他、端末装置30はWebブラウザやネイティブアプリが動作する装置であればよい。端末装置30は、電子黒板、カーナビ、テレビ受像機等でもよい。
【0036】
<ハードウェア構成例>
図4を参照して、本実施形態に係る信頼性評価システム100に含まれる信頼性評価装置10、SNSサーバ50及び端末装置30のハードウェア構成について説明する。
【0037】
<<信頼性評価装置、SNSサーバ及び端末装置>>
図4は、本実施形態に係る信頼性評価装置10、SNSサーバ50及び端末装置30の一例のハードウェア構成を示す図である。
図4に示されているように、信頼性評価装置10、SNSサーバ50及び端末装置30はコンピュータ500によって構築されており、CPU501、ROM502、RAM503、HD(Hard Disk)504、HDD(Hard Disk Drive)コントローラ505、ディスプレイ506、外部機器接続I/F(Interface)508、ネットワークI/F509、バスライン510、キーボード511、ポインティングデバイス512、DVD-RW(Digital Versatile Disk Rewritable)ドライブ514、メディアI/F516を備えている。
【0038】
これらのうち、CPU501は、コンピュータ500全体の動作を制御する。ROM502は、IPL等のCPU501の駆動に用いられるプログラムを記憶する。RAM503は、CPU501のワークエリアとして使用される。HD504は、プログラム等の各種データを記憶する。HDDコントローラ505は、CPU501の制御にしたがってHD504に対する各種データの読み出し又は書き込みを制御する。ディスプレイ506は、カーソル、メニュー、ウィンドウ、文字、又は画像などの各種情報を表示する。外部機器接続I/F508は、各種の外部機器を接続するためのインターフェースである。この場合の外部機器は、例えば、USB(Universal Serial Bus)メモリやプリンタ等である。ネットワークI/F509は、ネットワークN2を利用してデータ通信をするためのインターフェースである。バスライン510は、
図4に示されているCPU501等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。
【0039】
また、キーボード511は、文字、数値、又は各種指示などの入力に使用される複数のキーを備えた入力手段の一種である。ポインティングデバイス512は、各種指示の選択や実行、処理対象の選択、カーソルの移動などを行う入力手段の一種である。DVD-RWドライブ514は、着脱可能な記録媒体の一例としてのDVD-RW513に対する各種データの読み出し又は書き込みを制御する。なお、DVD-RWドライブ514は、DVD-RWに限らず、DVD-R等であってもよい。メディアI/F516は、フラッシュメモリ等の記録メディア515に対するデータの読み出し又は書き込み(記憶)を制御する。
【0040】
<機能について>
次に、
図5を用いて、本実施形態に係る信頼性評価システム100等の機能構成について説明する。
図5は、本実施形態に係る信頼性評価システム100、SNSサーバ50及び端末装置30の機能構成の一例を示す図である。
【0041】
<<SNSサーバの機能構成>>
SNSサーバ50は、投稿情報処理部51、及び、API52を有している。これら各部は、
図4に示されている各構成要素のいずれかが、RAM503に展開されたプログラムに従ったCPU501からの命令によって動作することで実現される機能、又は機能する手段である。なお、SNSサーバ50は図示する以外に種々の機能を有しているが、本実施形態で使用される機能を主に説明する。
【0042】
投稿情報処理部51は、SNSの各投稿者が投稿する投稿情報に関する全体的な処理を行う。投稿情報処理部51は、あるユーザーがフォローしている投稿者の投稿情報をタイムラインとしてユーザーの端末装置30に提供し、このユーザーをフォローしているフォロワーのタイムラインに、ユーザーが投稿した投稿情報を提供する。
【0043】
API52(Application Programming Interface)は、SNSサーバ50が処理する投稿情報を外部のサーバ等に提供するインターネット上のインターフェースである。すなわち、信頼性評価装置10はこのAPI52に対し所定の記述を有するプログラムで投稿情報を要求することで、投稿情報を取得し、信頼性を評価する。その他、API52は投稿ID等で指定された投稿情報と類似する投稿情報、投稿ID等で指定された投稿情報の被引用投稿情報を返す機能などを有していてもよい。
【0044】
<<端末装置>>
端末装置30は、投稿情報を閲覧したり投稿したりするユーザーにより使用される。端末装置30は、通信部31と、表示制御部32と、操作受付部33とを有する。これら各機能部は、端末装置30にインストールされた1以上のプログラムに含まれる命令をCPU501が実行することで実現される機能又は手段である。なお、このプログラムはWebブラウザが実行するWebアプリでもよいし、専用のネイティブアプリでもよい。
【0045】
通信部31は、SNSサーバ50及び信頼性評価装置10との間で各種の情報を送受信する。本実施形態では、通信部31は、Webアプリや投稿情報をSNSサーバ50から受信し、ユーザーが入力した投稿文、画像、ユーザーの操作内容等をSNSサーバ50に送信する。また、通信部31は、端末装置30が表示した投稿情報の信頼性を信頼性評価装置10から受信する。
【0046】
表示制御部32は、各種の画面の画面情報を解釈してディスプレイ506に表示させる。操作受付部33は、ディスプレイ506に表示されたアプリケーションに対するユーザーの各種操作を受け付ける。
【0047】
<<信頼性評価装置の機能構成>>
信頼性評価装置10は、通信部11、投稿情報取得部12、類似情報特定部13、系列生成部14、情報源判断部15、及び、信頼性評価部16を有している。これら各部は、
図4に示されている各構成要素のいずれかが、RAM503に展開されたプログラムに従ったCPU501からの命令によって動作することで実現される機能、又は機能する手段である。
【0048】
通信部11は、SNSサーバ50及び端末装置30との間で各種の情報を送受信する。本実施形態では、通信部31は、複数の投稿情報をSNSサーバ50から受信し、ユーザーが表示した投稿情報の信頼性を端末装置30に送信する。
【0049】
投稿情報取得部12は、通信部11を介して、SNSサーバ50のAPI52を宛先に通信し、API52から投稿情報を取得する。取得する投稿情報やそのタイミングとしては、処理負荷やSNSサーバ50との契約内容等によって種々考えられる。取得する投稿情報やそのタイミングの一例として以下がある。
・投稿情報取得部12は、一定時間ごとに全ての投稿情報を取得する。
・ユーザーが投稿情報を表示した場合に、端末装置30又はSNSサーバ50からその通知を受け、投稿情報取得部12は、該投稿情報の信頼性を算出するための他の投稿情報を取得する。
【0050】
類似情報特定部13は、ユーザーが表示した投稿情報と類似する投稿情報を、SNSサーバ50から取得した複数の投稿情報から特定する。投稿情報の特定は、類似する文書を検索する処理に置き換えられる。すなわち、類似情報特定部13は、文書間の類似度を算出し、閾値以上の類似度の文書を特定する。文書の類似度を算出する際には、TF-IDF(Term Frequency - Inverse Document Frequency)、LSI(潜在的意味索引)、Word2Vec、Doc2Vec、Sent2Vecなどの手法を用いて文章をベクトル化し、そのコサイン類似度を計算する手法や、WMD(Word Mover's Distance)、LC-RWMD(WMD と比較して精度と引き換えに計算量を大幅に削減する手法)等の手法を用いることが考えられる。本実施形態では、適宜、投稿情報の類似度の算出に適した手法が使用される。
【0051】
なお、類似情報特定部13は、画像が類似するか否か判断できる。画像の比較には、ほぼ同じだが微小な差異がある画像同士の比較、又は、類似する被写体やシーンが写っているかどうかの比較がある。本実施形態では、火事などの出来事が生じた場合、同じ又は異なる投稿者が様々な角度から出来事に関連する被写体やシーンを撮影すると考えられるので、後者の比較が行われる。このような画像処理はシーン認識と言われる(全体として何の画像であるか)。本実施形態では、ディープラーニング等により構築された、画像からシーンを判断する学習モデルを類似情報特定部13が有している。
【0052】
系列生成部14は、類似情報特定部13により特定された投稿情報を起点に、引用情報に基づいて被引用投稿情報を情報源までたどることで(被引用投稿情報が重複した場合は情報源までたどれなくてもよい)、被引用投稿情報の系列を生成する。詳細は後述される。
【0053】
情報源判断部15は、系列が有する情報源を投稿した投稿者のアカウントを比較することで、各系列の情報源が同じ投稿者により投稿されたかどうか判断する。情報源が異なっていても、複数の情報源が同じ投稿者による投稿の場合は、ユーザーが表示させた投稿情報の信頼性が低下する。また、情報源判断部15は、情報源がWebサイトだった場合、各系列のWebサイトのURLを比較することで、情報源が同じWebサイトであるかどうか判断する。したがって、情報源がWebサイトであっても情報源が同じかどうか判断できる。
【0054】
信頼性評価部16は、例えば被引用投稿情報が重複しない系列の数に基づいて、ユーザーが表示した投稿情報の信頼性を評価する。信頼性評価部16は、例えば、被引用投稿情報が重複しない系列の数そのものを信頼度としてよい。あるいは、信頼性評価部16は、系列の数と閾値を比較して、信頼性をN(>2)段階で判断し、この段階を「信頼度」として算出してもよい。簡単には、「二つの情報源ルール」に有効性がある場合、信頼性評価部16は、独立した系列の数が2以上の場合、信頼性があると評価する。
【0055】
<データ構造>
次に、
図6を参照して、投稿情報が有するデータ構造について説明する。
図6は、SNSサーバ50に投稿される投稿情報を模式的に示す。投稿情報60a~60cは、それぞれ投稿文ID、投稿文、投稿時刻、引用元、引用URL、及び、投稿者IDの各項目を有している。投稿情報60aは投稿情報60bを引用し、投稿情報60bは投稿情報60cを引用している。よって、投稿情報60bは投稿情報60aの被引用投稿情報であり、投稿情報60cは投稿情報60bの被引用投稿情報である。
・投稿文IDは、投稿情報を一意に識別する識別情報である。IDとは複数の対象から、ある特定の対象を一意的に区別するために用いられる名称、符号、文字列、数値などの組み合わせをいう。
・投稿文は、投稿情報の投稿内容である。引用再投稿でない単なる再投稿の場合、投稿文がない場合もある。また、投稿文は画像の場合がある。なお、端末装置30の表示上は画像だがURLにより画像が引用される場合もある。
・投稿時刻は、投稿情報が投稿された日時である。
・引用元は、投稿情報が再投稿されたことを表し、かつ、被引用投稿情報を特定するための情報である。引用元は引用情報の一例である。
・引用URLは、投稿者がWebサイト等を引用して投稿した場合にこのWebサイトのURLである。引用URLは引用情報の一例である。再投稿の場合、引用元と引用URLはどちらか一方は空欄であると考えられる(仮に一方が空欄でない場合は被引用投稿情報を分岐してたどる)。引用元と引用URLの両方が空欄の場合、この投稿情報が情報源である。引用元は空欄だが引用URLがある場合、引用URLが示すWebサイトが情報源である。
【0056】
<信頼性の評価例>
次に、
図7~
図10に基づいて、投稿情報の信頼性の評価方法を詳細に説明する。まず、
図7は、信頼性が高いと評価される場合の評価例を説明する図である。
【0057】
(1) まず、ユーザー9がある投稿情報PAを表示した。
【0058】
(2) 類似情報特定部13は、投稿情報PAと投稿内容が類似した投稿情報PBを文書間類似度などの指標を用いて特定する。
【0059】
(3) 次に、系列生成部14は、投稿情報PAが有する引用情報を利用して、投稿情報PAの被引用投稿情報Pa1を特定する。
【0060】
(4) 系列生成部14は、被引用投稿情報Pa1が有する引用情報を利用して、被引用投稿情報Pa1の被引用投稿情報(図では情報源RA)を特定する。この被引用投稿情報(図では情報源RA)は他の投稿情報を引用していないので、系列生成部14は探索を終了する。よって、被引用投稿情報は情報源RAであった。情報源RAはあるニュースサイトの記事の情報とする。
【0061】
以上の処理により、ある投稿情報PAからその情報源RAまで、一連の投稿情報の系列「PA→Pa1→RA」を得ることができる。
【0062】
(5) 次に、系列生成部14は、投稿情報PBに関しても同様の処理を行い、系列「PB→Pb1→RB」を得る。
【0063】
図7の例では、情報源R
A、R
Bまで交わらない2つの系列が得えられたので、信頼性評価部16は、投稿情報P
Aが「2つの(独立した)情報源から得られた」と評価し、「信頼性が高い」と評価する。
【0064】
図8は、信頼性が低いと評価される場合の評価例を説明する図である。
図7と同様の処理により、系列「P
A→P
a1→R
A」と系列「P
B→P
b1→R
A」が得られる。つまり、2つの系列の中に同じ被引用投稿情報(情報源R
A)が存在する。この場合、信頼性評価部16は、投稿情報P
AとP
Bは同じ1つの情報源R
Aからのものと評価し、「信頼性が高い」という評価を行わない(ただし、3つめの系列がありそれが独立していれば信頼性が高いと評価される)。このように、信頼性の評価は、異なる系列の中に同じ被引用投稿情報があるかどうかで行われる。信頼性評価部16は、異なる系列の投稿情報が同じ引用元又は引用URLの被引用投稿情報を引用している場合、系列が接続されたと判断する。
【0065】
図9は、系列の生成と信頼性の評価の詳細な処理を説明する図である。
図9に示した番号に沿って説明する。
【0066】
(1) ユーザー9が端末装置30で投稿情報PAを表示させた(閲覧した)。
【0067】
(2) 次に、類似情報特定部13が、投稿情報PAと投稿内容が類似した投稿情報PBをSNSサーバ50から取得した投稿情報で探しだし、抽出する。類似した投稿情報の抽出には、投稿情報PAをTF-IDFなどの手法をベクトル化し、他の投稿情報もベクトル化し、投稿情報間の文書間類似度を、コサイン類似度などを利用して算出する方法がある。この場合、文書間類似度がある閾値以上となった場合に、これらの投稿情報は「類似している」と判断する。
【0068】
(3) 次に、系列生成部14は、投稿情報PA、PB、PCのそれぞれについて、これらが引用している被引用投稿情報(情報源の場合はWebサイトの場合がある)を探索する。例えば、投稿情報PAが被引用投稿情報Pa1を再投稿していた場合には、系列生成部14は、被引用投稿情報Pa1が投稿情報PAの被引用投稿情報であると判断し、投稿情報PAから始まる系列S1に被引用投稿情報Pa1を追加する。
【0069】
(4)(5) 投稿情報PB、PCに関しても同様に系列生成部14が被引用投稿情報を探索し、それぞれ被引用投稿情報Pb1、Pc1が得られたとする。このように、系列生成部14は、再帰的に被引用投稿情報(又はWebサイト)を、系列S1,S2に追加していく。
【0070】
(6) 被引用投稿情報Pa1がニュースサイトNSを引用していた場合、系列生成部14は系列S0にニュースサイトNSを追加する。
【0071】
(7) 次に、系列S1において、被引用投稿情報Pb1から探索して得られた被引用投稿情報であるニュースサイトNSが、すでに他の系列S0に追加されているものと一致した場合は、系列生成部14は、系列S1がそこで系列S0に接続されたと判断し、探索を終了する。したがって、系列S0とS1は情報源が同じである。
【0072】
(8) 一方、系列S2において、被引用投稿情報Pc1が、被引用投稿情報を再投稿したりWebサイトを引用したりしていない場合、系列生成部14は探索を終了する。被引用投稿情報Pc1は情報源である。
【0073】
系列生成部14は(3)~(8)の処理を、すべての系列で探索が終了する(=被引用投稿情報や引用するWebサイトが得られなくなる)まで繰り返す。
【0074】
(9) 信頼性評価部16は、最終的に、交わらなかった(独立した)系列の数を、投稿情報P
Aの信頼性と評価する。
図9の場合の信頼性は、「2」となる。
【0075】
図10は、信頼性が低いと評価される系列の探索例を示す図である。
図10では、投稿情報P
Aに類似する投稿情報P
B、P
Cを起点に3つの系列が探索されている。しかし、被引用投稿情報P
a1、P
b1、P
c1が1つの情報源R
Aを被引用投稿情報としている。この場合、すべての系列が1つの被引用投稿情報に接続されたので、系列の数は1である。これは、特定の1つの投稿情報が、様々なルートを通じて拡散されている様子を表している。このような場合、前述した「二つの情報源ルール」を満たしていない情報を表しているため、信頼性評価部16は、ユーザー9に対して投稿情報P
Aの信頼性を確認する必要がある、という旨のアラームを表示することが好ましい。
【0076】
<処理又は動作>
図11は、信頼性評価装置10が投稿情報の信頼性を評価する処理の流れを説明するシーケンス図である。
【0077】
S1:ユーザー9が投稿情報を表示させる操作を端末装置30に入力する。
【0078】
S2:端末装置30の操作受付部33が操作を受け付け、通信部31が投稿情報をSNSサーバ50に要求する。ユーザー9が表示させる投稿情報は例えばタイムライン(ユーザー9がフォローしている投稿者の投稿情報)である。なお、端末装置30が表示する投稿情報は任意であり、ユーザー9は検索等により所望の投稿情報を閲覧できる。
【0079】
S3:SNSサーバ50の投稿情報処理部51は、例えば該ユーザー9がフォローしている投稿者の最近の投稿情報を端末装置30に送信する。
【0080】
S4:端末装置30の通信部31は投稿情報を受信し、表示制御部32が投稿情報を表示する。
【0081】
S5:投稿情報を表示したことを契機に、通信部31は表示した投稿情報の投稿IDを指定して、信頼性評価要求を信頼性評価装置10に送信する。このように通信部31が自動的に信頼性評価要求を信頼性評価装置10に送信するのでなく、ユーザー9の操作に応じて、信頼性評価要求を信頼性評価装置10に送信してもよい。
【0082】
S6:信頼性評価装置10の通信部11は投稿IDと信頼性評価要求を受信する。類似情報特定部13は、投稿IDで特定される投稿情報と類似する投稿情報をSNSサーバ50から取得する。類似情報特定部13はAPI52から例えば過去の一定期間の投稿情報を取得する。類似情報特定部13は過去の一定期間の投稿情報から類似する投稿情報を特定する。あるいは、類似情報特定部13は、API52に対し投稿IDを指定してこの投稿情報と類似する投稿情報の投稿IDをSNSサーバ50から取得してもよい。
【0083】
図11の処理の流れは一例であり、端末装置30が信頼性評価装置10に信頼性評価を要求するのでなく、SNSサーバ50が、信頼性評価装置10と契約しているユーザー9が投稿情報を表示したことと該投稿情報の投稿IDを信頼性評価装置10に通知してもよい。
【0084】
S7:次に、系列生成部14は、端末装置30が表示させた投稿情報、及び、該投稿情報と類似する2つ以上の投稿情報を起点とする系列を生成する。まず、系列生成部14は、API52に対し投稿ID(端末装置30が表示、及び、類似する投稿情報)で特定される投稿情報を取得する。次に、系列生成部14は、これら投稿情報を系列の起点として、系列ごとに、引用元又は引用URLで特定される各投稿情報の被引用投稿情報を、API52から取得する。このステップS7の処理の詳細を
図12にて説明する。
【0085】
S8:全ての系列について探索が終了すると、情報源判断部15は被引用投稿情報が重複しない系列の情報源が同じ投稿者によるものかどうか判断し、独立した系列から除外する。信頼性評価部16は、被引用投稿情報が重複しない系列数に基づいて信頼性を評価する。
【0086】
S9:信頼性評価装置10の通信部11は、端末装置30が表示した投稿情報と関連づけて表示される信頼性を端末装置30に送信する。このような処理は、通信部11が投稿IDを指定すればよい。
【0087】
S10:端末装置30の通信部31は信頼性を受信し、表示制御部32が信頼性を表示する。表示制御部32は、ステップS3で表示された投稿情報と関連付けて信頼性を表示することが好ましい。
【0088】
信頼性評価装置10は、信頼性を端末装置30に送信した後、一定時間ごとに又は少なくとも一定時間が経過した後に再度、ステップS6~S10を繰り返すことが好ましい。これは、時間と共に、独立した情報源を投稿する投稿者が増える場合があるためである。例えば、火事が発生したとして、最初に投稿者Aが火事の情報を投稿した場合、系列は1つしかない。しかし、火事に気づいた第2,第3の投稿者B,Cが個別に火事の情報を投稿した場合、系列は3つになる。この場合、ユーザー9が、投稿者Aのみが火事の情報を投稿した時点で投稿情報を閲覧すると、信頼性が低いと誤解するおそれがある。このため、信頼性評価装置10が、一定時間ごとにステップS6~S10を繰り返すことで、ユーザー9により正確な信頼性を提供できる。
【0089】
図12は、
図11のステップS7の処理を詳細に説明するフローチャート図である。端末装置30が表示した投稿情報とこれに類似する投稿情報の投稿IDが得られているものとする。
【0090】
まず、系列生成部14は、端末装置30が表示した投稿情報、及び、これと類似する投稿情報のいずれか1つを、これから生成する1つの系列に決定する(S21)。すなわち、系列生成部14は、端末装置30が表示した投稿情報、及び、これに類似する投稿情報から1つを選択する。
【0091】
次に、系列生成部14は、投稿情報(又は被引用投稿情報)が有する引用情報に基づいて被引用投稿情報を探索する(S22)。探索とは、引用情報(引用元又は引用URL)がある場合に引用元の投稿情報(被引用投稿情報に相当)又は引用URLで特定されるWebサイト等を特定することをいう。
【0092】
系列生成部14は被引用投稿情報がないかどうか判断する(S23)。被引用投稿情報がない場合(S23のYes)、1つの系列について情報源までたどり着いたので、処理はステップS25に進む。
【0093】
被引用投稿情報がある場合(S23のNo)、系列生成部14は、ステップS21で決定した系列に見つかった被引用投稿情報を追加する。また、系列生成部14は、これまでに生成が完了している他の系列に含まれる被引用投稿情報と、ステップS22の被引用投稿情報が重複するか否か判断する(S24)。被引用投稿情報が重複する場合(S24のYes)、系列が統合されたので処理はステップS25に進む。
【0094】
被引用投稿情報が重複しない場合(S24のNo)、系列を更に探索するため、処理はステップS22に戻る。
【0095】
次に、ステップS25では、系列生成部14は全ての系列について探索が完了したか否か判断する(S25)。全ての系列について探索が完了するとは、系列の起点とすべき投稿情報がなくなったことである。系列が残っている場合、処理はステップS21に戻る。
【0096】
全ての系列について探索が完了した場合、情報源判断部15が、独立している系列の情報源の投稿者IDに基づいて投稿者が同一か否か判断し、投稿者が同一の複数の系列を1つの系列とみなすことで系列数を減じる(S26)。同様に、情報源判断部15は、独立している系列の情報源がWebサイトの場合は、Webサイトが同一か否か判断し、情報源が同じWebサイトの複数の系列を1つの系列とみなすことで系列数を減じる。こうすることで、同じ投稿者が同じ出来事について複数の投稿を行っても、信頼性評価装置10が、信頼性が高いと誤って評価することを抑制できる。
【0097】
<端末装置が表示する画面例>
次に、
図13、
図14に基づいて、端末装置30が表示する画面例を説明する。
図13は、投稿情報の信頼性が高いと評価された場合に表示されるメッセージの一例を示す。
図13(a)は、ユーザー9が端末装置30で表示した投稿情報表示画面110を示す。投稿情報表示画面110は、「佐藤一郎さん」が投稿した投稿文111を、「山田太郎さん」が再投稿したこと112を示している。「佐藤一郎さん」が投稿した投稿文111には、引用URLによるWebサイトのニュース113が引用されている。
【0098】
図13(b)(c)は、ユーザー9が端末装置30で表示した投稿文111と類似する他の投稿情報である。
図13(b)の投稿情報は、「鈴木次郎さん」が投稿した投稿文115を有し、
図13(c)の投稿情報は、「田中三郎さん」が投稿した投稿文116を有する。
図13(c)の投稿情報は、引用URLによりWebサイトのニュース117が引用されている。
【0099】
信頼性評価装置10は、
図13(a)~(c)の投稿情報の系列が独立であると判断した。このため、投稿情報表示画面110には「信頼度:3(少なくとも3つの独立した情報源が同様の情報を示しているようです)」という信頼度情報114が表示されている。ユーザー9は「山田太郎さん」が再投稿した投稿文111を信頼できると評価できる。なお、信頼度情報114は、数値に限らず、アイコンでもよい。アイコンは、形状や色の違いで、信頼性の有無、大小、又は、高中低(5段階以上でもよい)等を示す。
【0100】
図14は、投稿情報の信頼性が低いと評価された場合に表示されるメッセージの一例を示す。なお、
図14の説明では主に
図13との相違を説明する。
図14(a)はユーザー9が端末装置30で表示した投稿情報表示画面120を示す。投稿情報表示画面120は、「佐藤一郎さん」が投稿した投稿文121を、「山田太郎さん」が再投稿したこと122を示している。
【0101】
図14(b)は、信頼性評価装置10が探索した情報源125である。この情報源125は、ユーザー9が端末装置30で表示した投稿情報と類似する他の投稿情報の数に関係なく、1つであった。すなわち、系列が1つに統合され、情報源125は各系列に共通する情報源である。
【0102】
このため、投稿情報表示画面120には「類似する投稿は、すべて下記の投稿を情報源としているようです。情報源の信憑性の確認が必要です。」という信頼度情報124が表示されている。ユーザー9は「山田太郎さん」が再投稿した投稿情報は、信頼性に注意が必要と判断できる。
【0103】
また、
図14のように、1つに統合された系列の情報源125が表示されることで、ユーザー9は情報源の投稿文や画像と投稿情報表示画面120の投稿文や画像と比較して、自身で投稿情報の信頼性を判断しやすい。例えば情報源が個人のブログの場合、ユーザー9は信頼性が低いと推定できるし、情報源が大学や公的機関に所属する学者の論文の場合、情報源が1つでもユーザー9は信頼性が高いと推定できる。
【0104】
<変形例1>
図11の処理では、端末装置30が表示した投稿情報と類似する投稿情報の数が多い場合に、系列生成部14が系列を探索する処理負荷が大きくなってしまう。そこで、端末装置30が表示した投稿情報と類似する投稿情報の数を絞ることで、処理負荷を低減する処理について説明する。
【0105】
図15は、端末装置30が表示した投稿情報と類似する投稿情報の数を絞り、信頼性評価装置10が投稿情報の信頼性を評価する処理の流れを説明するフローチャート図である。なお、
図15の説明では
図12との相違を説明する場合がある。
【0106】
類似情報特定部13は、端末装置30が表示した投稿情報と類似する投稿情報について、端末装置30が表示した投稿情報が直接、引用している投稿情報を除外する(S31)。例えば、端末装置30が表示した投稿情報Aが直接、投稿情報Bを引用していて、投稿情報Bが類似する投稿情報に含まれている場合、投稿情報Bは系列の起点から除外される。
【0107】
また、類似情報特定部13は、端末装置30が表示した投稿情報の投稿時刻との差が閾値内に入らない投稿情報を除外する(S32)。換言すると、類似情報特定部13は、端末装置30が表示した投稿情報と同時期に投稿された登録情報に限って、系列の起点に決定する。端末装置30が表示した投稿情報と同時期に投稿されていない投稿情報は、いずれかの系列に含まれている可能性が高く、系列の起点としても統合される可能性が高いためである。
【0108】
このステップS31、S32の処理により、端末装置30が表示した投稿情報と類似する投稿情報を絞ることができ、信頼性評価装置10の処理負荷を低減できる。
【0109】
【0110】
<変形例2>
投稿者が同一でないとしても関係が近い複数の投稿者が情報源を投稿した場合、独立した系列であっても信頼性が低い場合がある。これは、一般に、関係が近い複数の投稿者(後述する同じコミュニティに所属するユーザー)は、同じ投稿を目にする可能性や、SNSとは別の通信手段で連絡を取る可能性が高くなるためである。同じコミュニティ内にいるユーザーは、同じ投稿に注目する可能性が高いと言える。その際、同じコミュニティ内にいるユーザーが投稿の内容を引用することなく再投稿した場合、系列的には異なっても、実際の情報源は同じ、ということが生じ得る。言い換えると、関係が遠い複数の投稿者が独立した系列の情報源を投稿した場合、信頼性が高いと推定できる。なお、投稿者同士の関係とは、投稿者同士のSNS空間上での距離である。距離については
図16で説明する。本変形例では、信頼性評価部16は、独立した系列の情報源を投稿した投稿者間の距離に基づいて信頼性を評価する。
【0111】
図16は、SNS空間上での距離について模式的に説明する図である。
図16は、ユーザー間のフォロー関係を示している。各ノードがユーザーを表し、ノード間を接続するエッジ(直線)がフォローの関係を示す。つまり、
図16では、フォローする者とフォローされる者の間にエッジが示されている。どちらがフォローする者でどちらがフォローされる者かは問わない。
【0112】
信頼性評価部16は、独立した系列の情報源を投稿した投稿者から別の情報源を投稿した投稿者まで、エッジとノードをたどることで、投稿者同士の最短距離を計算する。距離はエッジとノードをたどった際のエッジ数とする。最短距離を計算する方法は、ダイクストラ法やAスター法など既存の方法が使用される。例えば
図16では、GさんとDさんの距離は3である。同様に、AさんとCさんとの距離は2、AさんとFさんの距離は1である。このように、距離が遠いほどフォローする者とフォローされる者の関係も遠いと推定できるので、投稿者同士のSNS空間上の距離は投稿者同士の関係の近さを表す。このようにSNS空間上の距離は、一方の情報源を投稿した投稿者が他方の情報源を投稿した投稿者の投稿情報を見守る(すなわちフォローする)関係に関する経路の距離である。
【0113】
次に、
図17を参照して、最短距離を信頼度とする根拠について説明する。
図17は、ユーザーから別のユーザーまでのエッジ数を信頼度とする根拠を説明する図である。SNSにおいてユーザー間のフォロー関係のネットワーク構造を利用すると、ユーザーは複数のコミュニティ62~64に分けられると考えられる。コミュニティとは、SNS内で話題が似ている仲間の集まりである。SNS内に明示的なコミュニティ62~64がありユーザーが所属していることまでは要さず、好む話題が近いユーザーを仮想的に分類した場合が想定されてよい。
【0114】
話題が似ているユーザー同士はフォロー関係になる可能性が高いので、一般的に、同じコミュニティに属するユーザー同士の最短経路長は短く、異なるコミュニティのユーザー同士の最短経路長は長いと考えられる。したがって、異なる系列の情報源が、どちらも同じコミュニティ内のユーザーによる投稿情報である場合よりも、別のコミュニティのユーザーによる投稿情報である方が、「2つの情報源ルール」からすると、信頼度が高いと考えられる。
【0115】
このように、異なる系列の情報源を投稿したユーザー同士の最短経路長が長い方が、ユーザーが表示させた投稿情報の信頼性が高いと判断できる。
【0116】
なお、異なる系列の情報源を投稿したユーザー同士がエッジで接続されていない場合、信頼性評価部16は、このユーザー同士の距離を所定値とする。所定値は、ユーザー同士がエッジで接続されていたとしても、ユーザー同士に関係がないとみなしてよい距離とする。同様に、ユーザー同士の距離が所定値超の場合、信頼性評価部16は、ユーザー同士の距離を所定値とみなしてよい。こうすることで信頼性判断装置10は処理負荷を低減できる。
【0117】
図18は、独立した系列の情報源を投稿した投稿者間の距離に基づいて、信頼性評価装置10が投稿情報の信頼性を評価する処理の流れを説明するフローチャート図である。なお、
図18の説明では主に
図12との相違を説明する場合がある。
図18のステップS21~S26の処理は
図12のステップS21~S26と同様でよい。
【0118】
ステップS47において、信頼性評価部16は、独立した系列の情報源の投稿者同士の距離を信頼度とする(S47)。独立した系列の情報源の数が例えばN個の場合、算出される距離の数はN(N-1)/2である(N個から2つを取り出す組み合わせ)。信頼性評価部16は、この距離の合計を正規化する(例えば0~100の値に変換する)。正規化には、例えば、ユーザーや信頼性評価装置10の運営者が完全に独立と判断してよい最大の距離を予め設定しておき、距離の合計に対する最大の距離の比率を用いればよい(比率が1超の場合は1とみなす)。
【0119】
信頼性評価部16は、正規化した距離の合計をそのまま信頼度としてもよいし、複数の閾値と比較して数段階の信頼度で評価してもよい。
【0120】
このように、本変形例によれば、SNS空間内のフォロー関係から求めた、投稿者同士の距離に基づいて信頼性を評価できる。
【0121】
なお、投稿者同士の距離は「フォロー関係」のみでなく、ユーザーが別のユーザーに「いいね!」をつけた関係や、投稿情報にコメントをつけた関係などで表現することもできる。
【0122】
<主な効果>
本実施形態の信頼性評価装置10は、ユーザーが投稿情報を表示した際に、信頼性をユーザーに提示することができる。ユーザーはその信頼性を参考に、その投稿情報がどれほど信頼できるかを判断し、行動を起こす際などの参考とすることができる。例えば、信頼性の低い投稿情報を再投稿するといった行動を回避することが可能となる。
【0123】
<その他の適用例>
以上、本発明を実施するための最良の形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
【0124】
例えば、本実施形態では、投稿情報を例にして信頼性を評価する方法を説明したが、信頼性が評価される情報は投稿情報に限られない。信頼性が評価される情報は、情報が被引用情報を引用する関係を1回以上繰り返す情報系列があれば可能で得る。例えばWebページが他のWebページをリンクしている場合、信頼性評価装置10は閲覧中のWebページの信頼性を評価できる。
【0125】
また、本実施形態では、ユーザーが投稿情報を表示したタイミングで信頼性が評価されているが、信頼性評価装置10が信頼性を評価する投稿情報を自動で選択し、選択したタイミングで評価してもよい。例えば、再投稿の数が一定以上の投稿情報や、「いいね」の回数が一定以上の投稿情報がある場合に、信頼性評価装置10が信頼性を判断できる。
【0126】
また、
図5などの構成例は、信頼性評価装置10、SNSサーバ50及び端末装置30による処理の理解を容易にするために、主な機能に応じて分割したものである。処理単位の分割の仕方や名称によって本願発明が制限されることはない。信頼性評価装置10、SNSサーバ50及び端末装置30の処理は、処理内容に応じて更に多くの処理単位に分割することもできる。また、1つの処理単位が更に多くの処理を含むように分割することもできる。
【0127】
上記で説明した実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路により実装されるプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)、DSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)や従来の回路モジュール等のデバイスを含むものとする。
【符号の説明】
【0128】
10 信頼性評価装置
30 端末装置
50 SNSサーバ
100 信頼性評価システム