(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024168491
(43)【公開日】2024-12-05
(54)【発明の名称】情報検証プログラム、情報処理装置および情報処理システム
(51)【国際特許分類】
G06F 16/907 20190101AFI20241128BHJP
【FI】
G06F16/907
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2023085214
(22)【出願日】2023-05-24
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110002918
【氏名又は名称】弁理士法人扶桑国際特許事務所
(72)【発明者】
【氏名】藤本 馨
(72)【発明者】
【氏名】須加 純一
(72)【発明者】
【氏名】吉武 敏幸
(72)【発明者】
【氏名】二村 和明
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175DA10
5B175FB03
5B175HA01
(57)【要約】
【課題】投稿情報の信頼度を高精度に算出する。
【解決手段】情報処理装置1の処理部2は、テキスト情報である第1情報と、画像情報または音声情報の少なくとも一方である第2情報と、第2情報のメタデータ13とを含む投稿情報10を取得する。処理部2は、第1情報に基づいて、発生した事象を特定する。処理部2は、特定された事象による、地理的な影響または時間的な影響の少なくとも一方の範囲を示す影響範囲30を特定する。処理部2は、特定された影響範囲30とメタデータ13とに基づいて投稿情報10の信頼度を算出する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
コンピュータに、
テキスト情報である第1情報と、画像情報または音声情報の少なくとも一方である第2情報と、前記第2情報のメタデータとを含む投稿情報を取得し、
前記第1情報に基づいて、発生した事象を特定し、
前記事象による、地理的な影響または時間的な影響の少なくとも一方の範囲を示す影響範囲を特定し、
前記影響範囲と前記メタデータとに基づいて前記投稿情報の第1信頼度を算出する、
処理を実行させる情報検証プログラム。
【請求項2】
前記メタデータは、前記第2情報が作成された作成位置を含み、
前記影響範囲の特定では、前記事象による地理的な影響の範囲を示す前記影響範囲を特定し、
前記第1信頼度の算出では、前記影響範囲と前記作成位置との位置関係に基づいて前記第1信頼度を算出する、
請求項1記載の情報検証プログラム。
【請求項3】
前記メタデータは、前記第2情報が作成された作成位置を含み、
前記影響範囲の特定では、前記影響範囲として前記事象の発生範囲を特定し、
前記第1信頼度の算出では、前記発生範囲と前記作成位置との位置関係に基づいて前記第1信頼度を算出する、
請求項1記載の情報検証プログラム。
【請求項4】
前記メタデータは、前記第2情報が作成された作成時刻を含み、
前記影響範囲の特定では、前記第1情報の時制が過去形の場合、前記作成時刻における前記発生範囲を特定し、前記第1情報の時制が現在形の場合、前記投稿情報が投稿された投稿時刻における前記発生範囲を特定する、
請求項3記載の情報検証プログラム。
【請求項5】
前記作成位置と、前記投稿情報が投稿された投稿位置との距離に基づいて、前記投稿情報の第2信頼度を算出し、
前記第1信頼度と前記第2信頼度とに基づいて、前記投稿情報の総合信頼度を算出する、
処理を前記コンピュータにさらに実行させる請求項3記載の情報検証プログラム。
【請求項6】
前記メタデータは、前記第2情報が作成された作成時刻を含み、
前記作成時刻と、前記投稿情報が投稿された投稿時刻との差に基づいて、前記投稿情報の第3信頼度を算出する処理を、前記コンピュータにさらに実行させ、
前記総合信頼度は、前記第1信頼度、前記第2信頼度および前記第3信頼度に基づいて算出される、
請求項5記載の情報検証プログラム。
【請求項7】
テキスト情報である第1情報と、画像情報または音声情報の少なくとも一方である第2情報と、前記第2情報のメタデータとを含む投稿情報を取得し、
前記第1情報に基づいて、発生した事象を特定し、
前記事象による、地理的な影響または時間的な影響の少なくとも一方の範囲を示す影響範囲を特定し、
前記影響範囲と前記メタデータとに基づいて前記投稿情報の第1信頼度を算出する、処理部、
を有する情報処理装置。
【請求項8】
テキスト情報である第1情報と、画像情報または音声情報の少なくとも一方である第2情報とを含む投稿情報の投稿を受け付け、前記第1情報と前記第2情報を投稿画面に表示させる第1情報処理装置と、
前記投稿情報を前記第1情報処理装置から取得し、前記第1情報に基づいて、発生した事象を特定し、前記事象による、地理的な影響または時間的な影響の少なくとも一方の範囲を示す影響範囲を特定し、前記影響範囲と、前記第2情報のメタデータとに基づいて、前記投稿情報の第1信頼度を算出する第2情報処理装置と、
を有する情報処理システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報検証プログラム、情報処理装置および情報処理システムに関する。
【背景技術】
【0002】
近年、一般のユーザから投稿された投稿情報を投稿画面に表示させる投稿サービスが広く普及している。例えば、SNS(Social Networking Service、Social Mediaとも呼ばれる)では、テキスト情報だけでなく画像情報や音声情報も含む投稿情報を投稿可能なサービスもある。
【0003】
このような投稿情報は、災害発生時などの緊急時には各地の被災状況に関する有力な情報源となり得る。一方で、投稿情報の中に偽情報が含まれ得るという問題がある。このため、投稿情報の信頼性や正確性を検証し、偽情報をリアルタイムに検出することが要求されている。
【0004】
このような技術の一例として、次のような投稿評価方法が提案されている。この投稿評価方法では、投稿情報に含まれるテキスト情報から所定の現象の有無に関する第1の情報を抽出し、高信頼情報から当該現象の有無に関する第2の情報を抽出し、第1の情報と第2の情報との比較によって投稿情報の正確性指標を計算する。
【0005】
また、投稿情報の利用に関しては、例えば、裁判に関する追加的な情報をソーシャルネットから検索するデータ解析プラットフォームが提案されている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2022-122297号公報
【特許文献2】米国特許出願公開第2014/344172号明細書
【発明の概要】
【発明が解決しようとする課題】
【0007】
ところで、投稿情報の信頼性を高信頼情報との比較によって検証する方法では、例えば電車の遅延やトイレの混雑など、特定の場所で発生した事象に関しては、その事象を示す投稿情報の信頼性を比較的精度よく検証できる。しかし、災害などの地理的または時間的に広範囲に影響が生じる事象に関しては、投稿情報が正しい場合であっても、その投稿情報が示す事象の発生場所や発生時刻と、高信頼情報から得られる発生場所や発生時刻とが一致しないことが多くなる。このため、このような事象を示す投稿情報の信頼性を精度よく検証できないという問題がある。
【0008】
1つの側面では、本発明は、投稿情報の信頼度を高精度に算出可能な情報検証プログラム、情報処理装置および情報処理システムを提供することを目的とする。
【課題を解決するための手段】
【0009】
1つの案では、コンピュータに、テキスト情報である第1情報と、画像情報または音声情報の少なくとも一方である第2情報と、第2情報のメタデータとを含む投稿情報を取得し、第1情報に基づいて、発生した事象を特定し、事象による、地理的な影響または時間的な影響の少なくとも一方の範囲を示す影響範囲を特定し、影響範囲とメタデータとに基づいて投稿情報の第1信頼度を算出する、処理を実行させる情報検証プログラムが提供される。
【0010】
また、1つの案では、上記の情報検証プログラムに基づく処理と同様の処理を実行する情報処理装置が提供される。
さらに、1つの案では、第1情報処理装置と第2情報処理装置とを有する情報処理システムが提供される。第1情報処理装置は、テキスト情報である第1情報と、画像情報または音声情報の少なくとも一方である第2情報とを含む投稿情報の投稿を受け付け、第1情報と第2情報を投稿画面に表示させる。第2情報処理装置は、投稿情報を第1情報処理装置から取得し、第1情報に基づいて、発生した事象を特定し、事象による、地理的な影響または時間的な影響の少なくとも一方の範囲を示す影響範囲を特定し、影響範囲と、第2情報のメタデータとに基づいて、投稿情報の第1信頼度を算出する。
【発明の効果】
【0011】
1つの側面では、投稿情報の信頼度を高精度に算出できる。
【図面の簡単な説明】
【0012】
【
図1】第1の情報処理システムの構成例および処理例を示す図である。
【
図2】第2の実施の形態に係る情報処理システムの構成例を示す図である。
【
図3】検証サーバのハードウェア構成例を示す図である。
【
図4】投稿情報の信頼度算出についての比較例を示す図である。
【
図5】第2の実施の形態における信頼度算出の一例を示す図である。
【
図6】検証サーバが備える処理機能の構成例を示す図である。
【
図7】発生事象テーブルのデータ構成例を示す図である。
【
図8】事象分類テーブルのデータ構成例を示す図である。
【
図9】発生事象情報収集処理の例を示すフローチャートである。
【
図10】投稿情報取得処理の例を示すフローチャートである。
【
図11】影響範囲推定処理の例を示すフローチャートである。
【
図12】影響範囲の具体的な推定処理例を示す図である。
【
図13】信頼度算出処理の例を示すフローチャートである。
【
図15】検証結果の出力処理例を示す第1の図である。
【
図16】検証結果の出力処理例を示す第2の図である。
【発明を実施するための形態】
【0013】
以下、本発明の実施の形態について図面を参照して説明する。
〔第1の実施の形態〕
図1は、第1の情報処理システムの構成例および処理例を示す図である。
図1に示す情報処理装置1は、SNSなどの投稿サービスに投稿された情報の信頼性を検証する装置である。情報処理装置1は、処理部2を有する。処理部2は、例えば、プロセッサである。この場合、以下で示す情報処理装置1の処理は、例えば、プロセッサが所定のプログラムを実行することで実現される。
【0014】
処理部2は、テキスト情報である第1情報と、画像情報または音声情報の少なくとも一方である第2情報と、第2情報のメタデータとを含む投稿情報を、検証対象として取得する。
図1の例では、第1情報として「洪水で家が流された」という投稿文11を含み、第2情報として画像情報12を含む投稿情報10が取得されたとする。また、投稿情報10に含まれるメタデータ13は、画像情報12の撮影位置の情報を含むものとする。この撮影位置の情報は、例えば、緯度および経度で表される。
【0015】
処理部2は、このような投稿情報10を取得すると、投稿文11に基づいて、発生した事象(発生事象)を特定する。例えば、処理部2は、投稿文11から単語を抽出し、あらかじめ決められた、複数の事象のそれぞれを示す単語と照合することによって、投稿文11から発生事象を特定する。
図1の例では、例えば投稿文11に含まれる「洪水」という単語から、発生事象として洪水が特定される。なお、発生事象の特定は、例えば、公的機関などの信頼性の高い情報源から取得した、実際に発生した事象の情報と、投稿文11から抽出された事象の情報とを照合することによって行われてもよい。
【0016】
次に、処理部2は、特定された発生事象による影響の範囲(影響範囲)を特定する。この影響範囲としては、発生事象による地理的な影響または時間的な影響の少なくとも一方の範囲を示す。
図1の例では、メタデータ13に地理的な情報である撮影位置が含まれることから、発生事象による地理的な影響範囲、すなわち洪水が発生する範囲が特定される。
【0017】
ここでは一例として、処理部2は、発生事象(洪水)に対応する影響範囲情報20を、公的機関などの信頼性の高い情報源から取得し、影響範囲情報20に基づいて影響範囲30を特定する。影響範囲情報20としては、浸水想定範囲を示すハザードマップ21と、降水量計測値22とが取得される。ハザードマップ21には、例として、一定時間Tにおける累積降水量が100mm、200mmの場合のそれぞれの浸水想定範囲が示されている。一方、降水量計測値22としては、例として、直近の一定時間Tにおける累積降水量の計測値が取得される。
図1の例では、降水量計測値22は累積降水量が100mmであることを示しているとする。この場合、処理部2は、ハザードマップ21が示す、累積降水量100mmの場合の浸水想定範囲を、影響範囲30として特定する。
【0018】
次に、処理部2は、特定された影響範囲30と、画像情報12のメタデータ13とに基づいて、投稿情報10の信頼度を算出する。例えば、処理部2は、影響範囲30として特定された浸水想定範囲と、メタデータ13が示す画像情報12の撮影位置との位置関係に基づいて、投稿情報10の信頼度を算出する。具体的な例としては、浸水想定範囲と撮影位置との距離が近いほど、信頼度の算出値は高い値とされる。
【0019】
ここで、比較例として、メタデータ13が示す撮影位置と、浸水が発生した場所を示す高信頼情報との一致判定によって信頼度を算出する方法を挙げる。この場合、高信頼情報は、例えば、あらかじめ決められた複数の地点について、洪水の発生の有無を示す。しかし、メタデータ13が示す撮影位置は、このような複数の地点のいずれかに一致するとは限らない。このため、例えば、投稿情報10が正しい情報である(すなわち、撮影位置で洪水が発生している)場合でも、撮影位置が、上記の複数の地点のうち洪水が発生している場所と一致しなければ、投稿情報10の信頼度の算出値は低くなってしまう。
【0020】
これに対して、処理部2による上記処理では、発生事象による影響範囲(
図1では浸水想定範囲)と第2情報(
図1では画像情報12)のメタデータ(
図1では画像情報12の撮影位置)に基づいて、投稿情報10の信頼度が算出される。これにより、事象が発生した離散的な場所や時刻ではなく、事象による影響が及ぶ地理的または時間的な範囲とメタデータとの比較によって信頼度が算出される。このため、洪水などの災害のように地理的または時間的に広い範囲に影響が及び得る事象が投稿文11から特定された場合でも、投稿情報10の信頼度を高精度に算出できる。
【0021】
なお、時間的な影響範囲としては、例えば、発生事象の発生期間(発生開始時刻から発生終了時刻までの期間)を適用可能である。この場合、メタデータとして第2情報の作成時刻(画像情報の場合は撮影時刻)が利用され、処理部2は、発生期間と作成時刻とに基づいて信頼度を精度よく算出することができる。
【0022】
また、影響範囲として、地理的な影響範囲と時間的な影響範囲の両方が用いられてもよい。この場合、処理部2は例えば、メタデータに含まれる地理的な情報と地理的な影響範囲との比較結果と、メタデータに含まれる時間的な情報と時間的な影響範囲との比較結果に基づいて、信頼度を精度よく算出することができる。
【0023】
〔第2の実施の形態〕
図2は、第2の実施の形態に係る情報処理システムの構成例を示す図である。
図2に示す情報処理システムは、SNSサーバ50、情報源サーバ60a,60b,・・・および検証サーバ100を含む。SNSサーバ50、情報源サーバ60a,60b,・・・および検証サーバ100は、ネットワーク70を介して接続されている。ネットワーク70は、例えば、インターネットなどの広域通信網である。
【0024】
SNSサーバ50は、SNSの事業者が運営するサーバコンピュータである。SNSサーバ50は、ユーザによって投稿された投稿情報を投稿画面上に表示させる。本実施の形態では、例として、投稿文(テキスト)と画像とを含む投稿情報がSNSサーバ50に投稿され、投稿画面上に表示されるものとする。投稿情報に含まれる画像は、静止画像と動画像のどちらであってもよい。
【0025】
情報源サーバ60a,60b,・・・は、検証サーバ100が各種の事象に関する情報を収集するための情報源となるサーバコンピュータである。例えば、情報源サーバ60a,60b,・・・は、事象に関する情報を提供するWebサイトを運営するWebサーバである。また、情報源サーバ60a,60b,・・・は、例えば、国や自治体などの公的機関や、気象情報などを提供する民間事業者によって運営される。これにより、検証サーバ100は、情報源サーバ60a,60b,・・・から事象に関する信頼性の高い情報を取得することが可能となっている。
【0026】
検証サーバ100は、SNSサーバ50に投稿される投稿情報を監視し、投稿された投稿情報の信頼性を検証して検証結果を出力する。例えば、検証サーバ100は、投稿された投稿情報から気象や地震、災害などの事象に関する事象情報を抽出し、抽出された事象情報に関連する関連情報を情報源サーバ60a,60b,・・・から収集する。検証サーバ100は、抽出された事象情報と収集された関連情報とを比較することで投稿情報の信頼性を評価し、信頼性を示す指標である信頼度を算出する。
【0027】
図3は、検証サーバのハードウェア構成例を示す図である。検証サーバ100は、例えば、
図3に示すようなハードウェア構成のコンピュータとして実現される。
図3に示す検証サーバ100は、プロセッサ101、RAM(Random Access Memory)102、HDD(Hard Disk Drive)103、GPU(Graphics Processing Unit)104、入力インタフェース(I/F)105、読み取り装置106およびネットワークインタフェース(I/F)107を備える。
【0028】
プロセッサ101は、検証サーバ100全体を統括的に制御する。プロセッサ101は、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)またはPLD(Programmable Logic Device)である。また、プロセッサ101は、CPU、MPU、DSP、ASIC、PLDのうちの2以上の要素の組み合わせであってもよい。
【0029】
RAM102は、検証サーバ100の主記憶装置として使用される。RAM102には、プロセッサ101に実行させるOS(Operating System)プログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、RAM102には、プロセッサ101による処理に必要な各種データが格納される。
【0030】
HDD103は、検証サーバ100の補助記憶装置として使用される。HDD103には、OSプログラム、アプリケーションプログラムおよび各種データが格納される。なお、補助記憶装置としては、SSD(Solid State Drive)などの他の種類の不揮発性記憶装置を使用することもできる。
【0031】
GPU104には、表示装置104aが接続されている。GPU104は、プロセッサ101からの命令にしたがって、画像を表示装置104aに表示させる。表示装置104aとしては、液晶ディスプレイや有機EL(ElectroLuminescence)ディスプレイなどがある。
【0032】
入力インタフェース105には、入力装置105aが接続されている。入力インタフェース105は、入力装置105aから出力される信号をプロセッサ101に送信する。入力装置105aとしては、キーボードやポインティングデバイスなどがある。ポインティングデバイスとしては、マウス、タッチパネル、タブレット、タッチパッド、トラックボールなどがある。
【0033】
読み取り装置106には、可搬型記録媒体106aが脱着される。読み取り装置106は、可搬型記録媒体106aに記録されたデータを読み取ってプロセッサ101に送信する。可搬型記録媒体106aとしては、光ディスク、半導体メモリなどがある。
【0034】
ネットワークインタフェース107は、ネットワーク70を介してSNSサーバ50などの他の装置との間でデータの送受信を行う。
以上のようなハードウェア構成によって、検証サーバ100の処理機能を実現することができる。なお、SNSサーバ50および情報源サーバ60a,60b,・・・も、
図3に示すようなハードウェア構成のコンピュータとして実現可能である。
【0035】
ところで、災害のような緊急性の高い事象に関しては、人々の安全のためにリアルタイムで正確な情報の提供が求められる。また、現状では、例えば災害の発生時において、地域ごとの被災状況が可能な限り報道機関から発信されているが、細かい地域ごとの被災状況がリアルタイムで発信されているとはいえない。一方、SNS上では、各地で発生した事象を一般のユーザがリアルタイムで発信している。このため、SNSの投稿情報は、災害などによる緊急時には有力な情報源となり得る。
【0036】
しかし、SNSでは偽情報や誤情報が拡散されることが多い。このため、災害のような緊急性の高い事象の発生時に偽情報や誤情報が拡散されると、人々の行動や心理に悪影響を与え、混乱をもたらす可能性がある。特に、画像や音声を含む投稿情報は、閲覧者が視覚的・聴覚的に情報を理解できるので、テキストのみの投稿よりもユーザが注目しやすい。このため、偽情報や誤情報を含む画像や音声が拡散された場合、その影響力が強い。したがって、テキストだけでなく画像や音声を含む投稿情報が正しい情報であるか、または偽情報もしくは誤情報であるかを、投稿情報を閲覧したユーザが認知できるようにすることが重要である。
【0037】
図4は、投稿情報の信頼度算出についての比較例を示す図である。投稿情報の信頼度を算出する方法の例として、投稿情報に含まれる画像のメタデータ(例えば撮影位置)と、投稿情報から抽出された事象情報に関する高信頼情報との一致判定により、投稿情報の信頼度を算出する方法が考えられる。
【0038】
図4の例では、撮影された画像202と、画像202に関するメタデータ203とを含む投稿情報200が取得されたとする。投稿文201は、「土砂崩れで家が沈んでる」という文になっており、画像202には、投稿文201が示すような光景が写っているとする。メタデータ203は、例えば、画像202の撮影時刻「15時」および撮影位置「B地区C町」を含んでいる。
【0039】
また、この投稿情報200の検証のために、信頼性の高い情報源から高信頼情報210が取得されたとする。
図4に例示した高信頼情報210は、国が発信している、土砂崩れの警戒情報である。
図4の例では、高信頼情報210は、15時における土砂崩れの警戒情報がA地区に出されていることを示している。
【0040】
このような投稿情報200と高信頼情報210との一致判定により、投稿情報200の信頼度が算出されたとする。この場合、メタデータ203に含まれる撮影時刻と高信頼情報210が示す土砂崩れの警戒予測時刻(15時)とは一致しているが、メタデータ203に含まれる撮影位置「B地区C町」と、高信頼情報210が示す土砂崩れの警戒対象地区「A地区」とは異なっている。このため、投稿情報200の内容が正しい場合であっても、投稿情報200の信頼度が低い値に算出される場合がある。
【0041】
例えば、電車の遅延やトイレの混雑といった事象は、特定の場所で発生する。このため、このような事象に関しては、事象の発生場所を示す高信頼情報とメタデータ203との一致判定により、信頼度を比較的高い精度で算出できる。
【0042】
一方、災害の影響は比較的広い範囲に及びやすい。高信頼情報210からは、あらかじめ決められた複数の地点のそれぞれにおける、災害発生の有無を示す情報が得られる。しかし、それらの複数の地点のいずれからもある程度以上の距離がある場所での災害発生の有無を、
図4のような高信頼情報210のみから判断することは難しい。このため、信頼度の算出精度が低下してしまう。
【0043】
これに対して、本実施の形態の検証サーバ100は、災害などの事象の発生によって影響が及ぶ範囲(影響範囲)を特定できるような情報を、公的機関のWebサイトや、事象に関する情報を提供するサービス企業のWebサイトなどから収集する。検証サーバ100は、収集された情報から事象発生による影響範囲を特定し、特定された影響範囲とメタデータ203とに基づいて、投稿情報200の信頼度を算出する。
【0044】
影響範囲としては、地理的な影響範囲と時間的な影響範囲の少なくとも一方が用いられる。地理的な影響範囲を用いる場合、メタデータ203内の地理的な情報である撮影位置と影響範囲とに基づいて、信頼度が算出される。また、時間的な影響範囲を用いる場合、メタデータ203内の時間的な情報である撮影時刻と影響範囲とに基づいて、信頼度が算出される。
【0045】
以下の説明では、例として地理的な影響範囲が用いられるものとする。また、検証対象の投稿情報には、投稿文と画像とが含まれるものとする。なお、投稿情報に画像の代わりに音声が含まれる場合、画像のメタデータに含まれる撮影位置および撮影時刻の代わりに、音声のメタデータに含まれる収音位置および収音時刻がそれぞれ用いられればよい。
【0046】
図5は、第2の実施の形態における信頼度算出の一例を示す図である。
図5では、
図4に示した投稿情報200を信頼度算出の対象とする。
図5の例では、土砂崩れの影響範囲を特定するための影響範囲情報221として、土砂崩れによる地形の崩壊危険区域を示すハザードマップが用いられる。検証サーバ100は、例えば、ハザードマップが示す崩壊危険区域を影響範囲として特定し、この崩壊危険区域と、メタデータ203に含まれる画像202の撮影位置との最短距離に基づいて信頼度を算出する。最短距離が短いほど信頼度の算出値は高くなる。
図5の例では、崩壊危険区域と撮影位置との最短距離が50mと比較的短いため、撮影位置が土砂崩れ被害を受ける可能性があると判定される。このため、投稿情報200の信頼度としては比較的高い値が算出される。このように、事象による影響範囲を用いることで信頼度を高精度で算出可能となる。
【0047】
なお、影響範囲を特定するための影響範囲情報としては、例えば、災害発生のシミュレーション情報、災害発生のリスク情報、過去の災害発生範囲を示す情報などを利用することができる。これらの影響範囲情報は、公的機関のWebサイトや、事象に関する情報を提供するサービス企業のWebサイトなど、信頼性の高い情報源から取得される。
【0048】
また、
図5に示すように、検証サーバ100はさらに、影響範囲に加えて様々な高信頼情報を組み合わせて信頼度を算出することもできる。例えば、
図5に示す高信頼情報222は、国が発信している土砂崩れの警戒情報であり、A地区で土砂崩れが発生する可能性があることを示している。検証サーバ100は、例えば、高信頼情報222に示されたA地区と、メタデータ203に含まれる撮影位置との位置関係(距離など)に基づいて信頼度を算出することができる。
図5の例では、A地区と撮影位置であるB地区とは隣接しており、撮影位置が土砂崩れの警戒地域に近いと判定される。このため、投稿情報200の信頼度としては比較的高い値が算出される。
【0049】
なお、高信頼情報222が示す警戒地域「A地区」は、災害発生の影響範囲と考えることもできる。すなわち、検証サーバ100は、影響範囲情報として高信頼情報222を取得することもできる。
【0050】
さらに、
図5に示す高信頼情報223は、国が発信している累積降水量の計測値であり、雨の降り始めから15時までの累積降水量が250mmと計測されたことを示している。検証サーバ100は、例えば、メタデータ203に含まれる撮影時刻までの累積降水量が多い(例えば所定の閾値を超える)ことから、撮影位置での土砂崩れの危険性があると判定し、投稿情報200の信頼度として比較的高い値を算出する。
【0051】
検証サーバ100は、以上のようにして算出された3種類の信頼度を統合することで(例えば平均化することで)、投稿情報200に関する最終的な信頼度を算出することができる。
【0052】
図6は、検証サーバが備える処理機能の構成例を示す図である。検証サーバ100は、記憶部110、事象情報収集部121、投稿情報収集部122、影響範囲推定部123、信頼度算出部124および検証結果出力部125を備える。
【0053】
記憶部110は、RAM102やHDD103など、検証サーバ100が備える記憶装置に確保された記憶領域である。記憶部110には、発生事象テーブル111、事象分類テーブル112および検証結果テーブル113が記憶される。
【0054】
発生事象テーブル111には、発生した事象(発生事象)に関する情報が登録される。発生事象テーブル111に登録される情報は、情報源サーバ60a,60b,・・・など、あらかじめ決められた信頼性の高い情報源から収集された情報である。
【0055】
事象分類テーブル112には、原因事象と結果事象との関係を示す情報が登録される。原因事象は、結果事象を引き起こす原因になり得る事象であり、結果事象は、原因事象の発生によって引き起こされ得る事象である。また、事象分類テーブル112には、結果事象の影響範囲を推定するための計測値の種類を示す情報や、影響範囲を推定するために参照される情報の参照先を示す情報も登録される。
【0056】
検証結果テーブル113は、投稿情報の検証結果を示す情報が登録される。検証結果テーブル113には、例えば、投稿情報を識別する識別番号と、投稿情報の信頼度とが対応付けて登録される。
【0057】
事象情報収集部121、投稿情報収集部122、影響範囲推定部123、信頼度算出部124および検証結果出力部125の処理は、例えば、プロセッサ101が所定のプログラムを実行することで実現される。
【0058】
事象情報収集部121は、情報源サーバ60a,60b,・・・など、あらかじめ決められた信頼性の高い情報源から、発生事象に関する情報を収集し、発生事象情報として発生事象テーブル111に登録する。
【0059】
投稿情報収集部122は、SNSサーバ50に投稿された投稿情報をSNSサーバ50から取得する。
影響範囲推定部123は、投稿情報に含まれる投稿文を解析して事象に関する情報を抽出し、その事象に関連する発生事象を発生事象テーブル111に基づいて特定する。影響範囲推定部123は、特定された発生事象に対応する影響範囲情報や高信頼度情報を収集し、収集された情報と投稿情報のメタデータとに基づいて、発生事象の影響範囲を推定する。
【0060】
信頼度算出部124は、投稿情報内の画像のメタデータと、推定された影響範囲とに基づいて、第1信頼度を算出する。また、信頼度算出部124は、画像の撮影位置と投稿情報自体の投稿位置との距離に基づいて、第2信頼度を算出する。さらに、信頼度算出部124は、画像の撮影時刻と投稿情報自体の投稿時刻との差に基づいて、第3信頼度を算出する。そして、信頼度算出部124は、第1~第3信頼度を統合することで総合信頼度を算出する。
【0061】
検証結果出力部125は、算出された総合信頼度を出力する。例えば、検証結果出力部125は、総合信頼度とともに第1~第3信頼度も併記した信頼性表示画面を作成し、ユーザの端末に表示させる。信頼性表示画面は、SNSサーバ50による投稿画面上に、検証対象の投稿情報とともに表示されてもよい。
【0062】
図7は、発生事象テーブルのデータ構成例を示す図である。発生事象テーブル111には、事象情報収集部121によって収集された、発生事象に関する情報が蓄積される。発生事象テーブル111には、発生事象に関する情報として、発生事象ID、発生事象名、発生事象分類名および発生/終了時刻が登録される。
【0063】
発生事象IDは、発生事象を識別するための識別情報である。発生事象名は、発生事象の名称を示す。この発生事象名としては、例えば、公的機関が発生事象に命名した名称が登録される。発生事象分類名は、結果事象を分類する結果事象分類名のうち、発生事象が該当する分類名が登録される。発生/終了時刻は、発生事象の発生時刻および終了時刻を示す。
図7では、発生時刻として2022年7月25日2時00分が登録されているが、終了時刻は登録されていない。これは、発生事象が未だ終了していないことを示す。
【0064】
図8は、事象分類テーブルのデータ構成例を示す図である。事象分類テーブル112には、原因事象を分類する原因事象分類名と、結果事象を分類する結果事象分類名との対抗関係を示す情報が登録される。例えば
図8では、「台風」という原因事象分類名に対して、「洪水」「土砂崩れ」「浸水」という結果事象分類名が対応付けられている。これは、台風という原因事象によって洪水、土砂崩れ、浸水という結果事象が引き起こされ得ることを示す。
【0065】
なお、他の原因事象としては、例えば、地震、大規模な事故などが考えられる。地震に対応する結果事象としては、津波、土砂崩れなどが考えられる。大規模な事故に対応する結果事象としては、停電、有害物の到達などが考えらえる。
【0066】
事象分類テーブル112には、原因事象分類名と結果事象分類名との組み合わせに対して、さらに、影響因子および影響範囲基準情報が対応付けて登録される。影響因子および影響範囲基準情報は、影響範囲を推定するための情報(影響範囲情報)である。影響因子は、結果事象の影響範囲を推定するために参照される計測値の種類を示す。影響範囲基準情報は、影響範囲を推定するために参照される基準情報である。例えば、影響因子が示す計測値と影響範囲基準情報とから、結果事象による影響範囲が特定される。なお、影響範囲情報の項目には、実際には、あらかじめ決められた、影響範囲基準情報の参照先(取得元)を示すリンク情報も登録される。
【0067】
次に、検証サーバ100の各部の処理について説明する。
図9は、発生事象情報収集処理の例を示すフローチャートである。
[ステップS11]事象情報収集部121は、あらかじめ決められた情報源をスキャンして、それらの情報源から、新たな発生事象を示す発生事象情報や、発生済み事象の発生事象情報の更新情報を取得する。なお、このステップS11では、例えば、日本の全体で発生した事象の情報が取得されればよい。
【0068】
[ステップS12]事象情報収集部121は、新たな発生事象を示す発生事象情報を発生事象テーブル111に登録する。また、事象情報収集部121は、発生済み事象の発生事象情報の更新情報(例えば、発生事象の終了時刻)を受信すると、発生事象テーブル111内の該当する発生事象情報に対して更新情報を反映させる。
【0069】
[ステップS13]ステップS11の処理の実行から一定時間が経過したかを判定する。一定時間が経過していない場合、一定時間が経過するまで待ち状態となる。また、一定時間が経過すると、処理がステップS111に戻り、発生事象情報の取得処理が実行される。
【0070】
図10は、投稿情報取得処理の例を示すフローチャートである。
[ステップS21]投稿情報収集部122は、投稿サーバ50に投稿された投稿情報を投稿サーバ50から取得する。
【0071】
[ステップS22]投稿情報収集部122は、取得した投稿情報に含まれる画像の正当性を検証する。検証により画像の正当性があると判定された場合、処理がステップS23に進められ、画像の正当性がないと判定された場合、処理が終了される。後者の場合、例えば、検証結果出力部125により、総合信頼度として0点が出力される。また、画像が不正であることを示す情報が投稿情報とともに表示されてもよい。
【0072】
このステップS22での検証処理では、投稿情報収集部122は例えば、投稿情報に含まれる画像が、アニメーションやイラストのように人口的に作成または加工されたものでなく、実世界を撮影した写真または動画像であるかを検証する。例えば、人工的に作成または加工された画像と実世界を撮影した写真とを用いた機械学習により、前者の画像と後者の写真とを判別する判別器があらかじめ作成される。ステップS22において、投稿情報収集部122は、作成された判別器に投稿情報内の画像を入力することで、その画像が実世界を撮影した写真であるか否かを検証する。
【0073】
また、投稿情報内の画像にメタデータが付加されている場合、投稿情報収集部122は、メタデータに含まれる画像の撮影位置や撮影時刻が正当な情報であるかを検証する。この検証は、例えば、市販の画像編集ソフトウェアが備えている画像の作者証明機能を用いて行われてもよい。あるいは、次のような方法が採用されてもよい。画像の所定領域に埋め込まれたパラメータを基に算出された第1ハッシュ値と、ハッシュ値を生成するためのスクリプトを基に算出された第2ハッシュ値と、スクリプトとがメタデータ内に記録される。そして、ステップS22において、投稿情報収集部122は、メタデータ内のスクリプトを基に第3ハッシュ値を算出し、メタデータ内のスクリプトを基に第4ハッシュ値を算出する。投稿情報収集部122は、メタデータ内の第1、第2ハッシュ値と算出された第3、第4ハッシュ値とを比較することで、画像が改ざんされていないかを判定する。
【0074】
[ステップS23]投稿情報収集部122は、投稿情報内の画像に、メタデータとして撮影位置および撮影時刻が付加されているかを判定する。該当するメタデータが付加されている場合、処理がステップS25に進められ、該当するメタデータが付加されていない場合、処理がステップS24に進められる。
【0075】
[ステップS24]投稿情報収集部122は、例えば、投稿情報内の画像を解析することで、画像の撮影位置および撮影時刻のうち、メタデータとして付加されていない情報を作成する。一例として、投稿情報収集部122は、投稿情報内の画像を、衛星画像や航空画像など、あらかじめ上空から撮影された画像と照合することで、投稿情報内の画像の撮影位置を推定し、メタデータとして画像に付加する。また、投稿情報収集部122は、メタデータに含まれる撮影位置、または上記手順で推定された撮影位置における太陽光の入り方や影の付き方を基に、画像の撮影時刻を推定し、メタデータとして画像に付加する。また、投稿情報収集部122は、投稿文の形態素解析を行い、固有名詞や位置を表す表現、時刻を表す表現を抽出し、前者を撮影位置、後者を撮影時刻とみなしてもよい。
【0076】
[ステップS25]投稿情報収集部122は、取得した投稿情報を記憶部110に一時的に記憶させる。
図11は、影響範囲推定処理の例を示すフローチャートである。また、
図12は、影響範囲の具体的な推定処理例を示す図である。
【0077】
[ステップS31]影響範囲推定部123は、投稿情報に含まれる投稿文を解析することで、投稿情報と関連する原因事象分類名、結果事象分類名および発生事象名を特定する。
【0078】
例えば、影響範囲推定部123は、投稿文の形態素解析を行うことで投稿文から名詞を抽出する。影響範囲推定部123は、抽出された名詞が発生事象テーブル111に登録された発生事象名と一致する場合には、その発生事象名を投稿情報と関連する発生事象名として特定する。この場合、影響範囲推定部123は、特定された発生事象名に対応付けられた発生事象分類名を発生事象テーブル111から抽出し、抽出された発生事象分類名を投稿情報と関連する原因事象分類名として特定する。また、影響範囲推定部123は、特定された原因事象分類名に対応付けられた結果事象分類名を事象分類テーブル112から抽出し、抽出された結果事象分類名のいずれかが投稿文から抽出された単語と一致するかを判定する。影響範囲推定部123は、抽出された結果事象分類名のいずれかが、投稿文から抽出された単語と一致した場合に、当該結果事象分類名を投稿情報に関連する結果事象分類名として特定する。また、抽出された結果事象分類名のいずれも投稿文から抽出された単語と一致しなかった場合、影響範囲推定部123は、抽出された結果事業分類名と意味が近い名詞を投稿文から探索し、探索できた場合に対応する結果事業分類名を投稿情報に対応する結果事業分類名として特定する。なお、名詞の意味の近さは、例えば、単語の分散表現であるword2vecなどの手法によって判定されればよい。
【0079】
一方、投稿文から抽出された名詞が発生事象名として発生事象テーブル111に登録されていない場合には、次のような処理が実行される。影響範囲推定部123は、投稿文から抽出された名詞の中に、事象分類テーブル112に登録された原因事象分類名または結果事象分類名と一致する名詞があるかを判定する。影響範囲推定部123は、抽出された名詞の中に結果事象分類名と一致する名詞がある場合、その結果事象分類名を投稿情報と関連する結果事象分類名として特定する。これとともに、影響範囲推定部123は、事象分類テーブル112において当該結果事象分類名に対応付けられた原因事象分類名を、投稿情報と関連する原因事象分類名として特定する。一方、影響範囲推定部123は、投稿文から抽出された名詞の中に原因事象分類名と一致する名詞がある場合、その原因事象分類名を投稿情報と関連する原因事象分類名として特定する。この場合、影響範囲推定部123は、投稿情報と関連する結果事象分類名については、前述の方法によって特定する。
【0080】
なお、投稿文から抽出された名詞が原因事象分類名および結果事象分類名のいずれにも一致しなかった場合には、例えば、抽出された名詞の中に、原因事象分類名または結果事象分類名と意味が近い名詞が存在するかによって、原因事象分類名および結果事象分類名が特定されればよい。
【0081】
影響範囲推定部123は、このようにして投稿情報に関連する原因事象分類名が特定されると、特定された原因事象分類名が発生事象分類名として登録されている発生事象情報を、発生事象テーブル111から抽出する。影響範囲推定部123は、該当する発生事象情報が1つ抽出された場合、その発生事象情報に含まれる発生事象名を投稿情報に関連する発生事象名として特定する。また、影響範囲推定部123は、該当する発生事象情報が複数抽出された場合、それらの発生事象情報の中から、発生事象名または発生事象分類名と関連する名詞が、投稿文から抽出された名詞と一致するものを特定し、特定された発生事象情報に含まれる発生事象名を投稿情報に関連する発生事象名として特定する。
【0082】
図12の例では、投稿文231、画像232、画像232のメタデータ233および投稿情報230のメタデータ234を含む投稿情報230が取得されたとする。ステップS31では、投稿文231から名詞として「洪水」「家」が抽出され、これらのうち「洪水」が結果事象分類名「洪水」と一致するので、投稿情報230に関連する結果事象分類名として「洪水」が特定される。また、事象分類テーブル112において結果事象分類名「洪水」に対して原因事象分類名「台風」が対応付けられているので(
図8参照)、投稿情報230に関連する原因事象分類名として「台風」が特定される。そして、発生事象テーブル111から、発生事象分類名として「台風」が登録されている発生事象情報が抽出され、抽出された発生事象情報に含まれる発生事象名「台風1号」が、投稿情報230に関連する発生事象名として特定される(
図7参照)。
【0083】
なお、例えば、発生事象分類名として「台風」が登録された発生事象情報が発生事象テーブル111に複数登録されている場合、影響範囲推定部123は、発生事象情報に含まれる発生時刻と、メタデータ233に含まれる撮影時刻との関係を基にいずれかの発生事象情報を特定する。例えば、発生時刻が撮影時刻を起点として一定時間前の時刻まで期間に含まれるような発生事象情報が特定される。
【0084】
[ステップS32]影響範囲推定部123は、ステップS31で特定された結果事象分類名に対応する影響範囲基準情報を収集する。ここでは、事象分類テーブル112において、ステップS31で特定された原因事象分類名および結果事象分類名の組み合わせに対応付けて登録された、影響範囲基準情報のリンク情報に基づいて、影響範囲基準情報の情報源が特定される。影響範囲基準情報としては、例えば、公的機関から公式に発信されている被害予測情報が収集される。
【0085】
図12の例では、投稿情報230に対応する原因事象分類名および結果事象分類名としてそれぞれ「台風」「洪水」が特定されている。このため、事象分類テーブル112に基づき、影響範囲基準情報として洪水ハザードマップが収集される(
図8参照)。
【0086】
[ステップS33]影響範囲推定部123は、投稿文を解析し、投稿文の時制が現在形か過去形かを特定する。
[ステップS34]影響範囲推定部123は、特定された時制に基づいて、影響範囲を推定する時刻および位置を決定する。時制が過去形の場合、画像の撮影位置および撮影時刻における影響範囲が推定される。これは、時制が過去形の場合、投稿情報の投稿時刻より前の時点での情報(主に、画像が撮影された時点での情報)が投稿文に表されていると考えられるからである。一方、時制が現在形の場合、投稿情報の投稿位置および投稿時刻における影響範囲が特定される。これは、時制が現在形の場合、投稿情報の投稿時点での情報が投稿文に表されていると考えられるからである。このように、投稿文の時制に応じて影響範囲を推定する時刻および位置を決定することで、次のステップS35において影響範囲を正確に推定できるようになる。
【0087】
図12の例では、投稿文231の時制は現在形となっている。このため、影響範囲を推定する時刻として、投稿情報230のメタデータ234に含まれる投稿時刻「2022年9月10日15時00分」が決定される。また、図示しないが、影響範囲を推定する位置として、メタデータ234に含まれる投稿位置が決定される。
【0088】
なお、投稿情報230のメタデータ234は、投稿情報230に付加されているとは限らない。メタデータ234が投稿情報230に付加されていない場合、影響範囲推定部123は、メタデータ234を投稿情報230とは別にSNSサーバ50から取得する。
【0089】
[ステップS35]影響範囲推定部123は、高信頼情報を収集する。ここでは、ステップS34で特定された位置および時刻における影響因子の計測値が、高信頼情報として収集される。収集される影響因子は、事象分類テーブル112においてステップS31で特定された結果事象分類名に対応付けられた影響因子となる。また、影響因子の情報源となるリンク先は、公的機関や気象情報の提供サービスを提供する企業のWebサイトなど、信頼性の高いリンク先となる。このようなリンク先は、対応する影響範囲基準情報に対してあらかじめ決められていればよい。
【0090】
影響範囲推定部123は、収集された影響因子の計測値と、ステップS32で収集された影響範囲基準情報とに基づき、ステップS34で特定された時刻における影響範囲を推定する。
【0091】
図12の例では、前述のように、影響範囲基準情報として洪水ハザードマップが収集されている。この洪水ハザードマップは、例えば、24時間の累積降水量が200mm、300mm、400mmのそれぞれの場合の浸水想定区域を示しているとする。この場合、ステップS35では、影響因子として、投稿位置(実際には、投稿位置に最も近い観測点)における、投稿時刻までの直近24時間の累積降水量の計測値が収集される。
図12では、累積降水量の計測値が450mmであったとする。この場合、影響範囲推定部123は、洪水ハザードマップから累積降水量が400mmの場合の浸水想定区域を特定し、この区域を影響範囲として推定する。
【0092】
なお、例えば、累積降水量の計測値が、洪水ハザードマップにおいて浸水が発生すると想定されている最小累積降水量(
図12では200mm)より小さい場合、影響範囲推定部123は「影響範囲なし」(すなわち、台風1号に伴う該当位置での洪水は発生しない)と推定する。
【0093】
図13は、信頼度算出処理の例を示すフローチャートである。なお、以下の説明では、第1~第3信頼度は、0点から100点までの値をとるものとする。
[ステップS41]信頼度算出部124は、
図11のステップS35で推定された影響範囲と、画像のメタデータに含まれる撮影位置との差に基づいて、第1信頼度を算出する。基本的に、信頼度算出部124は、影響範囲と撮影位置との差が小さいほど第1信頼度を高く算出する。
【0094】
一例として、信頼度算出部124は、撮影位置が影響範囲に含まれる場合、第1信頼度を100点と算出する。そして、信頼度算出部124は、撮影位置が影響範囲外にある場合、撮影位置と、撮影位置と最も近い影響範囲の境界との距離が大きくなるほど、第1信頼度を低く算出する。
【0095】
また、他の例として、信頼度算出部124は、洪水の水源となる河川と撮影位置との差に基づいて第1信頼度を算出してもよい。この河川としては、例えば、影響範囲に接するか影響範囲に包含され、かつ、撮影位置との距離が最も大きい河川が選択される。信頼度算出部124は、例えば、撮影位置が影響範囲に含まれる場合、100点から70点までの範囲で、撮影位置と河川との距離が近いほど第1信頼度を高く算出する。
【0096】
一例として、撮影位置を通って河川と直交する直線を引いた場合に、その直線における河川の位置から影響範囲の境界までが30等分される。そして、撮影位置が、河川の位置から撮影位置の境界側に1/30ずつ移動するごとに、第1信頼度は100点から1点ずつ減算される。例えば、撮影位置が影響範囲の境界に位置し、上記直線上で河川から最も離れている場合、第1信頼度は70点となる。
【0097】
また、信頼度算出部124は、撮影位置が影響範囲外にある場合、70点を最大値とし、0点を最小値として、撮影位置と河川との距離が0.1km離れるほど第1信頼度を1点ずつ低下させる。なお、信頼度算出部124は、降水量が少ないために影響範囲がないと推定された場合には、撮影位置と河川との距離が同じ場合に、影響範囲がある場合よりない場合の方が第1信頼度が低い値になるようにする。
【0098】
なお、ステップS41では、例えば、
図11のステップS34で投稿文の時制が過去形であった場合、撮影位置が用いられ、ステップS34で投稿文の時制が現在形であった場合、撮影位置の代わりに投稿情報の投稿位置が用いられてもよい。これにより、第1信頼度自体の算出精度を高めることができる。
【0099】
[ステップS42]信頼度算出部124は、画像のメタデータに含まれる撮影位置と、投稿情報の投稿位置との距離に基づいて、第2信頼度を算出する。基本的に、撮影位置と投稿位置との距離が小さいほど、第2信頼度は高い値となる。
【0100】
例えば、信頼度算出部124は、撮影位置と投稿位置との距離が5km以内であれば、100点から70点までの範囲で距離が小さいほど第2信頼度を高く算出する。また、撮影位置と投稿位置との距離が5km以上である場合、70点から0点までの範囲で、距離が0.1km大きくなるほど第2信頼度を1点ずつ減点する。一例として、撮影位置と投稿位置との距離が2kmの場合、第2信頼度は88点と算出される。このような第2信頼度は、投稿情報(または投稿文)の当事者性を示す指標となる。
【0101】
[ステップS43]信頼度算出部124は、画像のメタデータに含まれる撮影時刻と、投稿情報の投稿時刻との差に基づいて、第3信頼度を算出する。基本的に、信頼度算出部124は、撮影時刻と投稿時刻との差が大きいほど、第3信頼度は低い値となる。
【0102】
具体的な例としては、信頼度算出部124は、撮影位置に対して原因事象の影響が生じ始めた時刻を、原因事象の開始時刻とする。
図12のように原因事象が台風の場合、原因事象の開始時刻は、例えば、撮影位置が暴風雨域に入った時刻とされる。暴風雨域に入った時刻は、例えば、高信頼情報によって取得される。信頼度算出部124は、このような原因事象の開始時刻を考慮して、撮影時刻と投影時刻との差に基づいて第3信頼度を算出する。
【0103】
例えば、投稿文の時制が過去形の場合、信頼度算出部124は、投稿時刻と撮影時刻との差が6時間以内であれば、第3信頼度を50点から100点までの範囲で、時刻差が小さいほど高く算出する。一方、時刻差が6時間を超える場合、信頼度算出部124は、50点から0点までの範囲で、時刻差が1時間大きくなるほど第3信頼度を10点ずつ減点する。
【0104】
また、投稿文の時制が現在形または未来形の場合、信頼度算出部124は、投稿時刻と撮影時刻との差が3時間以内であれば、第3信頼度を50点から100点までの範囲で、時刻差が小さいほど高く算出する。一方、時刻差が3時間を超える場合、信頼度算出部124は、50点から0点までの範囲で、時刻差が1時間大きくなるほど第3信頼度を10点ずつ減点する。
【0105】
また、撮影時刻が原因事象の開始時刻より前の場合、撮影時刻に矛盾があり、原因事象と関係ない写真が使用されている可能性が高いことから、第3信頼度は低い値となる。例えば、撮影時刻が原因事象の開始時刻より前の場合、信頼度算出部124は、第3信頼度を0点とする。
【0106】
一例として、
図12に示した投稿情報230では、撮影時刻が2022年9月10日14時30分であり、投稿時刻が2022年9月10日15時00分である。原因事象の開始時刻が2022年9月10日9時00分であったとすると、この開始時刻は撮影時刻より前であり、投稿文231の時制は現在形であるので、投稿時刻と撮影時刻との差が3時間以内である場合の計算方法が適用される。撮影時刻14時30分と投稿時刻15時00分との差は30分(=0.5時間)であることから、100-(50/3)×0.5という式により第3信頼度は92点と算出される。
【0107】
[ステップS44]信頼度算出部124は、算出された第1~第3信頼度を統合することで総合信頼度を算出する。例えば、第1~第3信頼度の平均を演算することで総合信頼度が算出される。上記の例のように、第1信頼度が70点、第2信頼度が88点、第3信頼度が92点の場合、総合信頼度は83点(小数点以下第1位を四捨五入)と算出される。
【0108】
図14は、投稿情報の他の例を示す図である。
図14に示す投稿情報240は、投稿文241、画像242、画像242のメタデータ243および投稿情報240のメタデータ244を含む。メタデータ244の投稿位置および投稿時刻は、
図12に示した投稿情報230と同じであるとする。
【0109】
この投稿情報240の場合、影響範囲としては、
図12に示した投稿情報230と同様の影響範囲(浸水想定区域)が特定される。しかし、第1信頼度は、画像242の撮影位置がインドネシアであり、撮影位置は日本国内に設定された影響範囲に含まれておらず、影響範囲から4000kmを超える距離だけ離れていることから、第1信頼度は0点と算出される。
【0110】
また、撮影位置と投稿位置とが4000kmを超える距離だけ離れていることから、第2信頼度も0点と算出される。さらに、上記の例と同様に原因事象の開始時刻が2022年9月10日9時00分であったとすると、メタデータ243に含まれる撮影時刻は原因事象の開始時刻より前であるので、第3信頼度も0点と算出される。
【0111】
したがって、総合信頼度は0点と算出される。
図15は、検証結果の出力処理例を示す第1の図である。
図15に示す信頼性表示画面250aは、
図12に示した投稿情報230に基づく表示画面である。また、
図16は、検証結果の出力処理例を示す第2の図である。
図16に示す信頼性表示画面250bは、
図14に示した投稿情報240に基づく表示画面である。
【0112】
検証結果出力部125は、検証結果を示す画面として、
図15、
図16に示すような信頼性表示画面250a,250bをユーザの端末装置に表示させる。これらの信頼性表示画面250a,250bは、例えば、検証対象の投稿情報がSNSサイトの画面に表示された際に、投稿情報に対応する画面として表示されることが望ましい。これにより、投稿情報を閲覧しようとしたユーザが、この投稿情報の信頼性の検証結果を簡単に認識することが可能になる。
【0113】
信頼性表示画面250a,250bは、第1信頼度の表示部251、第2信頼度の表示部252、第3信頼度の表示部253、総合信頼度の表示部254および信頼度ラベルの表示部255を含む。これらの信頼性表示画面250a,250bでは、総合信頼度だけでなく第1~第3信頼度の算出値も表示されるので、信頼度算出の根拠もユーザに提示できる。
【0114】
また、表示部255に表示される信頼度ラベルは、例えば、総合信頼度を三段階の範囲に分割し、70点以上の場合に「高」、50点以上70点未満の場合に「中」、50点未満の場合に「低」と表示するものである。このような信頼度ラベルを表示することで、信頼度をユーザにわかりやすく提示できる。
【0115】
さらに、
図16の信頼性表示画面250bでは、総合信頼度が「低」となっている。このように総合信頼度が「低」の場合には、総合信頼度が低くなった理由を示す表示部256が表示されてもよい。
【0116】
以上説明した第2の実施の形態では、投稿情報に関連する事象の影響範囲を考慮して第1信頼度が算出されるので、災害など、事象の影響が広範囲に及ぶ場合でも、投稿情報の信頼度を高精度に算出できる。また、第1信頼度だけでなく、投稿情報の当事者性を示す第2信頼度や、撮影時刻と投稿時刻との矛盾のなさを示す第3信頼度も考慮して最終的な信頼度が算出されるので、信頼度の算出精度を高めることが可能となる。
【0117】
なお、上記の各実施の形態に示した装置(例えば、情報処理装置1、SNSサーバ50、検証サーバ100、情報源サーバ60a,60b,・・・)の処理機能は、コンピュータによって実現することができる。その場合、各装置が有すべき機能の処理内容を記述したプログラムが提供され、そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、光ディスク、半導体メモリなどがある。磁気記憶装置には、ハードディスク装置(HDD)、磁気テープなどがある。光ディスクには、CD(Compact Disc)、DVD(Digital Versatile Disc)、ブルーレイディスク(Blu-ray Disc:BD、登録商標)などがある。
【0118】
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD、CDなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
【0119】
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムまたはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムにしたがった処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムにしたがった処理を実行することもできる。また、コンピュータは、ネットワークを介して接続されたサーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムにしたがった処理を実行することもできる。
【符号の説明】
【0120】
1 情報処理装置
2 処理部
10 投稿情報
11 投稿文
12 画像情報
13 メタデータ
20 影響範囲情報
21 ハザードマップ
22 降水量計測値
30 影響範囲