(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6496952
(24)【登録日】2019年3月22日
(45)【発行日】2019年4月10日
(54)【発明の名称】データ処理装置、データ処理システム、データ処理方法及びプログラム
(51)【国際特許分類】
G06F 16/00 20190101AFI20190401BHJP
G06F 16/30 20190101ALI20190401BHJP
G06Q 50/00 20120101ALI20190401BHJP
【FI】
G06F17/30 220B
G06F17/30 170A
G06F17/30 210A
G06Q50/00 300
【請求項の数】15
【全頁数】17
(21)【出願番号】特願2017-90831(P2017-90831)
(22)【出願日】2017年4月28日
(65)【公開番号】特開2018-190113(P2018-190113A)
(43)【公開日】2018年11月29日
【審査請求日】2018年9月7日
【早期審査対象出願】
(73)【特許権者】
【識別番号】516083461
【氏名又は名称】株式会社Spectee
(74)【代理人】
【識別番号】100173646
【弁理士】
【氏名又は名称】大森 桂子
(72)【発明者】
【氏名】岩井 清彦
【審査官】
齊藤 貴孝
(56)【参考文献】
【文献】
特開2016−224487(JP,A)
【文献】
特開2012−150684(JP,A)
【文献】
特開2013−138278(JP,A)
【文献】
米国特許出願公開第2015/0169142(US,A1)
【文献】
米国特許出願公開第2016/0034426(US,A1)
【文献】
米国特許出願公開第2015/0012449(US,A1)
【文献】
河野 慎、外2名,深層学習によるマイクロブログの稿位置推定手法の検討,情報処理学会 研究報告 ユビキタスコンピューティングシステム(UBI),日本,情報処理学会,2016年 6月 3日,p.1−6
【文献】
鈴木 有、外3名,過去の投稿を活用したマイクロブログユーザの現在位置推定,第7回データ工学と情報マネジメントに関するフォーラム (第13回日本データベース学会年次大会),日本,電子情報通信学会データ工学研究専門委員会 日本データベース学会 情報処理学会データベースシステム研究会,2015年 8月18日,p.1−8
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00−16/958
G06Q 10/00−99/00
(57)【特許請求の範囲】
【請求項1】
インターネットを介して収集した任意の事象に関する画像が付帯された投稿データを処理するデータ処理装置であって、
前記投稿データの投稿者情報から地名を抽出する投稿者情報解析部と、
前記投稿者情報解析部と同時並行で、前記投稿データの投稿者による過去の投稿データから地名を抽出する過去投稿解析部と、
前記投稿者情報解析部及び前記過去投稿解析部と同時並行で、前記投稿データに付帯された画像から地名に関する文字情報を抽出する画像解析部と、
前記投稿者情報解析部、前記過去投稿解析部及び前記画像解析部での解析結果を比較し、前記投稿者情報解析部で抽出された地名と前記過去投稿解析部で抽出された地名が同じ場合又は前記投稿者情報解析部と前記過去投稿解析部のいずれか一方でしか地名が抽出されなかった場合は当該地名から前記事象の発生位置を特定し、前記投稿者情報解析部で抽出された地名と前記過去投稿解析部で抽出された地名が異なる場合は前記投稿者情報解析部で抽出された地名から前記事象の発生位置を特定し、前記投稿者情報解析部及び前記過去投稿解析部での解析結果から前記事象の発生位置を特定できなかった場合は前記画像解析部で抽出された地名から前記事象の発生位置を特定する発生位置特定部と
を有する請求項1に記載のデータ処理装置。
【請求項2】
前記投稿者情報解析部は、前記投稿者情報に複数の地名が含まれていた場合は、最新の情報を優先的に選択し、時間的推移から優先度が確定できない場合はより大きなくくりを採用する請求項1に記載のデータ処理装置。
【請求項3】
前記過去投稿解析部は、前記過去の投稿データに複数の地名が含まれていた場合は、特定対象の事象に関する投稿に時間的に近いものを優先的に採用する請求項1又は2に記載のデータ処理装置。
【請求項4】
前記投稿データの投稿者をフォローしているユーザーのプロフィール情報から地名を抽出するフォロワー情報解析部と、
前記投稿データの投稿者がフォローしているユーザーのプロフィール情報から地名を抽出するフォローユーザー情報解析部と
を更に有し、
前記発生位置特定部は、前記画像解析部での解析結果から前記事象の発生位置を特定できなかった場合に、前記フォロワー情報解析部及び/又は前記フォローユーザー情報解析部での解析結果を利用して前記事象の発生位置を特定する請求項1〜3のいずれか1項に記載のデータ処理装置。
【請求項5】
前記投稿データの投稿者をフォローしているユーザーの投稿データから地名を抽出するフォロワー投稿解析部と、
前記投稿データの投稿者がフォローしているユーザーの投稿データから地名を抽出するフォローユーザー投稿解析部と
を更に有し、
前記発生位置特定部は、前記フォロワー情報解析部及び前記フォローユーザー情報解析部での解析結果から前記事象の発生位置を特定できなかった場合に、前記フォロワー投稿解析部及び/又は前記フォローユーザー投稿解析部での解析結果を利用して前記事象の発生位置を特定する請求項4に記載のデータ処理装置。
【請求項6】
前記投稿データに含まれるテキストから地名を抽出するテキスト解析部と、
前記投稿データから投稿位置情報を抽出する位置情報解析部と
を有し、
前記発生位置特定部は、前記テキスト解析部及び前記位置情報解析部での解析結果から前記事象の発生位置を特定できなかった場合に、前記投稿者情報解析部及び/又は前記過去投稿解析部での解析結果を利用して前記事象の発生位置を特定する請求項1〜5のいずれか1項に記載のデータ処理装置。
【請求項7】
請求項1〜6のいずれか1項に記載のデータ処理装置と、
インターネットを介して任意の事象に関する画像が付帯された投稿データを収集するデータ収集装置と
を有し、
前記データ収集装置で収集した投稿データ又は投稿データ群を、前記データ処理装置で処理し、前記事象の発生位置を特定するデータ処理システム。
【請求項8】
前記データ処理装置で特定された発生位置情報を付加して、前記事象に関する投稿情報を外部配信する配信装置を有する請求項7に記載のデータ処理システム。
【請求項9】
1又は複数のデータ処理装置を用いて、インターネットを介して収集した任意の事象に関する画像が付帯された投稿データを処理する方法であって、
前記データ処理装置により、
前記投稿データの投稿者情報から地名を抽出する投稿者情報解析工程と、
前記投稿者情報解析工程と同時並行で、前記投稿データの投稿者による過去の投稿データから地名を抽出する過去投稿解析工程と、
前記投稿者情報解析工程及び前記過去投稿解析工程と同時並行で、前記投稿データに付帯された画像から地名に関する文字情報を抽出する画像解析工程と、
前記投稿者情報解析工程、前記過去投稿解析工程及び前記画像解析工程での解析結果を比較し、前記投稿者情報解析工程で抽出された地名と前記過去投稿解析工程で抽出された地名が同じ場合又は前記投稿者情報解析工程と前記過去投稿解析工程のいずれか一方でしか地名が抽出されなかった場合は当該地名から前記事象の発生位置を特定し、前記投稿者情報解析工程で抽出された地名と前記過去投稿解析工程で抽出された地名が異なる場合は前記投稿者情報解析工程で抽出された地名から前記事象の発生位置を特定し、前記投稿者情報解析工程及び前記過去投稿解析工程での解析結果から前記事象の発生位置を特定できなかった場合は前記画像解析工程で抽出された地名から前記事象の発生位置を特定する発生位置特定工程と
を行うデータ処理方法。
【請求項10】
前記投稿者情報解析工程では、前記投稿者情報に複数の地名が含まれていた場合は、最新の情報を優先的に選択し、時間的推移から優先度が確定できない場合はより大きなくくりを採用する請求項9に記載のデータ処理方法。
【請求項11】
前記過去投稿解析工程では、前記過去の投稿データに複数の地名が含まれていた場合は、特定対象の事象に関する投稿に時間的に近いものを優先的に採用する請求項9又は10に記載のデータ処理装置。
【請求項12】
前記画像解析工程の解析結果から前記事象の発生位置を特定できなかった場合は、
更に、前記投稿データの投稿者をフォローしているユーザーのプロフィール情報から地名を抽出するフォロワー情報解析工程と、
前記投稿データの投稿者がフォローしているユーザーのプロフィール情報から地名を抽出するフォローユーザー情報解析工程と
を行い、
前記フォロワー情報解析工程及び/又は前記フォローユーザー情報解析工程の解析結果を利用して前記事象の発生位置を特定する請求項9〜11のいずれか1項に記載のデータ処理方法。
【請求項13】
前記フォロワー情報解析工程及び前記フォローユーザー情報解析工程の解析結果から前記事象の発生位置を特定できなかった場合は、
前記投稿データの投稿者をフォローしているユーザーの投稿データから地名を抽出するフォロワー投稿解析工程と、
前記投稿データの投稿者がフォローしているユーザーの投稿データから地名を抽出するフォローユーザー投稿解析工程と
を行い、
前記フォロワー投稿解析工程及び/又は前記フォローユーザー投稿解析工程の解析結果を利用して前記事象の発生位置を特定する請求項12に記載のデータ処理方法。
【請求項14】
前記投稿データに含まれるテキストから地名を抽出するテキスト解析工程と、
前記投稿データから投稿位置情報を抽出する位置情報解析工程と
を行い、
前記テキスト解析工程及び前記位置情報解析工程の解析結果から前記事象の発生位置を特定できなかった場合に、前記投稿者情報解析工程及び前記過去投稿解析工程を行う請求項9〜13のいずれか1項に記載のデータ処理方法。
【請求項15】
コンピュータに、インターネットを介して収集した任意の事象に関する画像が付帯された投稿データを処理させるプログラムであって、
前記投稿データの投稿者情報から地名を抽出する投稿者情報解析機能と、
前記投稿者情報解析機能と同時並行で、前記投稿データの投稿者による過去の投稿データから地名を抽出する過去投稿解析機能と、
前記投稿者情報解析機能及び前記過去投稿解析機能と同時並行で、前記投稿データに付帯された画像から地名に関する文字情報を抽出する画像解析機能と、
前記投稿者情報解析機能、前記過去投稿解析機能及び前記画像解析機能による解析結果を比較し、前記投稿者情報解析機能で抽出された地名と前記過去投稿解析機能で抽出された地名が同じ場合又は前記投稿者情報解析機能と前記過去投稿解析機能のいずれか一方でしか地名が抽出されなかった場合は当該地名から前記事象の発生位置を特定し、前記投稿者情報解析機能で抽出された地名と前記過去投稿解析機能で抽出された地名が異なる場合は前記投稿者情報解析機能で抽出された地名から前記事象の発生位置を特定し、前記投稿者情報解析機能及び前記過去投稿解析機能での解析結果から前記事象の発生位置を特定できなかった場合は前記画像解析機能で抽出された地名から前記事象の発生位置を特定する発生位置特定機能と
を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、インターネット上から収集した投稿データを処理するデータ処理装置、データ処理システム、データ処理方法及びプログラムに関する。より詳しくは、投稿データ及びそれに付随するデータから、特定の情報を抽出する技術に関する。
【背景技術】
【0002】
インターネット上には、日々、数多くの文章や画像が投稿されている。特に、ソーシャル・ネットワーキング・サービス(social networking service:SNS)は、手軽にコメントや写真を投稿できるため、事件、事故及び災害などに関する情報がリアルタイムで投稿されることがあり、投稿写真や投稿動画などがニュース・報道で利用され始めている。
【0003】
一方、SNSへの投稿は短文テキストであることが多いため、インターネット上から事件、事故及び災害などに関する投稿データを収集しても、その事象がどこで発生しているのかを特定することが難しいという問題がある。そこで、従来、インターネットから収集した投稿データについて、投稿位置や投稿内容に関係する場所を特定するための技術が提案されている(特許文献1〜4参照)。
【0004】
例えば、特許文献1には、SNSから収集した投稿コメントから、地名情報を含むコメントを抽出し、その中からニュースに含まれていた地名情報や放送局名などを含まないものをさらに抽出することで、テレビ放送や新聞記事などに由来するコメントを除き、地域情報の可読性を高めた情報抽出装置が開示されている。また、特許文献2には、基準地域とその周辺地域から発信された事件などに関する投稿データを収集し、収集された投稿データが多い地域を新たな基準地域として再度収集を行うことにより、事件現場に関する詳細情報を収集できるようにした検索装置が開示されている。
【0005】
特許文献3には、位置情報付きの投稿コメントを所定地域範囲毎に分類し、その中で最も多いトピック番号を地域固有トピック番号として抽出し、各地域範囲の地域固有トピック番号に基づいて収集した全ての投稿コメントを分類することにより、その地域で発生した突発的な投稿文のみを抽出する方法が開示されている。また、特許文献4には、位置情報付きコメントを所定範囲に含まれる地図経路毎に分類し、その中で最も多いトピック番号を地図経路トピック番号として抽出し、各地図経路の地図経路トピック番号に基づいて各投稿コメントを分類する方法が開示されている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2014−137632号公報
【特許文献2】特開2014−182525号公報
【特許文献3】特開2016−45938号公報
【特許文献4】特開2016−136358号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、前述した特許文献1〜4に記載の方法では、投稿位置などの判定に必要な情報が十分に得られず、投稿内容に関係する場所を特定することはできないことがある。特に、事件・事故・災害などに関する投稿データをニュース・報道で利用する場合は、その事象の発生位置を特定することが重要であり、限られた情報の中から、短時間で発生位置を特定可能な技術が求められている。
【0008】
そこで、本発明は、インターネットを介して収集した事件・事故・災害などに関する投稿データから、その事象の発生位置を特定可能なデータ処理装置、データ処理システム、データ処理方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
本発明に係るデータ処理装置は、インターネットを介して収集した任意の事象に関する
画像が付帯された投稿データを処理するデータ処理装置であって、前記投稿データの投稿者情報から地名を抽出する投稿者情報解析部と、
前記投稿者情報解析部と同時並行で、前記投稿データの投稿者による過去の投稿データから地名を抽出する過去投稿解析部と、
前記投稿者情報解析部及び前記過去投稿解析部と同時並行で、前記投稿データに付帯された画像から地名に関する文字情報を抽出する画像解析部と、前記投稿者情報解析部、前記過去投稿解析部及び前記画像解析部での解析結果を比較し、前記投稿者情報解析部で抽出された地名と前記過去投稿解析部で抽出された地名が同じ場合又は前記投稿者情報解析部と前記過去投稿解析部のいずれか一方でしか地名が抽出されなかった場合は当該地名から前記事象の発生位置を特定し、前記投稿者情報解析部で抽出された地名と前記過去投稿解析部で抽出された地名が異なる場合は前記投稿者情報解析部で抽出された地名から前記事象の発生位置を特定し、前記投稿者情報解析部及び前記過去投稿解析部での解析結果から前記事象の発生位置を特定できなかった場合は前記画像解析部で抽出された地名から前記事象の発生位置を特定する発生位置特定部
を有するものである。
前記投稿者情報解析部は、前記投稿者情報に複数の地名が含まれていた場合は、例えば最新の情報を優先的に選択し、時間的推移から優先度が確定できない場合はより大きなくくりを採用する。
また、前記過去投稿解析部は、前記過去の投稿データに複数の地名が含まれていた場合は、例えば特定対象の事象に関する投稿に時間的に近いものを優先的に採用する。
本発明のデータ処理装置は、前記投稿データの投稿者をフォローしているユーザーのプロフィール情報から地名を抽出するフォロワー情報解析部と、前記投稿データの投稿者がフォローしているユーザーのプロフィール情報から地名を抽出するフォローユーザー情報解析部とを更に有することもでき、その場合、前記発生位置特定部は、前記画像解析部での解析結果から前記事象の発生位置を特定できなかった場合に、前記フォロワー情報解析部及び/又は前記フォローユーザー情報解析部での解析結果を利用して前記事象の発生位置を特定する。
本発明のデータ処理装置は、前記投稿データの投稿者をフォローしているユーザーの投稿データから地名を抽出するフォロワー投稿解析部と、前記投稿データの投稿者がフォローしているユーザーの投稿データから地名を抽出するフォローユーザー投稿解析部とを更に有していてもよく、その場合、前記発生位置特定部は、前記フォロワー情報解析部及び前記フォローユーザー情報解析部での解析結果から前記事象の発生位置を特定できなかった場合に、前記フォロワー投稿解析部及び/又は前記フォローユーザー投稿解析部での解析結果を利用して前記事象の発生位置を特定する。
本発明のデータ処理装置は、前記投稿データに含まれるテキストから地名を抽出するテキスト解析部と、前記投稿データから投稿位置情報を抽出する位置情報解析部とを有し、前記発生位置特定部は、前記テキスト解析部及び前記位置情報解析部での解析結果から前記事象の発生位置を特定できなかった場合に、前記投稿者情報解析部及び/又は前記過去投稿解析部での解析結果を利用して前記事象の発生位置を特定することもできる。
【0010】
本発明に係るデータ処理システムは、前述したデータ処理装置と、インターネットを介して任意の事象に関する
画像が付帯された投稿データを収集するデータ収集装置とを有し、前記データ収集装置で収集した投稿データ又は投稿データ群を、前記データ処理装置で処理し、前記事象の発生位置を特定する。
このデータ処理システムでは、更に、前記データ処理装置で特定された発生位置情報を付加して、前記事象に関する投稿情報を外部配信する配信装置を有していてもよい。
【0011】
本発明に係るデータ処理方法は、1又は複数のデータ処理装置を用いて、インターネットを介して収集した任意の事象に関する
画像が付帯された投稿データを処理する方法であって、前記データ処理装置により、前記投稿データの投稿者情報から地名を抽出する投稿者情報解析工程と、
前記投稿者情報解析工程と同時並行で、前記投稿データの投稿者による過去の投稿データから地名を抽出する過去投稿解析工程と、
前記投稿者情報解析工程及び前記過去投稿解析工程と同時並行で、前記投稿データに付帯された画像から地名に関する文字情報を抽出する画像解析工程と、前記投稿者情報解析工程、前記過去投稿解析工程及び前記画像解析工程での解析結果を比較し、前記投稿者情報解析工程で抽出された地名と前記過去投稿解析工程で抽出された地名が同じ場合又は前記投稿者情報解析工程と前記過去投稿解析工程のいずれか一方でしか地名が抽出されなかった場合は当該地名から前記事象の発生位置を特定し、前記投稿者情報解析工程で抽出された地名と前記過去投稿解析工程で抽出された地名が異なる場合は前記投稿者情報解析工程で抽出された地名から前記事象の発生位置を特定し、前記投稿者情報解析工程及び前記過去投稿解析工程での解析結果から前記事象の発生位置を特定できなかった場合は前記画像解析工程で抽出された地名から前記事象の発生位置を特定する発生位置特定工程を行う。
前記投稿者情報解析工程では、前記投稿者情報に複数の地名が含まれていた場合は、例えば最新の情報を優先的に選択し、時間的推移から優先度が確定できない場合はより大きなくくりを採用する。
前記過去投稿解析工程では、前記過去の投稿データに複数の地名が含まれていた場合は、例えば特定対象の事象に関する投稿に時間的に近いものを優先的に採用する。
本発明のデータ処理方法では、前記画像解析工程の解析結果から前記事象の発生位置を特定できなかった場合は、更に、前記投稿データの投稿者をフォローしているユーザーのプロフィール情報から地名を抽出するフォロワー情報解析工程と、前記投稿データの投稿者がフォローしているユーザーのプロフィール情報から地名を抽出するフォローユーザー情報解析工程とを行い、前記フォロワー情報解析工程及び/又は前記フォローユーザー情報解析工程の解析結果を利用して前記事象の発生位置を特定してもよい。
本発明のデータ処理方法では、前記フォロワー情報解析工程及び前記フォローユーザー情報解析工程の解析結果から前記事象の発生位置を特定できなかった場合は、前記投稿データの投稿者をフォローしているユーザーの投稿データから地名を抽出するフォロワー投稿解析工程と、前記投稿データの投稿者がフォローしているユーザーの投稿データから地名を抽出するフォローユーザー投稿解析工程とを行い、前記フォロワー投稿解析工程及び/又は前記フォローユーザー投稿解析工程の解析結果を利用して前記事象の発生位置を特定してもよい。
本発明のデータ処理方法では、先ず、前記投稿データに含まれるテキストから地名を抽出するテキスト解析工程と、前記投稿データから投稿位置情報を抽出する位置情報解析工程とを行い、前記テキスト解析工程及び前記位置情報解析工程の解析結果から前記事象の発生位置を特定できなかった場合に、前記投稿者情報解析工程及び前記過去投稿解析工程を行ってもよい。
【0012】
本発明に係るプログラムは、コンピュータに、インターネットを介して収集した任意の事象に関する
画像が付帯された投稿データを処理させるプログラムであって、前記投稿データの投稿者情報から地名を抽出する投稿者情報解析機能と、
前記投稿者情報解析機能と同時並行で、前記投稿データの投稿者による過去の投稿データから地名を抽出する過去投稿解析機能と、
前記投稿者情報解析機能及び前記過去投稿解析機能と同時並行で、前記投稿データに付帯された画像から地名に関する文字情報を抽出する画像解析機能と、前記投稿者情報解析機能、前記過去投稿解析機能及び前記画像解析機能による解析結果を比較し、前記投稿者情報解析機能で抽出された地名と前記過去投稿解析機能で抽出された地名が同じ場合又は前記投稿者情報解析機能と前記過去投稿解析機能のいずれか一方でしか地名が抽出されなかった場合は当該地名から前記事象の発生位置を特定し、前記投稿者情報解析機能で抽出された地名と前記過去投稿解析機能で抽出された地名が異なる場合は前記投稿者情報解析機能で抽出された地名から前記事象の発生位置を特定し、前記投稿者情報解析機能及び前記過去投稿解析機能での解析結果から前記事象の発生位置を特定できなかった場合は前記画像解析機能で抽出された地名から前記事象の発生位置を特定する発生位置特定機能を実行させるものである。
【0013】
本発明における「事象」には、事件、事故、災害など報道などで取り上げられる様々な出来事が含まれ、その発生位置は国内に限られず、海外も含む。
【発明の効果】
【0014】
本発明によれば、従来技術では位置の特定ができなかった投稿データについても、事件・事故・災害などの事象の発生位置を、短時間で特定することができる。
【図面の簡単な説明】
【0015】
【
図1】本発明の第1の実施形態のデータ処理装置の構成例を示す概念図である。
【
図2】
図1に示すデータ処理装置1を用いて投稿データを処理する方法を示すフローチャートである。
【
図3】本発明の第1の実施形態の第1変形例のデータ処理装置の構成例を示す概念図である。
【
図4】
図3に示すデータ処理装置2を用いて投稿データを処理する方法を示すフローチャートである。
【
図5】本発明の第1の実施形態の第2変形例のデータ処理装置の構成例を示す概念図である。
【
図6】
図5に示すデータ処理装置3を用いて投稿データを処理する方法を示すフローチャートである。
【
図7】本発明の第2の実施形態に係るデータ処理システムの構成例を示す概念図である。
【発明を実施するための形態】
【0016】
以下、本発明を実施するための形態について、添付の図面を参照して、詳細に説明する。なお、本発明は、以下に説明する実施形態に限定されるものではない。
【0017】
(第1の実施形態)
先ず、本発明の第1の実施形態に係るデータ処理装置について説明する。
図1は本実施形態のデータ処理装置の構成例を示す概念図である。
図1に示すように、本実施形態のデータ処理装置1は、少なくとも投稿者情報解析部11、過去投稿解析部12及び発生位置特定部13を備えており、任意の事象に関する投稿データから、その事象の発生位置を特定するものである。このデータ処理装置1には、必要に応じて画像解析部14を設けることができる。
【0018】
[投稿データ]
本実施形態のデータ処理装置1で処理される投稿データは、インターネットを介して収集された事件、事故、災害などの任意の事象に関するものであり、特に「投稿位置情報(GPSデータ)が含まれていない」又は「テキストに地名が含まれていない」などの理由で、従来の方法では事象の発生位置が特定できないものである。
【0019】
データ処理装置1で用いられる投稿データは、投稿文やコメントなどのテキストデータ、それに付帯する画像データの他、プロフィールなどの投稿者に関する情報も含まれる。また、テキストデータや画像データは、収集の対象となった事象に関係する投稿のものだけでなく、同一投稿者による過去の投稿のものも含まれる。
【0020】
[投稿者情報解析部11]
投稿者情報解析部11は、投稿者情報から地名を抽出するものである。投稿者は、自身の生活圏内において特定対象事象と遭遇した可能性があり、その場合、事象の発生位置は居住地、勤務地、出身地又はその周辺地域となるからである。
【0021】
[過去投稿解析部12]
過去投稿解析部12は、同一投稿者が特定対象事象に関する投稿よりも前に投稿した投稿文やコメントから地名を抽出するものである。過去の投稿には、特定対象事象に関する情報や投稿者の生活圏に関する情報が含まれている可能性があるからである。
【0022】
[発生位置特定部13]
前記発生位置特定部は、投稿データ及びそれに付随するデータから事象の発生位置を特定するものである。例えば、投稿者情報解析部11と過去投稿解析部12で同じ地名が抽出された場合、又は、投稿者情報解析部11と過去投稿解析部12のいずれか一方でしか地名が抽出されなかった場合は、発生位置特定部13は抽出された地名から発生位置を特定する。
【0023】
また、投稿者情報解析部11で抽出された地名と、過去投稿解析部12で抽出された地名が異なる場合は、発生位置特定部13は投稿者情報解析部11で抽出された地名を優先的に選択する。なお、投稿者情報解析部11及び過去投稿解析部12のいずれも地名が抽出できなかった場合は、後述する画像解析部14で抽出された地名から発生位置を特定してもよい。
【0024】
[画像解析部14]
画像解析部14は、投稿データに付帯された画像から地名に関する文字情報を抽出するものである。具体的には、OCRなどの光学文字認識技術により、画像データから文字情報を抽出する。ここで、画像から抽出される文字情報としては、車のナンバー、住所表示板、標識、店の看板に記載されている地名などが挙げられる。
【0025】
画像は事象の発生位置について有益な情報を有しているが、OCRなどの文字認識処理は、前述した地名抽出処理に比べて時間を要する。そこで、本実施形態のデータ処理装置1では、投稿者情報や過去投稿から事象の発生位置が特定できなかった投稿のみ画像解析部14での解析結果を利用することとする。なお、画像解析部14での処理は、投稿者情報解析部11及び過去投稿解析部12での解析の後に行ってもよいが、これらと同時期に処理を開始してもよい。
【0026】
[動作]
次に、本実施形態のデータ処理装置1の動作、即ち、データ処理装置1を用いて投稿データを処理し、事象の発生位置を特定する方法について説明する。
図2は本実施形態のデータ処理方法を示すフローチャートである。本実施形態のデータ処理方法は、1又は複数のデータ処理装置1を用いてインターネットを介して収集した任意の事象に関する投稿データを処理する方法であって、投稿者情報解析工程S1aと、過去投稿解析工程S1bと、発生位置特定工程(I)S2aを行う。
【0027】
<投稿者情報解析工程S1a>
投稿者情報解析工程S1aでは、プロフィールなどの投稿者に関する情報を解析して地名を抽出する。その際、投稿者情報に複数の地名が含まれていた場合は、最新の情報を優先的に選択し、時間的推移から優先度が確定できない場合は、より大きなくくりを採用する。
【0028】
例えば、投稿者の最新の居住地が「A市」であり、出身地が「B市」であった場合は、「A市」を選択する。また、優先度が確定できず「A市」と「B市」の両方が抽出された場合は、これらの市がある「X県」と判定すればよい。更に、投稿者情報に「X県A市」と「Y県C市」があり、いずれか一方を選択できない場合は、X県とY県を含む「Z地方」と判定してもよいし、その両方を選択して「A市又はC市」或いは「X県又はY県」と判定してもよい。なお、投稿者情報に地名が含まれていない場合は、「地名なし」と判定する。
【0029】
<過去投稿解析工程S1b>
過去投稿解析工程S1bでは、特定対象事象に関する投稿を行った投稿者が過去に投稿した投稿文やコメントなどの過去投稿データを解析して地名を抽出する。なお、過去投稿データに地名が含まれていない場合は「地名なし」と判定し、複数の地名が含まれていた場合は、特定対象事象に関する投稿に時間的に近いものを優先的に選択する。
【0030】
<発生位置特定工程(I)S2a>
発生位置特定工程(I)S2aでは、前述した投稿者情報解析工程S1a及び/又は過去投稿解析工程S1bで得た解析結果を利用して事象の発生位置を特定する。具体的には、投稿者情報解析工程S1aと過去投稿解析工程S1bの一方が、「地名なし」であった場合は、地名が抽出された工程での解析結果を利用して事象の発生位置を特定する。
【0031】
投稿者情報解析工程S1aと過去投稿解析工程S1bで同じ地名が抽出された場合は、その地名に基づき事象の発生位置を特定する。一方、投稿者情報解析工程S1aと過去投稿解析工程S1bで異なる地名が抽出された場合は、特定対象事象の発生位置である確率が高い投稿者情報解析工程S1aでの解析結果を優先的に利用して発生位置を特定する。例えば、投稿者情報解析工程S1aで「地名A」が抽出され、過去投稿解析工程S1bで「地名B」が抽出された場合は、「地名A」を事象の発生位置とする。
【0032】
なお、投稿者情報解析工程S1aと過去投稿解析工程S1bのいずれでも地名が抽出できなかった場合は、発生位置特定工程(I)S2aでは「特定不可」とする。その場合、後述する画像解析工程S1cと発生位置特定工程(II)S2bを行う。
【0033】
<画像解析工程S1c>
画像解析工程S1cは、特定対象事象に関する投稿に付帯された画像から、OCRなどの光学文字認識技術を用いて、地名に関する文字情報を抽出する。具体的には、画像に含まれる車のナンバー、住所表示板、標識、店の看板などから、地名を抽出する。
【0034】
この画像解析工程S1cは、発生位置特定工程(I)S2aの後に行ってもよいし、投稿者情報解析工程S1a及び過去投稿解析工程S1bと同時並行で行ってもよい。投稿者情報解析工程S1a及び過去投稿解析工程S1bと同時並行で行う場合は、発生位置特定工程(I)S2aで、投稿者情報解析工程S1a及び過去投稿解析工程S1bの解析結果と併せて、画像解析工程S1cでの解析結果を利用し、事象の発生位置の特定を行ってもよい。
【0035】
<発生位置特定工程(II)S2b>
発生位置特定工程(II)S2bでは、前述した画像解析工程S1cで抽出された地名(「地名C」)を利用して事象の発生位置を特定する。その際、画像に複数の地名が含まれていた場合は、住所表示板や標識などのようにより確実性の高いものを優先的に採用し、確実性の高い情報がない場合は、複数の情報を総合的に判定し、より大きなくくりを採用する。
【0036】
例えば、住所表示板から読み取った地名が「A市」であり、車のナンバーから読み取った地名が「B市」であった場合は、より確実性の高い「A市」を選択する。また、住所表示板や標識などの確実性の高い文字情報がなく、車のナンバーから「A市」と「B市」が抽出された場合は、これらの市がある「X県」と判定することができる。更に、画像に「X県A市」と「Y県C市」が含まれており、いずれか一方を選択できない場合は、X県とY県を含む「Z地方」と判定してもよいし、その両方を選択して「A市又はC市」或いは「X県又はY県」と判定してもよい。なお、画像に地名が含まれていない場合は、「地名なし」と判定する。
【0037】
[プログラム]
前述した各工程は、データ処理装置の各機能を実現するためのコンピュータプログラムを作成し、1又は2以上のコンピュータに実装することにより実施することができる。即ち、本実施形態のデータ処理方法は、コンピュータに、投稿データの投稿者情報から地名を抽出する投稿者情報解析機能と、投稿データの投稿者による過去の投稿データから地名を抽出する過去投稿解析機能と、投稿者情報解析機能及び/又は過去投稿解析機能による解析結果を利用して事象の発生位置を特定する発生位置特定機能とを実行させることにより、実施することができる。
【0038】
このコンピュータプログラムでは、投稿者情報解析機能で抽出された地名と、過去投稿解析機能で抽出された地名が異なる場合は、発生位置特定機能において、投稿者情報解析機能で抽出された地名を優先的に選択するようにしてもよい。また、本実施形態のコンピュータプログラムは、コンピュータに、前述した各機能に加えて、投稿データに付帯された画像から文字情報を抽出する画像解析機能を実行させ、投稿者情報解析機能及び過去投稿解機能による解析結果から事象の発生位置を特定できなかった場合に、発生位置特定機能は画像解析機能による解析結果を利用して事象の発生位置を特定するようにしてもよい。
【0039】
なお、前述した各機能は、一のプログラムに搭載されている必要はなく、機能毎にプログラムを作成し、それらを連動させることにより実行してもよい。その場合、各プログラムを2台以上のコンピュータ又は装置に分割して実装し、動作させることもできる。
【0040】
以上詳述したように、本実施形態のデータ処理装置は、投稿者に関する情報及び同一投稿者の過去の投稿、必要に応じて付帯画像から地名を抽出しているため、従来の方法で発生位置が特定できない投稿でも、事象の発生位置を特定することが可能となる。
【0041】
(第1の実施形態の第1変形例)
次に、本発明の第1の実施形態の第1変形例に係るデータ処理装置について説明する。
図3は本変形例のデータ処理装置の構成例を示す概念図である。なお、
図3においては、
図1に示すデータ処理装置1と同じ構成要素には同じ符号を付し、詳細な説明は省略する。
図3に示すように、本変形例のデータ処置装置2は、前述した第1の実施形態のデータ処理装置1の各部に加えて、テキスト解析部25と位置情報解析部26を備えている。
【0042】
[テキスト解析部25]
投稿文やコメントなど、特定対象事象に関する投稿に含まれるテキストから地名を抽出するものである。特定対象事象の投稿に含まれる地名は、事象の発生位置を示している可能性が高く、発生位置の特定には特に有効な情報である。
【0043】
[位置情報解析部26]
投稿データから投稿位置情報(GPSデータ)を抽出するものである。投稿者は、事象の発生位置から投稿している可能性が高く、特定対象事象の投稿に付されているGPSデータは、発生位置の特定に最も有効な情報である。
【0044】
そして、本変形例のデータ処理装置2では、先ずは、テキスト解析部25及び位置情報解析部26での解析結果から事象の発生位置を特定し、これらで発生位置が特定できなかった場合に、発生位置特定部13は、投稿者情報解析部11及び/又は過去投稿解析部12での解析結果を利用して事象の発生位置を特定する。
【0045】
[動作]
図4は
図3に示すデータ処理装置2を用いて投稿データを処理する方法を示すフローチャートである。
図4に示すように、本変形例のデータ処理装置2は、投稿データに含まれるテキストから地名を抽出するテキスト解析工程S10aと、投稿データから投稿位置情報を抽出する位置情報解析工程S10bとを行い、これらの解析結果から事象の発生位置を特定する発生位置特定工程S20aを行う。そして、発生位置特定工程S20aで事象の発生位置を特定できなかった場合に、前述した投稿者情報解析工程S1a及び過去投稿解析工程S1bを行う。
【0046】
[プログラム]
前述した各工程は、データ処理装置の各機能を実現するためのコンピュータプログラムを作成し、1又は2以上のコンピュータに実装することにより実施することができる。即ち、本変形例のデータ処理方法は、コンピュータに、前述した第1の実施形態のプログラムの各機能に加えて、投稿データに含まれるテキストから地名を抽出するテキスト解析機能と、投稿データから投稿位置情報を抽出する位置情報解析機能とを実行させ、テキスト解析機能及び位置情報解析機能による解析結果から事象の発生位置を特定できなかった場合に、投稿者情報解析機能及び過去投稿解析機能を実行させることにより、実施することができる。
【0047】
本変形例のデータ処理装置2では、テキストやGPSデータなどのような事象の発生位置を容易に特定可能な情報を有している投稿データについては、これらの情報に基づき事象の発生位置を特定し、これらで発生位置を特定できない投稿データについてのみ投稿者情報や過去投稿を解析しているため、効率的にかつ精度よく事象の発生位置を特定することができる。なお、本変形例における上記以外の構成及び効果は、前述した第1の実施形態と同様である。
【0048】
(第1の実施形態の第2変形例)
次に、本発明の第1の実施形態の第2変形例に係るデータ処理装置について説明する。
図5は本変形例のデータ処理装置の構成例を示す概念図である。なお、
図5においては、
図1に示すデータ処理装置1と同じ構成要素には同じ符号を付し、詳細な説明は省略する。
図5に示すように、本変形例のデータ処置装置3は、前述した第1の実施形態のデータ処理装置1の各部に加えて、フォロワー解析部37とフォローユーザー解析部38を備えている。
【0049】
[フォロワー解析部37]
フォロワー解析部37は、特定対象事象に関する投稿の投稿者をフォローしているユーザー(フォロワー)のプロフィール情報から地名を抽出するフォロワー情報解析部と、フォロワーの投稿データから地名を抽出するフォロワー投稿解析部とを備える。フォロワーは、投稿者と生活圏が共通していることがあり、フォロワーの出身地や居住地などの情報、投稿文やコメントなどのテキストから抽出された地名に、事象の発生位置が含まれている可能性があるからである。
【0050】
[フォローユーザー解析部38]
フォローユーザー解析部38は、特定対象事象に関する投稿の投稿者がフォローしているユーザーのプロフィール情報から地名を抽出するフォロワー情報解析部と、フォローユーザーの投稿データから地名を抽出するフォローユーザー投稿解析部とを備える。投稿者は、地震と生活圏が共通しているユーザーをフォローしていることがあり、フォローユーザーの出身地や居住地などの情報、投稿文やコメントなどのテキストから抽出された地名に、事象の発生位置が含まれている可能性があるからである。
【0051】
本変形例のデータ処理装置3では、発生位置特定部13は、投稿者情報解析部11及び過去投稿解析部12での解析結果から事象の発生位置を特定できなかった場合は、画像解析部14での解析結果から事象の発生位置を特定する。そして、画像解析部14での解析結果でも発生位置を特定できなかった場合に、フォロワー解析部37やフォローユーザー解析部38での解析結果を利用して事象の発生位置を特定する。
【0052】
[動作]
図6は
図5に示すデータ処理装置3を用いて投稿データを処理する方法を示すフローチャートである。
図6に示すように、本変形例のデータ処理装置3は、発生位置特定工程(II)S2bにおいて、画像解析工程S1cの解析結果から事象の発生位置を特定できなかった場合に、更に、フォロワー解析工程S3a及びフォローユーザー解析工程S3bを行い、これらの解析結果から事象の発生位置を特定する発生位置特定工程(III)S4を行う。
【0053】
具体的には、フォロワーのプロフィール情報から地名を抽出すると共に、フォローユーザーのプロフィール情報から地名を抽出し、抽出された地名から事象の発生位置を特定する。また、フォロワー及びフォローユーザーのプロフィール情報から地名が抽出されなかった場合は、フォロワーの投稿データ及びフォローユーザーの投稿データから地名を抽出し、その結果を利用して事象の発生位置を特定する。
【0054】
[プログラム]
前述した各工程は、データ処理装置の各機能を実現するためのコンピュータプログラムを作成し、1又は2以上のコンピュータに実装することにより実施することができる。即ち、本変形例のプログラムは、画像解析機能の解析結果から事象の発生位置を特定できなかった場合は、コンピュータに、フォロワーのプロフィール情報から地名を抽出するフォロワー情報解析機能と、フォローユーザーのプロフィール情報から地名を抽出するフォローユーザー情報解析機能とを実行させる。そして、発生位置特定機能が、フォロワー情報解析機能やフォローユーザー情報解析機能の解析結果を利用して事象の発生位置を特定するようにしてもよい。
【0055】
更に、本変形例のプログラムは、フォロワー情報解析機能及びフォローユーザー情報解析機能の解析結果から事象の発生位置を特定できなかった場合は、コンピュータに、フォロワーの投稿データから地名を抽出するフォロワー投稿解析機能と、フォローユーザーの投稿データから地名を抽出するフォローユーザー投稿解析機能とを実行させる。そして、発生位置特定機能が、フォロワー投稿解析機能やフォローユーザー投稿解析機能の解析結果を利用して事象の発生位置を特定するようしてもよい。
【0056】
本変形例のデータ処理装置3では、フォロワーやフォローユーザーの情報や投稿を解析しているため、投稿者の情報や投稿データから発生位置を特定できない事象についても、発生位置を特定することが可能となる。これにより、事象の発生位置の特定精度を高めることができる。
【0057】
なお、本変形例における上記以外の構成及び効果は、前述した第1の実施形態と同様である。また、本変形例のデータ処置装置は、前述した第1変形例の構成と組み合わせることも可能である。その場合、テキスト解析部と位置情報解析部を更に設け、これらの解析結果では発生位置が特定できない投稿についてのみ、投稿者情報解析部及び過去投稿解析部で解析を行えばよい。
【0058】
(第2の実施形態)
次に、本発明の第2の実施形態に係るデータ処理システムについて説明する。
図7は本実施形態のデータ処理システムの構成例を示す概念図である。
図7に示すように、本実施形態のデータ処理システム40は、前述した第1の実施形態のデータ処理装置1と、インターネット4を介して任意の事象に関する投稿データ5a,5bを収集するデータ収集装置41を備える。
【0059】
このデータ処理システム40は、データ収集装置41で収集した投稿データ5a,5b又はこれらを分類した投稿データ群を、データ処理装置1で処理し、事象の発生位置を特定する。また、本実施形態のデータ処理システム40には、データ処理装置1で特定された発生位置情報を付加して、事象に関する投稿情報を外部配信する配信装置42が設けられていてもよい。
【0060】
本実施形態のデータ処理システムは、投稿者情報解析部及び過去投稿解析部、必要に応じて画像解析部で投稿者に関する地名を抽出し、その結果を利用して事象の発生位置を特定するデータ処理装置を備えているため、従来の方法で発生位置が特定できない投稿でも、事象の発生位置を特定することが可能となる。なお、本実施形態における上記以外の構成及び効果は、前述した第1の実施形態と同様である。
【0061】
また、
図7には
図1に示す第1の実施形態のデータ処置装置1を用いた構成を示しているが、本発明はこれに限定されるものではない。具体的には、
図3に示すデータ処置装置2のようにテキスト解析部及び位置情報解析部を備えるものや、
図5に示すデータ処理装置3のようにフォロワー解析部及びフォローユーザー解析部を備えるものを用いてもよく、その場合も同様の効果が得られる。
【符号の説明】
【0062】
1〜3 データ処理装置
4 インターネット
5a,5b 投稿データ
11 投稿者情報解析部
12 過去投稿解析部
13 発生位置特定部
14 画像解析部
25 テキスト解析部
26 位置情報解析部
37 フォロワー情報解析部
38 フォローユーザー情報解析部
40 データ処理システム
41 データ収集装置
42 配信装置