(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2023-02-16
(45)【発行日】2023-02-27
(54)【発明の名称】情報処理装置、プログラムおよび情報処理方法
(51)【国際特許分類】
H04L 67/02 20220101AFI20230217BHJP
G06F 16/951 20190101ALI20230217BHJP
【FI】
H04L67/02
G06F16/951
(21)【出願番号】P 2022022543
(22)【出願日】2022-02-17
【審査請求日】2022-08-24
【早期審査対象出願】
(73)【特許権者】
【識別番号】514323246
【氏名又は名称】株式会社JX通信社
(74)【代理人】
【識別番号】110003166
【氏名又は名称】弁理士法人山王内外特許事務所
(72)【発明者】
【氏名】米重 克洋
(72)【発明者】
【氏名】柳 佳音
【審査官】羽岡 さやか
(56)【参考文献】
【文献】国際公開第2011/063561(WO,A1)
【文献】特表2011-513836(JP,A)
【文献】特開2006-004111(JP,A)
【文献】特開2007-164702(JP,A)
【文献】特開2012-069139(JP,A)
【文献】特開2004-318746(JP,A)
【文献】特開2020-106988(JP,A)
【文献】特開2018-195006(JP,A)
【文献】特開2011-043710(JP,A)
【文献】特開2001-265884(JP,A)
【文献】特開2021-185467(JP,A)
【文献】特開2021-051534(JP,A)
【文献】国際公開第2016/031244(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04L 67/02
G06F 16/951
(57)【特許請求の範囲】
【請求項1】
複数の情報源を対象として、前記情報源が提供する情報を、前記情報源ごとに元データとして収集するデータ収集部と、
前記情報源ごとの前記元データから、前記情報源ごとに予め設定された抽出ルールに基づき、要部データを抽出する情報抽出部と、
予め設定された集約ルールに基づき、前記要部データを集約した集約情報を生成する集約処理部と、
前記
元データが示すトピック
に対応する配信情報テンプレートと前記
集約情報とに基づき、配信情報を生成する配信情報生成部と、を備えた
ことを特徴とする情報処理装置。
【請求項2】
前記配信情報生成部は、前記情報源が提供する情報が更新された場合に前記配信情報を生成する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記情報抽出部は、前記情報源が提供する情報が更新された時期を示す更新時期情報を前記要部データに含めて抽出し、
前記配信情報生成部は、前記情報源が提供する情報が更新されたか否かを、前記更新時期情報に基づいて判断する
ことを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記データ収集部は、前記情報源ごとに予め設定された収集ルールに基づき、前記元データを収集する
ことを特徴とする請求項1から請求項3のいずれか1項に記載の情報処理装置。
【請求項5】
前記収集ルールは、予め定められた頻度で前記元データを収集することを指示するものであり、
前記データ収集部は、前記収集ルールに基づき、前記頻度で前記元データを収集する
ことを特徴とする請求項4に記載の情報処理装置。
【請求項6】
前記データ収集部は、前記情報源による情報の提供形態が更新された場合、当該情報源に対応する前記収集ルールを更新する
ことを特徴とする請求項4または請求項5に記載の情報処理装置。
【請求項7】
前記情報抽出部は、前記元データに含まれる画像からテキストを認識し、認識したテキストを前記要部データに含める
ことを特徴とする請求項1から請求項6のいずれか1項に記載の情報処理装置。
【請求項8】
前記データ収集部は、前記元データに第1識別情報を付与し、前記元データと前記第1識別情報とを紐付けて記憶装置に保存し、
前記情報抽出部は、前記第1識別情報に基づき前記要部データの抽出対象となる前記元データを特定し、特定した前記元データから前記要部データの抽出を行うとともに、抽出した前記要部データに第2識別情報を付与し、前記要部データと前記第2識別情報とを紐付けて前記記憶装置に保存し、
前記配信情報生成部は、前記配信情報テンプレート内に予め設定された前記第2識別情報の挿入箇所に、前記第2識別情報と紐づけられた前記要部データを挿入する
ことを特徴とする請求項1から請求項7のいずれか1項に記載の情報処理装置。
【請求項9】
前記配信情報テンプレート
は、前記情報源が提供する情報が示すトピックごとに予め設けられる
ことを特徴とする請求項1から請求項8のいずれか1項に記載の情報処理装置。
【請求項10】
前記集約処理部は、前記情報源ごとに予め設定された前記集約ルールに基づき、前記集約情報を生成する
ことを特徴とする請求項
1から請求項9のいずれか1項に記載の情報処理装置。
【請求項11】
前記集約処理部は、前記集約ルールに基づき、前記要部データを統計的に処理することで、前記集約情報を生成する
ことを特徴とする請求項
1から請求項10のいずれか1項に記載の情報処理装置。
【請求項12】
予め設定された配信ルールに基づき、前記配信情報を配信先に送信する配信情報送信部を備えた
ことを特徴とする請求項1から請求項11のいずれか1項に記載の情報処理装置。
【請求項13】
前記配信情報送信部は、前記配信ルールが示す配信時期に、前記配信情報を送信する
ことを特徴とする請求項12に記載の情報処理装置。
【請求項14】
前記配信情報送信部は、前記配信ルールが示す配信先に、前記配信情報を送信する
ことを特徴とする請求項12または請求項13に記載の情報処理装置。
【請求項15】
コンピュータを、請求項1から請求項14のいずれか1項に記載の情報処理装置として機能させるためのプログラム。
【請求項16】
情報処理装置が実行する情報処理方法であって、
データ収集部が、複数の情報源を対象として、前記情報源が提供する情報を、前記情報源ごとに元データとして収集するステップと、
情報抽出部が、前記情報源ごとの前記元データから、前記情報源ごとに予め設定された抽出ルールに基づき、要部データを抽出するステップと、
集約処理部が、予め設定された集約ルールに基づき、前記要部データを集約した集約情報を生成するステップと、
配信情報生成部が、前記
元データが示すトピック
に対応する配信情報テンプレートと前記
集約情報とに基づき、配信情報を生成するステップと、を備えた
ことを特徴とする情報処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、プログラムおよび情報処理方法に関する。
【背景技術】
【0002】
ニュース等の配信情報は、一般的に、気象情報、地震情報等の公共情報、Webサイト上の情報またはソーシャルネットワーキングサービス(以下、単に「SNS」という。)における投稿等の公開済のデータを用いて人手で生成されている。
【0003】
人手によらず、ニュースの原稿を自動生成する従来の技術として、例えば、特許文献1には、ニュースの原稿を自動で生成する原稿自動生成装置が記載されている。特許文献1に記載された装置は、全国各地の公開観測値として得られるセンサ情報のうち、ユーザによって指定される原稿作成用センサ情報に関して、過去の実原稿を基にして生成され蓄積されたテンプレートのうち、いずれのテンプレートが最も良いかを機械学習によりランキングして選別し、センサ情報を選別した所定数のテンプレートに割り当てることにより原稿作成用センサ情報に応じた所定数の原稿を自動生成し、ユーザインターフェース上に提示する。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
ニュース等の配信情報の対象となるトピックには様々なものがある。様々なトピックに応じて配信者の意図どおりの配信情報を自動的に生成できれば、迅速な情報提供が可能となる。特許文献1に記載される従来の技術は、過去の実原稿を基にして生成され蓄積されたテンプレートから機械学習を利用して所定数のテンプレートを選別するものであるため、配信者が意図しないテンプレートが選別されることがある。したがって、従来の技術には、様々なトピックに応じた意図どおりの配信情報を自動的に生成できないおそれがあるという課題があった。
【0006】
本発明は上記課題を解決するものであり、様々なトピックに応じた意図どおりの配信情報を自動的に生成することができる情報処理装置、プログラムおよび情報処理方法を得ることを目的とする。
【課題を解決するための手段】
【0007】
本発明に係る情報処理装置は、複数の情報源を対象として、情報源が提供する情報を、情報源ごとに元データとして収集するデータ収集部と、情報源ごとの元データから、情報源ごとに予め設定された抽出ルールに基づき、要部データを抽出する情報抽出部と、予め設定された集約ルールに基づき、要部データを集約した集約情報を生成する集約処理部と、元データが示すトピックに対応する配信情報テンプレートと集約情報とに基づき、配信情報を生成する配信情報生成部と、を備える。
【発明の効果】
【0008】
本発明によれば、元データが示すトピックに対応する配信情報テンプレートと集約情報とに基づき、配信情報を生成するので、本発明に係る情報処理装置は、様々なトピックに応じた意図どおりの配信情報を自動的に生成することができる。
【図面の簡単な説明】
【0009】
【
図1】実施の形態1に係る情報処理システムの構成を示すブロック図である。
【
図2】実施の形態1に係る情報処理装置の機能を実現するハードウェア構成を示すブロック図である。
【
図5】配信情報テンプレートの一例を示す図である。
【
図9】実施の形態1に係る情報処理方法を示すフローチャートである。
【
図10】実施の形態2に係る情報処理システムの構成を示すブロック図である。
【
図11】実施の形態2に係る情報処理方法を示すフローチャートである。
【発明を実施するための形態】
【0010】
実施の形態1.
図1は、実施の形態1に係る情報処理システム1の構成を示すブロック図である。情報処理システム1は、情報処理装置2、ユーザ端末3、Webサーバ4、SNSサーバ5、および公共情報サーバ6が、ネットワーク7を介して接続されたシステムである。ネットワーク7は、インターネットを含む電気通信回線である。情報処理システム1は、情報配信サービスを提供するとともに、情報配信サービスにおける配信情報の生成に用いられる情報(以下「元データ」という。)を収集するために利用される。
【0011】
情報処理装置2は、情報配信サービスで提供される配信情報を生成するサーバであり、複数の情報源を対象として、情報源が提供する情報を、情報源ごとに元データとして収集する。複数の情報源は、Webサーバ4、SNSサーバ5または公共情報サーバ6を含む各種のサーバ(以下「各種サーバ」という。)により管理されており、各情報源は、例えば、URL(Uniform Resource Locator)で特定される。情報源が提供する情報のデータ形式には、HTML(HyperText Markup Language)、CSV(Comma Separated Value)、JSON(JavaScript Object Notation)、XML(Extensible Markup Language)等の様々な形式があり得る。収集される元データには、テキストのほか、静止画像または動画像等の画像が含まれていてもよい。情報処理装置2は、ネットワーク7を介して、情報源が提供する様々なデータ形式の情報を、当該情報源から元データとしてそのまま収集する。
【0012】
また、情報処理装置2は、情報源ごとに予め設定された収集ルールに基づき、元データを収集する。収集ルールには、少なくとも、当該収集ルールが適用される情報源から元データを収集する頻度を示す情報が含まれる。情報処理装置2は、情報源ごとに設定された収集ルールが示す頻度で、当該情報源から元データを収集する。
【0013】
情報処理装置2は、情報源ごとに予め設定された抽出ルールの中から、元データを収集した情報源に対応する抽出ルールを選択して、選択した抽出ルールに基づき、配信情報の生成に用いる情報(以下「要部データ」という。)を元データから抽出する。なお、抽出ルールとは、元データから要部データを抽出する方法を示す情報である。情報処理装置2は、抽出ルールが示す方法で、元データから要部データを抽出する。
【0014】
情報処理装置2は、トピックごとに予め設定された配信情報テンプレートから、収集した元データのトピックに対応する配信情報テンプレートを選択し、選択した配信情報テンプレートと要部データとに基づき、配信情報を生成する。例えば、配信情報がテキストからなる場合、情報処理装置2は、テキストからなる配信情報テンプレートにおいて予め指定された挿入箇所に、テキストからなる要部データを挿入することにより、配信情報を生成する。また、例えば、配信情報が画像からなる場合、情報処理装置2は、画像からなる配信情報テンプレートの予め指定された位置に、要部データから得られた画像を重畳した画像を、配信情報として生成してもよい。配信情報が画像からなる場合の一例としては、地図上に要部データが示すイベント発生場所を示した画像を配信情報とする場合がある。この場合、情報処理装置2は、例えば、地図情報を含む配信情報テンプレートが示す地図上のイベント発生場所に、イベントを示すアイコンを要部データから得られた画像として重畳した画像を、配信情報として生成する。また、配信情報が画像からなる場合、画像は静止画像であっても、動画像であってもよい。例えば、配信情報が動画像からなる場合、情報処理装置2は、動画像からなる配信情報テンプレートの予め指定された位置に、要部データから得られた画像を重畳した動画像を、配信情報として生成する。また、配信情報は、テキストと画像からなるものであってもよい。
なお、この実施の形態におけるトピックとは、各情報源が提供する情報が示す内容に関するトピックである。各情報源が提供する情報が示す内容は、当該情報のうち一部の情報が示す内容でよい。また、この実施の形態におけるトピックとは、元データが示す内容に関するトピック、元データの一部が示す内容に関するトピック、または、各配信情報の示す内容に関するトピックともいえる。そして、一般的な概念としてのトピックには様々な区別の仕方があるのと同様に、この実施の形態におけるトピックも、どのように区別されたものであってもよく、配信情報テンプレートは、そのように区別されたトピックごとに設定される。ここで、異なる複数の情報源から、同一のトピックに属する配信情報の生成に必要な要部データがそれぞれ抽出できる場合、それらの要部データの互いの内容は異なっていても、配信情報の生成に使用される配信情報テンプレートとしては、同一のものを使用できる。したがって、トピックを区別する際は、異なる複数の情報源に対して同一の配信情報プレートが効率良く使用できることを考慮して区別を行ってもよい。
【0015】
情報処理装置2は、予め設定された配信ルールに基づき配信情報を配信先に送信する。配信ルールは、配信情報の配信先および配信時期を示す情報である。例えば、情報処理装置2は、配信ルールが示す配信先で特定される、ユーザ端末3またはネットワーク7に接続された不図示の端末に対し、ネットワーク7を介して配信情報を自動的に送信する、プッシュ型情報配信を行う。プッシュ型情報配信の態様としては、例えば、SNSへの投稿、電子メールによる送信、端末画面へのポップアップによる通知、または、配信情報に関連した処理を行う公共機関への通報が含まれる。
【0016】
また、情報処理装置2は、配信ルールが示す配信先で特定される、ユーザ端末3またはネットワーク7に接続された不図示の端末から配信要求を受信すると、配信要求を行った端末に対して配信情報を送信する、プル型情報配信を行ってもよい。
さらに、配信ルールが、配信情報の示す内容が特定のトピックに属することを条件に配信先の端末に当該配信情報を送信することを示す場合、情報処理装置2は、当該トピックに属する配信情報を新たに生成する度に、生成した配信情報を配信先の端末に送信する。
【0017】
ユーザ端末3は、情報処理装置2が提供する情報配信サービスを利用するユーザが使用する端末である。ユーザ端末3は、ネットワーク7を介して、少なくとも情報処理装置2と通信可能な端末装置であり、例えば、スマートフォン、タブレット端末またはPC(Personal Computer)である。
【0018】
ユーザ端末3には、情報配信サービスを利用するための専用アプリケーション(以下「サービス専用アプリ」という。)がインストールされている。または、ユーザ端末3には、SaaS(Software as a Service)の形態で情報配信サービスが提供されてもよい。情報配信サービスがSaaSの形態で提供される場合、情報配信サービスを提供するサービス用アプリケーションは、情報処理装置2で実行され、ユーザ端末3は、サービス専用アプリをインストールすることなく、Webブラウザ上で情報配信サービスの提供を受けることができる。
【0019】
Webサーバ4は、ネットワーク7を介して、Webサイトを提供するサーバである。Webサイトには、例えば、報道機関がニュースを掲載するニュースサイトがある。SNSサーバ5は、ネットワーク7を介してユーザ端末3にSNSを提供するサーバである。SNSには、例えば、Twitter(登録商標)、Instagram(登録商標)、TikTok(登録商標)、YouTube(登録商標)、または、Facebook(登録商標)がある。
【0020】
公共情報サーバ6は、ネットワーク7を介して、公共情報を提供するサーバである。公共情報は、公共性の高い情報であり、例えば、公的機関またはライフライン事業者等から提供される、気象情報、地震情報、不審者の発生等の防犯もしくは安全に関する情報、火災に関する情報、自治体からの避難指示もしくは避難所開設に関する情報、交通情報、またはインフラ設備に関する情報等である。
【0021】
情報配信サービスを提供する情報処理装置2は、通信部21、演算部22および記憶部23を備える。通信部21は、ネットワーク7を介して、ユーザ端末3または各種サーバと通信を行う。例えば、通信部21は、LTE、3G、4Gまたは5G等の通信方式によるモバイル通信が可能なユーザ端末3との間でネットワーク7を介して通信可能である。演算部22は、情報処理装置2の全体動作を制御する。演算部22は、配信情報の生成と送信を行うための情報処理アプリケーションを実行することで、各種の機能を実現する。
【0022】
記憶部23は、情報処理アプリケーションおよび演算部22の演算処理に用いる情報を記憶する。例えば、記憶部23は、元データの収集ルールおよび要部データの抽出ルールを、対象となる複数の情報源のそれぞれに対応付けて記憶し、配信情報テンプレートを様々なトピックのそれぞれに対応付けて記憶し、配信情報を送信するための配信ルールを記憶する。
【0023】
演算部22は、データ収集部221、情報抽出部222、配信情報生成部223および配信情報送信部224を備える。演算部22が情報処理アプリケーションを実行することにより、データ収集部221、情報抽出部222、配信情報生成部223および配信情報送信部224の各機能が実現される。
図2は、情報処理装置2の機能を実現するハードウェア構成を示すブロック図である。例えば、情報処理装置2は、ハードウェア構成として、通信インタフェース100、入出力インタフェース101、プロセッサ102およびメモリ103を有する。情報処理装置2が備える、データ収集部221、情報抽出部222、配信情報生成部223および配信情報送信部224の各機能は、これらのハードウェア構成により実現される。
【0024】
通信インタフェース100は、ネットワーク7を介して外部装置から受信されたデータをプロセッサ102へ出力し、プロセッサ102が生成したデータを、ネットワーク7を介して、ユーザ端末3へ送信する。プロセッサ102は、入出力インタフェース101を介して、記憶部23に対しデータを読み書きする。記憶部23は、情報処理装置2として機能するコンピュータがアクセス可能な記憶装置により実現される。
【0025】
データ収集部221、情報抽出部222、配信情報生成部223および配信情報送信部224の各機能を実現するための情報処理アプリケーションプログラムは、記憶部23に記憶されている。プロセッサ102は、入出力インタフェース101を介して記憶部23に記憶された情報処理アプリケーションプログラムを読み出して、メモリ103にロードし、メモリ103にロードされたプログラムを実行する。これにより、プロセッサ102は、データ収集部221、情報抽出部222、配信情報生成部223および配信情報送信部224の各機能を実現する。メモリ103は、例えばRAM(Random Access Memory)である。
【0026】
データ収集部221は、複数の情報源を対象として、情報源が提供する情報を、情報源ごとに元データとして収集する。例えば、データ収集部221は、ネットワーク7を介して、各種サーバ(Webサーバ4、SNSサーバ5および公共情報サーバ6)が管理する情報源から、元データを収集する。
【0027】
データ収集部221は、情報源ごとに予め設定された収集ルールに基づき、元データを収集する。
図3は、収集ルールの一例を示す図である。
図3に示すように、収集ルール31には、例えば、項目「説明」31A、項目「URL」31B、項目「データID」31C、項目「形式」31Dおよび項目「収集頻度」31Eが含まれる。
【0028】
項目「説明」31Aには、元データの収集元である情報源の説明が設定される。
図3において、項目「説明」31Aには、「AAA電力会社の東京都のWebページ」といったテキストが設定されており、情報源がAAA電力会社が提供している東京都に関するWebページであることを示している。つまり、収集ルール31は、「AAA電力会社の東京都のWebページ」という情報源についての収集ルールである。なお、「AAA電力会社」は、実施の形態の説明のために用いられる架空の電力会社名である。また、上記Webページが提供する情報は、東京都全体の停電軒数に関する情報と、東京都の市区町村ごとの現在の停電軒数に関する情報であるとする。また、当該Webページ内には、複数の「停電軒数」という文字列が記載されており、それら文字列のうちの1つにのみ右隣に数字が記載され、その数字が東京都全体の停電軒数を示し、他の文字列は、例えば、各市区町村の停電軒数を示すリストのタイトルを表すのみで、いずれも右隣に数字は記載されていないものとする。
【0029】
項目「URL」31Bには、AAA電力会社の東京都のWebページに接続するためのURLが設定される。例えば、項目「URL」31Bに「https://teideninfo.AAA」というURLが設定されている。
【0030】
項目「データID」31Cには、データIDを示すテキストが設定される。データIDは、データ収集部221が元データに付与する識別情報である。
図3において、データIDは「AAA.tokyo」である。データ収集部221は、元データを収集すると、元データにデータIDを付与して記憶部23に記憶させる。項目「形式」31Dには、元データのデータ形式が設定される。例えば、
図3において、元データのデータ形式は、HTMLである。
【0031】
項目「収集頻度」31Eには、AAA電力会社の東京都のWebページから元データを収集する頻度が設定される。つまり、収集ルール31は、予め定められた頻度で元データを収集することを指示するものである。データ収集部221は、項目「収集頻度」31Eに設定された頻度で元データを収集する。例えば、
図3において、元データの収集頻度は3分に1回である。収集ルールとして収集頻度を設定することで、公開情報のWebページ等の情報源ごとに、どの頻度で元データを収集するかを設定することが可能である。
【0032】
また、データ収集部221は、情報源による情報の提供形態が更新された場合、当該情報源に対応する収集ルールを更新する。情報の提供形態の更新とは、WebページのURLが変更された場合等である。WebページのURLが変更された場合、旧URLからリダイレクトされることがあるが、当該リダイレクトは一定期間にのみ限定されて行われる可能性がある。これに対し、例えば、データ収集部221は、収集ルールが示すURLにアクセスした際に、変更後のURLにリダイレクトされた場合、収集ルールが示す現在のURLをリダイレクト先のURLに更新する。これにより、情報源による情報の提供形態が更新されても元データを確実に収集することができる。
【0033】
情報抽出部222は、情報源ごとの元データから、情報源ごとに予め設定された抽出ルールに基づき、要部データを抽出する。
図4は、抽出ルールの一例を示す図である。
図4に示すように、抽出ルール41には、項目「説明」41A、項目「データID」41B、項目「情報ID」41Cおよび項目「抽出方法」41Dが含まれる。
【0034】
項目「説明」41Aには、抽出対象の要部データの説明が設定される。
図4において、項目「説明」41Aには、「東京都全体の停電軒数」というテキストが設定されている。抽出ルール41は、東京都内の停電軒数を示す数字を要部データとして抽出するためのルールである。項目「データID」41Bには、要部データ抽出元の元データに付与されたデータIDが設定される。例えば、項目「データID」41Bには、「AAA.tokyo」が設定されている。なお、データIDは、後述する第1識別情報の一例である。
【0035】
また、項目「情報ID」41Cには、情報IDが設定される。情報IDは、情報抽出部222が要部データに付与する識別情報である。
図4において、情報IDは、「AAA.tokyo.count」である。情報抽出部222は、元データから要部データを抽出すると、要部データに情報IDを付与して記憶部23に記憶する。なお、情報IDは、後述する第2識別情報の一例である。
【0036】
項目「抽出方法」41Dには、元データから要部データを抽出する抽出方法が設定される。情報抽出部222は、項目「抽出方法」41Dに設定された抽出方法で、元データから要部データを抽出する。
図4において、項目「抽出方法」41Dには、「「停電軒数」の文字列の右隣の数値を抽出」することを指示する命令文が設定されている。なお、
図4では、理解を容易にするため、情報抽出部222に対する実際の命令文ではなく、命令文が意味する内容を示している。情報抽出部222は、元データを単語解析して「停電軒数」という文字列を特定し、「停電軒数」の文字列の右隣に数値が記載されていれば、その数値を、要部データとして抽出する。この数字が東京都全体の停電軒数に相当する。
上記では、要部データとして一つの数値のみを抽出する例を示したが、要部データは、元データの複数の部分について、要部データを抽出してもよい。この場合、抽出ルールには、抽出すべき要部データごとに抽出方法が設定される。また、抽出された複数の要部データには、抽出ルールによる設定に基づき、それぞれ異なる情報IDが付与される。
【0037】
情報抽出部222は、元データに含まれる画像からテキストを認識し、認識したテキストを要部データに含めるものであってもよい。つまり、情報抽出部222は、画像から認識したテキストを、要部データとして抽出する。例えば、情報抽出部222は、抽出ルールに従って元データに含まれる画像を特定すると、特定した画像に対して文字認識処理等を施すことにより、当該画像に含まれるテキストを抽出する。情報抽出部222は、抽出したテキストの要部データに情報IDを付与して記憶部23に記憶する。なお、上述のように収集される元データには、静止画像または動画像等の画像が含まれていてもよく、情報抽出部222は、元データに含まれる静止画像または動画像等の画像からテキストを認識してもよい。
【0038】
配信情報生成部223は、情報源が提供する情報が示すトピックごとに予め設けられた配信情報テンプレートと要部データに基づき、配信情報を生成する。
各配信情報テンプレートは、各情報源が提供する情報が示すトピックに応じて、各情報源と対応付けられて、記憶部23に記憶される。配信情報テンプレートと各情報源とを対応付けての記憶は、例えば、情報源を特定できる情報と配信情報テンプレートを特定できる情報とを対応付けて記憶部23に記憶させること、言い換えれば、直接に配信情報テンプレートと情報源の対応関係を記憶部23に記憶させることで行える。または、配信情報テンプレートと情報源とを対応付けての記憶は、トピックを特定できる情報と当該トピックに対応する配信情報テンプレートとを特定できる情報とを対応付けて記憶部23に記憶させるとともに、情報源を特定できる情報とトピックを特定できる情報とを対応付けて記憶部23に記憶させること、言い換えれば、間接的に配信情報テンプレートと情報源の対応関係を記憶させることで行える。
トピックまたは配信情報テンプレートと情報源との対応関係には、種々のパターンがある。例えば、一つの情報源の元データから抽出される要部データに基づき、一つのトピックに属する一つの配信情報のみが生成される場合がある。この場合、一つの情報源と一つの配信情報テンプレートとが対応付けられて、記憶部23に記憶される。配信情報生成部223は、元データを収集した情報源が提供する情報が示すトピックに対応する配信情報テンプレートとして、当該情報源と対応付けられた一つの配信情報テンプレートを記憶部23から読み出し、当該配信情報テンプレートと元データから抽出された要部データとを用いて配信情報を生成する。
【0039】
また、例えば、上記のように、一つの情報源の元データから抽出される要部データに基づき、一つのトピックに属する一つの配信情報のみが生成される場合であって、かつ、複数の情報源のそれぞれの元データから抽出される要部データに基づき生成される配信情報が、それぞれ互いに共通の当該一つのトピックに属するものとなる場合がある。この場合、複数の情報源のそれぞれに対し、共通の一つの配信情報テンプレートが対応付けられて、記憶部23に記憶される。このような複数の情報源が対象となる場合、配信情報生成部223は、元データを収集した各情報源が提供する情報が示すトピックに対応する配信情報テンプレートとして、当該情報源と対応付けられた一つの配信情報テンプレートを記憶部23から読み出し、当該配信情報テンプレートと元データから抽出された要部データとを用いて配信情報を生成する。読み出される配信情報テンプレートは、複数の情報源に共通のものである。例えば、複数の電力会社の各Webページ(情報源)から元データを収集し、これらのWebページが提供する情報が示すトピックが、いずれも上述のような停電軒数に関するものである場合、配信情報生成部223は、上記各Webページに共通の停電軒数に関する配信情報テンプレートを記憶部23から読み出して、当該配信情報テンプレートを用いて配信情報を生成する。また、例えば、同一の路線の運行情報を、複数の情報提供会社の各Webページ(情報源)が提供している場合、配信情報生成部223は、所定の収集頻度で収集された当該各Webページが提供する運行情報を含む情報(元データ)から抽出された運行情報(要部データ)のうち、最も早く更新された運行情報に基づき、配信情報を生成する。この場合も、配信情報生成部223は、上記各Webページに共通の運行情報に関する配信情報テンプレートを記憶部23から読み出して、当該配信情報テンプレートを用いて配信情報を生成する。
【0040】
また、例えば、一つの情報源の元データから抽出される複数の要部データに基づき、複数のトピックに属する複数の配信情報が生成される場合がある。この場合、一つの情報源と複数の配信情報テンプレートとが対応付けられて、記憶部23に記憶される。また、この場合の複数の要部データは、複数のトピックのそれぞれに応じたものとなるため、当該要部データのそれぞれには、トピックに応じて異なる情報IDが付与されることとなる。配信情報生成部223は、複数の配信情報テンプレートを記憶部23から読み出し、これらの配信情報テンプレートとそれぞれの配信情報テンプレートに対応する要部データとを用いて複数の配信情報を生成する。例えば、AAA電力会社が提供する一つのWebページに電力供給量と停電軒数の2つのトピックの情報が含まれる場合、配信情報生成部223は、電力供給量に関する配信情報テンプレートを用いた配信情報を生成し、さらに停電軒数に関する配信情報テンプレートを用いた配信情報を生成する。なお、このように、一つの情報源の元データから抽出される複数の要部データに基づき、複数のトピックに属する複数の配信情報が生成される場合、配信情報生成部223は、複数の配信情報をすべて生成するものであってもよいし、更新された要部データに基づく配信情報のみを生成するものであってもよい。
また、例えば、一つの情報源の元データから抽出される要部データに基づき、一つのトピックに属する複数の配信情報が生成される場合がある。同一の要部データを用いた一つのトピックであっても、例えば、配信先に応じて、配信情報として配信される表現のパターンを使い分けたいことがあるためである。この場合、一つの情報源と複数の配信情報テンプレートとが対応付けられて、記憶部23に記憶される。これらの複数の配信情報テンプレートは、いずれも一つのトピックに属する配信情報に関するが、例えば、互いに文章表現等が異なるものである。配信情報生成部223は、複数の配信情報テンプレートを記憶部23から読み出し、これらの複数の配信情報テンプレートと、同一の要部データとを用いて複数の配信情報を生成する。
【0041】
また、例えば、複数の情報源の元データからそれぞれ抽出される要部データを統合して、一つのトピックに属する一つの配信情報が生成される場合がある。この場合、複数の情報源のそれぞれに対し、共通の一つの配信情報テンプレートが対応付けられて、記憶部23に記憶される。また、この場合の配信情報テンプレートは、複数の情報源から抽出される要部データとともに用いることで、初めて一つの配信情報を生成できるようなものである。例えば、AAA電力会社による東京都の停電軒数に関する第1のWebページと、当該電力会社による神奈川県の停電軒数に関する第2のWebページとから、元データが収集された場合、配信情報生成部223は、共通の一つの配信情報テンプレートを記憶部23から読み出し、東京都の停電軒数および神奈川県の停電軒数の両方を示した一つの配信情報を生成する。
【0042】
図5は、配信情報テンプレートの一例を示す図である。
図6は、配信情報例(1)である配信情報61を示す図である。
図5に示すように、配信情報テンプレート51は、「東京都内で{{情報ID:AAA.tokyo.count}}軒の停電が発生中」といった短文のテキストのテンプレートである。配信情報テンプレート51には、要部データを挿入する挿入箇所51Aとして、「{{情報ID:AAA.tokyo.count}}」が設けられている。配信情報生成部223は、停電軒数を示す要部データを挿入箇所51Aに挿入することにより、
図6に示す配信情報61を生成する。配信情報61は、要部データとして「100」の数字が抽出され、情報ID「AAA.tokyo.count」が付されている場合に、その要部データ「100」が挿入箇所51Aに挿入された例を示すものである。
【0043】
図7は、配信情報例(2)である配信情報71を示す図である。配信情報71は、BBB県における火災発生状況を示す情報であり、BBB県における火災発生場所の位置情報71AおよびBBB県の地図画像71Bが含まれる。なお、「BBB県」は、実施の形態の説明のために用いられる架空の県名である。配信情報71の生成に使用された配信情報テンプレートに対応するトピックは、「BBB県における火災発生状況」である。また、地図画像71Bが示す地図上には、火災発生場所を示すポイント画像71Cが描画され、さらに、ポイント画像71Cから所定ピクセル離れた位置に、火災を示すアイコン画像71Dが描画されている。
【0044】
配信情報生成部223は、トピックが「BBB県における火災発生状況」である元データが収集されると、当該トピックに対応する配信情報テンプレートを記憶部23から読み出す。そして、配信情報生成部223は、当該配信情報テンプレートの位置挿入欄に、要部データである位置情報71Aが示す緯度CCCおよび経度DDDを挿入し、地図上にポイント画像71Cとアイコン画像71Dとが重畳された地図画像71Bを描画(レンダリング)することにより、配信情報71を生成する。なお、実際には、「CCC」には具体的な緯度の値が記載され、「DDD」には具体的な経度の値が記載されることとなる。また、配信情報生成部223は、当該配信情報テンプレートの位置挿入欄に、要部データである位置情報71Aが示す緯度CCCおよび経度DDDを表示することに代えて、または、同緯度CCCおよび経度DDDを挿入することに加えて、同緯度CCCおよび経度DDDから特定される具体的な地名を挿入して、配信情報71を生成してもよい。
【0045】
また、配信情報に地図情報が含まれる場合、配信情報テンプレートとして単一の地域を示す互いに色違いの地図情報を含む複数の配信情報テンプレートを、一つの情報源と紐付けて記憶部23に記憶させておいてもよい。配信情報生成部223は、当該情報源から抽出された要部データの内容に応じて、記憶部23に記憶されたこれらの複数の配信情報テンプレートのうち配信情報を生成するための配信情報テンプレートを選択する。例えば、災害の緊急性に応じて色違いとした同一の地域を示す地図情報を含む複数の配信情報テンプレートを記憶部23に記憶しておく。配信情報生成部223は、災害の緊急性に関する要部データが入力されると、当該要部データが示す災害の緊急性に応じた配信情報テンプレートを読み出し、災害の緊急性に応じた色違いの地図情報を含む配信情報を生成する。
【0046】
配信情報生成部223は、情報源が提供する情報が更新された場合に、配信情報を生成するものでもよい。例えば、配信情報生成部223は、ある情報源が提供する情報として新たに収集された元データが、同一の情報源が提供する情報として前回に収集された元データと一致しない場合、情報源が提供する情報が更新されたと判断し、新たに収集された元データから抽出された要部データを用いて、配信情報を更新する。
【0047】
また、配信情報生成部223は、情報源が提供する情報として新たに収集された元データから抽出された要部データが、同一の情報源が提供する情報として前回に収集された元データから抽出された要部データと一致しない場合、元データが更新された結果、要部データが更新されたものと判断し、新たに抽出された要部データを用いて配信情報を更新するものでもよい。
【0048】
なお、配信情報生成部223は、一つの情報源から複数の要部データが抽出される場合、全ての要部データについて更新の有無を確認してもよいし、一部の要部データのみについて更新の有無を確認してもよい。
一部の要部データのみに基づいて更新の有無を確認する場合、例えば、情報抽出部222が、情報源が提供する情報が更新された時期を示す更新時期情報を、要部データとして抽出する。更新時期情報は、例えば、更新日または更新日時を示す情報である。配信情報生成部223は、複数の要部データのうち、更新時期情報を示す要部データに基づいて、情報源が提供する情報が更新されたか否かを判断する。前回の配信情報生成のときから更新時期情報が更新されていた場合、配信情報生成部223は、情報源が提供する情報が更新されたと判定し、同一の情報源から収集された元データから新たに抽出された要部データを用いて、配信情報を生成する。この場合、一部の要部データのみ、具体的には更新時期情報のみに基づいて更新の有無を確認すればよいので、情報源から抽出された全ての要部データについて前回の配信情報生成のときからの更新の有無を確認する場合と比べて、情報処理装置2は、更新の有無の確認に要する処理負荷を低減できる。
【0049】
また、データ収集部221は、元データに第1識別情報を付与し、元データと第1識別情報とを紐付けて記憶部23に保存する。第1識別情報は、例えば、
図3においてデータIDとして示した「AAA.tokyo」である。情報抽出部222は、記憶部23に記憶された元データの中から第1識別情報と紐付いた元データを特定し、要部データの抽出対象として記憶部23から読み出す。情報抽出部222は、特定した元データから要部データを抽出し、抽出した要部データに第2識別情報を付与して、要部データと第2識別情報とを紐付けて記憶部23に保存する。第2識別情報は、例えば、
図4において情報IDとして示した「AAA.tokyo.count」である。配信情報生成部223は、配信情報テンプレート内に予め設定された第2識別情報の挿入箇所に、第2識別情報と紐づけられた要部データを挿入する。挿入箇所は、例えば、
図5において挿入箇所51Aとして示した「{{情報ID:AAA.tokyo.count}}」である。これにより、配信情報生成部223は、識別情報を利用して配信情報を生成することができる。
【0050】
配信情報送信部224は、予め設定された配信ルールに基づき、配信情報を配信先に送信する。
図8は、配信ルール81を示す図である。
図8に示すように、配信ルール81には、項目「トピック」81Aおよび項目「配信先」81Bが含まれる。項目「トピック」81Aには、配信情報のトピックが設定される。
図8において、項目「トピック」81Aには、「AAAの停電情報」というテキストが設定されている。つまり、配信ルール81は、電力会社AAAの停電情報に関する配信情報(例えば、
図6の配信情報61)を送信するためのルールである。
【0051】
項目「配信先」81Bには、配信情報の配信先が設定される。つまり、配信ルール81は、配信情報の配信先を指示するものである。配信情報送信部224は、項目「配信先」81Bに設定された配信先に、配信情報を送信する。
図8において、配信先は、システムEEE、システムFFF、およびシステムGGGである。例えば、配信ルール81は、トピックに紐付けて記憶部23に記憶されている。配信情報送信部224は、記憶部23に記憶された配信ルールの中から、配信情報のトピックに対応する配信ルール81を特定し、特定した配信ルール81が示す配信先である、システムEEE、システムFFF、およびシステムGGGに対して、配信情報を送信する。これにより、情報処理装置2は、予め設定された配信先に配信情報を送信することができる。
【0052】
また、配信情報送信部224は、配信ルールが示す配信時期に、配信情報を送信する。例えば、
図8に示した配信ルール81に配信時期を設定する項目を含めておく。配信情報送信部224は、記憶部23に記憶された配信ルールの中から、配信情報のトピックに対応する配信ルール81を特定し、特定した配信ルール81が示す配信時期に、配信情報を送信する。これにより、情報処理装置2は、予め設定された配信時期に配信情報を送信することができる。
【0053】
図9は、実施の形態1に係る情報処理方法を示すフローチャートである。
データ収集部221が、各種サーバから、複数の情報源を対象として、情報源が提供する情報を、情報源ごとに元データとして収集する(ステップST1)。
情報抽出部222が、情報源ごとの元データから、情報源ごとに予め設定された抽出ルールに基づき、要部データを抽出する(ステップST2)。
配信情報生成部223が、トピックごとに予め設けられた配信情報テンプレートと要部データとに基づき、配信情報を生成する(ステップST3)。
配信情報送信部224が、予め設定された配信ルールに基づき、配信情報を配信先に送信する(ステップST4)。
【0054】
以上のように、実施の形態1に係る情報処理装置2は、複数の情報源を対象として、情報源が提供する情報を、情報源ごとに元データとして収集するデータ収集部221と、情報源ごとの元データから、情報源ごとに予め設定された抽出ルールに基づき、要部データを抽出する情報抽出部222と、情報源が提供する情報が示すトピックごとに予め設けられた配信情報テンプレートと要部データとに基づき、配信情報を生成する配信情報生成部223を備える。情報処理装置2は、情報源が提供する情報が示すトピックごとに予め設けられた配信情報テンプレートと要部データとに基づき、配信情報を生成するので、様々なトピックに応じた意図どおりの配信情報を自動的に生成することができる。
より具体的には、実施の形態1に係る情報処理装置2では、情報源が提供する情報が示すトピックごとに予め配信情報テンプレートが設けられることから、各情報源が提供する情報に応じて、各情報源と配信情報テンプレートとを予め対応付けて記憶させておくことができる。そして、各情報源に対応付けられた配信情報テンプレートに従って、各情報源が提供する情報のうち、どの情報を要部データとして抽出するか、そして、どのように要部データを配信情報テンプレートに適用するかを、予め明確に設定しておくことができる。したがって、実施の形態1に係る情報処理装置2では、配信者の意図どおりの配信情報を自動的に生成することができる。
【0055】
実施の形態1に係る情報処理装置2において、配信情報生成部223は、情報源が提供する情報が更新された場合に配信情報を生成する。これにより、情報処理装置2は、情報源が提供する情報が更新された際に、この更新を配信情報に反映させることができる。言い換えれば、実施の形態1に係る情報処理装置2は、情報源が提供する情報が更新されていない場合、不要な配信情報の生成を行うことがない。
【0056】
実施の形態1に係る情報処理装置2において、情報抽出部222は、情報源が提供する情報が更新された時期を示す更新時期情報を、要部データに含めて抽出する。配信情報生成部223は、情報源が提供する情報が更新されたか否かを、更新時期情報に基づいて判断する。情報処理装置2は、要部データに含まれる更新時期情報について更新の有無を確認すればよいので、更新の有無の確認に要する処理負荷を低減できる。
【0057】
実施の形態1に係る情報処理装置2において、データ収集部221は、情報源ごとに予め設定された収集ルールに基づき、元データを収集する。所望の収集ルールを設定することにより、情報処理装置2は、所望の収集方法で元データを収集することができる。
【0058】
実施の形態1に係る情報処理装置2において、収集ルールは、予め定められた頻度で元データを収集することを指示するものである。データ収集部221は、収集ルールに基づき、頻度で元データを収集する。これにより、情報処理装置2は、予め定められた頻度で元データを収集することができる。
【0059】
実施の形態1に係る情報処理装置2において、データ収集部221は、情報源による情報の提供形態が更新された場合、当該情報源に対応する収集ルールを更新する。これにより、情報処理装置2は、情報源による情報の提供形態が更新されても元データを収集することができる。
【0060】
実施の形態1に係る情報処理装置2において、情報抽出部222は、元データに含まれる画像からテキストを認識し、認識したテキストを要部データに含める。これにより、情報処理装置2は、画像から認識したテキストを、要部データとして抽出することが可能である。
【0061】
実施の形態1に係る情報処理装置2において、データ収集部221は、元データに第1識別情報を付与し、元データと第1識別情報とを紐付けて記憶部23に保存する。情報抽出部222は、第1識別情報に基づき要部データの抽出対象となる元データを特定する。情報抽出部222は、特定した元データから抽出した要部データに対して第2識別情報を付与し、要部データと第2識別情報とを紐付けて記憶部23に保存する。配信情報生成部223は、配信情報テンプレート内に予め設定された第2識別情報の挿入箇所に第2識別情報と紐づけられた要部データを挿入する。これにより、配信情報生成部223は、識別情報を利用して配信情報を生成することができる。
【0062】
実施の形態1に係る情報処理装置2において、配信情報送信部224は、予め設定された配信ルールに基づき、配信情報を配信先に送信する。所望の配信ルールを設定することにより、情報処理装置2は、所望の配信方法で配信情報を配信することができる。
【0063】
実施の形態1に係る情報処理装置2において、配信情報送信部224は、配信ルールが示す配信時期に、配信情報を送信する。これにより、情報処理装置2は、予め設定された配信時期に配信情報を送信することができる。
【0064】
実施の形態1に係る情報処理装置2において、配信情報送信部224は、配信ルールが示す配信先に、配信情報を送信する。これにより、情報処理装置2は、予め設定された配信先に配信情報を送信することができる。
【0065】
実施の形態1に係るプログラムはコンピュータに実行されることにより、コンピュータを、情報処理装置2として機能させるので、様々なトピックに応じた意図どおりの配信情報を自動的に生成する情報処理装置2を提供することができる。
【0066】
実施の形態1に係る情報処理方法は、データ収集部221が、複数の情報源を対象として、情報源が提供する情報を、情報源ごとに元データとして収集するステップと、情報抽出部222が、情報源ごとの元データから、情報源ごとに予め設定された抽出ルールに基づき、要部データを抽出するステップと、配信情報生成部223が、情報源が提供する情報が示すトピックごとに予め設けられた配信情報テンプレートと要部データとに基づき、配信情報を生成するステップを備える。これにより、様々なトピックに応じた意図どおりの配信情報を自動的に生成することができる。
【0067】
実施の形態2.
図10は、実施の形態2に係る情報処理システム1Aの構成を示すブロック図である。情報処理システム1Aは、情報処理装置2A、ユーザ端末3、Webサーバ4、SNSサーバ5および公共情報サーバ6が、ネットワーク7を介して接続されたシステムである。情報処理装置2Aは、情報配信サービスで提供される配信情報を生成するサーバであり、複数の情報源を対象として、情報源が提供する情報を、情報源ごとに元データとして収集し、元データから要部データを抽出する。さらに、情報処理装置2Aは、予め設定された集約ルールに基づき、要部データを集約した集約情報を生成し、配信情報テンプレートと集約情報とに基づき配信情報を生成し、生成した配信情報を配信先に送信する。なお、実施の形態2において、実施の形態1と共通する構成等については、同一の符号を付し、または、同一の用語を使用し、詳細な説明は省略する。
【0068】
集約情報は、1次情報である集約元の要部データを集約して得られる2次情報であり、例えば、集約元の要部データ全体の傾向を示す情報である。ユーザは、集約情報を含む配信情報を参照することにより、例えば集約元の要部データ全体の傾向を認識可能である。
【0069】
情報配信サービスを提供する情報処理装置2Aは、通信部21、演算部22Aおよび記憶部23Aを備える。通信部21は、ネットワーク7を介して、ユーザ端末3または各種サーバと通信を行う。例えば、通信部21は、LTE、3G、4Gまたは5G等の通信方式によるモバイル通信が可能なユーザ端末3との間で、ネットワーク7を介して通信可能である。演算部22Aは、情報処理装置2Aの全体動作を制御する。演算部22Aは、配信情報の生成と送信を行うための情報処理アプリケーションを実行することで、各種の機能を実現する。
【0070】
記憶部23Aは、情報処理アプリケーション、および演算部22Aの演算処理に用いる情報を記憶する。例えば、記憶部23Aは、元データの収集ルール、要部データの抽出ルールおよび集約ルールを、対象となる複数の情報源のそれぞれに対応付けて記憶し、配信情報テンプレートを様々なトピックのそれぞれに対応付けて記憶し、配信情報を配信するための配信ルールを記憶する。
【0071】
演算部22Aは、データ収集部221、情報抽出部222、配信情報生成部223A、配信情報送信部224および集約処理部225を備える。演算部22Aが情報処理アプリケーションを実行することにより、データ収集部221、データ収集部221、情報抽出部222、配信情報生成部223A、配信情報送信部224、および集約処理部225の各機能が実現される。例えば、情報処理装置2Aは、ハードウェア構成として、
図2に示した、通信インタフェース100、入出力インタフェース101、プロセッサ102およびメモリ103を有する。情報処理装置2Aが備えるデータ収集部221、情報抽出部222、配信情報生成部223A、配信情報送信部224および集約処理部225の各機能は、これらのハードウェア構成により実現される。
【0072】
図11は、実施の形態2に係る情報処理方法を示すフローチャートである。
データ収集部221が、各種サーバから、複数の情報源を対象として、情報源が提供する情報を、情報源ごとに元データとして収集する(ステップST1A)。
情報抽出部222が、情報源ごとの元データから、情報源ごとに予め設定された抽出ルールに基づき、要部データを抽出する(ステップST2A)。
集約処理部225が、予め設定された集約ルールに基づき、要部データを集約した集約情報を生成する(ステップST3A)。
配信情報生成部223が、トピックごとに予め設けられた配信情報テンプレートと集約情報とに基づき、配信情報を生成する(ステップST4A)。
配信情報送信部224が、予め設定された配信ルールに基づき、配信情報を配信先に送信する(ステップST5A)。
【0073】
図12は、集約ルール91を示す図である。
図12に示すように、集約ルール91には、例えば、項目「説明」91A、項目「集約元の情報ID」91B、項目「集約方法」91Cおよび項目「情報ID」91Dが含まれる。
【0074】
項目「説明」91Aには、集約ルール91の説明が設定される。例えば、実施の形態1で説明した「AAA電力会社」のWebページという情報源について、AAA電力会社が提供するWebサイトは、上述の東京都の停電軒数情報に加え、AAA電力会社管内の東京都以外の自治体(例えば、埼玉、千葉)ごとの停電軒数に関する情報も、同Webサイト内にそれぞれの自治体に対応して設けられたWebページを用いて、東京都の停電軒数情報と同様な形式で提供しているものとする。これらの複数のWebページのそれぞれも、互いに異なる情報源である。
図12において、項目「説明」91Aには「AAA電力会社管内の全ての停電軒数」というテキストが設定されている。つまり、集約ルール91は、AAA電力会社の管内における全ての停電軒数を示すために、複数の要部データを集約するためのルールである。項目「集約元の情報ID」91Bには、集約すべき全ての要部データにそれぞれ付与された互いに異なる情報IDが設定される。例えば、項目「集約元の情報ID」91Bには、東京都の停電軒数を示す「AAA.tokyo.count」、埼玉県の停電軒数を示す「AAA.saitama.count」、千葉県の停電軒数を示す「AAA.chiba.count」等を含む複数の要部データの情報IDが設定されている。
【0075】
項目「集約方法」91Cには、項目「集約元の情報ID」91Bに情報IDが設定された複数の要部データを集約する集約方法が設定される。集約処理部225は、項目「集約方法」91Cに設定された集約方法で要部データを集約する。
図12において、項目「集約方法」91Cには、「集約元の数値を合計」と設定されている。集約処理部225は、項目「集約方法」91Cに設定された集約方法に従い、複数の要部データそれぞれが示す停電軒数を合計した集約情報を生成する。
【0076】
項目「情報ID」91Dには、集約情報に付与される情報IDが設定される。当該情報IDは、集約処理部225が集約情報に付与する識別情報である。
図12において、集約情報の情報IDは、「AAA.all.count」である。集約処理部225は、集約情報を生成すると、生成した集約情報に情報IDを付与して記憶部23Aに記憶させる。配信情報生成部223Aは、配信情報テンプレートと集約情報とに基づき、配信情報を生成する。この場合の配信情報テンプレートは、例えば、「AAA電力会社管内で{{情報ID:AAA.all.count}}軒の停電が発生中」といった短文のテキストのテンプレートである。この配信情報テンプレートには、集約情報を挿入する挿入箇所として、「{{情報ID:AAA.all.count}}」が設けられている。配信情報生成部223Aは、停電軒数を示す集約情報を挿入箇所に挿入することにより、配信情報を生成する。例えば、集約情報が「800」の数字を示す場合、配信情報は、「AAA電力会社管内で800軒の停電が発生中」となる。
また、配信情報生成部223Aは、要部データと集約情報の両方を配信情報テンプレートに挿入することによって、配信情報を生成してもよい。この場合の配信情報テンプレートは、例えば、「AAA電力会社管内全体で{{情報ID:AAA.all.count}}軒の停電が発生中。内訳は、東京都{{情報ID:AAA.tokyo.count}}軒、埼玉県{{情報ID:AAA.saitama.count}}、千葉県{情報ID:AAA.chiba.count}}、・・・。」といったテキストのテンプレートである。配信情報生成部223Aは、停電軒数を示す集約情報と要部データを、それぞれの該当する挿入箇所に挿入することにより、配信情報を生成する。例えば、集約情報が「800」の数字を示し、東京都、埼玉県および千葉県の停電軒数を示す要部データが、それぞれ「100」、「150」および「50」の数字を示す場合、配信情報は、「AAA電力会社管内で800軒の停電が発生中。内訳は、東京都100軒、埼玉県150軒、千葉県50件、・・・。」となる。なお、配信情報生成部223Aが要部データと集約情報をいずれも配信情報テンプレートに挿入することによって、配信情報を生成する場合、挿入される要部データは、集約情報の生成に用いられた要部データとは異なる要部データであってもよい。
【0077】
集約ルールは、情報源ごとに予め設定される。例えば、ある一つの集約ルールは、集約情報を生成するために必要な要部データを抽出すべき複数の情報源にそれぞれ対応付けられて記憶部23Aに記憶される。集約処理部225は、記憶部23Aに記憶された集約ルールから、元データを収集した情報源に対応する集約ルールを特定し、特定した集約ルールに基づき集約情報を生成する。配信情報生成部223Aは、例えば、集約元の要部データを抽出した元データのトピックに基づき記憶部23Aから配信情報テンプレートを読み出し、当該配信情報テンプレートと集約情報とに基づき、配信情報を生成する。これにより、集約処理部225は、情報源に応じた集約情報を生成することができる。
なお、集約ルールは、上記の例のとおり、複数の情報源の元データからそれぞれ抽出された要部データに基づいて集約情報を生成することを示すものでもよいし、一つの情報源の元データから抽出した複数の要部データに基づいて集約情報を生成することを示すものであってもよい。後者の場合、例えば、一つの集約ルールが一つの情報源のみに対応付けられて記憶部23Aに記憶される。
【0078】
集約処理部225は、集約ルールに基づき要部データを統計的に処理することで、集約情報を生成する。
図12に示した集約ルール91では、要部データが示す数値を合計したが、これに限定されるものではない、例えば、要部データの統計的処理には、要部データが示す数値の単純平均の算出、重み付け平均の算出、中央値の算出、フィルタリング等がある。これにより、情報処理装置2Aは、集約元の要部データ全体の統計的な傾向を認識可能な配信情報を生成することができる。
【0079】
また、データ収集部221は、元データに第1識別情報(
図3に示したデータID)を付与し、元データと第1識別情報とを紐付けて記憶部23Aに保存する。情報抽出部222は、記憶部23Aに記憶された元データから、第1識別情報と紐付いた元データを特定し、要部データの抽出対象として記憶部23Aから読み出す。情報抽出部222は、特定した元データから抽出した要部データに第2識別情報を付与し、要部データと第2識別情報とを紐付けて記憶部23Aに保存する。第2識別情報は、例えば、
図12において情報IDとして示した「AAA.all.count」である。配信情報生成部223Aは、配信情報テンプレート内に予め設定された第2識別情報の挿入箇所に、第2識別情報と紐づけられた要部データを挿入する。これにより、配信情報生成部223Aは、識別情報を利用して配信情報を生成することができる。
【0080】
以上のように、実施の形態2に係る情報処理装置2Aは、予め設定された集約ルールに基づき、要部データを集約した集約情報を生成する集約処理部225を備える。配信情報生成部224Aは、配信情報テンプレートと集約情報とに基づき、配信情報を生成する。これにより、情報処理装置2Aは、例えば、集約元の要部データ全体の傾向を認識可能な配信情報を生成することができる。
【0081】
実施の形態2に係る情報処理装置2Aにおいて、集約処理部225は、情報源ごとに予め設定された集約ルールに基づき、集約情報を生成する。これにより、情報処理装置2Aは、情報源に応じた集約情報を生成することができる。
【0082】
実施の形態2に係る情報処理装置2Aにおいて、集約処理部225は、集約ルールに基づき要部データを統計的に処理することで、集約情報を生成する。これにより、情報処理装置2Aは、集約元の要部データ全体の統計的な傾向を認識可能な配信情報を生成することができる。
【0083】
なお、各実施の形態の組み合わせまたは実施の形態のそれぞれの任意の構成要素の変形もしくは実施の形態のそれぞれにおいて任意の構成要素の省略が可能である。
【符号の説明】
【0084】
1,1A 情報処理システム、2,2A 情報処理装置、3 ユーザ端末、4 Webサーバ、5 SNSサーバ、6 公共情報サーバ、7 ネットワーク、21 通信部、22,22A 演算部、23,23A 記憶部、31 収集ルール、41 抽出ルール、51 配信情報テンプレート、51A 挿入箇所、61 配信情報、71 配信情報、71A 位置情報、71B 地図画像、71C ポイント画像、71D アイコン画像、81 配信ルール、91 集約ルール、100 通信インタフェース、101 入出力インタフェース、102 プロセッサ、103 メモリ、221 データ収集部、222 情報抽出部、223,223A 配信情報生成部、224,224A 配信情報送信部、225 集約処理部。
【要約】 (修正有)
【課題】様々なトピックに応じた配信情報を生成する情報処理装置、プログラム及び情報処理方法を提供する。
【解決手段】情報処理システム1において、情報処理装置2は、複数の情報源を対象として、情報源が提供する情報を、情報源毎に元データとして収集するデータ収集部221と、情報源毎の元データから、情報源毎に予め設定された抽出ルールに基づき、配信情報の生成に用いる情報である要部データを抽出する情報抽出部222と、情報源が提供する情報が示すトピック毎に予め設けられた配信情報テンプレートと要部データとに基づき、配信情報を生成する配信情報生成部223と、を備える。
【選択図】
図1