特開2023-59866 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 楽天株式会社の特許一覧

特開2023-59866情報処理装置、情報処理方法、およびプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023059866

(43)【公開日】2023-04-27

(54)【発明の名称】情報処理装置、情報処理方法、およびプログラム

(51)【国際特許分類】

G06T 7/00 20170101AFI20230420BHJP

G06T 1/00 20060101ALI20230420BHJP

G06V 20/13 20220101ALI20230420BHJP

【ＦＩ】

G06T7/00 640

G06T7/00 350B

G06T1/00 285

G06V20/13

【審査請求】有

【請求項の数】5

【出願形態】ＯＬ

(21)【出願番号】P 2022168120

(22)【出願日】2022-10-20

(62)【分割の表示】P 2022507688の分割

【原出願日】2021-10-15

(71)【出願人】

【識別番号】399037405

【氏名又は名称】楽天グループ株式会社

(74)【代理人】

【識別番号】100109380

【弁理士】

【氏名又は名称】小西恵

(74)【代理人】

【識別番号】100109036

【弁理士】

【氏名又は名称】永岡重幸

(72)【発明者】

【氏名】ポリヤプラムヴィネーラジュ

(72)【発明者】

【氏名】アンダーソンジェラマイアー

(72)【発明者】

【氏名】バンサルマヤンク

【テーマコード（参考）】

5B057

5L096

【Ｆターム（参考）】

5B057AA14

5B057CA01

5B057CA08

5B057CA12

5B057CA16

5B057CB01

5B057CB08

5B057CB12

5B057CB16

5B057DA13

5B057DA16

5B057DB02

5B057DB06

5B057DB09

5B057DC02

5B057DC40

5L096AA02

5L096AA06

5L096DA01

5L096EA11

5L096EA33

5L096EA39

5L096FA32

5L096FA33

5L096FA52

5L096FA62

5L096GA19

5L096GA30

5L096GA32

5L096HA11

5L096KA04

5L096MA07

(57)【要約】（修正有）

【課題】衛星画像から人口を予測する際に、精度よく人口を予測することのできる情報処理装置、情報処理方法およびプログラムを提供する。
【解決手段】情報処理装置（１）は、衛星画像を取得する取得手段（１２）と、前記衛星画像を入力とした機械学習により、前記衛星画像に対する人口値の分布を表す第１画像を回帰的に推定して生成する第１の生成手段（１３）と、前記機械学習により、前記衛星画像に対する土地の種類の確率を表す第２画像を推定して生成する第２の生成手段（１３）と、を有する。
【選択図】図１

【特許請求の範囲】

【請求項1】

衛星画像を入力とした機械学習により、前記衛星画像に対する人口値の分布を表す第１画像を回帰的に推定して生成する生成手段と、
前記推定された第１画像と、位置情報を取得可能な所定のアプリケーションを起動している端末装置の位置情報から、人口の流れを推定する推定手段と、
を有することを特徴とする情報処理装置。

【請求項2】

前記衛星画像は、地球観測光学衛星により得られる複数のスペクトルバンドを使用したデータを、スペクトルごとに正規化した画像であることを特徴とする請求項１に記載の情報処理装置。

【請求項3】

前記推定手段は、前記端末装置の位置情報により、前記端末装置のユーザの自宅位置を推定し、当該自宅位置の分布と前記第１画像による人口の分布を用いて、地理的加重回帰モデルにより各端末装置に対するスケーリング係数を算出し、当該端末装置の動きと前記スケーリング係数から、前記人口の流れを推定することを特徴とする請求項１または２に記載の情報処理装置。

【請求項4】

情報処理装置が実行する情報処理方法であって、
衛星画像を入力とした機械学習により、前記衛星画像に対する人口値の分布を表す第１画像を回帰的に推定して生成する生成工程と、
前記推定された第１画像と、位置情報を取得可能な所定のアプリケーションを起動している端末装置の位置情報から、人口の流れを推定する推定工程と、
を有することを特徴とする情報処理方法。

【請求項5】

情報処理をコンピュータに実行させるための情報処理プログラムであって、該プログラムは、前記コンピュータに、
衛星画像を入力とした機械学習により、前記衛星画像に対する人口値の分布を表す第１画像を回帰的に推定して生成する生成処理と、
前記推定された第１画像と、位置情報を取得可能な所定のアプリケーションを起動している端末装置の位置情報から、人口の流れを推定する推定処理と、を含む処理を実行させるためのものである、
情報処理プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理装置、情報処理方法、およびプログラムに関し、特に、機械学習により人口を予測するための技術に関する。

【背景技術】

【0002】

世界の人口は時々刻々と動的に変化している。ある時点での人口および人の流れを推定することは、公衆衛生・商業といったあらゆる目的に活用可能である。例えば、人口および人の流れの推定は、疾病の影響分析、災害の軽減対策、店舗の立地計画、都市計画、交通工学などに役立ちうる。

【0003】

世界的に公開されている人口のデータセットの１つに、国による調査データである国勢調査（Ｃｅｎｓｕｓ）データがある。世界の多くの国では、人口の規模、構成、人口統計に関する情報を収集するために、数年に１度の頻度で国勢調査を実施している。
一方で、人口を予測するための技術の研究も進められている。非特許文献１には、衛星画像をニューラルネットワーク（ＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ））による学習モデルに入力して、所定エリアにおける人口を直接予測する手法が記載されている。当該衛星画像は、種々の地球観測光学衛星による画像であり、当該光学衛星の公式サイトにより取得可能である。また、当該学習モデルは、衛星画像と、国勢調査による人口データを用いて作成された学習モデルである。

【先行技術文献】

【非特許文献】

【0004】

【非特許文献1】ＣａｌｅｂＲｏｂｉｎｓｏｎ，ＦｒｅｄＨｏｈｍａｎ，ＢｉｓｔｒａＤｉｌｋｉｎａ， “Ａｄｅｅｐｌｅａｒｎｉｎｇａｐｐｒｏａｃｈｆｏｒｐｏｐｕｌａｔｉｏｎｅｓｔｉｍａｔｉｏｎｆｒｏｍｓａｔｅｌｌｉｔｅｉｍａｇｅｒｙ”，Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ１ｓｔＡＣＭＳＩＧＳＰＡＴＩＡＬＷｏｒｋｓｈｏｐｏｎＧｅｏｓｐａｔｉａｌＨｕｍａｎｉｔｉｅｓ，４７－５４，２０１７

【発明の概要】

【発明が解決しようとする課題】

【0005】

国勢調査のデータは、通常、５年から１０年に一度しか収集・公表されず、また、人口は行政による施策に十分なレベルのデータであるために空間的な解像度も低い。また、調査を主体とした国勢調査により、その国の人口状況を包括的に把握することができるが、実現には費用が掛かり、広い範囲の人口を把握することもできない。
また、非特許文献１に開示される手法によれば、衛星画像から人口を予測することが可能となるが、使用される学習モデルは、衛星画像と、国勢調査による人口データを用いて作成された学習モデルである。すなわち、正解データとして人口データのみを使用して作成された学習モデルであり、人口予測の精度が低いという課題がある。

【0006】

本発明は上記課題に鑑みてなされたものであり、精度よく人口を予測するための技術を提供することを目的とする。

【課題を解決するための手段】

【0007】

上記課題を解決するために、本発明による情報処理装置の一態様は、衛星画像を取得する取得手段と、前記衛星画像を入力とした機械学習により、前記衛星画像に対する人口値の分布を表す第１画像を回帰的に推定して生成する第１の生成手段と、前記機械学習により、前記衛星画像に対する土地の種類の確率を表す第２画像を推定して生成する第２の生成手段と、を有する。

【0008】

前記衛星画像は、地球観測光学衛星により得られる複数のスペクトルバンドを使用したデータを、スペクトルごとに正規化した画像でありうる。

【0009】

前記情報処理装置は、前記機械学習のための学習モデルを学習させる学習手段をさらに有し、前記学習手段は、複数の前記衛星画像を入力データとして用い、当該複数の衛星画像に対応する、土地分類を表す画像と人口を表す画像とを正解データとして用いて、前記学習モデルを学習させてもよい。

【0010】

前記学習モデルは、前記衛星画像を入力する第１パートと、推定した前記第１画像と前記第２画像とを出力する第２パートで構成され、前記第１パートは複数の畳み込み層を含み、前記第２パートは第１ブランチと第２ブランチを有し、当該第１ブランチと当該第２ブランチはそれぞれ、複数の畳み込み層を含みうる。

【0011】

前記第１ブランチは、前記第１画像を推定するための回帰モデルとして構成され、前記第２ブランチは、前記第２画像を推定するための分類モデルとして構成されうる。

【0012】

前記分類モデルは、前記土地分類について、水、都市、耕作地、草地、森林、裸地を分類可能に構成されうる。

【0013】

前記学習手段は、前記正解データに対する、前記回帰モデルの出力と前記分類モデルの出力を評価する２つの損失関数を使用して前記学習モデルに対する学習を行いうる。

【0014】

前記回帰モデルの出力に適用する損失関数は平均二乗誤差であり、前記分類モデルの出力に適用する損失関数はＳｏｆｔｍａｘ交差エントロピー誤差でありうる。

【0015】

前記情報処理装置は、前記推定された第１画像と、位置情報を取得可能な所定のアプリケーションを起動している端末装置の位置情報から、人口の流れを推定する第３の推定手段を有してもよい。
前記第３の推定手段は、前記端末装置の位置情報により、前記端末装置のユーザの自宅位置を推定し、当該自宅位置の分布と前記第１画像による人口の分布を用いて、地理的加重回帰モデルにより各端末装置に対するスケーリング係数を算出し、当該端末装置の動きと前記スケーリング係数から、前記人口の流れを推定しうる。

【0016】

本発明に係る情報処理方法の一態様は、情報処理装置が実行する情報処理方法であって、衛星画像を取得する取得工程と、前記衛星画像を入力とした機械学習により、前記衛星画像に対する人口値の分布を表す第１画像を回帰的に推定して生成する第１の生成工程と、前記機械学習により、前記衛星画像に対する土地の種類の確率を表す第２画像を推定して生成する第２の生成工程と、を有する。

【0017】

本発明に係る情報処理プログラムの一態様は、情報処理をコンピュータに実行させるための情報処理プログラムであって、該プログラムは、前記コンピュータに、衛星画像を取得する取得処理と、前記衛星画像を入力とした機械学習により、前記衛星画像に対する人口値の分布を表す第１画像を回帰的に推定して生成する第１の生成処理と、前記機械学習により、前記衛星画像に対する土地の種類の確率を表す第２画像を推定して生成する第２の生成処理と、を含む処理を実行させるためのものである。

【発明の効果】

【0018】

本発明によれば、精度よく人口を予測することが可能となる。
上記した本発明の目的、態様及び効果並びに上記されなかった本発明の目的、態様及び効果は、当業者であれば添付図面及び請求の範囲の記載を参照することにより下記の発明を実施するための形態から理解できるであろう。

【図面の簡単な説明】

【0019】

【図1】図１は、本発明の実施形態による情報処理装置の機能構成の一例を示すブロック図である。

【図2】図２は、本発明の実施形態による情報処理装置のハードウェア構成の一例を示すブロックである。

【図3】図３は、学習用データの一例を示す図である。

【図4】図４は、学習モデルのアーキテクチャの一例を示す。

【図5】図５は、第１実施形態による処理のフローチャートを示す。

【図6】図６は、衛星画像に対する人口の正解データと予測データを示す図である。

【図7】図７は、衛星画像に対する土地分類の正解データと予測データを示す図である。

【図8】図８は、衛星画像に対する土地分類の都市のクラスを抽出した正解データと予測データを示す図である。

【図9】図９は、第２実施形態による処理の流れを示す。

【図10】図１０は、スケーリング係数βの算出の概念を説明するための図である。

【発明を実施するための形態】

【0020】

以下、添付図面を参照して、本発明を実施するための実施形態について詳細に説明する。以下に開示される構成要素のうち、同一機能を有するものには同一の符号を付し、その説明を省略する。なお、以下に開示される実施形態は、本発明の実現手段としての一例であり、本発明が適用される装置の構成や各種条件によって適宜修正または変更されるべきものであり、本発明は以下の実施形態に限定されるものではない。また、本実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。

【0021】

［第１実施形態］
＜情報処理装置の機能構成＞
本実施形態による情報処理装置は、本実施形態による情報処理装置は、衛星画像を取得して、当該衛星画像を学習モデルに適用することにより、人口データ（人口値の分布を表す第１画像）と土地分類データ（土地の種類の確率（土地分類とも称する）を表す第２画像）を予測して生成する。当該学習モデルは、衛星画像を入力として、人口データと土地分類データを正解データとして用いて学習された学習モデルである。

【0022】

図１は、本実施形態による情報処理装置１の機能構成の一例を示す。
図１に示す情報処理装置１は、学習部１１、取得部１２、推定部１３、出力部１４、および学習モデル記憶部１５を有する。学習モデル記憶部１５が学習モデル１６を記憶している。

【0023】

学習部１１は、学習用（教師用）データ１７を用いて、機械学習のための、ニューラルネットワーク（ＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ））による深層学習モデル（以下、学習モデル）を学習させる。当該学習モデルは、後述するように、回帰アプローチと分類アプローチによるマルチタスク学習を行う学習モデルである。本実施形態では、学習用データ１７として、衛星画像、人口データ、および土地分類データを用いる。具体的には、学習部１５は、衛星画像を入力データ、人口データと土地分類データを正解データ（ＧｒｏｕｎｄＴｒｕｔｈ／地上検証データ）として用いて、学習モデルを作成する。学習モデルを作成するために用いる学習用データ１７について、図３を参照して説明する。図３は、学習用データ１７の一例を示す図である。

【0024】

図３（ａ）は、センチネル２号から得られた衛星画像の例であり、日本の東京周辺のエリアの衛星画像を示す。衛星画像は、種々の地球観測光学衛星から取得可能であり、例えば、欧州の地球観測光学衛星であるセンチネル２号（Ｓｅｎｔｉｎｅｌ－２）から取得される。センチネル２号による衛生画像は、利用可能になった時点で日々追加（更新）されうる。当該画像は、当該光学衛星に関する所定のウェブサイトからダウンロード可能である。
本実施形態では、センチネル２号から得られる衛星データから、３０ｍの解像度（空間分解能）で集約した画像を、衛星画像として用いるものとする。また、当該衛星画像は、青、赤、赤、近赤外（ＮＩＲ（ＮｅａｒＩｎｆｒａｒｅｄ））、短波長赤外（ＳＷＩＲ（ＳｈｏｒｔｗａｖｅＩｎｆｒａｒｅｄ）１）、ＳＷＩＲ２といった６つのスペクトルバンドを使用したマルチスペクトルデータであるとする。このように、衛星画像は６つのスペクトルバンドを使用したデータであり、カラー画像であるが、図３（ａ）ではグレースケール画像で示している。

【0025】

なお、学習部１１による学習プロセスの収束を早めるために、衛星画像は（１）式のように正規化（平均が０で分散が１）されてもよい。

【数1】

ここで、Ｘは衛星画像を表し、iは衛星画像の各スペクトルバンドを表し、ｍｅａｎは平均を表し、ｓｔｄは標準偏差を表す。

【0026】

学習部１１は、学習プロセスの効率化のために、衛星画像をパッチ（画像パッチ）に切り出し、当該衛星画像を分割した分割衛星画像を生成する。本実施形態では、学習部１１は、図３（ａ）に示す衛星画像を、５１２×５１２ピクセルの分割衛星画像に分割する。

【0027】

図３（ｂ）は、土地分類データの一例を示す。ここでは、土地分類データの一例として、ＬＵＬＣ（土地利用および土地被覆（ＬａｎｄＵｓｅａｎｄＬａｎｄＣｏｖｅｒ））データ（ＬＵＬＣを表す画像）を示す。ＬＵＬＣデータは、各地域における所定の調査機関により取得可能である。日本におけるＬＵＬＣデータは、宇宙航空研究開発機構（ＪＡＸＡ）の地球観測研究センター（ＥＯＲＣ）によるウェブサイトから取得可能である。ＪＡＸＡは、宇宙航航空分野の研究開発を行う機関である。ＪＡＸＡＥＯＲＣから得られるＬＵＬＣデータは、例えば、水、都市、耕作地、草地、森林、裸地、といった様々なクラスが分類可能（識別可能）に表されており、当該クラスに応じて、カラーで表されているが、図３（ｂ）ではグレースケール画像で示している。
図３（ｂ）に示す土地分類データは、図３（ａ）に示す衛星画像と同様に３０ｍの（空間）解像度であるとする。学習部１１は、学習プロセスのために、土地分類データをパッチに切り出し、当該土地分類データを分割した分割土地分類データ（分割土地分類画像）を生成する。本実施形態では、学習部１１は、図３（ｂ）に示す土地分類データを、５１２×５１２ピクセルの分割土地分類データに分割する。

【0028】

図３（ｃ）は、人口データ（人口分布を表す画像）を示す。本実施形態では、人口データは、人口の数値データは、例えば、Ｗｏｒｌｄｐｏｐによるウェブサイトから取得可能である。得られた数値データを地図へマッピングすることにより、図３（ｃ）のような人口データが得られる。当該マッピング処理は学習部１１により行われてもよいし、情報処理装置１における不図示の処理部により行われてもよい。あるいは、外部装置により当該マッピング処理が行われることにより得られた人口データを学習部１１が取得してもよい。当該人口データは人口（人口密度）に応じてカラーで表されうるが、図３（ｃ）ではグレースケール画像で示している。
図３（ｃ）に示す人口分布は、１００ｍの（空間）解像度で示されているものとする。学習部１１は、学習プロセスのために、人口データをパッチに切り出し、当該人口データを分割した分割人口データを生成する。本実施形態では、学習部１１は、図３（ｃ）に示す人口データを、１５４×１５４ピクセルの分割人口データに分割する。

【0029】

学習部１１は、前述したような、分割衛星画像、分割土地分類データ、および分割人口データを用いて学習モデル１６を学習することができる。具体的には、分割衛星画像を入力として、当該分割衛星画像に対する土地分類データと人口データ（分割土地分類データと分割人口データ）の両方を出力する学習モデル１６を学習し、ここで、土地分類データと人口データの両方が補完的にパラメータを学習する（学習モデルを学習させる）。当該学習モデルのアーキテクチャの一例については、図４を用いて後述する。
学習部１１は、学習済みの学習モデル１６を、学習モデル記憶部１５に格納する。

【0030】

取得部１２は、人口データと土地分類データ（本実施形態ではＬＵＬＣデータ）を予測する際に学習モデル１６に入力するための衛星画像を取得する。当該衛星画像は、図３（ａ）を参照して説明した画像と同様の画像であり、地球観測光学衛星から取得可能な画像である。取得部１２は、当該取得された画像に対して、式（１）を用いて説明したような正規化処理を行ってもよいし、当該正規化処理が施された衛星画像を取得してもよい。取得部１２は、衛星画像を推定部１３に出力する。また、取得部１２は、正規化処理が施された衛星画像を推定部１３に出力しうる。

【0031】

推定部１３は、取得部１２から出力された衛星画像を、図３（ａ）を参照して説明した手法と同様に分割し、分割衛星画像を生成する。そして、推定部１３は、当該分割衛星画像を学習モデル１６に適用し、教師あり学習を行うことにより、当該分割衛星画像に対する人口データおよび土地分類データを推定（予測）して生成する。推定の手順については、図４を用いて後述する。
また、推定部１３は、生成した人口データを用いて、人の流れを予測するための処理を行う。当該処理については、第２実施形態において説明する。

【0032】

出力部１４は、推定部１３による推定結果（生成した人口データと土地分類データ）を出力する。例えば、出力部１４は、当該推定結果を表示部２６に出力（表示）してもよいし、通信Ｉ／Ｆ２７を介して外部装置（不図示）に出力してもよい。

【0033】

＜情報処理装置のハードウェア構成＞
図２は、本実施形態による情報処理装置１のハードウェア構成の一例を示すブロック図である。
本実施形態による情報処理装置１は、単一または複数の、あらゆるコンピュータ、モバイルデバイス、または他のいかなる処理プラットフォーム上にも実装することができる。
図２を参照して、情報処理装置１は、単一のコンピュータに実装される例が示されているが、本実施形態による情報処理装置１は、複数のコンピュータを含むコンピュータシステムに実装されてよい。複数のコンピュータは、有線または無線のネットワークにより相互通信可能に接続されてよい。

【0034】

図２に示すように、情報処理装置１は、ＣＰＵ２１と、ＲＯＭ２２と、ＲＡＭ２３と、ＨＤＤ２４と、入力部２５と、表示部２６と、通信Ｉ／Ｆ２７と、システムバス２８とを備えてよい。情報処理装置１はまた、外部メモリを備えてよい。
ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）２１は、情報処理装置１における動作を統括的に制御するものであり、データ伝送路であるシステムバス２８を介して、各構成部（２２～２７）を制御する。

【0035】

ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）２２は、ＣＰＵ２１が処理を実行するために必要な制御プログラム等を記憶する不揮発性メモリである。なお、当該プログラムは、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）２４、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）等の不揮発性メモリや着脱可能な記憶媒体（不図示）等の外部メモリに記憶されていてもよい。
ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）２３は、揮発性メモリであり、ＣＰＵ８１の主メモリ、ワークエリア等として機能する。すなわち、ＣＰＵ２１は、処理の実行に際してＲＯＭ２２から必要なプログラム等をＲＡＭ２３にロードし、当該プログラム等を実行することで各種の機能動作を実現する。

【0036】

ＨＤＤ２４は、例えば、ＣＰＵ２１がプログラムを用いた処理を行う際に必要な各種データや各種情報等を記憶している。また、ＨＤＤ２４には、例えば、ＣＰＵ２１がプログラム等を用いた処理を行うことにより得られた各種データや各種情報等が記憶される。
入力部２５は、キーボードやマウス等のポインティングデバイスにより構成される。
表示部２６は、液晶ディスプレイ（ＬＣＤ）等のモニターにより構成される。表示部２６は、キーワード特定処理で使用される各種パラメータや、他の装置との通信で使用される通信パラメータ等を情報処理装置１へ指示入力するためのユーザインタフェースであるＧＵＩ（ＧｒａｐｈｉｃａｌＵｓｅｒＩｎｔｅｒｆａｃｅ）を提供してよい。

【0037】

通信Ｉ／Ｆ２７は、情報処理装置１と外部装置との通信を制御するインタフェースである。
通信Ｉ／Ｆ２７は、ネットワークとのインタフェースを提供し、ネットワークを介して、外部装置との通信を実行する。例えば、通信Ｉ／Ｆ２７を介して、外部装置との間で各種データや各種パラメータ等が送受信される。本実施形態では、通信Ｉ／Ｆ２７は、イーサネット（登録商標）等の通信規格に準拠する有線ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）や専用線を介した通信を実行してよい。ただし、本実施形態で利用可能なネットワークはこれに限定されず、無線ネットワークで構成されてもよい。この無線ネットワークは、Ｂｌｕｅｔｏｏｔｈ（登録商標）、ＺｉｇＢｅｅ（登録商標）、ＵＷＢ（ＵｌｔｒａＷｉｄｅＢａｎｄ）等の無線ＰＡＮ（ＰｅｒｓｏｎａｌＡｒｅａＮｅｔｗｏｒｋ）を含む。また、Ｗｉ－Ｆｉ（ＷｉｒｅｌｅｓｓＦｉｄｅｌｉｔｙ）（登録商標）等の無線ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）や、ＷｉＭＡＸ（登録商標）等の無線ＭＡＮ（ＭｅｔｒｏｐｏｌｉｔａｎＡｒｅａＮｅｔｗｏｒｋ）を含む。さらに、ＬＴＥ／３Ｇ、４Ｇ、５Ｇ等の無線ＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）を含む。なお、ネットワークは、各機器を相互に通信可能に接続し、通信が可能であればよく、通信の規格、規模、構成は上記に限定されない。

【0038】

図１に示す情報処理装置１の各要素のうち少なくとも一部の機能は、ＣＰＵ２１がプログラムを実行することで実現することができる。ただし、図１に示す情報処理装置１の各要素のうち少なくとも一部の機能が専用のハードウェアとして動作するようにしてもよい。この場合、専用のハードウェアは、ＣＰＵ２１の制御に基づいて動作する。

【0039】

＜学習モデルのアーキテクチャ＞
学習部１１により作成される学習モデル１６のアーキテクチャの一例を図４に示す。
学習モデル１６は、上述したように、分割衛星画像を入力として、分割土地分類データと人口データの両方を出力する学習モデルである。なお、図４の説明において、分割衛星画像、分割土地分類データ、分割人口データをそれぞれ、衛星画像、土地分類データ、人口データと称する。図４において、各ブロック間で示される数字は、ピクセルサイズを表す。

【0040】

学習モデル１６は２つのパート（第１パートと第２パート）に分かれている。第１パートは最後のブロックで分岐（Ｓｐｌｉｔ）して第２パートへ続き、第２パートは、人口データ（人口値の分布を示す画像データ）を出力する人口予測ブランチと土地分類データ（土地の種類の確率を示す画像データ）を出力する土地分類予測ブランチとを有する。

【0041】

第１パートは４つのＣＮＮブロック（畳み込み層（２Ｃｏｎｖ２Ｄ（２次元畳み込み層）））を含んで構成される。第１パートはさらに、ダウンサンプリングブロック（プーリング層（ＭａｘＰｏｏｌｉｎｇ２Ｄ（２次元プーリング層）））を含んで構成される。

【0042】

第１パートに入力されるデータは、５１２×５１２ピクセルの衛星画像である。当該衛星画像は、上述のように６つのスペクトルバンドを使用したマルチスペクトルデータである。すなわち、入力レイヤ数は６である。各演算ブロックには６４個のフィルターがあり、３×３のカーネルを持つ各ブロックには、活性化関数としてＲｅＬＵ（ＲｅｃｔｉｆｉｅｄＬｉｎｅａｒＵｎｉｔ）が使用される。

【0043】

第２パートは２つのブランチ（人口予測ブランチと土地分類予測ブランチ）を有し、それぞれが３つのＣＮＮブロックを含んで構成される。
第２パートにおいて、人口予測ブランチ（図４の第２パートの上側）は、入力された衛星画像から回帰的に人口データを予測するために、機械学習における回帰アプローチを用いる。
また、土地分類予測ブランチ（図４の第２パートの下側）は、入力された衛星画像から土地分類に対する複数クラスを予測するために、機械学習における分類アプローチ（分類手法）を用いる。当該クラスは、例えば、水、都市、耕作地、草地、森林、裸地の６クラスを含み、当該クラスに分類されないものは、分類不可として分類される。
このように、学習モデル１６は、人口データ予測のための回帰アプローチによる回帰モデルと、土地分類クラス分類のための分類アプローチによる分類モデルの両方を１つのネットワークに備える学習モデルである。

【0044】

人口データと土地分類データ（それぞれ図３（ｃ）と図３（ｂ）を参照）の（空間）解像度は異なるため、第２パートにおける２つのＣＮＮによる出力データの（空間）解像度は、正解データの解像度に合わせている。
例えば、図４に示すように、人口予測ブランチでは、バイリニア補間ブロックにより、２５６×２５６ピクセルから１５４×１５４ピクセルのピクセルサイズにリサイズされる。バイリニア補間は、縦方向と横方向の２方向に対して、線形（リニア）補間する方法である。
また、土地分類予測ブランチでは、２５６×２５６ピクセルから５１２×５１２ピクセルにアップサンプリングされ、これは、土地分類正解データの（空間）解像度（すなわち３０ｍ）に相当する。

【0045】

前述のように、本実施形態による学習モデル１６は、人口データ予測のための回帰アプローチと、土地分類クラス分類のための両方を１つのネットワークで扱う。このような、静的な人口分布予測と土地分類予測を備える学習モデル１６の作成および更新のために、２つの損失関数による評価値を使用する。
第１の損失関数は、平均二乗誤差（ＭＳＥ：ＭｅａｎＳｑｕａｒｅｄＥｒｒｏｒ）であり、第２の損失関数は、Ｓｏｆｔｍａｘ交差エントロピー誤差（ＣＥ：ＣｒｏｓｓＥｎｔｒｏｐｙＬｏｓｓ）である。

【0046】

ＭＳＥは、（２）式のように表される。

【数2】

ここで、ｙ_ｉはある分割衛星画像ｉに対して観測された人口（正解データとしての人口データ）であり、ｙ_ｉ＾は当該分割衛星画像ｉに対して予測された人口である。ｎは、１衛星画像における分割衛星画像数（すなわち、１衛星画像から予測される人口データの数）である。

【0047】

また、ＣＥは、（３）式のように表される。

【数3】

ここで、ｔｉとｓｉは、それぞれ、土地分類のクラスｉ（Ｃは全クラス）に対する正解データ（正解値）と推定データである。当該推定データは、土地分類予測ブランチで得られたＣＮＮスコアに対して活性化関数（ｓｏｆｔｍａｘ）が適用された値である。
学習部１５は、この２つの損失関数の両方の評価値（ＭＳＥとＣＥ）が十分に安定するように、学習モデル１６の各種パラメータを更新する。このように、２つの評価値から学習モデル１６のパラメータが更新されることにより、より精度の高い人口データおよび土地分類データ（一例としてＬＵＬＣデータ）の予測が可能となる。

【0048】

＜処理の流れ＞
図５に、情報処理装置１により実行される処理のフローチャートを示す。
Ｓ５１で、取得部１２は、衛星画像を取得する。上述のように、衛星画像は例えばセンチネル２号により取得されたデータである。当該衛星画像は、式（１）を用いて説明したように、正規化処理が施された衛星画像であってもよい。
続いて、Ｓ５２で、推定部１３は、取得部１１により取得された衛星画像をパッチに切り出し、当該衛星画像を分割した分割衛星画像（画像パッチ）を生成する。本実施形態では、推定部１３は、衛星画像を、５１２×５１２ピクセルの分割衛星画像に分割する。

【0049】

Ｓ５３は、Ｓ５２で生成された分割衛星画像ごとの処理である。Ｓ５３では、推定部１３は、分割衛星画像を入力として、図４を参照して説明したように作成された学習モデル１６を用いて当該分割衛星画像に対する、人口データと土地分類データとを推定（予測）して生成する。推定部１３は、当該推定処理を、取得部１１により取得された衛星画像における全分割衛星画像に対して行い、完了すると、処理はＳ５４へ進む。なお、当該推定処理は、複数の分割衛星画像に対して並行して行われてもよい。

【0050】

Ｓ５４では、出力部１４は、Ｓ５３の処理により得られた、全分割衛星画像に対する人口データと土地分類データを合成し、Ｓ５１で取得された衛星画像に対する人口データと土地分類データを生成し、当該データを推定結果として出力する。例えば、出力部１４は、推定結果を表示部２６に出力（表示）してもよいし、通信Ｉ／Ｆ２７を介して外部装置（不図示）に出力してもよい。

【0051】

＜性能評価＞
続いて、図４を参照して説明した学習モデル１６を用いた、衛星画像からの人口予測および土地分類予測の性能について説明する。

【0052】

（人口予測についての性能評価）
表１に、人口予測に関しての性能評価結果を示す。表１は、ある衛星画像に対する人口予測に関しての性能評価結果を示す。

【表1】

表１において、「検証データの範囲」は、１衛星画像から分割された１分割衛星画像（５１２×５１２ピクセル）のエリアにおいて取りうる人口の正解データの範囲である。すなわち、１分割衛星画像に対する正解データとしての人口は、０．０～２１４．２８の間の数である。
「予測データの範囲」は、１衛星画像から分割された１分割衛星画像（５１２×５１２ピクセル）から、図４に示す学習モデルに従って推定部１３により推定された人口の予測データの範囲である。すなわち、１分割衛星画像に対する予測データとしての人口は、０．０～１６３．５８の間の数である。

【0053】

「寄与率（Ｅｘｐｌａｉｎｅｄｖａｒｉａｎｃｅ）」と「決定係数（Ｃｏｅｆｆｉｃｉｅｎｔｏｆｄｅｔｅｒｍｉｎａｔｉｏｎ）」は、機械学習における評価指標である。
寄与率は、予測データが検証データにどれだけ近づけたかを示す値であり、１に近いほど精度が高いことを表す。決定係数は、値が大きいほど予測能力が高いことを意味し、最大値は１である。

【0054】

「ＲＭＳＥ」は、平均二乗誤差の平方根（ＲｏｏｔＭｅａｎＳｑｕａｒｅｄＥｒｒｏｒ）であり、式（４）のように表される。

【数4】

式（４）において、ｉは分割衛星画像のインデックスであり、ｎは１衛星画像における分割衛星画像数の数である。また、ｙ_ｉはｉ番目の分割衛星画像に対する人口の予測データであり、ｙ＾_ｉはｉ番目の分割衛星画像に対する正解データとしての人口である。

【0055】

「ＭＡＥ」は、平均絶対誤差（ＭｅａｎＡｂｓｏｌｕｔｅＥｒｒｏｒ）であり、式（５）のように表される。

【数5】

式（４）と同様に、ｉは分割衛星画像のインデックスであり、ｎは１衛星画像における分割衛星画像数の数である。また、ｙ_ｉはｉ番目の分割衛星画像に対する人口の予測データであり、ｙ＾_ｉはｉ番目の分割衛星画像に対する正解データとしての人口である。

【0056】

図６に、衛星画像に対する人口の正解データ（図６（ａ））と予測データ（図６（ｂ））を示す。具体的には、図６（ａ）は、図３（ａ）に示す衛星画像（日本の東京周辺のエリアの衛星画像）に対応する、人口の正解データを示し、図６（ｂ）は、図３（ａ）に示す衛星画像が図４に示す学習モデル１６に適用された場合の人口の予測データである。すなわち、当該人口の予測データは、当該衛星画像の分割衛星画像が学習モデル１６に入力された場合の人口予測ブランチ（図４の第２パートの上側）における出力データを、全分割衛星画像について合成したデータである。なお、図６（ａ）と図６（ｂ）に示す人口データは、本来はいずれもカラー画像であるが、ここではグレースケール画像で示している。いずれの図においても、傾向として、色が黒に近いほど、人口が高いことを表す。

【0057】

図６（ａ）と図６（ｂ）とを比較すると、図６（ａ）で白く表示されている海の部分に対応する図６（ｂ）の予測データを除いて、同じような人口分布の傾向を示していることがわかる。すなわち、両図において、人口が少ないエリアと多いエリアの分布は同様な傾向であることがわかる。
一方で、表１の結果から、正解（検証）データの範囲より、予測データの範囲が小さく、最大値は予測データの方が小さい傾向にある。この傾向が、図６（ｂ）でも表れており、黒く表示されている人口が特に多いエリアが、図６（ａ）の正解データより図６（ｂ）の予測データの方が小さいことがわかる。このように、人口の特に多いエリアについては、正解データよりも小さく予測されたが、地図全体としての人口分布の傾向は両図で同様であり、本実施形態による学習モデル１６により、静的な人口分布を精度よく予測しているといえる。

【0058】

（土地分類予測についての性能評価）
表２に、ある衛星画像に対する土地分類予測についての性能評価の結果を示す。本実施形態では、図４に示す学習モデル１６の土地分類予測ブランチ（図４の第２パートの下側）で、６つのクラス（水、都市、耕作地、草地、森林、裸地）に加えて、当該６つのクラスに分類されなかったクラスである分類不可（不能）が分類される。

【表2】

表２において、各クラスについての「適合率（Ｐｒｅｃｉｓｉｏｎ）」、「再現率（Ｒｅｃａｌｌ）」、および、「Ｆ値（Ｆ１－ｓｃｏｒｅ）」と、「正解率（Ａｃｃｕｒａｃｙ）」は、機械学習における分類の評価指標である。
適合率は、本当の正解の数のうち、機械学習の予測としても正解している割合を示す。
再現率は、機械学習の予測において正解のうち、本当の結果も正解である割合を示す。
Ｆ値は、適合率と再現率を用いた統計値であり、２×（適合率×再現率）／（適合率＋再現率）で算出される値である。Ｆ値は最大値１であり、高いほど分類の精度が高いことを表す。
また、正解率は、すべての予測のうち、正解した予測の割合を示す。
表２から、水と森林はより高い精度で予測されていることがわかる。一方、裸地は、かなり予測精度が低いことがわかる。

【0059】

図７に、衛星画像に対する土地分類の正解データ（図７（ａ））と予測データ（図７（ｂ））を示す。具体的には、図７（ａ）は、図３（ａ）に示す衛星画像（日本の東京周辺のエリアの衛星画像）に対応する、土地分類の正解データを示し、図７（ｂ）は、図３（ａ）に示す衛星画像が図４に示す学習モデル１６に適用された場合の土地分類の予測データである。すなわち、当該土地分類の予測データは、当該衛星画像の分割衛星画像が学習モデル１６に入力された場合の土地分類予測ブランチ（図４の第２パートの下側）における出力データを、全分割衛星画像について合成したデータである、図７（ａ）と図７（ｂ）に示す土地分類データは、本来は、いずれも各クラスを識別するカラー画像であるが、ここではグレースケール画像で示している。

【0060】

図７（ａ）と図７（ｂ）とを比較すると、両図に顕著な違いはなく、精度高く土地分類が予測されていることがわかる。表２から、裸地は予測精度が低いことを考慮すると、図３（ａ）の衛星画像において、裸地がないことも土地分類の予測データの精度が高い一つの理由と考えられる。

【0061】

図８に、図７（ａ）と図７（ｂ）における土地分類の正解データと予測データにおいて、クラス＝都市を抽出したデータを示す。図７と同様に、両図に顕著な違いはなく、精度高く都市エリアが予測されていることがわかる。

【0062】

このように、本実施形態では、衛星画像から人口および土地分類を予測することができるため、最新の衛星画像から人口および土地分類を予測することが可能となる。また、学習時に２つの正解データ（ＧｒｏｕｎｄＴｒｕｔｈ）を適用することにより、従来技術より精度よく、人口および土地分類を予測することが可能となる。このように、現在の実データに近い人口および土地分類のデータを提供できることにより、疾病の影響分析、災害の軽減対策、店舗の立地計画、都市・交通計画の最適な実施が可能となる。

【0063】

［第２実施形態］
第１実施形態では、衛星画像を学習モデル１６に適用することにより、人口と土地分類を予測した。本実施形態では、第１実施形態の手法に従って得られた予測人口データを用いて、人の流れを予測する手法について説明する。
本実施形態では、所定のアプリケーションをインストール（ダウンロード）している端末装置の位置情報を用いる。当該所定のアプリケーションをインストールしている端末装置の数は人口に対して少なく、また当該端末装置の分布は地域により偏りがある。このことを考慮し、本実施形態では、スケーリング係数を算出して、変化する端末装置の位置情報と当該スケーリング係数から人の流れを導出する。

【0064】

端末装置は、公衆回線または無線ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）等により無線通信が可能な、携帯電話、モバイル端末、小型ノートパソコン、タブレット型端末、スマートフォンといった装置である。
また、所定のアプリケーションは、少なくともＧＰＳ（ＧｌｏｂａｌＰｏｓｉｔｉｏｎｉｎｇＳｙｓｔｅｍ）と連携し、端末装置の位置情報は端末装置のＩＤ（識別子）と関連付けられているものとする。当該所定のアプリケーションは、例えば、通信事業者によって提供されうるものである。情報処理装置１は、端末装置の位置情報を取得可能に構成されている。
なお、以下の説明において、端末装置は、ユーザ（例えば人）により携帯（保持）されていることを想定し、当該所定のアプリケーションをインストールし、起動している端末装置を「ＡＵ（ＡｃｔｉｖｅＵｓｅｒ）端末」、当該端末装置の数を、「ＡＵ人口」と称しうる。

【0065】

図９に、本実施形態による処理の流れを説明する。当該処理は、情報処理装置１の推定部１３により実行される。
本実施形態の処理は、大きく３つのブロックに分けられる。
ブロック６１は、あるエリアの地図上に等間隔のグリッド（格子線）を引くことにより分けられた複数の区画（以下、グリッド）におけるＡＵ人口を示すＡＵ人口グリッドを生成するためのブロックである。本実施形態において、１グリッドは２００ｍ×２００ｍとするが、４００ｍ×４００ｍ等、別のサイズであってもよい。当該エリアにおけるグリッド数はｎとする。
ブロック６２は、各グリッドに対するスケーリング係数を生成するためのブロックである。
ブロック６３は、時間ごと（例えば、３時間ごとや２時間ごと）の人口グリッドを計算するためのブロックである。
以下、各ブロックにおける処理について説明する。

【0066】

ブロック６１では、まず、ブロック６１１において、推定部１３は、ＡＵ端末のユーザのホーム位置（自宅位置）を、ＡＵ端末のＩＤ（識別子）と関連付けて取得する。例えば、推定部１３は、過去1ヶ月間の午前０時から午前６時までのＡＵ端末の位置情報から得られる軌跡データから、地理的なセントロイド（中心）を計算することにより、当該ホーム位置を取得する。これは、午前０時から午前６時までの時間帯は、ほとんどのＡＵ端末のユーザは自宅にいるという仮定に基づく。
ブロック６１２において、推定部１３は、ブロック６１１で取得したＡＵ端末のユーザのホームの位置を、各グリッドにマッピング（空間結合）することにより、グリッドごとのＡＵ人口をカウントする。
ブロック６１３において、推定部１３は、ブロック６１２でカウントされた、各グリッドのＡＵ人口から、全体のＡＵ人口グリッドを生成する。

【0067】

ブロック６２では、ブロック６２１と６２２から開始する。ブロック６２１において、推定部１３は、ブロックＳ６１３で生成したＡＵ人口グリッドを取得する。また、ブロック６２２において、推定部１３は、第１実施形態の手法に従って得られた予測人口データを取得する。推定部１３は、当該予測人口データ（画像）を、強度に応じて複数のレベル値にサンプリングした人口分布データを作成する。そして、推定部１３は、当該人口分布データを、ＡＵ人口グリッドと同じサイズの各グリッドにマッピングする。これにより、各グリッドの予測人口データが反映された、全体の予測人口グリッドが生成される。
ブロック６２３において、推定部１２は、周知の地理的加重回帰（ＧｅｏｇｒａｐｈｉｃａｌｌｙＷｅｉｇｈｔｅｄＲｅｇｒｅｓｓｉｏｎ：ＧＷＲ）モデルを用いて、グリッドごとのスケーリング係数を推定する。ＧＷＲを用いることにより、データ（すなわち、グリッドごとのＡＵ人口）の局所的な不均一性に対処することが可能となる。

【0068】

本実施形態による地理的加重回帰モデルを、式（６）に示す。

【数6】

ここで、Ｙは予測人口（スケールアップされたＡＵ人口に対応）である。スケーリング係数β_０，・・・，β_ｎは、予測人口を用いて線形重回帰から得ることができる。β_０は切片であり、β_１，・・・，β_ｎはそれぞれ、１，・・，ｎ番目のグリッドにおけるＡＵ人口Ｘ_１，・・・，Ｘ_ｎに対するスケーリング係数である。Ｅは誤差項である。

【0069】

図１０は、スケーリング係数βの算出の概念を説明するための図である。図１０において黒丸はＡＵ端末の位置を示す。図１０からわかるように、領域１０１におけるＡＵ端末の数が標準であるとすると、領域１０２におけるＡＵ端末は密度が高く、領域１０３におけるＡＵ端末は密度が低い。このように、地域によりＡＵ端末の数の分布に差が生じる。これは、人口の多くが端末装置を保持しているとしても、ＡＵ端末の数は、所定のアプリケーションをインストールして起動している端末装置の数に限られ、当該装置のユーザの位置は、年齢や居住／活動地域等により均一に分布しないからである。
図１０に示す例の場合、領域１０２に対するスケーリング係数βは小さい値となり、領域１０１、領域１０３の順に大きくなる。

【0070】

ブロック６３では、まず、ブロック６３１において、推定部１３は、時空間ユーザリストを作成する。本実施形態では、当該時空間ユーザリストは、１時間ごとの、グリッド（２００ｍ×２００ｍ）ごとのＡＵ端末のリストである。
ブロック６３２では、ブロック６３１で生成されたリストに含まれるＡＵ端末に対して、該ＡＵ端末のＩＤに関連付けられた、該ＡＵ端末のホームの位置（ブロック６１１）に応じたスケーリング係数（ブロック６２３）をマッピングする。

【0071】

ブロック６３３では、推定部１３は、各グリッドにおける流出量（ｉｎｆｌｏｗ）と流入量（ｏｕｔｆｌｏｗ）を計算する。流入量と流出量はそれぞれ式（７）と式（８）のように表される。

【数7】

【数8】

ここで、Ｘは時間ｔｉにおける現在のグリッドを示し、ｕはＡＵ端末のＩＤを示し、ｓは各ユーザＩＤにマッピングされた（割り当てられた）スケーリング係数である。
時間ｔｉにおいてＸ番目のグリッドでは存在し、時間ｔｉ－１において存在しなかったＡＵユーザのスケーリング係数の合計が流入量となる。
一方、時間ｔｉにおいてＸ番目のグリッドでは存在せず、時間ｔｉ－１において存在したＡＵ端末のスケーリング係数の合計が流出量となる。

【0072】

ここまでの処理で、時間ごとの全グリッドにわたる人口の動きが取得され、最後に、ブロック６３４では、推定部１３は、連続する時間の人口グリッドを導出する。

【0073】

このように、本実施形態によれば、衛星画像から第１実施形態の手法に従って予測された人口データと、端末装置の位置情報から、人の流れを予測することが可能となる。これにより、例えば、特定のエリアへの混雑を検証でき、当該混雑に迅速に対処することが可能となる。
なお、本実施形態では、端末装置の位置情報に関連付けられる当該装置のＩＤを用いたが、ユーザの匿名性を保護しつつ、当該装置のユーザの性別や年齢を用いてもよい。これにより、性別や年齢に応じた人流が推定でき、多様なマーケティングの活用に資する。

【0074】

なお、上記において特定の実施形態が説明されているが、当該実施形態は単なる例示であり、本発明の範囲を限定する意図はない。本明細書に記載された装置及び方法は上記した以外の形態において具現化することができる。また、本発明の範囲から離れることなく、上記した実施形態に対して適宜、省略、置換及び変更をなすこともできる。かかる省略、置換及び変更をなした形態は、請求の範囲に記載されたもの及びこれらの均等物の範疇に含まれ、本発明の技術的範囲に属する。

【符号の説明】

【0075】

１：情報処理装置、１１：学習部、１２：取得部、１３：推定部、１４：出力部、１５：学習モデル記憶部、１６：学習モデル、１７：学習用データ

【図1】