(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-12-05
(54)【発明の名称】場所ベースの意味的類似性プラットフォーム
(51)【国際特許分類】
G06F 16/909 20190101AFI20241128BHJP
【FI】
G06F16/909
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2024556330
(86)(22)【出願日】2022-11-15
(85)【翻訳文提出日】2024-07-09
(86)【国際出願番号】 US2022079906
(87)【国際公開番号】W WO2023087032
(87)【国際公開日】2023-05-19
(32)【優先日】2021-11-15
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2021-12-02
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2022-11-14
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】506332063
【氏名又は名称】セールスフォース インコーポレイテッド
(71)【出願人】
【識別番号】524184574
【氏名又は名称】マッケンジー,グラント
(71)【出願人】
【識別番号】524184585
【氏名又は名称】バタースビー,サラ,イー.
(71)【出願人】
【識別番号】524184596
【氏名又は名称】セトラー,ヴィジャ,ラガヴァン
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100229448
【氏名又は名称】中槇 利明
(72)【発明者】
【氏名】マッケンジー,グラント
(72)【発明者】
【氏名】バタースビー,サラ,イー.
(72)【発明者】
【氏名】セトラー,ヴィジャ,ラガヴァン
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175DA03
(57)【要約】
方法は、データセットの視覚分析を提供する。方法は、コンピュータシステムで実行される。ユーザはデータソースを選択する。それに応答して、システムは、データソース内のデータの分析のための自然言語インターフェースを提示し、データソースから地理空間データポイントを選択するために、グラフィカルユーザインターフェース内にマップデータ視覚化を提示する。1つまたは複数の地理的地域の第1のセットを選択するための第1のユーザ入力を受信したことに応答して、システムは、1つまたは複数の統計的技法(例えば、ジェンセンシャノン情報量(JSD))を使用して、データソースからの社会経済的、人口統計学的、および/または地理的データフィールドの範囲に基づいて、1つまたは複数の地理的地域の第1のセットと1つまたは複数の地理的地域の第2のセットとの間の類似性を計算する。次いで、システムは、計算された類似性にしたがってマップデータ視覚化を更新して表示する。
【特許請求の範囲】
【請求項1】
データセットの視覚分析の方法であって、
1つまたは複数のプロセッサと、前記1つまたは複数のプロセッサによって実行されるように構成された1つまたは複数のプログラムを記憶するメモリとを有するコンピューティングシステムにおいて、
データソースのユーザ選択を受信するステップと、
前記データソース内のデータの分析のためのグラフィカルユーザインターフェースを提示するステップであって、前記データは地理空間データポイントを含む、ステップと、
前記グラフィカルユーザインターフェース内にマップデータ視覚化を提示するステップであって、前記マップデータ視覚化は複数の地理的地域を含み、各地理的地域はそれぞれの1つまたは複数の地理空間データポイントに対応する、ステップと、
前記複数の地理的地域のうちの1つまたは複数の地理的地域の第1のセットを選択するための第1のユーザ入力を受信したことに応答して、
1つまたは複数の統計的技法を使用して、前記データソースからのデータフィールドのセットに基づいて、前記1つまたは複数の地理的地域の第1のセットと前記複数の地理的地域のうちの1つまたは複数の地理的地域の第2のセットとの間の類似性を計算するステップと、
前記計算された類似性にしたがって前記マップデータ視覚化を更新して表示するステップと
を含む方法。
【請求項2】
前記データフィールドのセットは、1つまたは複数の社会経済的、人口統計学的、および地理的変数を含む、請求項1に記載の方法。
【請求項3】
前記マップデータ視覚化を更新することは、前記第2の1つまたは複数の地理的地域のうちの少なくとも1つの地理的地域をハイライト表示またはローライト表示することを含む、請求項1に記載の方法。
【請求項4】
前記マップデータ視覚化上の検索多角形の座標を選択するための第2のユーザ入力を受信したことに応答して、
前記座標に基づいて前記第2の1つまたは複数の地域を定義するステップ
をさらに含む、請求項1に記載の方法。
【請求項5】
前記1つまたは複数の地理的地域の第2のセットを識別するために、前記検索多角形の前記座標を、前記複数の地理的地域のうちの前記地理的地域の各々についての対応する地理空間データポイントと比較するステップ
をさらに含む、請求項4に記載の方法。
【請求項6】
前記データフィールドのセットの各データフィールドは、複数の重みのうちの対応する重みに関連付けられ、前記方法は、
前記複数の重みに基づいて前記類似性を計算するステップ
をさらに含む、請求項1に記載の方法。
【請求項7】
1つまたは複数のアフォーダンスを提供するステップであって、各アフォーダンスは前記データフィールドのセットのそれぞれのデータフィールドに対応する、ステップ
をさらに含む、請求項6に記載の方法。
【請求項8】
前記1つまたは複数のアフォーダンスのうちの第1のアフォーダンスを選択するための第2のユーザ入力を受信したことに応答して、
前記第1のアフォーダンスに対応する第1の属性に対応する第1の重みを調整して、重みの更新されたセットを取得するステップと、
前記1つまたは複数の統計的技法を使用して、前記重みの更新されたセットに基づいて、前記第1の1つまたは複数の地理的地域と前記第2の1つまたは複数の地理的地域との間の更新された類似性を計算するステップと、
前記更新された類似性にしたがって前記マップデータ視覚化を更新して表示するステップと
をさらに含む、請求項7に記載の方法。
【請求項9】
前記重みの更新されたセットを記憶するためのストアアフォーダンスを提供するステップと、
ユーザが前記ストアアフォーダンスを選択したことに応答して、
次のセッションのために、前記重みの更新されたセットをプリセットファイルに記憶するステップと
をさらに含む、請求項8に記載の方法。
【請求項10】
前記次のセッションのために、前記プリセットファイルを取り出し、前記1つまたは複数の地理的地域の第1のセットと前記1つまたは複数の地理的地域の第2のセットとの間の前記類似性を計算するために前記重みの更新されたセットを使用するステップ
をさらに含む、請求項9に記載の方法。
【請求項11】
前記マップデータ視覚化は、コロプレスマップを含み、前記計算された類似性にしたがって前記マップデータ視覚化を更新して表示するステップは、最大類似性から最小類似性への勾配を表示することを含む、請求項1に記載の方法。
【請求項12】
コロプレスマップを選択するための第1のアフォーダンスと、最大-最小マップを選択するための第2のアフォーダンスとを提供するステップと、
前記第1のアフォーダンスのユーザ選択に応答して、最大類似性から最小類似性への勾配を表示するステップと、
前記第2のアフォーダンスのユーザ選択に応答して、最も類似している地域および最も類似していない地域を表示するステップと
をさらに含む、請求項1に記載の方法。
【請求項13】
複数のアフォーダンスを提供するステップであって、各アフォーダンスはそれぞれの最大数の地域に対応する、ステップと、
前記複数のアフォーダンスのうちの1つのアフォーダンスのユーザ選択に応答して、前記アフォーダンスに対応する地域の最大数に基づいて、前記第2の1つまたは複数の地域内の最も類似している地域および最も類似していない地域を表示するステップと
をさらに含む、請求項1に記載の方法。
【請求項14】
複数のアフォーダンスを提供するステップであって、各アフォーダンスは複数の小地域のうちの小地域のそれぞれのサブセットに対応する、ステップと、
前記複数のアフォーダンスのうちのアフォーダンスのユーザ選択に応答して、
前記マップデータ視覚化の提示を中止するステップと、
前記グラフィカルユーザインターフェース内に代替のマップデータ視覚化を提示するステップであって、前記代替のマップデータ視覚化は、前記アフォーダンスに対応する小地域のサブセットを含む、ステップと
をさらに含む、請求項1に記載の方法。
【請求項15】
前記グラフィカルユーザインターフェースは第1の部分および第2の部分を含み、前記方法は、
前記マップデータ視覚化を前記第1の部分に表示するステップと、
前記第1の1つまたは複数の地理的地域と前記第2の1つまたは複数の地理的地域との間の前記類似性の要約を前記第2の部分に表示するステップと
をさらに含む、請求項1に記載の方法。
【請求項16】
前記地理的地域の各々は、それぞれの国勢統計区に対応する、請求項1に記載の方法。
【請求項17】
前記類似性を計算するステップは、前記データフィールドのセットについて、前記複数の地理的地域のうちの前記1つまたは複数の地理的地域の第1のセットおよび前記1つまたは複数の地理的地域の第2のセットのための意味的類似性行列を計算することを含む、請求項1に記載の方法。
【請求項18】
前記類似性を計算するステップは、前記1つまたは複数の地理的地域の第1のセットおよび前記1つまたは複数の地理的地域の第2のセットの地理的地域のペア間のジェンセンシャノン情報量(JSD)を計算することを含む、請求項1に記載の方法。
【請求項19】
データセットの視覚分析のためのコンピュータシステムであって、
1つまたは複数のプロセッサと、
メモリと
を備え、
前記メモリは、前記1つまたは複数のプロセッサによって実行されるように構成された1つまたは複数のプログラムを記憶し、前記1つまたは複数のプログラムは、
データソースのユーザ選択を受信するための命令と、
前記データソース内のデータの分析のためのグラフィカルユーザインターフェースを提示するための命令であって、前記データは地理空間データポイントを含む、命令と、
前記グラフィカルユーザインターフェース内にマップデータ視覚化を提示するための命令であって、前記マップデータ視覚化は複数の地理的地域を含み、各地理的地域はそれぞれの1つまたは複数の地理空間データポイントに対応する、命令と、
前記複数の地理的地域のうちの1つまたは複数の地理的地域の第1のセットを選択するための第1のユーザ入力を受信したことに応答して、
1つまたは複数の統計的技法を使用して、前記データソースからのデータフィールドのセットに基づいて、前記1つまたは複数の地理的地域の第1のセットと前記複数の地理的地域のうちの1つまたは複数の地理的地域の第2のセットとの間の類似性を計算するための命令と、
前記計算された類似性にしたがって前記マップデータ視覚化を更新して表示するための命令と
を含む、コンピュータシステム。
【請求項20】
ディスプレイと、1つまたは複数のプロセッサと、メモリとを有するコンピュータシステムによって実行されるように構成された1つまたは複数のプログラムを記憶する非一時的コンピュータ可読記憶媒体であって、前記1つまたは複数のプログラムは、
データソースのユーザ選択を受信するための命令と、
前記データソース内のデータの分析のためのグラフィカルユーザインターフェースを提示するための命令であって、前記データは地理空間データポイントを含む、命令と、
前記グラフィカルユーザインターフェース内にマップデータ視覚化を提示するための命令であって、前記マップデータ視覚化は複数の地理的地域を含み、各地理的地域はそれぞれの1つまたは複数の地理空間データポイントに対応する、命令と、
前記複数の地理的地域のうちの1つまたは複数の地理的地域の第1のセットを選択するための第1のユーザ入力を受信したことに応答して、
1つまたは複数の統計的技法を使用して、前記データソースからのデータフィールドのセットに基づいて、前記1つまたは複数の地理的地域の第1のセットと前記複数の地理的地域のうちの1つまたは複数の地理的地域の第2のセットとの間の類似性を計算するための命令と、
前記計算された類似性にしたがって前記マップデータ視覚化を更新して表示するための命令と
を含む、非一時的コンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
[関連出願への相互参照]
本出願は、(i)2021年11月15日に出願された「Place-Based Semantic Similarity Platform」と題する米国仮特許出願第63/279,667号、および(ii)2021年12月2日に出願された「Place-Based Semantic Similarity Platform」と題する米国仮特許出願第63/285,476号の優先権を主張する、2022年11月14日に出願された「Place-Based Semantic Similarity Platform」と題する米国特許出願第17/986,822号の継続出願であり、これらの各々は、その全体が参照により本明細書に組み込まれる。
【0002】
[技術分野]
開示される実装形態は、一般に、データ視覚化に関し、より詳細には、場所ベースの意味的類似性を提供するシステム、方法、およびユーザインターフェースに関する。
【背景技術】
【0003】
物体間の類似性は直感的に定義される。木と潅木は両方とも植物であるので類似している。一方で、木と共同住宅はどちらも高さを使用して説明されることが多いが、似て非なるものである。その核心において、物事を類似させるのが何であるか理解することは、非常に複雑かつ微妙である。例えば、研究者は、類似性の概念を、特徴と、人々が類似性を個々に理解し評価する方法とに分解することを目的として、類似性の概念を研究してきた。
【0004】
木、潅木、および共同住宅のような物体間の比較は、明白で直感的な評価のように見えるかもしれないが、人種、年齢、および収入のような多様な社会人口統計学的特性を扱う場合、類似性を識別することは容易ではない。それはまた、コンテキストと、個人が類似性を解釈する上で何が重要であるかにも依存する。これらの特性の観点から、米国のどの地域がサンフランシスコに最も類似しているのだろうか、そしてどのように類似しているのだろうか?人種構成の観点から、シカゴのどの地区(neighborhood)がニューヨーク州ブロンクスに最も類似しているのだろうか?
【0005】
他のどのロケーションが地区に似ているのだろうか?どのように似ているのだろうか?なぜ似ているのだろうか?多くの空間分析の中心は、ロケーション間の類似性または非類似性を見つけることである。パターンを発見し、類似性を解釈することは、空間特性と、場所に割り当てられたセマンティクスまたは意味との両方に基づく複雑なプロセスである。ロケーションについての類似性の人間による概念化は多面的であり、人口密度または平均収入のような単一の数値属性の単純な評価では捉えることはできない。しかしながら、これらの定量化可能な属性は、意味付けの最初のパスの基礎となる。
【0006】
社会経済的変数および人口統計学的変数を使用して類似性を測定する際の1つの困難は、利用可能なデータが膨大かつ多様であることである。従来の人口統計学的研究では、研究者は、平均収入または年齢などのいくつかの単純な変数を厳選し、それらを統計における独立変数として使用して、相関を識別し得る。時には、研究者は、すべての可能な地理的ロケーションを、それらのロケーションの間で値が高いか低いかという観点から比較することで、一度に1つの属性を調べる(例えば、国勢統計区Aは国勢統計区Bより人口が10%多い)。しかしながら、これらの方法はいずれも、潜在的に大きな人口統計学的変数のグループにまたがるデータの関係を使用しない。
【発明の概要】
【0007】
したがって、情報の削減および/また意味的一般化を提供するために、類似性尺度および空間分析の組み込みを容易にするシステム、方法、およびインターフェースが必要とされている。本明細書で説明される技法は、ユーザを実用的な洞察に近づけるのに役立つ。この技法は、地域間の類似性を決定するための地理空間的な問い合わせにおいて使用することができ、参加者は、これらのロケーションを記述する様々な属性の個々の重みを操作することができる。いくつかの実装形態は、類似性を計算するためにコンテキストおよび追加の場所固有パラメータを使用する。いくつかの実装形態は、場所類似性のためにセマンティクスのニュアンスを利用する地理空間分析ツールを提供する。
【0008】
いくつかの実装形態は、統計的アプローチを使用して、地理的地域(例えば、米国内の地域)間の類似性を決定する。いくつかの実装形態は、ユーザがこのタイプの類似性尺度をユーザの分析に組み込むことを容易にするデータハブを提供する。本明細書で説明される技法によるフレームワークは、人々が、ユーザが関心を持っている属性を使用して、より類似しているまたはあまり類似していないロケーションを識別するために、米国国勢調査からの多様な属性を扱うことを容易にする。いくつかの実装形態は、ジェンセンシャノン情報量(JSD:Jensen-Shannon Divergence)に基づく計算を使用して類似性を決定し、および/または読みやすいマップで結果を提示する。いくつかの実装形態は、ツールチップにおいてオンデマンドで詳細を示す。データ分析のために類似性を評価するためのJSDの使用について、いくつかの実装形態にしたがって、以下で詳細に説明する。
【0009】
いくつかの実装形態によれば、データセットの視覚的分析のための方法が提供される。この方法は、コンピュータシステムで実行される。ユーザはデータソースを選択する。これに応答して、システムは、データソース内のデータの分析のためのグラフィカルユーザインターフェースを提示する。データは地理空間データポイントを含む。システムはまた、グラフィカルユーザインターフェース内にマップデータ視覚化を提示する。マップデータ視覚化は複数の地理的地域を含む。各地理的地域はそれぞれの1つまたは複数の地理空間データポイントに対応する。複数の地理的地域のうちの1つまたは複数の地理的地域の第1のセットを選択するための第1のユーザ入力を受信したことに応答して、システムは、1つまたは複数の統計的技法を使用して、属性(例えば、データソースからのデータフィールド)のセットに基づいて、1つまたは複数の地理的地域の第1のセットと複数の地理的地域のうちの1つまたは複数の地理的地域の第2のセットとの間の類似性を計算する。次いで、システムは、計算された類似性にしたがってマップデータ視覚化を更新して表示する。
【0010】
いくつかの実装形態では、属性のセットは、1つまたは複数の社会経済的、人口統計学的、および地理的変数を含む。
【0011】
いくつかの実装形態では、マップデータ視覚化を更新することは、1つまたは複数の地理的地域の第2のセットのうちの少なくとも1つの地理的地域をハイライト表示またはローライト表示することを含む。
【0012】
いくつかの実装形態では、方法は、マップデータ視覚化上の検索多角形の座標を選択するための第2のユーザ入力を受信したことに応答して、座標に基づいて第2の1つまたは複数の地域を定義することをさらに含む。
【0013】
いくつかの実装形態では、方法は、1つまたは複数の地理的地域の第2のセットを識別するために、検索多角形の座標を、複数の地理的地域のうちの地理的地域の各々についての対応する1つまたは複数の地理空間データポイントと比較することをさらに含む。
【0014】
いくつかの実装形態では、属性のセットの各属性は、複数の重みのうちの対応する重みに関連付けられ、方法は、複数の重みに基づいて類似性を計算することをさらに含む。
【0015】
いくつかの実装形態では、方法は、1つまたは複数のアフォーダンスを提供することをさらに含み、各アフォーダンスは、属性のセットのそれぞれの属性に対応する。
【0016】
いくつかの実装形態では、方法は、1つまたは複数のアフォーダンスのうちの第1のアフォーダンスを選択するための第2のユーザ入力を受信したことに応答して、(i)第1のアフォーダンスに対応する第1の属性に対する第1の重みを調整して、重みの更新されたセットを取得することと、(ii)1つまたは複数の統計的技法を使用して、重みの更新されたセットに基づいて、1つまたは複数の地理的地域の第1のセットと1つまたは複数の地理的地域の第2のセットとの間の更新された類似性を計算することと、(iii)更新された類似性にしたがってマップデータ視覚化を更新して表示することとをさらに含む。
【0017】
いくつかの実装形態では、方法は、重みの更新されたセットを記憶するためのストアアフォーダンスを提供することをさらに含む。ユーザがストアアフォーダンスを選択したことに応答して、方法は、次のセッションのために、重みの更新されたセットをプリセットファイルに記憶する。
【0018】
いくつかの実装形態では、方法は、次のセッションのために、プリセットファイルを取り出し、1つまたは複数の地理的地域の第1のセットと1つまたは複数の地理的地域の第2のセットとの間の類似性を計算するために重みの更新されたセットを使用することをさらに含む。
【0019】
いくつかの実装形態では、マップデータ視覚化はコロプレスマップであり、計算された類似性にしたがってマップデータ視覚化を更新して表示することは、最大類似性から最小類似性への勾配を表示することを含む。
【0020】
いくつかの実装形態では、方法は、(i)コロプレスマップを選択するための第1のアフォーダンスと、最大-最小マップ(most-least map)を選択するための第2のアフォーダンスとを提供することと、(ii)第1のアフォーダンスのユーザ選択に応答して、最大類似性から最小類似性への勾配を表示することと、(iii)第2のアフォーダンスのユーザ選択に応答して、最も類似している地域および最も類似していない地域を表示することとをさらに含む。
【0021】
いくつかの実装形態では、方法は、(i)複数のアフォーダンスを提供することであって、各アフォーダンスはそれぞれの最大数の地域に対応する、提供することと、(ii)複数のアフォーダンスのうちの1つのアフォーダンスのユーザ選択に応答して、アフォーダンスに対応する地域の最大数に基づいて、1つまたは複数の地域の第2のセット内の最も類似している地域および最も類似していない地域を表示することとをさらに含む。
【0022】
いくつかの実装形態では、方法は、(i)複数のアフォーダンスを提供することであって、各アフォーダンスは複数の小地域のうちの小地域のそれぞれのサブセットに対応する、提供することと、(ii)複数のアフォーダンスのうちのアフォーダンスのユーザ選択に応答して、(a)マップデータ視覚化の提示を中止することと、(b)グラフィカルユーザインターフェース内に代替のマップデータ視覚化を提示することとをさらに含む。代替のマップデータ視覚化は、アフォーダンスに対応する小地域のサブセットを含む。
【0023】
いくつかの実装形態では、グラフィカルユーザインターフェースは第1の部分および第2の部分を含み、方法は、(i)マップデータ視覚化を第1の部分に表示することと、(ii)第1の1つまたは複数の地理的地域と第2の1つまたは複数の地理的地域との間の類似性の要約を第2の部分に表示することとをさらに含む。
【0024】
いくつかの実装形態では、地理的地域の各々は、それぞれの国勢統計区に対応する。
【0025】
いくつかの実装形態では、類似性を計算することは、属性のセットについて、複数の地理的地域のうちの1つまたは複数の地理的地域の第1のセットおよび1つまたは複数の地理的地域の第2のセットのための意味的類似性行列を計算することを含む。
【0026】
いくつかの実装形態では、類似性を計算することは、1つまたは複数の地理的地域の第1のセットおよび1つまたは複数の地理的地域の第2のセットの地理的地域のペア間のジェンセンシャノン情報量(JSD)を計算することを含む。
【0027】
別の態様では、電子デバイスは、1つまたは複数のプロセッサと、メモリと、ディスプレイと、メモリに記憶された1つまたは複数のプログラムとを含む。プログラムは、1つまたは複数のプロセッサによって実行されるように構成され、本明細書で説明される方法のいずれかを実行するように構成される。
【0028】
別の態様では、非一時的コンピュータ可読記憶媒体は、1つまたは複数のプロセッサと、メモリと、ディスプレイとを有するコンピューティングデバイスによって実行されるように構成された1つまたは複数のプログラムを記憶する。1つまたは複数のプログラムは、本明細書で説明される方法のいずれかを実行するように構成される。
【0029】
したがって、ユーザがデータ視覚化アプリケーション内に表示されるデータを効率的に探索することを可能にする方法、システム、およびグラフィカルユーザインターフェースが開示される。
【0030】
前述の概要および以下の詳細な説明の両方は、例示的および説明的であり、特許請求されるような本発明のさらなる説明を提供することを意図するものである。
【図面の簡単な説明】
【0031】
前述のシステム、方法、およびグラフィカルユーザインターフェース、ならびにデータ視覚化分析を提供する追加のシステム、方法、およびグラフィカルユーザインターフェースのより良好な理解のために、同様の参照番号が図全体を通して対応する部分を指す以下の図面と併せて、以下の発明を実施するための形態を参照されたい。
【
図1A】
図1A-1および
図1A-2は、類似性を使用した場合と対比して、特定のロケーションにおける異なる人種の相対的な割合を表示するマップを示す。
【
図1B】いくつかの実装形態による、ジェンセンシャノン距離を使用する複数の属性を使用して類似性を示すマップの一例である。
【
図1C】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図1D】いくつかの実装形態による、例示的なチャートを示す。
【
図1E】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図1F】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図1G】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図2】いくつかの実装形態による、ヘルプメニューを有するグラフィカルユーザインターフェースを示す。
【
図3A】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図3B】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図4】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図5】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図6A】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図6B】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図6C】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図7A】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図7B】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図8】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図9】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図10】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図11】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図12】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図13】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図14】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図15】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図16】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図17A】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図17B】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図18】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図19】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図20A】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図20B】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図21】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図22】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図23】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図24】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図25】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図26】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図27】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図28】いくつかの実装形態による、マップを表示するグラフィカルユーザインターフェースの例を示す。
【
図29】いくつかの実装形態による、コンピューティングデバイスのブロック図である。
【
図30】いくつかの実装形態による、類似性値を計算するための例示的なプロセスの概略図を示す。
【
図31】いくつかの実装形態による、例示的なユーザインターフェースを示す。
【
図32A】いくつかの実装形態による、類似性データのための異なる地図形式視覚化を示す。
【
図32B】いくつかの実装形態による、類似性データのための異なる地図形式視覚化を示す。
【
図33】いくつかの実装形態による、例示的なユーザインターフェースを示す。
【
図34】いくつかの実装形態による、データの視覚的分析のための例示的な方法のためのフローチャートを示す。
【0032】
次に、例が添付の図面に示されている実装形態を参照する。以下の説明では、本発明の完全な理解を提供するために、数多くの具体的な詳細が記載されている。しかしながら、本発明がこれらの具体的な詳細を必要とせずに実施され得ることは、当業者には明らかであろう。
【発明を実施するための形態】
【0033】
推定によると、ビジネスデータセットの80%超に空間成分(例えば、住所、緯度/経度、州、または国)が含まれている。ビジネスデータとロケーションとの強い関係により、ユーザは、データ内の空間パターンを中心に質問および探索を行うことが多い。これらのユーザクエリおよび対話の多くは、絶対的なロケーション(例えば、「何人の顧客がカリフォルニア州にいるか?」)に結び付いているが、探索のための広範囲にわたる重要な質問および手段は、場所のセマンティクスにより適合したシステムにおけるさらなる柔軟性から恩恵を受けるであろう。これは、ビジネス関連の質問だけに当てはまるわけではない。多くの意思決定の機会には、コンテキストを提供するためのロケーション間の関係の評価が含まれる。ロケーション間の関係は、それ自体が答え(例えば、「どの場所がこの場所に似ているか」)であってもよいし、関係は、より大規模な分析プロセスにおける予備ステップであってもよい(例えば、「どの場所がこの場所に似ているかとすることで、学区バス送迎政策を評価する際にこれらのロケーションを使用することができる」)。このタイプの質問の鍵は類似性である。しかしながら、類似性を定量化することは困難である。ロケーションは、単に属性の数ではなく、人々がロケーション間の関係を理解する方法は、それらのロケーションに与えられている文字または意味論的意味に強く結び付けられる。
【0034】
世界についての意味付けはコンテキストに左右されることが多い。ロケーションの相対的な重要性は、主に、そのロケーションが他のロケーションとどのように比較されるかに基づく。コンテキスト評価は、何が「類似する」または「異なる」か、およびどの程度類似するまたは異なるかについてのメトリックに基づく。これらのメトリックは、視覚パターンの順序解釈に基づき得る。例えば、マップ上でどの地域が明るくてどの地域が暗いか、または多次元類似性スコアを表すインデックス化された値の定量的メトリックに基づく。
【0035】
図1A-1は、地理空間エリアにおける人種分布を比較する単一の類似性尺度を使用するマップである。
図1A-2は、
図1A-1と同じロケーションにおける異なる人種の相対的な割合を表示するマップ100を示す。ユーザがマップ上の異なる場所の類似性について知りたい場合、ユーザは、これらの4つのマップのそれぞれを頭の中で組み合わせ、どのマップが他のマップと最も似ているかを把握しなければならない。
図1A-1に示すように、これらの分布のそれぞれを単一の類似性尺度へと組み合わせることによって、それらがどのように互いに比較されるかを見ることが容易になる。
【0036】
図1Bは、いくつかの実装形態による、ジェンセンシャノン距離を使用する複数の属性を使用して類似性を示すマップ102の一例である。
【0037】
属性(例えば、選択されたデータソースからのデータフィールド)におけるパターンを視覚化するように良好に設計されたマップを用いても、ロケーション間の類似性を評価することは困難な可能性がある。単一の属性(例えば、
図1A-2のように、黒人またはアフリカ系アメリカ人である人口の割合)の場合、ユーザは、類似性の指標として、マップ上の色合い(shade)の類似性を探すことができる。例えば、濃い緑色で示される国勢統計区はすべて、類似していると考えられ得る。しかしながら、読者による地域およびそれらの関係の理解は、多くの場合、数多くの属性に依存し、読者がパターンを視覚的に解釈し、次いで、それらを頭の中で集約して類似性を評価しなければならないとき、ロケーション間の類似性を正確に識別することは、事実上、不可能である。単一のマップ(例えば、二変量または三変量コロプレスマップ)上の少数の変数を視覚化するための方法は存在するが、より多数の変数の複雑性は、本明細書に説明される技法を必要とする。
【0038】
人々が、関心のある複数の変数にわたって類似性を識別し、容易に探索するのを助けるには、数多くの絡み合った課題がある。適切なデータを収集し、類似性を計算するという一般的な課題に加えて、意味をなし、かつ、人々が自身の意図に基づいて計算を調整することを可能にする方法で類似性をモデル化するというより広範な問題が存在する。概念としての空間的類似性は、非常に個人的であり、ユーザが具体的に測定することができるもの、ユーザがロケーションについて知覚するもの、および類似性を評価するために使用される個々の要素の重要性をユーザがどのように評価するかに影響される。同じ一般的入力(例えば、本明細書で説明される属性)を使用した計算の場合であっても、個人は、類似性について考えるとき、それらのうちのいくつかを他のものよりも重要となるようにまたは他のものよりも重要とならないように重み付けし得る。
【0039】
いくつかの実装形態は、空間的および属性類似性のためのモデルを使用する。これにより、推奨事項の改善、クエリ自体の可能な修正(例えば、
図1A-1および
図1A-2におけるロサンゼルスという地域対ロサンゼルスの正確な都市境界)、そして、ユーザが関連データに誘導され得る方法の拡張が可能になる。これは、類似したデータセットの推奨を通して、または関心のある特性に一致する必要性によって駆動される分析的な質問に対して行われ得る。例えば、企業は、特性を評価するために自社のトップドナーのサブセットを有する地域を選択し、次いで、アウトリーチ活動または広告活動でターゲットとる類似したロケーションを探し得る。いくつかの実装形態は、場所類似性行列(place-similarity matrix)を使用して、類似した場所特性(例えば、類似した社会経済的人口統計、または関心)を有する他の地域または潜在的候補を推奨する。これらの地域は、必ずしも、元のクエリロケーションの近くにある必要はない。
【0040】
いくつかの実装形態は、フロントエンドの対話型ウェブプラットフォームおよびバックエンドのデータストアという2つの構成要素から構成されるツールを提供する。PHPウェブハンドラのセットは、ウェブクライアントからの要求に基づいて2つの構成要素間でデータを渡す(例えば、ユーザがマウスで国勢統計区を選択したとき)。いくつかの実装形態では、フロントエンドは、Leafletフレームワークを使用して構築された対話型ウェブマップ、ならびにD3およびJQueryフレームワークを使用して構築された一連のDOMコントロールである。いくつかの実装形態では、データは、空間的に有効化された(PostGIS)PostGreSQLデータベースに記憶され、一意の国勢調査地理的識別子を使用して国勢統計区ジオメトリにリンクされる。いくつかの実装形態では、地理的境界(例えば、国勢統計区の境界)がGeoJSONとして記憶され、ページロード時にLeafletベースマップ上に階層化される。
データの例
【0041】
本明細書で説明される技法は、任意のタイプの社会経済的および人口統計学的データを分析するために使用され得る。例示のために、このセクションでは、2019年のAmerican Community Survey(ACS)の国勢統計区データに対する技法の適用について説明する。これには、米国カリフォルニア州についての国勢統計区レベルでの5年推定値(国勢統計区またはACSデータと呼ばれることもある)が含まれる。国勢統計区の粒度は、分析のための論理的解像度である。いくつかの実装形態は、データの視覚的分析のためのツールを提供する。このツールのスキャフォールディングは地理にとらわれないので、これらの地域は、必要に応じて、高解像度(例えば、国勢調査細分区グループ)または低解像度(例えば、郡)の地理に取り換えることができる。ACSデータには、年齢(Age)、人種(Race)、収入(Income)、教育達成度(Educational Attainment)、および通勤手段(Mode of Commuting)という5つの次元が含まれる。これらの次元の各々は、個々の社会経済的または人口統計学的属性のセットにわたる分布である。例えば、年齢次元では、カリフォルニア州の国勢統計区の各々について、0~10歳、10~15歳、15~25歳などの人数の推定値がある。地域にわたって値を比較するために、いくつかの実装形態は、次元内のすべての属性を正規化し、各国勢統計区内の各次元について合計が1になる数値ベクトルを生成する。ACSデータは排他的かつ相補的であり、正規化が許容されることを意味する。
【0042】
いくつかの実装形態は、データ内の国勢統計区ジオメトリのすべてのペア間のユークリッド距離を計算する。これにより、ユーザは、類似した地域を識別する際の近接性の影響を制御することができる。国勢統計区ごとに人口密度が計算され、国勢統計区が海岸から20マイル以内にあるか否かを示すブール値も計算される。より精密なフィルタリングを可能にするために、外部データをツール内に組み込むことができる。
類似性を定義するための方法の例
【0043】
それぞれがビニングされた社会経済的または人口統計学的な値の正規化されたベクトルを含む5つの次元に分割されたACSデータのセットが与えられると、いくつかの実装形態は、各次元について別々にすべての国勢統計区間のペアワイズ類似性を計算する。これを達成するために、いくつかの実装形態は、ジェンセン-シャノン距離(JSD)を計算する。JSDは、2つの確率分布間の非類似性を測定する方法である。これは、カルバックライブラー情報量(KLD:Kullback-Leibler divergence)(式2)に基づいて、2つの分布に対して相対エントロピーアプローチを使用するが、対称であり、結果として得られる尺度が有限であるという点でKLDとは異なる。JSDは、美的ランキングの予測から健康コンテンツの紹介方法の区別まで、広範囲のアプリケーションについて類似性を評価する際に成功裏に使用されてきた。地理的な分野では、JSDは、名所の区別および土地利用パターンの評価などのタスクに使用されてきた。
【0044】
JSD式を以下の式1に示す。ここで、CT
AおよびCT
Bは、2つの異なる国勢統計区についての同じ国勢調査次元(例えば、人種分布)の正規化されたベクトルであり、
【数1】
であり、xは次元ベクトルXにおける単一の属性値である。
【数2】
【0045】
この分析の結果は、ACSデータの5つの分布に基づいて2つの国勢統計区間の類似性を定量化する特異値のセットである。このプロセスは、国勢統計区のすべてのペアついて繰り返され、ACS次元の各々に対して1つずつ、合計5つの類似性行列を生成する。JSD値は、0(同一)と1(完全な非類似性)との間に制限されるが、JSD値の実際の範囲は、基礎となる入力分布に依存する。これらの範囲は、次元によってかなり異なり、0.5の最大JSDを報告するものもあれば、0.9を報告するものもある。最終目標は、地域間の類似性を視覚的に表すための単一の集約値を決定することであるので、いくつかの実装形態は、単一の国勢統計区を表すために個々の次元のJSD値を組み合わせる。いくつかの実装形態は、単に値を平均する。しかしながら、JSD範囲の違いは、均等に重み付けされたアプローチであっても、特定の次元を他の次元よりも重み付けすることを意味する。この問題を緩和するために、いくつかの実装形態は、最初に、すべての他の地理と比較して、各国勢統計区のJSD値を正規化する。これにより、すべての地理におけるすべての次元について0~1の範囲が生成される。最後に、いくつかの実装形態は、1から各JSD値を減算することによって、非類似性値を類似性に変換する。正規化されたJSD値のこれらの5つの行列は、データ視覚化を更新するために使用される。
【0046】
いくつかの実装形態では、次のステップは、これらの独立したACS次元の各々についてのJSD値を、国勢統計区の各ペアについての単一の類似性値にマージすることを含む。この単一の値は、類似性がユーザによって表形式で評価され、視覚化のために色密度に変換される基礎である。
図30は、いくつかの実装形態による、類似性値を計算するための例示的なプロセス3000の概略図を示す。このプロセスは、ACS分布から開始し、国勢統計区AおよびBという2つのサンプルを使用して単一の類似性値を計算する。いくつかの実装形態は、2つの地域(例えば、
図30の国勢統計区AおよびB)間の類似性を計算する。各国勢統計区は、複数の次元のデータ3002(例えば、年齢、人種、収入、教育、および通勤手段などの5つの次元のデータ)を含む。データの各次元は、国勢調査値の分布である。いくつかの実装形態は、各国勢統計区の次元の間のJSD3004を個々に計算し、次いで、各JSDに対応するユーザ重み3006(ユーザ定義の重みと呼ばれることもある)を乗算し、最後に、それらの積を合計して(3008)、国勢統計区のペアについての単一の類似性値3010を生成する。
【0047】
次元固有のJSD値を平均するのではなく、いくつかの実装形態は、代わりに、ユーザが、各次元が国勢統計区の全体的な類似性に与える影響を決定することを可能にする。いくつかの実装形態は、グラフィカルユーザインターフェース内のスライダとして、一連のユーザ定義の重みを提供する。次元の各々に重みが割り当てられ、すべての重みの合計は1になる。これらの重みの公開は、ユーザの分析要件を最良に満たすようにモデルを調整するようにユーザを促す。ユーザは、異なる選好、目的、および探索目標を有し、個人またはグループが類似性評価プロセスを統制する機会は、ユーザに権限を与え、ツールの有用性を向上させる。
ユーザインターフェースの例
【0048】
図31は、いくつかの実装形態による、例示的なユーザインターフェース3100を示す。例示的なユーザインターフェースは、マップデータ視覚化3102を含む。この例は、(A)とラベル付けされた、選択されたロケーションと比較した米国国勢統計区の類似性を示す。類似性に関する詳細は、ツールチップ(B)に含まれる。ユーザインターフェースは、ユーザが、関心のある特性を重み付けして(C)、ユーザの質問および関心にしたがって類似性の計算を調整することを可能にし、視覚化のための複数のマップタイプ(D)と、ユーザが特定のミキサ設定およびフィルタを用いてプリセットファイルを保存および再使用することを可能にする機能(E)とを提供する。対話型テキスト記述(F)およびソート可能な要約表(G)も提供される。
【0049】
いくつかの実装形態では、データ視覚化アプリケーションを起動すると、ユーザに、マップ(例えば、カリフォルニア州の国勢統計区を示すマップ)が均一な色(例えば、均一な灰色)で提示される。地区、町、および都市を(ズームレベルに応じて)示すマップラベルが、参照レイヤとして国勢統計区の上にオーバーレイされる。画面の左側の縦型パネルは、ユーザが、マップをクリックすることで国勢統計区を選択することを可能にする。国勢統計区が選択されると、その国勢統計区の識別子がウェブハンドラを介してデータベースに送信され、JSON応答、すなわち事前に計算された5つの次元のJSD類似性値を返す。次いで、各国勢統計区の5つのJSD値のそれぞれに、正規化されたユーザ定義の重み(ページロード時に均等に重み付けされる)を乗算し、合計して、国勢統計区ごとに単一の類似性値を生成する。
マップパネルの例
【0050】
いくつかの実装形態では、次いで、類似性値は、等間隔コロプレス色方式(equal interval choropleth color scheme)を使用してマップ上に変換され、マップ上の国勢統計区レイヤに適用される。いくつかの実装形態では、より濃い色または色合い(例えば、より濃い青色値)は、より高い類似性を示す。いくつかの実装形態では、ツールチップ機能性により、ユーザは、マップの各国勢統計区上にカーソルを乗せ、国勢統計区識別子、郡の名前、類似性ランク、および選択された国勢統計区との類似性一致率を含む情報を受け取ることができる。いくつかの実装形態では、設定メニュー内で、ユーザは、追加のツールチップ詳細を有効にするオプションを有し、これは、個々の次元の各々に対する類似性値をツールチップに追加する。
【0051】
いくつかの実装形態は、ユーザが、関心のある国勢統計区を選択することを可能にするマップパネルを提供する。いくつかの実装形態は、(1つまたは複数の)選択された地域とデータセット内のすべての他の地域との間の類似性を地図形式および/または表形式で提示することによって応答する。いくつかの実装形態は、ズーミングおよびパニングを通じてマップと対話し、マップを探索する能力も提供する。
【0052】
図20Aは、いくつかの実装形態による、多角形描画機能性を提供する例示的なユーザインターフェース2000を示す。いくつかの実装形態では、多角形描画ツールにより、ユーザは、分析のための国勢統計区のセットをサブ選択することができる。ユーザは、
図20Bに示されるように、類似性評価を関心のある指定されたサブセットに限定するために、マップ上に地域を手動で描画することを可能にする多角形描画ツールを選択することができる。いくつかの実装形態では、マップパネルから、ユーザはまた、マップを印刷し、ベースマップを標準マップタイルから衛星画像に変更し、マップラベル、郡境界レイヤ、および主要国勢統計区レイヤを切り替えることができる。
表形式パネルの例
【0053】
いくつかの実装形態では、マップが地域類似性を示すように更新されると、マップの下に別のパネルが提示される。追加のパネルは、類似性分析に関する記述的内容を提供する。いくつかの実装形態では、このパネル内の記述テキストは、非常に類似する国勢統計区の数、それらが見つかった郡の数、および/または選択と同一の郡における類似した国勢統計区の数を提示する。テキストには、ハイパーリンクが埋め込まれており、ユーザは、選択された国勢統計区の1つまたは複数の上位の郡にズームすることができる。加えて、上位5つの最も類似している国勢統計区、それらの類似性一致率、郡の名前、ならびに選択された国勢統計区からの距離および方向を列挙する表が示される。いくつかの実装形態では、ユーザは、表内の行をクリックして、マップ上の国勢統計区をハイライト表示するか、または拡大鏡アイコンを選択することで、選択された国勢統計区にズームすることができる。この表内で、類似性についての列のヘッダをクリックすると、降順と昇順とが切り替わり、これにより、ユーザは、最も類似している国勢統計区と最も類似しない国勢統計区とを容易に識別することができる。
サイドパネルの例
【0054】
いくつかの実装形態では、国勢統計区が選択されると、サイドパネルも出現し、データ探索および分析を可能にするための様々な対話型ツールを提供する。いくつかの実装形態では、サイドパネルには、ミキサ、マップタイプ、プリセット、ロケーションブックマーク、および/または地理的フィルタを含む一連のウィジェットが含まれる。
ミキサウィジェットの例
【0055】
いくつかの実装形態では、ミキサは対話型機能性を提供し、これを通じて、ユーザは、類似性値への全体的な寄与における社会経済的または人口統計学的次元の重要性(重み)を調整することができる。これらの重みは、ユーザが、スライダを右に移動させることによって重みを増加させ、スライダを左に移動させることによって重みを減少させることを可能にするスライダによって表される。いくつかの実装形態では、デフォルトで、ミキサは、50の重要度値で均等に重み付けされる。ユーザがミキサを調整すると、次元ラベルの色密度が変化し、重みの数値表現が変化し(0と100との間に制限される)、ミキサに関連付けられたツールチップが更新されて、この調整が全体的な類似性モデルに与えている影響をユーザに知らせる。
【0056】
いくつかの実装形態では、ウィジェット中のミキサのうちの少なくともいくつかは、社会経済的または人口統計学的次元ではない。例えば、このウィジェット内の最初の5つのミキサは、国勢調査データの社会経済的および人口統計学的次元であり得るが、最後のミキサ(例えば、近接性ミキサ)はそうではない。この近接性ミキサは、ミックス内の2つの国勢統計区間のユークリッド距離の重みを調整する。ミックスにおける近接性の重みを増加させることによって、選択された国勢統計区に物理的により近い国勢統計区は、より離れた国勢統計区よりも類似していると見なされる。近接性ミキサの値を0に調整すると、地理的な近接性の影響が完全に排除される。
【0057】
ユーザが分析に有用な重みの組合せを識別すると、ユーザは、そのミックスを新しいプリセットに保存するオプションを有する。これにより、プリセットウィジェットが更新され、ダウンロードのためのプリセットXMLファイルが生成され、コラボレータ(collaborator)と共有するための一意のユニフォームリソースロケータ(URL)が提示される。
マップタイプウィジェットの例
【0058】
図32Aおよび
図32Bは、いくつかの実装形態による、同じ基礎となる類似性データについて異なる地図形式視覚化3200および3202をそれぞれ示す。デフォルトで、いくつかの実装形態は、勾配ベースのコロプレスマップを使用して国勢統計区類似性を提示する(
図32A)。この表現は、多くの状況において有用であるが、他の状況では、最も適切な地図形式視覚化ではない場合がある。この理由から、いくつかの実装形態は、Most/Least(
図32B)などの代替マップタイプオプションを提供する。このオプションは、マップを簡略化し、各地域の類似性を次の3つのオプションのうちの1つとして提示する:非常に類似するものは第1の色(例えば、青)、非常に類似しないものは第2の色(例えば、赤)、またはそれらの中間を第3の色(例えば、灰色)。いくつかの実装形態では、ユーザはさらに、選択された国勢統計区と類似する/類似しない上位1000、100、または10個の国勢統計区を選択することによって、「非常に」が何を意味するかを絞り込むことができる。この地図形式アプローチは、勾配の代わりにブール型(類似または非類似)の視覚化を好むユーザにとって特に有用である。
プリセットウィジェットの例
【0059】
いくつかの実装形態では、ユーザがミキサウィジェット内のスライダを調整することによってミックスを作成すると、ユーザは、そのミックスをプリセットとしてラベル付けして保存することを選択することができ、それは、このウィジェット内のボタンとして現れる。様々なシナリオを表し、異なるタイプの分析を可能にするために、複数のプリセットを作成することができる。これらのプリセットは、プリセットXMLファイルにも保存され、コラボレータとプリセットを共有するためにURLに付加することもできる一意の識別子と共にサーバに記憶される。ユーザが前のセッションでプリセットXMLファイルを介してプリセットを作成または共有した場合、ユーザは、設定メニューを介してこのファイルをアップロードし、ミキサを調整するボタンをウィジェットに自動的に追加することもできる。ロケーションブックマークウィジェットの例
【0060】
いくつかの実装形態では、ロケーションブックマークウィジェットは、関心のあるロケーションをボタンとして記憶する。ボタンをクリックすると、指定された地域にマップがズームされる。いくつかの実装形態では、3つのロケーションブックマークがデフォルトでツールに追加されているが、ラベル、地理的座標、およびズームレベルを含むプリセットXMLファイルをアップロードすることによって、追加のブックマークを追加することができる。
地理的フィルタウィジェットの例
【0061】
図33は、いくつかの実装形態による、例示的なユーザインターフェース3300を示す。いくつかの実装形態では、地理的フィルタウィジェットにより、ユーザは、追加の属性を通じて既存の国勢統計区をフィルタリングすることができる。例えば、ユーザは、(
図33に示されるように)人口密度が1平方マイル当たり100人未満の国勢統計区のみ、または海岸から20キロメートル未満の国勢統計区のみを探索することを決定することができる。デフォルトで、いくつかの実装形態は、言及されたものなどの追加の変数のサンプルセットを含む。いくつかの実装形態では、ユーザは、これらのデータに対して独自のSQLタイプのクエリを書き込み、それらをプリセットXMLファイルに追加し、それらをツールにアップロードすることができる。ファイルがロードされると、クエリで指定された基準を満たす国勢統計区のみがマップ上に表示される。これは、強力な機能であり、ユーザは、地域探索および類似性分析に入り込む前に、外部属性フィルタリングを介してデータを限定することができる。
【0062】
上述したように、いくつかの実装形態は、社会経済的および人口統計学的変数を類似した特性の次元にグループ化し、類似性メトリックを計算し、および/またはユーザがこれらの次元を重み付して類似性がどのように計算されるかをカスタマイズすることを可能にする。これにより、ユーザは、類似性を定義する際に多くの柔軟性を得ることができる。いくつかの実装形態は、ユーザが1つの次元を使用することを可能にし、これは、ユーザが1つの次元(例えば、年齢分布)に基づく類似性を知りたいだけであるときに有用である。いくつかの実装形態は、ユーザが次元の組合せを使用することを可能にし、これは、ユーザが次元を異なるように重み付けすることを可能にしつつ(例えば、ユーザは、類似性を計算する際に収入をより重要にすることを望む場合、それに応じて重みを調整することができる)、複数の次元(例えば、年齢と収入)について知るのに有用であり得る。
【0063】
いくつかの実装形態は、2つの確率分布間の(非)類似性を測定する統計方法であるジェンセンシャノン情報量(JSD)を使用する。JSD自体は、推論の統計モデルにおいて情報利得を測定するために使用されることが多い方法であるカルバックライブラー情報量に基づく。JSDは、対称であるアプリケーションにより適している。これは、任意の2つの国勢統計区を比較する値が両方向において同じであるとき類似性を理解することが概念的により容易であるので、アプリケーションが対称であるときに特に重要である:国勢統計区A->国勢統計区Bの類似性は、国勢統計区B->国勢統計区Aに等しい。各国勢統計区の値が合計して1になるように、分布内の変数がすべて、属性のすべてにわたって正規化されると仮定すると、JSD類似性値は、常に0(同一分布)と1(完全な非類似性)との間に制限される。
【0064】
説明のために、
図1Cに示される例を考える。
図1Cの画像104は、ロサンゼルスの地域内の国勢統計区を示す。この例では、3つの国勢統計区が選択される。人種変数の分布は、いくつかの実装形態にしたがって、
図1Dに示されるチャート106に示される。視覚的におよび空間近接性から予想され得るように、国勢統計区1および国勢統計区2は、国勢統計区1および国勢統計区3よりも類似している(チャート内の分布が、より似ているように見える)。JSDアプローチの結果、国勢統計区1と国勢統計区2との間の類似性値は0.1359となり、より類似していることを示しており、一方で、国勢統計区1と国勢統計区3との間の類似性値は0.7197であり、あまり類似していないことを示している。JSDは非類似性尺度であるので、0の尺度は同一であり、1は完全に異なる。
【0065】
このアプローチを使用して、いくつかの実装形態は次いで、国勢統計区で以下に示されるような、ロケーションのすべての可能なペア間の任意の特性についてのJSDを計算する。いくつかの実装形態は、特徴的な色または輝度レベルを使用して、ユーザによって選択された国勢統計区をハイライト表示する(例えば、より明るい色)。例えば、いくつかの実装形態によれば、
図1Eに示されるマップ108内のより明るい国勢統計区は、選択された国勢統計区であり、他の各国勢統計区は、この選択されたロケーションに対する相対的な類似性を示す。
【0066】
いくつかの実装形態は、属性の複数のカテゴリにわたるJSDを示し、ユーザが類似性を評価する際にそれらの重要度を重み付けすることを可能にする。マップ108において、ツールチップは、人種、年齢、収入、教育達成度、および通勤手段という次元についての類似性尺度を示す。いくつかの実装形態は、ツールチップにおいて類似性値を個々に示す。いくつかの実装形態は、ユーザが、類似性尺度を組み合わせて、異なる属性の重要性を関心のある特定の質問に調整することを可能にする。類似性を評価するための次元が複数あるので、これは、新たな課題をもたらす。いくつかの実装形態は、ユーザ定義の重みのセットを使用することによってこれを処理する。タスク、専門知識、および関心のあるトピックに応じて、異なるユーザは、類似性モデル内で異なるように次元を重み付けすることを望む場合がある。これを行うために、いくつかの実装形態は、以下のように類似性を計算する(ただし、すべての重み(w)を合計すると1になることに注意する):
Sim=JSDRace*w1+JSDAge*w2+JSDIncome*w3+JSDEducation*w4+JSD...*wN…
【0067】
例えば、
図1Fおよび
図1Gは、いくつかの実装形態による、次元に対して異なる重みを使用して類似性を示す2つの異なるマップ110および112をそれぞれ示す。マップ110は、等しく重み付けされた人種、収入、および教育を調査している。マップ112は、類似性計算で使用される唯一の次元として人種を示す。
【0068】
図2は、いくつかの実装形態による、ユーザがミキサ重みを調整し、プリセットファイルをアップロードし、関心のある地域を制限し、および/またはマップタイプを変更することができる様々な方法を示すヘルプメニュー202を有するグラフィカルユーザインターフェース200を示す。
【0069】
図3Aおよび
図3Bに示されるように、いくつかの実装形態は、グラフィカルユーザインターフェース(例えば、インターフェース300および302)にマップを示し、ユーザが(例えば、特定の国勢統計区を選択するために)マップ上のロケーションおよび/または地域を選択することを可能にする。本明細書の説明では、国勢統計区(census tract)(国勢統計区(Census tract)と呼ばれることもある)のデータ視覚化が、例示のために使用される。これらの概念は、任意のタイプの統計的データ、地理的情報、および/または人口統計学的情報に適用することができることを理解されたい。
【0070】
いくつかの実装形態では、ユーザインターフェースは、選択された国勢統計区に類似するすべての他の国勢統計区を示すように自動的に更新され、その例を、
図4のグラフィカルユーザインターフェース400に示す。いくつかの実装形態は、ユーザによって選択された国勢統計区に最も類似していない国勢統計区から最も類似している国勢統計区を示す凡例402を表示する。類似性は、様々な人口統計学的および経済的次元に基づいて測定され得る。
【0071】
いくつかの実装形態は、これらの次元を、対応するスライダアフォーダンスと共にグラフィカルユーザインターフェースの一部に示す。いくつかの実装形態による、そのようなアフォーダンスを含む部分502を有する例示的なグラフィカルユーザインターフェース500が
図5に示される。いくつかの実施形態は、ユーザが各アフォーダンス上にカーソルを乗せて各カテゴリに関するより多くの情報を得ることを可能にする。いくつかの実装形態によれば、各スライダアフォーダンスは、個々に調整することができる。いくつかの実装形態は、いくつの国勢統計区が選択された国勢統計区に類似しているかを含む類似性の詳細を示す付随テキストを表示し、その例を、
図6A~
図6Cのグラフィカルユーザインターフェース600、602、および604の部分、ならびに
図7Aおよび
図7Bのグラフィカルユーザインターフェース700および702の部分に示す。
【0072】
いくつかの実装形態は、上位にランク付けされた類似した国勢統計区を示す表(例えば、
図8のグラフィカルユーザインターフェース800内の表802)を表示する。各国勢統計区は個別に選択することができる。いくつかの実装形態は、各国勢統計区または地域にズームインするためのアイコン(例えば、
図9のグラフィカルユーザインターフェース900内のアイコン902)を提供する。いくつかの実装形態はまた、ユーザが類似性パーセンテージに基づいてソートすることを可能にし(例えば、類似性の降順でリストをソートすることで、ユーザは、最も類似していないまたは非類似している国勢統計区を見ることができる)、その例を、
図10および
図11に示されているグラフィカルユーザインターフェース1000および1100に示す。いくつかの実装形態は、類似性を表示するための複数の地地図形式表現を提供する。この例が
図12に示されており、
図12は、グラフィカルユーザインターフェース1200における2つのオプション1202を示す。いくつかの実装形態は、最大から最小への勾配が示されるコロプレスマップタイプをサポートする(例えば、
図12に示される例示的なマップ)。いくつかの実装形態は、2つのカラーパレット(例えば、それぞれ
図13、
図14、および
図15のグラフィカルユーザインターフェース1300、1400、および1500に示されるマップ)を使用して最大または最小(例えば、上位100、下位10、または上位1000)としてデータが示されるマップタイプをサポートする。いくつかの実装形態は、最も類似しているもの(例えば、赤)および最も類似していないもの(例えば、青)について異なる色コーディングを示す。
【0073】
図16のグラフィカルユーザインターフェース1600に示すように、いくつかの実装形態は、選択すべき所定のロケーションを示す。いくつかの実装形態は、ユーザがロケーションを追加することを可能にする。いくつかの実装形態は、ユーザがマップ上に多角形を描画することを可能にし、その例を
図17Aのグラフィカルユーザインターフェース1700に示し、これは、ユーザが多角形を描画することを可能にするアフォーダンス1702を示す。ユーザが多角形を描画することによって(例えば、マップ上の異なる場所を選択することによって)地域を選択すると、特定の地域についての類似性が示される(例えば、類似した国勢統計区が示される)。例示的な多角形1706は、いくつかの実装形態にしたがって、
図17Bに示されるグラフィカルユーザインターフェース1704に示される。いくつかの実装形態は、データがインターフェースの外部で分析され得るように、(例えば、アフォーダンス1708をクリックすることによって)データのエクスポートを可能にする。
図18は、いくつかの実装形態による、(上述したように)ユーザが多角形を描写することによって地域を選択した後に更新されるグラフィカルユーザインターフェース1800を示す。
図19のグラフィカルユーザインターフェース例1900に示すように、いくつかの実装形態は、ユーザが調整を行った後にマップを印刷することを可能にするアフォーダンス1902を提供する。
【0074】
いくつかの実装形態は、ユーザが、手動でミキサを変更する(例えば、スライダアフォーダンスを調整することによって、個々のカテゴリの値を選択する)代わりに、(例えば、外部文書内の値に基づいて)値を制限することができるように、「プリセット」を提供し、その例を、それぞれ
図21、
図22、および
図23のグラフィカルユーザインターフェース2100(例えば、部分2102)、2200、および2300に示す。例示的なXMLファイル2400は、いくつかの実装形態にしたがって、
図24に例示のために示される。この例は、密度パラメータ(例えば、1平方マイル当たり100人未満の人口密度)とともに、指定されたロケーション名を示す。いくつかの実装形態は、ユーザがプリセットファイルをアップロードすることを可能にし、その例を、
図25のグラフィカルユーザインターフェース2500に示し、ここで、プリセットファイル2502はユーザによってアップロードされている。いくつかの実装形態は、ユーザがURL(例えば、共有用のURL2504)を使用して外部ファイルを共有することを可能にする。いくつかの実装形態によれば、外部ファイルがアップロードされると、表示は、現在のファイル内の値を反映するように自動的に更新される。いくつかの実装形態による、例示的な更新が
図26のグラフィカルユーザインターフェース2600に示される。いくつかの実装形態は、ユーザが選択するためのいくつかのプリセットを示す。いくつかの実装形態は、選択されたプリセットに基づいてミキサ(異なるカテゴリの値)を自動的に更新する。いくつかの実装形態は、ユーザが追加のツールチップ詳細を有効にすることを可能にし、その例を、それぞれ
図27および
図28のグラフィカルユーザインターフェース2700および2800に示されている。
【0075】
図29は、いくつかの実装形態による、上述したグラフィカルユーザインターフェースを表示することができるコンピューティングデバイス2900を示すブロック図である。コンピューティングデバイス2900の様々な例には、デスクトップコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、ならびにディスプレイおよびデータ視覚化アプリケーション2930を実行することができるプロセッサを有する他のコンピューティングデバイスが含まれる。コンピューティングデバイス2900は、通常、1つまたは複数の処理ユニット(プロセッサまたはコア)2902と、1つまたは複数のネットワークまたは他の通信インターフェース2904と、メモリ2906と、これらの構成要素を相互接続するための1つまたは複数の通信バス2908とを含む。通信バス2908は、オプションで、システム構成要素間の通信を相互接続および制御する回路(チップセットと呼ばれることもある)を含む。コンピューティングデバイス2900は、ユーザインターフェース2910を含む。ユーザインターフェース2910は、通常、ディスプレイデバイス212を含む。いくつかの実装形態では、コンピューティングデバイス2900は、キーボード、マウス、および/または他の入力ボタン2916などの入力デバイスを含む。代替的または追加的に、いくつかの実装形態では、ディスプレイデバイス2912はタッチセンシティブ表面2914を含み、その場合、ディスプレイデバイス2912はタッチセンシティブディスプレイである。いくつかの実装形態では、タッチセンシティブ表面2914は、様々なスワイプジェスチャ(例えば、垂直方向および/または水平方向の連続ジェスチャ)および/または他のジェスチャ(例えば、シングルタップ/ダブルタップ)を検出するように構成される。タッチセンシティブディスプレイ2914を有するコンピューティングデバイスでは、物理キーボードはオプションである(例えば、キーボード入力が必要なときにはソフトキーボードが表示され得る)。ユーザインターフェース2910はまた、スピーカ、またはスピーカ、イヤホン、もしくはヘッドホンに接続されたオーディオ出力接続などのオーディオ出力デバイス2918を含む。さらに、いくつかのコンピューティングデバイス2900は、キーボードを補完または置き換えるためにマイクロフォンおよび音声認識を使用する。オプションで、コンピューティングデバイス2900は、オーディオ(例えば、ユーザからのスピーチ)をキャプチャするためのオーディオ入力デバイス2920(例えば、マイクロフォン)を含む。
【0076】
メモリ2906は、DRAM、SRAM、DDR RAM、または他のランダムアクセスソリッドステートメモリデバイスなどの高速ランダムアクセスメモリを含み、1つまたは複数の磁気記憶ディスクデバイス、光学ディスク記憶デバイス、フラッシュメモリデバイス、または他の不揮発性ソリッドステート記憶デバイスなどの不揮発性メモリを含み得る。いくつかの実装形態では、メモリ2906は、プロセッサ(複数可)2902から離れて位置する1つまたは複数の記憶デバイスを含む。メモリ2906、または代替的にメモリ2906内の不揮発性メモリデバイス(複数可)は、非一時的コンピュータ可読記憶媒体を含む。いくつかの実装形態では、メモリ2906またはメモリ2906のコンピュータ可読記憶媒体は、以下のプログラム、モジュール、およびデータ構造、またはそれらのサブセットもしくはスーパーセットを記憶する:
・ 様々な基本システムサービスを処理し、ハードウェア依存タスクを実行するためのプロシージャを含むオペレーティングシステム2922;
・ インターネット、他のワイドエリアネットワーク、ローカルエリアネットワーク、メトロポリタンエリアネットワークなどの1つまたは複数の通信ネットワークインターフェース2904(ワイヤードまたはワイヤレス)を介して、コンピューティングデバイス2900を他のコンピュータおよびデバイスに接続するために使用される通信モジュール2924;
・ ユーザがネットワークを介してリモートコンピュータまたはデバイスと通信することを可能にする、ウェブブラウザ2926(またはウェブページを表示することができる他のアプリケーション);
・ オプションで、オーディオ入力デバイス2920によってキャプチャされたオーディオを処理するためのオーディオ入力モジュール2928(例えば、マイクロフォンモジュール)。キャプチャされたオーディオは、リモートサーバに送信され、および/またはコンピューティングデバイス2900上で実行されるアプリケーション(例えば、データ視覚化アプリケーション2930)によって処理され得る;
・ データ視覚化および関連する特徴を生成するためのデータ視覚化アプリケーション2930。アプリケーション2930は、ユーザが視覚的グラフィックを構築するためのグラフィカルユーザインターフェース2932を含む。例えば、ユーザは、1つまたは複数のデータソース2940(コンピューティングデバイス2900上に記憶され得るか、またはリモートに記憶され得る)を選択し、データソース(複数可)からデータフィールドを選択し、選択されたフィールドを使用して視覚的グラフィックを定義する;ならびに
・ データ視覚化アプリケーション2930によって使用される、ゼロ以上のデータベースまたはデータソース2940(例えば、第1のデータソース2940-1および第2のデータソース2940-2)。いくつかの実装形態では、データソースは、スプレッドシートファイル、CSVファイル、テキストファイル、JSONファイル、XMLファイル、もしくはフラットファイルとして記憶されるか、またはリレーショナルデータベースに記憶される。
【0077】
いくつかの実装形態では、データ視覚化アプリケーション2930は、ユーザ入力(例えば、視覚的仕様2936)を取り込み、対応する視覚的グラフィックを生成する、データ視覚化生成モジュール2934を含む。次いで、データ視覚化アプリケーション2930は、生成された視覚的グラフィックをユーザインターフェース2932に表示する。いくつかの実装形態では、データ視覚化アプリケーション2930は、独立型アプリケーション(例えば、デスクトップアプリケーション)として実行される。いくつかの実装形態では、データ視覚化アプリケーション2930は、ウェブブラウザ2926またはウェブサーバによって提供されるウェブページを使用する別のアプリケーション(例えば、サーバベースのアプリケーション)内で実行される。
【0078】
いくつかの実装形態では、ユーザが提供する情報(例えば、ユーザ入力)は、視覚的仕様2936として記憶される。いくつかの実装形態では、視覚的仕様2936は、ユーザから受信された以前の自然言語コマンド、または自然言語コマンドを通じてユーザによって指定されたプロパティを含む。
【0079】
いくつかの実装形態では、データ視覚化アプリケーション2930は、コンピューティングデバイスのユーザによって提供されるコマンドを処理する(例えば、解釈する)ための言語処理モジュール2938を含む。いくつかの実装形態では、コマンドは、(例えば、オーディオ入力デバイス2920によってキャプチャされた)自然言語コマンドである。いくつかの実装形態では、言語処理モジュール2938は、オートコンプリートモジュール、語用論モジュール、および曖昧さモジュールなどのサブモジュールを含み、そのそれぞれについて以下でさらに詳細に説明する。
【0080】
いくつかの実装形態では、メモリ2906は、言語処理モジュール2938によって決定されたメトリックおよび/またはスコアを記憶する。加えて、メモリ2906は、言語処理モジュール2938によって決定されたメトリックおよび/またはスコアと比較されるしきい値および他の基準を記憶し得る。例えば、言語処理モジュール2938は、受信したコマンドの分析的な単語/句についての関連性メトリック(詳細に後述する)を決定し得る。次いで、言語処理モジュール2938は、関連性メトリックをメモリ2906に記憶されたしきい値と比較し得る。
【0081】
コンピューティングデバイス2900の様々なデータ構造およびモジュールの詳細は、いくつかの実装形態にしたがって、
図34を参照して以下にさらに説明される。
【0082】
上記で識別された実行可能モジュール、アプリケーション、またはプロシージャのセットの各々は、前述のメモリデバイスのうちの1つまたは複数に記憶され得、上述した機能を実行するための命令のセットに対応する。上記で識別されたモジュールまたはプログラム(すなわち、命令のセット)は、別個のソフトウェアプログラム、プロシージャ、またはモジュールとして実装される必要はなく、したがって、これらのモジュールの様々なサブセットは、様々な実装形態において組み合わせられるか、または場合によっては再構成され得る。いくつかの実装形態では、メモリ2906は、上記で識別されたモジュールおよびデータ構造のサブセットを記憶する。さらに、メモリ2906は、上述されていない追加のモジュールまたはデータ構造を記憶し得る。
【0083】
図29はコンピューティングデバイス2900を示すが、
図29は、本明細書で説明される実装形態の構造概略図としてではなく、存在し得る様々な特徴の機能的説明として意図されている。実際には、当業者によって認識されるように、別々に示された項目を組み合わせることができ、いくつかの項目を分離することができる。
【0084】
図34は、いくつかの実装形態による、データの視覚的分析のための例示的な方法3400のフローチャートを示す。方法3400は、メモリ2906内の1つまたは複数のモジュールを使用して、コンピューティングデバイス2900によって実行される。ユーザは、データソース(例えば、データソース2940-1)を選択する。コンピューティングデバイス2900は、データソース(例えば、データソース2940-1)のユーザ選択(例えば、ユーザインターフェース2910を介したユーザ選択)を受信する(3402)。それに応答して、コンピューティングデバイス2900(例えば、データ視覚化一般化モジュール2934)は、データソース内のデータの分析のためのグラフィカルユーザインターフェース(例えば、グラフィカルユーザインターフェース2932、その様々な例は上述されている)を提示する(3404)。データは地理空間データポイントを含む。コンピューティングデバイス2900はまた、グラフィカルユーザインターフェース内にマップデータ視覚化(例えば、グラフィカルユーザインターフェース3100内のマップデータ視覚化3102)を提示する(3406)。マップデータ視覚化は複数の地理的地域(例えば、国勢統計区)を含む。各地理的地域はそれぞれの1つまたは複数の地理空間データポイントに対応する。
【0085】
複数の地理的地域のうちの1つまたは複数の地理的地域の第1のセットを選択するための第1のユーザ入力を受信したことに応答して(3408)、コンピューティングデバイス2900は、1つまたは複数の統計的技法を使用して、属性のセット(例えば、選択されたデータソースからのデータフィールド)に基づいて、1つまたは複数の地理的地域の第1のセットと複数の地理的地域のうちの1つまたは複数の地理的地域の第2のセットとの間の類似性を計算する(3410)。
【0086】
いくつかの実装形態では、属性のセットは、1つまたは複数の社会経済的、人口統計学的、および地理的変数を含む。そのような属性(次元と呼ばれることがある)の例は、例示的なミキサウィジェットを参照して上述されている。例えば、国勢統計区は、複数の次元を含み得る。いくつかの実装形態では、属性のセットの各属性は、複数の重みのうちの対応する重みに関連付けられ、方法は、複数の重みに基づいて類似性を計算することをさらに含む。いくつかの実装形態では、方法3400は、1つまたは複数のアフォーダンスを提供することをさらに含み、各アフォーダンスは、属性のセットのそれぞれの属性に対応する。いくつかの実装形態では、方法は、1つまたは複数のアフォーダンスのうちの第1のアフォーダンスを選択するための第2のユーザ入力を受信したことに応答して、(i)第1のアフォーダンスに対応する第1の属性に対応する第1の重みを調整して、重みの更新されたセットを取得することと、(ii)1つまたは複数の統計的技法を使用して、重みの更新されたセットに基づいて、第1の1つまたは複数の地理的地域と第2の1つまたは複数の地理的地域との間の更新された類似性を計算することと、(iii)更新された類似性にしたがってマップデータ視覚化を更新して表示すること(3412)とをさらに含む。これらのステップの例は、いくつかの実装形態による、ミキサウィジェットを参照して上述されている。いくつかの実装形態では、方法3400は、(i)重みの更新されたセットを記憶するためのストアアフォーダンスを提供することと、(ii)ユーザがストアアフォーダンスを選択したことに応答して、次のセッションのために、重みの更新されたセットをプリセットファイルに記憶することとをさらに含む。いくつかの実装形態では、方法3400は、次のセッションのために、プリセットファイルを取り出し、1つまたは複数の地理的地域の第1のセットと1つまたは複数の地理的地域の第2のセットとの間の類似性を計算するために重みの更新されたセットを使用することをさらに含む。プリセットファイルの使用の例は、いくつかの実装形態による、プリセットウィジェットを参照して上述されている。
【0087】
いくつかの実装形態では、方法3400は、マップデータ視覚化上の検索多角形の座標を選択するための第2のユーザ入力を受信したことに応答して、座標に基づいて1つまたは複数の地域の第2のセットを定義することをさらに含む。いくつかの実装形態では、方法は、1つまたは複数の地理的地域の第2のセットを識別するために、検索多角形の座標を、複数の地理的地域のうちの地理的地域の各々についての対応する地理空間データポイントと比較することをさらに含む。検索多角形(描画多角形と呼ばれることがある)を使用するための例は、いくつかの実装形態による、
図17A、
図17B、
図20Aおよび
図20Bを参照しながら上述されている。
【0088】
図34に戻って参照すると、コンピューティングデバイス2900は、計算された類似性にしたがってマップデータ視覚化を更新して表示する(3412)。例えば、データ視覚化生成モジュール2934は、前のステップで計算された類似性にしたがってマップデータ視覚化を更新して表示し得る。いくつかの実装形態では、マップデータ視覚化を更新することは、第2の1つまたは複数の地理的地域のうちの少なくとも1つの地理的地域をハイライト表示またはローライト表示することを含む。そのようなハイライト表示またはローライト表示の例は、いくつかの実装形態にしたがって、
図4を参照して上述されている。
【0089】
いくつかの実装形態では、マップデータ視覚化は、コロプレスマップを含み、計算された類似性にしたがってマップデータ視覚化を更新して表示することは、最大類似性から最小類似性への勾配を表示することを含む。いくつかの実装形態では、方法3400は、(i)コロプレスマップを選択するための第1のアフォーダンスと、最大-最小マップを選択するための第2のアフォーダンスとを提供することと、(ii)第1のアフォーダンスのユーザ選択に応答して、最大類似性から最小類似性への勾配を表示することと、(iii)第2のアフォーダンスのユーザ選択に応答して、最も類似している地域および最も類似していない地域を表示することとをさらに含む。
【0090】
いくつかの実装形態では、方法3400は、(i)複数のアフォーダンスを提供することであって、各アフォーダンスはそれぞれの最大数の地域に対応する、提供することと、(ii)複数のアフォーダンスのうちの1つのアフォーダンスのユーザ選択に応答して、アフォーダンスに対応する地域の最大数に基づいて、1つまたは複数の地域の第2のセット内の最も類似している地域および最も類似していない地域を表示することとをさらに含む。
【0091】
いくつかの実装形態では、方法3400は、(i)複数のアフォーダンスを提供することであって、各アフォーダンスは複数の小地域のうちの小地域のそれぞれのサブセットに対応する、提供することと、(ii)複数のアフォーダンスのうちのアフォーダンスのユーザ選択に応答して、(a)マップデータ視覚化の提示を中止することと、(b)グラフィカルユーザインターフェース内に代替のマップデータ視覚化を提示することとをさらに含む。代替のマップデータ視覚化は、アフォーダンスに対応する小地域のサブセットを含む。
【0092】
いくつかの実装形態では、グラフィカルユーザインターフェースは第1の部分および第2の部分を含む。方法3400は、マップデータ視覚化を第1の部分に表示することと、第1の1つまたは複数の地理的地域と第2の1つまたは複数の地理的地域との間の類似性の要約を第2の部分に表示することとをさらに含む。例えば、
図31において、グラフィカルユーザインターフェース3100は、マップデータ視覚化3102を示すための第1の部分と、要約を示すためのGとラベル付けされた第2の部分とを含む。
【0093】
いくつかの実装形態では、地理的地域の各々は、それぞれの国勢統計区に対応する。
【0094】
いくつかの実装形態では、類似性を計算することは、属性のセットについて、複数の地理的地域のうちの第1の1つまたは複数の地理的地域および第2の1つまたは複数の地理的地域についての意味的類似性行列を計算することを含む。
【0095】
いくつかの実装形態では、類似性を計算することは、第1の1つまたは複数の地理的地域および第2の1つまたは複数の地理的地域の地理的地域のペア間のジェンセンシャノン情報量(JSD)を計算することを含む。
【0096】
このようにして、本明細書で説明される技法は、分析ワークフロー中に地理的地域の類似性を決定するためのユーザ駆動型アプローチをサポートする。ユーザは、関心のある任意のロケーションを選択することができ、システムは、類似したロケーションおよび類似していないロケーションを識別することを目的として、その地域の社会経済的および人口統計学的特性を、所与の行政区画内の他のすべての地理的地域におけるこれらの特性と比較する。いくつかの実装形態は、ユーザが、将来の分析のためにプリセットファイルとして保存することができる類似性モデルのパラメータを調整することを可能にする。いくつかの実装形態は、ユーザが比較している地理的特徴に対してユーザが関連性判断を行うのを助けるために、場所類似性を探索するための直感的で構成可能なアフォーダンスを提供する。
【0097】
本明細書の発明の説明に使用される用語は、特定の実装形態のみを説明するためのものであり、本発明を限定するものではない。本発明の説明および添付の特許請求の範囲において使用される場合、単数形「a」、「an」、および「the」は、文脈がそうでないことを明確に示さない限り、複数形も含むことが意図される。本明細書で使用される「および/または」という用語は、関連する列挙された項目のうちの1つまたは複数の項目のありとあらゆる可能な組合せを指すことおよび包含することも理解されよう。「備える/含む(comprises)」および/または「備えている/含んでいる(comprising)」という用語は、本明細書で使用されるとき、述べられた特徴、ステップ、動作、要素、および/または構成要素の存在を指定するが、1つまたは複数の他の特徴、ステップ、動作、要素、構成要素、および/またはそれらのグループの存在または追加を排除しないことはさらに理解されよう。
【0098】
前述の説明は、説明の目的のために、特定の実装を参照して説明されている。しかしながら、上記の例示的な説明は、網羅的であること、または本発明を開示された厳密な形態に限定することを意図するものではない。上記の教示に鑑みて、多くの修正および変形が可能である。実装形態は、本発明の原理およびその実際の適用例を最もよく説明し、それによって、他の当業者が、企図される特定の使用に適するように様々な修正を伴って本発明および様々な実装形態を最もよく利用することを可能にするために選択され、説明された。
【手続補正書】
【提出日】2024-07-09
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
データセットの視覚分析の方法で
あって、
1つまたは複数のプロセッサと、前記1つまたは複数のプロセッサによって実行されるように構成された1つまたは複数のプログラムを記憶するメモリとを有するコンピューティングシステムにおいて、
データソースのユーザ選択を受信するステップと、
前記データソース内のデータの分析のためのグラフィカルユーザインターフェースを提示するステップであって、前記データは地理空間データポイントを含む、ステップと、
前記グラフィカルユーザインターフェース内にマップデータ視覚化を提示するステップであって、前記マップデータ視覚化は複数の地理的地域を含み、各地理的地域はそれぞれの1つまたは複数の地理空間データポイントに対応する、ステップと、
前記複数の地理的地域のうちの1つまたは複数の地理的地域の第1のセットを選択するための第1のユーザ入力を受信したことに応答して、
1つまたは複数の統計的技法を使用して、前記データソースからのデータフィールドのセットに基づいて、前記1つまたは複数の地理的地域の第1のセットと前記複数の地理的地域のうちの1つまたは複数の地理的地域の第2のセットとの間の類似性を計算するステップと、
前記計算された類似性にしたがって前記マップデータ視覚化を更新して表示するステップと
を含む方法。
【請求項2】
前記データフィールドのセットは、1つまたは複数の社会経済的、人口統計学的、および地理的変数を含む、請求項1に記載の方法。
【請求項3】
前記マップデータ視覚化を更新することは、前
記1つまたは複数の地理的地域
の第2のセットのうちの少なくとも1つの地理的地域をハイライト表示またはローライト表示することを含む、請求項1に記載の方法。
【請求項4】
前記マップデータ視覚化上の検索多角形の座標を選択するための第2のユーザ入力を受信したことに応答して、
前記座標に基づいて前
記1つまたは複数の
地理的地域
の第2のセットを定義するステップ
をさらに含む、請求項1に記載の方法。
【請求項5】
前記1つまたは複数の地理的地域の第2のセットを識別するために、前記検索多角形の前記座標を、前記複数の地理的地域のうちの前記地理的地域の各々についての対応する地理空間データポイントと比較するステップ
をさらに含む、請求項4に記載の方法。
【請求項6】
前記データフィールドのセットの各データフィールドは、複数の重みのうちの対応する重みに関連付けられ、前記方法は、
前記複数の重みに基づいて前記類似性を計算するステップ
をさらに含む、請求項1に記載の方法。
【請求項7】
1つまたは複数のアフォーダンスを提供するステップであって、各アフォーダンスは前記データフィールドのセットのそれぞれのデータフィールドに対応する、ステップ
をさらに含む、請求項6に記載の方法。
【請求項8】
前記1つまたは複数のアフォーダンスのうちの第1のアフォーダンスを選択するための第2のユーザ入力を受信したことに応答して、
前記第1のアフォーダンスに対応する第1の属性に対応する第1の重みを調整して、重みの更新されたセットを取得するステップと、
前記1つまたは複数の統計的技法を使用して、前記重みの更新されたセットに基づいて、前記1つまたは複数の地理的地域
の第1のセットと前記1つまたは複数の地理的地域
の第2のセットとの間の更新された類似性を計算するステップと、
前記更新された類似性にしたがって前記マップデータ視覚化を更新して表示するステップと
をさらに含む、請求項7に記載の方法。
【請求項9】
前記重みの更新されたセットを記憶するためのストアアフォーダンスを提供するステップと、
ユーザが前記ストアアフォーダンスを選択したことに応答して、
次のセッションのために、前記重みの更新されたセットをプリセットファイルに記憶するステップと
をさらに含む、請求項8に記載の方法。
【請求項10】
前記次のセッションのために、前記プリセットファイルを取り出し、前記1つまたは複数の地理的地域の第1のセットと前記1つまたは複数の地理的地域の第2のセットとの間の前記類似性を計算するために前記重みの更新されたセットを使用するステップ
をさらに含む、請求項9に記載の方法。
【請求項11】
前記マップデータ視覚化は、コロプレスマップを含み、前記計算された類似性にしたがって前記マップデータ視覚化を更新して表示するステップは、最大類似性から最小類似性への勾配を表示することを含む、請求項1に記載の方法。
【請求項12】
コロプレスマップを選択するための第1のアフォーダンスと、最大-最小マップを選択するための第2のアフォーダンスとを提供するステップと、
前記第1のアフォーダンスのユーザ選択に応答して、最大類似性から最小類似性への勾配を表示するステップと、
前記第2のアフォーダンスのユーザ選択に応答して、最も類似している地域および最も類似していない地域を表示するステップと
をさらに含む、請求項1に記載の方法。
【請求項13】
複数のアフォーダンスを提供するステップであって、各アフォーダンスはそれぞれの最大数の地域に対応する、ステップと、
前記複数のアフォーダンスのうちの1つのアフォーダンスのユーザ選択に応答して、前記アフォーダンスに対応する地域の最大数に基づいて、前
記1つまたは複数の
地理的地域
の第2のセット内の最も類似している地域および最も類似していない地域を表示するステップと
をさらに含む、請求項1に記載の方法。
【請求項14】
複数のアフォーダンスを提供するステップであって、各アフォーダンスは複数の小地域のうちの小地域のそれぞれのサブセットに対応する、ステップと、
前記複数のアフォーダンスのうちのアフォーダンスのユーザ選択に応答して、
前記マップデータ視覚化の提示を中止するステップと、
前記グラフィカルユーザインターフェース内に代替のマップデータ視覚化を提示するステップであって、前記代替のマップデータ視覚化は、前記アフォーダンスに対応する小地域のサブセットを含む、ステップと
をさらに含む、請求項1に記載の方法。
【請求項15】
前記グラフィカルユーザインターフェースは第1の部分および第2の部分を含み、前記方法は、
前記マップデータ視覚化を前記第1の部分に表示するステップと、
前
記1つまたは複数の地理的地域
の第1のセットと前
記1つまたは複数の地理的地域
の第2のセットとの間の前記類似性の要約を前記第2の部分に表示するステップと
をさらに含む、請求項1に記載の方法。
【請求項16】
前記地理的地域の各々は、それぞれの国勢統計区に対応する、請求項1に記載の方法。
【請求項17】
前記類似性を計算するステップは、前記データフィールドのセットについて、前記複数の地理的地域のうちの前記1つまたは複数の地理的地域の第1のセットおよび前記1つまたは複数の地理的地域の第2のセットのための意味的類似性行列を計算することを含む、請求項1に記載の方法。
【請求項18】
前記類似性を計算するステップは、前記1つまたは複数の地理的地域の第1のセットおよび前記1つまたは複数の地理的地域の第2のセットの地理的地域のペア間のジェンセンシャノン情報量(JSD)を計算することを含む、請求項1に記載の方法。
【請求項19】
データセットの視覚分析のためのコンピュータシステムであって、
1つまたは複数のプロセッサと、
メモリと
を備え、
前記メモリは、前記1つまたは複数のプロセッサによって実行されるように構成された1つまたは複数のプログラムを記憶し、前記1つまたは複数のプログラムは、
請求項1から18のいずれか一項に記載の方法を実行するための命令を含む、コンピュータシステム。
【請求項20】
ディスプレイと、1つまたは複数のプロセッサと、メモリとを有するコンピュータシステムによって実行される
と、前記コンピュータシステムに、請求項1から18のいずれか一項に記載の方法を実行させる、命令を含むプログラム。
【国際調査報告】