IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 三井住友海上火災保険株式会社の特許一覧 ▶ 公立大学法人兵庫県立大学の特許一覧

特開2022-156923推論装置、推論方法およびプログラム
<>
  • 特開-推論装置、推論方法およびプログラム 図1
  • 特開-推論装置、推論方法およびプログラム 図2
  • 特開-推論装置、推論方法およびプログラム 図3
  • 特開-推論装置、推論方法およびプログラム 図4
  • 特開-推論装置、推論方法およびプログラム 図5
  • 特開-推論装置、推論方法およびプログラム 図6
  • 特開-推論装置、推論方法およびプログラム 図7
  • 特開-推論装置、推論方法およびプログラム 図8
  • 特開-推論装置、推論方法およびプログラム 図9
  • 特開-推論装置、推論方法およびプログラム 図10
  • 特開-推論装置、推論方法およびプログラム 図11
  • 特開-推論装置、推論方法およびプログラム 図12
  • 特開-推論装置、推論方法およびプログラム 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022156923
(43)【公開日】2022-10-14
(54)【発明の名称】推論装置、推論方法およびプログラム
(51)【国際特許分類】
   G09B 29/00 20060101AFI20221006BHJP
   G06F 40/216 20200101ALI20221006BHJP
【FI】
G09B29/00 Z
G06F40/216
【審査請求】有
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2021060866
(22)【出願日】2021-03-31
(71)【出願人】
【識別番号】399106192
【氏名又は名称】三井住友海上火災保険株式会社
(71)【出願人】
【識別番号】513099603
【氏名又は名称】兵庫県公立大学法人
(74)【代理人】
【識別番号】110000877
【氏名又は名称】弁理士法人RYUKA国際特許事務所
(72)【発明者】
【氏名】澤田 祥一
(72)【発明者】
【氏名】山本 光穂
(72)【発明者】
【氏名】大島 裕明
(72)【発明者】
【氏名】山本 岳洋
【テーマコード(参考)】
2C032
5B091
【Fターム(参考)】
2C032HB05
2C032HC27
5B091EA01
(57)【要約】      (修正有)
【課題】学習によって地図表示情報を推論する。
【解決手段】推論装置は、特定の地点を含む区域に関する地理データを取得する取得部と、任意の地点に関する第1言語表現および任意の地点を含む区域に関する地理データと、任意の地点との対応関係の学習結果に基づき、特定の地点に関する第1言語表現および取得部によって取得された地理データから特定の地点を推論する推論部とを備える。推論部は、取得部によって取得された地理データに含まれる複数の地図画像または地物画像から複数の画像特徴量を特定し、特定の地点に関する第1言語表現から複数の言語特徴量を特定し、特定の地点に関する複数の画像特徴量および複数の言語特徴量から特定の地点を推論してもよい。
【選択図】図1
【特許請求の範囲】
【請求項1】
特定の地点を含む区域に関する地理データを取得する取得部と、
任意の地点に関する第1言語表現および前記任意の地点を含む区域に関する地理データと、前記任意の地点との対応関係の学習結果に基づき、前記特定の地点に関する第1言語表現および前記取得部によって取得された前記地理データから前記特定の地点を推論する推論部と
を備える推論装置。
【請求項2】
前記推論部は、
前記任意の地点に関する前記第1言語表現から特定される複数の言語特徴量、および、前記任意の地点を含む区域に関する前記地理データに含まれる複数の地図画像または地物画像から特定される複数の画像特徴量と、前記任意の地点との対応関係を学習し、
前記取得部によって取得された前記地理データに含まれる複数の地図画像または地物画像から複数の画像特徴量を特定し、
前記特定の地点に関する前記第1言語表現から複数の言語特徴量を特定し、
前記特定の地点に関する前記複数の画像特徴量および前記複数の言語特徴量から前記特定の地点を推論する、
請求項1に記載の推論装置。
【請求項3】
前記推論部は、
前記任意の地点を含む第1区域から、前記第1区域よりも小さい、前記任意の地点を含む第2区域へと段階的に、前記任意の地点に関する前記複数の言語特徴量および前記複数の画像特徴量と、前記任意の地点との対応関係を学習し、
前記特定の地点を含む第3区域から、前記第3区域よりも小さい、前記特定の地点を含む第4区域へと段階的に、前記特定の地点に関する前記複数の画像特徴量および前記複数の言語特徴量から前記特定の地点を推論する、
請求項2に記載の推論装置。
【請求項4】
前記推論部は、前記特定の地点に関する前記複数の言語特徴量にそれぞれ対応する前記複数の画像特徴量に示される地理的な尤度を足し合わせることで前記特定の地点の画像を生成する、
請求項2または3に記載の推論装置。
【請求項5】
前記推論部が生成した前記特定の地点の前記画像の中で、最も地理的な尤度が高い点を前記特定の地点として決定し、決定した前記点の緯度および経度を算出する算出部を更に備える、
請求項4に記載の推論装置。
【請求項6】
前記算出部が算出した前記緯度および前記経度で特定される地点が道路上に位置していない場合に、前記算出部が算出した前記緯度および前記経度を、特定される前記地点に最も近い道路上における、特定される前記地点から最も近い地点の緯度および経度に補正する補正部を更に備える、
請求項5に記載の推論装置。
【請求項7】
前記取得部は、前記特定の地点に関する第2言語表現を取得した場合に、前記第2言語表現に基づいて前記特定の地点を含む区域のオープンデータを取得し、前記オープンデータから、ランドマーク、道路および交差点の少なくとも何れかによって分類した前記複数の地図画像または地物画像を生成する、
請求項2から6の何れか一項に記載の推論装置。
【請求項8】
前記取得部は、前記特定の地点に関する自然言語表現を取得し、前記自然言語表現を、前記特定の地点に関するベクトル表現である前記第1言語表現に変換して前記推論部に出力する、
請求項2から7の何れか一項に記載の推論装置。
【請求項9】
特定の地点を含む区域に関する地理データを取得する取得段階と、
任意の地点に関する第1言語表現および前記任意の地点を含む区域に関する地理データと、前記任意の地点との対応関係の学習結果に基づき、前記特定の地点に関する第1言語表現および前記取得段階で取得した前記地理データから前記特定の地点を推論する推論段階と
を備える推論方法。
【請求項10】
コンピュータに、
特定の地点を含む区域に関する地理データを取得する取得手順と、
任意の地点に関する第1言語表現および前記任意の地点を含む区域に関する地理データと、前記任意の地点との対応関係の学習結果に基づき、前記特定の地点に関する第1言語表現および前記取得手順で取得した前記地理データから前記特定の地点を推論する推論手順と
を実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、推論装置、推論方法およびプログラムに関する。
【背景技術】
【0002】
特許文献1には、「端末3に含まれる位置情報検出センサ9は、GPSであってもよい…車両の現在位置を測定して、この現在位置情報を出力する。」(段落0086)、「端末3からサーバ20に…送付される情報は、…位置情報として〇県×市△町XXX」(段落0109)と記載されている。
[先行技術文献]
[特許文献]
[特許文献1] 特許第6095835号
【発明の概要】
【0003】
本発明の一態様においては、推論装置が提供される。推論装置は、特定の地点を含む区域に関する地理データを取得する取得部を備えてもよい。推論装置は、任意の地点に関する第1言語表現および任意の地点を含む区域に関する地理データと、任意の地点との対応関係の学習結果に基づき、特定の地点に関する第1言語表現および取得部によって取得された地理データから特定の地点を推論する推論部を備えてもよい。
【0004】
推論部は、任意の地点に関する第1言語表現から特定される複数の言語特徴量、および、任意の地点を含む区域に関する地理データに含まれる複数の地図画像または地物画像から特定される複数の画像特徴量と、任意の地点との対応関係を予め学習しておいてもよい。推論部は、取得部によって取得された地理データに含まれる複数の地図画像または地物画像から複数の画像特徴量を特定してもよい。推論部は、特定の地点に関する第1言語表現から複数の言語特徴量を特定してもよい。推論部は、特定の地点に関する複数の画像特徴量および複数の言語特徴量から特定の地点を推論してもよい。
【0005】
推論部は、任意の地点を含む第1区域から、第1区域よりも小さい、任意の地点を含む第2区域へと段階的に、任意の地点に関する複数の言語特徴量および複数の画像特徴量と、任意の地点との対応関係を学習してもよい。推論部は、特定の地点を含む第3区域から、第3区域よりも小さい、特定の地点を含む第4区域へと段階的に、特定の地点に関する複数の画像特徴量および複数の言語特徴量から特定の地点を推論してもよい。
【0006】
推論部は、特定の地点に関する複数の言語特徴量にそれぞれ対応する複数の画像特徴量に示される地理的な尤度を足し合わせることで特定の地点の画像を生成してもよい。
【0007】
推論装置は、推論部が生成した特定の地点の画像の中で、最も地理的な尤度が高い点を特定の地点として決定し、決定した点の緯度および経度を算出する算出部を更に備えてもよい。
【0008】
推論装置は、算出部が算出した緯度および経度で特定される地点が道路上に位置していない場合に、算出部が算出した緯度および経度を、特定される地点に最も近い道路上における、特定される地点から最も近い地点の緯度および経度に補正する補正部を更に備えてもよい。
【0009】
取得部は、特定の地点に関する第2言語表現が入力された場合に、第2言語表現に基づいて特定の地点を含む区域のオープンデータを取得し、オープンデータから、ランドマーク、道路および交差点の少なくとも何れかによって分類した複数の地図画像または地物画像を生成してもよい。
【0010】
取得部は、特定の地点に関する自然言語表現を取得し、自然言語表現を、特定の地点に関するベクトル表現である第1言語表現に変換して推論部に出力してもよい。
【0011】
本発明の一態様においては、推論方法が提供される。推論方法は、特定の地点を含む区域に関する地理データを取得する取得段階を備えてもよい。推論方法は、任意の地点に関する第1言語表現および任意の地点を含む区域に関する地理データと、任意の地点との対応関係の学習結果に基づき、特定の地点に関する第1言語表現および取得段階で取得した地理データから特定の地点を推論する推論段階を備えてもよい。
【0012】
本発明の一態様においては、プログラムが提供される。プログラムは、コンピュータに、特定の地点を含む区域に関する地理データを取得する取得手順を実行させてもよい。プログラムは、コンピュータに、任意の地点に関する第1言語表現および任意の地点を含む区域に関する地理データと、任意の地点との対応関係の学習結果に基づき、特定の地点に関する第1言語表現および取得手順で取得した地理データから特定の地点を推論する推論手順を実行させてもよい。
【0013】
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。
【図面の簡単な説明】
【0014】
図1】一実施形態によるシステム10の概略図である。
図2】一実施形態による推論装置100のブロック図である。
図3】一実施形態による推論方法のフロー図である。
図4】一実施形態による、ユーザ20が位置する特定の地点を含む区域60の一例である。
図5】一実施形態による、オープンデータから地図画像または地物画像を生成する方法の一例を説明するための図である。
図6】一実施形態による、オープンデータから地図画像または地物画像を生成する方法の一例を説明するための図である。
図7】一実施形態による、ランドマーク層および道路ネットワーク層のそれぞれに分類される複数の地図画像または地物画像の一例である。
図8】一実施形態による、ニューラルネットワーク構造で特定の地点の画像を生成する方法の一例を説明するための図である。
図9】一実施形態による、地理的な尤度を足し合わせる方法の一例を説明するための図である。
図10】一実施形態による、ニューラルネットワーク構造で特定の地点の画像を生成する方法の他の一例を説明するための図である。
図11】一実施形態による学習方法のフロー図である。
図12】一実施形態による学習方法で使用する地図画像または地物画像の一例を示す図である。
図13】本発明の複数の態様が全体的又は部分的に具現化されうるコンピュータ1200の例を示す図である。
【発明を実施するための形態】
【0015】
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。なお、図面において、同一または類似の部分には同一の参照番号を付して、重複する説明を省く場合がある。
【0016】
図1は、一実施形態によるシステム10の概略図である。システム10は、通信ネットワーク50を介して相互に通信する通信端末30および推論装置100を備える。システム10は、通信端末30を所持しているユーザ20からの自然言語で記述される自然言語表現に基づき、ユーザ20に関する地理的位置を推論するためのシステムである。なお、通信ネットワーク50は有線か無線かを問わない。
【0017】
本実施形態における通信端末30は、一例として、スマートフォンなどの通話機器である。通信端末30は、回線交換方式によって推論装置100と通信する。本実施形態におけるシステム10では、ユーザ20が通信端末30から推論装置100に発信し、推論装置100と音声通話する。
【0018】
本実施形態における推論装置100は、ユーザ20が音声通話中に発した自然言語で記述される自然言語表現に基づき、ユーザ20が現在いる地点の緯度および経度を特定する。
【0019】
より具体的には、推論装置100は、ユーザ20との音声通話中に、ユーザ20から、ユーザ20が現在いる地点の住所と、当該地点に関する情報、例えばユーザ20が視認可能なランドマークや、ユーザ20から最も近い道路や交差点などの名称とを聞き出す。当該住所は、一例として、市区町村レベルの大まかな住所情報であってもよく、番地レベルの具体的な住所情報であってもよい。推論装置100は、これらの自然言語で記述される自然言語表現から、ルールベースの探索と機械学習による推論を行うことで、ユーザ20が現在いる地点の緯度および経度を特定する。
【0020】
ルールベースの探索は、例えば、ジオコーダを用いて、住所から緯度および経度を特定することを含んでもよい。また、ルールベースの探索は、例えば、オープンストリートマップ(OSM)を用いて、当該緯度および経度を中心とする一定領域内のポイントデータやラインデータを取得することを含んでもよい。また、ルールベースの探索は、例えば、住所で表される位置を特定し、当該位置が道路上や交差点上の位置ではない場合に、当該位置を、当該位置の最寄りの道路や交差点上の位置に補正することを含んでもよい。
【0021】
機械学習による推論は、例えば、言語表現と地理データを入力として、言語で示される地理的位置を推論することであってもよい。推論装置100は、上記の自然言語表現が、自然言語で曖昧に記述された地点を示す場合にも、ルールベースの探索と機械学習による推論とを行うことにより、当該地点の緯度および経度を高精度に特定できる。
【0022】
なお、本実施形態における推論装置100は、一例として、通信端末30を通じたユーザ20からの電話を自動音声で応対することにより、ユーザ20から上記の自然言語を聞き出して、当該自然言語で記述される自然言語表現を取得する。追加的に又は代替的に、推論装置100は、推論装置100を管理する会社のオペレータがユーザ20から聞き出した上記の自然言語で記述される自然言語表現を取得してもよい。
【0023】
なお、推論装置100がユーザ20との音声通話中にユーザ20から聞き出す、ユーザ20が現在いる地点の住所は、特定の地点の住所に関する第2言語表現の一例である。また、推論装置100がユーザ20との音声通話中にユーザ20から聞き出す、上記のランドマーク、道路、交差点などの名称は、特定の地点に関する自然言語表現の一例である。
【0024】
なお、通信端末30および推論装置100は、上述の回線交換方式に代えて、パケット交換方式により通信してもよく、ユーザ20が通信端末30のインターフェースに手入力又は音声入力した言語表現を、データ通信によって推論装置100に送信してもよい。
【0025】
図2は、一実施形態による推論装置100のブロック図である。推論装置100は、取得部101と、推論部103と、算出部105と、補正部107と、事故情報データベース109とを備える。
【0026】
取得部101は、推論装置100の外部の装置、例えば通信端末30と相互に通信する。取得部101は、他の通信端末、例えば推論装置100を管理する管理会社のコンピュータと相互に通信してもよい。
【0027】
取得部101は、特定の地点を含む区域に関する地理データを取得する。より具体的には、本実施形態における取得部101は、通信端末30と通信している間、ユーザ20が音声通話中に発した、ユーザ20が現在いる地点に関する自然言語を解読して自然言語表現を取得する。当該自然言語は、例えば、当該地点の住所を示すものであってもよく、高速の〇〇IC付近や、〇〇駅付近といった特定の道路やランドマーク等を示すものであってもよい。なお、当該自然言語表現は、特定の地点に関する第2言語表現の一例である。
【0028】
本実施形態における取得部101は、このように当該地点の自然言語表現を取得した場合に、当該自然言語表現に基づいて、ユーザ20が現在いる地点を含む区域のオープンデータを取得する。取得部101は更に、当該オープンデータから、ランドマーク、道路および交差点の少なくとも何れかによって分類した複数の地図画像または地物画像を生成する。
【0029】
具体的な一例として、本実施形態における取得部101は、当該住所をジオコーダで緯度および経度に変換し、オープンストリートマップ(OSM)を用いて、当該緯度および経度を中心とする一定領域内のポイントデータやラインデータを取得する。
【0030】
本実施形態における取得部101は更に、地図描画用ライブラリによって、当該ポイントデータやラインデータから上記の複数の地図画像または地物画像を生成する。なお、オープンデータ、地図画像および地物画像は何れも、上記の地理データの一例である。
【0031】
取得部101は、取得した地理データを推論部103に出力する。より具体的には、本実施形態における取得部101は、OSMで取得したオープンデータから生成した複数の地図画像または地物画像を推論部103に出力する。
【0032】
本実施形態における取得部101は更に、特定の地点に関する自然言語表現を取得し、自然言語表現を、当該特定の地点に関するベクトル表現に変換する。具体的な一例として、本実施形態における取得部101は、通信端末30と通信している間にユーザ20が現在いる地点に関する自然言語から自然言語表現を取得した場合、Word2Vec(ワードツーベック)を用いた構文解析器を用いて、当該自然言語表現をベクトル表現に変換する。取得部101は、当該ベクトル表現を推論部103に出力する。なお、当該ベクトル表現は、特定の地点に関する第1言語表現の一例である。
【0033】
本実施形態における取得部101は更に、補正部107から緯度および経度を入力された場合、例えば、推論装置100を管理する管理会社のコンピュータに緯度および経度を送信する。
【0034】
推論部103は、任意の地点に関する第1言語表現および当該任意の地点を含む区域に関する地理データと、当該任意の地点との対応関係の学習結果に基づき、特定の地点に関する第1言語表現および取得部101によって取得された地理データから当該特定の地点を推論する。
【0035】
より具体的には、本実施形態における推論部103は、特定の地点に関する第1言語表現から複数の言語特徴量を特定し、また、取得部101によって取得された地理データに含まれる複数の地図画像または地物画像から複数の画像特徴量を特定する。本実施形態では、当該第1言語表現は上述のベクトル表現であり、特定の地点に関するベクトル表現は、上述の通り、取得部101から推論部103に入力される。
【0036】
推論部103は更に、任意の地点に関する第1言語表現から特定される複数の言語特徴量、および、当該任意の地点を含む区域に関する地理データに含まれる複数の地図画像または地物画像から特定される複数の画像特徴量と、当該任意の地点との対応関係の学習結果に基づき、特定の地点に関する複数の画像特徴量および複数の言語特徴量から特定の地点を推論する。
【0037】
具体的な一例として、本実施形態における推論部103は、LSTM(Long Short-Term Memory)ネットワークおよびCNN(Convolution Neural Network)を含むニューラルネットワーク構造の深層学習モデルを有する。推論部103は、LSTMネットワークにより、ベクトル表現から複数の言語特徴量を特定し、CNNにより、複数の地図画像または地物画像から複数の画像特徴量を特定する。
【0038】
具体的な一例において、推論部103は、上記の深層学習モデルにより、任意の地点に関するベクトル表現から特定される複数の言語特徴量、および、当該任意の地点に関する複数の地図画像または地物画像から特定される複数の画像特徴量と、当該任意の地点との対応関係を深層学習する。当該対応関係は、言語特徴量と画像特徴量との関連度合いを含む。推論部103は、例えば、事故情報データベース109に格納されている、任意の地点に関するベクトル表現および複数の地図画像または地物画像を読み出して、言語特徴量および画像特徴量をそれぞれ特定し、当該対応関係を深層学習する。
【0039】
なお、事故情報データベース109には、任意の地点に関するベクトル表現および複数の地図画像または地物画像に代えて、任意の地点に関する自然言語表現および任意の地点の住所に関する自然言語表現が格納されていてもよい。この場合、推論部103は、事故情報データベース109から読み出したこれらの自然言語表現を取得部101に出力することで、取得部101から、任意の地点に関するベクトル表現および複数の地図画像または地物画像を入力されてもよい。
【0040】
具体的な一例において、推論部103は更に、特定の地点に関する複数の言語特徴量にそれぞれ対応する複数の画像特徴量に示される地理的な尤度を足し合わせることで特定の地点の画像を生成する。画像特徴量に示される地理的な尤度とは、例えば、各画像特徴量に対応する言語特徴量の元となった言語表現が表す場所、すなわちユーザ20が現在いる位置の尤もらしさの度合いを画像内にマッピングしたものであり、範囲、複数個所、曖昧さなどを含めて扱うことができる。なお、当該特定の地点の画像を生成することは、当該特定の地点を推論することに相当する。推論部103は、当該特定の地点の画像を算出部105に出力する。
【0041】
本実施形態において、算出部105は、推論部103が生成した特定の地点の画像の中で、最も地理的な尤度が高い点を特定の地点として決定し、決定した点の緯度および経度を算出する。なお、当該画像には、当該画像の元となったオープンデータが有する緯度および経度の情報が紐付けられている。算出部105は、算出した緯度および経度を補正部107に出力する。
【0042】
本実施形態において、補正部107は、算出部105が算出した緯度および経度で特定される地点が道路上に位置しているか否かを判断する。補正部107は、当該地点が道路上に位置していない場合に、算出部105が算出した緯度および経度を、特定される地点に最も近い道路上における、特定される地点から最も近い地点の緯度および経度に補正する。一例として、補正部107は、これらの判断および補正を行うために、道路の地図画像から特定された画像特徴量を、算出部105を介して推論部103から取得してもよい。補正部107は、緯度および経度を取得部101に出力する。
【0043】
なお、推論装置100は、算出部105および補正部107を備えなくてもよい。例えば、推論装置100は、外部装置に対して、上述の算出部105および補正部107の各処理を実行させてもよい。外部装置の一例は、上述した管理会社のコンピュータであってもよい。
【0044】
本実施形態において、事故情報データベース109は、上述した各データを格納する。各データは、過去に車両事故が起きた場所を示すデータであってもよい。なお、推論装置100は、推論装置100全体を制御するためのプログラム等が格納されたメモリを事故情報データベース109とは別に備えてもよく、当該メモリが事故情報データベース109を含んでもよい。推論装置100の各構成は、上記で説明した各機能を実行するべく、当該メモリに格納されたプログラムを読み出す。
【0045】
なお、推論装置100は、事故情報データベース109を備えなくてもよい。例えば、推論装置100は、外部装置のデータベースから、上述した各データを取得して、上述の推論や学習を実行してもよい。
【0046】
図3は、一実施形態による推論方法のフロー図である。図3に示すフローは、一例として、ユーザ20が通信端末30を使用して推論装置100に音声通話を発信し、推論装置100が自動音声でユーザ20への応対を始めることによって開始されてもよい。ユーザ20は、自動音声の案内に従い、当該フローで必要とされる自然言語を発話する。
【0047】
推論装置100は、ユーザ20が発話した自然言語から、(1)特定の地点の住所に関する住所言語表現を取得し、(2)特定の地点に関する地点言語表現を取得する(ステップS101)。住所言語表現の一例は、「兵庫県神戸市中央区」という言語表現である。地点言語表現の一例は、「三宮町のコンビニ近くの、国道Aおよび国道Bの交差点付近」という言語表現である。
【0048】
推論装置100は、(1)当該住所を含む区域のオープンデータを取得し、オープンデータからNi個の地図画像又は地物画像を生成し、(2)地点言語表現を長さNvのベクトル表現に変換する(ステップS103)。
【0049】
図4は、一実施形態による、ユーザ20が位置する特定の地点を含む区域60の一例である。図4において、区域60に、緯度(latitude)および経度(longitude)をそれぞれベクトルで併記してある。区域60は、一例として、「兵庫県神戸市中央区」という言語表現で示される住所の緯度および経度を中心とする、5km四方の正方形領域である。
【0050】
図4に示す通り、区域60には、自車両の傍らで通信端末30を操作しているユーザ20と、4つの交差点で交わる4本の道路と、各道路沿いに位置する3つのコンビニとが含まれる。また、単に説明を明確にする目的で、区域60上に「三宮町」と表記してある。
【0051】
推論装置100は、ジオコーダを用いて、「兵庫県神戸市中央区」という言語表現で示される住所から緯度および経度を特定する。このように、住所言語表現に示される住所が市区町村レベルの場合、当該住所は点ではなく範囲なので、推論装置100は、当該住所の中心を代表点として、当該代表点の緯度および経度を特定してもよい。これに代えて、推論装置100は、当該範囲に基づいてオープンデータを取得してもよい。住所言語表現に示される住所が番地や号までを含んでいる場合には、当該住所は点なので、当該点の緯度および経度を特定してもよい。
【0052】
推論装置100は更に、当該緯度および経度を中心とする区域60を定め、OSMを用いて、区域60の複数のポイントデータやラインデータを取得し、これらのオープンデータから、Ni個の、例えば150個の地図画像および地物画像を生成する。
【0053】
図5は、一実施形態による、オープンデータから地図画像または地物画像を生成する方法の一例を説明するための図である。図5は、上から順に、OSMのポイントデータ(ランドマーク)のテーブルと、当該テーブルに示される各ランドマークの地理的な尤度のグラフと、当該グラフに基づく各ランドマークの地物画像とを示す。
【0054】
当該テーブルには、1行目にOSMポイントデータ(ランドマーク)という大別されたグループ名が記載され、2行目の1列目から順に、ランドマークの種別、各ランドマークの名称、各ランドマークのlatitude(緯度)、および、各ランドマークのlongitude(経度)が記載される。また、当該テーブルの3行目以降の各セルには、各ポイントデータが格納されている。
【0055】
図6は、一実施形態による、オープンデータから地図画像または地物画像を生成する方法の一例を説明するための図である。図6は、図5と同様、上から順に、OSMのラインデータ(道路)のテーブルおよびポイントデータ(交差点)のテーブルと、当該テーブルに示される道路および交差点のそれぞれの地理的な尤度のグラフと、当該グラフに基づく道路の地図画像および交差点の地図画像とを示す。
【0056】
図6の最上部左側に示すテーブルには、1行目にOSMラインデータ(道路)という大別されたグループ名が記載され、2行目以降の各行には、道路の名称とラインデータとの組み合わせが格納されている。
【0057】
図6の最上部右側に示すテーブルには、1行目にOSMポイントデータ(交差点)という大別されたグループ名が記載され、2行目の1列目から順に、交差点の名称、各交差点のlatitude(緯度)、および、各交差点のlongitude(経度)が記載される。また、当該テーブルの3行目以降の各セルには、各ポイントデータが格納されている。
【0058】
推論装置100は、図5および図6に例示するように、地図描画用ライブラリを用いて、OSMにおけるランドマーク、道路、交差点などのポイントデータやラインデータからNi個の地図画像および地物画像を生成する。
【0059】
図7は、一実施形態による、ランドマーク層および道路ネットワーク層のそれぞれに分類される複数の地図画像または地物画像の一例である。推論装置100は、図7に示すように、Ni個の地図画像および地物画像を、ランドマーク層および道路ネットワーク層のそれぞれに分類してもよい。
【0060】
ランドマーク層は、ランドマーク毎に、例えば店舗、建物、地形、目標物などの種類毎に、別レイヤとなっており、一例として数百層を含む。推論装置100は、例えば、図5に示すランドマークの地物画像を、ランドマーク層の何れかの層に分類する。
【0061】
また、道路ネットワーク層は、歩道、車道、交差点、高速などを含み、一例として10層程度を含む。推論装置100は、例えば、図6に示す道路および交差点の地図画像を、道路ネットワーク層の何れかの層に分類する。
【0062】
推論装置100は、構文解析器を用いて、「三宮町のコンビニ近くの、国道Aおよび国道Bの交差点付近」という地点言語表現を、「三宮町/の/コンビニ/近く/の、/国道A/および/国道B/の/交差点/付近」のように解析し、長さNvのベクトルに埋め込む。ベクトルの単語(トークン)の数Nvは可変であり、係り受けも含まれる。
【0063】
なお、ステップS101~ステップS103は、特定の地点を含む区域に関する地理データを取得する取得段階の一例である。
【0064】
図3のフローの説明に戻り、推論装置100は、(1)Ni個の地図画像又は地物画像から複数の画像特徴量を特定し、(2)長さNvのベクトル表現から複数の言語特徴量を特定する(ステップS105)。推論装置100は更に、複数の画像特徴量および複数の言語特徴量から特定の地点を推論する(ステップS107)。より具体的には、推論装置100は、複数の言語特徴量にそれぞれ対応する複数の画像特徴量に示される地理的な尤度を足し合わせることで特定の地点の画像を生成する。
【0065】
図8は、一実施形態による、ニューラルネットワーク構造で特定の地点の画像を生成する方法の一例を説明するための図である。推論装置100は、図8に示すように、LSTMネットワークおよびCNNを含むニューラルネットワーク構造の深層学習モデルを有する。
【0066】
推論装置100は、LSTMネットワークにより、ベクトル表現である言語表現(Nv)から複数の言語特徴量(Mv)を特定し、CNNにより、複数の地図画像または地物画像(256×256×Ni)から複数の画像特徴量(256×256×Mi)を特定する。
【0067】
推論装置100は、画像特徴量のi層目の行列と言語特徴量のi番目の値を掛け算することでi層目の特徴量とし、これをM枚生成する。推論装置100は更に、生成したM枚を足し合わせ、CNNにより、ユーザ20が位置する特定の地点を推定する画像を生成する。
【0068】
推論装置100は、画像特徴量のi層目の行列と言語特徴量のi番目の値を掛け算する際に、画像特徴量の各層に対して言語特徴量の各値を重みとみなして掛け合わせてもよい。推論装置100は、各層の重みを学習によって得てもよい。推論装置100は、学習の結果として、例えば「三宮町:コンビニ:交差点=3:6:1」という重みを得てもよい。
【0069】
図9は、一実施形態による、地理的な尤度を足し合わせる方法の一例を説明するための図である。図9は、単に説明を明確にする目的で、図5に示した各ランドマークの地理的な尤度のグラフを足し合わせるイメージ図と、当該グラフに基づく各ランドマークの地物画像を足し合わせるイメージ図とを、上下に並べて示す。推論装置100は、図9に示すイメージ図のように、複数の言語特徴量にそれぞれ対応する複数の画像特徴量に示される地理的な尤度を足し合わせることで特定の地点の画像を生成する。
【0070】
図10は、一実施形態による、ニューラルネットワーク構造で特定の地点の画像を生成する方法の他の一例を説明するための図である。当該他の一例の実施形態における推論装置100は、図8に示す実施形態と異なる点として、LSTMネットワークにより、ベクトル表現である言語表現(Nv)から複数の言語特徴量(256×256×Mv)を特定し、CNNにより、複数の地図画像または地物画像(256×256×Ni)から複数の画像特徴量(256×256×Mi)を特定する。
【0071】
当該他の一例の実施形態における推論装置100は、言語特徴量の層と画像特徴量の層のサイズを合わせて、層を重ねることで、2M枚の層とする。推論装置100は更に、2M枚の層を足し合わせ、CNNにより、ユーザ20が位置する特定の地点を推定する画像を生成する。
【0072】
なお、ステップS105~ステップS107は、学習用の任意の地点に関する第1言語表現および当該任意の地点を含む区域に関する地理データと、当該任意の地点との対応関係の学習結果に基づき、特定の地点に関する第2言語表現および取得段階で取得した地理データから特定の地点を推論する推論段階の一例である。
【0073】
図3のフローの説明に戻り、推論装置100は、ステップS107で生成した画像の中で最も地理的な尤度が高い点を特定の地点として決定し、決定した点の緯度および経度を算出する(ステップS109)。推論装置100は更に、算出した緯度および経度で特定される地点が道路上に位置しているか否かを判断する(ステップS111)。
【0074】
推論装置100は、当該地点が道路上に位置していないと判断した場合には(ステップS111:YES)、当該緯度および経度を、当該緯度および経度で特定される地点に最も近い道路上における、当該地点から最も近い地点の緯度および経度に補正し(ステップS113)、補正後の緯度および経度を例えば推論装置100の管理会社のコンピュータに送信して、当該フローを終了する。
【0075】
推論装置100は、OSMを利用して上記補正を実行してもよい。例えば、推論装置100は、道路や地物の緯度および経度のデータをOSMで検索して、当該緯度および経度から最寄りの道路上の位置の緯度および経度を取得してもよい。例えば、推論装置100は、事故情報データベース109に格納されている路上、交差点などの事故場所の補足情報を利用して、上記補正を実行してもよい。
【0076】
推論装置100は、当該地点が道路上に位置していると判断した場合には(ステップS111:NO)、算出した緯度および経度をそのまま、例えば当該コンピュータに送信して、当該フローを終了する。
【0077】
図11は、一実施形態による学習方法のフロー図である。推論装置100は、図11に示す学習方法を、図3に示す推論方法を実行する前に実行する。推論装置100は、これに追加して、図11に示す学習方法を、図3に示す推論方法を実行していない間に実行してもよい。
【0078】
推論装置100は、学習対象とする区域を定め、当該区域のオープンデータを取得し、オープンデータからNi個の地図画像または地物画像を生成する(ステップS301)。当該区域は、例えば図3に示すように、5km四方程度であってもよい。推論装置100は、例えば図3のフローのステップS103における(1)と同様の処理を行うことで、Ni個の地図画像または地物画像を生成する。なお、推論装置100は、図11に示す学習のフローを実行する間、ステップS301で生成したNi個の地図画像または地物画像を固定として、繰り返し使用する。
【0079】
推論装置100は、事故情報データベース109から、教師データとして、(1)当該区域内の任意の地点に関する地点言語表現を取得し、(2)当該地点の緯度および経度の正解情報を取得する(ステップS303)。換言すると、推論装置100は、過去に事故が起きた場所などのデータを用いて、事故場所の言語表現と、その地点の緯度および経度とのペアを教師データとする。
【0080】
推論装置100は、(1)地点言語表現を長さNvのベクトル表現に変換し、(2)正解情報の緯度および経度の地図画像を生成する(ステップS305)。推論装置100は、例えば図3のフローのステップS103における(1)および(2)と同様の処理を行うことで、長さNvのベクトル表現を特定し、且つ、正解情報の緯度および経度の地図画像を生成する。
【0081】
推論装置100は、Ni個の地図画像又は地物画像および長さNvのベクトル表現を入力とし、正解情報に基づく地図画像を出力として深層学習し(ステップS307)、十分学習するまでステップS303からS307までを繰り返してから(ステップS309)、当該フローを終了する。
【0082】
このように、推論装置100は、Ni個の地図画像または地物画像の入力を固定として、言語表現と正解画像のペアをそれぞれ入力と出力として順次与えていくことにより、深層学習する。
【0083】
図12は、一実施形態による学習方法で使用する地図画像または地物画像の一例を示す図である。図12には、当該一実施形態による推論装置100が自動的に生成する自然言語表現と、地図画像または地物画像とのペアの一例を示す。
【0084】
推論装置100は、事故データなどの実際の情報を使用する他に、データ量を補うべく、OSMの地理データを使用したり、クラウドソーシングを活用したりすることで、図12に示すようなペアを自動生成してもよい。
【0085】
推論装置100は、図12に示すように、住所、地物名、補正情報などの様々な言語表現の組合せを自動生成してもよい。推論装置100はまた、図12に示すように、単一地点、複数地点、範囲などの任意の地図画像または地物画像を生成してもよい。
【0086】
推論装置100は、自然言語表現の自動生成データを使用する場合、先ず、地図画像または地物画像と、自動生成した言語表現とを入力とし、自動生成した画像特徴量を正解データとして事前学習を行う。次に、推論装置100は、図11の学習方法により、追加学習を行う。ただし、推論装置100は、事前学習および追加学習において、互いに同じ「地図画像または地物画像」を使用する。すなわち、推論装置100は、図11のフローのステップS301で生成する地図画像または地物画像を、事前学習および追加学習の両方で用いる。
【0087】
図11のように実データのみを用いる場合、必要十分な数のデータを用意することが難しい場合がある。そこで、推論装置100は、図12に示すような大量の自動生成データで事前学習した上で、少量の実データで追加学習することで精度を向上させてもよい。推論装置100は、実データの数が十分でない場合に、自動生成したデータで数を補うことで、学習モデルの精度を向上させてもよい。
【0088】
また、推論装置100は、再学習(ファインチューニング)してもよい。具体的には、推論装置100は、様々な区域のデータによって汎用的なベースモデルを学習し、当該ベースモデルを元にして、特定地域のデータで再学習することで、少量のデータで高い精度を実現することも可能である。もしくは、推論装置100は、汎用的なベースモデルを学習後、入力する地理画像を入れ替えるだけで、上記の再学習をすることなく、様々な地域に適用可能であってもよい。
【0089】
以上、上記で説明した複数の実施形態による推論装置100および推論方法によれば、特定の地点を含む区域に関する地理データを取得し、任意の地点に関する第1言語表現および任意の地点を含む区域に関する地理データと、任意の地点との対応関係の学習結果に基づき、特定の地点に関する第1言語表現および取得された地理データから特定の地点を推論する。
【0090】
例えば、保険会社が保有する既存の事故データベースに格納されている過去の事故データは、事故地の住所等の記録が正確でない場合がある。また、事故受付担当者が、自由記述で事故地を記録したものが事故データベースに格納されるため、記述内容が曖昧なことが多い。また、事故地の住所と事故場所は正確には一致しない。住所は建物の位置であるが、事故場所の殆どは道路上であるため、事故地の住所と事故場所との間にはずれがある。
【0091】
上記の構成を備える推論装置100および推論方法によれば、例えば、自然言語で曖昧に表現された事故場所を示す情報から、例えば町丁目などの範囲までルールベースで絞り込んだ上で、機械学習を用いてより詳細な事故位置を推定することができる。例えば、上記の構成を備える推論装置100および推論方法によれば、過去に記録された事故データの事故地の言語表現から緯度および経度を推定することにより、どういう場所で事故が多発しているかを分析するなど、事故データの地理的な統計分析に活用したり、リスクマップを詳細に作製することができる。
【0092】
また例えば、上記の構成を備える推論装置100および推論方法によれば、保険会社のコールセンターなどの電話受付時に、より具体的に位置を特定するための質問を指示することで事故位置特定の補助をしたり、事故位置を特定する精度を向上させたりすることができる。
【0093】
以上の複数の実施形態において、推論部103は追加的に、任意の地点を含む第1区域から、第1区域よりも小さい、任意の地点を含む第2区域へと段階的に、任意の地点に関する複数の言語特徴量および複数の画像特徴量と、任意の地点との対応関係を学習してもよい。この場合、推論部103は、特定の地点を含む第3区域から、第3区域よりも小さい、特定の地点を含む第4区域へと段階的に、特定の地点に関する複数の画像特徴量および複数の言語特徴量から特定の地点を推論してもよい。
【0094】
例えば、推論部103は、区域の広さを、2000km四方の範囲、100km四方の範囲、5km四方の範囲へと段階的に変えて、それぞれでモデルを学習させてもよい。換言すると、推論部103は、機械学習で使用する画像の解像度を複数に分け、広い範囲から徐々に狭い範囲に絞り込んでいってもよい。推論部103は、広い範囲から徐々に場所を絞り込むことで、詳細な位置を推定するように構成されてもよい。換言すると、推論部103は、広い区域から順に推論を行い、徐々に範囲を絞り込んでいってもよい。
【0095】
以上の複数の実施形態におけるシステム10では、推論装置100が、通信ネットワーク50を介して通信端末30から取得した、ユーザ20からの言語表現に基づき、ユーザ20の現在位置を推論する構成として説明した。追加的に又は代替的に、システム10は、ユーザ20の車両に搭載された推論装置100や、ユーザ20の通信端末30に実装された推論装置100等を備えてもよい。
【0096】
また、以上の複数の実施形態におけるシステム10では、推論装置100は、ユーザ20の現在位置を推論する構成として説明した。追加的に又は代替的に、推論装置100は、ユーザ20が意図する目的地を推論してもよい。この場合、推論装置100は、ユーザ20の現在の位置や進行方向などのコンテキスト情報を追加的に使用して、ユーザ20が意図する目的地、すなわちユーザ20が今いる位置からの相対的な位置を推論してもよい。推論装置100は、一例として、推論した目的地までの経路をユーザ20に知らせるべく、推論した目的地までの経路情報を通信端末30、例えば車両のカーナビのディスプレイ等に表示させてもよい。推論装置100は、一例として、推論した目的地に向かって車両を自動運転させるべく、推論した目的地までの経路情報を車両に入力してもよい。なお、推論装置100は、ユーザ20が今いる位置からの相対的な位置を推論する場合、ジオコーダの代わりに、現在の位置や方向などで区域を決定してもよい。
【0097】
本発明の様々な実施形態は、フローチャートおよびブロック図を参照して記載されてよく、ここにおいてブロックは、(1)操作が実行されるプロセスの段階または(2)操作を実行する役割を持つ装置のセクションを表わしてよい。特定の段階およびセクションが、専用回路、コンピュータ可読媒体上に格納されるコンピュータ可読命令と共に供給されるプログラマブル回路、および/またはコンピュータ可読媒体上に格納されるコンピュータ可読命令と共に供給されるプロセッサによって実装されてよい。専用回路は、デジタルおよび/またはアナログハードウェア回路を含んでよく、集積回路(IC)および/またはディスクリート回路を含んでよい。プログラマブル回路は、論理AND、論理OR、論理XOR、論理NAND、論理NOR、および他の論理操作、フリップフロップ、レジスタ、フィールドプログラマブルゲートアレイ(FPGA)、プログラマブルロジックアレイ(PLA)等のようなメモリ要素等を含む、再構成可能なハードウェア回路を含んでよい。
【0098】
コンピュータ可読媒体は、適切なデバイスによって実行される命令を格納可能な任意の有形なデバイスを含んでよく、その結果、そこに格納される命令を有するコンピュータ可読媒体は、フローチャートまたはブロック図で指定された操作を実行するための手段を作成すべく実行され得る命令を含む、製品を備えることになる。コンピュータ可読媒体の例としては、電子記憶媒体、磁気記憶媒体、光記憶媒体、電磁記憶媒体、半導体記憶媒体等が含まれてよい。コンピュータ可読媒体のより具体的な例としては、フロッピー(登録商標)ディスク、ディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、消去可能プログラマブルリードオンリメモリ(EPROMまたはフラッシュメモリ)、電気的消去可能プログラマブルリードオンリメモリ(EEPROM)、静的ランダムアクセスメモリ(SRAM)、コンパクトディスクリードオンリメモリ(CD-ROM)、デジタル多用途ディスク(DVD)、ブルーレイ(RTM)ディスク、メモリスティック、集積回路カード等が含まれてよい。
【0099】
コンピュータ可読命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、またはSmalltalk(登録商標)、JAVA(登録商標)、C++等のようなオブジェクト指向プログラミング言語、および「C」プログラミング言語または同様のプログラミング言語のような従来の手続型プログラミング言語を含む、1または複数のプログラミング言語の任意の組み合わせで記述されたソースコードまたはオブジェクトコードのいずれかを含んでよい。
【0100】
コンピュータ可読命令は、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサまたはプログラマブル回路に対し、ローカルにまたはローカルエリアネットワーク(LAN)、インターネット等のようなワイドエリアネットワーク(WAN)を介して提供され、フローチャートまたはブロック図で指定された操作を実行するための手段を作成すべく、コンピュータ可読命令を実行してよい。プロセッサの例としては、コンピュータプロセッサ、処理ユニット、マイクロプロセッサ、デジタル信号プロセッサ、コントローラ、マイクロコントローラ等を含む。
【0101】
図13は、本発明の複数の態様が全体的又は部分的に具現化されうるコンピュータ1200の例を示す。コンピュータ1200にインストールされたプログラムは、コンピュータ1200に、本発明の実施形態に係る装置に関連付けられるオペレーション又は当該装置の1又は複数の「部」として機能させ、又は当該オペレーション又は当該1又は複数の「部」を実行させることができ、及び/又はコンピュータ1200に、本発明の実施形態に係るプロセス又は当該プロセスの段階を実行させることができる。このようなプログラムは、コンピュータ1200に、本明細書に記載のフローチャート及びブロック図のブロックのうちのいくつか又はすべてに関連付けられた特定のオペレーションを実行させるべく、CPU1212によって実行されてよい。
【0102】
本実施形態によるコンピュータ1200は、CPU1212、RAM1214、グラフィックコントローラ1216、及びディスプレイデバイス1218を含み、これらはホストコントローラ1210によって相互に接続される。コンピュータ1200はまた、通信インターフェース1222、ハードディスクドライブ1224、DVD-ROMドライブ1226、及びICカードドライブのような入出力ユニットを含み、これらは入出力コントローラ1220を介してホストコントローラ1210に接続される。コンピュータはまた、ROM1230及びキーボード1242のようなレガシの入出力ユニットを含み、これらは入出力チップ1240を介して入出力コントローラ1220に接続される。
【0103】
CPU1212は、ROM1230及びRAM1214内に格納されたプログラムに従い動作し、これにより各ユニットを制御する。グラフィックコントローラ1216は、RAM1214内に提供されるフレームバッファ等又は当該グラフィックコントローラ1216自体の中に、CPU1212によって生成されるイメージデータを取得し、イメージデータがディスプレイデバイス1218上に表示させる。
【0104】
通信インターフェース1222は、ネットワークを介して他の電子デバイスと通信する。ハードディスクドライブ1224は、コンピュータ1200内のCPU1212によって使用されるプログラム及びデータを格納する。DVD-ROMドライブ1226は、プログラム又はデータをDVD-ROM1201から読み取り、ハードディスクドライブ1224にRAM1214を介してプログラム又はデータを提供する。ICカードドライブは、プログラム及びデータをICカードから読み取り、及び/又はプログラム及びデータをICカードに書き込む。
【0105】
ROM1230は、内部に、アクティブ化時にコンピュータ1200によって実行されるブートプログラム等、及び/又はコンピュータ1200のハードウェアに依存するプログラムを格納する。入出力チップ1240はまた、様々な入出力ユニットをパラレルポート、シリアルポート、キーボードポート、マウスポート等を介して、入出力コントローラ1220に接続してよい。
【0106】
プログラムが、DVD-ROM1201又はICカードのようなコンピュータ可読記憶媒体によって提供される。プログラムは、コンピュータ可読記憶媒体から読み取られ、コンピュータ可読記憶媒体の例でもあるハードディスクドライブ1224、RAM1214、又はROM1230にインストールされ、CPU1212によって実行される。これらのプログラム内に記述される情報処理は、コンピュータ1200に読み取られ、プログラムと、上記様々なタイプのハードウェアリソースとの間の連携をもたらす。装置又は方法が、コンピュータ1200の使用に従い情報のオペレーション又は処理を実現することによって構成されてよい。
【0107】
例えば、通信がコンピュータ1200及び外部デバイス間で実行される場合、CPU1212は、RAM1214にロードされた通信プログラムを実行し、通信プログラムに記述された処理に基づいて、通信インターフェース1222に対し、通信処理を命令してよい。通信インターフェース1222は、CPU1212の制御の下、RAM1214、ハードディスクドライブ1224、DVD-ROM1201、又はICカードのような記録媒体内に提供される送信バッファ領域に格納された送信データを読み取り、読み取られた送信データをネットワークに送信し、又はネットワークから受信した受信データを記録媒体上に提供される受信バッファ領域等に書き込む。
【0108】
また、CPU1212は、ハードディスクドライブ1224、DVD-ROMドライブ1226(DVD-ROM1201)、ICカード等のような外部記録媒体に格納されたファイル又はデータベースの全部又は必要な部分がRAM1214に読み取られるようにし、RAM1214上のデータに対し様々なタイプの処理を実行してよい。CPU1212は次に、処理されたデータを外部記録媒体にライトバックしてよい。
【0109】
様々なタイプのプログラム、データ、テーブル、及びデータベースのような、様々なタイプの情報が、情報処理されるべく、記録媒体に格納されてよい。CPU1212は、RAM1214から読み取られたデータに対し、本開示の随所に記載され、プログラムの命令シーケンスによって指定される様々なタイプのオペレーション、情報処理、条件判断、条件分岐、無条件分岐、情報の検索/置換等を含む、様々なタイプの処理を実行してよく、結果をRAM1214に対しライトバックする。また、CPU1212は、記録媒体内のファイル、データベース等における情報を検索してよい。例えば、各々が第2の属性の属性値に関連付けられた第1の属性の属性値を有する複数のエントリが記録媒体内に格納される場合、CPU1212は、当該複数のエントリの中から、第1の属性の属性値が指定されている条件に一致するエントリを検索し、当該エントリ内に格納された第2の属性の属性値を読み取り、これにより予め定められた条件を満たす第1の属性に関連付けられた第2の属性の属性値を取得してよい。
【0110】
以上の説明によるプログラム又はソフトウェアモジュールは、コンピュータ1200上又はコンピュータ1200近傍のコンピュータ可読記憶媒体に格納されてよい。また、専用通信ネットワーク又はインターネットに接続されたサーバシステム内に提供されるハードディスク又はRAMのような記録媒体が、コンピュータ可読記憶媒体として使用可能であり、これにより、プログラムをコンピュータ1200にネットワークを介して提供する。
【0111】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。また、技術的に矛盾しない範囲において、特定の実施形態について説明した事項を、他の実施形態に適用することができる。また、各構成要素は、名称が同一で、参照符号が異なる他の構成要素と同様の特徴を有してもよい。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
【0112】
例えば、ルールベースの探索は、カーナビゲーションシステムやスマートフォンのGPS情報から、特定の地点を含む、緯度経度の範囲で表される区域の地理データ、例えばタイル座標やメッシュコードなどの地理データを取得することを含んでもよい。すなわち、取得部は、特定の地点を含む区域に関する地理データを取得する具体例として、GPS情報から当該特定の地点を含む区域の地理データを取得してもよい。
【0113】
特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。
【符号の説明】
【0114】
10 システム
20 ユーザ
30 通信端末
50 通信ネットワーク
60 区域
100 推論装置
101 取得部
103 推論部
105 算出部
107 補正部
1200 コンピュータ
1201 DVD-ROM
1210 ホストコントローラ
1212 CPU
1214 RAM
1216 グラフィックコントローラ
1218 ディスプレイデバイス
1220 入出力コントローラ
1222 通信インターフェース
1224 ハードディスクドライブ
1226 DVD-ROMドライブ
1230 ROM
1240 入出力チップ
1242 キーボード
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
【手続補正書】
【提出日】2022-07-27
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
特定の地点を含む区域に関する地理データを取得する取得部と、
任意の地点に関する第1言語表現および前記任意の地点を含む区域に関する地理データと、前記任意の地点との対応関係の学習結果に基づき、前記特定の地点に関する第1言語表現および前記取得部によって取得された前記地理データから前記特定の地点を推論する推論部と
を備え
前記推論部は、
前記任意の地点に関する前記第1言語表現から特定される複数の言語特徴量、および、前記任意の地点を含む区域に関する前記地理データに含まれる複数の地図画像または地物画像から特定される複数の画像特徴量と、前記任意の地点との対応関係を学習し、
前記取得部によって取得された前記地理データに含まれる複数の地図画像または地物画像から複数の画像特徴量を特定し、
前記特定の地点に関する前記第1言語表現から複数の言語特徴量を特定し、
前記特定の地点に関する前記複数の画像特徴量および前記複数の言語特徴量から前記特定の地点を推論する、
推論装置。
【請求項2】
前記推論部は、
前記任意の地点を含む第1区域から、前記第1区域よりも小さい、前記任意の地点を含む第2区域へと段階的に、前記任意の地点に関する前記複数の言語特徴量および前記複数の画像特徴量と、前記任意の地点との対応関係を学習し、
前記特定の地点を含む第3区域から、前記第3区域よりも小さい、前記特定の地点を含む第4区域へと段階的に、前記特定の地点に関する前記複数の画像特徴量および前記複数の言語特徴量から前記特定の地点を推論する、
請求項に記載の推論装置。
【請求項3】
前記推論部は、前記特定の地点に関する前記複数の言語特徴量にそれぞれ対応する前記複数の画像特徴量に示される地理的な尤度を足し合わせることで前記特定の地点の画像を生成する、
請求項1または2に記載の推論装置。
【請求項4】
前記推論部が生成した前記特定の地点の前記画像の中で、最も地理的な尤度が高い点を前記特定の地点として決定し、決定した前記点の緯度および経度を算出する算出部を更に備える、
請求項に記載の推論装置。
【請求項5】
前記算出部が算出した前記緯度および前記経度で特定される地点が道路上に位置していない場合に、前記算出部が算出した前記緯度および前記経度を、特定される前記地点に最も近い道路上における、特定される前記地点から最も近い地点の緯度および経度に補正する補正部を更に備える、
請求項に記載の推論装置。
【請求項6】
前記取得部は、前記特定の地点に関する第2言語表現を取得した場合に、前記第2言語表現に基づいて前記特定の地点を含む区域のオープンデータを取得し、前記オープンデータから、ランドマーク、道路および交差点の少なくとも何れかによって分類した前記複数の地図画像または地物画像を生成する、
請求項1から5の何れか一項に記載の推論装置。
【請求項7】
前記取得部は、前記特定の地点に関する自然言語表現を取得し、前記自然言語表現を、前記特定の地点に関するベクトル表現である前記第1言語表現に変換して前記推論部に出力する、
請求項1から6の何れか一項に記載の推論装置。
【請求項8】
コンピュータによって実行される推論方法であって、
特定の地点を含む区域に関する地理データを取得する取得段階と、
任意の地点に関する第1言語表現および前記任意の地点を含む区域に関する地理データと、前記任意の地点との対応関係の学習結果に基づき、前記特定の地点に関する第1言語表現および前記取得段階で取得した前記地理データから前記特定の地点を推論する推論段階と
を備え
前記推論段階は、
前記任意の地点に関する前記第1言語表現から特定される複数の言語特徴量、および、前記任意の地点を含む区域に関する前記地理データに含まれる複数の地図画像または地物画像から特定される複数の画像特徴量と、前記任意の地点との対応関係を学習することと、
前記取得段階で取得された前記地理データに含まれる複数の地図画像または地物画像から複数の画像特徴量を特定することと、
前記特定の地点に関する前記第1言語表現から複数の言語特徴量を特定することと、
前記特定の地点に関する前記複数の画像特徴量および前記複数の言語特徴量から前記特定の地点を推論することと
を含む、
推論方法。
【請求項9】
コンピュータに、
特定の地点を含む区域に関する地理データを取得する取得手順と、
任意の地点に関する第1言語表現および前記任意の地点を含む区域に関する地理データと、前記任意の地点との対応関係の学習結果に基づき、前記特定の地点に関する第1言語表現および前記取得手順で取得した前記地理データから前記特定の地点を推論する推論手順と
を実行させるためのプログラムであり、
前記推論手順は、
前記任意の地点に関する前記第1言語表現から特定される複数の言語特徴量、および、前記任意の地点を含む区域に関する前記地理データに含まれる複数の地図画像または地物画像から特定される複数の画像特徴量と、前記任意の地点との対応関係を学習することと、
前記取得手順で取得された前記地理データに含まれる複数の地図画像または地物画像から複数の画像特徴量を特定することと、
前記特定の地点に関する前記第1言語表現から複数の言語特徴量を特定することと、
前記特定の地点に関する前記複数の画像特徴量および前記複数の言語特徴量から前記特定の地点を推論することと
を含む、
プログラム