(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022049767
(43)【公開日】2022-03-30
(54)【発明の名称】情報処理装置、情報処理方法、情報処理システム、情報処理プログラム
(51)【国際特許分類】
G06T 7/70 20170101AFI20220323BHJP
G06T 7/00 20170101ALI20220323BHJP
G06Q 50/16 20120101ALI20220323BHJP
H03M 7/30 20060101ALI20220323BHJP
【FI】
G06T7/70 Z
G06T7/00 350B
G06Q50/16 300
H03M7/30 Z
【審査請求】有
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2020155970
(22)【出願日】2020-09-17
(11)【特許番号】
(45)【特許公報発行日】2021-02-17
(71)【出願人】
【識別番号】517158083
【氏名又は名称】株式会社スペースリー
(74)【代理人】
【識別番号】230122390
【弁護士】
【氏名又は名称】石原 一樹
(72)【発明者】
【氏名】森田 博和
(72)【発明者】
【氏名】安田 洋介
【テーマコード(参考)】
5J064
5L049
5L096
【Fターム(参考)】
5J064BA13
5J064BD03
5L049CC28
5L096CA02
5L096FA67
5L096FA69
5L096HA11
5L096KA04
(57)【要約】
【課題】物の写真および物の平面図に関係する情報を処理することを可能とする情報処理装置等を提供する。
【解決手段】学習済みモデルと、物の写真および物の平面図とに基づいて、物の平面図における物の写真が撮影された撮影位置と撮影方向を推定する情報処理装置が提供される。一態様において、物の平面図は、不動産物件の間取り図であり、前記物の写真は、部屋写真であってもよい。一態様において、情報処理装置における制御部が物の写真におけるchannel方向のベクトルに圧縮した情報とwidth方向のベクトルに圧縮した情報とを抽出し、これと物の平面図を圧縮した情報とをコンカットすることで、両者を対応付ける。
【選択図】
図7
【特許請求の範囲】
【請求項1】
記憶部と制御部とを有する情報処理装置であって、
前記記憶部は、第1のN個の物の情報と、前記第1のN個の物それぞれを撮影した1以上の写真との対応関係に基づいた学習済モデルを記憶し、
前記制御部が、前記学習済みモデルと、前記N個の物と異なる第2の物の写真および該第2の物の平面図とに基づいて、前記第2の物の平面図における前記第2の物の写真が撮影された撮影位置と撮影方向を推定する、
情報処理装置。
【請求項2】
前記撮影位置と撮影方向を推定することは、
前記制御部が、前記学習済みモデルに基づいて前記第2の物の写真を圧縮して該第2の物の写真におけるオブジェクトの内容と位置からなる特徴を認識し、前記第2の物の平面図におけるオブジェクトの内容と位置からなる特徴と対照することを含む、
請求項1に記載の情報処理装置。
【請求項3】
前記第2の物の写真におけるオブジェクトの内容と位置からなる特徴を認識することは、
前記制御部が前記第2の物の写真におけるchannel方向のベクトルに圧縮した情報とwidth方向のベクトルに圧縮した情報とを抽出することを含む、
請求項2に記載の情報処理装置。
【請求項4】
前記対照することは、
前記制御部が前記第2の物の写真における前記channel方向のベクトルに圧縮した情報と前記width方向のベクトルに圧縮した情報とを、それぞれ前記第2の物の平面図を圧縮した情報と2回以上コンカットすることを含む、
請求項3に記載の情報処理装置。
【請求項5】
前記対照することは、
さらに、前記制御部が前記コンカットの結果を、前記撮影位置を推定するための2次元のヒートマップと、前記撮影方向を推定するための1次元のヒートマップとを出力して評価することを含む、
請求項4に記載の情報処理装置。
【請求項6】
前記コンカットは、
前記制御部が前記第2の物の写真における前記channel方向のベクトルに圧縮した情報と前記width方向のベクトルに圧縮した情報とを、ぞれぞれ、前記第2の物の平面図の幅方向および高さ方向に基づいて1以上複製し、当該複製した情報に基づいて前記第2の物の平面図を圧縮した情報とコンカットすることである、
請求項4または5に記載の情報処理装置。
【請求項7】
制御部を有し、物の平面図と該物の写真との対応付けを行う情報処理装置であって、
前記制御部が、前記平面図を畳み込んで得た3次元特徴量と、前記写真から抽出されたchannel方向のベクトルに圧縮した1次元特徴量およびwidth方向のベクトルに圧縮した1次元特徴量とを、前記各1次元特徴量を前記3次元特徴量の幅方向および高さ方向に1以上複製してコンカットする、
情報処理装置。
【請求項8】
制御部を有し、物の平面図と当該物の写真との対応付けを行う情報処理装置であって、
前記制御部が、前記平面図を畳み込んで得た特徴量と、前記写真から抽出された特徴量とをコンカットして対照し、該対照結果を1次元または2次元のヒートマップとして出力して評価し前記対応付けを行う、
情報処理装置。
【請求項9】
記憶部を有し、第1の情報と第2の情報とを対応付ける情報処理装置であって、
前記第1の情報から得た3次元特徴量と前記第2の情報から得た第1の1次元特徴量および第2の1次元特徴量とを、前記各1次元特徴量を前記3次元特徴量の幅方向および高さ方向に1以上複製してコンカットして前記第1の情報と前記第2の情報との前記対応付けを行う、
情報処理装置。
【請求項10】
コンピュータを、
記憶部と制御部とを有し、
前記記憶部が、第1のN個の物の情報と、前記第1のN個の物それぞれを撮影した1以上の写真との対応関係に基づいた学習済モデルを記憶し、
前記制御部が、前記学習済みモデルと、前記N個の物と異なる第2の物の写真および該第2の物の平面図とに基づいて、前記第2の物の平面図における前記第2の物の写真が撮影された撮影位置と撮影方向を推定する情報処理装置として動作させる、
コンピュータプログラム。
【請求項11】
コンピュータを、
制御部を有し、
前記制御部が、物の平面図を畳み込んで得た3次元特徴量と、前記物の写真から抽出されたchannel方向のベクトルに圧縮した1次元特徴量およびwidth方向のベクトルに圧縮した1次元特徴量とを、前記各1次元特徴量を前記3次元特徴量の幅方向および高さ方向に1以上複製してコンカットして前記平面図と前記写真との対応付けを行う情報処理装置として動作させる、
コンピュータプログラム。
【請求項12】
コンピュータを、
制御部を有し、
前記制御部が、物の平面図の特徴量と、前記物の写真から抽出された特徴量とをコンカットして対照し、該対照結果を1次元または2次元のヒートマップとして出力して評価し、前記平面図と前記写真との対応付けを行う情報処理装置として動作させる、
コンピュータプログラム。
【請求項13】
コンピュータを、
制御部を有し、
前記制御部が、第1の情報から得た3次元特徴量と第2の情報から得た第1の1次元特徴量および第2の1次元特徴量とを、前記各1次元特徴量を前記3次元特徴量の幅方向および高さ方向に1以上複製してコンカットして前記第1の情報と前記第2の情報との対応付けを行う情報処理装置として動作させる、
コンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、情報処理システム、情報処理プログラムに関する。一例として、不動産物件の「部屋写真」および「間取り図」に関連する情報を処理することを可能とする情報処理装置、情報処理方法、情報処理システム、情報処理プログラムに関する。
【背景技術】
【0002】
不動産の物件案内には、通常、当該不動産の平面図としての間取り図が掲載されており、加えて、特定の部屋や設備に関してはそれらを撮影した写真が掲載されることがある。従来は、不動産物件の部屋写真(たとえば、廊下、居間、洋室、キッチン、トイレ、玄関、ベランダなどの写真)を撮影した場合、その写真と、間取り図との対応関係(たとえば、どの場所から撮影したものであるのか、どの方向に向かって撮影したものであるのか等)については、不動産業者等において手動で入力を行っていた。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】Nam Vo et al. CVPR2019, Composing Text and Image for Image Retrieval - An Empirical Odyssey (arXiv:1812.07119)
【非特許文献2】Shuai Liao et al. CVPR 2019, Spherical Regression: Learning Viewpoints, Surface Normals and 3D Rotations on n-Spheres (arXiv:1904.05404)
【発明の概要】
【発明が解決しようとする課題】
【0004】
上記のとおり、物件の部屋写真については、従来から、物件案内等において掲載され、当該写真がどの場所ないし部屋の写真なのかを説明する物件説明が記載されてきた。しかしながら、現在までにその撮影位置や撮影方向の入力について自動化の試みは、(本発明者ら以外においては)奏功していない。その主な理由は、建築図面である間取り図と、不動産の部屋等の現物を撮影した部屋写真とが、全く異なる次元の図であるためであった。たとえば、
図1と
図2を参照する。
図1はいわゆる間取り図(フロアデザイン)の一例であり、
図1の物件では玄関正面に収納があり、玄関からは、トイレと10.9畳のLDK(リビングダイニングキッチン)に入室することができる。LDK(リビングダイニングキッチン)には、キッチンが配置され、図面右手方向の6.7畳洋室と、図面左手方向の5.4畳の洋室に隣接している。都合2部屋とLDKが存在することになる。他方、
図2は、デジタルカメラによって撮影した
図1に示す物件内部の写真である。間取り図(フロアデザイン)とは次元も視点も異なる図である。
【0005】
図1に、当該写真の撮影位置と撮影方向を矢印で記載した。人間が観察すれば、正面にキッチンがあり、右手方向に扉が複数位置していることなどが分かるが、このような撮影位置と撮影方向の特定は、コンピュータで精度良く自動的に入力することができなかったため、不動産会社等において人が推測し、手作業で入力するほかなかった。このような課題を発見した本件発明者らは、これらの課題を解決することのできる、より利便性の高い、不動産物件の間取り図および部屋写真の情報処理に係る情報処理装置、当該情報処理装置を用いた情報処理方法、当該情報処理装置を含む情報処理システム、コンピュータを当該情報処理装置として動作させる情報処理プログラムが求められることを認識し、本件発明に至ったものである。なお、その際、非特許文献1ないし2のような画像の認識に係る先行技術文献に接したものの、これらの文献に記載の技術では、本課題を解決することはできなかった。
【課題を解決するための手段】
【0006】
本発明の一実施形態においては、記憶部(発明の詳細な説明における記憶部33に対応する)と制御部(発明の詳細な説明における制御部32に対応する)とを有する情報処理装置(発明の詳細な説明における情報処理装置3に対応する)であって、前記記憶部は、第1のN個の物の情報(発明の詳細な説明における、学習モデルの部屋に関する情報に対応する)と、前記第1のN個の物それぞれを撮影した1以上の写真(発明の詳細な説明における、学習モデルの部屋写真に対応する)との対応関係に基づいた学習済モデルを記憶し、前記制御部が、前記学習済みモデルと、前記N個の物と異なる第2の物の写真(発明の詳細な説明における、推定対象であるところの部屋写真に対応する)および該第2の物の平面図(発明の詳細な説明における、推定対象であるところの部屋写真に対応した間取り図に対応する)とに基づいて、前記第2の物の平面図における前記第2の物の写真が撮影された撮影位置と撮影方向を推定する、情報処理装置が提供される。
【0007】
上記構成を備える情報処理装置は、学習済みモデルを用いて、物の写真が撮影された撮影位置と撮影方向を物の平面図において推定することが可能である。
【0008】
本発明の一実施形態においては、記憶部(発明の詳細な説明における記憶部33に対応する)と制御部(発明の詳細な説明における制御部32に対応する)とを有する情報処理装置(発明の詳細な説明における情報処理装置3に対応する)における情報処理方法であって、前記記憶部が、第1のN個の物の情報(発明の詳細な説明における、学習モデルの部屋に関する情報に対応する)と、前記第1のN個の物それぞれを撮影した1以上の写真(発明の詳細な説明における、学習モデルの部屋写真に対応する)との対応関係に基づいた学習済モデルを記憶し、前記制御部が、前記学習済みモデルと、前記N個の物と異なる第2の物の写真(発明の詳細な説明における、推定対象であるところの部屋写真に対応する)および該第2の物の平面図(発明の詳細な説明における、推定対象であるところの部屋写真に対応した間取り図に対応する)とに基づいて、前記第2の物の平面図における前記第2の物の写真が撮影された撮影位置と撮影方向を推定する、情報処理方法が提供される。
【0009】
上記構成を備える情報処理方法は、コンピュータにより、学習済みモデルを用い、物の写真が撮影された撮影位置と撮影方向を物の平面図において推定することを可能とする。
【0010】
本発明の一実施形態においては、コンピュータを、記憶部(発明の詳細な説明における記憶部33に対応する)と制御部(発明の詳細な説明における制御部32に対応する)とを有する情報処理装置(発明の詳細な説明における情報処理装置3に対応する)であって、前記記憶部は、第1のN個の物の情報(発明の詳細な説明における、学習モデルの部屋に関する情報に対応する)と、前記第1のN個の物それぞれを撮影した1以上の写真(発明の詳細な説明における、学習モデルの部屋写真に対応する)との対応関係に基づいた学習済モデルを記憶し、前記制御部が、前記学習済みモデルと、前記N個の物と異なる第2の物の写真(発明の詳細な説明における、推定対象であるところの部屋写真に対応する)および該第2の物の平面図(発明の詳細な説明における、推定対象であるところの部屋写真に対応した間取り図に対応する)とに基づいて、前記第2の物の平面図における前記第2の物の写真が撮影された撮影位置と撮影方向を推定する情報処理装置として機能させる、情報処理プログラムが提供される。
【0011】
上記構成を備える情報処理プログラムは、コンピュータを、学習済みモデルを用い、物の写真が撮影された撮影位置と撮影方向を物の平面図において推定する装置として利用することを可能とする。
【0012】
本発明の一実施形態においては、情報処理装置(発明の詳細な説明における情報処理装置3に対応する)を含む情報処理システムであって、該情報処理装置は記憶部(発明の詳細な説明における記憶部33に対応する)と制御部(発明の詳細な説明における制御部32に対応する)とを有し、前記記憶部は、第1のN個の物の情報(発明の詳細な説明における、学習モデルの部屋に関する情報に対応する)と、前記第1のN個の物それぞれを撮影した1以上の写真(発明の詳細な説明における、学習モデルの部屋写真に対応する)との対応関係に基づいた学習済モデルを記憶し、前記制御部が、前記学習済みモデルと、前記N個の物と異なる第2の物の写真(発明の詳細な説明における、推定対象であるところの部屋写真に対応する)および該第2の物の平面図(発明の詳細な説明における、推定対象であるところの部屋写真に対応した間取り図に対応する)とに基づいて、前記第2の物の平面図における前記第2の物の写真が撮影された撮影位置と撮影方向を推定する、情報処理システムが提供される。当該情報処理システムはさらに、上記情報処理装置にインターネット回線等を通じてアクセス可能な端末を含みうる。
【0013】
上記構成を備える情報処理システムは、コンピュータにおいて、学習済みモデルを用い、物の写真が撮影された撮影位置と撮影方向を物の平面図において推定することを可能とし、システムが端末を含む場合にあっては、該撮影位置と撮影方向の推定の結果を該端末において把握させることを可能とする。
【0014】
本発明の一実施形態において、前記撮影位置と撮影方向を推定することは、前記制御部が、前記学習済みモデルに基づいて前記第2の物の写真を圧縮して該第2の物の写真におけるオブジェクトの内容と位置からなる特徴を認識し、前記第2の物の平面図におけるオブジェクトの内容と位置からなる特徴と対照することを特徴としてもよい。
【0015】
上記構成を備えることにより、撮影位置および撮影方向の推定の演算量を減少させ、本発明出願当時の通常のサーバ装置においても十分な正確性をもって撮影位置および撮影方向の推定を行うことを可能とする。
【0016】
本発明の一実施形態において、前記第2の物の写真におけるオブジェクトの内容と位置からなる特徴を認識することは、前記制御部が前記第2の物の写真におけるchannel方向のベクトルに圧縮した情報とwidth方向のベクトルに圧縮した情報とを抽出することを特徴としてもよい。
【0017】
上記構成を備えることにより撮影位置および撮影方向の推定の正確性を向上させることが可能となる。
【0018】
本発明の一実施形態において、前記対照することは、前記制御部が前記第2の物の写真における前記channel方向のベクトルに圧縮した情報と前記width方向のベクトルに圧縮した情報とを、それぞれ前記第2の物の平面図を圧縮した情報と2回以上コンカットすることを特徴としてもよい。
【0019】
上記構成を備えることにより撮影位置および撮影方向の推定の正確性を向上させることが可能となる。
【0020】
本発明の一実施形態において、前記対照することは、さらに、前記制御部が前記コンカットの結果を、前記撮影位置を推定するためのヒートマップ(たとえば、2次元のヒートマップ)と、前記撮影方向を推定するためのヒートマップ(たとえば、1次元のヒートマップ)とを出力して評価することを含むことを特徴としてもよい。
【0021】
上記構成を備えることにより撮影位置および撮影方向の推定の正確性を向上させることが可能となる。
【0022】
本発明の一実施形態において、前記コンカットは、前記制御部が前記第2の物の写真における前記channel方向のベクトルに圧縮した情報と前記width方向のベクトルに圧縮した情報とを、ぞれぞれ、前記第2の物の平面図の幅方向および高さ方向に基づいて1以上複製し、当該複製した情報に基づいて前記第2の物の平面図を圧縮した情報とコンカットすることを特徴としてもよい。
【0023】
上記構成を備えることにより、写真のchannel方向のベクトルに圧縮した情報とwidth方向のベクトルに圧縮した情報とを分けて平面図と対応付けることができ、もって正確性を向上させることが可能としてもよい。
【0024】
本発明の一実施形態において、前記第1のN個の物の情報は、N個の不動産物件の情報(たとえば、部屋内容、部屋情報、部屋内の物体の情報、間取りの内容に関する情報)であってもよく、また、前記第1のN個の物それぞれを撮影した1以上の写真は、該不動産物件の1以上の第1の部屋写真であってもよく、また、前記第2の物の平面図は、第2の間取り図であってもよく、また、前記第2の物の写真は、第2の部屋写真であってもよい。
【0025】
上記構成を備えることにより、所定の部屋の間取り図における部屋写真(たとえば、パノラマ画像)が撮影された撮影位置と撮影方向を推定することが可能となる。
【0026】
本発明の一実施形態においては、制御部を有し、物の平面図と該物の写真との対応付けを行う情報処理装置であって、前記制御部が、前記平面図の3次元特徴量と、前記写真から抽出されたchannel方向のベクトルに圧縮した1次元特徴量およびwidth方向のベクトルに圧縮した1次元特徴量とを、前記各1次元特徴量を前記3次元特徴量の幅方向および高さ方向に1以上複製してコンカットする、情報処理装置が提供される。本発明の一実施形態において、前記物の平面図は、不動産物件の間取り図であり、前記物の写真は、部屋写真であってもよい。
【0027】
上記構成を備えた情報処理装置により、3次元特徴量と1次元特徴量とを対応付ける際に、3次元特徴量の有する情報を失うことなく対応付けることが可能となる。
【0028】
本発明の一実施形態においては、制御部を有する情報処理装置における、物の平面図と該物の写真との対応付けを行う情報処理方法であって、前記制御部が、前記平面図の3次元特徴量と、前記写真から抽出されたchannel方向のベクトルに圧縮した1次元特徴量およびwidth方向のベクトルに圧縮した1次元特徴量とを、前記各1次元特徴量を前記3次元特徴量の幅方向および高さ方向に1以上複製してコンカットする、情報処理方法が提供される。本発明の一実施形態において、前記物の平面図は、不動産物件の間取り図であり、前記物の写真は、部屋写真であってもよい。
【0029】
上記構成を備えた情報処理方法により、3次元特徴量と1次元特徴量とを対応付ける際に、3次元特徴量の有する情報を失うことなく対応付けることが可能となる。
【0030】
本発明の一実施形態においては、コンピュータを、物の平面図と該物の写真との対応付けを行う制御部を有する情報処理装置であって、前記制御部が、前記平面図の3次元特徴量と、前記写真から抽出されたchannel方向のベクトルに圧縮した1次元特徴量およびwidth方向のベクトルに圧縮した1次元特徴量とを、前記各1次元特徴量を前記3次元特徴量の幅方向および高さ方向に1以上複製してコンカットしてする、情報処理装置として動作させるコンピュータプログラムが提供される。本発明の一実施形態において、前記物の平面図は、不動産物件の間取り図であり、前記物の写真は、部屋写真であってもよい。
【0031】
上記構成を備えた情報処理プログラムにより、情報処理装置において、3次元特徴量と1次元特徴量とを対応付ける際に、3次元特徴量の有する情報を失うことなく対応付けることが可能となる。
【0032】
本発明の一実施形態においては、物の平面図と該物の写真との対応付けを行う制御部を有する情報処理装置を含む情報処理システムであって、前記制御部が、前記平面図の3次元特徴量と、前記写真から抽出されたchannel方向のベクトルに圧縮した1次元特徴量およびwidth方向のベクトルに圧縮した1次元特徴量とを、前記各1次元特徴量を前記3次元特徴量の幅方向および高さ方向に1以上複製してコンカットしてする、情報処理システムが提供される。当該情報処理システムはさらに、上記情報処理装置にインターネット回線等を通じてアクセス可能な端末を含みうる。本発明の一実施形態において、前記物の平面図は、不動産物件の間取り図であり、前記物の写真は、部屋写真であってもよい。
【0033】
上記構成を備えた情報処理システムにより、情報処理装置において、3次元特徴量と1次元特徴量とを対応付ける際に、3次元特徴量の有する情報を失うことなく対応付けることが可能となる。
【0034】
本発明の一実施形態においては、制御部を有し、物の平面図と当該物の写真との対応付けを行う情報処理装置であって、前記制御部が、前記平面図の特徴量と、前記写真から抽出された特徴量とをコンカットして対照し、該対照結果を1次元または2次元のヒートマップとして出力して前記対応付けを行う、情報処理装置が提供される。本発明の一実施形態において、前記物の平面図は、不動産物件の間取り図であり、前記物の写真は、部屋写真であってもよい。本発明の別の実施形態においては、制御部を有し、物(変形例2における「端末装置5」に対応する。)の周囲情報(変形例2における「周囲画像」に対応する。)と当該物から撮影された写真との対応付けを行う(変形例2における「端末装置5の現在の向きを計算」することに対応する)情報処理装置であって、前記制御部が、前記周囲情報の特徴量と、前記写真から抽出された特徴量とをコンカットして対照し、該対照結果を1次元のヒートマップとして出力して前記対応付けを行う、情報処理装置が提供される。
【0035】
上記構成を備えた情報処理装置により、平面図(または周囲情報ないし周囲画像)と写真とを対応付ける際に、正確性を向上させることが可能となる。
【0036】
本発明の一実施形態においては、制御部を有し、物の平面図と当該物の写真との対応付けを行う情報処理装置における情報処理方法であって、前記制御部が、前記平面図の特徴量と、前記写真から抽出された特徴量とをコンカットして対照し、該対照結果を1次元または2次元のヒートマップとして出力して前記対応付けを行う、情報処理方法が提供される。本発明の一実施形態において、前記物の平面図は、不動産物件の間取り図であり、前記物の写真は、部屋写真であってもよい。本発明の別の実施形態においては、制御部を有し、物(変形例2における「端末装置5」に対応する。)の周囲情報(変形例2における「周囲画像」に対応する。)と当該物から撮影された写真との対応付けを行う(変形例2における「端末装置5の現在の向きを計算」することに対応する)情報処理装置における情報処理方法であって、前記制御部が、前記周囲情報の特徴量と、前記写真から抽出された特徴量とをコンカットして対照し、該対照結果を1次元のヒートマップとして出力して前記対応付けを行う、情報処理方法が提供される。
【0037】
上記構成を備えた情報処理方法により、平面図(または周囲情報ないし周囲画像)と写真とを対応付ける際に、正確性を向上させることが可能となる。
【0038】
本発明の一実施形態においては、コンピュータを、制御部を有し、物の平面図と当該物の写真との対応付けを行う情報処理装置であって、前記制御部が、前記平面図の特徴量と、前記写真から抽出された特徴量とをコンカットして対照し、該対照結果を1次元または2次元のヒートマップとして出力して前記対応付けを行う、情報処理装置として動作させるコンピュータプログラムが提供される。本発明の一実施形態において、前記物の平面図は、不動産物件の間取り図であり、前記物の写真は、部屋写真であってもよい。本発明の別の実施形態においては、コンピュータを、制御部を有し、物(変形例2における「端末装置5」に対応する。)の周囲情報(変形例2における「周囲画像」に対応する。)と当該物から撮影された写真との対応付けを行う(変形例2における「端末装置5の現在の向きを計算」することに対応する)情報処理装置であって、前記制御部が、前記周囲情報の特徴量と、前記写真から抽出された特徴量とをコンカットして対照し、該対照結果を1次元のヒートマップとして出力して前記対応付けを行う、情報処理装置として動作させるコンピュータプログラムが提供される。
【0039】
上記構成を備えた情報処理プログラムにより、情報処理装置において平面図(または周囲情報ないし周囲画像)と写真とを対応付ける際に、正確性を向上させることが可能となる。
【0040】
本発明の一実施形態においては、物の平面図と該物の写真との対応付けを行う制御部を有する情報処理装置を含む情報処理システムであって、前記制御部が、前記平面図の特徴量と、前記写真から抽出された特徴量とをコンカットして対照し、該対照結果を1次元または2次元のヒートマップとして出力して前記対応付けを行う、情報処理システムが提供される。当該情報処理システムはさらに、上記情報処理装置にインターネット回線等を通じてアクセス可能な端末を含みうる。本発明の一実施形態において、前記物の平面図は、不動産物件の間取り図であり、前記物の写真は、部屋写真であってもよい。本発明の別の実施形態においては、撮影手段を備えた端末(変形例2における「端末装置5」に対応する。)と、当該端末の周囲情報(変形例2における「周囲画像」に対応する。)および当該端末から撮影された写真を対応付ける(変形例2における「端末装置5の現在の向きを計算」することに対応する)制御部を有する情報処理装置と、を含む情報処理システムであって、前記制御部が、前記周囲情報の特徴量と、前記写真から抽出された特徴量とをコンカットして対照し、該対照結果を1次元のヒートマップとして出力して前記対応付けを行う、情報処理システムが提供される。
【0041】
上記構成を備えた情報処理システムにより、情報処理装置において平面図(または周囲情報ないし周囲画像)と写真とを対応付ける際に、正確性を向上させることが可能となる。
【0042】
本発明の一実施形態において、推定された撮影位置と撮影方向は、間取り図上において矢印等のマークを用いて表示されても良く、ユーザ端末装置における入力部の操作(たとえば、当該マークを選択すること)によって、対応する部屋写真を表示できるようにしても良い。
【0043】
本発明の一実施形態において、情報処理装置は、推定された撮影位置と撮影方向を用いて、ユーザ端末装置に対し、不動産物件の自動的及び/又はインタラクティブなツアーを提供するバーチャルツアーを提供する。バーチャルツアーでは、当該バーチャルツアーにおいて訪問される間取り図における特定の部屋(位置)における、対応するパノラマ画像によって提供され、ユーザからの方角(撮影方向)を変更する信号を受信することで撮影方向が異なるパノラマ画像を提供することもできる。
【0044】
本発明の一実施形態において、記憶部を有し、第1の情報と第2の情報とを対応付ける情報処理装置であって、前記第1の情報から得た3次元特徴量と、前記第2の情報から得た第1の1次元特徴量(たとえば、channel方向のベクトルに圧縮した1次元特徴量)および第2の1次元特徴量(たとえば、width方向のベクトルに圧縮した1次元特徴量)とを前記各1次元特徴量を前記3次元特徴量の幅方向および高さ方向に1以上複製してコンカットして前記第1の情報と前記第2の情報との前記対応付けを行う、情報処理装置が提供される。
【0045】
上記構成を有する情報処理装置によれば、2つの入力の特徴量の次元が異なる場合の情報処理(コンカット)を行う情報処理装置を提供することができる。
【0046】
本発明の一実施形態において、コンピュータを、制御部を有し、前記制御部が、第1の情報の3次元特徴量と、前記第2の情報から得た第1の1次元特徴量(たとえば、channel方向のベクトルに圧縮した1次元特徴量)および第2の1次元特徴量(たとえば、width方向のベクトルに圧縮した1次元特徴量)とを前記各1次元特徴量を前記3次元特徴量の幅方向および高さ方向に1以上複製してコンカットして前記第1の情報と前記第2の情報との対応付けを行う情報処理装置として動作させる、コンピュータプログラムが提供される。
【0047】
上記構成を有するコンピュータプログラムによれば、2つの入力の特徴量の次元が異なる場合の情報処理(コンカット)を行うことのできるコンピュータプログラムを提供することができる。
【0048】
本発明の一実施形態において、制御部を有する情報処理方法であって、前記制御部において、第1の情報の3次元特徴量と、第2の情報から得た第1の1次元特徴量(たとえば、channel方向のベクトルに圧縮した1次元特徴量)および第2の1次元特徴量(たとえば、width方向のベクトルに圧縮した1次元特徴量)とを前記各1次元特徴量を前記3次元特徴量の幅方向および高さ方向に1以上複製してコンカットして前記第1の情報と前記第2の情報との対応付けを行う、情報処理方法が提供される。
【0049】
上記構成を有する情報処理方法によれば、2つの入力の特徴量の次元が異なる場合の情報処理(コンカット)を行うことのできる、情報処理装置における情報処理方法を提供することができる。
【0050】
本発明の一実施形態において、制御部を有する情報処理装置を含む情報処理システムであって、前記制御部において、第1の情報の3次元特徴量と、第2の情報から得た第1の1次元特徴量(たとえば、channel方向のベクトルに圧縮した1次元特徴量)および第2の1次元特徴量(たとえば、width方向のベクトルに圧縮した1次元特徴量)とを前記各1次元特徴量を前記3次元特徴量の幅方向および高さ方向に1以上複製してコンカットして前記第1の情報と前記第2の情報との対応付けを行う、情報処理システムが提供される。
【0051】
上記構成を有する情報処理システムによれば、2つの入力の特徴量の次元が異なる場合の情報処理(コンカット)を行うことのできる情報処理装置を構成要素とする情報処理システムを提供することができる。
【発明の効果】
【0052】
本発明の一態様によれば、物の平面図における、当該物の写真の撮影位置および撮影方向の推定が可能となる。たとえば、不動産(物件)のパノラマ画像と間取り図を入力にして、撮影位置と撮影方向の推定が可能となる。
【図面の簡単な説明】
【0053】
【
図1】
図1は、間取り図画像の一例を示す図である。
【
図2】
図2は、デジタルカメラで撮影された、
図1に示す部屋の部屋写真(パノラマ写真)の一例を示す図である。
【
図3】
図3は、情報処理装置3(サーバ)の構成の一例を示す図である。
【
図4】
図4は、情報処理装置3(サーバ)とインターネット4とユーザ端末装置5とを含む情報処理システム1の構成の一例を示す図である。
【
図5】
図5は、ユーザ端末装置の構成の一例を示す図である。
【
図6】
図6は、本発明の一実施形態に係る情報処理ステップの事前ステップを示すための図である。具体的には、記憶部33が学習済みモデルGを記憶するまでのステップの一例を示したものである。
【
図7】
図7は、本発明の一実施形態に係る情報処理ステップを示すための図である。
【
図8】
図8は、本発明の一実施形態に係る情報処理ステップを補足説明するための図である。具体的には、部屋写真(たとえばパノラマ画像)からwidth方向の情報を抽出する場合のステップに関する説明である。
【
図9】
図9は、本発明の一実施形態に係る情報処理ステップを補足説明するための図である。具体的には、部屋写真(たとえばパノラマ画像)からwidth方向の情報を抽出する場合のステップに関する説明である。
図8において、部屋写真において対象となるべきオブジェクト位置に網掛けをして表示したものである。
【
図10】
図10は、本発明の一実施形態に係る情報処理ステップを補足説明するための図である。具体的には、1階のテンソル情報(channel方向の情報および/またはwidth方向の情報)と、3階のテンソル情報(間取り図の情報)をコンカットする際に、3階のテンソル情報が保有する空間情報を失うことなくコンカットを行うことを可能とする手法に関する。
【発明を実施するための形態】
【0054】
本発明の一実施形態を説明するフローチャートは、プロセスステップを意味しており、当該特定の例のみに限定されることなく、代替の実施態様を許容するものである。また、本明細書の明示の記載に反しない限りにおいて、プロセスステップは本明細書における特定の説明と異なる順序で実行することを許容するものである。このように、本発明の趣旨及び範囲から逸脱することなく本実施形態に対しては種々の変更を行うことができる。以下、本明細書においては、所定の部屋の「間取り図(画像)」と当該部屋の「部屋写真」を例にとって情報処理装置ないしは情報処理装置における情報処理内容を説明する。
【0055】
[物体の認識]
近時、物体の認識について、畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)は、画像のクラス分類(画像認識)だけでなく、物体の位置や大きさの検出(物体検出)や形状の抽出(領域抽出)にも用いられ、例えば、物体検出には、リージョンCNNであるR-CNN(さらに、Faster R-CNN)、Yoloなどが、領域抽出にはSegNetや画像のセグメンテーションを推定するU-Net(U字型の畳み込みネットワーク)などのニューラルネットワークが用いられるようになってきている。
【0056】
たとえば、R-CNNでは、ある矩形が物体なのか背景なのかを学習し、検出した場所に具体的に何が写っているのかを学習する。また、U-Net(U字型の畳み込みネットワーク)では物体の「局所的特徴」と「全体的位置情報」の両方を統合して学習する。本発明ではこれらの既存技術、非特許文献1および2に記載の技術を用いる際、これらの既存技術に対する詳細な説明自体は省略し、それらの技術内容を参照により本明細書に組み込むものとする。
【0057】
[ハードウェア]
本発明の実施形態に係るハードウェアの基本的な構成を説明する。まず、情報処理装置3は、サーバを念頭に置いているが、たとえば、スマートフォンやタブレット端末などのモバイル端末、ノートブックコンピュータ、デスクトップコンピュータなどの電子機器であってもよい。情報処理装置3は、物理的な演算装置(CPUおよび/またはGPU、図示せず)、一時的な作業内容を記憶しておく作業メモリ(RAM、図示せず)等、情報処理装置として必須の物理的構成を備えている。
【0058】
図3に示すように、情報処理装置3は、通信部31を有する。通信部31は、インターネット等のネットワークを介して外部と通信可能に接続されている。なお、ネットワークは、有線回線、無線回線を問わない接続方法によるインターネットや、イーサネット(登録商標)等を利用したローカルエリアネットワーク等の公知のネットワーク接続方法を用いることができる。
【0059】
情報処理装置3は、画像データの処理等を行う制御部32を更に有する。本明細書において「制御部」として説明するものは、CPUおよび/またはGPUによって対応するプログラムが読みだされ、CPUおよび/またはGPUによって実行される機能を意味する。制御部32は、情報処理装置3内のプロセッサが所定のプログラムを実行することにより実現されてもよいし、ハードウェアで実装されてもよい。
【0060】
情報処理装置は、記憶部33を更に有する。記憶部33には、制御部32が取り扱う各種データが記憶される。記憶部33は、たとえば内蔵ハードディスクドライブ、内臓ソリッドステートドライブ、外部データストレージ(たとえば外付けハードディスクドライブ、サーバ用テープドライブ等)などのデータストレージであり、場合によってはクラウドストレージなどのデータストレージであってもよい。その意味で、本発明は、制御部32と記憶部33とは別の情報処理装置を用いるという態様を許容する。
【0061】
なお、情報処理装置3はさらに入力部、表示部を備えていてもよい(図示せず)が、これらは必須の構成ではない。たとえば、入力部は情報を入力するためのインターフェースであり、モバイル端末におけるタッチパネルやマイクロフォン、ノートブックコンピュータないしデスクトップコンピュータなどにおけるタッチパッド、キーボードまたはマウスなどである。表示部は情報処理装置3の使用者に対して各種情報を表示するインターフェースであり、たとえば液晶ディスプレイ、ヘッドマウントディスプレイ等の映像表示手段である。
【0062】
[端末装置5]
本情報処理システムは、ユーザ端末装置5をさらに含んでも良い(
図4)。ユーザ端末装置5(端末5aおよび端末5b)は、ユーザが入出力するためのクライアント端末を意味する。たとえば、スマートフォンやタブレット端末などのモバイル端末、ノートブックコンピュータ、デスクトップコンピュータ、ワークステーションなどの電子機器であってもよい。これらのユーザ端末装置5と情報処理装置3とは、ネットワーク4を介して接続される。なお、変形例2においては、端末装置5はカメラを搭載したロボットやカメラを搭載した自動運転車であるが、これも、情報処理装置3にネットワーク4を通じてアクセスすることができるクライアント端末の一例であることに変わりはない。
【0063】
図5は、ユーザ端末装置5の構成の一例を示す図である。
図5に示すように、端末装置5は、(端末)通信部51と、(端末)制御部52と、(端末)記憶部53と、(端末)入力部54と、(端末)表示部55とを有し、各部は、バスを介して互いに通信可能に接続されている。以下、ユーザ端末装置5の各部については、情報処理装置3における各部と区別するために、端末通信部51などと、頭に「端末」を付して説明する。
【0064】
端末通信部51は、ユーザ端末装置5とネットワーク4との間の通信インターフェースである。端末通信部51は、ネットワーク4を介して端末装置5と情報処理装置3との間で情報を送受信することができる。
【0065】
端末制御部52は、端末装置5の各種処理を行う制御手段である。端末制御部52は、端末装置5内のプロセッサが所定のプログラムを実行することにより実現されてもよいし、ハードウェアで実装されてもよい。
【0066】
端末記憶部53は、たとえば内蔵メモリや外部メモリ(SDメモリカード等)などのデータストレージである。端末記憶部53には、端末制御部52が取り扱う各種データが記憶される。
【0067】
端末入力部54は、ユーザが端末装置5に情報を入力するためのインターフェースであり、たとえばモバイル端末におけるカメラ(CCDカメラやCMOSカメラ)、タッチパネルやマイクロフォン、ノートブックコンピュータにおけるタッチパッド、キーボードまたはマウスなどである。なお、端末装置5がロボットないし自動運転車である変形例2においては、端末入力部54としてカメラが必須の構成となる。
【0068】
端末表示部55は、端末装置5からユーザに対して各種情報を表示するインターフェースであり、たとえば液晶ディスプレイ等の映像表示手段である。具体的には、たとえば、端末表示部55は、ユーザからの操作を受け付けるためのGUI(Graphical User Interface)を表示してもよい。なお、端末装置5がロボットないし自動運転車である変形例2においては、端末表示部55は不要である。
【0069】
[間取り図]
間取り図画像(以下、単に「間取り図」とも称する。)は、建物における部屋(複数の場合もあり得る。)の配置の図(たとえば、平面図)であり、通常は、一律の縮尺で描かれている。不動産小売業者、建築家、不動産仲介業者、不動産情報業者等によって用いられる様々なタイプ又はスタイルの間取り図がある。通常は部屋の平面的な形状のみならず、部屋内の一定の物体(たとえば、扉、扉の開閉方向、キッチン、トイレ、バスタブ、床暖房の位置など)の位置と種類が、一定のルールで記載されている。間取り図画像は、JPEG、TIFF、GIF、BMP、PNG等を含む任意の画像フォーマットのものとすることができる。
【0070】
[部屋写真]
本発明において「部屋写真」は、部屋内部ないしは建物内部の空間を撮影したカラー、グレースケールまたはモノクロ等の写真を意味するものとする。部屋写真は、JPEG、TIFF、GIF、BMP、PNG等を含む任意の画像フォーマットのものとすることができる。
【0071】
本発明の一実施形態において部屋写真はパノラマ画像であることを想定しており、本発明において「パノラマ画像」とは、不動産物件内の内部ロケーションにある1以上の物体をキャプチャーすることが可能な広視野を有する任意の画像を意味するものとする。
【0072】
本実施形態では、部屋内部ないしは建物内部の空間を撮影した画像(部屋写真10)は、画角360度のパノラマ画像であることを想定しており、かかる画角が本発明に最も好適である。もっとも、パノラマ画像は、水平方向に360度未満の視野を有することもできる。また、理論上は、本発明の部屋画像10として、たとえば270度、180度又はそれ未満のようにより狭い視野の画像を用いることもできる。本明細書において以下、パノラマ画像及び部屋写真という用語は区別なく用いられ得る。すなわち、部屋、又は建物内の空間を撮影した画角360度の画像を、単に「部屋写真」とも称するものとする。
【0073】
[学習済みモデル]
本発明においては、事前に推定を行う画像等に関する学習(重みの自動調整)をさせたデータ(「学習済みモデル」)を記憶部33に記憶することになる。たとえば、本発明の一実施形態では、事前に、パノラマ画像を入力とした部屋の種類を推定するタスクを畳み込みニューラルネットワークにより学習させ、その結果得られる学習済みモデルを記憶部33に記憶しておく(
図6:「事前ステップ」)。学習は、情報処理装置3の制御部32において行われてもよいが、他の情報処理装置において行われ、情報処理装置3の記憶部33に記憶されてもよい。
【0074】
一例において学習セットは、部屋写真(間取り
図1枚に対して部屋写真は複数枚であってもよい)と当該部屋の情報(部屋の種類)のセットであり、その学習方法ないし畳み込みニューラルネットワークの構成については、本明細書の他の記載により制限される他には特に制限はなく、非特許文献1に記載の手法などを含む、標準的な深層学習(たとえば、標準的な距離学習)を用いることができる。ここで、本発明において距離学習とは、対応すると判明しているアイテム同士を近くに、対応しないと分かっているアイテム同士を遠くにマッピングするようなニューラルネットの学習方法一般を意味する。たとえば、対応するペアの特徴量のベクトルが小さくなるように重みパラメータの自動調整(学習)を行い、対応しないペアの特徴量のベクトルの距離は大きくなるように重みパラメータの自動調整を行ってもよい。一例として、コントラスティブ ロス(Contrastive Loss)を用いることができる。コントラスティブ ロスは距離学習の一つであり、ペアとなるデータ(たとえば、2つの画像データ)に基づいて、損失関数の出力値(L)を最小化し、ニューラルネットワークの学習(重みの自動調整)を行う。そのほか、トリプレット ロス(Triplet Loss)を用いることもできる。トリプレット ロスは距離学習の一つであり、3データに基づいて重みの自動調整を行う手法である。具体的に言えば、まず、3データ中で中心となるもの(「中心データ」)が決められる。次いで、残る2データに対し、中心データと相対的に似ているものと似ていないものがそれぞれ指定される。ニューラルネットは中心データと残る2データの距離を計算し、実際に似ているもの同士の距離を似ていないもの同士の距離よりも大きくするように更新する。
【0075】
学習された内容は、学習済みモデルとして記憶部33に記憶されるが、このことは、記憶部が、第1のN個の物の情報(たとえば、部屋内容、部屋情報、部屋内の物体の情報、間取りの内容に関する情報)と第1のN個の物それぞれを撮影した1以上の写真との対応関係(すなわち、学習セット)に基づいた学習済モデルGを記憶している、と表現することもできる。
【0076】
[実施形態1の情報処理]
以下では、実施形態1における情報処理の詳細を説明する。実施形態1の情報処理の概要は、情報処理装置3の制御部32が、学習済みモデルと、所定の部屋の間取り
図20と、当該部屋の1枚以上の部屋写真10と、に基づいて、当該部屋写真10が、当該間取り
図20でいえば、どの位置で撮影されたものであるのか、また、どの方向に向かって撮影されたものであるのかを推定するというものである。なお、上記した所定の部屋の「間取り
図20(画像)」と当該部屋の「部屋写真10」は、あくまで本発明を説明するための具体的な例の一に過ぎない。本発明自体は、所定の部屋の「間取り図(画像)」と当該部屋の「部屋写真」に関する推定に限定されるものではなく、所定の物(複数でも構わない)の「平面図」と当該物(複数でも構わない)の「写真」の関連を推定、判断するという形態をも包含する。さらに、第1の情報と第2の情報とが存在し、両情報の特徴量の次元が異なる場合において、両情報の関連を推定ないし判断するという形態をも包含する。
【0077】
本発明の一実施形態に係る情報処理ステップを
図7に示す。
図7に記載の各ステップ(ステップ1からステップ7まで)を以下に説明する。
【0078】
[情報処理ステップの詳細]
[ステップ1]
本実施形態1において、まず、推定対象である部屋写真10と、当該部屋写真20に対応した間取り図とが、情報処理装置3に入力される(「ステップ1」)。入力方法には特に制限はない。たとえば、推定対象である部屋写真10と、当該部屋写真10に対応した間取り
図20とは、メモリーカードやUSBメモリ等の外部記憶デバイスに保存され、当該外部記憶デバイスが直接情報処理装置3に接続されても良い。この場合、受信された部屋写真10と、間取り
図20とは、記憶部33に記憶されてもよいし、そのまま外部記憶デバイスに保存されたままでも良い。
【0079】
そのほか、たとえば、情報処理装置3が外部ネットワーク4から通信部31を介して、部屋写真10と間取り
図20とを受信してもよい。この場合、受信された部屋写真10と、間取り
図20とは、記憶部33に記憶される。情報処理システム1全体で考えれば、ユーザ端末装置5(たとえば、スマートフォン)において情報処理装置3の記憶部33に予め記憶された間取り
図20を選択するという形態のみならず、端末装置5において間取り
図20を撮影(スキャン)または入力して情報処理装置3にアップロードするという形態であってもよいことを意味し、その上で、部屋写真10を該スマートフォンのカメラで撮影し、撮影した部屋写真10を情報処理装置3にアップロードするという形でも実現され得る。以下では、部屋写真10としてパノラマ画像を外部ネットワーク4から受信した場合を想定して説明を行う。
【0080】
[ステップ2]
ステップ2において情報処理装置3の制御部32は、部屋写真10(パノラマ画像)を読み込む。ここで、一例において、情報処理装置3に入力された(すなわち、情報処理装置3が受信した)部屋写真10(パノラマ画像)がグレースケール画像である場合にはそのまま読み込んで後記情報処理を行うが、それがカラー画像である場合にはグレースケールで読み込む(「ステップ2」)。
【0081】
[ステップ3]
読み込まれた部屋写真(グレースケール画像)から、制御部32において、学習済みモデルに基づいて、部屋写真(パノラマ画像)内の物体情報(channel方向の情報、すなわち、1階のテンソル情報)を抽出するとともに、パノラマ画像内の物体のそれぞれの位置情報(width方向の情報、すなわち、1階テンソル情報)を抽出するという計算が行われる(「ステップ3」)。この際の挙動をさらに補足する。
【0082】
一例として、読み込まれたグレースケールのパノラマ画像の解像度が、H(高さ)=256、W(幅)=512という解像度であることを前提に以下、width方向の情報(つまり、位置情報)の抽出について補足的に説明を行う。なお当然のことながら、読み込まれたグレースケールのパノラマ画像の解像度はこのような解像度に限定されるものではない。
図8にwidth方向の情報の抽出の補足説明の図を示す。まず、制御部32は、当該グレースケールのパノラマ画像に対し、畳み込みを行う。当該畳み込みにより、たとえば、H(高さ)=8、W(幅)=16、C(チャネル数)=1080のデータに変換する。制御部32は、当該変換後のデータについて、高さ方向の情報については平均化を行うことによって、情報としては落としてしまっても良い。そうすると、高さ方向の情報の平均化によって、W(幅)=16、C(チャネル数)=1080というデータに変換することができる。ここで、全結合層はW(幅)=16、C(チャネル数)=64となり、これをベクトル化することにより、C(チャネル数)=1024とすることができる。
図9は、たとえば
図8において部屋写真10の左側にオブジェクトが存在すると仮定した場合のステップを示しており、オブジェクト位置を網掛けで示した。上記各処理後のデータにおける当該オブジェクトに対応する部分もまた、網掛けで示している。
【0083】
[ステップ4]
部屋写真10内の物体に対応するchannel方向の情報、及びパノラマ画像内の物体のそれぞれの位置に対応するwidth方向の情報は、所定のファイル100に保存され、該部屋写真10(パノラマ画像)と関連付けられて記憶部33に記憶される。
【0084】
[ステップ5]
情報処理装置3に入力された間取り
図20が畳み込まれてエンコードされる。一例において、間取り
図20は、MobileNetをベースとしたアーキテクチャを用いて、エンコードされる。これにより相当量の演算量を削減することができる。なお、通常の畳み込みが空間方向とチャネル方向の畳み込みを同時に行うのに対して、本発明の一実施形態においては、MobileNet等により、畳み込みはwidth方向(パノラマ画像内の物体のそれぞれの位置情報)を行なったのちに、channel方向(つまり画像内の物体の情報)を行なう。すなわち、空間方向とチャネル方向の畳み込みを同時に行うのではなく、上記した記載の順に行うものとする。なお、畳み込みに用いられるアーキテクチャはMobileNetbに限定されるものではないが、仮にMobileNetを使用する場合にあっては、そのバージョンについて制限はない。好ましくは、MobileNetV1ではなくMobileNetV2を用いる。一般的に畳み込みでは層を重ねるごとにチャネル数が増加していきパラメータ量を圧迫していくが、MobileNetV1は最終的に形が7×7×1024になるのに対してMobileNetV2は7×7×320までしかならないためパラメータ数がMobileNetV1よりも小さくすることができる。そして、本発明において提供される推定の精度との関係では、MobileNetV2で圧縮される程度まで間取り図を圧縮したとしても、特に大きな問題は生じない。
【0085】
[ステップ6]
当該ステップ5で得た情報と、ファイル100に記憶された部屋写真10(パノラマ画像)における上記特徴量(画像内の物体に対応するchannel方向の情報、及びパノラマ画像内の物体のそれぞれの位置に対応するwidth方向の情報)とを、それぞれコンカット(縦に連結)することで対応づけを行う。一例において、本コンカットは複数回(好ましくは2回)行われる。
【0086】
この点、間取り図は3階のテンソルであるのに対し、画像内の物体に対応するchannel方向の情報及びパノラマ画像内の物体のそれぞれの位置に対応するwidth方向の情報はいずれも1階のテンソルである。したがって、これらを直接コンカットすることはできない。3階のテンソルを1階のテンソルに落とすことで(つまり、3階のテンソルが有する情報のうち、1階のテンソルに対応しない次元の情報はコンカットしないことになる)、1階のテンソル同士をコンカットする手法も考えられないではないが、それでは空間情報が失われてしまい、撮影位置および撮影方向の特定に問題が生じる。そこで、本発明者らは、以下において説明するように、1階のテンソル情報(channel方向の情報および/またはwidth方向の情報)と、3階のテンソル情報(間取り図の情報)をコンカットする際に、3階のテンソル情報が保有する空間情報を失うことなく、コンカットを行う手法に至った。当該手法について、
図10を用いて以下説明する。
【0087】
上記手法は、概略、1階のテンソルを間取り図のテンソルの形に合わせて複製し、channel方向とwidth方向とそれぞれコンカットする手法である。上記のとおり、channel方向の情報及びwidth方向の情報はいずれも1階のテンソルであり、C(チャネル数)のみであるが、これを、(1、1、C1)という情報量に変換する。そして、間取り図画像が(H2、W2、C2)の情報量であるとした場合、間取り図画像を基準とし、(1、1、C)をH(高さ)方向に複数(×H2)複製し、それをさらにW(幅)方向に複数(×W2)複製し、(H2、W2、C1)という情報量に変換する。これにより、channel方向の情報及びwidth方向の情報は、それぞれ、(H2、W2、C1)という、3階のテンソルと同次元の情報に変換される。さいごに、(H2、W2、C2)と(H2、W2、C1)とについて、いずれも3階のテンソルであるとして、コンカットを行う。
【0088】
ここで、非特許文献1においては、コンカットはchannel情報のみに基づいて行われていた。しかしながら、本発明者らは、channel情報のみに基づいてコンカットを行った場合、位置関係の情報が不十分であり、その結果として本発明に係る推定の正確性が担保できないことを見いだした。そこで、本発明者らはwidth方向の情報をもコンカットに用いることで、正確性を格段に高めることができるという技術に至った。
【0089】
[ステップ7]
当該コンカットされた情報をデコードし、間取り図と同サイズのヒートマップとして出力し、評価する。これらは、既存の手法によって実行することができ、たとえば、U字型の畳み込みネットワーク(U-Net)をベースにしたアーキテクチャにより実行することができる。ただし、一例において、この際、位置情報(2次元)と方向情報(1次元)とを分けて、ヒートマップで出力する。これにより、撮影位置情報(2次元)と撮影方向情報(1次元)とをヒートマップから評価する(すなわち、対照同士の確率分布の積分値の差分による比較をする)ことが可能となる。
【0090】
一例において、撮影方向の推定および撮影位置の推定におけるLoss、すなわち、機械学習におけるクロスエントロピーであるLogarithmic Lossとしては、Jensen-Shannon(JS)divergenceを用いる。すなわち、同じ確率変数x(すなわち、角度情報)に対して、2つの確率分布P(x)とQ(x)があるとき、これらの確率分布の距離(すなわち、差分)は、Kullback-Leibler(「KL」)divergenceを使い評価することもできるが、KL divergenceは対称性がなく(すなわち、2つの確率分布を交換した場合に等価でない)ため距離の公理を満たさないが、Jensen-Shannon(「JS」)divergenceであれば対称性を有し、本発明に好適である。
【0091】
なお、機械学習に係る文献である非特許文献2では、(角度情報)推定のために符号付きのsin、cosの2つを出力に学習するよりも、sinの絶対値、cosの絶対値、sinの符号、cosの符号を出力として、その差分を小さくするよう学習する方が、精度が高かったとされている。しかしながら、本発明者らは、一次元のヒートマップを撮影方向の推定の出力とすることで、格段に精度を高めることができることを見いだした。
【0092】
[追加的情報処理]
これらにより、1つ以上の画像のセット、好ましくは、広視野を示すパノラマ画像のセットと、対応する間取り図画像とが、情報処理装置3の記憶部33に記憶される。次に、これらの1つ以上のパノラマ画像は、当該パノラマ画像が撮影された間取り図における特定の撮影位置および撮影方向とマッチングされる。当該マッチングに基づいて、間取り図上に矢印等のマークを表示し(
図1の矢印参照)、パノラマ画像のセットと、対応する間取り図画像とをユーザに表示させることが可能となる。
【0093】
[追加的構成]
間取り図内における撮影されたパノラマ画像のそれぞれの撮影位置及び撮影方向が特定されると、不動産物件の自動的及び/又はインタラクティブなツアーを提供するバーチャルツアーを作成することができる。バーチャルツアーでは、当該バーチャルツアーにおいて訪問される間取り図における特定の部屋(位置)における、対応するパノラマ画像によって提供され、ユーザ端末装置5からの方角(撮影方向)を変更する信号を受信することで撮影方向が異なるパノラマ画像を提供することもできる。また、情報処理装置3において、パノラマ画像を編集し、所定の方向からの写真を修正し、異なる方向からの写真を合成して表示することも可能である。また、パノラマ画像の広視野画像に変えて、クロッピングなどにより、ユーザの視野角に応じた標準的な視野を提供する事も可能である。
【0094】
一例として、バーチャルツアーは双方向性のあるツアーでも良く、たとえばユーザがユーザ端末装置5の表示部55としてヘッドマウントディスプレイなどを使用して部屋内を見学できるようにしても良い。その際、本発明の一実施形態によれば、各パノラマ画像の撮影位置と撮影方向が正確に算出され間取り図と対応付けられるから、ユーザは間取り図に対応した形で各部屋をバーチャルに訪問することができる。また、ユーザの所定の場所に対する視線をヘッドマウントディスプレイの入力部54が感知するように構成し、バーチャルツアーを一時停止したり、進行したり、別の視点に切り替えたりするなどの操作ができるようになっていてもよい。
【0095】
この際、ユーザの体験が実体験と一致することができるように、部屋Aから部屋Bに入室する場合には、部屋Aから見た部屋Bの画像を提供するなど、複数の部屋写真のうち、最も適した撮影方向の部屋写真10を選択してユーザ端末装置5の表示部55に表示するようにすることができる。
【0096】
[実施形態2]
さらに別の実施形態として、部屋写真10Bおよび間取り
図20Bの両方において物体を特定し、当該特定された物体の位置関係を元に、撮影位置および方向を特定する手法を提案する。たとえば、
図1および
図2において、撮影位置と間取り図上のキッチンの位置と、部屋写真においてキッチンが正面に写っていることを前提とすれば、これらの情報に基づいて、制御部32は撮影方向を推定することが可能である。
【0097】
部屋写真が撮影された間取り図上の位置(すなわち、撮影位置)の特定は、実施形態1の手法によって行うことができるので、詳細な説明は省略する。
【0098】
間取り図上の物体の位置の特定については、実施形態1の手法のみならず、その他の手法によって行うこともできる。たとえば、物体はニューラルネットワークによる学習済みモデルを用いて特定され、特定される物体は、学習済みモデルに応じるものであり、事前に規定される。具体的には、キッチンアイランド、扉(ドア)およびそのドアノブ、壁、階段、手摺り、トイレ、シンク、バスタブ、シャワー、ストーブ、冷蔵庫、洗濯機、棚などがあげられるが、これらに限定されるものではない。一例においては、ドアノブの位置を検出することで、右ドアと左ドアとは区別して特定される。
【0099】
[変形例1]
なお、本発明は上記実施の形態に限られたものではなく、要旨を逸脱しない範囲で適宜変更することが可能である。すなわち、本発明の一実施形態によれば、2つの入力の特徴量の次元が異なっていても、
図10および対応する詳細な説明(たとえば上記「ステップ6」)で記載したとおり、両者をコンカットして評価を行うことが可能となるから、たとえば、インプットとして、画像と、画像の説明文章(例として「左に犬が走っていて、右に風船が飛んでいる」)が入力された場合に、「犬が走っているかどうか」「風船が飛んでいるかどうか」の判定ではなく、説明文書どおりの画像であるかどうか(すなわち、上記の例でいえば、「左に犬が走っていて、右に風船が飛んでいる」画像であるかどうか)を正確に判定することができる。その意味で、本発明は「間取り図」と「部屋写真」との情報処理に限定されるものではないし、「物の平面図」と「物の写真」との情報処理に限定されるものでもなく、2つの入力の特徴量の次元が異なる場合の情報処理に関するものである。
【0100】
[変形例2]
さらに、上記「ステップ7」において説明した、角度情報を一次元のヒートマップとして出力して評価するという手法は、正確な角度情報が必要とされる他の分野において広く適用することができる。具体的には、変形例として、ロボティクスや自動運転分野において、(端末)入力部54としてカメラを搭載した端末装置5(本変形例における「端末装置5」とは、たとえば、カメラを搭載したロボットやカメラを搭載した自動運転車である)について、当該端末の周囲の画像情報を情報処理装置3に与え、情報処理装置3の制御部32において当該端末に搭載されたカメラで撮影された画像と端末の周囲の画像情報とに基づいて当該端末5の現在の向きを計算し、そこから目的地に移動するための当該端末の向きを適切に変更させ、当該端末の向きを制御するという形態においても、その角度情報(すなわち、端末の向き)計算の精度向上に寄与する。この場合、上記実施形態において間取り
図20として説明したものが「端末の周囲の画像情報」に対応し、本実施形態において部屋写真10(ないしパノラマ画像)として説明したものが「端末に搭載されたカメラで撮影された画像」に対応する。さらに、ヒートマップによる出力は、特定の画像における人物や物体が、どの方向を向いているのかを計算する際にも、有用である。
【産業上の利用可能性】
【0101】
上記のとおり、本発明は、間取り図内における部屋写真の撮影位置と撮影方向の特定および物の平面図と当該物の写真の対応付けのみならず、画像と当該画像の説明文の対応付けおよび正誤判断、並びにロボットや自動運転車に係る角度情報(方向)の計算などにも適用することができ、有用である。
【符号の説明】
【0102】
情報処理システム 1
部屋写真 10
間取り図(画像) 20
情報処理装置 3
通信部 31
制御部 32
記憶部 33
ネットワーク 4
ユーザ端末装置 5
通信部 51
制御部 52
記憶部 53
入力部 54
表示部 55
ファイル 100
学習モデル G
【手続補正書】
【提出日】2020-11-04
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
記憶部と制御部とを有する情報処理装置であって、
前記記憶部は、第1のN個の空間の平面図と、前記第1のN個の空間それぞれを撮影した1以上の写真との対応関係に基づいた学習済モデルを記憶し、
前記制御部が、前記学習済みモデルと、前記N個の空間と異なる第2の空間の写真および該第2の空間の平面図とに基づいて、
前記第2の空間の写真におけるchannel方向のベクトルに圧縮した情報とwidth方向のベクトルに圧縮した情報とを抽出し、前記第2の空間の平面図を圧縮した情報とコンカットすることにより前記第2の空間の平面図における前記第2の空間の写真が撮影された撮影位置と撮影方向を推定する、
情報処理装置。
【請求項2】
前記推定することは、
さらに、前記制御部が前記コンカットの結果を、前記撮影位置を推定するための2次元のヒートマップと、前記撮影方向を推定するための1次元のヒートマップとを出力して評価することを含む、
請求項1に記載の情報処理装置。
【請求項3】
前記コンカットは、
前記制御部が前記第2の空間の写真における前記channel方向のベクトルに圧縮した情報と前記width方向のベクトルに圧縮した情報とを、ぞれぞれ、前記第2の空間の平面図の幅方向および高さ方向に基づいて1以上複製し、当該複製した情報に基づいて前記第2の空間の平面図を圧縮した情報とコンカットすることである、
請求項2に記載の情報処理装置。
【請求項4】
前記第1のN個の空間および前記第2の空間は、いずれも不動産物件の部屋であることを特徴とする、
請求項1から3のいずれか一項に記載の情報処理装置。
【請求項5】
コンピュータを、
記憶部と制御部とを有し、
前記記憶部が、第1のN個の空間の平面図と、前記第1のN個の空間それぞれを撮影した1以上の写真との対応関係に基づいた学習済モデルを記憶し、
前記制御部が、前記学習済みモデルと、前記N個の空間と異なる第2の空間の写真および該第2の空間の平面図とに基づいて、
前記第2の空間の写真におけるchannel方向のベクトルに圧縮した情報とwidth方向のベクトルに圧縮した情報とを抽出し、前記第2の空間の平面図を圧縮した情報とコンカットすることにより前記第2の空間の平面図における前記第2の空間の写真が撮影された撮影位置と撮影方向を推定する情報処理装置として動作させる、
コンピュータプログラム。
【請求項6】
前記推定することは、さらに、前記制御部が前記コンカットの結果を、前記撮影位置を推定するための2次元のヒートマップと、前記撮影方向を推定するための1次元のヒートマップとを出力して評価することを含む、
請求項5に記載のコンピュータプログラム。
【請求項7】
前記コンカットは、
前記制御部が前記第2の空間の写真における前記channel方向のベクトルに圧縮した情報と前記width方向のベクトルに圧縮した情報とを、ぞれぞれ、前記第2の空間の平面図の幅方向および高さ方向に基づいて1以上複製し、当該複製した情報に基づいて前記第2の空間の平面図を圧縮した情報とコンカットすることである、
請求項6に記載のコンピュータプログラム。
【請求項8】
前記第1のN個の空間および前記第2の空間は、いずれも不動産物件の部屋であることを特徴とする、
請求項5から7のいずれか一項に記載のコンピュータプログラム。
【手続補正書】
【提出日】2020-12-17
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
記憶部と制御部とを有する情報処理装置であって、
前記記憶部は、第1のN個の空間の平面図と、前記第1のN個の空間それぞれを撮影した1以上の写真との対応関係に基づいた学習済モデルを記憶し、
前記制御部が、前記学習済みモデルと、前記N個の空間と異なる第2の空間の写真および該第2の空間の平面図とに基づいて、
前記第2の空間の写真におけるchannel方向のベクトルに圧縮した情報とwidth方向のベクトルに圧縮した情報とを抽出し、前記第2の空間の平面図を圧縮した情報とコンカットすることにより前記第2の空間の平面図における前記第2の空間の写真が撮影された撮影位置と撮影方向を推定し、
前記推定することは、前記制御部が前記コンカットの結果を、前記撮影位置を推定するための2次元のヒートマップと、前記撮影方向を推定するための1次元のヒートマップとを出力して評価することを特徴とする、
情報処理装置。
【請求項2】
前記コンカットは、
前記制御部が前記第2の空間の写真における前記channel方向のベクトルに圧縮した情報と前記width方向のベクトルに圧縮した情報とを、ぞれぞれ、前記第2の空間の平面図の幅方向および高さ方向に基づいて1以上複製し、当該複製した情報に基づいて前記第2の空間の平面図を圧縮した情報とコンカットすることである、
請求項2に記載の情報処理装置。
【請求項3】
前記第1のN個の空間および前記第2の空間は、いずれも不動産物件の部屋であることを特徴とする、
請求項1または2に記載の情報処理装置。
【請求項4】
コンピュータを、
記憶部と制御部とを有し、
前記記憶部が、第1のN個の空間の平面図と、前記第1のN個の空間それぞれを撮影した1以上の写真との対応関係に基づいた学習済モデルを記憶し、
前記制御部が、前記学習済みモデルと、前記N個の空間と異なる第2の空間の写真および該第2の空間の平面図とに基づいて、
前記第2の空間の写真におけるchannel方向のベクトルに圧縮した情報とwidth方向のベクトルに圧縮した情報とを抽出し、前記第2の空間の平面図を圧縮した情報とコンカットすることにより前記第2の空間の平面図における前記第2の空間の写真が撮影された撮影位置と撮影方向を推定し、
前記推定することは、前記制御部が前記コンカットの結果を、前記撮影位置を推定するための2次元のヒートマップと、前記撮影方向を推定するための1次元のヒートマップとを出力して評価することを特徴とする情報処理装置として動作させる、
コンピュータプログラム。
【請求項5】
前記コンカットは、
前記制御部が前記第2の空間の写真における前記channel方向のベクトルに圧縮した情報と前記width方向のベクトルに圧縮した情報とを、ぞれぞれ、前記第2の空間の平面図の幅方向および高さ方向に基づいて1以上複製し、当該複製した情報に基づいて前記第2の空間の平面図を圧縮した情報とコンカットすることである、
請求項4に記載のコンピュータプログラム。
【請求項6】
前記第1のN個の空間および前記第2の空間は、いずれも不動産物件の部屋であることを特徴とする、
請求項4または5に記載のコンピュータプログラム。
【手続補正書】
【提出日】2020-12-21
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
記憶部と制御部とを有する情報処理装置であって、
前記記憶部は、第1のN個の空間の平面図と、前記第1のN個の空間それぞれを撮影した1以上の写真との対応関係に基づいた学習済モデルを記憶し、
前記制御部が、前記学習済みモデルと、前記N個の空間と異なる第2の空間の写真および該第2の空間の平面図とに基づいて、
前記第2の空間の写真におけるchannel方向のベクトルに圧縮した情報とwidth方向のベクトルに圧縮した情報とを抽出し、前記第2の空間の平面図を圧縮した情報とコンカットすることにより前記第2の空間の平面図における前記第2の空間の写真が撮影された撮影位置と撮影方向を推定し、
前記推定することは、前記制御部が前記コンカットの結果を、前記撮影位置を推定するための2次元のヒートマップと、前記撮影方向を推定するための1次元のヒートマップとを出力して評価することを特徴とする、
情報処理装置。
【請求項2】
前記コンカットは、
前記制御部が前記第2の空間の写真における前記channel方向のベクトルに圧縮した情報と前記width方向のベクトルに圧縮した情報とを、ぞれぞれ、前記第2の空間の平面図の幅方向および高さ方向に基づいて1以上複製し、当該複製した情報に基づいて前記第2の空間の平面図を圧縮した情報とコンカットすることである、
請求項1に記載の情報処理装置。
【請求項3】
前記第1のN個の空間および前記第2の空間は、いずれも不動産物件の部屋であることを特徴とする、
請求項1または2に記載の情報処理装置。
【請求項4】
コンピュータを、
記憶部と制御部とを有し、
前記記憶部が、第1のN個の空間の平面図と、前記第1のN個の空間それぞれを撮影した1以上の写真との対応関係に基づいた学習済モデルを記憶し、
前記制御部が、前記学習済みモデルと、前記N個の空間と異なる第2の空間の写真および該第2の空間の平面図とに基づいて、
前記第2の空間の写真におけるchannel方向のベクトルに圧縮した情報とwidth方向のベクトルに圧縮した情報とを抽出し、前記第2の空間の平面図を圧縮した情報とコンカットすることにより前記第2の空間の平面図における前記第2の空間の写真が撮影された撮影位置と撮影方向を推定し、
前記推定することは、前記制御部が前記コンカットの結果を、前記撮影位置を推定するための2次元のヒートマップと、前記撮影方向を推定するための1次元のヒートマップとを出力して評価することを特徴とする情報処理装置として動作させる、
コンピュータプログラム。
【請求項5】
前記コンカットは、
前記制御部が前記第2の空間の写真における前記channel方向のベクトルに圧縮した情報と前記width方向のベクトルに圧縮した情報とを、ぞれぞれ、前記第2の空間の平面図の幅方向および高さ方向に基づいて1以上複製し、当該複製した情報に基づいて前記第2の空間の平面図を圧縮した情報とコンカットすることである、
請求項4に記載のコンピュータプログラム。
【請求項6】
前記第1のN個の空間および前記第2の空間は、いずれも不動産物件の部屋であることを特徴とする、
請求項4または5に記載のコンピュータプログラム。