(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023173612
(43)【公開日】2023-12-07
(54)【発明の名称】処理装置、処理方法およびプログラム
(51)【国際特許分類】
G06Q 50/10 20120101AFI20231130BHJP
【FI】
G06Q50/10
【審査請求】未請求
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2022085980
(22)【出願日】2022-05-26
(71)【出願人】
【識別番号】504133110
【氏名又は名称】国立大学法人電気通信大学
(74)【代理人】
【識別番号】100083806
【弁理士】
【氏名又は名称】三好 秀和
(74)【代理人】
【識別番号】100101247
【弁理士】
【氏名又は名称】高橋 俊一
(72)【発明者】
【氏名】坂本 真樹
(72)【発明者】
【氏名】家田 大希
(72)【発明者】
【氏名】野崎 裕二
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049CC20
(57)【要約】
【課題】エリアの雰囲気を指標化する。
【解決手段】 処理装置1は、複数のエリアのそれぞれについて、統計種別毎の統計値を対応づける統計データ11と、複数のエリアのうちの教師エリアについて、エリアの雰囲気を特定する指標種別毎の評価値を対応づける教師データ12を記憶する記憶装置と、教師エリアの統計種別毎の統計値と、教師エリアの指標種別毎の評価値との関係を示す学習モデルを学習する学習部21と、複数のエリアのいずれかが指定されると、統計データ11の指定されたエリアにおける統計種別毎の統計値を学習モデルに入力し、指定されたエリアの指標種別毎の評価値を出力する出力部22を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
複数のエリアのそれぞれについて、統計種別毎の統計値を対応づける統計データと、
前記複数のエリアのうちの教師エリアについて、前記エリアの雰囲気を特定する指標種別毎の評価値を対応づける教師データを記憶する記憶装置と、
前記教師エリアの前記統計種別毎の統計値と、前記教師エリアの前記指標種別毎の評価値との関係を示す学習モデルを学習する学習部と、
前記複数のエリアのいずれかが指定されると、前記統計データの指定されたエリアにおける前記統計種別毎の統計値を前記学習モデルに入力し、前記指定されたエリアの前記指標種別毎の評価値を出力する出力部
を備える処理装置。
【請求項2】
前記出力部は、前記複数のエリアのそれぞれについて、前記指標種別毎の評価値を対応づけた評価値データを出力し、
前記複数のエリアのいずれかが指定されると、指定されたエリアの前記指標種別毎の評価値との類似度が所定条件を満たすエリアの識別子を出力する
請求項1に記載の処理装置。
【請求項3】
前記指標種別は、音象徴語である
請求項1に記載の処理装置。
【請求項4】
複数のエリアのそれぞれについて、統計種別毎の統計値を対応づける統計データと、前記複数のエリアのうちの教師エリアについて、前記エリアの雰囲気を特定する指標種別毎の評価値を対応づける教師データを記憶するコンピュータが、
前記教師エリアの前記統計種別毎の統計値と、前記教師エリアの前記指標種別毎の評価値との関係を示す学習モデルを学習し、
前記複数のエリアのいずれかが指定されると、前記統計データの指定されたエリアにおける前記統計種別毎の統計値を前記学習モデルに入力し、前記指定されたエリアの前記指標種別毎の評価値を出力する
処理方法。
【請求項5】
コンピュータを、請求項1ないし3のいずれか1項に記載の処理装置として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、処理装置、処理方法およびプログラムに関する。
【背景技術】
【0002】
近年の情報機器の発達に伴い、不動産情報ポータルサイトが普及している(非特許文献1)。非特許文献1に記載のサイトは、ユーザに、ユーザが希望する市町村または最寄り駅等のエリアを指定させた後、ユーザが希望する価格、間取り等の物件の条件を指定させ、ユーザが指定した条件に合致する物件を出力する。
【0003】
一方、ユーザが不動産を探す際、定量的に表される不動産情報だけでなく、街の雰囲気も重要な要因であると考えられる。実際にその街を歩かないと気づかないような街の魅力を把握することが重要視されている(非特許文献2)。
【先行技術文献】
【非特許文献】
【0004】
【非特許文献1】株式会社リクルート、" SUUMO(スーモ)"、[online]、[2022年5月12日検索]、インターネット〈URL:https://suumo.jp/〉
【非特許文献2】荒牧英治,北雄介,宮部真衣,若宮翔子,河合由起子,清田陽司、“広がり続ける100 ninmap project-街歩きから不動産検索まで-”、 人工知能、 32(4)、pp.563-568(2017)
【発明の概要】
【発明が解決しようとする課題】
【0005】
不動産を探すにあたって、街の雰囲気が重要であるにも関わらず、非特許文献1などの現在普及している不動産情報ポータルサイトは、ユーザが希望する市町村の入力を要求する。従ってユーザは、非特許文献1などのポータルサイトの利用にあたり、街の雰囲気を予め調査して、希望する街を特定する必要がある。
【0006】
しかしながら、ユーザは、既知の街の雰囲気を知るに止まり、ユーザがポータルサイトで指定可能な希望する街は、既知の街に止まる場合が多い。そのためユーザは、限られた街から不動産を探すことになり、選択肢が狭まることになる。
【0007】
そこで、ユーザに、未知の街の雰囲気を知らせるために、街等のエリアの雰囲気を指標化する方法が期待されている。
【0008】
従って本発明の目的は、エリアの雰囲気を指標化する技術を提供することである。
【課題を解決するための手段】
【0009】
本発明の一態様の処理装置は、複数のエリアのそれぞれについて、統計種別毎の統計値を対応づける統計データと、前記複数のエリアのうちの教師エリアについて、前記エリアの雰囲気を特定する指標種別毎の評価値を対応づける教師データを記憶する記憶装置と、前記教師エリアの前記統計種別毎の統計値と、前記教師エリアの前記指標種別毎の評価値との関係を示す学習モデルを学習する学習部と、前記複数のエリアのいずれかが指定されると、前記統計データの指定されたエリアにおける前記統計種別毎の統計値を前記学習モデルに入力し、前記指定されたエリアの前記指標種別毎の評価値を出力する出力部を備える。
【0010】
本発明の一態様の処理方法は、複数のエリアのそれぞれについて、統計種別毎の統計値を対応づける統計データと、前記複数のエリアのうちの教師エリアについて、前記エリアの雰囲気を特定する指標種別毎の評価値を対応づける教師データを記憶するコンピュータが、前記教師エリアの前記統計種別毎の統計値と、前記教師エリアの前記指標種別毎の評価値との関係を示す学習モデルを学習し、前記複数のエリアのいずれかが指定されると、前記統計データの指定されたエリアにおける前記統計種別毎の統計値を前記学習モデルに入力し、前記指定されたエリアの前記指標種別毎の評価値を出力するする。
【0011】
本発明の一態様は、上記処理装置として、コンピュータを機能させるプログラムである。
【発明の効果】
【0012】
本発明によれば、エリアの雰囲気を指標化する技術を提供することができる。
【図面の簡単な説明】
【0013】
【
図1】
図1は、本発明の実施の形態に係る処理装置の機能を説明する図である。
【
図2】
図2は、統計データのデータ構造の一例を説明する図である。
【
図3】
図3は、統計データの項目の詳細を説明する図である。
【
図4】
図4は、エリアと、そのエリアの学校数の統計値の一例を説明する図である。
【
図5】
図5は、教師データのデータ構造の一例を説明する図である。
【
図6】
図6は、学習部による学習処理の一例を説明するフローチャートである。
【
図7】
図7は、出力部による出力処理の一例を説明するフローチャートである。
【
図8】
図8は、出力部が出力するエリアの評価値の一例を説明する図である。
【
図9】
図9は、処理装置に用いられるコンピュータのハードウエア構成を説明する図である。
【発明を実施するための形態】
【0014】
次に、図面を参照して、本発明の実施の形態を説明する。以下の図面の記載において、同一または類似の部分には同一または類似の符号を付している。
【0015】
(処理装置)
図1に示す本発明の実施の形態に係る処理装置1は、各エリアについて、各エリアの統計値と、各エリアの雰囲気を特定する評価値との関係を学習したモデルデータ13を生成する。また処理装置1は、エリアの識別子が入力されると、モデルデータ13を用いて、入力されたエリアの評価値を算出したり、入力されたエリアと類似する評価値を有するエリアを出力したりする。
【0016】
各エリアは、閉領域であって、地名から特定されても良いし、任意の条件で特定されても良い。任意の条件は、所定駅から500メートル以内、所定駅の所定出口から総人口数が所定数の範囲内など、基準地点とその基準地点からの範囲を決める条件で特定される。また任意の条件は、鉄道のある線路よりも北側のみ、あるいは、ある商店街から100メートル以内など、所定の線形を基準に特定されても良い。任意の条件は、複数の条件を複合的に掛け合わせて設定されても良い。
【0017】
各エリアは、そのエリア内で同様の雰囲気を有すると想定される大きさであることが好ましい。各エリアは、同じ大きさを有することなく、各エリアによって適宜大きさおよび範囲が設定されても良い。例えば、徒歩移動が一般的な地域ではエリアを狭く設定し、車移動が一般的な地域では、エリアを広く設定しても良い。また各エリアは重複することなく設定されることが好ましい。
【0018】
本発明の実施の形態において各エリアは、基準となる駅から500メートル以内と規定するが、これは一例であってこれに限るものではない。
【0019】
図1に示すように処理装置1は、統計データ11、教師データ12、モデルデータ13、評価値データ14および類似エリアデータ15の各データと、学習部21および出力部の各機能を備える。各データは、メモリ902またはストレージ903等の記憶装置に記憶される。各機能は、CPU901に実装される。
【0020】
統計データ11は、複数のエリアのそれぞれについて、統計種別毎の統計値を対応づける。統計値は、政府または民間等がサイトで提供する統計値である。統計種別は、例えば、人口、世帯、経済、その他等の各大項目に区分される。各大項目は、
図3に示すような各統計項目を有する。例えば、統計項目「人口総数」は、それ自体が統計種別となるが、統計項目「年齢別人口」は、10才刻みなどで特定される各年齢範囲の人口が統計種別となる。本発明の実施の形態において統計値データの統計種別は、163次元あるとする。
【0021】
各エリアにおける統計種別毎の統計値はどのような手段で取得されても良い。例えば、政府統計ポータルサイト地理情報システム「jSTAT MAP(https://jstatmap.e-stat.go.jp/jstatmap/main/trialstart.html)」、国土交通省が運営を行っているサイト(https://nlftp.mlit.go.jp/index.html)、グルメサイト「食べログ(https://tabelog.com)」等において、指定されたエリア内での各種統計値を提供する。予めこれらのサイトから取得した各エリアの統計値から、統計データ11が生成される。
【0022】
図4を参照して、エリアと、そのエリアの学校数の統計値の一例を説明する。
図4に示す地図中に、X駅とY駅があり、X駅を囲む一点鎖線の円が、X駅のエリアである。X駅のエリアは、X駅から500メートルである。地図中に、AからJの学校があるが、X駅のエリア内には、C小学校、E短期大学、G大学院大学およびI小学校が位置する。従って、
図4に示す例において、エリア「X駅」の統計種別「学校数」の統計値は、「4」となる。
【0023】
なおここに示す統計値の取得方法は一例であって、これに限るものではない。
【0024】
教師データ12は、複数のエリアのうちの教師エリアについて、エリアの雰囲気を特定する指標種別毎の評価値を対応づける。教師データ12は、後述の学習部21において、評価値が未知のエリアの評価値を推定する機械学習モデルの作成時に入力されるデータである。複数のエリアのうちのいくつかのエリアが、教師エリアとして予め指定される。教師エリアは、統計データ11で定義される各エリアのうち、学習部21による機械学習モデルの学習に先駆けて、予め評価値が設定されたエリアである。教師データ12は、各教師エリアの雰囲気の評価値を特定する。雰囲気の評価値は、例えば、アンケートによって生成される。各教師エリアについて、指標種別毎に、複数人に5段階評価などで回答させる。各教師エリアの指標種別毎に得られた複数人の回答の平均が、評価値となる。
【0025】
図5を参照して、教師データ12のデータ構造とデータの一例を説明する。
図5に示す例において教師エリアは、新宿駅、経堂駅、表参道駅等の各駅に対応するエリアである。複数人に、これらの各教師エリアに対して、「さらさら」度、「きびきび」度、「ゆるゆる」度などの指標種別毎に、1から5の5段階のSD(semantic differential)法による主観評価で、数値化させる。複数人から得られた数値の平均が、教師データ12に設定される。
図5は、新宿駅についての「さらさら度」について得た複数人の回答の平均が、「2」であることを示す。
【0026】
本発明の実施の形態において指標種別は、音象徴語である。音象徴語は、語音そのものが、ある特定のイメージを喚起する語であって、「さらさら」、「きびきび」等のオノマトペに代表される。オノマトペ等の音象徴語は、直感的にわかりやすい言葉なので、エリアの雰囲気を、他の言語表現よりも微細に数値化することが可能にする。
【0027】
他の実施例において指標種別は、例えば、「静音性」、「高級性」、「買い物のしやすさ」、「子育てのしやすさ」、「緑の多さ」など、人がエリアの雰囲気を特定するための主観的指標であっても良い。
【0028】
モデルデータ13は、各エリアの統計値と、各エリアの雰囲気を特定する評価値との関係を示すデータである。モデルデータ13は、学習部21によって生成される。
【0029】
評価値データ14は、各エリアの評価種別毎の評価値を対応づけたデータである。評価値データ14は、処理装置1に入力されたエリアの評価値を含む。評価値データ14は、出力部22によって出力される。評価値データ14に含まれる所定のエリアの評価値は、モデルデータ13によって特定される学習モデルに、統計データ11の所定のエリアの統計値を入力することによって、得られる。
【0030】
類似エリアデータ15は、処理装置に入力されたエリアと類似する雰囲気を有するエリアの識別子を含む。類似エリアデータ15は、出力部22によって出力される。
【0031】
学習部21は、教師エリアの統計種別毎の統計値と、教師エリアの指標種別毎の評価値との関係を示す学習モデルを学習する。学習部21は、統計データ11から、各教師エリアの統計種別毎の統計値を取得する。学習部21は、各教師エリアの統計値と評価値の関係を学習し、モデルを構築する。学習部21は、構築したモデルを特定するモデルデータ13を出力する。
【0032】
学習部21による学習アルゴリズムは、非線型モデルで高次元のデータに適用できる手法であれば、どのようなものでも良い。学習アルゴリズムとして、例えばSupport Vector Regression(サポートベクター回帰、以下SVR)が考えられる。SVRは、分類問題に対して注目されているSupport Vector Machine(サポートベクターマシン、以下SVM)を回帰問題に拡張した学習モデルである。分類問題においてSVMは、入力となる特徴量の次元が大きい場合でも高い汎化性能を持つことから、回帰問題に拡張したSVRも高い汎化性能を持つと期待される。
図3に示す各統計種別は、163次元で次元が大きいため、エリアの雰囲気の評価値の予測モデルを構築する学習モデルとしてSVRが挙げられる。
【0033】
SVRのカーネルはガウシアンカーネルを用いる。ハイパーパラメータCおよびεの探索範囲は、10-3から103とした。この探索範囲の中で等間隔な30個の値を生成し、グリッドサーチによって決定係数が最も高くなるハイパーパラメータの組み合わせを統計種別ごとに求め、その組み合わせを予測モデルに採用した。もう一つのハイパーパラメータであるγはautoとした。
【0034】
なおここで示す学習方法は一例であって、これに限るものではない。
【0035】
図6を参照して、学習部21による学習処理を説明する。
図6に示す処理の内容および順序は一例であってこれに限るものではない。
【0036】
ステップS11において学習部21は、統計データ11から、教師データ12の各教師エリアの統計値を取得する。ステップS12において学習部21は、教師データ12から、各教師エリアの評価値を取得する。
【0037】
ステップS13において学習部21は、各教師エリアの統計値と評価値の関係を学習して学習モデルを構築する。ステップS14において学習部21は、ステップS13で構築した学習モデルを特定するモデルデータ13を出力して、処理を終了する。
【0038】
出力部22は、学習部21から得られたモデルデータ13を用いて、エリアの雰囲気に関する情報を出力する。出力部22が出力するエリアの雰囲気に関する情報は、所定エリアの評価値、所定エリアと類似する類似エリア等である。出力部22は、評価値出力部23と、類似エリア出力部24を備える。
【0039】
評価値出力部23は、複数のエリアのいずれかが指定されると、統計データ11の指定されたエリアにおける統計種別毎の統計値を学習モデルに入力し、指定されたエリアの指標種別毎の評価値を出力する。
【0040】
評価値出力部23は、統計データ11が特定する複数のエリアのそれぞれについて、指標種別毎の評価値を対応づけた評価値データ14を出力しても良い。評価値出力部23は、統計データ11の各エリアのそれぞれについて、指標種別毎の評価値を算出して、評価値データ14を出力しても良い。
【0041】
評価値出力部23は、エリアの客観データである統計値と、エリアの雰囲気を特定する評価値との関係を示す学習モデルに、あるエリアの統計値を入力することにより、そのエリアの雰囲気についての評価値を出力する。これにより評価値出力部23は、エリアの雰囲気を指標化することができる。
【0042】
類似エリア出力部24は、複数のエリアのいずれかが指定されると、指定されたエリアの指標種別毎の評価値との類似度が所定条件を満たすエリアの識別子を、類似エリアデータ15として出力する。
【0043】
類似エリア出力部24は、評価値データ14が特定する各エリアの評価値を参照して、指定されたエリアの評価値に類似する評価値を有するエリアの識別子を出力する。評価値間の類似度は、例えば、コサイン類似度によって算出される。類似エリア出力部24は、指定されたエリアの評価値との類似度が所定値以上となるエリアを、類似エリアとして特定する。あるいは類似エリア出力部24は、指定されたエリアの評価値との類似度が高い順に所定数のエリアを、類似エリアとして特定する。
【0044】
各エリアの雰囲気を指標化した指標値から算出されるエリア間の類似度により、類似エリア出力部24は、既知のエリアと類似する未知のエリアの情報を提供することができる。例えば、大阪のあるエリアに住んでいたユーザが、東京でこのエリアに類似するエリアに住みたいと考えた場合、ユーザは、処理装置1に、かつて住んでいた大阪のエリアの識別子を入力する。類似エリア出力部24は、東京内のエリアのうち、入力された大阪のエリアに類似するエリアを出力することができる。入力された大阪のエリアの評価値と、類似エリア出力部24が出力する東京のエリアの評価値は類似する。類似エリア出力部24は、ユーザに既知のエリアの情報から、ユーザに未知の同様の雰囲気を有するエリアの情報を出力することができる。
【0045】
指定されたエリアと類似するエリアを出力する例を説明したが、これに限らない。例えば、ユーザが、各指標種別について評価値を指定した場合、出力部22は、指定された評価値と類似する評価値を有するエリアを出力しても良い。出力部22は、ユーザが所望する雰囲気の情報から、その雰囲気を有するユーザに未知エリアの情報を出力することができる。
【0046】
また出力部22は、入力されたエリアの雰囲気と正反対の雰囲気を有するエリアを出力しても良い。具体的には出力部22は、入力されたエリアの評価値との類似度が所定値以下の評価値を有するエリアを、正反対の雰囲気を有するエリアとして出力する。
【0047】
図7を参照して、出力部22による出力処理を説明する。
図7に示す処理の内容および順序は一例であってこれに限るものではない。
【0048】
まず各エリアについて、ステップS51ないしステップS53の処理を繰り返す。ステップS51において出力部22は、統計データ11から、対象エリアの統計値を取得する。ステップS52において出力部22は、対象エリアの統計値をモデルに入力して、対象エリアの評価値を出力する。ステップS53において出力部22は、対象エリアの評価値を、評価値データ14に設定する。
【0049】
評価値データが生成されると、ステップS54において、指定エリアの識別子の入力を待機する。ステップS54において指定エリアの識別子が入力されると、ステップS55において出力部22は、評価値データ14から指定エリアの評価値を取得して出力する。またステップS56において出力部22は、評価値データ14から、指定エリアの評価値と類似度が高いエリアを出力する。
【0050】
図8を参照して、処理装置1による処理結果の一例を説明する。
図8では、東京都内の指標が類似する2つのエリアを示す。2つのエリアの各指標種別の評価値は、互いに類似する。処理装置1は、各エリアの評価値とともに、各エリアを地図上に図示して表示しても良い。
【0051】
このように、本発明の実施の形態に係る処理装置1によれば、エリアの雰囲気を指標化することができる。このような技術は、例えば、不動産会社の業務に適用することができる。処理装置1は、顧客に物件をレコメンドする際に、「買い物しやすさ」などの顧客が希望する指標の評価値を指定することにより、物件のエリアを絞り込むためのコストを削減することができる。また顧客に所望のエリアと類似する未知のエリアの物件の紹介も可能になるので、顧客に提供できる物件の範囲を広げ、契約に結びつく可能性を広げることが可能になる。また、処理装置1の出力を不動産会社の業務に適用することは一例であって、店舗を設けるエリアの選定など、そのほかの業務に適用されても良い。
【0052】
上記説明した本実施形態の処理装置1は、例えば、CPU(Central Processing Unit、プロセッサ)901と、メモリ902と、ストレージ903(HDD:Hard Disk Drive、SSD:Solid State Drive)と、通信装置904と、入力装置905と、出力装置906とを備える汎用的なコンピュータシステムが用いられる。このコンピュータシステムにおいて、CPU901がメモリ902上にロードされたプログラムを実行することにより、処理装置1の各機能が実現される。
【0053】
なお、処理装置1は、1つのコンピュータで実装されてもよく、あるいは複数のコンピュータで実装されても良い。また処理装置1は、コンピュータに実装される仮想マシンであっても良い。
【0054】
処理装置1のプログラムは、HDD、SSD、USB(Universal Serial Bus)メモリ、CD(Compact Disc)、DVD (Digital Versatile Disc)などのコンピュータ読取り可能な記録媒体に記憶することも、ネットワークを介して配信することもできる。
【0055】
なお、本発明は上記実施形態に限定されるものではなく、その要旨の範囲内で数々の変形が可能である。
【符号の説明】
【0056】
1 処理装置
11 統計データ
12 教師データ
13 モデルデータ
14 評価値データ
15 類似エリアデータ
21 学習部
22 出力部
23 評価値出力部
24 類似エリア出力部
901 CPU
902 メモリ
903 ストレージ
904 通信装置
905 入力装置
906 出力装置