(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-02-19
(45)【発行日】2024-02-28
(54)【発明の名称】情報処理装置、情報処理方法、情報処理プログラム及び記録媒体
(51)【国際特許分類】
G06F 16/29 20190101AFI20240220BHJP
G06F 16/2452 20190101ALI20240220BHJP
【FI】
G06F16/29
G06F16/2452
(21)【出願番号】P 2020083510
(22)【出願日】2020-05-11
【審査請求日】2023-02-03
(73)【特許権者】
【識別番号】501271479
【氏名又は名称】株式会社トヨタマップマスター
(74)【代理人】
【識別番号】110002516
【氏名又は名称】弁理士法人白坂
(72)【発明者】
【氏名】田川 達司
(72)【発明者】
【氏名】大崎 新太郎
【審査官】松尾 真人
(56)【参考文献】
【文献】特開2005-129002(JP,A)
【文献】特許第6059314(JP,B1)
【文献】中国特許出願公開第110674419(CN,A)
【文献】特開2018-028732(JP,A)
【文献】特開2016-053870(JP,A)
【文献】中村 玄貴,コンテキストを考慮した画像生成のための敵対的生成ネットワークの提案,第11回データ工学と情報マネジメントに関するフォーラム (第17回日本データベース学会年次大会) [online] ,一般社団法人 電子情報通信学会、一般社団法人 日本データベース学会、一般社団法人 情報処理学会,2019年03月06日,DEIM Forum 2019 A5-3, Internet<URL:http://db-event.jpn.org/deim2019/post/papers/282.pdf>
【文献】高橋 輝,店舗の分散表現に対する意味演算を用いた飲食店検索手法,第12回データ工学と情報マネジメントに関するフォーラム (第18回日本データベース学会年次大会) [online] ,一般社団法人 電子情報通信学会、一般社団法人 日本データベース学会、一般社団法人 情報処理学会,2020年03月04日,DEIM 2020 P1-15, Internet<URL:https://proceedings-of-deim.github.io/DEIM2020/papers/P1-15.pdf>
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
(57)【特許請求の範囲】
【請求項1】
情報を出力する出力部と、
複数の施設に関する1又は複数の情報について分散表現に関する処理を行うことにより生成された第1ベクトルを記憶し、当該第1ベクトルとして、施設に関する情報として施設の名称、その施設を説明するための文書、及び、その施設の画像それぞれのベクトルを記憶する記憶部と、
検索対象となる施設に関する所定のデータを受け付ける受付部と、
前記受付部によって受け付けた所定のデータに含まれる情報を相対的に高次元のベクトルで表現し、当該ベクトルについて第2ベクトルとして生成する生成部と、
前記記憶部に記憶される第1ベクトルとしての施設の名称を示すベクトルと、前記生成部によって生成される第2ベクトルとの類似度を判定し、当該判定により類似度が高いと判定されたベクトルに対応する第1ベクトルとしての施設を説明するための文書、及び、その施設の画像のうち少なくとも一方のベクトルと、第2ベクトルとの類似度を判定する判定部と、
前記判定部によって判定された類似度が高い順に、その類似度が高い第1ベクトルに対応する施設に関する情報を前記出力部から出力する出力制御部と、
を備える情報処理装置。
【請求項2】
前記記憶部は、
第1ベクトルとして、施設に関する情報として施設の名称について分散表現に関する処理を行うことにより生成された第11ベクトルと、
第1ベクトルとして、施設に関する情報としてその施設を説明するための文書について分散表現に関する処理を行うことにより生成された第12ベクトルと、
第1ベクトルとして、施設に関する情報としてその施設の画像について分散表現に関する処理を行うことにより生成された第13ベクトルと、を記憶し、
前記判定部は、
施設の名称に基づく第11ベクトルと、第2ベクトルとの類似度を判定する第1判定処理部と、
前記第1判定処理部によって類似度が高いと判定された第11ベクトルに対応する施設を説明するための文書に基づく第12ベクトル及び当該施設の画像に基づく第13ベクトルのうちの少なくとも一方と、第2ベクトルとの類似度を判定する第2判定処理部と、を備え、
前記出力制御部は、第2判定処理部によって判定された類似度が高い順に、その類似度が高い
第1ベクトルに対応する施設に関する情報を前記出力部から出力する
請求項1に記載の情報処理装置。
【請求項3】
前記記憶部は、第12ベクトル及び第13ベクトルに基づいて、類似度の高い施設をクラスタリングした施設群に関するクラスタリング情報を記憶し、
前記第2判定処理部は、前記第1判定処理部によって類似度が高いと判定された施設と、クラスタリング情報に基づいて、当該施設に対して類似度が高い施設群に対応する第12ベクトル及び第13ベクトルの少なくとも一方のベクトルを前記記憶部から取得し、当該ベクトルと、第2ベクトルとの類似度を判定する
請求項2に記載の情報処理装置。
【請求項4】
前記第1判定処理部は、
前記受付部によって所定のデータとして施設に関する文字列データを受け付けた場合、文字列データに記録される文字列と、施設の名称との類似度を判定する第1判定と、
第11ベクトルと第2ベクトルとの類似度を判定する第2判定と、を行い、
前記第1判定と前記第2判定との結果に基づいて、前記文字列と施設との類似度を取得する
請求項2又は3に記載の情報処理装置。
【請求項5】
前記受付部は、所定のデータとして、施設に関する文字列データ、及び、施設に関する画像データの少なくとも一方を受け付けることが可能であり、
前記生成部は、前記受付部によって受け付けた文字列データ及び画像データについて分散表現に関する処理を行うことによって第2ベクトルを生成する
請求項1~4のいずれか1項に記載の情報処理装置。
【請求項6】
出力部を備えるコンピュータが、
複数の施設に関する1又は複数の情報について分散表現に関する処理を行うことにより生成された第1ベクトルを記憶部に記憶し、当該第1ベクトルとして、施設に関する情報として施設の名称、その施設を説明するための文書、及び、その施設の画像それぞれのベクトルを記憶する記憶ステップと、
検索対象となる施設に関する所定のデータを受け付ける受付ステップと、
前記受付ステップによって受け付けた所定のデータに含まれる情報を相対的に高次元のベクトルで表現し、当該ベクトルについて第2ベクトルとして生成する生成ステップと、
前記記憶部に記憶される第1ベクトルとしての施設の名称を示すベクトルと、前記生成ステップによって生成される第2ベクトルとの類似度を判定し、当該判定により類似度が高いと判定されたベクトルに対応する第1ベクトルとしての施設を説明するための文書、及び、その施設の画像のうち少なくとも一方のベクトルと、第2ベクトルとの類似度を判定する判定ステップと、
前記判定ステップによって判定された類似度が高い順に、その類似度が高い第1ベクトルに対応する施設に関する情報を前記出力部から出力する出力制御ステップと、
を実行する情報処理方法。
【請求項7】
コンピュータに、
情報を出力する出力機能と、
複数の施設に関する1又は複数の情報について分散表現に関する処理を行うことにより生成された第1ベクトルを記憶し、当該第1ベクトルとして、施設に関する情報として施設の名称、その施設を説明するための文書、及び、その施設の画像それぞれのベクトルを記憶する記憶機能と、
検索対象となる施設に関する所定のデータを受け付ける受付機能と、
前記受付機能によって受け付けた所定のデータに含まれる情報を相対的に高次元のベクトルで表現し、当該ベクトルについて第2ベクトルとして生成する生成機能と、
前記記憶機能に記憶される第1ベクトルとしての施設の名称を示すベクトルと、前記生成機能によって生成される第2ベクトルとの類似度を判定し、当該判定により類似度が高いと判定されたベクトルに対応する第1ベクトルとしての施設を説明するための文書、及び、その施設の画像のうち少なくとも一方のベクトルと、第2ベクトルとの類似度を判定する判定機能と、
前記判定機能によって判定された類似度が高い順に、その類似度が高い第1ベクトルに対応する施設に関する情報を前記出力機能から出力する出力制御機能と、
を実現させる情報処理プログラム。
【請求項8】
コンピュータに、
情報を出力する出力機能と、
複数の施設に関する1又は複数の情報について分散表現に関する処理を行うことにより生成された第1ベクトルを記憶し、当該第1ベクトルとして、施設に関する情報として施設の名称、その施設を説明するための文書、及び、その施設の画像それぞれのベクトルを記憶する記憶機能と、
検索対象となる施設に関する所定のデータを受け付ける受付機能と、
前記受付機能によって受け付けた所定のデータに含まれる情報を相対的に高次元のベクトルで表現し、当該ベクトルについて第2ベクトルとして生成する生成機能と、
前記記憶機能に記憶される第1ベクトルとしての施設の名称を示すベクトルと、前記生成機能によって生成される第2ベクトルとの類似度を判定し、当該判定により類似度が高いと判定されたベクトルに対応する第1ベクトルとしての施設を説明するための文書、及び、その施設の画像のうち少なくとも一方のベクトルと、第2ベクトルとの類似度を判定する判定機能と、
前記判定機能によって判定された類似度が高い順に、その類似度が高い第1ベクトルに対応する施設に関する情報を前記出力機能から出力する出力制御機能と、
を実現させる情報処理プログラムを記録した、前記コンピュータで読み取り可能な非一時的な記録媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、情報処理プログラム及び記録媒体に関する。
【背景技術】
【0002】
従来から、情報を検索する際に、入力された単語の類似度を、特徴ベクトルを利用して取得することが行われている。特許文献1に記載された技術は、検索フレーズから検索対象の単語に関連する特徴語を生成し、特徴語に基づいてデータベースを検索し、検索結果を出力する。特許文献1に記載された技術は、特徴語の代わりとして、入力された単語に関する特徴情報として特徴ベクトルを取得し、特徴ベクトルに対して類似度が高い類似語を取得し、その類似語を利用して検索を行う。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1に記載された技術のように、特徴ベクトルを利用して単語に類似する類似語を取得して、その類似語に基づいて検索を行うだけでは、ユーザが所望する施設を検索結果として出力することができない可能性がある。例えば、特定の施設を検索する場合でも、種々の業態があり、特に、同一の系列施設であってもサービス内容が異なる場合がある。このため、ユーザが施設を検索する際に、ユーザが所望する施設の検索結果を出力することが望まれている。
【0005】
本発明は、施設を検索することができる情報処理装置、情報処理方法、情報処理プログラム及び記録媒体を提供することを目的とする。
【課題を解決するための手段】
【0006】
一態様の情報処理装置は、情報を出力する出力部と、複数の施設に関する1又は複数の情報について分散表現に関する処理を行うことにより生成された第1ベクトルを記憶する記憶部と、検索対象となる施設に関する所定のデータを受け付ける受付部と、受付部によって受け付けた所定のデータに含まれる情報を相対的に高次元のベクトルで表現し、そのベクトルについて第2ベクトルとして生成する生成部と、記憶部に記憶される第1ベクトルと、生成部によって生成される第2ベクトルとの類似度を判定する判定部と、判定部によって判定された類似度が高い順に、その類似度が高い第1ベクトルに対応する施設に関する情報を出力部から出力する出力制御部と、を備える。
【0007】
一態様の情報処理装置では、記憶部は、第1ベクトルとして、施設に関する情報として施設の名称について分散表現に関する処理を行うことにより生成された第11ベクトルと、第1ベクトルとして、施設に関する情報としてその施設を説明するための文書について分散表現に関する処理を行うことにより生成された第12ベクトルと、第1ベクトルとして、施設に関する情報としてその施設の画像について分散表現に関する処理を行うことにより生成された第13ベクトルと、を記憶し、判定部は、施設の名称に基づく第11ベクトルと、第2ベクトルとの類似度を判定する第1判定処理部と、第1判定処理部によって類似度が高いと判定された第11ベクトルに対応する施設を説明するための文書に基づく第12ベクトル及びその施設の画像に基づく第13ベクトルのうちの少なくとも一方と、第2ベクトルとの類似度を判定する第2判定処理部と、を備え、出力制御部は、第2判定処理部によって判定された類似度が高い順に、その類似度が高い第2ベクトルに対応する施設に関する情報を出力部から出力することとしてもよい。
【0008】
一態様の情報処理装置では、記憶部は、第12ベクトル及び第13ベクトルに基づいて、類似度の高い施設をクラスタリングした施設群に関するクラスタリング情報を記憶し、第2判定処理部は、第1判定処理部によって類似度が高いと判定された施設と、クラスタリング情報に基づいて、その施設に対して類似度が高い施設群に対応する第12ベクトル及び第13ベクトルの少なくとも一方のベクトルを記憶部から取得し、そのベクトルと、第2ベクトルとの類似度を判定することとしてもよい。
【0009】
一態様の情報処理装置では、第1判定処理部は、受付部によって所定のデータとして施設に関する文字列データを受け付けた場合、文字列データに記録される文字列と、施設の名称との類似度を判定する第1判定と、第11ベクトルと第2ベクトルとの類似度を判定する第2判定と、を行い、第1判定と第2判定との結果に基づいて、文字列と施設との類似度を取得することとしてもよい。
【0010】
一態様の情報処理装置では、受付部は、所定のデータとして、施設に関する文字列データ、及び、施設に関する画像データの少なくとも一方を受け付けることが可能であり、生成部は、受付部によって受け付けた文字列データ及び画像データについて分散表現に関する処理を行うことによって第2ベクトルを生成することとしてもよい。
【0011】
一態様の情報処理方法では、出力部を備えるコンピュータが、複数の施設に関する1又は複数の情報について分散表現に関する処理を行うことにより生成された第1ベクトルを記憶部に記憶する記憶ステップと、検索対象となる施設に関する所定のデータを受け付ける受付ステップと、受付ステップによって受け付けた所定のデータに含まれる情報を相対的に高次元のベクトルで表現し、そのベクトルについて第2ベクトルとして生成する生成ステップと、記憶部に記憶される第1ベクトルと、生成ステップによって生成される第2ベクトルとの類似度を判定する判定ステップと、判定ステップによって判定された類似度が高い順に、その類似度が高い第1ベクトルに対応する施設に関する情報を出力部から出力する出力制御ステップと、を実行する。
【0012】
一態様の情報処理プログラムは、コンピュータに、情報を出力する出力機能と、複数の施設に関する1又は複数の情報について分散表現に関する処理を行うことにより生成された第1ベクトルを記憶する記憶機能と、検索対象となる施設に関する所定のデータを受け付ける受付機能と、受付機能によって受け付けた所定のデータに含まれる情報を相対的に高次元のベクトルで表現し、そのベクトルについて第2ベクトルとして生成する生成機能と、記憶機能に記憶される第1ベクトルと、生成機能によって生成される第2ベクトルとの類似度を判定する判定機能と、判定機能によって判定された類似度が高い順に、その類似度が高い第1ベクトルに対応する施設に関する情報を出力機能から出力する出力制御機能と、を実現させる。
一態様の記録媒体は、上述した一態様の情報処理プログラムを記録した、コンピュータで読み取り可能な非一時的な記録媒体である。
【発明の効果】
【0013】
一態様の情報処理装置は、複数の施設に関する1又は複数の情報について分散表現に関する処理を行うことにより生成された第1ベクトルと、検索対象となる施設に関する所定のデータに含まれる情報を相対的に高次元のベクトルで表現し、そのベクトルとしての第2ベクトルとの類似度を判定し、その判定された類似度が高い順に、その類似度が高い第1ベクトルに対応する施設に関する情報を出力するので、施設を検索することができる。
また、一態様の情報処理方法、情報処理プログラム及び記録媒体は、上述した一態様の情報処理装置と同様の効果を奏することができる。
【図面の簡単な説明】
【0014】
【
図1】一実施形態に係る情報処理装置について説明するためのブロック図である。
【
図2】第1ベクトル(第11ベクトル、第12ベクトル及び第13ベクトル)について説明するための図である。
【
図3】クラスタリング情報について説明するための図である。
【
図4】一実施形態に係る情報処理方法について説明するためのフローチャートである。
【発明を実施するための形態】
【0015】
以下、本発明の一実施形態について説明する。
本明細書では、「情報」の文言を使用しているが、「情報」の文言は「データ」と言い換えることができ、「データ」の文言は「情報」と言い換えることができる。
【0016】
図1は、一実施形態に係る情報処理装置1について説明するためのブロック図である。
【0017】
情報処理装置1は、例えば、コンピュータ及びサーバ等の装置である。情報処理装置1は、ユーザによって入力された情報を基に施設を検索する際に、入力された検索条件となる検索情報をベクトル化した第1情報と、施設に関する情報をベクトル化した第2情報との類似度を判定し、判定結果として類似度の高い施設を出力する。
【0018】
第1情報は、例えば、検索情報(例えば、単語、文書及び画像等)を相対的に高次元のベクトルで表現した、そのベクトルであってもよい。同様に、第2情報は、例えば、施設情報(例えば、施設の名称、施設を説明する文書及び施設の画像等)を相対的に高次元のベクトルで表現した、そのベクトルであってもよい。ここで、各ベクトルは、例えば、分散表現技術により生成されたベクトルであってもよい。
【0019】
次に、情報処理装置1について詳細に説明する。
情報処理装置1は、入力部16、通信部17、記憶部18、表示部19、受付部12、生成部13、判定部14及び出力制御部15を備える。受付部12、生成部13、判定部14及び出力制御部15は、情報処理装置1の制御部11(例えば、演算処理装置等)の一機能として実現されてもよい。通信部17、記憶部18及び表示部19は、本発明の「出力部」の一実施形態であってもよい。
【0020】
入力部16は、施設を検索するための条件(検索条件)が入力される装置である。一例として、入力部16は、キーボード及びマウス等であってもよい。
なお、入力部16は、情報処理装置1が備える例に限定されず、情報処理装置1の外部に配されてもよい。例えば、入力部16は、ユーザが所有する携帯端末及び情報処理端末(図示せず)であってもよい。携帯端末は、例えば、スマートフォン及びタブレット等であってもよい。情報処理端末は、ラップトップ及びパソコン等のコンピュータ等であってもよい。入力部16が情報処理装置1の外部に配される場合、情報処理装置1は、入力部16によって入力された施設を検索するための条件(検索条件)を、通信ネットワークを介して後述する通信部17で受信することとしてもよい。
【0021】
出力部は、情報を出力する。出力部の具体的な一例としては、上述したように、通信部17、記憶部18及び表示部19であってよい。
【0022】
通信部17は、情報処理装置1の外部にある装置との間で情報の送受信を行う装置である。例えば、通信部17は、外部にある装置として、外部サーバ、携帯端末及び情報処理端末(いずれも図示せず)との間で通信を行う。
【0023】
記憶部18は、例えば、種々の情報及びプログラム等を記憶する装置である。記憶部18は、本実施形態で説明するように情報処理装置1に配されてもよく、情報処理装置1の外部に配されてもよい。記憶部18が情報処理装置1の外部に配される場合、その記憶部18は、例えば、外部サーバ等であってもよい。
【0024】
記憶部18は、複数の施設に関する1又は複数の情報について分散表現に関する処理を行うことにより生成された第1ベクトルを記憶する。分散表現に関する処理とは、情報(例えば、単語、文書及び画像等)を相対的に高次元(一例として、200~300次元等)のベクトルで表現するために、情報に基づいてベクトルを生成する処理である。分散表現は、近い意味を持つ情報を近いベクトルに対応させる技術である。一例として、制御部11は、分散表現に関する処理として、例えば、word2vec、GloVe及びgensim等を利用することにより、相対的に高次元のベクトルを生成することが可能である。
【0025】
図2は、第1ベクトル(第11ベクトル、第12ベクトル及び第13ベクトル)について説明するための図である。
記憶部18は、第1ベクトルとして、第11ベクトル、第12ベクトル及び第13ベクトルを記憶することとしてもよい。第11ベクトルは、第1ベクトルとして、施設に関する情報として施設の名称について分散表現に関する処理を行うことにより生成された施設名称ベクトルである。第12ベクトルは、第1ベクトルとして、施設に関する情報としてその施設を説明するための文書について分散表現に関する処理を行うことにより生成された施設説明ベクトルである。第13ベクトルは、第1ベクトルとして、施設に関する情報としてその施設の画像について分散表現に関する処理を行うことにより生成された施設画像ベクトルである。
【0026】
例えば、
図2に示すように、制御部11は、施設の名称、施設を説明するための文書、及び、施設の画像それぞれについて分散表現に関する処理を行うことにより、第1ベクトル(第11ベクトル、第12ベクトル及び第13ベクトル)を生成して、記憶部18に記憶することとしてもよい。
【0027】
又は、上述したように制御部11が第1ベクトルを生成する代わりに、例えば、情報処理装置1の外部にある装置(例えば、外部サーバ等)が施設の名称、施設を説明するための文書、及び、施設の画像それぞれについて分散表現に関する処理を行うことにより、第1ベクトル(第11ベクトル、第12ベクトル及び第13ベクトル)を生成することとしてもよい。この場合、情報処理装置1は、通信部17を介して外部サーバから第1ベクトルを取得して、記憶部18に記憶することとしてもよい。
【0028】
又は、例えば、外部サーバが本実施形態の記憶部18として機能する場合には、その外部サーバにおいて上述した場合と同様に第1ベクトルを生成し、蓄積することとしてもよい。この場合、例えば、情報処理装置1(例えば、後述する判定部14)は、外部サーバ(記憶部18)から第1ベクトル(第11ベクトル、第12ベクトル及び第13ベクトル)を取得することとしてもよい。
【0029】
ここで、「施設の名称」は、例えば、施設の店名であってもよい。「施設を説明するための文書」は、例えば、施設で提供するサービス及び商品を説明する文書、施設の業種、施設の営業時間、及び、施設に駐車場が有るか否かの説明等、その施設がどのような施設であるかを具体的又は簡潔に説明する文書であってもよい。「施設の画像」は、例えば、施設の外観の画像、施設の内部の画像、施設が提供するサービス及び商品の画像等、その施設がどのような施設であるかを示す画像(静止画又は動画)であってもよい。
【0030】
図3は、クラスタリング情報について説明するための図である。
記憶部18は、第12ベクトル及び第13ベクトルに基づいて、類似度の高い施設をクラスタリングした施設群に関するクラスタリング情報を記憶することとしてもよい。
例えば、施設の業種によっては、施設を説明する文書と、施設の画像とが類似する場合がある。具体的な一例としては、施設が「レストラン」の場合には、施設(レストラン)を説明するための文書と、施設の画像(例えば、施設内部及び施設の外観の画像等)とが、複数の施設(レストラン)で共通する(類似する)可能性が高い。
このため、例えば、制御部11は、(共通する)類似する複数の施設をクラスタリングしてクラスタリング情報を生成し(類似する複数の施設で施設群を生成し)、そのクラスタリング情報を記憶部18に記憶することとしてもよい。制御部11は、施設群を複数生成する、すなわち、クラスタリング情報を複数生成してもよい。
より具体的な一例として、
図3に示すように、制御部11は、同一の施設の説明文書及び画像それぞれから第12ベクトル及び第13ベクトルを生成する。さらに、制御部11は、類似施設の第12ベクトル及び第13ベクトルをクラスタリングして、クラスタリング情報を生成する。
又は、情報処理装置1の外部にある外部サーバが、上述した制御部11の場合と同様にクラスタリング情報を生成して蓄積することとしてもよい。
【0031】
なお、施設の業種によっては、施設の名称と、施設を説明する文書と、施設の画像とが類似する場合がある。この場合、制御部11(又は、外部サーバ)は、類似する(共通する)複数の施設(施設群)をクラスタリングしてクラスタリング情報を生成し、そのクラスタリング情報を記憶部18に記憶することとしてもよい。すなわち、記憶部18は、第11ベクトル、第12ベクトル及び第13ベクトルに基づいて、類似度の高い施設をクラスタリングした施設群に関するクラスタリング情報を記憶することとしてもよい。
【0032】
表示部19は、例えば、文字及び画像等を表示することが可能な装置である。
【0033】
受付部12は、検索対象となる施設に関する所定のデータを受け付ける。受付部12は、所定のデータとして、施設に関する文字列データ、及び、施設に関する画像データの少なくとも一方を受け付けることが可能であってもよい。例えば、受付部12は、入力部16によって入力された検索条件を施設に関する所定のデータとして受け付ける。検索条件は、上述したように、例えば、単語、文書及び画像等のいずれかであってもよい。したがって、検索条件のデータ(所定のデータ)は、例えば、文字列データ及び画像データ等のいずれかであってもよい。なお、文字列データには、複数の文字からなる文字列のデータの他に、1つの文字からなる文字のデータも含まれる。文字には、文字そのものの他に、例えば、記号及び絵文字等が含まれる。
【0034】
生成部13は、受付部12によって受け付けた所定のデータに含まれる情報を相対的に高次元のベクトルで表現し、そのベクトルについて第2ベクトルとして生成する。生成部13は、受付部12によって受け付けた文字列データ及び画像データについて分散表現に関する処理を行うことによって第2ベクトルを生成することとしてもよい。すなわち、生成部13は、検索条件(例えば、単語、文書及び画像等それぞれ)から相対的に高次元のベクトル(第2ベクトル)を生成する。生成部13によって行われる分散表現に関する処理は、第1ベクトルを生成する際の分散表現に関する処理と同様であってもよい。
【0035】
判定部14は、記憶部18に記憶される第1ベクトルと、生成部13によって生成される第2ベクトルとの類似度を判定する。すなわち、判定部14は、第1ベクトル及び第2ベクトルに基づいて、意味合いが類似した施設を抽出する。判定部14は、例えば、第1ベクトルと第2ベクトルとのコサイン類似度及びユークリッド距離等を算出することに基づいて、類似度を判定することとしてもよい。なお、判定部14は、上述した一例に限定されることはなく、種々の方法により類似度を判定することとしてもよい。
【0036】
一例として、判定部14は、第1判定処理部141及び第2判定処理部142を備えることとしてもよい。判定部14は、後述するように、第1判定処理部141によって第11ベクトルと第2ベクトルとの類似度を判定した後、第2判定処理部142によって第12ベクトル及び第13ベクトルと第2ベクトルとの類似度を判定することとしてもよいし、他の手順により類似度を判定することとしてもよい。
他の手順の一例として、判定部14は、第11ベクトル、第12ベクトル及び第13ベクトルと、第2ベクトルとの類似度を一度に判定することとしてもよい。又は、判定部14は、第11ベクトル及び第12ベクトルと第2ベクトルとの類似度を判定することと、第13ベクトルと第2ベクトルとの類似度を判定することとを分けて行うこととしてもよい。又は、判定部14は、第11ベクトル及び第13ベクトルと第2ベクトルとの類似度を判定することと、第12ベクトルと第2ベクトルとの類似度を判定することとを分けて行うこととしてもよい。
【0037】
第1判定処理部141は、施設の名称に基づく第11ベクトルと、第2ベクトルとの類似度を判定することとしてもよい。
第1判定処理部141は、後述する第1判定及び第2判定を行い、第1判定と第2判定との結果に基づいて、文字列と施設との類似度を取得することとしてもよい。第1判定は、受付部12によって所定のデータとして施設に関する文字列データを受け付けた場合、文字列データに記録される文字列と、施設の名称との類似度を判定する。第2判定は、第11ベクトルと第2ベクトルとの類似度を判定する。
【0038】
すなわち、第1判定処理部141は、第11ベクトルと第2ベクトルとの類似度を判定することに基づいて、検索条件としての文字(文字列)と、検索対象となる施設の名称との類似度を判定する。第1判定処理部141は、第11ベクトルと第2ベクトルとの類似度が相対的に高い場合に、検索条件としての文字(文字列)と検索対象となる施設の名称とが一致している可能性が高いと判定する。これに対し、第1判定処理部141は、第11ベクトルと第2ベクトルとの類似度が相対的に低い場合に、検索条件としての文字(文字列)と検索対象となる施設の名称とが一致している可能性が低いと判定する。
【0039】
ここで、第1判定処理部141は、例えば、ユーザが入力した検索条件(文字列)に基づいて、第11ベクトルと第2ベクトルとを判定した結果として、例えば、同綴同義語、同形異義語、類似語等を出力することが可能である。そこで、情報処理装置1は、ユーザが入力した検索条件(文字列)により合致した検索結果を出力するために、第2判定処理部142によって判定処理を行う。
【0040】
すなわち、第2判定処理部142は、第1判定処理部141によって類似度が高いと判定された第11ベクトルに対応する施設を説明するための文書に基づく第12ベクトル及びその施設の画像に基づく第13ベクトルのうちの少なくとも一方と、第2ベクトルとの類似度を判定することとしてもよい。
【0041】
第2判定処理部142は、第1判定処理部141によって類似度が高いとされた施設の名称(第11ベクトル)に対応する、その施設を説明するための文書(第12ベクトル)と、その施設の画像(第13ベクトル)とのうちの少なくとも一方のベクトルと、第2ベクトルとの類似度を判定する。具体的な一例として、第2判定処理部142は、ユーザが入力した検索条件(文字列)が「レストラン」の場合には、第12ベクトル(施設を説明するための文書)及び第13ベクトル(施設の画像)の少なくとも一方に基づいて、第2ベクトル(検索条件「レストラン」)との類似度を判定する。
【0042】
第2判定処理部142は、上述したような処理を行うことにより、例えば、検索条件がいわゆる「目的検索」の場合には、その目的検索に応じた検索結果(類似度の判定結果)を出力することが可能となる。例えば、第2判定処理部142は、検索条件(目的検索)が「桜の名所」の場合には、「桜の名所」(第2ベクトル)と、「春には花見客で賑わっている」という文書に基づいて生成された第12ベクトル、及び、「桜が満開の写真」に基づいて生成された第13ベクトルとに基づいて類似度を判定して、類似する施設(桜の名所)を出力することが可能になる。
【0043】
この場合、第2判定処理部142は、第1判定処理部141によって類似度が高いと判定された施設と、クラスタリング情報に基づいて、その施設に対して類似度が高い施設群に対応する第12ベクトル及び第13ベクトルの少なくとも一方のベクトルを記憶部18から取得し、そのベクトルと、第2ベクトルとの類似度を判定することとしてもよい。すなわち、例えば、第2判定処理部142は、記憶部18には類似する複数の施設をクラスリングしたクラスタリング情報が記憶されているため、第1判定処理部141によって類似度が高いと判定された施設を含むクラスタリング情報(そのクラスタリング情報に対応する第12ベクトル及び第13ベクトルの少なくとも一方のベクトル)と、第2ベクトルとの類似度を判定する。
【0044】
具体的な一例として、検索条件が「レストラン」の文字列の場合には、第2判定処理部142は、レストランに属する又は類似する複数の施設をクラスタリングしたクラスタリング情報に含まれる第12ベクトル及び第13ベクトルの少なくとも一方のベクトルと、第2ベクトルとの類似度を判定する。これにより、第2判定処理部142は、検索条件(一例として、レストラン等)に対して類似度がより高い施設を取得することが可能になる。
【0045】
第2判定処理部142は、類似度が高い施設を複数取得することとしてもよい。この場合、第2判定処理部142は、類似度が高い順に予め設定された数の施設を取得することとしてもよい。
【0046】
なお、判定部14は、例えば、検索条件としてユーザの現在位置が入力された場合には、その現在位置の周辺で、類似する第1ベクトルに基づいた施設を出力することとしてもよい。ユーザの現在位置は、例えば、GNSS(Global Navigation Satellite System)等を利用して取得されてもよい。判定部14は、例えば、検索条件として入力された施設が臨時休業だった場合には、現在位置から時間的又は距離的に近くの類似施設を、第1ベクトルに基づいて出力することとしてもよい。
【0047】
また、判定部14は、例えば、検索条件として「京都で香嵐渓みたいな所」と入力された場合には、類似する第1ベクトルに基づいて「嵐山」を出力することとしてもよい。すなわち、判定部14は、ユーザの現在位置の周辺で、類似する第1ベクトルに基づく施設を抽出することとしてもよい。
【0048】
出力制御部15は、判定部14によって判定された類似度が高い順に、その類似度が高い第1ベクトルに対応する施設に関する情報を出力部から出力する。すなわち、出力制御部15は、第2判定処理部142によって判定された類似度が高い順に、その類似度が高い第2ベクトルに対応する施設に関する情報を出力部から出力することとしてもよい。
出力部は、上述したように、通信部17、記憶部18及び表示部19であってもよい。
【0049】
出力制御部15は、例えば、施設に関する情報として、施設の名称を表示するよう表示部19(出力部)を制御することとしてもよい。又は、出力制御部15は、例えば、施設に関する情報として、施設の名称をユーザが所有する携帯端末及び情報処理端末(図示せず)に送信するよう通信部17を制御することとしてもよい。又は、出力制御部15は、例えば、施設に関する情報として、施設の名称に関する情報を記憶部18に記憶することとしてもよい。
なお、施設に関する情報は、上述した施設の名称に限定されることはなく、施設の名称に加えて又は施設の名称に代えて、施設を説明する文書及び施設の画像のうち少なくとも一方が含まれていてもよい。
又は、出力制御部15は、判定部14によって判定された類似度が予め設定された閾値以上の第1ベクトルに対応する施設に関する情報を出力部から出力することとしてもよい。
又は、出力制御部15は、判定部14によって判定された類似度が高い順に、上位から予め設定された数の第1ベクトルに対応する施設に関する情報を出力部から出力することとしてもよい。
【0050】
次に、情報処理方法について説明する。
図4は、一実施形態に係る情報処理方法について説明するためのフローチャートである。
【0051】
ステップST101において、受付部12は、検索対象となる施設に関する所定のデータを受け付ける。受付部12は、所定のデータとして、施設に関する文字列データ、及び、施設に関する画像データの少なくとも一方を受け付けることが可能であってもよい。
【0052】
ステップST102において、生成部13は、ステップST101で受け付けた所定のデータに含まれる情報を相対的に高次元のベクトルで表現し、そのベクトルについて第2ベクトルとして生成する。すなわち、生成部13は、情報を分散表現した第2ベクトルを生成する。
【0053】
ステップST103において、第1判定処理部141は、第1判定として、例えば、ステップST101で所定のデータとして施設に関する文字列データを受け付けた場合、文字列データに記録される文字列と、施設の名称との類似度を判定する。
【0054】
ステップST104において、第1判定処理部141は、第2判定として、施設の名称を分散表現した第1ベクトル(第11ベクトル)と、ステップST101で受け付けた所定のデータ(例えば、文字列データ等)を分散表現した第2ベクトルとの類似度を判定する。
【0055】
なお、本実施形態ではステップST103とステップST104とは別の処理として説明しているが、他の実施形態としてステップST103とステップST104とは1つの処理として行われてもよい。すなわち、第1判定処理部141は、ステップST102で所定のデータを分散表現した第2ベクトルと、施設の名称を分散表現した第1ベクトル(第11ベクトル)との類似度を判定することとしてもよい。
【0056】
ステップST105において、第2判定処理部142は、ステップST104によって類似度が高いと判定された第11ベクトルに対応する施設を説明するための文書に基づく第12ベクトル及びその施設の画像に基づく第13ベクトルのうちの少なくとも一方と、第2ベクトルとの類似度を判定する。この場合、第2判定処理部142は、類似する複数の施設をクラスリングしたクラスタリング情報を利用して、そのクラスタリング情報に含まれる第12ベクトル及び第13ベクトルの少なくとも一方と、第2ベクトルとに基づいて、類似度を判定することとしてもよい。
【0057】
ステップST106において、出力制御部15は、ステップST105で判定された類似度が高い第1ベクトルに対応する施設に関する情報を出力する。この場合、出力制御部15は、類似度が高い順に施設に関する情報を出力することとしてもよい。出力制御部15は、出力部として、例えば、通信部17、記憶部18及び表示部19を制御することにより、施設に関する情報を出力する。
【0058】
次に、本実施形態の効果について説明する。
情報処理装置1は、情報を出力する出力部と、複数の施設に関する1又は複数の情報について分散表現に関する処理を行うことにより生成された第1ベクトルを記憶する記憶部18と、検索対象となる施設に関する所定のデータを受け付ける受付部12と、受付部12によって受け付けた所定のデータに含まれる情報を相対的に高次元のベクトルで表現し、そのベクトルについて第2ベクトルとして生成する生成部13と、記憶部18に記憶される第1ベクトルと、生成部13によって生成される第2ベクトルとの類似度を判定する判定部14と、判定部14によって判定された類似度が高い順に、その類似度が高い第1ベクトルに対応する施設に関する情報を出力部から出力する出力制御部15と、を備える。
これにより、情報処理装置1は、施設を検索して、その検索の結果を出力することができる。すなわち、情報処理装置1は、分散表現したベクトルを利用することにより、ユーザが入力した検索条件(所定のデータの情報)に合致した施設を検索することができる。
【0059】
情報処理装置1では、記憶部18は、第1ベクトルとして、第11ベクトルと、第12ベクトルと、第13ベクトルとを記憶することとしてもよい。この場合、判定部14は、施設の名称に基づく第11ベクトルと、第2ベクトルとの類似度を判定する第1判定処理部141と、第1判定処理部141によって類似度が高いと判定された第11ベクトルに対応する施設を説明するための文書に基づく第12ベクトル及びその施設の画像に基づく第13ベクトルのうちの少なくとも一方と、第2ベクトルとの類似度を判定する第2判定処理部142と、を備えることとしてもよい。出力制御部15は、第2判定処理部142によって判定された類似度が高い順に、その類似度が高い第2ベクトルに対応する施設に関する情報を出力部から出力することとしてもよい。
すなわち、情報処理装置1は、第11ベクトルと第2ベクトルとの類似度が高い場合に、第12ベクトル及び第13ベクトルの少なくとも一方と第2ベクトルとの類似度を判定するので、ユーザが入力した検索条件(所定のデータの情報)により合致した施設を検索して、その検索結果を出力することができる。
【0060】
情報処理装置1では、記憶部18は、第12ベクトル及び第13ベクトルに基づいて、類似度の高い施設をクラスタリングした施設群に関するクラスタリング情報を記憶することとしてもよい。第2判定処理部142は、第1判定処理部141によって類似度が高いと判定された施設と、クラスタリング情報に基づいて、その施設に対して類似度が高い施設群に対応する第12ベクトル及び第13ベクトルの少なくとも一方のベクトルを記憶部18から取得し、そのベクトルと、第2ベクトルとの類似度を判定することとしてもよい。
情報処理装置1は、少なくとも第12ベクトル及び第13ベクトルに基づいて、類似する複数の施設をクラスタリングし、そのクラスタリングした範囲内で類似度を判定するので、ユーザが入力した検索条件(所定のデータの情報)により合致した施設を検索して、その検索結果を出力することができる。
【0061】
情報処理装置1では、第1判定処理部141は、受付部12によって所定のデータとして施設に関する文字列データを受け付けた場合、文字列データに記録される文字列と、施設の名称との類似度を判定する第1判定と、第11ベクトルと第2ベクトルとの類似度を判定する第2判定と、を行い、第1判定と第2判定との結果に基づいて、文字列と施設との類似度を取得することとしてもよい。
これにより、情報処理装置1は、施設の名称に関する第11ベクトルと第2ベクトルとの類似度に基づいて、検索条件の文字列と、検索対象の施設の名称とが一致している可能性を取得することができる。
【0062】
情報処理装置1では、受付部12は、所定のデータとして、施設に関する文字列データ、及び、施設に関する画像データの少なくとも一方を受け付けることが可能である。この場合、生成部13は、受付部12によって受け付けた文字列データ及び画像データについて分散表現に関する処理を行うことによって第2ベクトルを生成することとしてもよい。
情報処理装置1は、分散表現したベクトルに基づいて、検索条件に応じた施設を検索することができる。
【0063】
情報処理方法では、出力部を備えるコンピュータが、複数の施設に関する1又は複数の情報について分散表現に関する処理を行うことにより生成された第1ベクトルを記憶部18に記憶する記憶ステップと、検索対象となる施設に関する所定のデータを受け付ける受付ステップと、受付ステップによって受け付けた所定のデータに含まれる情報を相対的に高次元のベクトルで表現し、そのベクトルについて第2ベクトルとして生成する生成ステップと、記憶部18に記憶される第1ベクトルと、生成ステップによって生成される第2ベクトルとの類似度を判定する判定ステップと、判定ステップによって判定された類似度が高い順に、その類似度が高い第1ベクトルに対応する施設に関する情報を出力部から出力する出力制御ステップと、を実行する。
これにより、情報処理方法は、施設を検索して、その検索の結果を出力することができる。すなわち、情報処理方法は、分散表現したベクトルを利用することにより、ユーザが入力した検索条件(所定のデータの情報)に合致した施設を検索することができる。
【0064】
情報処理プログラムは、コンピュータに、情報を出力する出力機能と、複数の施設に関する1又は複数の情報について分散表現に関する処理を行うことにより生成された第1ベクトルを記憶する記憶機能と、検索対象となる施設に関する所定のデータを受け付ける受付機能と、受付機能によって受け付けた所定のデータに含まれる情報を相対的に高次元のベクトルで表現し、そのベクトルについて第2ベクトルとして生成する生成機能と、記憶機能に記憶される第1ベクトルと、生成機能によって生成される第2ベクトルとの類似度を判定する判定機能と、判定機能によって判定された類似度が高い順に、その類似度が高い第1ベクトルに対応する施設に関する情報を出力機能から出力する出力制御機能と、を実現させる。
これにより、情報処理プログラムは、施設を検索して、その検索の結果を出力することができる。すなわち、情報処理プログラムは、分散表現したベクトルを利用することにより、ユーザが入力した検索条件(所定のデータの情報)に合致した施設を検索することができる。
【0065】
上述した情報処理装置1の各部は、コンピュータの演算処理装置等の機能として実現されてもよい。すなわち、情報処理装置1の受付部12、生成部13、判定部14及び出力制御部15は、コンピュータの演算処理装置等による受付機能、生成機能、判定機能及び出力制御機能としてそれぞれ実現されてもよい。
情報処理プログラムは、上述した各機能をコンピュータに実現させることができる。情報処理プログラムは、外部メモリ又は光ディスク等の、コンピュータで読み取り可能な非一時的な記録媒体に記録されていてもよい。
また、上述したように、情報処理装置1の各部は、コンピュータの演算処理装置等で実現されてもよい。その演算処理装置等は、例えば、集積回路等によって構成される。このため、情報処理装置1の各部は、演算処理装置等を構成する回路として実現されてもよい。すなわち、情報処理装置1の受付部12、生成部13、判定部14及び出力制御部15は、コンピュータの演算処理装置等を構成する受付回路、生成回路、判定回路及び出力制御回路として実現されてもよい。
また、情報処理装置1の入力部16、並びに、通信部17、記憶部18及び表示部19(出力部)は、例えば、演算処理装置等の機能を含む入力機能、並びに、通信機能、記憶機能及び表示機能(出力機能)として実現されもよい。また、情報処理装置1の入力部16、並びに、通信部17、記憶部18及び表示部19(出力部)は、例えば、集積回路等によって構成されることにより入力回路、並びに、通信回路、記憶回路及び表示回路(出力回路)として実現されてもよい。また、情報処理装置1の入力部16、並びに、通信部17、記憶部18及び表示部19(出力部)は、例えば、複数のデバイスによって構成されることにより入力装置、並びに、通信装置、記憶装置及び表示装置(出力装置)として構成されてもよい。
【符号の説明】
【0066】
1 情報処理装置
11 制御部
12 受付部
13 生成部
14 判定部
141 第1判定処理部
142 第2判定処理部
15 出力制御部
16 入力部
17 通信部
18 記憶部
19 表示部