特許6332954 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ｔｏｏｒの特許一覧 ▶ サイバネットシステム株式会社の特許一覧

特許6332954マップ表示方法及びマップ表示システム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6332954

(24)【登録日】2018年5月11日

(45)【発行日】2018年5月30日

(54)【発明の名称】マップ表示方法及びマップ表示システム

(51)【国際特許分類】

G06F 17/30 20060101AFI20180521BHJP

【ＦＩ】

G06F17/30 360Z

G06F17/30 170A

G06F17/30 210D

【請求項の数】6

【全頁数】10

(21)【出願番号】特願2013-253227(P2013-253227)

(22)【出願日】2013年12月6日

(65)【公開番号】特開2015-111345(P2015-111345A)

(43)【公開日】2015年6月18日

【審査請求日】2016年10月28日

【新規性喪失の例外の表示】特許法第３０条第２項適用第３０条第２項適用、平成２５年６月１０日ウェブサイト（ｈｔｔｐ：／／５４．２５０．１２５．７５／ｌｏｇｉｎ／Ｒ１０３ｏｇｓ）にて発表

【新規性喪失の例外の表示】特許法第３０条第２項適用第３０条第２項適用、平成２５年８月２日日経産業新聞平成２５年８月２日付日刊、第１面において公開

(73)【特許権者】

【識別番号】313016554

【氏名又は名称】株式会社ｔｏｏｒ

(73)【特許権者】

【識別番号】502457249

【氏名又は名称】サイバネットシステム株式会社

(74)【代理人】

【識別番号】100119677

【弁理士】

【氏名又は名称】岡田賢治

(74)【代理人】

【識別番号】100115794

【弁理士】

【氏名又は名称】今下勝博

(72)【発明者】

【氏名】高枝佳男

(72)【発明者】

【氏名】金田哲也

(72)【発明者】

【氏名】矢野弘海

(72)【発明者】

【氏名】大原康生

(72)【発明者】

【氏名】阪本善博

【審査官】樋口龍弥

(56)【参考文献】

【文献】特開２００４−１７８６０４（ＪＰ，Ａ）

【文献】特開２００３−２２８７０６（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｆ１７／３０

(57)【特許請求の範囲】

【請求項1】

ベクトル化の可能な複数の情報をベクトル化し、ベクトルによって表される点を、情報の内容の近さに応じてマップ上に配置するマップ化手順と、
前記マップの少なくとも一部の領域を複数の領域に機械的に分割する分割手順と、
分割された各領域に含まれる情報の小集合ごとに、当該小集合の特徴を表す属性を抽出する抽出手順と、
抽出した属性を前記領域内に配置する属性配置手順と、
を有するマップ表示方法。

【請求項2】

前記マップ化手順において、複数の文書をベクトル化し、ベクトルによって表される点を、文書の内容の近さに応じてマップ上に配置し、
前記抽出手順において、分割された各領域に含まれる情報の小集合ごとに、文書の特徴を表す単語を抽出し、
前記属性配置手順において、抽出した単語を前記領域内に配置する
ことを特徴とする請求項１に記載のマップ表示方法。

【請求項3】

前記分割手順において、前記マップ上に配置されている点の両端を検出し、両端を設定された数に座標軸に沿って分割することを特徴とする請求項１又は２に記載のマップ表示方法。

【請求項4】

ベクトル化の可能な複数の情報をベクトル化し、ベクトルによって表される点を、情報の内容の近さに応じてマップ上に配置するマップ化部と、
前記マップの少なくとも一部の領域を複数の領域に機械的に分割する分割部と、
分割された各領域に含まれる情報の小集合ごとに、当該小集合の特徴を表す属性を抽出する抽出部と、
抽出した属性を前記領域内に配置する属性配置部と、
を備えるマップ表示システム。

【請求項5】

前記マップ化部は、複数の文書をベクトル化し、ベクトルによって表される点を、文書の内容の近さに応じてマップ上に配置し、
前記抽出部は、分割された各領域に含まれる情報の小集合ごとに、文書の特徴を表す単語を抽出し、
前記属性配置部は、抽出した単語を前記領域内に配置する
ことを特徴とする請求項４に記載のマップ表示システム。

【請求項6】

前記分割部は、前記マップ上に配置されている点の両端を検出し、両端を設定された数に座標軸に沿って分割することを特徴とする請求項４又は５に記載のマップ表示システム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、文書相互間の内容の近さを表示するマップ表示方法及びマップ表示システムに関する。

【背景技術】

【0002】

大量の文書のなかから内容の近い文書を検索するサービスが提供されている（例えば、特許文献１参照）。特許文献１は、類似文書が近くに配置されるよう各文書の点をプロットする。これにより、各文書間の類似性を表すマップを作成することができる。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】ＷＯ２００８／１４３１１６号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

特許文献１のマップは、マップ上のどの領域にどのような内容が分布しているのかは表示されない。このため、マップ上のどの領域にどのような内容が分布しているのかを確かめるためには、プロットされた文書を読まなければならない問題があった。

【0005】

そこで、本発明は、マップ上のどの領域にどのような内容が分布しているのかを表示可能なマップ表示方法及びマップ表示システムの提供を目的とする。

【課題を解決するための手段】

【0006】

本願発明は、マップを複数領域に分割し、分割された各領域に含まれる情報の特徴を表す属性を抽出し、抽出した属性を領域に配置する。

【0007】

本願発明のマップ表示方法は、
ベクトル化の可能な複数の情報をベクトル化し、ベクトルによって表される点を、情報の内容の近さに応じてマップ上に配置するマップ化手順と、
前記マップの少なくとも一部の領域を複数の領域に機械的に分割する分割手順と、
分割された各領域に含まれる情報の小集合ごとに、当該小集合の特徴を表す属性を抽出する抽出手順と、
抽出した属性を前記領域内に配置する属性配置手順と、
を有する。

【0008】

本願発明のマップ表示方法では、
前記マップ化手順において、複数の文書をベクトル化し、ベクトルによって表される点を、文書の内容の近さに応じてマップ上に配置し、
前記抽出手順において、分割された各領域に含まれる情報の小集合ごとに、文書の特徴を表す単語を抽出し、
前記属性配置手順において、抽出した単語を前記領域内に配置してもよい。

【0009】

本願発明のマップ表示方法では、前記分割手順において、前記マップ上に配置されている点の両端を検出し、両端を設定された数に座標軸に沿って分割してもよい。

【0010】

本願発明のマップ表示システムは、
ベクトル化の可能な複数の情報をベクトル化し、ベクトルによって表される点を、情報の内容の近さに応じてマップ上に配置するマップ化部と、
前記マップの少なくとも一部の領域を複数の領域に機械的に分割する分割部と、
分割された各領域に含まれる情報の小集合ごとに、当該小集合の特徴を表す属性を抽出する抽出部と、
抽出した属性を前記領域内に配置する属性配置部と、
を備える。

【0011】

本願発明のマップ表示システムでは、
前記マップ化部は、複数の文書をベクトル化し、ベクトルによって表される点を、文書の内容の近さに応じてマップ上に配置し、
前記抽出部は、分割された各領域に含まれる情報の小集合ごとに、文書の特徴を表す単語を抽出し、
前記属性配置部は、抽出した単語を前記領域内に配置してもよい。

【0012】

本願発明のマップ表示システムでは、前記分割部は、前記マップ上に配置されている点の両端を検出し、両端を設定された数に座標軸に沿って分割してもよい。

【発明の効果】

【0013】

本発明によれば、マップ上のどの領域にどのような内容が分布しているのかを表示可能なマップ表示方法及びマップ表示システムを提供することができる。

【図面の簡単な説明】

【0014】

【図1】本発明の実施形態に係るマップ表示システムの構成の一例を示す。

【図2】本発明の実施形態に係るマップ表示システムのシーケンスを示す。

【図3】マップ化の一例を示す。

【図4】表示部への表示例を示す。

【図5】密度線によって分割した場合の表示例を示す。

【発明を実施するための形態】

【0015】

以下、本発明の実施形態について、図面を参照しながら詳細に説明する。なお、本発明は、以下に示す実施形態に限定されるものではない。これらの実施の例は例示に過ぎず、本発明は当業者の知識に基づいて種々の変更、改良を施した形態で実施することができる。なお、本明細書及び図面において符号が同じ構成要素は、相互に同一のものを示すものとする。

【0016】

（実施形態１）
図１に、本実施形態に係るマップ表示システムの構成例を示す。本実施形態に係るマップ表示システムは、サーバ１０と、ストレージ２０と、ユーザ端末３０を備える。ストレージ２０は、サーバ１０からアクセス可能な任意の記憶媒体である。サーバ１０、ストレージ２０及びユーザ端末３０は、いずれも任意の数を採用しうるが、本実施形態では、サーバ１０が１台、ストレージ２０が２台、ユーザ端末３０が１台の場合について示す。

【0017】

図２に、本実施形態に係るマップ表示システムのシーケンスを示す。ストレージ２０は、予めベクトル化の可能な任意の情報を保持する。ユーザ端末３０は、通信ネットワークを介してマップ化要求を送信する。サーバ１０は、ユーザ端末３０からマップ化要求を受信すると、ストレージ２０から情報を取得し、取得した情報を用いて要求のあったマップを作成し、マップをユーザ端末３０へ送信する。ユーザ端末３０は、サーバ１０から受信したマップを表示する。

【0018】

ベクトル化の可能な情報であればマップ化は可能である。本発明はベクトル化の可能な任意の情報について適用できるが、本実施形態では一例として、ベクトル化の可能な情報が文書である場合について説明する。文書は、単語を識別可能な任意の媒体であり、文字データのほか、動画や静止画などの画像データ、音声データが含まれる。なお、文字データは数字や記号を含み、単語にも数字や記号が含まれる。

【0019】

サーバ１０は、通信ネットワークを介してユーザ端末３０及びストレージ２０と情報の送受信を行う通信機能部（不図示）と、マップを作成するための構成を備える。マップを作成するための構成は、例えば、マップ化部１１と、分割部１２と、抽出部１３と、属性配置部１４と、を備える。

【0020】

サーバ１０は、マップを作成するに際し、本実施形態に係るマップ表示方法を実行する。本実施形態に係るマップ表示方法は、マップ化手順と、分割手順と、抽出手順と、属性配置手順と、を順に有する。

【0021】

マップ化手順では、マップ化部１１が、ベクトル化の可能な複数の情報をベクトル化し、ベクトルによって表される点をマップ上に配置する。マップ化の方法は任意であるが、例えば、概念検索アルゴリズムにおけるベクトル空間モデルを用いることができる。
分割手順では、分割部１２が、マップを複数の領域に分割する。
抽出手順では、抽出部１３が、分割された各領域に含まれる情報の小集合ごとに、小集合の特徴を表す属性を抽出する。
属性配置手順では、属性配置部１４が、抽出した属性を領域内に配置する。

【0022】

本実施形態では、マップ化手順において、マップ化部１１が、文書の内容の近さに応じてマップ上に配置する。図３は、マップ上への配置例である。マップ上の各点が、各文書を表す。内容の近い文書ほど近くに配置される。

【0023】

分割手順における分割方法は任意であるが、例えば、マップをあらかじめ設定された数に機械的に等分割する。このとき、図４に示すように、マップ上に配置された点の両端を検出し、両端を設定された数に等分割することが好ましい。図４は、設定された数が４の場合の分割例を示す。ここで、領域に分ける際に、領域Ａ_４３のように、領域内に存在する点の数が少ない場合は、各文書を確認することが可能であり、小集合の特徴が正確に表れないこともあることから、領域を生成しなくてもよい。

【0024】

なお、図４では、直交座標系のｘ軸ｙ軸ともに４分割されている例を示しているが、ｘ軸方向とｙ軸方向の分割数は異なっていてもよい。また、図４では、直交座標系のｘ軸ｙ軸に沿って分割されている例を示すが、本発明はマップ上の任意の線に沿って分割することができる。例えば、文書の内容の近さに応じて分割する。例えば、内容の近い文書をクラスタリング化してグループを生成し、各グループが１つの領域となるように分割する。

【0025】

また、文書の内容の近さに応じた分割例としては、例えば、マップ上に配置されている点の密度分布に基づいた分割が例示できる。この場合、マップ上に配置されている点の密度分布を算出し、図５に示すように、密度分布に基づいて形成された密度線を境に分割する。密度線は、密度の等しい点を結ぶ線であり、平滑化されていてもよい。点の密度が高い領域は重要な領域と考えられ、その領域がどのような単語から構成されているかは関心が高いと予想される。そこで、周囲よりも密度の高い領域ごとに分割することが好ましい。これにより、重要な領域を構成する特徴的な単語を表示することができる。

【0026】

本実施形態では、抽出部１３が、分割された各領域に含まれる情報の小集合ごとに、文書の特徴を表す単語を抽出する。例えば、図４に示す領域Ａ_４１に含まれるすべての点に対応する文書を抽出した結果、「酸化ガス」及び「流路」という単語が抽出できている。ここで、抽出する単語の数は、本実施形態では２語にしたが、任意の数を採用しうる。

【0027】

本実施形態では、属性配置手順において、属性配置部１４が、抽出した単語を領域内に配置する。例えば、図４に示す領域Ａ_４１に、抽出した「酸化ガス」及び「流路」という単語を配置する。

【0028】

サーバ１０が図４に示すマップをユーザ端末３０へ送信し、ユーザ端末３０が図４に示すマップを表示する。図４に示すマップは、各領域に特有の単語が表示されている。このため、本実施形態に係るマップ表示システムは、マップ上のどの領域にどのような内容が分布しているのかを表示することができる。

【0029】

なお、本実施形態では一例として、ベクトル化の可能な情報が文書である場合について説明したが、本発明はこれに限られない。例えば、文書に代えて、ベクトル化の可能な任意の情報について適用することができる。

【0030】

（実施形態２）
本実施形態では、マップ化手順において、概念検索アルゴリズムにおけるベクトル空間モデルを用いて、ベクトル化の可能な複数の情報をマップ上に配置する方法の詳細について説明する。本実施形態においても、一例として、ベクトル化の可能な情報が文書である場合について説明する。

【0031】

情報ｄ_ｉが、要素ｔ_ｊに対してマトリクス表記できる場合、情報ｄ_ｉをベクトル空間モデルｄ_ｉ＝（ｔ_１，ｔ_２，ｔ_３，……）で記述することができる。情報ｄ_ｉが文書ｄ_ｉであり、要素ｔ_ｉが単語ｔ_ｊであり、文書ｄ_ｉ中に出現する単語ｔ_ｊの出現頻度をｎ_ｉｊとすると、文書ｄ_ｉは文書ベクトルｄ_ｉ＝（ｎ_ｉ１，ｎ_ｉ２，ｎ_ｉ３，……）で表すことができる。

【0032】

文書ｄ_１における単語ｔ_１、ｔ_２、ｔ_３の出願回数がそれぞれ０、１、０であり、文書ｄ_２における単語ｔ_１、ｔ_２、ｔ_３の出願回数がそれぞれ２、１、０であり、文書ｄ_３における単語ｔ_１、ｔ_２、ｔ_３の出願回数がそれぞれ１、２、３である場合、単語文書行列Ｍは以下のように表される。

【0033】

【数1】

【0034】

文書集合ｄ＝Σｄ_ｉにおいて、各文書ｄ_ｉの文書ベクトル相互間の近さを計算する。文書の内容が近いと、使用する単語の種類が類似するため、文書ベクトルの指し示す点は互いに近くに配置される。文書ベクトル相互間の近さを算出することで、文書の内容の近さを求めることができる。演算は、文書ベクトル相互間の距離であってもよいし、内積、外積等の任意の演算を用いてもよい。

【0035】

ここで、どの文書にも共通に使用される単語は文書の内容の近さに影響を与えない。そこで、文書ベクトルの算出においては、各文書に特徴的な単語とそれ以外の単語の文書ベクトルへの寄与に差を設けることが好ましい。例えば、ｔｆｉｄｆ（ＴｅｒｍＦｒｅｑｕｅｎｃｙＩｎｖｅｒｓｅＤｏｃｕｍｅｎｔＦｒｅｑｕｅｎｃｙ）法を使って重み付けを行う。これにより、文書の内容の近さの精度を向上することができる。

【0036】

得られた近さをベースに、マップ化アルゴリズムによりマップ化する。例えば、文書ベクトルの指し示す点を面上に配置する。このとき、意味的距離が離れている文書同士は、文書同士の平面上の距離の精度を落として配置することが好ましい。また、図２に示すように平面に配置してもよいが、球面に配置してもよい。

【0037】

なお、本実施形態においては単語を含む文書について説明したが、本発明は文書に限らず、ベクトル化の可能な任意の情報に適用することができる。

【0038】

例えば、ベクトル化の可能な任意の情報として、オンラインサービスにおけるユーザのアクセスログデータを例示することができる。情報ｄ_ｉを時刻とし、要素ｔ_ｊをユーザとし、時刻ｄ_ｉ〜ｄ_ｉ＋Ｔ（時間間隔Ｔ）の間におけるユーザｔ_ｊのアクセス数をｎ_ｉｊとする。この場合、時刻ｄ_ｉはベクトルｄ_ｉ＝（ｎ_ｉ１，ｎ_ｉ２，ｎ_ｉ３，……）と表現することができる。これにより、マップ化アルゴリズムでマップ化が可能となる。なお、この場合の属性配置手順においてはユーザ名を領域に配置する。

【0039】

例えば、ベクトル化の可能な任意の情報として、センサーデータを例示することができる。情報ｄ_ｉを時刻とし、要素ｔ_ｊをセンサーとし、時刻ｄ_ｉ〜ｄ_ｉ＋Ｔ（時間間隔Ｔ）の間におけるセンサーｔ_ｊの出力数値をｎ_ｉｊとする。この場合、時刻ｄ_ｉはベクトルｄ_ｉ＝（ｎ_ｉ１，ｎ_ｉ２，ｎ_ｉ３，……）と表現することができる。これにより、マップ化アルゴリズムでマップ化が可能となる。なお、この場合の属性配置手順においてはセンサーを領域に配置する。

【0040】

例えば、ベクトル化の可能な任意の情報として、画像データを例示することができる。情報ｄ_ｉを画像とし、要素ｔ_ｊを周波数の成分とし、周波数の成分ｔ_ｊの数値をｎ_ｉｊとする。ここで周波数の成分は、画像ｄ_ｉを周波数変換し、変換後の各周波数の成分である。この場合、画像ｄ_ｉはベクトルｄ_ｉ＝（ｎ_ｉ１，ｎ_ｉ２，ｎ_ｉ３，……）と表現できる。これにより、マップ化アルゴリズムでマップ化が可能となる。なお、この場合の属性配置手順においては周波数の成分を領域に配置する。

【0041】

以上説明したように、概念検索アルゴリズムにおけるベクトル空間モデルを用いることで、ベクトル化の可能な複数の情報をマップ上に配置することができる。

【0042】

（実施形態３）
本実施形態では、抽出手順において特徴を表す属性を抽出する方法の詳細について説明する。本実施形態においても、一例として、ベクトル化の可能な情報が文書である場合について説明する。

【0043】

文書の集合の特徴を表す属性を抽出する方法として、ｔｆｉｄｆ法を用いることができる。ｔｆｉｄｆは、単語の出現頻度を表すｔｆと、逆文書頻度を表すｉｄｆの二つの指標に基づいて算出される。ｉｄｆは一種の一般語フィルタとして働き、多くのドキュメントに出現する単語（一般的な単語）の重み付けｔｆｉｄｆは小さくなり、特定のドキュメントにしか出現しない単語のｔｆｉｄｆが大きくなる。ある文書集合において、その部分文書集合全体でｔｆｉｄｆが上位の単語を抽出する。これにより、小集合における特徴的な単語を抽出することができる。

【0044】

なお、本実施形態においては単語を含む文書について説明したが、本発明は文書に限らず、ベクトル化の可能な任意の情報に適用することができる。
例えば、ベクトル化の可能な任意の情報がオンラインサービスにおけるユーザのアクセスログデータである場合、始終平均的にアクセスするユーザの重み付けｔｆｉｄｆは小さくなり、アクセスのムラが大きいユーザの重み付けｔｆｉｄｆは大きくなる。
例えば、ベクトル化の可能な任意の情報がセンサーデータである場合、出力数値があまり変化しないセンサーの重み付けｔｆｉｄｆは小さくなり、出力数値の変化が大きいセンサーの重み付けｔｆｉｄｆは大きくなる。
例えば、ベクトル化の可能な任意の情報が画像データである場合、画像間で成分値のバラツキが小さい周波数の重み付けｔｆｉｄｆは小さくなり、画像間で成分値のバラツキが大きい周波数の重み付けｔｆｉｄｆは大きくなる。

【産業上の利用可能性】

【0045】

本発明は情報通信産業に適用することができる。

【符号の説明】

【0046】

１０：サーバ
１１：マップ化部
１２：分割部
１３：抽出部
１４：属性配置部
２０：ストレージ
３０：ユーザ端末

【図1】