【新規性喪失の例外の表示】特許法第30条第2項適用 第30条第2項適用、平成25年6月10日ウェブサイト(http://54.250.125.75/login/R103ogs)にて発表
(58)【調査した分野】(Int.Cl.,DB名)
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1のマップは、マップ上のどの領域にどのような内容が分布しているのかは表示されない。このため、マップ上のどの領域にどのような内容が分布しているのかを確かめるためには、プロットされた文書を読まなければならない問題があった。
【0005】
そこで、本発明は、マップ上のどの領域にどのような内容が分布しているのかを表示可能なマップ表示方法及びマップ表示システムの提供を目的とする。
【課題を解決するための手段】
【0006】
本願発明は、マップを複数領域に分割し、分割された各領域に含まれる情報の特徴を表す属性を抽出し、抽出した属性を領域に配置する。
【0007】
本願発明のマップ表示方法は、
ベクトル化の可能な複数の情報をベクトル化し、ベクトルによって表される点を、情報の内容の近さに応じてマップ上に配置するマップ化手順と、
前記マップ
の少なくとも一部の領域を複数の領域に
機械的に分割する分割手順と、
分割された各領域に含まれる情報の小集合ごとに、当該小集合の特徴を表す属性を抽出する抽出手順と、
抽出した属性を前記領域内に配置する属性配置手順と、
を有する。
【0008】
本願発明のマップ表示方法では、
前記マップ化手順において、複数の文書をベクトル化し、ベクトルによって表される点を、文書の内容の近さに応じてマップ上に配置し、
前記抽出手順において、分割された各領域に含まれる情報の小集合ごとに、文書の特徴を表す単語を抽出し、
前記属性配置手順において、抽出した単語を前記領域内に配置してもよい。
【0009】
本願発明のマップ表示方法では、前記分割手順において、前記マップ上に配置されている点の
両端を検出し、両端を設定された数に座標軸に沿って分割してもよい。
【0010】
本願発明のマップ表示システムは、
ベクトル化の可能な複数の情報をベクトル化し、ベクトルによって表される点を、情報の内容の近さに応じてマップ上に配置するマップ化部と、
前記マップ
の少なくとも一部の領域を複数の領域に
機械的に分割する分割部と、
分割された各領域に含まれる情報の小集合ごとに、当該小集合の特徴を表す属性を抽出する抽出部と、
抽出した属性を前記領域内に配置する属性配置部と、
を備える。
【0011】
本願発明のマップ表示システムでは、
前記マップ化部は、複数の文書をベクトル化し、ベクトルによって表される点を、文書の内容の近さに応じてマップ上に配置し、
前記抽出部は、分割された各領域に含まれる情報の小集合ごとに、文書の特徴を表す単語を抽出し、
前記属性配置部は、抽出した単語を前記領域内に配置してもよい。
【0012】
本願発明のマップ表示システムでは、前記分割部は、前記マップ上に配置されている点の
両端を検出し、両端を設定された数に座標軸に沿って分割してもよい。
【発明の効果】
【0013】
本発明によれば、マップ上のどの領域にどのような内容が分布しているのかを表示可能なマップ表示方法及びマップ表示システムを提供することができる。
【発明を実施するための形態】
【0015】
以下、本発明の実施形態について、図面を参照しながら詳細に説明する。なお、本発明は、以下に示す実施形態に限定されるものではない。これらの実施の例は例示に過ぎず、本発明は当業者の知識に基づいて種々の変更、改良を施した形態で実施することができる。なお、本明細書及び図面において符号が同じ構成要素は、相互に同一のものを示すものとする。
【0016】
(実施形態1)
図1に、本実施形態に係るマップ表示システムの構成例を示す。本実施形態に係るマップ表示システムは、サーバ10と、ストレージ20と、ユーザ端末30を備える。ストレージ20は、サーバ10からアクセス可能な任意の記憶媒体である。サーバ10、ストレージ20及びユーザ端末30は、いずれも任意の数を採用しうるが、本実施形態では、サーバ10が1台、ストレージ20が2台、ユーザ端末30が1台の場合について示す。
【0017】
図2に、本実施形態に係るマップ表示システムのシーケンスを示す。ストレージ20は、予めベクトル化の可能な任意の情報を保持する。ユーザ端末30は、通信ネットワークを介してマップ化要求を送信する。サーバ10は、ユーザ端末30からマップ化要求を受信すると、ストレージ20から情報を取得し、取得した情報を用いて要求のあったマップを作成し、マップをユーザ端末30へ送信する。ユーザ端末30は、サーバ10から受信したマップを表示する。
【0018】
ベクトル化の可能な情報であればマップ化は可能である。本発明はベクトル化の可能な任意の情報について適用できるが、本実施形態では一例として、ベクトル化の可能な情報が文書である場合について説明する。文書は、単語を識別可能な任意の媒体であり、文字データのほか、動画や静止画などの画像データ、音声データが含まれる。なお、文字データは数字や記号を含み、単語にも数字や記号が含まれる。
【0019】
サーバ10は、通信ネットワークを介してユーザ端末30及びストレージ20と情報の送受信を行う通信機能部(不図示)と、マップを作成するための構成を備える。マップを作成するための構成は、例えば、マップ化部11と、分割部12と、抽出部13と、属性配置部14と、を備える。
【0020】
サーバ10は、マップを作成するに際し、本実施形態に係るマップ表示方法を実行する。本実施形態に係るマップ表示方法は、マップ化手順と、分割手順と、抽出手順と、属性配置手順と、を順に有する。
【0021】
マップ化手順では、マップ化部11が、ベクトル化の可能な複数の情報をベクトル化し、ベクトルによって表される点をマップ上に配置する。マップ化の方法は任意であるが、例えば、概念検索アルゴリズムにおけるベクトル空間モデルを用いることができる。
分割手順では、分割部12が、マップを複数の領域に分割する。
抽出手順では、抽出部13が、分割された各領域に含まれる情報の小集合ごとに、小集合の特徴を表す属性を抽出する。
属性配置手順では、属性配置部14が、抽出した属性を領域内に配置する。
【0022】
本実施形態では、マップ化手順において、マップ化部11が、文書の内容の近さに応じてマップ上に配置する。
図3は、マップ上への配置例である。マップ上の各点が、各文書を表す。内容の近い文書ほど近くに配置される。
【0023】
分割手順における分割方法は任意であるが、例えば、マップをあらかじめ設定された数に機械的に等分割する。このとき、
図4に示すように、マップ上に配置された点の両端を検出し、両端を設定された数に等分割することが好ましい。
図4は、設定された数が4の場合の分割例を示す。ここで、領域に分ける際に、領域A
43のように、領域内に存在する点の数が少ない場合は、各文書を確認することが可能であり、小集合の特徴が正確に表れないこともあることから、領域を生成しなくてもよい。
【0024】
なお、
図4では、直交座標系のx軸y軸ともに4分割されている例を示しているが、x軸方向とy軸方向の分割数は異なっていてもよい。また、
図4では、直交座標系のx軸y軸に沿って分割されている例を示すが、本発明はマップ上の任意の線に沿って分割することができる。例えば、文書の内容の近さに応じて分割する。例えば、内容の近い文書をクラスタリング化してグループを生成し、各グループが1つの領域となるように分割する。
【0025】
また、文書の内容の近さに応じた分割例としては、例えば、マップ上に配置されている点の密度分布に基づいた分割が例示できる。この場合、マップ上に配置されている点の密度分布を算出し、
図5に示すように、密度分布に基づいて形成された密度線を境に分割する。密度線は、密度の等しい点を結ぶ線であり、平滑化されていてもよい。点の密度が高い領域は重要な領域と考えられ、その領域がどのような単語から構成されているかは関心が高いと予想される。そこで、周囲よりも密度の高い領域ごとに分割することが好ましい。これにより、重要な領域を構成する特徴的な単語を表示することができる。
【0026】
本実施形態では、抽出部13が、分割された各領域に含まれる情報の小集合ごとに、文書の特徴を表す単語を抽出する。例えば、
図4に示す領域A
41に含まれるすべての点に対応する文書を抽出した結果、「酸化ガス」及び「流路」という単語が抽出できている。ここで、抽出する単語の数は、本実施形態では2語にしたが、任意の数を採用しうる。
【0027】
本実施形態では、属性配置手順において、属性配置部14が、抽出した単語を領域内に配置する。例えば、
図4に示す領域A
41に、抽出した「酸化ガス」及び「流路」という単語を配置する。
【0028】
サーバ10が
図4に示すマップをユーザ端末30へ送信し、ユーザ端末30が
図4に示すマップを表示する。
図4に示すマップは、各領域に特有の単語が表示されている。このため、本実施形態に係るマップ表示システムは、マップ上のどの領域にどのような内容が分布しているのかを表示することができる。
【0029】
なお、本実施形態では一例として、ベクトル化の可能な情報が文書である場合について説明したが、本発明はこれに限られない。例えば、文書に代えて、ベクトル化の可能な任意の情報について適用することができる。
【0030】
(実施形態2)
本実施形態では、マップ化手順において、概念検索アルゴリズムにおけるベクトル空間モデルを用いて、ベクトル化の可能な複数の情報をマップ上に配置する方法の詳細について説明する。本実施形態においても、一例として、ベクトル化の可能な情報が文書である場合について説明する。
【0031】
情報d
iが、要素t
jに対してマトリクス表記できる場合、情報d
iをベクトル空間モデルd
i=(t
1,t
2,t
3,……)で記述することができる。情報d
iが文書d
iであり、要素t
iが単語t
jであり、文書d
i中に出現する単語t
jの出現頻度をn
ijとすると、文書d
iは文書ベクトルd
i=(n
i1,n
i2,n
i3,……)で表すことができる。
【0032】
文書d
1における単語t
1、t
2、t
3の出願回数がそれぞれ0、1、0であり、文書d
2における単語t
1、t
2、t
3の出願回数がそれぞれ2、1、0であり、文書d
3における単語t
1、t
2、t
3の出願回数がそれぞれ1、2、3である場合、単語文書行列Mは以下のように表される。
【0034】
文書集合d=Σd
iにおいて、各文書d
iの文書ベクトル相互間の近さを計算する。文書の内容が近いと、使用する単語の種類が類似するため、文書ベクトルの指し示す点は互いに近くに配置される。文書ベクトル相互間の近さを算出することで、文書の内容の近さを求めることができる。演算は、文書ベクトル相互間の距離であってもよいし、内積、外積等の任意の演算を用いてもよい。
【0035】
ここで、どの文書にも共通に使用される単語は文書の内容の近さに影響を与えない。そこで、文書ベクトルの算出においては、各文書に特徴的な単語とそれ以外の単語の文書ベクトルへの寄与に差を設けることが好ましい。例えば、tfidf(Term Frequency Inverse Document Frequency)法を使って重み付けを行う。これにより、文書の内容の近さの精度を向上することができる。
【0036】
得られた近さをベースに、マップ化アルゴリズムによりマップ化する。例えば、文書ベクトルの指し示す点を面上に配置する。このとき、意味的距離が離れている文書同士は、文書同士の平面上の距離の精度を落として配置することが好ましい。また、
図2に示すように平面に配置してもよいが、球面に配置してもよい。
【0037】
なお、本実施形態においては単語を含む文書について説明したが、本発明は文書に限らず、ベクトル化の可能な任意の情報に適用することができる。
【0038】
例えば、ベクトル化の可能な任意の情報として、オンラインサービスにおけるユーザのアクセスログデータを例示することができる。情報d
iを時刻とし、要素t
jをユーザとし、時刻d
i〜d
i+T(時間間隔T)の間におけるユーザt
jのアクセス数をn
ijとする。この場合、時刻d
iはベクトルd
i=(n
i1,n
i2,n
i3,……)と表現することができる。これにより、マップ化アルゴリズムでマップ化が可能となる。なお、この場合の属性配置手順においてはユーザ名を領域に配置する。
【0039】
例えば、ベクトル化の可能な任意の情報として、センサーデータを例示することができる。情報d
iを時刻とし、要素t
jをセンサーとし、時刻d
i〜d
i+T(時間間隔T)の間におけるセンサーt
jの出力数値をn
ijとする。この場合、時刻d
iはベクトルd
i=(n
i1,n
i2,n
i3,……)と表現することができる。これにより、マップ化アルゴリズムでマップ化が可能となる。なお、この場合の属性配置手順においてはセンサーを領域に配置する。
【0040】
例えば、ベクトル化の可能な任意の情報として、画像データを例示することができる。情報d
iを画像とし、要素t
jを周波数の成分とし、周波数の成分t
jの数値をn
ijとする。ここで周波数の成分は、画像d
iを周波数変換し、変換後の各周波数の成分である。この場合、画像d
iはベクトルd
i=(n
i1,n
i2,n
i3,……)と表現できる。これにより、マップ化アルゴリズムでマップ化が可能となる。なお、この場合の属性配置手順においては周波数の成分を領域に配置する。
【0041】
以上説明したように、概念検索アルゴリズムにおけるベクトル空間モデルを用いることで、ベクトル化の可能な複数の情報をマップ上に配置することができる。
【0042】
(実施形態3)
本実施形態では、抽出手順において特徴を表す属性を抽出する方法の詳細について説明する。本実施形態においても、一例として、ベクトル化の可能な情報が文書である場合について説明する。
【0043】
文書の集合の特徴を表す属性を抽出する方法として、tfidf法を用いることができる。tfidfは、単語の出現頻度を表すtfと、逆文書頻度を表すidfの二つの指標に基づいて算出される。idfは一種の一般語フィルタとして働き、多くのドキュメントに出現する単語(一般的な単語)の重み付けtfidfは小さくなり、特定のドキュメントにしか出現しない単語のtfidfが大きくなる。ある文書集合において、その部分文書集合全体でtfidfが上位の単語を抽出する。これにより、小集合における特徴的な単語を抽出することができる。
【0044】
なお、本実施形態においては単語を含む文書について説明したが、本発明は文書に限らず、ベクトル化の可能な任意の情報に適用することができる。
例えば、ベクトル化の可能な任意の情報がオンラインサービスにおけるユーザのアクセスログデータである場合、始終平均的にアクセスするユーザの重み付けtfidfは小さくなり、アクセスのムラが大きいユーザの重み付けtfidfは大きくなる。
例えば、ベクトル化の可能な任意の情報がセンサーデータである場合、出力数値があまり変化しないセンサーの重み付けtfidfは小さくなり、出力数値の変化が大きいセンサーの重み付けtfidfは大きくなる。
例えば、ベクトル化の可能な任意の情報が画像データである場合、画像間で成分値のバラツキが小さい周波数の重み付けtfidfは小さくなり、画像間で成分値のバラツキが大きい周波数の重み付けtfidfは大きくなる。