(58)【調査した分野】(Int.Cl.,DB名)
前記判定部は、更に、データ収集期間の中で前記対象テキストを含むクエリが観測された単位期間の数の、前記データ収集期間の長さに対する比率に基づいて、前記対象テキストを前記ブランド辞書に含めるか否かを判定する、
請求項1から4のうちいずれか一項に記載のブランド辞書作成装置。
前記監視部は、前記ブランド名抽出部により抽出されたブランド名の数が所定数以上である場合、前記対象語句が取得された取得元の商品等を前記注意対象の商品等と特定する、
請求項7に記載の商品等評価装置。
【発明を実施するための形態】
【0009】
以下、図面を参照し、本発明のブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラムの実施形態について説明する。
【0010】
[全体構成]
図1は、商品等評価装置を利用した販売仲介サーバ200と、ブランド辞書作成装置300との構成および使用環境の一例を示す図である。販売仲介サーバ200は、端末装置100によってアクセスされ、商品またはサービス(以下、商品等)の販売を仲介するための装置であり、いわゆるショッピングサイトやオークションサイトを提供する装置である。ここで、「サイト」とは、ブラウザによって再生されるウェブサイトの他、アプリケーションプログラムによって表示されるアプリ画面の元データを含むものとする。販売仲介サーバ200の運営者には、商品等の出品者により出品される商品等に関する商品等データが提供される。商品等データは、商品等のタイトルや詳細説明などを含む。
【0011】
端末装置100では、ブラウザやアプリケーションプログラムなどのUA(User Agent)110が起動する。UA110は、販売仲介サーバ200から提供された販売画面を表示すると共に、端末装置100の利用者によってなされた入力操作に応じたリクエストを販売仲介サーバ200に送信する。販売仲介サーバ200は、UA110からのリクエストに応じて商品等の販売を決定する。
【0012】
また、販売仲介サーバ200には、ブランド辞書作成装置300により作成されたブランド辞書が提供される。ブランド辞書とは、ある商品等の紹介画面について原則的に一つのみ掲載される筈のブランド名であって、ブランドの名称である確からしさが高い単語を集めた電子的な辞書である。図では、販売仲介サーバ200とブランド辞書作成装置300が別体であるように示しているが、これらは統合されて一つのハードウェアにより実現されてもよい。
【0013】
端末装置100、販売仲介サーバ200、およびブランド辞書作成装置300は、ネットワークNWを介して互いに通信する。これらの構成要素は、ネットワークNWに接続するためのネットワークカード、無線通信モジュールなどを備える。ネットワークNWは、例えば、インターネット、WAN(Wide Area Network)、LAN(Local Area Network)、無線基地局、プロバイダ端末、専用回線などを含む。
【0014】
[販売仲介サーバ]
販売仲介サーバ200は、例えば、販売画面提供部210と、ランキング処理部212と、ログ収集部214と、対象語句取得部230と、ブランド名抽出部232と、注意対象商品等特定部234とを備える。これらの構成要素は、例えば、CPU(Central Processing Unit)などのプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)などのハードウェアによって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。
【0015】
また、販売仲介サーバ200は、RAM(Random Access Memory)やHDD(Hard Disk Drive)、フラッシュメモリ、ROM(Read Only Memory)などの記憶装置に、商品等データ220、ランキングデータ222、ログ情報224、ブランド辞書240などのデータを格納している。なお、これらのデータは、販売仲介サーバ200がネットワークNWを介してアクセス可能なNAS(Network Attached Storage)などに格納されてもよい。
【0016】
販売画面提供部210は、商品等データ220およびランキングデータ222を参照し、商品等の販売画面を端末装置100に提供する。
図2は、商品等の販売画面IM1の一例を示す図である。販売画面IM1には、商品等を検索するためのクエリを入力するためのクエリ入力欄A1、および、入力されたクエリで検索を実行させるための検索ボタンB1が設けられている。クエリ入力欄A1にクエリが入力され、検索ボタンB1が操作されると、検索結果表示画面IM2に遷移する。なお、クエリは一語だけのクエリもあるし、複数の子クエリがスペースなどで結合された複数語を含むクエリもある。
【0017】
図3は、検索結果表示画面IM2の一例を示す図である。検索結果表示画面IM2には、検索結果表示欄A2が含まれる。検索結果表示欄A2には、ランキング処理部212によって決定されたクエリ毎のランキング順に、商品等の画像や説明が並べて表示される。検索結果表示画面IM2において一つの商品等の画像や説明が操作されると、商品等表示画面IM3に遷移する。
【0018】
図4は、商品等表示画面IM3の一例を示す図である。商品等表示画面IM3には、商品等画像表示欄A3−1、タイトル欄A3−2、商品等説明欄A3−3などが含まれる。タイトル欄A3−2や商品等説明欄A3−3には、製造元、商品の素材、使用、その他の内容が掲載される。このような内容が通常の商品等表示画面IM3であるが、過剰なSEOがなされた商品等表示画面は、異なる態様を示すものとなる。
【0019】
図5は、過剰なSEOがなされた商品等表示画面IM4の一例である。商品等表示画面IM4では、製造元が「○○社」であるにも関わらず、商品等説明欄A4−3に、無関係なA社、B社、C社(いずれも○○社と同じカテゴリのブランド名)が掲載されている。この結果、クエリとして「A社」、「B社」、または「C社」のいずれかを指定して検索が行われた結果、それらの商品等でないにも関わらず、この商品等が検索にヒットする場合がある。このような商品等の掲載を回避あるいは抑制するために、販売仲介サーバ200は、ブランド辞書240を用いた注意対象商品等の特定処理を実行する。これについては、後述する。
【0020】
話を戻し、販売画面提供部210は、
図2〜5に例示した各種表示画面を、商品等データ220に基づいて生成する。
図6は、商品等データ220の内容の一例を示す図である。商品等データ220は、商品等の識別情報である商品等IDに対して、商品カテゴリ、商品等画像、タイトル、商品等説明、価格(オークションであれば基準価格または入札価格)、発送条件、その他のデータが対応付けられたものである。
【0021】
ランキング処理部212は、過去に入力されたクエリのそれぞれに対して、種々の基準によりランキング処理を行い、ランキングデータ222を生成する。
図7は、ランキングデータ222の内容の一例を示す図である。ランキングデータ222は、例えば、クエリに対して、商品等IDのランキングが対応付けられたものである。ランキングデータ222は、例えば、ログ収集部214により収集されたログ情報に基づいて、クリック数が多い順、購入数が多い順、CVR(Conversion Ratio)が高い順、お気に入り登録数が多い順、または価格が安い順、或いはこれらを組み合わせたスコア順に、高いランキングとする。また、ランキング処理は、ランダムに商品等をランキングに含めることを含んでもよい。
【0022】
ログ収集部214は、端末装置100において入力されたクエリを含む情報であって、端末装置100からリクエストのあったページを時系列で並べた行動履歴などの情報を、ログ情報224として蓄積する。
【0023】
対象語句取得部230は、商品等データ220に含まれるデータのうち、商品等IDで示される商品等毎の対象語句を取得する。対象語句は任意に定めてよいが、例えば、タイトルおよび商品等説明に含まれる語句が対象語句に設定される。
【0024】
ブランド名抽出部232は、ブランド辞書240を参照し、対象語句取得部230により取得された対象語句の中に含まれるブランド名を抽出する。より具体的に、ブランド名抽出部232は、対象語句が取得された元の商品等のカテゴリに合致するブランド名を抽出する。
図8は、ブランド辞書240の内容の一例を示す図である。ブランド辞書240は、例えば、商品等のカテゴリ毎にブランド名を列挙したものである。
【0025】
ブランド名抽出部232は、例えば、既に行った検索結果を活かすため、AhoCorasick法などの共通接頭辞検索(Common Prefix Search)を行うことで、辞書中からパターンマッチングを行うオートマトンを構築し、入力テキストに対して線形な計算時間を実現する。
【0026】
注意対象商品等特定部234は、ブランド名抽出部232により抽出されたブランド名の数に基づいて、注意対象商品等を特定する。例えば、注意対象商品等特定部234は、所定数k以上のブランド名が対象語句に含まれている商品等を、注意対象商品等として特定する。例えばk=2である。
【0027】
そして、注意対象商品等特定部234は、特定した注意対象商品等について、(1)出品者に対する注意を行うため、表示装置に商品等IDを表示させ、あるいは出品者に対して注意する電子メールを生成して送信する、(2)ランキングデータ222における当該商品等のランキングを下げる、(3)商品等データ220から削除する(出品を取り消す)などの処理を行う。
【0028】
注意対象商品等特定部234は、ブランド名抽出部232により特定されたブランド名の数に応じて、上記(1)〜(3)の処理を段階的に行ってもよい。例えば、2つのブランド名が対象語句に含まれている商品等について(1)の処理を、3つのブランド名が対象語句に含まれている商品等について(2)の処理を、4つ以上のブランド名が対象語句に含まれている商品等について(3)の処理を行ってもよい。
【0029】
また、注意対象商品等特定部234は、出品者毎に、注意対象商品等に該当した商品等の数をカウントし、注意対象商品等に該当した商品等の数に応じて上記(1)〜(3)の処理を段階的に行ってもよい。例えば、注意対象商品等に該当した商品等の数が第1閾値C1以上、第2閾値C2未満の出品者に対して(1)の処理を、注意対象商品等に該当した商品等の数が第2閾値C2以上、第3閾値C3未満の出品者の注意対象商品等に対して(2)の処理を、注意対象商品等に該当した商品等の数が第3閾値C3以上の出品者の注意対象商品等(或いは全ての商品等)に対して(3)の処理を行ってもよい(C1<C2<C3)。
【0030】
図9は、販売仲介サーバ200の対象語句取得部230、ブランド名抽出部232、および注意対象商品等特定部234により実行される処理の流れの一例を示すフローチャートである。本フローチャートの処理は、任意のタイミングで開始される。
【0031】
まず、対象語句取得部230が、商品等データ220から一つの商品等を選択し(S100)、対象語句を取得する(S102)。次に、ブランド名抽出部232が、S102で取得された対象語句からブランド名を抽出する(S104)。
【0032】
次に、注意対象商品等特定部234が、S104で抽出されたブランド名が所定数k以上であるか否かを判定する(S106)。S104で抽出されたブランド名が所定数k以上である場合、注意対象商品等特定部234は、S100で選択した商品等を注意対象商品として特定する(S108)。
【0033】
次に、対象語句取得部230が、商品等データ220から今回の処理対象である全ての商品等を選択したか否かを判定する(S110)。全ての商品等を選択していない場合はS100に処理が戻され、全ての商品等を選択した場合は本フローチャートの処理が終了する。なお、
図9に例示したループ処理は、並列コンピューティングによって同時並行的に実行されてもよい。
【0034】
このように、販売仲介サーバ200(商品等評価装置)によれば、ネットワークNWを介して販売される商品等の紹介画面に含まれる対象語句を取得する対象語句取得部230と、ブランド名を記述したブランド辞書240を参照し、対象語句の中に含まれるブランド名を抽出するブランド名抽出部232と、ブランド名抽出部232により抽出されたブランド名の数に基づいて、注意対象の商品等を特定する注意対象商品等特定部234と、を備えることにより、注意対象の商品等を、効率よく発見することができる。なお、対象語句取得部230、ブランド名抽出部232、および注意対象商品等特定部234を合わせたものが「商品等評価装置」の一例である。また、注意対象商品等特定部234は、「監視部」の一例である。
【0035】
なお、上記の説明では、商品等のカテゴリに応じたブランド辞書240を用いて注意対象商品等を特定するものとしたが、カテゴリを特定せずに全てのブランド辞書240を用いて注意対象商品等を特定してもよい。
【0036】
[ブランド辞書作成装置]
以下、ブランド辞書240を作成するブランド辞書作成装置300について説明する。ブランド辞書作成装置300は、例えば、クエリ取得部310と、出現数カウント部312と、判定部314と、作成部316とを備える。これらの構成要素は、例えば、CPUなどのプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSIやASIC、FPGA、GPUなどのハードウェアによって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。
【0037】
また、ブランド辞書作成装置300は、RAMやHDD、フラッシュメモリ、ROMなどの記憶装置に、クエリログ320、作成中のブランド辞書322などのデータを格納している。なお、これらのデータは、ブランド辞書作成装置300がネットワークNWを介してアクセス可能なNASなどに格納されてもよい。
【0038】
クエリ取得部310は、販売仲介サーバ200が蓄積するログ情報224のうち、クエリに関する情報を取得し、クエリログ320として記憶装置に格納させる。クエリログ320に含まれる各クエリには、そのクエリを用いて検索した結果として表示された商品等およびそのカテゴリが付随している。なお、商品等のカテゴリは階層的に付与されている場合があるが、ここではブランド辞書のカテゴリに対応する階層のカテゴリに着目して説明する。
【0039】
出現数カウント部312は、クエリログ320に含まれる各クエリに基づいて、クエリに含まれるテキストであり、ブランド辞書に含めるか否かを判定される判定対象のテキスト(以下、対象テキスト)の出現回数をカウントする。対象テキストは、例えば、形態素解析などの所定のロジックにより、意味的にひとまとまりであると解釈されるものである。また、対象テキストは、スペース等で区切られた子クエリのそれぞれであってもよく、子クエリを複数結合したものであってもよい。出現数カウント部312は、カテゴリによっては、対象テキストを3文字以上のカタカナに限定するなど、対象テキストを構成する要素に限定を追加してもよい。
【0040】
まず、出現数カウント部312は、あるカテゴリ(以下、対象カテゴリ)のブランド辞書を作成する際に、クエリログ320から対象カテゴリに対応しているクエリ(以下、対象クエリ)を抽出する。クエリログ320には、クエリと、クエリの検索結果画面においてクリックされた商品等を示す情報とが、互いに対応付けられて記憶される(クリックログ)。出現数カウント部312は、例えば、クリックログにおいて、対象カテゴリに対応する商品等が最も多く対応付けられているクエリを、対象クエリとして抽出する。例えば、クエリログ320に含まれるクエリAに対応付けられる商品等のカテゴリが、ファッション40%、食品20%、アウトドア10%、美容10、その他20%である場合、出現数カウント部312は、最も比率の高い対象カテゴリである「ファッション」のブランド辞書の作成に用いる対象クエリとして、クエリAを抽出する。
【0041】
なお、出現数カウント部312は、クエリに対応付けられる商品等のカテゴリのうち、最も比率が高いカテゴリのブランド辞書を作成する際に、当該クエリを用いてもよい。また、出現数カウント部312は、クエリに対応付けられる商品等のカテゴリのうち、高い比率のカテゴリが複数存在する場合、当該クエリが多様な意味のクエリとして用いられている可能性が高い(つまり、意味の特定がしづらいクエリである)と推定し、複数の対象カテゴリに関するブランド辞書について当該クエリを処理対象としてもよいし、そもそも、そのような傾向を示すクエリを処理対象から除外してもよい。
【0042】
次に、出現数カウント部312は、抽出された対象クエリを構成する対象テキストの出現回数をカウントする。
図10は、出現数カウント部312による処理の内容を説明するための図である。出現数カウント部312は、対象クエリに含まれる各対象テキストについて、単独でクエリとして入力された回数をs0、複数の対象テキストを含むクエリの中で、一番目に出現した回数をs1、二番目に出現した回数をs2、三番目以降に出現した回数をs3としてカウントする。
【0043】
また、出現数カウント部312は、対象クエリに含まれる各対象テキストが、データ収集期間に出現した回数(つまり、s0〜s3の総和)である総出現数ntをカウントする。データ収集期間とは、ブランド辞書作成装置300が一回の処理の対象とする期間(対象期間)である。ブランド辞書作成装置300は、その期間において収集されたクエリログ320に基づいて、ブランド辞書の作成処理を行う。データ収集期間は、例えば、1年程度の期間である。
【0044】
また、出現数カウント部312は、対象クエリに含まれる各対象テキストが、データ収集期間において出現した(観測された)日数である出現日数ctを併せてカウントする。
図10の例では、対象テキスト「aaa」に関して、一番目に1回出現し、単独で1回出現しているため、s0とs1にそれぞれ1が与えられている。
【0045】
判定部314は、出現数カウント部312によって、データ収集期間を対象として上記各種指標がカウントされた対象クエリについて、以下の条件のうち一部または全部に基づいて、ブランド辞書に含めるか否かを判定する。
【0046】
(条件1)
判定部314は、条件式(1)で示すように、対象テキストの先頭出現数(つまり、s1)を、対象テキストの総出現数ntによって除した指標値(割合)rを導出する。判定部314は、導出した指標値rが、第1閾値thrよりも大きい場合、その他の条件を満たすのであれば、対象テキストをブランド辞書に含めると判定する。式中、rは、指標値rであり、thrは、第1閾値thrである(0<thr<1、より好ましくは、thrは0.5程度)。
r>thr …(1)
【0047】
指標値rは、複数の対象テキストを含むクエリの一番目に出現した頻度に着目しているが、これは、ファッションのカテゴリに適した規則である。ファッションのカテゴリにおいてクエリ検索を行う場合、一番目にブランド名を入力することが多いという傾向が予め分かっているからである。これによって、判定部314は、ブランド名である可能性が高い対象テキストを、より適切にブランド辞書に含めることができる。
【0048】
(条件2)
判定部314は、条件式(2)で示すように、対象テキストの総出現数ntが、所定の閾値(例えば、第2閾値thnとデータ収集期間の日数とを乗じた値)よりも大きい場合、その他の条件を満たすのであれば、対象テキストをブランド辞書に含めると判定する。式中、ntは、総出現数ntであり。Dは、データ収集期間の日数であり、thnは、第2閾値thnである(1<thn、好ましくは、10〜100程度)。
nt>thn×D…(2)
【0049】
総出現数ntが所定の閾値に達していない対象テキストは、例えば、クエリとしてあまり検索されないマイナーな単語である可能性が高い。これによって、判定部314は、マイナーな単語以外の対象テキストであり、ブランド名である可能性が高い対象テキストを、ブランド辞書に含めることができる。ここで、対象区間の日数は、「単位期間」の一例であり、第2閾値thnとデータ収集期間の日数とを乗じた値は、「単位期間の数の長さに対する比率」の一例である。
【0050】
(条件3)
判定部314は、条件式(3)で示すように、データ収集期間の中で対象テキストを含むクエリが観測された出現日数ctが、所定の閾値(例えば、第3閾値thcと出現日数とを乗じた値)よりも大きい場合、その他の条件を満たすのであれば、対象テキストをブランド辞書に含めると判定する。式中、ctは、出現日数ctであり、Dは、データ収集期間の日数であり、thcは、第3閾値thcである(0<thc<1、より好ましくは、thcは0.5〜0.9程度)。
nt>thn×D…(2)
【0051】
出現日数ctが所定の閾値に達していない対象テキストは、例えば、流行語に関連して多数検索されたテキスト(バズワード)である可能性が高い。これによって、判定部314は、恒常的に用いられているブランド名である可能性が高い対象テキストを、ブランド辞書に含めることができる。
【0052】
作成部316は、判定部314による判定の結果、ブランド辞書に含めると判定された対象テキストを集めて、ブランド辞書を作成する。ブランド辞書は、例えば販売仲介サーバ200に提供される。
【0053】
以下、ブランド辞書作成装置300により実行される処理の流れについて、フローチャートを用いて説明する。
図11は、ブランド辞書作成装置300により実行される処理の流れの一例を示すフローチャートである。
【0054】
まず、ブランド辞書作成装置300は、対象カテゴリを決定する(S200)。対象カテゴリは、例えば外部(オペレータを含む)からの指示に基づいて決定される。次に、判定部314が、対象カテゴリに対応するクエリをクエリログ320から抽出する(S202)。
【0055】
次に、判定部314は、S202で抽出したクエリを一つ選び(S204)、クエリを対象テキストに分割する(S206)。次に、判定部314は、対象テキスト毎に、出現位置毎の出現数、総出現数ntおよび出現日数ctをカウントアップする(S208)。
【0056】
そして、判定部314は、S204で全てのクエリを選択したか否かを判定する(S210)。全てのクエリを選択していない場合、S204に処理が戻される。
【0057】
全てのクエリを選択した場合、判定部314は、前述した各種条件に基づいて、対象テキストをブランド辞書に含めるか否かを判定する(S212)。S212の処理の詳細については、後述する。作成部316は、判定部314による判定の結果、ブランド辞書に含めると判定された対象テキストをブランド名として対象カテゴリの辞書に含める(S214)。なお、
図11に例示したS204〜S210のループ処理は、並列コンピューティングによって同時並行的に実行されてもよい。
【0058】
図12は、S212の処理の一例を示すフローチャートである。S212において、判定部314は、対象テキストが3文字以上のカタカナで構成されているか否かを判定する(S300)。判定部314は、対象テキストが3文字のカタカナで構成されていない場合、対象テキストをブランド辞書に含めないと判定し、処理を終了する。
【0059】
判定部314は、対象テキストが3文字以上のカタカナである場合、対象テキストの指標値rが、第1閾値thrよりも大きいか否かを判定する(条件1)(S302)。判定部314は、対象テキストの指標値rが、第1閾値thr以下である場合、対象テキストをブランド辞書に含めないと判定し、処理を終了する。
【0060】
判定部314は、対象テキストの指標値rが、第1閾値thrよりも大きい場合、対象テキストの総出現数ntが、第2閾値thnとデータ収集期間の日数とを乗じた値よりも大きいか否かを判定する(条件2)(S304)。判定部314は、対象テキストの総出現数ntが、第2閾値thnとデータ収集期間の日数とを乗じた値よりも大きくない場合、対象テキストをブランド辞書に含めないと判定し、処理を終了する。判定部314は、対象テキストの総出現数ntが、第2閾値thnとデータ収集期間の日数とを乗じた値よりも大きい場合、データ収集期間の中で対象テキストを含むクエリが観測された出現日数ctが、第3閾値thcと出現日数とを乗じた値よりも大きいか否かを判定する(S306)。
【0061】
判定部314は、データ収集期間の中で対象テキストを含むクエリが観測された出現日数ctが、第3閾値thcと出現日数とを乗じた値よりも大きくない場合、対象テキストをブランド辞書に含めないと判定し、処理を終了する。判定部314は、象期間の中で対象テキストを含むクエリが観測された出現日数ctが、第3閾値thcと出現日数とを乗じた値よりも大きい場合(つまり、条件1〜3を満たす場合)、対象テキストをブランド辞書に含めると判定し、S214に処理を進める。
【0062】
なお、クエリから対象テキストに分割する手法は、上記の手法に限られない。例えば、「aaa bbb ccc」なるクエリの中に含まれる「aaa bbb」が、ブランド名として世に広まっているような場合も考えられる。これに対し、ブランド辞書作成装置300は、「aaa bbb ccc」から「aaa」、「bbb」、「ccc」、「aaa bbb」、「bbb ccc」のように、単純に形態素解析などを行った場合には二つ以上の対象テキストとなるようなワードも含めて、一つの対象テキストとして扱ってよい。この場合において、例えば「aaa」と「aaa bbb」の双方が絞り込みを通過して残った場合、条件式(3)の左辺の値が大きい方を採用し、小さい方を除外してもよい。「aaa」よりも「aaa bbb」の方が世間の認知度が高い場合、むしろ「aaa bbb」を登録した方が適切に過剰なSEOを検出できるからである。
【0063】
また、作成部316のブランド辞書の作成処理は、既に存在するブランド辞書(例えば、ブランド辞書240)を更新する処理であってもよい。作成部316は、例えば、判定部314によってブランド辞書に含めないと判定された対象テキストが、ブランド辞書240に含まれる場合、当該対象テキストをブランド辞書240から除外し、判定部314によってブランド辞書に含めると判定された対象テキストが、ブランド辞書240に含まれていない場合、当該対象テキストをブランド辞書240に含めることにより、ブランド辞書240を更新するようにしてもよい。
【0064】
以上説明したブランド辞書作成装置300によれば、ネットワークNWを介して商品等を販売するための販売画面に対して入力されたクエリを取得するクエリ取得部310と、取得されたクエリに含まれる対象テキスト毎に、対象テキストがクエリの先頭に出現した先頭出現数と、クエリの中における位置を問わず対象テキストがクエリの中に出現した出現数とをカウントする出現数カウント部312と、対象テキスト毎に先頭出現数を総出現数ntによって除した指標値rを導出し、導出した指標値rに基づいて、対象テキストをブランド辞書に含めるか否かを判定する判定部314とを備えることにより、より適切なブランド辞書を作成することができる。
【0065】
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。