特開2015-41386(P2015-41386A)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ネイバー コーポレーションの特許一覧

特開2015-41386セマンティックデプス構造基盤の検索語提示システムおよび方法
<>
  • 特開2015041386-セマンティックデプス構造基盤の検索語提示システムおよび方法 図000005
  • 特開2015041386-セマンティックデプス構造基盤の検索語提示システムおよび方法 図000006
  • 特開2015041386-セマンティックデプス構造基盤の検索語提示システムおよび方法 図000007
  • 特開2015041386-セマンティックデプス構造基盤の検索語提示システムおよび方法 図000008
  • 特開2015041386-セマンティックデプス構造基盤の検索語提示システムおよび方法 図000009
  • 特開2015041386-セマンティックデプス構造基盤の検索語提示システムおよび方法 図000010
  • 特開2015041386-セマンティックデプス構造基盤の検索語提示システムおよび方法 図000011
  • 特開2015041386-セマンティックデプス構造基盤の検索語提示システムおよび方法 図000012
  • 特開2015041386-セマンティックデプス構造基盤の検索語提示システムおよび方法 図000013
  • 特開2015041386-セマンティックデプス構造基盤の検索語提示システムおよび方法 図000014
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】特開2015-41386(P2015-41386A)
(43)【公開日】2015年3月2日
(54)【発明の名称】セマンティックデプス構造基盤の検索語提示システムおよび方法
(51)【国際特許分類】
   G06F 17/30 20060101AFI20150203BHJP
【FI】
   G06F17/30 320D
   G06F17/30 210D
【審査請求】有
【請求項の数】19
【出願形態】OL
【全頁数】24
(21)【出願番号】特願2014-167690(P2014-167690)
(22)【出願日】2014年8月20日
(31)【優先権主張番号】10-2013-0100560
(32)【優先日】2013年8月23日
(33)【優先権主張国】KR
(71)【出願人】
【識別番号】505205812
【氏名又は名称】ネイバー コーポレーション
【氏名又は名称原語表記】NAVER Corporation
(74)【代理人】
【識別番号】110000408
【氏名又は名称】特許業務法人高橋・林アンドパートナーズ
(72)【発明者】
【氏名】趙 ▲民▼ 梗
(72)【発明者】
【氏名】李 ▲喜▼ 承
(72)【発明者】
【氏名】梁 美 承
(72)【発明者】
【氏名】劉 珍 煥
(72)【発明者】
【氏名】金 泰 壹
(57)【要約】      (修正有)
【課題】セマンティックデプス構造基盤の検索語提示システムおよび方法を提供する。
【解決手段】クライアントから入力された検索語に関連する多数の検索語を提示する検索語提示システムであって、クライアント20からネットワークを介して検索語の入力を受け、多数の推奨検索語を提示する検索インターフェース部120と、検索インターフェースを構成する多数の検索結果と候補検索語を格納する検索DB140と、検索語間の意味上の距離を示すセマンティックデプス(semantic depth)構造が格納されるセマンティックデプスDB150と、クライアントから入力された検索語に基づいて、検索DBからセマンティックデプスによる推奨検索語グループを形成して、セマンティックデプス段階別推奨検索語リストをユーザの選択に応じて段階的に提示するセマンティックデプスエンジン130とを含む。
【選択図】図1
【特許請求の範囲】
【請求項1】
クライアントから入力された検索語に関連する多数の検索語を提示する検索語提示システムにおいて、
前記クライアントにネットワークを介して接続される通信部と、
前記クライアントから検索語の入力を受け、多数の候補検索語を提示する検索インターフェースを提供するインターフェース部と、
前記検索インターフェースを構成する多数の検索結果と多数の候補検索語を格納する検索DBと、
候補検索語別に検索語間の意味上の距離を示すセマンティックデプス(semantic depth)構造が格納されるセマンティックデプスDBと、
前記クライアントから入力された検索語を基盤として前記検索DBに基づいて多数の関連キーワードを導出し、前記セマンティックデプスDBを用いて前記多数の関連キーワードからセマンティックデプスによる推奨検索語グループを形成してセマンティックデプス段階別推奨検索語リストをユーザの選択に応じて段階的に提示する機能を支援するセマンティックデプスエンジンとを含んでなることを特徴とする、セマンティックデプス構造基盤の検索語提示システム。
【請求項2】
前記セマンティックデプスエンジンは、
前記クライアントから入力された検索語に関連する多数の候補検索語を前記検索DBに基づいて導出する候補検索語提供部と、
前記候補検索語提供部から導出した候補検索語を基盤として所定のグルーピングアルゴリズムに従って前記セマンティックデプスDBに基づいて多数のセマンティックデプス段階別推奨検索語リストを構成する推奨検索語提供部とを含むことを特徴とする、請求項1に記載のセマンティックデプス構造基盤の検索語提示システム。
【請求項3】
前記推奨検索語提供部は、
前記候補検索語提供部から導出した多数の関連キーワードを対象として、同一のディレクトリに該当する類似キーワードでクラスタリング(clustering)する作業を行い、多数のディレクトリ別推奨検索語グループをグルーピングすることを特徴とする、請求項2に記載のセマンティックデプス構造基盤の検索語提示システム。
【請求項4】
前記推奨検索語提供部は、
前記多数の関連キーワードを対象として、意味基盤の文字列距離の計算による階層的クラスタリング方式、および前記多数の関連キーワードの接頭辞または接尾辞を用いた接辞クラスタリング方式のうち少なくとも一つを使用することを特徴とする、請求項3に記載のセマンティックデプス構造基盤の検索語提示システム。
【請求項5】
前記推奨検索語提供部は、
前記クラスタリング作業の遂行結果による多数の検索語グループを、前記クライアントから入力された検索語とのセマンティックデプスに基づいて、多数のディレクトリ別推奨検索語グループを含む多数の上位グループに再グルーピングし、前記再グルーピングされた結果に基づいて前記推奨検索語リストを構成することを特徴とする、請求項3に記載のセマンティックデプス構造基盤の検索語提示システム。
【請求項6】
前記セマンティックデプスエンジンは、
前記推奨検索語リストから構成される検索語別セマンティックデプスツリー構造を前記セマンティックデプスDBに格納して前記セマンティックデプスDBをアップデートすることを特徴とする、請求項5に記載のセマンティックデプス構造基盤の検索語提示システム。
【請求項7】
前記セマンティックデプスエンジンは、
候補検索語または推奨検索語の導出の際に、前記候補検索語または前記推奨検索語と、前記候補検索語または前記推奨検索語に関連する一つ以上の基本類義語を用いて一つ以上の拡張類義語を生成することを特徴とする、請求項1〜5のいずれか1項に記載のセマンティックデプス構造基盤の検索語提示システム。
【請求項8】
多数のディレクトリ推奨検索語別に関連するコンテンツ資料を格納するコンテンツDBと、
前記コンテンツDBに基づいて、前記クライアントから入力される特定の検索語に関する一つ以上のコンテンツを検索し、前記検索インターフェースを介して提供する検索エンジンとをさらに含むことを特徴とする、請求項1〜5のいずれか1項に記載のセマンティックデプス構造基盤の検索語提示システム。
【請求項9】
クライアントからネットワークを介して接続され、多数の候補検索語を提示する検索インターフェースを提供するインターフェース部と、前記検索インターフェースを構成する多数の検索結果と多数の候補検索語を格納する検索DBと、候補検索語別に検索語間の意味上の距離を示すセマンティックデプス構造が格納されるセマンティックデプスDBと、前記クライアントから入力された検索語を基盤として前記検索DBに基づいて多数の関連キーワードを導出し、前記セマンティックデプスDBを用いて前記多数の関連キーワードからセマンティックデプスによる推奨検索語リストを提示する機能を支援するセマンティックデプスエンジンとを含む検索語提示システムで推奨検索語を提示する方法において、
前記インターフェース部から提供する前記検索インターフェースを介して前記クライアントから所定の検索語の入力を受け、
前記検索DBに基づいて、前記クライアントから入力された検索語に関連する多数の候補検索語を導出し、
前記セマンティックデプスDBに基づいて前記候補検索語別に多数の関連キーワードを導出してセマンティックデプスによる推奨検索語グループを形成し、ユーザの選択に応じてセマンティックデプス段階別推奨検索語リストを段階的に提示することを含む、セマンティックデプス構造基盤の検索語提示方法。
【請求項10】
前記検索DBに基づいて、前記クライアントから入力された検索語に関連する多数の候補検索語を導出することは、
前記候補検索語の導出の際に、前記候補検索語と前記候補検索語に関連する一つ以上の基本類義語を形態素解析し、
前記形態素解析の結果に基づいて前記候補検索語および前記基本類義語から共通接頭辞または共通接尾辞を除去し、
前記候補検索語および前記基本類義語からの除去作業の後、残った単語に対して文字列マッチング技法によって拡張類義語を生成することをさらに含むことを特徴とする、請求項9に記載のセマンティックデプス構造基盤の検索語提示方法。
【請求項11】
前記検索DBに基づいて、前記クライアントから入力された検索語に関連する多数の候補検索語を導出することは、
前記候補検索語の導出の際に、前記候補検索語の形態素を解析し、
前記形態素解析の結果に基づいて形態素別キーワードカウンティングを行い、
前記形態素別キーワードカウンティングの結果に基づいて所定の基準値以上の形態素に対する基本類義語を導出し、
前記候補検索語を構成する形態素および前記基本類義語間の文字列マッチング技法によって拡張類義語を生成することをさらに含むことを特徴とする、請求項9に記載のセマンティックデプス構造基盤の検索語提示方法。
【請求項12】
前記セマンティックデプスDBに基づいて前記候補検索語別に多数の関連キーワードを導出してセマンティックデプスによる推奨検索語グループを形成し、ユーザの選択に応じてセマンティックデプス段階別推奨検索語リストを段階的に提示することは、
前記候補検索語、前記基本類義語および前記拡張類義語を基盤として前記セマンティックデプスDBに基づいて前記多数の関連キーワードを導出することを特徴とする、請求項10または11に記載のセマンティックデプス構造基盤の検索語提示方法。
【請求項13】
前記セマンティックデプスDBに基づいて前記候補検索語別に多数の関連キーワードを導出してセマンティックデプスによる推奨検索語グループを形成し、ユーザの選択に応じてセマンティックデプス段階別推奨検索語リストを段階的に提示することは、
前記推奨検索語の導出の際に、前記推奨検索語と前記推奨検索語に関連する一つ以上の基本類義語を形態素解析し、
前記形態素解析の結果に基づいて前記推奨検索語および前記基本類義語から共通接頭辞または共通接尾辞を除去し、
前記推奨検索語および前記基本類義語からの除去作業の後、残った単語に対して文字列マッチング技法によって拡張類義語を生成して前記推奨検索語の数を増大させる段階とをさらに含むことを特徴とする、請求項9に記載のセマンティックデプス構造基盤の検索語提示方法。
【請求項14】
前記セマンティックデプスDBに基づいて前記候補検索語別に多数の関連キーワードを導出してセマンティックデプスによる推奨検索語グループを形成し、ユーザの選択に応じてセマンティックデプス段階別推奨検索語リストを段階的に提示することは、
前記推奨検索語の導出の際に、前記推奨検索語の形態素を解析し、
前記形態素解析の結果に基づいて形態素別キーワードカウンティングを行い、
前記形態素別キーワードカウンティングの結果に基づいて所定基準値以上の形態素に対する類義語を導出し、
前記推奨検索語を構成する形態素および前記類義語間の文字列マッチング技法によって拡張類義語を生成して前記推奨検索語の数を増大させる段階をさらに含むことを特徴とする、請求項9に記載のセマンティックデプス構造基盤の検索語提示方法。
【請求項15】
前記セマンティックデプスDBに基づいて前記候補検索語別に多数の関連キーワードを導出してセマンティックデプスによる推奨検索語グループを形成し、ユーザの選択に応じてセマンティックデプス段階別推奨検索語リストを段階的に提示することは、
前記セマンティックデプスDBに基づいて前記候補検索語別に導出した前記多数の関連キーワードを含む関連キーワードリストを構成し、
前記関連キーワードリストに基づいて、キーワード間の文字列距離基盤の階層的クラスタリング技法を用いた1次検索語グルーピングを行い、
前記関連キーワードリストに基づいて、キーワードの接尾辞または接頭辞を基盤とする接辞クラスタリング技法を用いた2次検索語グルーピングを行い、
前記階層的および接辞クラスタリング技法を用いたグルーピングの後、残った検索語を同一のグループに分類する3次検索語グルーピングを行うことを含むことを特徴とする、請求項9、13または14に記載のセマンティックデプス構造基盤の検索語提示方法。
【請求項16】
前記セマンティックデプスDBに基づいて前記候補検索語別に多数の関連キーワードを導出してセマンティックデプスによる推奨検索語グループを形成し、ユーザの選択に応じてセマンティックデプス段階別推奨検索語リストを段階的に提示することは、
前記グルーピングの結果による多数の検索語グループに基づいて、前記クライアントから入力された検索語と各グループに属する検索語間のセマンティックデプスの程度を分析し、
前記分析結果に基づいて、同一範疇のセマンティックデプスを満足する多数の検索語グループを一つのセマンティックデプス別上位グループに再グルーピングし、
前記セマンティックデプス別上位グループに属する多数の検索語グループから、各グループを代表する代表検索語を選択して推奨検索語にして前記セマンティックデプス別推奨検索語リストを構成することをさらに含むことを特徴とする、請求項15に記載のセマンティックデプス構造基盤の検索語提示方法。
【請求項17】
前記1次検索語グルーピングを行うことは、
関連キーワード間の組み合わせが示す意味を把握し、所定の条件による意味別コードを該当キーワードで代替し、
前記コードで代替されたキーワードに対して所定の類似度計算関数を適用し、キーワード間の編集距離を計算して類似度を測定し、
前記類似度の測定結果に基づいて、所定の基準値以上の場合には同一のディレクトリグループにグルーピングすることを含むことを特徴とする、請求項15に記載のセマンティックデプス構造基盤の検索語提示方法。
【請求項18】
前記2次検索語グルーピングを行うことは、
前記関連キーワードリスト上で接頭辞情報または接尾辞情報が同じキーワードを同一のディレクトリグループにグルーピングすることを特徴とする、請求項15に記載のセマンティックデプス構造基盤の検索語提示方法。
【請求項19】
前記検索語提示システムは、推奨検索語別に関連するコンテンツ資料を格納するコンテンツDB、および前記コンテンツDBに基づいて推奨検索語に対応する一つ以上のコンテンツを検索する検索エンジンをさらに含み、
前記検索語提示方法は、
前記クライアントから入力されるユーザの選択信号に応じて、前記推奨検索語リストを前記検索インターフェースを介して上位ディレクトリから下位ディレクトリに段階的に提供し、
前記コンテンツDBに基づいて、前記クライアントから入力される特定の推奨検索語に関する一つ以上のコンテンツを検索し、前記検索インターフェースを介して前記クライアントへ提供することをさらに含むことを特徴とする、請求項9に記載のセマンティックデプス構造基盤の検索語提示方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、検索サービスの利用の際に推奨検索語を提示するシステムおよびその提示方法に係り、具体的には、検索の際に検索ウィンドウに入力される検索語について、セマンティックデプス構造(semantic depth structure)に基づいて、検索語に関連する多数の推奨検索語を段階別に提示するシステムおよび方法に関する。
【背景技術】
【0002】
一般に、検索サービスを提供する検索サービスシステムは、ユーザから検索語(または、キーワードやクエリ)が入力されると、前記検索語に対応する検索結果(例えば、検索語を含むWebサイト、検索語を含む記事、検索語を含むファイル名を持つイメージなど)をユーザに提供する。
【0003】
特に、最近の検索サービスシステムは、ユーザから検索要請を受信した場合、前記検索要請に対して統合検索を行い、前記統合検索の結果を一定の検索チャネルの順に配列してユーザへ提供する。
【0004】
また、ユーザが入力した検索語に関する情報だけでなく、入力された検索語に関連する検索語を提供する関連モデルに基づく検索語提供技術が発達するにつれて、従来の技術としては、ユーザが特定の検索語を入力した後、多く入力される検索語を特定の検索語に対する関連検索語として提供する第一の方法がある。或いは、WebページなどのようにWeb上に存在する文書を用いて単語間の関連度を測定し、特定の単語に対して関連度の高い単語を互いに関連付けて記憶した後、ユーザが入力する検索語との関連度の高い単語を関連検索語として提供する第二の方法がある。
【0005】
関連モデルとは、単語間の連関関係を基盤としてモデリング(modeling)したデータ構造であって、その代表的な例としてオントロジー(ontology)がある。オントロジーとは、知識の特定の領域内に存在する実体および相互作用の作業モデルであって、一定の推論規則に従って、特定のドメインに関連する単語が階層的に表現されている。すなわち、オントロジーは、情報交換用として合意された語彙を生成するために特定の自然言語で定義される事物、事件および関係などの概念の集合であるといえる。主にWeb基盤の知識処理または応用プログラムにおける知識の共有、再使用などが可能である。
【0006】
一般に、従来のポータルサイト(portal site)および検索サイトでは、検索の便宜を提供するために、検索語自動補完という検索語提示機能を提供している。この機能は、検索ユーザが検索語の一部のみを入力しても、ドロップダウンメニューを介して、入力された検索語を含む多数の提示語を示す機能である。関連する検索語は類似度および頻度数の順で提示される。このような機能は、検索ユーザが検索語の一部のみを知っていても、検索装置で提示する多数の検索語の中から自分の所望する検索語を選択することができ、検索語を入力する時間を減らすことができるという利点があって、ユーザに検索の便宜性を提供する。
【0007】
ところが、第一の従来技術は、単に引き続き多く検索された検索語を露出させることにより、ユーザの検索パターンを示すものであり、第二の従来技術は、単に単語間の関連度に基づいて、入力された検索語との関連性の高い検索語をユーザに提供するものであって、単にユーザが入力した検索語に関連する他の検索語を提供するだけであり、実質的に該当検索語から派生できる様々な話題別検索語を提供するには限界がある。
【0008】
また、検索語自動補完機能は、検索ユーザから入力された単語を含む検索語のみを提示するので、入力された検索語と、検索ユーザの実際所望する概念の検索語とが互いに異なる単語構成を持つ場合には、検索ユーザの検索趣旨に符合する検索語を確保して提示することはできないという問題点がある。
【発明の概要】
【発明が解決しようとする課題】
【0009】
本発明は、上述したような問題点を解決するためになされたもので、その目的は、検索の際に検索ウィンドウに入力される検索語と意味上の関連がある推奨検索語を、検索語に関連してセマンティックデプス構造(semantic depth structure)に基づいて段階別に提示するシステムおよび方法を提供することにある。
【0010】
また、本発明の他の目的は、入力された検索語に関連する多数のキーワードをセマンティックデプスの程度に基づく推奨検索語として提供することにより、検索ユーザが予め認知しなかった単語を認識して検索の幅を広めることができるように支援するシステムおよび方法を提供することにある。
【0011】
本発明で解決しようとする技術的課題は、上述した技術的課題に制限されず、上述していない別の技術的課題は、以降の記載から、本発明の属する技術分野における通常の知識を有する者に明らかに理解できるであろう。
【課題を解決するための手段】
【0012】
上記課題を解決するために、本発明の一実施態様は、クライアントから入力された検索語に関連する多数の検索語を提示する検索語提示システムであって、前記クライアントとネットワークを介して接続されるための通信部と、前記クライアントから検索語の入力を受け、多数の候補検索語を提示する検索インターフェースを提供するインターフェース部と、前記検索インターフェースを構成する多数の検索結果と多数の候補検索語を格納する検索DB(データベース)と、候補検索語別に検索語間の意味上の距離を示すセマンティックデプス(semantic depth)構造が格納されるセマンティックデプスDBと、前記クライアントから入力された検索語を基盤として前記検索DBに基づいて多数の関連キーワードを導出し、前記セマンティックデプスDBを用いて前記多数の関連キーワードからセマンティックデプスによる推奨検索語グループを形成してセマンティックデプス段階別推奨検索語リストをユーザの選択に応じて段階的に提示する機能を支援するセマンティックデプスエンジンとを含んでなる、セマンティックデプス構造基盤の検索語提示システムを提供する。
【0013】
本発明の実施態様に係る前記セマンティックデプスエンジンは、前記クライアントから入力された検索語に関連する多数の候補検索語を前記検索DBに基づいて導出する候補検索語提供部と、前記候補検索語提供部から導出した候補検索語を基盤として所定のグルーピングアルゴリズムに従って前記セマンティックデプスDBに基づいて多数のセマンティックデプス段階別推奨検索語リストを構成する推奨検索語提供部とを含むことができる。
【0014】
本発明の実施態様に係る前記推奨検索語提供部は、前記候補検索語提供部から導出した多数の関連キーワードを対象として、同一のディレクトリに該当する類似キーワードでクラスタリング(clustering)する作業を行い、多数のディレクトリ別推奨検索語グループをグルーピングすることができる。そして、前記推奨検索語提供部は、前記クラスタリング作業の遂行結果による多数の検索語グループを、前記クライアントから入力された検索語とのセマンティックデプスに基づいて、多数のディレクトリ別推奨検索語グループを含む多数の上位グループに再グルーピングし、前記再グルーピングされた結果に基づいて前記推奨検索語リストを構成することができる。
【0015】
好ましくは、前記セマンティックデプスエンジンは、前記推奨検索語リストから構成される検索語別セマンティックデプスツリー構造を前記セマンティックデプスDBに格納して前記セマンティックデプスDBをアップデートすることができる。
【0016】
一方、本発明の実施態様に係る前記セマンティックデプスエンジンは、候補検索語または推奨検索語の導出の際に、前記候補検索語または前記推奨検索語と、前記候補検索語または前記推奨検索語に関連する一つ以上の基本類義語を用いて一つ以上の拡張類義語を生成することができる。
【0017】
ひいては、前記セマンティックデプスエンジンは、前記候補検索語提供部または前記推奨検索語提供部から導出した検索語を、前記検索インターフェースを介して提供するために前記インターフェース部へ伝送する伝送部をさらに含むことができる。
【0018】
本発明の実施態様に係るシステムは、多数のディレクトリ推奨検索語別に関連するコンテンツ資料を格納するコンテンツDBと、前記コンテンツDBに基づいて、前記クライアントから入力される特定の検索語に関する一つ以上のコンテンツを検索し、前記検索インターフェースを介して提供する検索エンジンとをさらに含むことができる。また、前記インターフェース部、前記セマンティックデプスエンジン、前記検索エンジンおよび前記検索語提示システムの内部を制御する制御部をさらに含むことができる。
【0019】
上述した課題を解決するために、本発明の他の実施態様は、クライアントからネットワークを介して接続され、多数の候補検索語を提示する検索インターフェースを提供するインターフェース部と、前記検索インターフェースを構成する多数の検索結果および多数の候補検索語を格納する検索DBと、候補検索語別に検索語間の意味上の距離を示すセマンティックデプス構造が格納されるセマンティックデプスDBと、前記クライアントから入力された検索語を基盤として前記検索DBに基づいて多数の関連キーワードを導出し、前記セマンティックデプスDBを用いて前記多数の関連キーワードからセマンティックデプスによる推奨検索語リストを提示する機能を支援するセマンティックデプスエンジンとを含む検索語提示システムで推奨検索語を提示する方法であって、(a)前記インターフェース部で提供する前記検索インターフェースを介して前記クライアントから所定の検索語の入力を受け、(b)前記検索DBに基づいて、前記クライアントから入力された検索語に関連する多数の候補検索語を導出し、(c)前記セマンティックデプスDBに基づいて前記候補検索語別に多数の関連キーワードを導出してセマンティックデプスによる推奨検索語グループを形成してユーザの選択に応じてセマンティックデプス段階別推奨検索語リストを段階的に提示することを含んでなる、セマンティックデプス構造基盤の検索語提示方法を提供する。
【0020】
本発明の実施態様に係る前記(b)は、前記候補検索語の導出の際に、前記候補検索語および前記候補検索語に関連する一つ以上の基本類義語を形態素解析し、前記形態素解析の結果に基づいて前記候補検索語および前記基本類義語から共通接頭辞または共通接尾辞を除去し、前記候補検索語および前記基本類義語からの除去作業の後、残った単語に対して文字列マッチング技法によって拡張類義語を生成することをさらに含むことができる。
【0021】
或いは、本発明の実施態様に係る前記(b)は、前記候補検索語の導出の際に、前記候補検索語の形態素を解析し、前記形態素解析の結果に基づいて形態素別キーワードカウンティングを行い、前記形態素別キーワードカウンティングの結果に基づいて所定の基準値以上の形態素に対する類義語を導出し、前記候補検索語を構成する形態素および前記類義語間の文字列マッチング技法によって拡張類義語を生成することをさらに含むことができる。
【0022】
その際、好ましくは、本発明の実施態様に係る前記(c)は、前記候補検索語、前記基本類義語および前記拡張類義語を基盤として前記セマンティックデプスDBに基づいて前記多数の関連キーワードを導出することができる。
【0023】
同様に、本発明の実施態様に係る前記(c)は、前記推奨検索語の導出の際に、前記推奨検索語と前記推奨検索語に関連する一つ以上の基本類義語を形態素解析し、前記形態素解析の結果に基づいて前記推奨検索語および前記基本類義語から共通接頭辞または共通接尾辞を除去し、前記推奨検索語および前記基本類義語からの除去作業の後、残った単語に対して文字列マッチング技法によって拡張類義語を生成して前記推奨検索語の数を増大させることをさらに含むことができる。
【0024】
一方、本発明の実施態様に係る前記(c)は、前記セマンティックデプスDBに基づいて前記候補検索語別に導出した前記多数の関連キーワードを含む関連キーワードリストを構成し、前記関連キーワードリストに基づいて、キーワード間の文字列距離基盤の階層的クラスタリング技法を用いた1次検索語グルーピングを行い、前記関連キーワードリストに基づいて、キーワードの接尾辞または接頭辞を基盤とする接辞クラスタリング技法を用いた2次検索語グルーピングを行い、前記クラスタリング技法を用いたグルーピングの後、残った検索語を同一のグループに分類する3次検索語グルーピングを行うことを含むことができる。
【0025】
前記(c)は、前記グルーピングの結果による多数の検索語グループに基づいて、前記クライアントから入力された検索語と各グループに属する検索語間のセマンティックデプスの程度を分析し、前記分析結果に基づいて、同一範疇のセマンティックデプスを満足する多数の検索語グループを一つのセマンティックデプス別上位グループに再グルーピングし、前記セマンティックデプス別上位グループに属する多数の検索語グループから、各グループを代表する代表検索語を選択して推奨検索語にして前記セマンティックデプス別推奨検索語リストを構成することをさらに含むことができる。
【0026】
その際、本発明の実施態様に係る前記1次検索語グルーピングは、関連キーワード間の組み合わせが示す意味を把握して、所定の条件による意味別コードを該当キーワードで代替し、前記コードで代替されたキーワードに対して所定の類似度計算関数を適用して、キーワード間の編集距離を計算して類似度を測定し、前記類似度の測定結果に基づいて、所定の基準値以上の場合には同一のディレクトリグループにグルーピングすることを含むことができる。
【0027】
また、本発明の実施態様に係る前記2次検索語グルーピングは、前記関連キーワードリスト上で接頭辞情報または接尾辞情報が同じキーワードを同一のディレクトリグループにグルーピングすることができる。
【0028】
本発明の実施態様に係る検索語提示方法は、検索語提示システムが、推奨検索語別に関連するコンテンツ資料を格納するコンテンツDB、および前記コンテンツDBに基づいて推奨検索語に対応する一つ以上のコンテンツを検索する検索エンジンをさらに含む場合、(d)前記クライアントから入力されるユーザの選択信号に応じて前記推奨検索語リストを前記検索インターフェースを介して上位ディレクトリから下位ディレクトリに段階的に提供し、(c)前記コンテンツDBに基づいて、前記クライアントから入力される特定の推奨検索語に関する一つ以上のコンテンツを検索し、前記検索インターフェースを介して前記クライアントへ提供することをさらに含むことができる。
【0029】
前記実施態様は、本発明の好適な実施例の一部に過ぎず、本発明の技術的特徴が反映された様々な実施例が当該技術分野における通常の知識を有する者によって本発明の詳細な説明を基づいて導出され、理解できる。
【発明の効果】
【0030】
本発明によれば、ユーザが入力した最初の検索データに基づいて、該当検索語に関連する推奨検索語をセマンティックデプス別に段階的に提供することにより、検索語と意味上の関連がある様々なイシュー別検索語を段階的に提示し、検索ユーザが予め認知しなかった単語を認識して検索の幅を広めることができ且つ検索の便宜性を高めることができる。
【図面の簡単な説明】
【0031】
本発明についての理解を助けるために詳細な説明の一部として含まれる添付図面は、本発明に対する実施態様を提供し、詳細な説明と共に本発明の技術的思想を説明する。
図1】本発明の一実施態様に係るセマンティックデプス構造を利用した検索語提示システムの一例を示す図である。
図2】本発明の実施態様に係る検索語提示システムで一実施例による類義語拡張技法を用いて検索語を導出する過程を示す図である。
図3】本発明の実施態様に係る検索語提示システムで他の実施例による類義語拡張技法を用いて検索語を導出する過程を示す図である。
図4】本発明の実施態様に係る検索語提示システムでディレクトリ別推奨検索語を分類する過程の一例を示す図である。
図5】本発明の実施態様に係る階層的クラスタリング方式を用いた意味基盤の文字列類似度計算方式の一例を示す図である。
図6】本発明の実施態様に係る階層的クラスタリング方式を用いた意味基盤の文字列類似度計算のための同義語シソーラスの一例を示す図である。
図7】本発明の実施態様に係る接辞クラスタリング方式を用いた検索語グルーピングの一例を示す図である。
図8】本発明の実施態様に係る検索語提示システムで導出する検索語のセマンティックデプス構造の一例を示す図である。
図9】本発明の実施態様に係る検索語提示システムで提案するディレクトリ別推奨検索語サービスの一例を示す図である。
図10】本発明の実施態様に係る検索語提示システムで提案するセマンティックデプス別推奨検索語サービスの他の例を示す図である。
【発明を実施するための形態】
【0032】
本発明は、多様な変換を加えることができ、様々な実施態様を持つことができるので、特定の実施態様を図面に例示し、詳細な説明に詳細に説明しようとする。本発明を説明するにあたり、関連する公知の技術に対する具体的な説明が本発明の要旨を不明確にするおそれがあると判断される場合、その詳細な説明を省略する。
【0033】
以下、本発明に係る好適な実施態様を添付図面に基づいて詳細に説明する。添付図面と共に以下に開示される詳細な説明は、本発明の例示的な実施態様を説明しようとするものであり、本発明が実施できる唯一の実施態様を示そうとするものではない。以下の詳細な説明は、本発明の完全な理解を提供するために具体的な詳細事項を含む。ところが、当業者は本発明がかかる具体的な詳細事項なしでも実施できることを理解するであろう。
【0034】
本発明は検索サービスの利用の際に推奨検索語を提示するシステムおよびその提示方法に関する。具体的には、検索の際に検索ウィンドウに入力される検索語について、「セマンティックデプス構造(semantic depth structure)」に基づいて、検索語に関連する多数の推奨検索語を段階別に提示するシステムおよび方法に関する。
【0035】
本明細書において、「セマンティックデプス構造」とは、検索語との意味上の関連程度を示す構造であって、デプスの程度に基づいて、検索ウィンドウに提示する段階が区分され、同一のデプスにおいても多数のディレクトリ別推奨検索語を含む一種のツリー構造として定義される。
【0036】
図1は本発明の一実施態様に係るセマンティックデプス構造を利用した検索語提示システムの一例を示す図である。
【0037】
図1を参照すると、本発明に係る検索語提示システム10は、クライアント20とネットワークを介して検索のためのデータを送受信する通信部110と、クライアント20から検索語の入力を受け、多数の検索インターフェースを提供するインターフェース部120と、クライアント20から入力された検索語を基盤としてセマンティックデプスの程度に基づいて多数の推奨検索語をディレクトリ(directory)別に段階的に提示する機能を支援するセマンティックデプスエンジン130と、検索インターフェースを構成する多数の検索結果および多数の検索語候補を格納する検索DB140と、検索語候補別に関連する多様な推奨検索語をセマンティックデプスに基づいて段階的に提示するためのセマンティックデプスDB150と、多数の推奨検索語別にコンテンツ資料を格納するコンテンツDB160と、ユーザが特定する検索語を用いてコンテンツDB160から該当コンテンツ検索を行う検索エンジン170と、検索エンジン170を始めとして検索語提示システム10の機能別動作を制御する制御部180とを含む。
【0038】
以下、本発明に係る検索語提示システム10の各構成について説明する。
【0039】
通信部110は、検索語提示システム10とクライアント20間、または検索語提示システム10と別のシステムが位置するネットワーク間の有線又は無線通信を可能とする一つ以上のモジュールを含むことができる。
【0040】
インターフェース部120は、検索ユーザが検索サービスを利用することが可能なコンテンツを提供するための検索インターフェースを含む。検索インターフェースは、検索ユーザが検索サービスを利用することが可能な有線コンテンツ(contents)または無線コンテンツであり、検索サービス機能を提供することが可能なインターフェースであれば、コンテンツの形式ではなくても検索インターフェースとして使用できる。検索インターフェースには、基本的に、検索ユーザが入力することが可能な入力ウィンドウ、および検索を実行させることが可能な検索ボタンが存在する。
【0041】
セマンティックデプスエンジン130は、クライアント20から入力された検索語に関連する多数の検索語候補を検索DB140から導出する候補検索語提供部131と、候補検索語提供部131で導出した検索語を基盤として、該当検索語に関連する多数のセマンティックデプス段階別推奨検索語を生成して提案する推奨検索語提供部132と、候補検索語提供部131で生成した検索語候補および推奨検索語提供部132で生成したセマンティックデプス段階別推奨検索語を、検索インターフェースを介して提示するためにインターフェース部120へ伝送する伝送部133とを含むことができる。
【0042】
候補検索語提供部131は、クライアント20から入力された検索語に関連するキーワードや入力された検索語の類義語などの多数の検索語候補を検索DB140から導出してクライアント20へ伝送する。また、候補検索語提供部131は、検索DB140に基づいて、検索語に関連する一つ以上の検索インターフェースファイルを導出し、これをクライアント20へ伝送することにより、ユーザに検索サービスの利用が可能な環境を提供する。
【0043】
また、候補検索語提供部131は、検索語に関連する基本類義語を検索し、検索された基本類義語を所定の文字列マッチング技法を用いて類義語の拡張により検索語の数を増加させることができる。
【0044】
例えば、クライアント20から、ユーザが入力した「結婚」という検索語が伝送されると、候補検索語提供部131は、検索DB140に基づいて、「結婚」という単語を含む関連検索語または「結婚」という単語の類義語を検索する。「結婚」という単語を含む関連検索語としては「結婚」、「結婚情報会社」、「結婚準備」、「結婚費用」、「結婚祝いプレゼント」、「結婚式場」、「結婚式ファッション」などがあり、「結婚」という単語の類義語に関連する関連検索語としては「ウェディング撮影」、「婚姻届」などがある。このような多数の単語が、「結婚」に関連する検索語候補になれる。
【0045】
候補検索語提供部131は、検索された多数の検索語候補を、伝送部133を介してインターフェース部120へ伝達し、インターフェース部120は、クライアント20の検索サービス利用の際に検索入力ウィンドウに前記導出した多数の検索語候補がドロップダウンメニューとして提示されるように検索インターフェースをクライアント20へ提供し、クライアント20は、提示された検索語候補の中から自分の所望する単語(例えば、「結婚式場」)を選択することができる。
【0046】
推奨検索語提供部132は、候補検索語提供部131で提供した多数の検索語候補の中から、クライアント20で特定されたいずれか一つの検索語に対して、セマンティックデプスDB150に基づいて、検索語に関連するセマンティックデプス段階別推奨検索語を導出する。このために、推奨検索語提供部132は、セマンティックデプスDB150に格納された多数の検索語を所定の関連モデルアルゴリズムに従って類似キーワードでクラスタリングする作業を行い、多数の類似キーワードをキーワードの特性によって一つ以上のディレクトリに分類する作業を行う。
【0047】
例えば、推奨検索語提供部132は、候補検索語提供部131で提供した多数の検索語候補の中からユーザが選択した特定の検索語「結婚式場」と同一のセマンティックデプス段階に属する多数のディレクトリ別推奨検索語(例えば、教会結婚式、聖堂結婚式、ホテル結婚式、ハウスウェディングなど)を提供することができる。この際、提示される推奨検索語は、該当セマンティックデプスにおいてディレクトリ別に代表できる代表検索語であるといえる。
【0048】
同様に、推奨検索語提供部132は、検索された多数の検索語候補を伝送部133を介してインターフェース部120へ伝達し、インターフェース部120は、クライアント20の検索サービス利用の際に検索入力ウィンドウにセマンティックデプス段階別に導出された多数のディレクトリ別推奨検索語がドロップダウンメニューとして提示されるように検索インターフェースをクライアント20へ提供し、クライアント20は、提示された推奨検索語の中から自分の所望する検索語を選択することができる。
【0049】
すなわち、ディレクトリ別推奨検索語は、セマンティックデプス段階に基づいて上位段階から下位段階へユーザの選択する推奨検索語に応じて様々に提供できる。
【0050】
ひいては、セマンティックデプスエンジン130は、検索DB140およびセマンティックデプスDB150に基づいて入力される検索語に応じて、リアルタイムに関連検索語の導出からセマンティックデプス構造を生成することもでき、生成した検索語別セマンティックデプス構造をセマンティックデプスDB150に格納し、追って同一の検索語入力の際に活用するようにDB構築を行うことができる。
【0051】
また、推奨検索語提供部132は、それぞれのディレクトリ別推奨検索語に関連する基本類義語を検索し、検索された基本類義語を所定の文字列マッチング技法を用いて類義語拡張により推奨検索語の数を増加させることができる。
【0052】
検索エンジン170は、セマンティックデプスエンジン130で行う検索動作およびユーザによって選択される特定の検索語に関連する一つ以上のコンテンツをコンテンツDB160に基づいて検索してクライアント20へ提供する。
【0053】
制御部180は、セマンティックデプスエンジン130および検索エンジン170を始めとして検索語提示システム10の機能別動作を制御する。
【0054】
また、本発明に係る検索語提示システム10は、全ての単語に対して類義語、反義語、派生語などの情報が共に関連して格納される国語辞典DB190をさらに含むことができる。セマンティックデプスエンジン130は、検索DB140およびセマンティックデプスDB150に基づいて所定の検索語を検索するとともに、国語辞典DB190からも特定の検索語の類義語などを追加的にさらに検索することができる。
【0055】
このように、図1に示した検索語提示システム10でユーザが入力した検索語に基づいて類義語を処理する作業について、図2および図3を参照して説明する。
【0056】
図2は本発明の実施態様に係る検索語提示システムで一実施例による類義語拡張技法を用いて検索語を導出する過程を示す図である。
【0057】
図1で上述したセマンティックデプスエンジン130は、検索DB140またはセマンティックデプスDB150に基づいて、ユーザによって入力された所定の検索語に関連する一つ以上の基本類義語を検索し、検索された基本類義語と文字列マッチング技法を用いて一つ以上の拡張類義語を生成することができる。
【0058】
すなわち、図2に示すように、セマンティックデプスエンジン130の推奨検索語提供部132は、一つ以上のディレクトリ別推奨検索語201の中から、ユーザが選択した特定の推奨検索語に基づいて、一つ以上の基本類義語202を検索DB140またはセマンティックデプスDB150に基づいて導出することができる。そして、推奨検索語201および基本類義語202から、単語別に区分して共通の接頭辞または接尾辞203を除いた残りの単語204を交替可能な単語として分類し、推奨検索語と基本類義語間の文字列マッチング技法を適用して拡張された類義語205を導出する。
【0059】
例えば、最初ユーザが入力した「結婚」という単語に関連するディレクトリ別推奨検索語として「プロポーズ」、「プロポーズイベント」、「プロポーズ場所」などがあれば、このうち「プロポーズイベント」の類義語として「求婚イベント」という検索語を導出することができる。この際、推奨検索語提供部132は、類義語拡張技法によって、推奨検索語および類義語から、単語別に区分して交替可能な全ての単語を抽出する。すなわち、「プロポーズイベント」と「求婚イベント」という推奨検索語201および基本類義語202において、「イベント」は共通接尾辞203であって除去対象になれる。そして、別の推奨検索語「プロポーズ場所」を対象として、「プロポーズ」の類義語である「求婚」という単語を、文字列マッチング技法によって、「求婚場所」という拡張された類義語205として再生成することができる。
【0060】
図3は、本発明の実施態様に係る検索語提示システムで、他の実施例による類義語拡張技法を用いて検索語を導出する過程を示す図である。
【0061】
図1で上述したセマンティックデプスエンジン130は、検索DB140またはセマンティックデプスDB150に基づいて検索語の形態素を解析し、解析による形態素解析結果および国語辞典DB190の類義語辞典を用いて一つ以上の拡張類義語を生成することができる。
【0062】
図3を参照すると、セマンティックデプスエンジン130は、特定の検索語に対応する全てのディレクトリ別推奨検索語に対して形態素解析器を用いて単語別分類(segmentation)、および分類された単語別カウンティング(counting)を行って第1リスト301を構成する。「結婚」という検索語を始めとして数多くのディレクトリ別推奨検索語を分類した結果、「ウェディング」、「スタジオ」、「ソウル」、「メークアップ」、「ヘア」という形態素別にカウントされてリスト化されると、それぞれの形態素のうちカウンティング個数条件に応じて上位k個の形態素に対して国語辞典DB190による類義語を検索してマッチングさせた第2リスト302を構成する。
これにより、「ヘア」の類義語たる「髪」、「ハネムーン」の類義語たる「新婚旅行」が検索でき、検索された類義語を基盤として文字列マッチング技法を適用して「付き添い+ヘア」という推奨検索語303から、「ヘア」の類義語たる「髪」を使用した「付き添い+髪」という基本類義語304を導出し、「ハネムーン+カップルルック」という推奨検索語305から、「ハネムーン」の類義語として「新婚旅行」を使用した「新婚旅行+カップルルック」という拡張類義語306を導出することができる。
【0063】
次に、本発明の実施態様に係る検索語提示システムで、関連検索語リストを類似したキーワードでクラスタリングする作業について説明する。
【0064】
クラスタリング技術としては様々な技法を使用することができ、本発明では一例として階層的クラスタリング(Hierarchical Clustering)技法と接辞クラスタリング(Affix Clustering)技法を用いるようにする。
【0065】
階層的クラスタリング技法は、最小距離(minimum distance)を用いて、最短に隣接したクラスターをグルーピングする技法であって、文字列間の距離を用いて類似度を測定し、或いは意味基盤の文字列距離を計算する。意味基盤の文字列距離の計算は代表同義語で該当検索語を代替して編集距離を計算する。
【0066】
接辞クラスタリング技法は、接頭辞または接尾辞情報を用いてキーワード別にグルーピングする技法である。
【0067】
以下、図4を参照して、クラスタリング技法を用いた推奨検索語分類処理過程について説明する。
【0068】
図4は本発明の実施態様に係る検索語提示システムで、検索語に関連するセマンティックデプス別推奨検索語をディレクトリ別に分類する過程の一例を示す手続き流れ図である。
【0069】
図4を参照すると、セマンティックデプスエンジン130は、クライアント20から所定の検索語が入力されると(S401)、入力されたキーワードに基づいて多数の関連検索語を導出し、導出された関連検索語からなるキーワードリストを構成する(S402)。
【0070】
この際、関連検索語としては、上述した方式に従って、検索語に関連する基本類義語だけでなく拡張類義語も追加的に検索できる。
【0071】
その後、セマンティックデプスエンジン130は、キーワードリストに基づいて階層的クラスタリング技法を用いて1次検索語グルーピングを行う(S403)。
【0072】
例えば、階層的クラスタリング技法は、単語間の最小距離(minimum distance)を用いて、最短に隣接したクラスターをグルーピングする技法であって、文字列間の距離を用いて類似度を測定し或いは意味基盤の文字列距離を計算する方式を用いることができる。
【0073】
文字列間の編集距離の計算は、入力された2文字列の類似した情報を計算する方式であって、下記に示す数1の類似度計算式を用いる。
【0074】
【数1】
【0075】
前記数1を参照すると、2つの検索語(i、j)に対して、類似した情報を計算する方式で意味基盤の文字列類似度を計算し、所定の類似度基準値を満足する場合、2つの検索語を同一のグループにグルーピングする。この際、類似度の計算のために各検索語を構成する単語は、該当単語のディレクトリに与えられるコードを用いてコード間の距離で数値化することができる。
【0076】
これに対し、意味基盤の文字列距離の計算は、国語辞典DB190に基づいて代表同義語を予め検索し、代表同義語に対する置換によって代表語で該当検索語を代替して編集距離を計算する方式であって、入力された2文字列の類似度情報を計算する。例えば、「ブサン結婚式」に対して単語の特性では類義語として認められない「デゾン結婚式」または「ソウル結婚式」に対して、「結婚式」という共通単語と「地域名」を示す単語との組み合わせとして捉えることにより、「ブサン結婚式」、「デゾン結婚式」、「ソウル結婚式」は類義語として取り扱われる。これについては図5を参照して後述する。
【0077】
階層的クラスタリング技法による1次検索語グルーピングの完了の際に、セマンティックデプスエンジン130は、キーワードリストに含まれた多数のキーワードの接頭辞または接尾辞情報を用いて、同一の接頭辞を使用するキーワードを同一のグループにグルーピングする接辞クラスタリング方式基盤の2次検索語グルーピングを行う(S404)。
【0078】
さらに図4を参照すると、セマンティックデプスエンジン130は、階層的クラスタリング方式の1次検索語グルーピング作業および接辞クラスタリング方式の2次検索語グルーピング作業を行った結果、キーワードリストのうち、いかなるディレクトリグループにもグルーピングされていないキーワードを別途のグループにグルーピングする3次検索語グルーピング過程を行う(S405)。
下記表1は、図4で説明された検索語グルーピング過程に従って関連検索語リストからクラスタリング作業を行った結果を示す。
【0079】
【表1】
【0080】
前記表1を参照すると、クライアント20から伝送された検索語データが「教会結婚式」である場合、セマンティックデプスエンジン130は、上述した本発明の実施態様に係る類義語拡張技法によって、該当検索語に関連する候補検索語、基本類義語、拡張類義語などからなる関連検索語リストを構成することができる。
【0081】
関連検索語リストに基づいて、階層的クラスタリング方式の意味基盤の類似度計算によって、「教会結婚式」を行うために必要な情報からなる第1グループ(教会結婚式の費用、教会結婚式の準備)と、地域別教会結婚式を準備するための第2グループ(ブサン教会の結婚式、デゾン教会の結婚式、チョンアン教会の結婚式、ウルサン教会の結婚式、スウォン教会の結婚式)に1次検索語グルーピングを行うことができる。
【0082】
次いで、関連検索語リスト上で、接辞クラスタリング方式の共通接頭辞または共通接尾辞で一つ以上の検索語を同一のグループにグルーピングする2次検索語グルーピングを行うが、前記表1では「野外」という接頭辞を共通とする第3グループ(野外結婚式、野外結婚)を構成することができる。
【0083】
階層的クラスタリング方式および接辞クラスタリング方式によるグルーピング過程を行った後、残った検索語を第4グループ(聖堂結婚式、教会結婚式の推薦、ホテルウェディング、出張ビュッフェ、伝統婚礼、ハウスウェディング)にグルーピングすることができる。
【0084】
さらに図4を参照すると、セマンティックデプスエンジン130は、多様な方式でグルーピングを行ったならば、各グループに属する検索語と前記段階S401でユーザが入力した検索語間のセマンティックデプスを分析し、検索語のセマンティックデプス別上位グループを構成する(S406)。すなわち、前記数1で上述したように2単語間の意味上の最小距離を計算する方式を用いて、特定の検索語を基準として、該当検索語に関連するグループ別検索語との距離を計算し、一定の範囲に属する多数の検索語グループを同一のセマンティックデプスに属する上位グループとして再構成することができる。これについては図8を参照して後述し、その実施態様は図9に例示してある。
【0085】
上位グルーピング作業を行うと、セマンティックデプスエンジン130は、ユーザが入力した検索語データを基準として、最終的に同一のセマンティックデプス段階に属する多数のディレクトリ別検索語グループから、各グループを代表する代表検索語を選択し、推奨検索語として提示する推奨検索語リストを構成して提供する(S407)。
【0086】
セマンティックデプス別の多数の推奨検索語リストは、検索インターフェースを介してクライアント20へ提供され、検索語入力ウィンドウでドロップダウンメニューとして提供できる。
【0087】
図4で上述したクラスタリング方式を用いたディレクトリ別推奨検索語グルーピング過程は、図5および図6を参照してより詳細に説明する。
【0088】
図5は、本発明の実施態様に係る階層的クラスタリング方式を用いた意味基盤の文字列類似度計算方式の一例を示す図である。
【0089】
図5を参照すると、単語の意味を基盤として「地域」を意味する単語と「結婚式」という単語との組み合わせからなる検索語が入力された場合、地域を示す単語と、意味的に異なる地域を示す単語とに対して、該当検索語の類義語としての類似度を計算することができる。図5に例示されているように、例えば、韓国の場合、「ブサン結婚式」という検索語に対して、「ブサン」という地域名称に対するコード(_h55pva)によって国内地域および国外地域に分類し、国内地域の他の単語「ソウル」、「デク」、「デゾン」、「グァンジュ」などを同義語として辞典探索することができる(S501)。
【0090】
ここで、「ブサン結婚式」と「デゾン結婚式」に対して、地域を示す「ブサン」と「デゾン」を、国内地域を意味するコード(_h55pva_)で代替する(S502)。2つの検索語間の共通する単語「結婚式」に対しては、別途のコードで代替しなくてもよい。
【0091】
次に、コード化された2つの検索語に対して文字列類似度を計算する(S503)。この際、文字列類似度は、0.0〜1.0の値であって、類似した程度によって類似度値が大きくなる方式で計算することができる。すなわち、2つの検索語間の類似度が小さいほど0に近い値、類似度が大きくなるほど1.0に近い値と計算できる。よって、図5に例示された2つの検索語「ブサン結婚式」と「デゾン結婚式」はいずれも「_h55pva_結婚式」で代替されるので、2つの検索語間の意味基盤の文字列距離は0であり且つ類似度は1.0を満足する。したがって、「ブサン結婚式」と「デゾン結婚式」のように地域別結婚式を示す検索語を同一のディレクトリに1次グルーピングすることができる。
【0092】
このようにデータ検索のためのキーワード(索引語)別にディレクトリを適用する方法は、同義語、下位語、関連語など、関係を示すシソーラス(thesaurus)を使用することができる。シソーラスを用いて検索する方式を包括検索というが、これは使用するキーワードに関わるニュースや記事などの検索資料を最大限多く検索するため、或いはユーザが使用する検索語とDBで使用する検索語との差異を調整して検索効率を高めるための方案として広く用いられる。
【0093】
図6は、本発明の実施態様に係る階層的クラスタリング方式を用いた意味基盤の、文字列類似度計算のための同義語シソーラスの一例を示す図である。
【0094】
図6に例示されているように、地域を示す索引語を一つのディレクトリに分類し、該当索引語のディレクトリ別特性に応じてコードを割り当てることができる。
【0095】
「サギポ」、「ナジュ市」、「サンゾン洞」などの索引語は、韓国における国内地域の名称であって、地域を国内および国外に区分する場合、国内地域を示すディレクトリ601に分類して同一のコード(h55pva)を割り当てることができる。ディレクトリが海外地域602である場合には、下位ディレクトリとして国名ディレクトリ602aと海外地域一般ディレクトリ602bに様々なディレクトリを設定し、それぞれに符合するコードh55vktvzt、h55vktbhqに割り当てることができる。
【0096】
図6に例示されている他の例として、上位ディレクトリとして自動車603を設定する場合、自動車モデルに関する下位ディレクトリ603a、自動車製造会社に関する下位ディレクトリ603b、ガソリンスタンド/油価に関する下位ディレクトリ603cなど、自動車に関連するキーワードに対して多数の下位ディレクトリを設定し、それぞれに符合するコードを割り当てることができる。
【0097】
このように、同一のコードが割り当てられた検索語は、同義語として看做すことができ、同一のディレクトリ推奨検索語として検索インターフェースを介してユーザに提供できる。例えば、「ショッピング」という上位ディレクトリにおける「ショッピング場所」に関連する下位ディレクトリには地域別デパート、免税店、プラザなどの索引語が含まれ、最終同義語として関連キーワードと共に提供できる。
【0098】
図7は、本発明の実施態様に係る接辞クラスタリング方式を用いた検索語グルーピングの一例を示す図である。
【0099】
図7を参照すると、キーワードリストに含まれた単語に対して接尾辞または接頭辞の形態を解析し、同一の接尾辞または接頭辞を含むキーワードを同一のグループにグルーピングすることができる。例示の如く、キーワードリスト701における、「六角脳枕」、「キング枕」、「粟枕」、「オーガニックベビー枕」、「パコラバンヌベビー枕」などの「枕」の種類または形態を示す接尾辞を含むキーワード702は、「枕」という共通の接尾辞703を使用するので、同一のディレクトリにグルーピングすることができる。
【0100】
図8は、本発明の実施態様に係る検索語提示システムで導出する検索語のセマンティックデプス構造の一例を示す図である。
【0101】
図8を参照すると、ユーザが入力した特定の検索語801を基準として、意味上の文字距離(すなわち、セマンティックデプスの程度)の計算によって複数の関連検索語を多数のデプス別上位グループと、各デプスを構成するディレクトリ別下位グループにグルーピングすることにより、デプスツリー構造を構成することができる。ここでは、図8に例示されている推奨検索語は、図4で上述したように階層的クラスタリング、接辞クラスタリングおよびその他のグルーピング過程によってディレクトリ別にグルーピングされた多数のグループを代表するものとして抽出された代表検索語であると仮定する。
【0102】
ユーザが入力した特定の検索語801との文字距離が第1範疇dに属する多数の検索語グループ802、803は、同一のセマンティックデプス(第1段階)に分類し、第1段階で提示される第1推奨検索語リストから構成できる。この際、第1段階に属する推奨検索語11(802)乃至推奨検索語1N(803)は、ディレクトリ別に分類された検索語グループであって、同一のセマンティックデプス第1グループにグルーピングされたものである。
【0103】
特定の検索語801との文字距離が第2範疇dに属する多数の検索語グループ804、805は、同一のセマンティックデプス(第2段階)に分類し、第1段階で提示された多数の推奨検索語のうちいずれか一つの検索が要請されると、次に第2段階で提示される第2推奨検索語リストから構成できる。この際、第2段階のセマンティックデプス範疇に含まれるそれぞれの検索語グループは、第1段階の検索語グループとの一定の距離d12を満足するグループにグルーピングすることもできる。同様に、第2段階に属する推奨検索語21(804)乃至推奨検索語2M(805)は、ディレクトリ別に分類された検索語グループであって、同一のセマンティックデプス第2グループにグルーピングされたものである。
【0104】
特定の検索語801との文字距離が第3範疇dに属する多数の検索語グループ806、807は、同一のセマンティックデプス(第3段階)に分類し、第2段階で提示された多数の推奨検索語のうちいずれか一つの検索が要請されると、次に第3段階で提示される第3推奨検索語リストから構成できる。この際、第3段階のセマンティックデプス範疇に含まれるそれぞれの検索語グループは、第2段階の検索語グループとの一定の距離d23を満足するグループにグルーピングすることもできる。同様に、第3段階に属する推奨検索語31(806)乃至推奨検索語3L(807)は、ディレクトリ別に分類された検索語グループであって、同一のセマンティックデプス第3グループにグルーピングされたものである。
【0105】
図9は、本発明の実施態様に係る検索語提示システムで提案する、ディレクトリ別推奨検索語サービスが提供される形態の一例を示す図である。
【0106】
図9を参照すると、本発明の実施態様に係るセマンティックデプスエンジン130は、「ワイン」という検索語に基づいて、これに関連する全てのキーワード(基本類義語および拡張類義語を含む)を検索DB140、セマンティックデプスDB150およびコンテンツDB160から導出することによりキーワードリストを構成し、キーワードリストに対して、図4で上述した方式のディレクトリグルーピングを行った結果、最終的なディレクトリ別検索語リストを含む検索結果画面900を構成して提供することができる。
【0107】
これにより、Webページ上の検索ウィンドウ901に検索キーワード「ワイン」が入力される場合、「ワイン分類」、「ワインの肴」、「ワイナリー」、「ワイン保管」、「ワイン祭り」、「ワイン試飲」などの同一セマンティックデプス段階に属する多数のディレクトリ別推奨検索語からなる第1推奨検索語リスト902を構成して検索結果画面900上に出力することができる。第1推奨検索語リスト902上に例示されているそれぞれの推奨検索語は、上位デプスであって、デプス段階によって下位ディレクトリ推奨検索語に細かく分けて段階的に提供できる。
【0108】
図10は、本発明の実施態様に係る検索語提示システムで提案する、セマンティックデプス別推奨検索語サービスが提供される形態の他の例を示す図である。
【0109】
図10の(a)を参照すると、本発明の実施態様に係るセマンティックデプスエンジン130は、検索ウィンドウに入力された検索キーワード「結婚」1001に基づいて、多数の上位ディレクトリ別推奨検索語からなる第1推奨検索語リスト1002を提供することができる。
【0110】
例えば、「プロポーズ」、「結婚費用」、「結婚日付」、「結婚式場」、「結婚祝いプレゼント」、「ブライダルシャワー」などが、セマンティックデプス第1段階に属するディレクトリ別推奨検索語に該当する。すなわち、結婚に関連する全ての検索リストを「推奨検索語」として提供し、ユーザが状況に応じて必要な検索語を選択することができるように検索条件を様々に提供することができる。
【0111】
図10の(b)は、(a)で提供されたセマンティックデプス1段階の第1推奨検索語リスト1002上でユーザが選択した特定の推奨検索語に関連するセマンティックデプス第2段階の第2推奨検索語リスト1004の一例を示す。
【0112】
例えば、ユーザが第1推奨検索語リスト1002上で「結婚式場」を検索語として選択した場合、セマンティックデプスエンジン130は、検索ウィンドウに検索キーワード「結婚式場」1003が入力されたと仮定し、「結婚式場」1003と関連のある「結婚式場の推薦」、「結婚式場の費用」、「結婚式場の予約」などの第2推奨検索語リスト1004を提供することができる。同様に、第2推奨検索語リスト1004上に例示されたそれぞれの推奨検索語は、それぞれ一つ以上の下位段階のデプスに属するディレクトリ別推奨検索語に分けて提供できる。
【0113】
図10の(c)は、(b)で提供された第2推奨検索語リスト1004上でユーザが選択した「結婚式場の推薦」という検索語に関連するセマンティックデプス第3段階の第3推奨検索語リスト1006の一例を示す。
【0114】
例えば、ユーザが第2推奨検索語リスト1004上で「結婚式場の推薦」を検索語として選択した場合、セマンティックデプスエンジン130は、検索ウィンドウに検索キーワード「結婚式場の推薦」1005が入力されたと仮定し、「結婚式場の推薦」という検索語に基づいて、「聖堂結婚式」、「野外結婚式」、「ホテルウェディング」、「ウェディングホール」など、場所的特徴によってグルーピングされた推奨検索語からなる第3推奨検索語リスト1006を構成して提供することができる。
【0115】
以上、本発明の実施態様に係る検索語提示システムによれば、ユーザが入力した最初の検索データに基づいて、該当検索語に関連する主題別ディレクトリ推奨検索語を予め提供することにより、ユーザの検索上の便宜性および情報収集の多様性を提供することができる。
【0116】
以上の説明は、本発明の技術思想を例示的に説明したものに過ぎず、本発明の属する技術分野における通常の知識を有する者であれば、本発明の本質的な特性から外れない範囲で様々な修正および変形が可能であろう。よって、本発明に記載された実施態様は、本発明の技術思想を限定するためのものではなく、説明するためのものである。これらの実施態様によって本発明の技術思想が限定されるのではない。本発明の保護範囲は以下の請求の範囲によって解釈されるべきであり、それと同等な範囲内にある全ての技術思想は本発明の権利範囲に含まれるものと解釈されるべきである。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10