(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022068101
(43)【公開日】2022-05-09
(54)【発明の名称】検索クエリの意図を反映した検索結果提供の方法及びシステム
(51)【国際特許分類】
G06F 16/338 20190101AFI20220426BHJP
G06F 16/335 20190101ALI20220426BHJP
【FI】
G06F16/338
G06F16/335
【審査請求】有
【請求項の数】20
【出願形態】OL
(21)【出願番号】P 2021144415
(22)【出願日】2021-09-06
(31)【優先権主張番号】10-2020-0136696
(32)【優先日】2020-10-21
(33)【優先権主張国・地域又は機関】KR
【新規性喪失の例外の表示】新規性喪失の例外適用申請有り
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.BLUETOOTH
2.ZIGBEE
(71)【出願人】
【識別番号】505205812
【氏名又は名称】ネイバー コーポレーション
【氏名又は名称原語表記】NAVER Corporation
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100135079
【弁理士】
【氏名又は名称】宮崎 修
(72)【発明者】
【氏名】パク チャンフン
(72)【発明者】
【氏名】イ ジヒョン
(72)【発明者】
【氏名】イ ユンドン
(72)【発明者】
【氏名】パク ジヒョン
(72)【発明者】
【氏名】キム ウンジン
(72)【発明者】
【氏名】パク フィホ
(72)【発明者】
【氏名】パク ソラ
(72)【発明者】
【氏名】ホ アヨン
(72)【発明者】
【氏名】キム ジンヒ
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175HA01
5B175JC05
(57)【要約】 (修正有)
【課題】少なくとも一つのプロセッサにより遂行される検索クエリの意図を反映した検索結果提供方法、コンピュータプログラム及び検索結果提供システムを提供する。
【解決手段】検索クエリの意図を反映した検索結果提供方法であって、ユーザ端末から検索クエリを受信するステップと、検索クエリから抽出された一つ以上のクエリ意図に基づき、検索クエリに対する一つ以上のクエリパターンタイプを決定するステップと、一つ以上のクエリパターンタイプに基づき、検索クエリと関連した複数のコンテンツの各々のランキングを決定するステップと、を含む。
【選択図】
図6
【特許請求の範囲】
【請求項1】
少なくとも一つのプロセッサにより遂行される検索クエリの意図を反映した検索結果提供方法において、
ユーザ端末から検索クエリを受信するステップ;
前記検索クエリから抽出された一つ以上のクエリ意図に基づき、前記検索クエリに対する一つ以上のクエリパターンタイプを決定するステップ;及び、
前記一つ以上のクエリパターンタイプに基づき、前記検索クエリと関連した複数のコンテンツの各々のランキングを決定するステップを含む、クエリ意図を反映した検索結果提供方法。
【請求項2】
前記検索クエリから抽出された一つ以上のクエリ意図に基づき、前記検索クエリに対する一つ以上のクエリパターンタイプを決定するステップは、
前記検索クエリに含まれた一つ以上のキーワードにより、前記検索クエリから前記一つ以上のクエリ意図を抽出するステップ;及び、
前記一つ以上のクエリ意図に対する一つ以上のクエリパターンタイプを決定するステップを含む、請求項1に記載のクエリ意図を反映した検索結果提供方法。
【請求項3】
前記検索クエリから抽出された一つ以上のクエリ意図に基づき、前記検索クエリに対する一つ以上のクエリパターンタイプを決定するステップは、
自然言語処理により前記検索クエリから一つ以上のクエリ意図を抽出するステップ;及び、
前記一つ以上のクエリ意図に対する一つ以上のクエリパターンタイプを決定するステップを含む、請求項1に記載のクエリ意図を反映した検索結果提供方法。
【請求項4】
前記一つ以上のクエリパターンタイプは、一つ以上のビットで表現され、
前記一つ以上のビットは、前記複数のコンテンツのランキングを決定するのに加重値を付与する要素である一つ以上のランキングファクターと予めマッチングされる、請求項1乃至3の何れか一項に記載のクエリ意図を反映した検索結果提供方法。
【請求項5】
前記一つ以上のクエリパターンタイプに基づき、前記検索クエリと関連した複数のコンテンツの各々のランキングを決定するステップは、
前記一つ以上のランキングファクターに基づき、前記検索クエリと関連した複数のコンテンツの各々のランキング点数を算出するステップ;及び、
前記複数のコンテンツの各々のランキング点数に基づき、前記検索クエリと関連した複数のコンテンツの各々のランキングを決定するステップを含む、請求項4に記載のクエリ意図を反映した検索結果提供方法。
【請求項6】
前記複数のコンテンツのクエリパターンタイプをラベル付けするステップをさらに含み、
前記一つ以上のランキングファクターに基づき、前記検索クエリに対する複数のコンテンツの各々のランキング点数を算出するステップは、
前記複数のコンテンツのクエリパターンタイプ及び前記一つ以上のランキングファクターに基づき、前記検索クエリに対する複数のコンテンツの各々のランキングを決定するステップを含む、請求項5に記載のクエリ意図を反映した検索結果提供方法。
【請求項7】
前記複数のコンテンツのクエリパターンタイプをラベル付けするステップは、
前記複数のコンテンツに含まれたテキスト、テキスト構造、添付ファイル及びイメージの少なくとも一つに基づいて決定されたクエリパターンタイプをラベル付けするステップを含む、請求項6に記載のクエリ意図を反映した検索結果提供方法。
【請求項8】
前記決定されたランキングに基づき、前記検索クエリと関連した複数のコンテンツの少なくとも一つ以上のコンテンツを、前記ユーザ端末を通じて出力するステップをさらに含む、請求項1乃至7の何れか一項に記載のクエリ意図を反映した検索結果提供方法。
【請求項9】
前記複数のコンテンツの各々から少なくとも一つ以上のスニペットを抽出するステップをさらに含む、請求項1乃至8の何れか一項に記載のクエリ意図を反映した検索結果提供方法。
【請求項10】
前記複数のコンテンツの各々から少なくとも一つ以上のスニペットを抽出するステップは、
前記複数のコンテンツの各々に含まれたテキスト、テキスト構造、添付ファイル及びイメージの少なくとも一つを解析して、複数のコンテンツの各々から少なくとも一つ以上のスニペットを抽出するステップを含む、請求項9に記載のクエリ意図を反映した検索結果提供方法。
【請求項11】
前記複数のコンテンツの各々に含まれたテキスト、テキスト構造、添付ファイル及びイメージの少なくとも一つを解析して、複数のコンテンツの各々から少なくとも一つ以上のスニペットを抽出するステップは、
前記複数のコンテンツの各々に含まれたテキスト、テキスト構造、添付ファイル及びイメージの少なくとも一つに基づいて決定された複数のコンテンツの各々のクエリパターンタイプと関連した一つ以上のスニペットを抽出するステップを含む、請求項10に記載のクエリ意図を反映した検索結果提供方法。
【請求項12】
前記決定されたランキングに基づき、前記検索クエリに関連した複数のコンテンツの少なくとも一つ以上のコンテンツのスニペットを、前記ユーザ端末を通じて出力するステップをさらに含む、請求項1乃至8の何れか一項に記載のクエリ意図を反映した検索結果提供方法。
【請求項13】
前記複数のコンテンツの各々のクエリパターンタイプと関連した一つ以上のスニペットを抽出するステップをさらに含み、
前記決定されたランキングに基づき、前記検索クエリに関連した複数のコンテンツの少なくとも一つ以上のコンテンツのスニペットを、前記ユーザ端末を通じて出力するステップは、
前記一つ以上のスニペットのうち、前記一つ以上のクエリパターンタイプと関連したスニペットを、前記ユーザ端末を通じて出力するステップを含む、請求項12に記載のクエリ意図を反映した検索結果提供方法。
【請求項14】
前記一つ以上のスニペットのうち、前記一つ以上のクエリパターンタイプと関連したスニペットを、前記ユーザ端末を通じて出力するステップは、
前記一つ以上のクエリパターンタイプに対し、既定の優先順位によって前記一つ以上のスニペットの少なくとも一部を、前記ユーザ端末を通じて出力するステップを含む、請求項13に記載のクエリ意図を反映した検索結果提供方法。
【請求項15】
前記決定されたランキングに基づき、前記検索クエリと関連した複数のコンテンツの少なくとも一つ以上のコンテンツのスニペットを、前記ユーザ端末を通じて出力するステップは、
前記スニペットにおいて、前記一つ以上のクエリパターンタイプと関連した一部領域を強調して出力するステップを含む、請求項12に記載のクエリ意図を反映した検索結果提供方法。
【請求項16】
前記スニペットにおいて、前記一つ以上のクエリパターンタイプと関連した一部領域を強調して出力するステップは、
前記スニペットにおいて、前記一つ以上のクエリパターンタイプと関連した一部領域を、太字体処理及びバックグラウンド処理の少なくとも一つにより強調して出力するステップを含む、請求項15に記載のクエリ意図を反映した検索結果提供方法。
【請求項17】
請求項1乃至16の何れか一項に記載のクエリ意図を反映した検索結果提供方法をコンピュータで実行するためにコンピュータ読み取り可能なコンピュータプログラム。
【請求項18】
検索クエリの意図を反映した検索結果提供システムにおいて、
通信モジュール;
メモリ;及び、
前記メモリと連結され、前記メモリに含まれたコンピュータ読み取り可能な少なくとも一つのプログラムを実行するように構成された少なくとも一つのプロセッサを含み、
前記少なくとも一つのプログラムは、ユーザ端末から検索クエリを受信し、前記検索クエリから抽出された一つ以上のクエリ意図に基づき、前記検索クエリに対する一つ以上のクエリパターンタイプを決定し、前記一つ以上のクエリパターンタイプに基づき、前記検索クエリと関連した複数のコンテンツの各々のランキングを決定するための命令語を含む、クエリ意図を反映した検索結果提供システム。
【請求項19】
前記少なくとも一つのプログラムは、前記複数のコンテンツのクエリパターンタイプをラベル付けするための命令語を含む、請求項18に記載のクエリ意図を反映した検索結果提供システム。
【請求項20】
前記少なくとも一つのプログラムは、前記複数のコンテンツの各々に対する少なくとも一つ以上のスニペットを抽出するための命令語を含む、請求項18又は19に記載のクエリ意図を反映した検索結果提供システム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、検索クエリ(query)の意図を反映した検索結果提供の方法及びシステムに関し、具体的には、検索クエリから抽出されたクエリ意図に対応するコンテンツ及びスニペット(snippet)を提供する方法及びシステムに関する。
【背景技術】
【0002】
スマートフォンなどのようなモバイル機器の拡散及びインターネットの発達に伴い、ユーザなどは、日常生活で容易且つ迅速に所望の検索結果を得るために、検索機能付きアプリケーションで検索語を入力し、それに従う検索結果により多様なコンテンツに接することができる。ユーザが検索語を入力すれば、検索システムは、検索語から抽出したキーワードを含むコンテンツをデータベースから抽出して検索結果として提供する。このような検索システムは、検索語及びコンテンツ間のキーワードマッチング度合によってコンテンツのランキングを決定し、決定されたランキングによってコンテンツを配列してユーザに提供できる。換言すれば、検索語に対してキーワードマッチング度合の高いコンテンツが上位にランク(rank)されることで、キーワードマッチング度合の高いコンテンツをユーザに優先的に提供できる。
【0003】
このとき、ユーザは、特定の情報及びコンテンツを提供されるための明確な意図を持って検索語が入力できる。従来の検索結果提供方法の場合、検索語とのキーワードマッチング度合によってコンテンツのランキングを決定し、決定されたランキングに基づいてコンテンツを提供するので、検索結果がユーザの検索意図を正確に反映できないという問題点がある。従って、ユーザは、自分の検索意図を充足させるコンテンツを検索するために、検索結果として出力されるコンテンツを逐一確認するか、又は、他のキーワードの組合せてを用いて再検索しなければならないという不便さがある。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】韓国登録特許第10-1503713号
【発明の概要】
【発明が解決しようとする課題】
【0005】
本開示は、前記問題点を解決するためになされたもので、検索クエリの意図を反映した検索結果提供方法、コンピュータ読み取り可能なコンピュータプログラム及び装置(システム)を提供する。
【課題を解決するための手段】
【0006】
本開示は、方法、装置(システム)又はコンピュータ読み取り可能なコンピュータプログラムを含む多様な方式により具現化できる。
【0007】
本開示の一実施例に係る少なくとも一つのプロセッサにより遂行される検索クエリの意図を反映した検索結果提供方法は、ユーザ端末から検索クエリを受信するステップ、検索クエリから抽出された一つ以上のクエリ意図に基づき、検索クエリに対する一つ以上のクエリパターンタイプを決定するステップ、及び、一つ以上のクエリパターンタイプに基づき、検索クエリと関連した複数のコンテンツの各々のランキングを決定するステップを含む。
【0008】
本開示の一実施例に係るクエリ意図を反映した検索結果提供方法をコンピュータで実行するために、コンピュータ読み取り可能なコンピュータプログラムが提供される。
【0009】
本開示の一実施例に係る検索クエリの意図を反映した検索結果提供システムは、通信モジュール、メモリ及びメモリと連結され、メモリに含まれたコンピュータ読み取り可能な少なくとも一つのプログラムを実行するように構成された少なくとも一つのプロセッサを含み、少なくとも一つのプログラムは、ユーザ端末から検索クエリを受信し、検索クエリから抽出された一つ以上のクエリ意図に基づき、検索クエリに対する一つ以上のクエリパターンタイプを決定し、一つ以上のクエリパターンタイプに基づき、検索クエリと関連した複数のコンテンツの各々のランキングを決定するための命令語を含む。
【発明の効果】
【0010】
本開示の多様な実施例によれば、ユーザにより入力された検索クエリからクエリ意図を把握し、クエリ意図に合致するランキングファクター(ranking factor)を動的に適用してコンテンツを順位化(rank)することで、ユーザのニーズ(needs)に合致するコンテンツを優先的に提供できる。すなわち、ユーザは、検索結果として、単純に検索クエリのキーワードとマッチングされるコンテンツではなく、ユーザのクエリ意図に対応するコンテンツを優先的に得ることができる。
【0011】
本開示の多様な実施例によれば、クエリ意図別に対応するスニペットを予め抽出し、ユーザにより検索クエリが入力される場合、検索クエリのクエリ意図に合致するスニペットをリアルタイムで選択して、ユーザに提供できる。したがって、ユーザは、コンテンツの本文において、単純に画一的に検索クエリに対してキーワードマッチングされる部分を含むスニペットではなく、ユーザのクエリ意図に対応する一部分、すなわち、ユーザが実際に所望する対象情報及びコンテンツが含まれた部分を含むスニペットを得ることができる。
【0012】
本開示の多様な実施例によれば、コンテンツのテキストだけでなく、文書内容、テキスト構造、添付ファイル及びイメージなどを分析/解析するので、検索クエリのクエリ意図に合致するコンテンツ及びスニペットをより正確に抽出できる。
【0013】
本開示の多様な実施例によれば、スニペットにおいてクエリ意図に対応する領域が強調されるので、ユーザは可読性が高いスニペットを得ることができる。
【図面の簡単な説明】
【0014】
本開示の実施例は、以下の添付図面に基づいて説明する。ここで、類似の参照番号は類似の要素を示すが、これに限定されるものではない。
【
図1】本開示の一実施例に係るユーザ端末の画面を通じてユーザが検索クエリに対する検索結果を得る例を示す図である。
【
図2】本開示の一実施例に係る複数のユーザ端末が情報処理システムと通信可能であるように接続された構成を示す概要図である。
【
図3】本開示の一実施例に係るユーザ端末及び情報処理システムの内部構成を示すブロック図である。
【
図4】本開示の一実施例に係る情報処理システムのプロセッサの詳細ブロック図である。
【
図5】本開示の他の実施例に係る情報処理システムのプロセッサの詳細ブロック図である。
【
図6】本開示の一実施例に係るクエリ意図を反映した検索結果提供方法を示すフローチャットである。
【
図7】本開示の一実施例に係る検索クエリのクエリ意図が反映された検索結果を提供する例を示す図である。
【
図8】本開示の他の実施例に係る検索クエリのクエリ意図が反映された検索結果を提供する例を示す図である。
【
図9】本開示のまた他の実施例に係る検索クエリのクエリ意図が反映された検索結果を提供する例を示す図である。
【
図10】本開示の一実施例に係る検索クエリのクエリ意図によって異なるスニペットを提供する例を示す図である。
【
図11】本開示の一実施例に係る検索クエリのクエリ意図と関連した領域が強調されたスニペットを提供する例を示す図である。
【発明を実施するための形態】
【0015】
以下、本開示の実施のための具体的な内容を添付図面に基づいて詳細に説明する。ただし、以下の説明では、本開示の要旨を不要に不明瞭にする恐れがある場合、公知の機能や構成に関する具体的な説明は省略する。
【0016】
添付図面において、同一又は対応する構成要素には同一の参照符号が付与される。また、以下の実施例の説明において、同一又は対応する構成要素の重複記述は省略され得る。しかしながら、構成要素に関する記述が省略されても、そのような構成要素がある実施例に含まれないものと意図してはならない。
【0017】
開示の実施例の利点及び特徴、そしてそれらを達成する方法は、添付図面に基づいて後述する実施例を参照すれば明確になる。しかしながら、本開示は、以下で開示される実施例に限定されず、互いに異なる多様な形態で具現化され得る。但し、本実施例は、本開示が完全になるようにし、本開示が通常の技術者に発明のカテゴリを正確に認識させるために提供されるだけである。
【0018】
本明細書で使用される用語について簡略に説明し、開示の実施例について具体的に説明する。本明細書で使用される用語は、本開示での機能を考慮しつつ、可能な限り現在広く使用される一般的な用語を選択したが、これは関連分野に従事する技術者の意図又は判例、新技術の出現などにより変化し得る。また、特定の場合は出願人が任意で選定した用語もあり得るが、これらの意味は当該発明の説明の部分において詳細に記載する。よって、本開示で使用される用語は、単純な用語の名称ではなく、その用語が有する意味と本開示の全般にわたった内容に基づいて定義されるべきである。
【0019】
本明細書では、文脈上において明確に特定しない限り、単数の表現は複数の表現を含み、複数の表現は単数の表現を含むことができる。明細書の全般に渡り、ある部分がある構成要素を「含む」とする際、これは特に反対の記載がない限り、他の構成要素を除くものではなく、他の構成要素をさらに含むこともできることを意味する。
【0020】
また、明細書で使用される「モジュール」又は「部(ユニット)」という用語は、ソフトウェアやハードウェア構成要素を意味し、「モジュール」又は「部」はある役割を遂行する。しかしながら、「モジュール」又は「部」はソフトウェアやハードウェアに限定される意味ではない。「モジュール」又は「部」は、アドレッシング可能な保存媒体にあるように構成してもよく、一つ又はそれ以上のプロセッサを再生させるように構成してもよい。したがって、一例として、「モジュール」又は「部」は、ソフトウェア構成要素、オブジェクト指向ソフトウェア構成要素、クラス構成要素、タスク構成要素のような構成要素、並びに、プロセス、関数、属性、プロシージャ、サブルーチン、プログラムコードのセグメント、ドライバー、ファームウェア、マイクロコード、回路、データ、データベース、データ構造、テーブル、アレイ又は変数のうちで少なくとも一つを含むことができる。構成要素と「モジュール」又は「部」は、内部で提供される機能はさらに小さい数の構成要素及び「モジュール」又は「部」で結合されたり、追加的な構成要素と「モジュール」又は「部」にさらに分離されたりできる。
【0021】
本開示の一実施例によれば、「モジュール」又は「部」はプロセッサ及びメモリで具現化され得る。「プロセッサ」は汎用プロセッサ、中央処理装置(CPU)、マイクロプロセッサ、デジタル信号プロセッサ(DSP)、制御器、マイクロ制御器、状態マシンなどを含むように広く解釈されるべきである。いくつかの環境では、「プロセッサ」は特定用途向け半導体(ASIC)、プログラム可能なロジックデバイス(PLD)、フィールドプログラム可能なゲートアレイ(FPGA)等を称することもできる。「プロセッサ」は、例えば、DSPとマイクロプロセッサの組合せ、複数のマイクロプロセッサの組合せ、DSPコアと結合した一つ以上のマイクロプロセッサの組合せ、若しくは、任意の他のそのような構成等の組合せのような処理デバイスの組合せを称することもできる。また、「メモリ」は電子情報を保存可能な任意の電子コンポーネントを含むように広く解釈されるべきである。「メモリ」は、RAM(Random Access Memory)、ROM(Read Only Memory)、NVRAM(Non-Volatile Random Access Memory)、PROM(Programmable Read-Only Memory)、EPROM(Erasable Programmable Read-Only Memory)、EEPROM(Electrically Erasable Programmable Reda-Only Memory)、フラッシュメモリ、磁気又は光学データ保存装置、レジスターなどのようなプロセッサ-読み取り可能な媒体の多様な類型を称することもできる。プロセッサがメモリから情報を読み取り/読み取ったりメモリに情報を記録できる場合、メモリはプロセッサと電子通信状態にあると言われる。プロセッサに集積されたメモリはプロセッサと電子通信状態にある。
【0022】
本開示において、「検索クエリ(search query)」は、検索エンジンを用いて入力及び検索できるテキスト(例えば、キーワード、単語、文句、文章等)を含むことのできるが、これに限定されるものではない。例えば、検索クエリは、ユーザがウェブブラウザ又は検索アプリケーションのような検索プログラムの入力UIを介して入力するテキストを含んだり、ユーザが検索プログラムで提供する検索語リストの何れか一つをクリックにより選択できるテキストを含んだりできる。他の例において、検索語は、テキストに限定されず、イメージ、映像、音声、声などのようなマルチメディアコンテンツから抽出できるテキスト又は情報を含むことができる。
【0023】
本開示において、「クエリ意図」は、ユーザが検索クエリにより検索しようとする目的又は検索クエリにより検索して実質的に得ようとする対象情報を示すことができる。例えば、クエリ意図は、ユーザが入力した検索クエリに含まれたキーワード、単語又は文句の少なくとも一部を通じて表現又は抽出されることができる。例えば、ユーザが「最近流行っている歌」という検索クエリにより検索しようとする目的は、最近(例えば、最近1週間又は1ケ月内)に大衆により聴取又は選択されている歌に関する情報を含むことができる。このようなクエリ意図は、検索クエリに含まれたキーワードらの一つ以上又は当該キーワードと関連した他のキーワード、記号、数字、識別子などで表現されることができる。
【0024】
本開示において、「クエリパターン(query pattern)」は、検索クエリのクエリ意図を示すキーワード又は情報であり得る。例えば、「最近流行っている歌」という検索クエリのクエリパターンは、キーワード「最近」で表現されることができる。また、本開示において、「クエリパターンタイプ(query pattern type)」は、検索クエリのクエリパターンの類型を示す情報又は記号であり得る。例えば、「最近流行っている歌」という検索クエリのクエリパターンである「最近」は、これを表現又は識別できる固有情報又は識別子(例えば、一番目の桁のビットが1で表現された4桁の二進数「0×0001」)で表現されたクエリパターンタイプを有することができる。
【0025】
本開示において、「ランキングファクター(ranking factor)」は、検索クエリに基づいた検索結果等の順位又はランキングを決定する一つ以上の因子を示すことができる。ランキングファクターは、多様な形態のコンテンツ(例えば、テキスト、イメージ又は映像を含むウェブ文書等)を含む検索結果に含まれた検索キーワードの数、検索結果に対するユーザの訪問又はクリックの数、検索キーワードとの連関性などを含むことができるが、これに限定されず、検索結果の順位に影響を及ぼす多様な因子を含むことができる。例えば、検索クエリの「最近流行っている歌」において、クエリ意図を示すキーワードの「最近」と関連したランキングファクターは「最新性」であり得る。したがって、前記検索クエリによる検索結果等の順位又はランキングは、当該検索結果らが生成された時間や日付、或いは、当該検索結果らが含む情報の最新性によって決定され得る。
【0026】
本開示において、「スニペット(snippet)」は、検索クエリにより検索されたコンテンツ又は文書(例えば、ウェブページ、文書、テキスト又は映像コンテンツ等)から抽出されて、検索結果として露出される当該コンテンツ又は文書の一部分を示すことができる。スニペットは、検索クエリにより検索されたコンテンツ又は文書に基づいて自動的に生成され得る。具体的に、スニペットは、検索クエリ又は検索キーワードと連関性が高いコンテンツ又は文書の一部を強調するか、若しくは、これに関するプレビュー又は要約を提供するように生成され得る。例えば、検索クエリにより検索された文書等の場合、スニペットは、検索クエリに含まれた検索キーワードがマッチングされた文書の本文の一部分を抽出し、当該部分においてキーワードを強調して露出する形態で表示されるか、若しくは、当該文書に対して予め準備されている代表説明や要約文の形態で表示される。
【0027】
図1は、本開示の一実施例に係るユーザ端末110の画面120を通じてユーザ100が検索クエリに対する検索結果を得る例を示す図である。
図1に示す画面120は、ユーザ100がユーザ端末(例えば、スマートフォン)110で検索アプリケーションを実行して検索サービスを利用する例を示す。例えば、ユーザ100は、検索アプリケーション画面の上部に位置した検索語入力部122に検索クエリを入力して検索が遂行できる。ここで、検索クエリは、ユーザの一つ以上のクエリ意図又は検索意図を示す一つ以上のキーワードを含むことができる。
【0028】
ユーザ端末110は、ユーザ100が入力した検索クエリにより検索されたコンテンツを、上位ランキングに相当するコンテンツから順次配列して画面120に表示できる。一実施例において、ユーザ端末110は、ユーザ100のクエリ意図によって上位にランクされたコンテンツを優先的に表示できる。このために、コンテンツを提供する情報処理システム(図示せず)は、ユーザ端末110から検索クエリを受信し、検索クエリから抽出されるクエリ意図に基づいて検索クエリのクエリパターンタイプを決定できる。情報処理システムは、検索クエリのクエリパターンタイプに基づき、検索クエリと関連した複数のコンテンツの各々のランキングを決定し、決定されたランキングに基づき、複数のコンテンツの少なくとも一つ以上のコンテンツを配列して、ユーザ端末110を通じて出力するようにできる。ここで、検索クエリと関連した複数のコンテンツは、検索クエリに含まれた一つ以上のキーワードとマッチングされるコンテンツであり得る。例えば、検索クエリと関連した複数のコンテンツは、検索クエリに含まれた一つ以上のキーワードを含むコンテンツであり得る。一方、検索クエリのクエリパターンタイプに基づいて複数のコンテンツの各々のランキングを決定するために、情報処理システムは、予め複数のコンテンツの各々のクエリパターンタイプを決定し、当該コンテンツに対応するクエリパターンタイプをラベル付けできる。
【0029】
画面120において、図に示すように、ユーザ100が入力した検索クエリの「皮膚科の価格」に含まれるキーワード(「皮膚科」、「価格」)を含む検索結果のうちで、検索クエリから抽出されたクエリ意図の「価格」又は「価格情報」に合致するコンテンツが上位にランクされて優先的に表示できる。例えば、実際に皮膚科の価格情報が含まれたコンテンツである「[江南駅の皮膚科のウォーターピーリング]一食の価格で皮膚管理を受ける!」、「皮膚科のニキビ圧出の価格、瘢痕の治療軟膏のリアル口コミ」及び「水原のA皮膚科のほくろ除去の価格」が上位にランクされて、皮膚科の価格情報が含まれていないコンテンツよりも優先的にユーザ端末110に表示できる。
【0030】
ユーザ端末110は、検索結果として一つ以上のコンテンツのリンク、題目、スニペット、サムネイルイメージ、ハッシュタグ、類似コンテンツリンクなどを画面に表示できる。一実施例において、画面に表示されるスニペットは、検索結果のコンテンツのうち、クエリ意図と対応する一部分であり得る。このために、情報処理システムは、予め複数のコンテンツに対して各々のクエリパターンタイプと関連した複数のスニペットを抽出できる。その後、情報処理システムは、予め抽出した複数のスニペットのうち、検索クエリのクエリパターンタイプと関連したスニペットを、ユーザ端末110を通じて出力するようにできる。
【0031】
画面120において、図に示すように、ユーザ端末110は、検索結果としてコンテンツを表示するとき、表示されるコンテンツの複数のスニペットのうち、クエリ意図に対応するスニペットを共に表示できる。例えば、検索結果として表示されるコンテンツの全体本文において、皮膚科の価格情報、すなわち実際金額情報が含まれたスニペットが表示され得る。画面120に表示されたコンテンツの各々の全体本文において、実際金額情報の「・・・でも、10万ウォンにならない。・・・」、「・・・4回で進行する場合に20万ウォン半ばと分かる・・・」、及び、「・・・A皮膚科で33、000ウォン2ケ月内から1年・・・」が含まれた部分がスニペットとしてユーザ端末110に表示され得る。
【0032】
したがって、ユーザ100は、検索結果として、単純に検索クエリのキーワードとマッチングされるコンテンツではなく、ユーザ100のクエリ意図に対応するコンテンツを優先的に得ることができる。また、ユーザ100は、提供されるコンテンツの全体本文において、単純に検索クエリに対してキーワードマッチングされる部分を含むスニペットではなく、ユーザ100のクエリ意図に対応する部分を含むスニペットを得ることができる。一方、
図1では、ユーザ端末110の画面120を通じて3つのコンテンツが表示されるが、これに限定されず、異なる数のコンテンツが表示されることもできる。
【0033】
図2は、本開示の一実施例に係る複数のユーザ端末210_1、210_2、210_3が情報処理システム230と通信可能であるように接続された構成を示す概要図である。図に示すように、複数のユーザ端末210_1、210_2、210_3は、ネットワーク220を介して検索サービスが提供される情報処理システム230と接続され得る。一実施例において、情報処理システム230は、検索サービス提供等と関連したコンピュータ実行可能なプログラム(例えば、ダウンロード可能なアプリケーション)や、データを保存、提供及び実行できる一つ以上のサーバ装置及び/又はデータベースや、クラウドコンピューティング(cloud computing)サービス基盤の一つ以上の分散コンピュータ装置及び/又は分散データベースを含むことができる。
【0034】
情報処理システム230により提供される検索サービスは、複数のユーザ端末210_1、210_2、210_3の各々に設置された検索アプリケーション、モバイルブラウザアプリケーション又はウェブブラウザなどを介してユーザに提供され得る。例えば、情報処理システム230は、検索アプリケーションなどを介してユーザ端末210_1、210_2、210_3から受信される検索クエリに対応する情報を提供したり、対応する処理を遂行したりできる。
【0035】
複数のユーザ端末210_1、210_2、210_3は、ネットワーク220を介して情報処理システム230と通信できる。ネットワーク220は、複数のユーザ端末210_1、210_2、210_3及び情報処理システム230間の通信が可能であるように構成できる。ネットワーク220は、設置環境に応じて、例えば、イーサネット(Ethernet)、PLC(Power Line Communication)、電話線通信装置及びRS-serial通信などのような有線ネットワーク、移動通信網、WLAN(Wireless LAN)、Wi-Fi、Bluetooth及びZigBeeなどのような無線ネットワーク又はその組合せからなることができる。通信方式は制限されず、ネットワーク220を含むことができる通信網(例えば、移動通信網、有線インターネット、無線インターネット、放送網、衛星網等)を活用する通信方式だけでなく、ユーザ端末210_1、210_2、210_3間の近距離無線通信も含まれる。
【0036】
図2において、携帯電話端末210_1、タブレット端末210_2及びPC端末210_3をユーザ端末の例として示したが、これに限定されず、ユーザ端末210_1、210_2、210_3は、有線及び/又は無線通信が可能であり、検索アプリケーション、モバイルブラウザアプリケーション又はウェブブラウザが設置されて実行できる任意のコンピュータ装置であり得る。例えば、ユーザ端末は、スマートフォン、携帯電話、ナビゲーション、デスクトップコンピュータ、ラップトップコンピュータ、デジタル放送用端末、PDA(Personal Digital Assistants)、PMP(Portable Multimedia Player)、タブレットPC、AIスピーカ(artificial intelligence speaker)、ゲームコンソール(game console)、ウェアラブルデバイス(wearable device)、IoT(internet of things)デバイス、VR(virtual reality)デバイス、AR(augmented reality)デバイス及びセットトップボックス(set top box)などを含むことができる。また、
図2では、3つのユーザ端末210_1、210_2、210_3がネットワーク220を介して情報処理システム230と通信するものと示したが、これに限定されず、異なる数のユーザ端末がネットワーク220を介して情報処理システム230と通信するように構成されることもできる。
【0037】
一実施例によれば、情報処理システム230は、複数のユーザ端末210_1、210_2、210_3から検索クエリ又は検索クエリに対する要請を受信できる。このように受信された検索クエリ又は要請に応じて、情報処理システム230は、検索クエリと関連した複数のコンテンツの少なくとも一つ以上のコンテンツを、複数のユーザ端末210_1、210_2、210_3に提供できる。例えば、情報処理システム230は、検索クエリのクエリ意図に基づいて決定される複数のコンテンツの各々のランキング情報及びスニペットを、複数のユーザ端末210_1、210_2、210_3に提供できる。
【0038】
図3は、本開示の一実施例に係るユーザ端末210及び情報処理システム230の内部構成を示すブロック図である。ユーザ端末210は、検索アプリケーション、モバイルブラウザアプリケーション又はウェブブラウザなどが実行可能であり、有/無線通信が可能な任意のコンピュータ装置を示すことができ、例えば、
図2の携帯電話端末210_1、タブレット端末210_2、PC端末210_3などを含むことができる。図に示すように、ユーザ端末210は、メモリ312、プロセッサ314、通信モジュール316及び入出力インタフェース318を含むことができる。これと同様に、情報処理システム230は、メモリ332、プロセッサ334、通信モジュール336及び入出力インタフェース338を含むことができる。
図3に示すように、ユーザ端末210及び情報処理システム230は、各々の通信モジュール316、336を用いて、ネットワーク220を介して情報及び/又はデータが通信できるように構成できる。また、入出力装置320は、入出力インタフェース318を介して、ユーザ端末210に情報及び/又はデータを入力したり、ユーザ端末210から生成された情報及び/又はデータを出力したりするように構成できる。
【0039】
メモリ312、332は、非一時的な任意のコンピュータ読み取り可能な記録媒体を含むことができる。一実施例によれば、メモリ312、332は、RAM(random access memory)、ROM(read only memory)、ディスクドライブ、SSD(solid state drive)及びフラッシュメモリ(flash memory)などのような永久的な大容量記憶装置(permanent mass storage device)を含むことができる。他の例として、ROM、SSD、フラッシュメモリ及びディスクドライブなどのような永久的な大容量保存装置は、メモリとは区分される別途の永久保存装置としてユーザ端末210又は情報処理システム230に含まれることができる。また、メモリ312、332には、運営体制と少なくとも一つのプログラムコード(例えば、ユーザ端末210に設置されて駆動される検索アプリケーションなどのためのコード)が保存され得る。
【0040】
このようなソフトウェア構成要素は、メモリ312、332とは別途のコンピュータ読み取り可能な記録媒体からローディングできる。このような別途のコンピュータ読み取り可能な記録媒体は、このようなユーザ端末210及び情報処理システム230に直接接続可能な記録媒体を含むことのできるが、例えば、フロッピードライブ、ディスク、テープ、DVD/CD-ROMドライブ及びメモリカードなどのようなコンピュータ読み取り可能な記録媒体を含むことができる。他の例として、ソフトウェア構成要素等は、コンピュータ読み取り可能な記録媒体でなく、通信モジュールを介してメモリ312、332にローディングされることもできる。例えば、少なくとも一つのプログラムは、開発者又はアプリケーションの設置ファイルを配信するファイル配信システムが、ネットワーク220を介して提供するファイルにより設置されるコンピュータプログラムに基づいてメモリ312、332にローディングされることができる。
【0041】
プロセッサ314、334は、基本的な算術、ロジック及び入出力演算を遂行することで、コンピュータプログラムの命令を処理するように構成できる。命令は、メモリ312、332又は通信モジュール316、336によりプロセッサ314、334に提供され得る。例えば、プロセッサ314、334は、メモリ312、332のような記録装置に保存されたプログラムコードによって受信される命令を実行するように構成できる。
【0042】
通信モジュール316、336は、ネットワーク220を介して、ユーザ端末210と情報処理システム230とが互いに通信するための構成や機能が提供でき、ユーザ端末210及び/又は情報処理システム230が、他のユーザ端末又は他のシステム(例えば、別途のクラウドシステム等)と通信するための構成や機能が提供できる。一例として、ユーザ端末210のプロセッサ314がメモリ312などのような記録装置に保存されたプログラムコードによって生成した要請やデータ(例えば、検索クエリ又は検索要請など)は、通信モジュール316の制御により、ネットワーク220を介して情報処理システム230に伝達され得る。反対に、情報処理システム230のプロセッサ334の制御により提供される制御信号や命令が、通信モジュール336及びネットワーク220を経て、ユーザ端末210の通信モジュール316を介してユーザ端末210に受信され得る。例えば、ユーザ端末210は、情報処理システム230から通信モジュール316を介して、検索クエリと関連した複数のコンテンツ及びスニペットに関する情報などを受信できる。
【0043】
入出力インタフェース318は、入出力装置320とのインタフェースのための手段であり得る。一例として、入力装置はオーディオセンサ及び/又はイメージセンサを含むカメラ、キーボード、マイクロホン、マウスなどのような装置を含み、出力装置はディスプレイ、スピーカ、ハプティック(触覚)フィードバックデバイス(haptic feedback device)などのような装置を含むことができる。他の例として、入出力インタフェース318は、タッチスクリーンなどのように入力及び出力を遂行するための構成及び機能が一つで統合された装置とのインタフェースのための手段であり得る。例えば、ユーザ端末210のプロセッサ314がメモリ312にローディングされたコンピュータプログラムの命令を処理する際に、情報処理システム230や他のユーザ端末が提供する情報及び/又はデータを用いて構成されるサービス画面などが、入出力インタフェース318を介してディスプレイに表示され得る。
図3では、入出力装置320がユーザ端末210に含まれないように示したが、これに限定されず、ユーザ端末210と一体に構成することもできる。また、情報処理システム230の入出力インタフェース338は、情報処理システム230と連結するか、又は、情報処理システム230が含むことができる入力や出力のための装置(図示せず)とのインタフェースのための手段であり得る。
図3では、入出力インタフェース318、338がプロセッサ314、334と別途に構成された要素として示したが、これに限定されず、入出力インタフェース318、338がプロセッサ314、334に含まれるように構成することもできる。
【0044】
ユーザ端末210及び情報処理システム230は、
図3に示す構成要素よりも多くの構成要素を含むことができる。しかしながら、大部分の従来技術的構成要素を明確に示す必要はない。一実施例によれば、ユーザ端末210は、前述した入出力装置320の少なくとも一部を含むように具現化できる。また、ユーザ端末210は、トランシーバー(transceiver)、GPS(Global Positioning system)モジュール、カメラ、各種センサ及びデータベースなどのような他の構成要素をさらに含むことができる。例えば、ユーザ端末210がスマートフォンである場合、一般にスマートフォンが有する構成要素を含むことができ、例えば、加速度センサ、ジャイロセンサ、カメラモジュール、各種物理的なボタン、タッチパネルを用いたボタン、入出力ポート及び振動のための振動器などのような多様な構成要素がユーザ端末210にさらに含まれるように具現化できる。一実施例によれば、ユーザ端末210のプロセッサ314は、検索サービスを提供するアプリケーションなどが動作するように構成できる。このとき、当該アプリケーション及び/又はプログラムと関連したコードがユーザ端末210のメモリ312にローディングできる。
【0045】
検索サービスを提供するアプリケーションなどのためのプログラムが動作される際に、プロセッサ314は、入出力インタフェース318と連結されたタッチスクリーン、キーボード、オーディオセンサ及び/又はイメージセンサを含むカメラ及びマイクロホンなどのような入力装置により入力又は選択されたテキスト、イメージ、映像、音声及び/又は動作などが受信でき、受信されたテキスト、イメージ、映像、音声及び/又は動作などをメモリ312に保存したり、通信モジュール316及びネットワーク220を介して情報処理システム230に提供したりできる。例えば、プロセッサ314は、検索クエリに対するユーザ入力を受信できる。
【0046】
一実施例において、プロセッサ314は、入力装置により検索サービスを提供するアプリケーションやウェブブラウザ上で入力される検索クエリ又は検索要請を含むユーザ入力を受信し、このような検索クエリ又は検索要請を、ネットワーク220及び通信モジュール316を介して情報処理システム230に提供できる。例えば、プロセッサ314は、タッチスクリーンやキーボードなどのような入力装置により検索語入力部に入力される検索クエリに対するユーザ入力が受信でき、受信された検索クエリを、通信モジュール316及びネットワーク220を介して情報処理システム230に提供できる。他の例として、プロセッサ314は、タッチスクリーン、マウス及びキーボードなどのような入力装置により検索クエリを含むユーザ入力が受信でき、このようなユーザ入力に応じて、検索クエリを情報処理システム230に転送できる。
【0047】
ユーザ端末210のプロセッサ314は、入力装置、他のユーザ端末、情報処理システム230及び/又は複数の外部システムから受信された情報及び/又はデータを管理、処理及び/又は保存するように構成できる。プロセッサ314により処理された情報及び/又はデータは、通信モジュール316及びネットワーク220を介して情報処理システム230に提供できる。ユーザ端末210のプロセッサ314は、入出力インタフェース318を介して、入出力装置320に情報及び/又はデータを転送して出力できる。例えば、プロセッサ314は、受信した情報及び/又はデータをユーザ端末の画面にディスプレイできる。一実施例において、プロセッサ314は、クエリ意図が反映された検索クエリと関連した複数のコンテンツの各々のランキングに基づき、複数のコンテンツの少なくとも一つ以上のコンテンツを画面に表示できる。例えば、プロセッサ314は、メモリ312及び/又は情報処理システム230から受信した検索クエリと関連した複数のコンテンツを、上位ランキングに相当するコンテンツから順次配列して画面120に表示できる。他の実施例において、プロセッサ314は、一つ以上のコンテンツのリンク、スニペット、サムネイルイメージ及びハッシュタグなどを画面に表示できる。例えば、プロセッサ314は、一つ以上のコンテンツに対し、メモリ312及び/又は情報処理システム230から受信したクエリ意図に対応するスニペットを画面に表示できる。一実施例において、プロセッサ314は、スニペットにおいて、一つ以上のクエリパターンタイプと関連した一部領域を強調して画面に表示できる。例えば、プロセッサ314は、スニペットにおいて、一つ以上のクエリパターンタイプと関連した一部領域を太字体処理及びバックグラウンド処理の少なくとも一つにより強調して画面に表示できる。
【0048】
情報処理システム230のプロセッサ334は、複数のユーザ端末210及び/又は複数の外部システムから受信された情報及び/又はデータを管理、処理及び/又は保存するように構成できる。プロセッサ334により処理された情報及び/又はデータは、通信モジュール336及びネットワーク220を介してユーザ端末210に提供できる。一実施例において、情報処理システム230のプロセッサ334は、ユーザ端末210から受信した検索クエリから抽出された一つ以上のクエリ意図に基づき、検索クエリの一つ以上のクエリパターンタイプ(query pattern type)を決定し、一つ以上のクエリパターンタイプに基づき、検索クエリと関連した複数のコンテンツの各々のランキングを決定できる。このために、プロセッサ334は、検索クエリから一つ以上のクエリ意図に対応する一つ以上のキーワードを抽出し、抽出した一つ以上のキーワードに対応する一つ以上のクエリパターンタイプを決定できる。代案として、プロセッサ334は、自然言語処理(Natural Language Processing;NLP)により検索クエリから一つ以上のクエリ意図を抽出し、抽出した一つ以上のクエリ意図に対する一つ以上のクエリパターンタイプを決定できる。
【0049】
一実施例において、一つ以上のクエリパターンタイプは一つ以上のビットで表現され、一つ以上のビットは、複数のコンテンツのランキングを決定するのに加重値を付与する要素である一つ以上のランキングファクターと予めマッチングされることができる。この場合、プロセッサ334は、一つ以上のランキングファクターに基づき、検索クエリと関連した複数のコンテンツの各々のランキング点数を算出し、複数のコンテンツの各々のランキング点数に基づき、検索クエリと関連した複数のコンテンツの各々のランキングを決定できる。
【0050】
一実施例において、プロセッサ334は、コンテンツDBに含まれた複数のコンテンツのクエリパターンタイプが予めラベル付けできる。例えば、プロセッサ334は、複数のコンテンツに含まれたテキスト、テキスト構造、添付ファイル及びイメージの少なくとも一つに基づいて決定されたクエリパターンタイプをラベル付けできる。このとき、プロセッサ334は、複数のコンテンツのクエリパターンタイプ及び一つ以上のランキングファクターに基づき、検索クエリと関連した複数のコンテンツの各々のランキングを決定できる。
【0051】
一実施例において、プロセッサ334は、コンテンツDBに含まれた複数のコンテンツの各々から少なくとも一つ以上のスニペットが予め抽出できる。例えば、プロセッサ334は、複数のコンテンツの各々に含まれたテキスト、テキスト構造、添付ファイル及びイメージの少なくとも一つを分析/解析して、複数のコンテンツの各々から少なくとも一つ以上のスニペットを抽出できる。また、プロセッサ334は、複数のコンテンツの各々に含まれたテキスト、テキスト構造、添付ファイル及びイメージの少なくとも一つに基づいて決定された複数のコンテンツの各々のクエリパターンタイプと関連した一つ以上のスニペットを抽出できる。
【0052】
情報処理システム230のプロセッサ334は、ユーザ端末210のディスプレイ出力可能装置(例えば、タッチスクリーンやディスプレイ等)、音声出力可能装置(例えば、スピーカ)などの出力装置により処理された情報及び/又はデータを出力するように構成できる。一実施例において、プロセッサ334は、決定されたランキングに基づき、検索クエリと関連した複数のコンテンツの少なくとも一つ以上のコンテンツを、ユーザ端末210を通じて出力するようにできる。例えば、プロセッサ334は、ユーザ端末210が検索クエリと関連した複数のコンテンツを上位ランキングに相当するコンテンツから順次配列して出力するようにできる。
【0053】
一実施例において、プロセッサ334は、決定されたランキングに基づき、検索クエリと関連した複数のコンテンツの少なくとも一つ以上のコンテンツのスニペットを、ユーザ端末210を通じて出力するようにできる。例えば、プロセッサ334が複数のコンテンツの各々のクエリパターンタイプと関連した一つ以上のスニペットを抽出した場合、プロセッサ334は、一つ以上のスニペットの一つ以上のクエリパターンタイプと関連したスニペットを、ユーザ端末を通じて出力できる。また、プロセッサ334は、一つ以上のクエリパターンタイプに対して既定の優先順位により、一つ以上のスニペットの少なくとも一部を、ユーザ端末を通じて出力するようにできる。一実施例において、プロセッサ334は、スニペットにおいて、一つ以上のクエリパターンタイプと関連した一部領域を強調して出力できる。例えば、プロセッサ334は、スニペットにおいて、一つ以上のクエリパターンタイプと関連した一部領域を太字体処理及びバックグラウンド処理の少なくとも一つにより強調して出力できる。
【0054】
図4は、本開示の一実施例に係る情報処理システムのプロセッサ334の詳細ブロック図である。図に示すように、プロセッサ334は、クエリ意図分類によるクエリパターンタイプ決定部410、ランキング決定部420及びコンテンツ提供部430を含み、コンテンツDB440と接続され得る。ここで、コンテンツDB440は、情報処理システムの内部保存装置に含まれたり、情報処理システムと連結された外部保存装置に含まれたりできる。コンテンツDB440には、複数のコンテンツに関する情報が保存できる。例えば、コンテンツDB440には、複数のコンテンツ又は複数のコンテンツに対するリンク、複数のコンテンツの各々から抽出された一つ以上のスニペット、サムネイルイメージなどが保存できる。
【0055】
クエリ意図分類によるクエリパターンタイプ決定部410は、ユーザ端末から検索クエリを受信し、受信された検索クエリから一つ以上のクエリ意図を抽出できる。一実施例において、クエリ意図分類によるクエリパターンタイプ決定部410は、検索クエリから一つ以上のクエリ意図に対応する一つ以上のキーワードを抽出できる。例えば、クエリ意図分類によるクエリパターンタイプ決定部410は、検索クエリから次の表1に含まれたキーワード及び/又は類似キーワードの一つ以上が抽出でき、それにより検索クエリから一つ以上のクエリ意図を抽出できる。すなわち、クエリ意図分類によるクエリパターンタイプ決定部410は、「最近の釜山の人気グルメ店目録」という検索クエリから、「最近」というキーワード及び「目録」というキーワードを抽出し、それにより当該検索クエリから各々「時点トレンド」及び「アイテム推薦」に対するクエリ意図を抽出できる。
【0056】
【0057】
他の実施例において、クエリ意図分類によるクエリパターンタイプ決定部410は、自然言語処理により検索クエリから一つ以上のクエリ意図を抽出できる。例えば、検索クエリに「最近の釜山の人気グルメ店目録を検索してください」という文章が含まれた場合、クエリ意図分類によるクエリパターンタイプ決定部410は、前記文章に対する構文分析/解析や意味分析/解析などの実行により、前記文章が示すクエリ意図が「時点トレンド」及び「アイテム推薦」を含むことが導出し得る。一実施例において、クエリ意図分類によるクエリパターンタイプ決定部410は、入力文章又は文句に対して対応するクエリ意図が導出されるように構成された自然言語処理モデル、確率統計的モデル及び人工神経網モデルの何れか一つを含むことができる。
【0058】
クエリ意図分類によるクエリパターンタイプ決定部410は、検索クエリから抽出された一つ以上のクエリ意図に基づき、検索クエリの一つ以上のクエリパターンタイプを決定できる。ここで、一つ以上のクエリパターンタイプは一つ以上のビットで表現され、一つ以上のクエリパターンタイプは一つ以上のクエリ意図と予めマッチングされることができる。例えば、次の表2に示すように、クエリ意図とクエリパターンタイプが予めマッチングされることができる。
【0059】
【0060】
例えば、「最近の釜山の人気グルメ店目録」という検索クエリから抽出されたクエリ意図の「時点トレンド」及び「アイテム推薦」に基づき、検索クエリのクエリパターンタイプを各々のクエリ意図と対応する「0×0001」及び「0×0100」として決定できる。代案として、このような複数のクエリパターンタイプは「0×0101」のように併合されて表現できる。
【0061】
その後、ランキング決定部420は、クエリ意図分類によるクエリパターンタイプ決定部410で決定された一つ以上のクエリパターンタイプに基づき、検索クエリと関連した複数のコンテンツの各々のランキングを決定できる。ここで、検索クエリと関連した複数のコンテンツの情報は、コンテンツDB440から受信できる。一実施例において、ランキング決定部420は、一つ以上のランキングファクターを決定し、一つ以上のランキングファクタに基づき、検索クエリと関連した複数のコンテンツの各々のランキング点数を算出し、複数のコンテンツの各々のランキング点数に基づき、検索クエリと関連した複数のコンテンツの各々のランキングを決定できる。ここで、一つ以上のクエリパターンタイプの一つ以上のビットは、次の表3に示すように、一つ以上のランキングファクターと予めマッチングでき、ランキングファクターは、複数のコンテンツのランキングを決定するのに加重値を付与する要素であり得る。
【0062】
【0063】
例えば、クエリ意図分類によるクエリパターンタイプ決定部410で決定されたクエリパターンタイプが「0×0101」である場合、ランキング決定部420は、これと対応する「最新性」及び「目録型情報」をランキングファクターとして決定できる。その後、ランキング決定部420は、複数のコンテンツのうち、ランキングファクターの「最新性」と関連したコンテンツのランキング点数に加重値を付与できる。また、ランキング決定部420は、複数のコンテンツのうち、ランキングファクターの「目録型情報」と関連したコンテンツのランキング点数に加重値を付与できる。ランキング決定部420は、最終的に算出されるランキング点数によって複数のコンテンツの各々のランキングを決定できる。したがって、ランキングファクターの「最新性」及び/又は「目録型情報」を有するコンテンツの点数の方が、「最新性」及び「目録型情報」がないコンテンツの点数よりも高まることができ、検索結果のうちで上位にランクされることができる。ここで、ランキング決定部420は、ランキングファクターに対する複数のコンテンツの各々の関連程度(度合)によって異なる加重値を付与できる。例えば、「最新性」のランキングファクターの場合、最新性の程度によって異なる加重値を付与できる。すなわち、一日前にアップロードされたコンテンツのランキング点数に付与される「最新性」と関連した加重値よりも、1時間前にアップロードされたコンテンツのランキング点数に付与される「最新性」と関連した加重値の方が、より大きいことがある。
【0064】
コンテンツ提供部430は、ユーザ端末に複数のコンテンツの少なくとも一つ以上のコンテンツを提供して、ランキング決定部420で決定されたランキングに基づき、検索クエリと関連した複数のコンテンツの少なくとも一つ以上のコンテンツを出力するようにできる。すなわち、コンテンツ提供部430は、ユーザ端末に複数のコンテンツのうちでランキングが高いコンテンツから順次配列して出力するようにできる。したがって、ユーザは、検索クエリと関連した複数のコンテンツのうち、クエリ意図に対応するコンテンツを優先的に得ることができる。
【0065】
前述した表1乃至表3は、各々「クエリ意図-キーワード」、「クエリ意図-クエリパターンタイプ」及び「クエリパターンタイプ-ランキングファクター」間の対応関係に対する一例を示すが、これに限定されるものではない。したがって、このような対応関係は、新しく追加されたり、検索クエリ又はコンテンツ分析/解析により拡張されたりできる。例えば、「クエリ意図」及び「キーワード」は、各々新しいクエリ意図分類及び新しいキーワードの追加により拡張され得る。また、前述したように、クエリパターンタイプは、4桁の二進数で表現できるが、これに限定されるものではない。例えば、クエリパターンタイプの全体数によって異なる桁数の二進数で表現できる。
【0066】
図5は、本開示の他の実施例による情報処理システムのプロセッサ334の詳細ブロック図である。図に示すように、プロセッサ334は、クエリ意図分類によるクエリパターンタイプ決定部410、ランキング決定部420、コンテンツ提供部430及びコンテンツDB440を含むことができる。また、プロセッサ334は、コンテンツラベル付け部510、スニペット抽出部520及びスニペット提供部530をさらに含むことができる。プロセッサ334のクエリ意図分類によるクエリパターンタイプ決定部410、ランキング決定部420、コンテンツ提供部430及びコンテンツDB440は、
図4に示すプロセッサ334の対応構成要素と同様又は類似の構成や機能を含むので、以下では重複する説明を省略する。
【0067】
コンテンツラベル付け部510は、コンテンツDB440に保存された複数のコンテンツのクエリパターンタイプをラベル付けできる。一実施例において、コンテンツラベル付け部510は、複数のコンテンツの各々に含まれたテキスト、テキスト構造(例えば、表構造、順位構造、リスト構造等)、添付ファイル及びイメージの少なくとも一つに基づいて決定されたクエリパターンタイプを複数のコンテンツの各々にラベル付けできる。例えば、コンテンツラベル付け部510は、複数のコンテンツに含まれたテキスト及びリスト構造を分析/解析して、複数のコンテンツのうちで目録型情報を有するコンテンツにクエリパターンタイプの「0×0100」をラベル付けできる。
【0068】
一実施例において、複数のコンテンツに含まれた添付ファイルに基づいてクエリパターンタイプをラベル付けする場合、コンテンツラベル付け部510は、添付ファイルの拡張子名、添付ファイルの題目、添付ファイルの生成日付及び添付ファイルに含まれた情報などを分析/解析してクエリパターンタイプを決定し、ラベル付けできる。例えば、拡張子が「.mp3」のファイルが添付されたコンテンツの場合、「音声情報」又は「マルチメディア情報」などに対応するクエリパターンタイプをラベル付けできる。他の実施例において、複数のコンテンツに含まれたイメージに基づいてクエリパターンタイプをラベル付けする場合、コンテンツラベル付け部510は、イメージに含まれたテキスト情報やイメージ情報などを分析/解析してクエリパターンタイプを決定し、ラベル付けできる。例えば、「楽譜」のイメージが添付されたコンテンツの場合、「楽譜情報」、「音楽情報」又は「マルチメディア情報」などに対応するクエリパターンタイプをラベル付けできる。
【0069】
このような複数のコンテンツのクエリパターンタイプのラベル付け作業は、検索クエリに対する検索結果又はコンテンツの抽出が実行される前に行われる。また、複数のコンテンツのクエリパターンタイプのラベル付け作業は、複数のコンテンツの各々に対するクエリパターンタイプを決定するように構成された確率統計的モデルや人工神経網モデルなどを利用する自動ラベル付け技法により行われる。代案として、人間作業者が直接ラベル付け作業を遂行して、情報処理システムに入力した情報により、コンテンツラベル付け部510が複数のコンテンツのクエリパターンタイプをラベル付けできる。コンテンツラベル付け部510は、ラベル付けされたクエリパターンタイプを複数のコンテンツと関連してコンテンツDB440に保存できる。
【0070】
その後、ユーザにより入力される検索クエリに対し、ランキング決定部420は、複数のコンテンツのクエリパターンタイプ及び一つ以上のランキングファクターに基づき、検索クエリと関連した複数のコンテンツの各々のランキングを決定できる。例えば、ランキング決定部420は、複数のコンテンツのうちで、ランキングファクターに対応するクエリパターンタイプがラベル付けされるコンテンツが上位にランクされるように、複数のコンテンツの各々のランキングを決定できる。すなわち、ランキング決定部420は、ランキングファクターが「目録型情報」である場合、予め「0×0100」がラベル付けされた目録型情報を有するコンテンツが上位にランクされるように、複数のコンテンツの各々のランキングを決定できる。
【0071】
スニペット抽出部520は、複数のコンテンツの各々から少なくとも一つ以上のスニペットを抽出できる。一実施例において、スニペット抽出部520は、複数のコンテンツの各々に含まれたテキスト、テキスト構造、添付ファイル及びイメージの少なくとも一つを分析/解析して、複数のコンテンツの各々から少なくとも一つ以上のスニペットを抽出できる。例えば、スニペット抽出部520は、複数のコンテンツの各々に含まれたテキスト、テキスト構造、添付ファイル及びイメージの少なくとも一つに基づいて決定された複数のコンテンツの各々のクエリパターンタイプと関連した一つ以上のスニペットを抽出できる。ここで、スニペット抽出部520は、複数のコンテンツの各々の本文において、クエリパターンタイプのラベル付けの基になる部分を、当該クエリパターンタイプと関連したスニペットとして抽出できる。スニペット抽出部520は、抽出したスニペットを複数のコンテンツと関連してコンテンツDB440に保存できる。
【0072】
スニペット提供部530は、決定されたランキングに基づき、検索クエリと関連した複数のコンテンツの少なくとも一つ以上のコンテンツのスニペットを、ユーザ端末を通じて出力できる。一実施例において、スニペット提供部530は、一つ以上のスニペットの一つ以上のクエリパターンタイプ(すなわち、検索クエリのクエリパターンタイプ)と関連したスニペットを、ユーザ端末を通じて出力できる。例えば、クエリ意図分類によるクエリパターンタイプ決定部410が、検索クエリのクエリパターンタイプを、検索クエリから抽出されたクエリ意図の「時点トレンド」に対応する「0×0001」として決定する場合、スニペット提供部530は、「0×0001」と関連したスニペットを、ユーザ端末を通じて出力できる。
【0073】
一実施例において、スニペット提供部530は、一つ以上のクエリパターンタイプに対し、既定の優先順位によって一つ以上のスニペットの少なくとも一部を、ユーザ端末を通じて出力できる。例えば、クエリ意図分類によるクエリパターンタイプ決定部410が、検索クエリのクエリパターンタイプを、「0×0001」と「0×0100」を併合した「0×0101」として決定する場合、スニペット提供部530は、既定の優先順位によって優先する「0×0100」と関連したスニペットを、ユーザ端末を通じて出力できる。
【0074】
一実施例において、スニペット提供部530は、スニペットにおいて、一つ以上のクエリパターンタイプと関連した一部領域を強調して出力できる。例えば、スニペット提供部530は、スニペットにおいて、一つ以上のクエリパターンタイプと関連した一部領域を、太字体処理及びバックグラウンド処理の少なくとも一つにより強調して出力できる。
【0075】
図6は、本開示の一実施例に係るクエリ意図を反映した検索結果提供方法600を示すフローチャットである。一実施例において、クエリ意図を反映した検索結果提供方法600は、プロセッサ(例えば、ユーザ端末及び/又は情報処理システムの少なくとも一つのプロセッサ)により遂行される。図に示すように、検索結果提供方法600は、プロセッサがユーザ端末から検索クエリを受信することによって開始される(S610)。
【0076】
その後、プロセッサは、検索クエリから抽出された一つ以上のクエリ意図に基づき、検索クエリに対する一つ以上のクエリパターンタイプを決定できる(S620)。一実施例において、プロセッサは、検索クエリに含まれた一つ以上のキーワードにより一つ以上のクエリ意図を抽出し、一つ以上のクエリ意図に対する一つ以上のクエリパターンタイプを決定できる。他の実施例において、プロセッサは、自然言語処理(例えば、自然言語理解(Natural Language Understanding)等)により検索クエリから一つ以上のクエリ意図を抽出し、一つ以上のクエリ意図に対する一つ以上のクエリパターンタイプを決定できる。ここで、一つ以上のクエリパターンタイプは一つ以上のビットで表現され、一つ以上のビットは複数のコンテンツのランキングを決定するのに加重値を付与する要素である一つ以上のランキングファクターと予めマッチングされることができる。
【0077】
その後、プロセッサは、一つ以上のクエリパターンタイプに基づき、検索クエリと関連した複数のコンテンツの各々のランキングを決定できる(S630)。一実施例において、プロセッサは、一つ以上のランキングファクターに基づき、検索クエリと関連した複数のコンテンツの各々のランキング点数を算出し、複数のコンテンツの各々のランキング点数に基づき、検索クエリと関連した複数のコンテンツの各々のランキングを決定できる。他の実施例において、プロセッサは、複数のコンテンツのクエリパターンタイプ及び一つ以上のランキングファクターに基づき、検索クエリに対する複数のコンテンツの各々のランキングを決定できる。このために、プロセッサは、予め複数のコンテンツのクエリパターンタイプをラベル付けできる。例えば、複数のコンテンツに含まれたテキスト、テキスト構造、添付ファイル及びイメージの少なくとも一つに基づいて決定されたクエリパターンタイプをラベル付けできる。プロセッサは、新しいコンテンツがコンテンツDBにアップロードされる場合、当該コンテンツのクエリパターンタイプをリアルタイムでラベル付けできる。代案として、プロセッサは、一定期間別にコンテンツDBに保存された新しいコンテンツのクエリパターンタイプをラベル付けできる。一実施例において、プロセッサは、決定されたランキングに基づき、検索クエリと関連した複数のコンテンツの少なくとも一つ以上のコンテンツを、ユーザ端末を通じて出力できる。
【0078】
プロセッサは、複数のコンテンツの各々から少なくとも一つ以上のスニペットを抽出できる。例えば、プロセッサは、複数のコンテンツの各々から少なくとも一つ以上のスニペットを予め抽出し、コンテンツDBに保存できる。代案として、プロセッサは、検索クエリが受信される場合、検索クエリと関連した複数のコンテンツの各々から少なくとも一つ以上のスニペットをリアルタイムで抽出できる。一実施例において、プロセッサは、複数のコンテンツの各々に含まれたテキスト、テキスト構造、添付ファイル及びイメージの少なくとも一つを分析/解析して、複数のコンテンツの各々から少なくとも一つ以上のスニペットを抽出できる。例えば、プロセッサは、複数のコンテンツの各々に含まれたテキスト、テキスト構造、添付ファイル及びイメージの少なくとも一つに基づいて決定された複数のコンテンツの各々のクエリパターンタイプと関連した一つ以上のスニペットを抽出できる。
【0079】
プロセッサは、決定されたランキングに基づき、検索クエリと関連した複数のコンテンツの少なくとも一つ以上のコンテンツのスニペットを、ユーザ端末を通じて出力できる。一実施例において、プロセッサは、一つ以上のスニペットの一つ以上のクエリパターンタイプと関連したスニペットを、ユーザ端末を通じて出力できる。他の実施例において、プロセッサは、一つ以上のクエリパターンタイプに対し、既定の優先順位によって一つ以上のスニペットの少なくとも一部を、ユーザ端末を通じて出力できる。
【0080】
一実施例において、プロセッサは、スニペットにおいて、一つ以上のクエリパターンタイプと関連した一部領域を、強調して出力できる。例えば、プロセッサは、スニペットにおいて、一つ以上のクエリパターンタイプと関連した一部領域を、太字体処理及びバックグラウンド処理の少なくとも一つにより強調して出力できる。代案として、プロセッサは、スニペットにおいて、一つ以上のクエリパターンタイプと関連した一部領域を、目録型の配列により強調して出力できる。他の実施例において、プロセッサは、検索クエリと関連した複数のコンテンツのうち、添付ファイル及びイメージの少なくとも一つが強調されたスニペットが出力できる。
【0081】
図7は、本開示の一実施例に係る検索クエリのクエリ意図が反映された検索結果を提供する例を示す図である。プロセッサは、ユーザ端末から検索クエリを受信し、検索クエリから抽出された一つ以上のクエリ意図に基づき、検索クエリに対する一つ以上のクエリパターンタイプを決定できる。一実施例において、プロセッサは、検索クエリから一つ以上のクエリ意図に対応する一つ以上のキーワードを抽出し、一つ以上のキーワードに対応する一つ以上のクエリパターンタイプを決定できる。プロセッサは、決定されたクエリパターンタイプに対応するランキングファクターに基づき、検索クエリと関連した複数のコンテンツの各々のランキング点数を算出し、複数のコンテンツの各々のランキング点数に基づき、複数のコンテンツの各々のランキングを決定できる。ここで、ランキングファクターは、複数のコンテンツの各々のランキングを決定する際に、加重値を付与する要素であり得る。プロセッサは、このように決定されたランキングに基づき、複数のコンテンツの一つ以上のコンテンツをユーザ端末に出力できる。例えば、複数のコンテンツは、上位ランキングのコンテンツから順次配列されてユーザ端末に出力できる。すなわち、上位ランキングに相当するコンテンツの方が、下位ランキングに相当するコンテンツよりも優先的に出力できる。
【0082】
プロセッサは、図に示すように、ユーザ端末の画面の検索語入力部702に入力された検索クエリの「今日の占い」を受信できる。その後、プロセッサは、受信された「今日の占い」からクエリ意図の「時点トレンド」に相当する「今日」というキーワードを抽出し、クエリパターンタイプを「今日」というキーワードに対応するクエリパターンタイプの「0×0001」として決定できる。プロセッサは、決定されたクエリパターンタイプの「0×0001」に対応するランキングファクターの「最新性」に基づき、検索クエリの「今日の占い」と関連した複数のコンテンツの各々のランキング点数を算出し、複数のコンテンツの各々のランキング点数に基づき、複数のコンテンツの各々のランキングを決定できる。一実施例において、プロセッサは、コンテンツの「最新性」によって複数のコンテンツの各々のランキング点数に加重値を付与してランキング点数を算出し、算出されたランキング点数に基づき、複数のコンテンツの各々のランキングを決定できる。この場合、プロセッサは、コンテンツの「最新性」の程度によって複数のコンテンツの各々に異なる加重値を付与できる。すなわち、プロセッサは、比較的「最新性」が低いコンテンツよりも、「最新性」が高いコンテンツの方により大きい加重値を付与できる。
【0083】
図に示すように、「最新性」が非常に高い1時間前にアップロードにされた第1のコンテンツの「今日の占い(9月16日)の星座占い」710、第2のコンテンツの「今日の占い、9月の16番目の日(水曜日)」720及び3時間前にアップロードされた第3のコンテンツの「昼食をもぐもぐ、教大の眼鏡屋+今日の占い」730の方が、比較的最新性が低いコンテンツ(例えば、1日前又は1ヶ月前にアップロードされたコンテンツ)(図示せず)よりも、上位にランクされて優先的に出力され得る。また、1時間前にアップロードされた第1のコンテンツ710及び第2のコンテンツ720の方が、3時間前にアップロードされた第3のコンテンツ730よりも上位にランクされ、第1のコンテンツ710、第2のコンテンツ720及び第3のコンテンツ730の順に配列されて、画面700に表示され得る。
【0084】
図8は、本開示の他の実施例に係る検索クエリのクエリ意図が反映された検索結果を提供する例を示す図である。プロセッサは、予め複数のコンテンツのクエリパターンタイプをラベル付けできる。一実施例において、複数のコンテンツに含まれたテキスト、テキスト構造、添付ファイル及びイメージの少なくとも一つに基づいて決定されたクエリパターンタイプをラベル付けできる。例えば、複数のコンテンツに含まれたテキスト及びテキストが並んでいる構造を分析/解析して、クエリパターンタイプをラベル付けできる。すなわち、テキストが目録形態の構造又は構成(レイアウト)で並んでいるコンテンツに対し、プロセッサは「目録型情報」に対応するクエリパターンタイプの「0×0100」をラベル付けできる。
図8の画面800に出力された第1のコンテンツの「皆が好む釜山の人気グルメ店目録5」810及び第2のコンテンツの「夏に行くべき釜山の人気グルメ店目録14、西面、 蓮山洞、海雲台」820は、各々人気グルメ店目録、すなわち、「目録型情報」を含むので、予めプロセッサにより「0×0100」がラベル付けされてコンテンツDBに保存され得る。
【0085】
予めラベル付けされた複数のコンテンツのクエリパターンタイプ及び検索クエリにより決定されるランキングファクターに基づき、プロセッサは、検索クエリと関連した複数のコンテンツの各々のランキングを決定できる。例えば、プロセッサは、複数のコンテンツのうち、ランキングファクターに対応するクエリパターンタイプがラベル付けされたコンテンツが上位にランクされるように、複数のコンテンツの各々のランキングを決定できる。図に示すように、プロセッサは、ユーザ端末の画面800の検索語入力部802に入力された検索クエリの「釜山の人気グルメ店目録」を受信できる。その後、プロセッサは、受信された「釜山の人気グルメ店目録」から「アイテム推薦」という意図を分析/解析して、検索クエリの意図をクエリパターンタイプの「0×0100」として決定できる。ここで、プロセッサは、クエリパターンタイプの「0×0100」に対応するランキングファクターの「目録型情報」と複数のコンテンツのクエリパターンタイプに基づき、検索クエリの「釜山の人気グルメ店目録」と関連した複数のコンテンツの各々のランキング点数を算出し、算出されたランキング点数に基づいて複数のコンテンツの各々のランキングを決定できる。すなわち、プロセッサは、予め「0×0100」がラベル付けされた「目録型情報」を含む第1のコンテンツ810及び第2のコンテンツ820のランキング点数に加重値を付与でき、それにより第1のコンテンツ810及び第2のコンテンツ820が複数のコンテンツのうちで上位ランキングにランクされ、優先的に出力され得る。
【0086】
プロセッサは、予め複数のコンテンツの各々から少なくとも一つ以上のスニペットを抽出できる。一実施例において、プロセッサは、複数のコンテンツの各々に含まれたテキスト、テキスト構造、添付ファイル及びイメージの少なくとも一つを分析/解析して、複数のコンテンツの各々から少なくとも一つ以上のスニペットを抽出できる。例えば、プロセッサは、複数のコンテンツの各々に含まれたテキスト、テキスト構造、添付ファイル及びイメージの少なくとも一つに基づいて決定された複数のコンテンツの各々のクエリパターンタイプと関連した一つ以上のスニペットを抽出できる。ここで、複数のコンテンツの各々のクエリパターンタイプと関連した一つ以上のスニペットは、複数のコンテンツの各々の本文においてクエリパターンタイプがラベル付けされるのに基になる一部分であり得る。
【0087】
プロセッサは、
図8の第1のコンテンツ810及び第2のコンテンツ820の各々に含まれたテキスト、テキスト構造、添付ファイル及びイメージの少なくとも一つに基づいて決定された複数のコンテンツの各々のクエリパターンタイプの「0×0100」と関連した一つ以上のスニペットを抽出できる。すなわち、第1のコンテンツ810及び第2のコンテンツ820のクエリパターンタイプをラベル付けする際に、各々のコンテンツの本文においてクエリパターンタイプの「0×0100」がラベル付けされるのに基になる「目録型情報」が含まれた部分を、「0×0100」と関連したスニペットとして抽出できる。同様に、第1のコンテンツ810及び/又は第2のコンテンツ820に「0×0100」の以外の異なるクエリパターンタイプの「0×0010」が共にラベル付けされる場合、当該クエリパターンタイプの「0×0010」がラベル付けされるのに基になる異なる部分を当該クエリパターンタイプの「0×0010」と関連したスニペットとして抽出できる。したがって、プロセッサは、一つのコンテンツに対し、クエリパターンタイプ別に異なる複数のスニペットを抽出できる。
【0088】
プロセッサは、決定されたランキングに基づき、検索クエリに関連した複数のコンテンツの少なくとも一つ以上のコンテンツのスニペットを、ユーザ端末を通じて出力できる。一実施例において、プロセッサは、一つ以上のスニペットの一つ以上のクエリパターンタイプ(すなわち、検索クエリのクエリパターンタイプ)と関連したスニペットを、ユーザ端末を通じて出力できる。例えば、第1のコンテンツ810及び第2のコンテンツ820のスニペットにおいて、検索語入力部802に入力された検索クエリの「釜山の人気グルメ店目録」のクエリパターンタイプの「0×0100」と関連したスニペットの「目録型情報」が含まれた部分を、ユーザ端末を通じて出力できる。
【0089】
従来のように、検索クエリとのキーワードマッチングにより画一的にスニペットを抽出して出力する場合、コンテンツの本文において、単純に「釜山」、「人気グルメ店」、「目録」というキーワードが含まれた部分(例えば、本文の導入部など)がスニペットとして出力されるが、本開示の実施例によれば、実際に「人気グルメ店目録」(すなわち、目録型情報)を含む部分がスニペットとして出力されるので、ユーザは、コンテンツ等のクエリ意図に対応する一部分をスニペットとして得ることができる。
【0090】
図9は、本開示のまた他の実施例に係る検索クエリのクエリ意図が反映された検索結果を提供する例を示す図である。プロセッサは、複数のコンテンツに含まれたテキスト、テキスト構造、添付ファイル及びイメージの少なくとも一つに基づいて決定されたクエリパターンタイプをラベル付けできる。一実施例において、プロセッサは、複数のコンテンツに含まれた添付ファイルに基づいてクエリパターンタイプをラベル付けする場合、プロセッサは、添付ファイルの拡張子名、添付ファイルの題目、添付ファイルの生成日付及び添付ファイルに含まれたコンテンツなどを分析/解析してクエリパターンタイプを決定し、当該添付ファイルを含むコンテンツに決定されたクエリパターンタイプをラベル付けできる。他の実施例において、複数のコンテンツに含まれたイメージに基づいてクエリパターンタイプをラベル付けする場合、プロセッサは、イメージに含まれたテキスト情報やイメージ情報などを分析/解析してクエリパターンタイプを決定し、当該イメージを含むコンテンツに決定されたクエリパターンタイプをラベル付けできる。
【0091】
画面900に出力された第1のコンテンツの「イU-愛の詩をギターで弾いてみましょう(ギターコード楽譜を含む、弾き易いバージョン)」910は、添付ファイルを含むことができる。この場合、プロセッサは、第1のコンテンツ910の添付ファイルの拡張子の「.pdf」、題目の「愛の詩のギターコード楽譜」などに基づき、第1のコンテンツ910のクエリパターンタイプを「楽譜情報」又は「マルチメディア情報」などに対応するクエリパターンタイプの「0×1000」としてラベル付けできる。一方、画面900に出力された第2のコンテンツの「[メロディー]イU-愛の詩の楽譜」920はイメージを含むことができる。この場合、プロセッサは、第2のコンテンツ920のイメージを分析/解析して認識された「愛の詩」、「作詞」、「作家」などのようなテキスト、及び「音符」、「五線紙」、「楽譜イメージ」などのようなイメージ情報に基づき、第2のコンテンツ920のクエリパターンタイプを「楽譜情報」又は「マルチメディア情報」などに対応するクエリパターンタイプの「0×1000」としてラベル付けできる。
【0092】
プロセッサは、図に示すように、ユーザ端末の画面900の検索語入力部902に入力された検索クエリの「イUの愛の詩の楽譜」を受信できる。その後、プロセッサは、受信された「イUの愛の詩の楽譜」から「楽譜」というキーワードを抽出し、クエリパターンタイプを「楽譜」というキーワードに対応するクエリパターンタイプの「0×1000」として決定できる。ここで、プロセッサは、複数のコンテンツのクエリパターンタイプ及び検索クエリのクエリパターンタイプの「0×1000」に対応するランキングファクターの「楽譜情報」又は「マルチメディア情報」に基づき、複数のコンテンツの各々のランキング点数を算出し、複数のコンテンツの各々のランキングを決定できる。すなわち、プロセッサは、「0×1000」がラベル付けされた第1のコンテンツ910及び第2のコンテンツ920のランキング点数に加重値を付与でき、それにより第1のコンテンツ910及び第2のコンテンツ920が複数のコンテンツのうちで上位ランキングにランクされることができ、優先的に出力されることができる。
【0093】
図10は、本開示の一実施例に係る検索クエリのクエリ意図によって異なるスニペットを提供する例を示す図である。一実施例において、プロセッサは、複数のコンテンツの各々に含まれたテキスト、テキスト構造、添付ファイル及びイメージの少なくとも一つを分析/解析して、複数のコンテンツの各々から少なくとも一つ以上のスニペットを抽出できる。例えば、プロセッサは、複数のコンテンツの各々に含まれたテキスト、テキスト構造、添付ファイル及びイメージの少なくとも一つに基づいて決定された複数のコンテンツの各々のクエリパターンタイプと関連した一つ以上のスニペットを抽出できる。ここで、複数のコンテンツの各々のクエリパターンタイプと関連した一つ以上のスニペットは、複数のコンテンツの各々の本文において当該クエリパターンタイプがラベル付けされるのに基になる一部分であり得る。
【0094】
例えば、プロセッサは、コンテンツの「A自動車の発売情報(発売日、価格)」1014、1034に含まれたテキスト、テキスト構造、添付ファイル及びイメージの少なくとも一つを分析/解析して、当該コンテンツ1014、1034に「時間情報」に対応するクエリパターンタイプの「0×10000」及び「価格情報」に対応するクエリパターンタイプの「0×00010」をラベル付けできる。このとき、プロセッサは、コンテンツからクエリパターンタイプの「0×10000」と関連したスニペット及びクエリパターンタイプの「0×00010」と関連したスニペットを各々抽出できる。すなわち、コンテンツ1014、1034の本文において、「時間情報」を含む「・・・A自動車の発売日は、2020モーターショー(5月29日)以後である9月15日であり、・・・」という部分をクエリパターンタイプの「0×10000」と関連したスニペット1016として抽出し、「価格情報」を含む「・・・最小価格4,000万ウォン半ばから最高6,000万ウォンまで・・・」という部分をクエリパターンタイプの「0×00010」と関連したスニペット1036として各々抽出できる。
【0095】
プロセッサは、一つ以上のスニペットの一つ以上のクエリパターンタイプ(すなわち、検索クエリのクエリパターンタイプ)と関連したスニペットを、ユーザ端末を通じて出力できる。例えば、プロセッサが、第1の画面1010の検索語入力部1012に入力された検索クエリの「A車の発売日」を受信する場合、コンテンツ1014のスニペットのうち、検索クエリの「A車の発売日」のクエリパターンタイプの「0×10000」と関連したスニペット1016を、ユーザ端末を通じて出力できる。これに対し、プロセッサが、第2の画面1030の検索語入力部1032に入力された検索クエリの「A車の価格」を受信する場合、コンテンツ1034のスニペットのうち、検索クエリの「A車の価格」のクエリパターンタイプ'の「0×00010」と関連したスニペット1036を、ユーザ端末を通じて出力できる。したがって、第1の画面1010及び第2の画面1030に示すように、検索クエリの「A車の発売日」 に対する検索結果及び検索クエリの「A車の価格」に対する検索結果として同一のコンテンツ1014、1034が出力されても、各々異なるスニペット1016、1036が出力され得る。
【0096】
図11は、本開示の一実施例に係る検索クエリのクエリ意図と関連した領域が強調されたスニペット1110、1120、1130を提供する例を示す図である。プロセッサは、スニペットにおいて一つ以上のクエリパターンタイプと関連した一部領域を強調して出力できる。すなわち、ユーザの可読性のために、スニペットにおいてユーザのクエリ意図に合致する一部領域(例えば、ユーザが所望する対象情報を含む領域)を強調してユーザ端末に出力できる。例えば、プロセッサは、スニペットにおいて一つ以上のクエリパターンタイプと関連した一部領域を、太字体処理及びバックグラウンド処理の少なくとも一つにより強調して出力できる。
【0097】
図に示すように、第1のコンテンツのスニペット1110は、検索クエリの「皮膚科の価格」のクエリパターンタイプ(すなわち、キーワードの「価格」に対応するクエリパターンタイプ)と関連した「10万ウォン」及び「価格」という領域が太字体処理により強調されて、画面1100に表示される。また、第2のコンテンツのスニペット1120は、検索クエリの「皮膚科の価格」のクエリパターンタイプと関連した「4回で進行する場合、20万ウォン半ば」という領域がバックグラウンド処理により強調されて、画面1100に表示される。また、第3のコンテンツのスニペット1130は、検索クエリの「皮膚科の価格」のクエリパターンタイプと関連した「A皮膚科で33,000ウォン2ケ月内から1年」という領域がバックグラウンド処理及び「33,000ウォン」という領域が太字体処理により強調されて、画面1100に表示される。したがって、ユーザは、クエリ意図に対応する領域が強調された可読性のあるスニペットを得ることができる。
【0098】
図11では、スニペットの強調処理方式として、太字体処理方式又はバックグラウンド処理方式を示しているが、これに限定されず、ユーザの可読性を向上させるための多様な強調処理方式が利用される。例えば、コンテンツに含まれたテキストを目録型に配列して出力する強調処理方式が利用されることもできる。また、
図11では、コンテンツのテキストが強調されたスニペットが出力される例を示しているが、これに限定されず、コンテンツに含まれた添付ファイルやイメージなどが強調されたスニペットが出力されることもできる。
【0099】
前述したクエリ意図を反映した検索結果提供方法は、コンピュータで実行するために、コンピュータ読み取り可能なコンピュータブラグラムとして提供され得る。媒体は、コンピュータで実行可能なプログラムを継続的に保存したり、実行又はダウンロードのために一時保存したりするものであり得る。また、媒体は、単一又は多数のハードウェアが結合された形態の多様な記録手段又は保存手段であり得るが、あるコンピュータシステムに直接接続される媒体に限定されず、ネットワーク上に分散して存在するものであり得る。媒体の例としては、ハードディスク、フロッピーディスク及び磁気テープのような磁気媒体、CD-ROMやDVDのような光記録媒体、フロプティカルディスク(floptical disk)のような磁気-光媒体(magneto-optical medium)、及び、ROM、RAM、フラッシュメモリなどを含み、プログラム命令語が保存されるように構成されたものが挙げられる。また、他の媒体の例としては、アプリケーションを流通するアプリストアやその他の多様なソフトウェアを供給乃至流通するサイト、サーバなどで管理する記録媒体乃至保存媒体も挙げられる。
【0100】
本開示の方法、動作又は技法は多様な手段により具現化できる。例えば、このような技法は、ハードウェア、ファームウェア、ソフトウェア、若しくはこれらの組合せで具現化できる。本願の開示により説明された多様な例示的な論理的ブロック、モジュール、回路及びアルゴリズムステップは、電子ハードウェア、コンピュータソフトウェア、若しくは両方の組合せで具現化できることを、通常の技術者であれば理解できるはずである。ハードウェア及びソフトウェアのこのような相互の代替を明確に説明するために、多様な例示的な構成要素、ブロック、モジュール、回路及びステップが、それらの機能的観点から一般的に前述された。そのような機能が、ハードウェアとして具現化されるか、若しくは、ソフトウェアとして具現化されるかは、特定アプリケーション及び全体システムに付加される設計要求事項によって変化する。通常の技術者は、各々の特定アプリケーションのために多様な方式により説明された機能を具現化することもできるが、そのような具現化は本開示の範囲から逸脱するものと解釈してはならない。
【0101】
ハードウェアの具現化において、技法の遂行に利用されるプロセッシングユニットは、一つ以上のASIC、DSP、デジタル信号処理デバイス(digital signal processing devices ; DSPD)、プログラム可能な論理デバイス(programmable logic devices ; PLD)、フィールドプログラム可能なゲートアレイ(field programmable gate arrays ; FPGA)、プロセッサ、制御器、マイクロ制御器、マイクロプロセッサ、電子デバイス、本開示に説明された機能を遂行するように設計された他の電子ユニット、コンピュータ、若しくはこれらの組合せ内で具現化されることもできる。
【0102】
したがって、本開示により説明された多様な例示的な論理ブロック、モジュール及び回路は、汎用プロセッサ、DSP、ASIC、FPGAや他のプログラム可能な論理デバイス、離散ゲートやトランジスタロジック、離散ハードウェアコンポーネント、若しくは、本願に説明された機能を遂行するように設計されたもの等の任意の組合せで具現化又は遂行されることもできる。汎用プロセッサはマイクロプロセッサであり得るが、代案として、プロセッサは、任意の従来のプロセッサ、制御器、マイクロ制御器、若しくは状態マシンであり得る。プロセッサは、また、コンピューティングデバイスの組合せ、例えば、DSPとマイクロプロセッサ、複数のマイクロプロセッサ、DSPコアと関連する一つ以上のマイクロプロセッサ、若しくは任意の他の構成の組合せで具現化されることもできる。
【0103】
ファームウェア及び/又はソフトウェアの具現化において、技法は、RAM(random access memory)、ROM(read-only memory)、NVRAM(non-volatile random access memory)、PROM(programmable read-only memory)、EPROM(erasable programmable read-only memory)、EEPROM(electrically erasable PROM)、フラッシュメモリ、CD(compact disc)、磁気又は光学データストレージデバイスなどのようなコンピュータ読み取り可能な媒体上に保存された命令で具現化できる。命令は、一つ以上のプロセッサによって実行可能であり得、プロセッサが本開示に説明された機能の特定様態を遂行するようにできる。
【0104】
前述した実施例が一つ以上の独立型コンピュータシステムで現在開示された主題の様態を活用するものとして記述しているが、本開示はこれに限定されず、ネットワークや分散コンピューティング環境のような任意のコンピューティング環境によって具現化できる。さらには、本開示における主題の様態は複数のプロセッシングチップや装置で具現化されることもでき、ストレージは複数の装置にわたって類似に影響を受けることもできる。このような装置は、PC、ネットワークサーバ及び携帯用装置を含むこともできる。
【0105】
本明細書では、本開示が一部の実施例によって説明されたが、本開示の発明が属する技術分野における通常の技術者が理解し得る本開示から逸脱しない範囲内で多様な変形や変更が可能である。また、そのような変形や変更は、本明細書に添付された特許請求の範囲内に属するものと理解されるべきである。
【符号の説明】
【0106】
100 ユーザ
110 ユーザ端末
120 画面