IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッドの特許一覧

特許7163440テキストクエリ方法、装置、電子機器、記憶媒体及びコンピュータプログラム製品
<>
  • 特許-テキストクエリ方法、装置、電子機器、記憶媒体及びコンピュータプログラム製品 図1
  • 特許-テキストクエリ方法、装置、電子機器、記憶媒体及びコンピュータプログラム製品 図2
  • 特許-テキストクエリ方法、装置、電子機器、記憶媒体及びコンピュータプログラム製品 図3
  • 特許-テキストクエリ方法、装置、電子機器、記憶媒体及びコンピュータプログラム製品 図4
  • 特許-テキストクエリ方法、装置、電子機器、記憶媒体及びコンピュータプログラム製品 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-10-21
(45)【発行日】2022-10-31
(54)【発明の名称】テキストクエリ方法、装置、電子機器、記憶媒体及びコンピュータプログラム製品
(51)【国際特許分類】
   G06F 16/383 20190101AFI20221024BHJP
   G06F 3/16 20060101ALI20221024BHJP
【FI】
G06F16/383
G06F3/16 650
【請求項の数】 13
(21)【出願番号】P 2021044383
(22)【出願日】2021-03-18
(65)【公開番号】P2021099881
(43)【公開日】2021-07-01
【審査請求日】2021-03-18
(31)【優先権主張番号】202010343782.4
(32)【優先日】2020-04-27
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】514322098
【氏名又は名称】ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド
【氏名又は名称原語表記】Beijing Baidu Netcom Science Technology Co., Ltd.
【住所又は居所原語表記】2/F Baidu Campus, No.10, Shangdi 10th Street, Haidian District, Beijing 100085, China
(74)【代理人】
【識別番号】110002468
【氏名又は名称】特許業務法人後藤特許事務所
(72)【発明者】
【氏名】劉 暢
(72)【発明者】
【氏名】楊 雙全
(72)【発明者】
【氏名】張 陽
(72)【発明者】
【氏名】謝 奕
【審査官】佐賀野 秀一
(56)【参考文献】
【文献】特開2019-212266(JP,A)
【文献】特表2018-530026(JP,A)
【文献】特開2009-176302(JP,A)
【文献】特開2010-277312(JP,A)
【文献】特開2019-109730(JP,A)
【文献】米国特許出願公開第2015/0286747(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00- 16/958
G06F 3/16
(57)【特許請求の範囲】
【請求項1】
クエリテキストの、意図を表す意図情報及び特徴情報を認識することと、
意図情報に基づいて、前記意図をクエリするためのクエリインタフェースを決定することと、
前記クエリインタフェースにより、前記意図に対応する情報において、前記特徴情報に合致するクエリ結果をクエリすることとを含み、
前記意図情報は、レベル1の意図情報、レベル2の意図情報及びレベル3の意図情報を含み、
前記レベル1の意図情報は言語モデルで認識され、
前記レベル2の意図情報及び前記レベル3の意図情報は、キーワド正規マッチング方法で認識されることを特徴とする、テキストクエリ方法。
【請求項2】
前記特徴情報は、
エンティティ情報及び時間情報のうちの少なくとも一方を含むことを特徴とする、請求項1に記載の方法。
【請求項3】
前記エンティティ情報は、言語モデルによって認識された前記クエリテキストのエンティティ情報であり、及び/又は
前記時間情報は、時間記述情報から解析した時点情報、及び前記時点情報に基づいて前記時間記述情報から解析した時間帯情報のうちの少なくとも一方を含み、前記時間記述情報は、前記クエリテキストから抽出された時間記述情報であることを特徴とする、請求項2に記載の方法。
【請求項4】
前記時点情報は、
前記時間記述情報を正規化して、時間正規化情報を取得し、
前記時間正規化情報に合致する時間解析ルールをクエリし、
前記時間正規化情報に合致する時間解析ルールが複数あれば、予め設定された衝突解決ポリシを用いてターゲット時間解析ルールを選択し、前記時間正規化情報を解析して、前記時点情報を取得し、前記時間正規化情報に合致する時間解析ルールが1つしかなければ、前記時間解析ルールを用いて前記時間正規化情報を解析して、前記時点情報を取得するという方法によって得られることを特徴とする、請求項3に記載の方法。
【請求項5】
前記クエリインタフェースは、ターゲット意図情報が表すターゲット意図をクエリするためのクエリインタフェースであり、前記ターゲット意図情報は、記レベル1の意図情報であり、
前記クエリインタフェースにより、前記意図に対応する情報において、前記特徴情報に合致するクエリ結果をクエリすることは、
前記クエリインタフェースにより、前記ターゲット意図に対応するターゲット種別情報において、前記特徴情報に合致するクエリ結果をクエリすることを含み、前記ターゲット種別情報の情報種別は、他の意図情報が表す意図に合致し、かつ前記ターゲット種別情報は、前記ターゲット意図に対応する情報であり、前記他の意図情報は、前記図情報のうち、前記ターゲット意図情報以外の意図情報であることを特徴とする、請求項1に記載の方法。
【請求項6】
クエリテキストの、意図を表す意図情報及び特徴情報を認識する認識モジュールと、
意図情報に基づいて、前記意図をクエリするためのクエリインタフェースを決定する決定モジュールと、
前記クエリインタフェースにより、前記意図に対応する情報において、前記特徴情報に合致するクエリ結果をクエリするクエリモジュールとを含み、
前記意図情報は、レベル1の意図情報、レベル2の意図情報及びレベル3の意図情報を含み、
前記レベル1の意図情報は言語モデルで認識され、
前記レベル2の意図情報及び前記レベル3の意図情報は、キーワド正規マッチング方法で認識されることを特徴とする、テキストクエリ装置。
【請求項7】
前記特徴情報は、
エンティティ情報及び時間情報のうちの少なくとも一方を含むことを特徴とする、請求項6に記載の装置。
【請求項8】
前記エンティティ情報は、言語モデルによって認識された前記クエリテキストのエンティティ情報であり、及び/又は
前記時間情報は、時間記述情報から解析した時点情報、及び前記時点情報に基づいて前記時間記述情報から解析した時間帯情報のうちの少なくとも一方を含み、前記時間記述情報は、前記クエリテキストから抽出された時間記述情報であることを特徴とする、請求項7に記載の装置。
【請求項9】
前記時点情報は、
前記時間記述情報を正規化して、時間正規化情報を取得し、
前記時間正規化情報に合致する時間解析ルールをクエリし、
前記時間正規化情報に合致する時間解析ルールが複数あれば、予め設定された衝突解決ポリシを用いてターゲット時間解析ルールを選択し、前記時間正規化情報を解析して、前記時点情報を取得し、前記時間正規化情報に合致する時間解析ルールが1つしかなければ、前記時間解析ルールを用いて前記時間正規化情報を解析して、前記時点情報を取得するという方法によって得られることを特徴とする、請求項8に記載の装置。
【請求項10】
前記クエリインタフェースは、ターゲット意図情報が表すターゲット意図をクエリするためのクエリインタフェースであり、前記ターゲット意図情報は、記レベル1の意図情報であり、
前記クエリモジュールは、前記クエリインタフェースにより、前記ターゲット意図に対応するターゲット種別情報において、前記特徴情報に合致するクエリ結果をクエリし、前記ターゲット種別情報の情報種別は、他の意図情報が表す意図に合致し、かつ前記ターゲット種別情報は、前記ターゲット意図に対応する情報であり、前記他の意図情報は、前記図情報のうち、前記ターゲット意図情報以外の意図情報であることを特徴とする、請求項6に記載の装置。
【請求項11】
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信接続されたメモリとを含み、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能で、前記少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに請求項1~5のいずれか1項に記載の方法を実行させることができる命令が記憶されていることを特徴とする、電子機器。
【請求項12】
コンピュータに請求項1~5のいずれか1項に記載の方法を実行させるコンピュータ命令が記憶されていることを特徴とする、非一時的なコンピュータ読み取り可能な記憶媒体。
【請求項13】
コンピュータプログラムであって、
前記コンピュータプログラムがプロセッサにより実行されると、請求項1~5のいずれか1項に記載の方法が実現される、ことを特徴とするコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本願は、コンピュータの技術分野におけるインテリジェント検索の技術分野に関し、特に、テキストクエリ方法、装置、機器及び記憶媒体に関する。
【背景技術】
【0002】
現在のテキストクエリ方法は、主にユーザによる手動クエリ方法であり、具体的には、ユーザは、ページや入力ボックスなどのコンポーネント内でクリック、ドラッグ、テキスト入力などの一連の操作を行わないと、対応するクエリ機能を見つけて、対応するクエリを行うことができない。そのため、現在、テキストクエリのクエリ効率が低い。
【発明の概要】
【0003】
本願は、テキストクエリのクエリ効率が低いという問題を解決するために、テキストクエリ方法、装置、機器及び記憶媒体を提供する。
【0004】
第1の態様に係るテキストクエリ方法は、
クエリテキストの、意図を表す意図情報及び特徴情報を認識することと、
意図情報に基づいて、前記意図をクエリするためのクエリインタフェースを決定することと、
前記クエリインタフェースにより、前記意図に対応する情報において、前記特徴情報に合致するクエリ結果をクエリすることとを含む。
【0005】
第2の態様に係るテキストクエリ装置は、
クエリテキストの、意図を表す意図情報及び特徴情報を認識する認識モジュールと、
意図情報に基づいて、前記意図をクエリするためのクエリインタフェースを決定する決定モジュールと、
前記クエリインタフェースにより、前記意図に対応する情報において、前記特徴情報に合致するクエリ結果をクエリするクエリモジュールとを含む。
【0006】
第3の態様に係る電子機器は、
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信接続されたメモリとを含み、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能で、前記少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに本願に係るテキストクエリ方法を実行させることができる命令が記憶されていることを特徴とする。
【0007】
第4の態様に係る非一時的なコンピュータ読み取り可能な記憶媒体には、本願に係るテキストクエリ方法をコンピュータに実行させるコンピュータ命令が記憶されていることを特徴とする。
【0008】
本願に係る技術手段は、テキストクエリのクエリ効率を向上させる。
【0009】
本部分で説明された内容は、本開示の実施例の主要又は重要な特徴を特定することを意図するものではなく、本開示の範囲を限定することを意図するものでもないことを理解されたい。本開示の他の特徴は、以下の明細書により容易に理解できる。
【図面の簡単な説明】
【0010】
図面は、本解決手段をよりよく理解するためのものであり、本願を限定するものではない。
【0011】
図1】本願に係るテキストクエリ方法のフローチャートである。
図2】本願に係る言語モデルの概略図である。
図3】本願に係る時間情報解析の概略図である。
図4】本願に係るテキストクエリ装置の構造図である。
図5】本願の実施例に係るマルチメディアコンテンツの検索方法を実現するための電子機器のブロック図である。
【発明を実施するための形態】
【0012】
以下、図面を参照しながら本願の例示的な実施例を説明し、理解を容易にするために、本願の実施例の様々な詳細を説明するが、これらが単なる例示的なものと見なされるべきである。したがって、当業者は、本願の範囲及び精神から逸脱することなく、ここで説明された実施例に対して様々な変更及び修正を行うことができることを理解すべきである。同様に、明確さと簡潔さのために、以下の説明では、公知の機能及び構造についての説明を省略する。
【0013】
図1を参照すると、図1は、本願に係るテキストクエリ方法のフローチャートであり、図1に示すように、テキストクエリ方法は、以下のステップS101~S103を含む。
【0014】
ステップS101では、クエリテキストの、意図を表す意図情報及び特徴情報を認識する。
【0015】
上記意図は、上記クエリテキストのクエリ意図を表すことができ、上記意図情報は、クエリテキストから抽出された意図情報であってよく、例えば、クエリテキストが「→先週の李四の旅行記録」である場合、意図情報は旅行、人、記録などの意図情報を含んでよく、或いは、例えば、クエリテキストが「先週の宿泊条件」である場合、意図情報は宿泊などの意図情報を含んでよい。さらに、上記意図情報は、クエリテキストから分析された意図情報を含んでもよく、例えば、クエリテキストが「先週の宿泊条件」である場合、該クエリテキストの意図情報がホテルを含んでよいと認識することができる。
【0016】
上記特徴情報は、クエリテキストの時間、エンティティなどの情報を含んでよい。
【0017】
また、上記クエリテキストは、フリーテキストクエリ語句、自然テキストクエリ語句、又はルールクエリ語句であってよい。
【0018】
さらに、上記クエリテキストは、入力された音声を変換したテキストであってもよく、入力されたテキストであってもよい。
【0019】
ステップS102では、意図情報に基づいて、上記意図をクエリするためのクエリインタフェースを決定する。
【0020】
本願において、複数のクエリインタフェースを予め設定することができ、異なるクエリインタフェースは、異なる意図のクエリ結果をクエリするために用いられる。
【0021】
本願におけるクエリインタフェースは、アプリケーションプログラミングインタフェース(Application Programming Interface,API)であってよい。
【0022】
ステップS103では、上記クエリインタフェースにより、上記意図に対応する情報において、上記特徴情報に合致するクエリ結果をクエリする。
【0023】
上記意図に対応する情報は、該意図に関連する情報であってよく、例えば、旅行意図を例として、該意図に対応する情報は、ルート、天気、フライト情報などの旅行関連の情報を含んでよい。
【0024】
上記特徴情報に合致する上記クエリ結果は、上記意図に対応する情報と上記特徴情報から取得された情報、例えば、テキスト、ピクチャ、又はビデオなどの情報であってもよく、もちろん、これらの情報の組み合わせであってもよい。さらに、上記特徴情報は、上記インタフェースのクエリパラメータとしても理解することができる。
【0025】
本願において、上記ステップにより、意図に対応するクエリ結果で特徴情報に合致するクエリ結果を直接クエリして、テキストクエリの効率を向上させることを実現することができる。
【0026】
例えば、クエリテキストが、
「最近張三と同行した人」、
「先週の李四の旅行記録」、
「張のお父さんは誰ですか?」である場合、
クエリ結果は、具体的な記録情報、関係者の基本情報、関連記事の全文検索情報、関係マップ、行動軌跡などを含んでよい。
【0027】
さらに、本願は、クエリテキストとの類似性スコアに応じてクエリ結果を順序付けることもできる。
【0028】
なお、本願に係るテキストクエリ方法は、サーバ、コンピュータ、携帯電話などの電子機器に適用することができる。
【0029】
好ましい実施形態として、上記特徴情報は、
エンティティ情報及び時間情報のうちの少なくとも一方を含む。
【0030】
上記エンティティ情報は、上記クエリテキストのエンティティを表すことができ、これらのエンティティは、人物、イベント、場所、オブジェクト、ケースなどの種別のエンティティであってよい。
【0031】
上記時間情報は、上記クエリテキストに対応する時間、例えば時点又は時間帯を表すことができる。
【0032】
該実施形態では、上記意図に対応する情報において、エンティティ情報及び時間情報のうちの少なくとも一方に合致するクエリ結果をクエリすることで、クエリ結果の正確性を向上させることができる。
【0033】
好ましくは、上記エンティティ情報は、言語モデルによって認識された上記クエリテキストのエンティティ情報である。
【0034】
上記言語モデルは、深層学習ニューラルネットワークモデル、リカレントニューラルネットワークモデルであってよい。例えば、図2に示すネットワークモデルであってよいが、当然のことながら、図2は単なる例であり、本願では言語モデルは限定されない。
【0035】
また、上記言語モデルは、深層学習又は条件付き確率場(crf)により構築された言語モデルであってよい。
【0036】
深層学習により構築された言語モデルを例として、訓練プロセスにおいて、語句の各文字又は単語に対して対応ラベルを付けることができ、具体的には、シーケンスツーシーケンス(sequence to sequence)モデルを使用することができる。
【0037】
長短期記憶ネットワーク(Long Short-Term Memory、LSTM)言語モデルを例として、教師ありコーパスを訓練する。
【0038】
例えば、「先週の李四の旅行記録」について、先週->「時間」、「李四」->「名前」、「旅行」->「行動タイプ」、記録->「default」。
【0039】
すると、この例は、教師ありラベル付きデータであり、LSTM言語モデルでは、単語分割後のコーパスに対して言語モデルを構築してもよく、単語分割を行わずにワードベクトルで言語モデルを構築してもよい。
【0040】
条件付き確率場の方法の場合、単語分割後のコーパスを使用して言語モデルを構築することができる。
【0041】
該実施形態では、言語モデルによりエンティティ情報を認識するため、エンティティ情報の正確性を向上させることができ、エンティティ情報を迅速に認識することもできる。
【0042】
なお、本願において、言語モデルによりエンティティ情報を認識することに限定されず、他の方法でエンティティ情報を認識することもでき、例えば、意味認識技術により、クエリテキストのエンティティ情報を認識する。
【0043】
好ましくは、上記時間情報は、時間記述情報から解析した時点情報、及び上記時点情報に基づいて上記時間記述情報から解析した時間帯情報のうちの少なくとも一方を含み、上記時間記述情報は、上記クエリテキストから抽出された時間記述情報である。
【0044】
上記時点情報を解析することは、予め設定された時間粒度に基づいて解析することであってよく、時間粒度情報は、表1示すとおりである。
【0045】
【表1】
【0046】
上記時間帯情報は、上記時点情報に基づいて時点を決定し、そして時間記述情報のキーワード(例えば、から、までなど)に基づいて決定された具体的な時間帯情報であってよく、上記時間帯情報を解析することは、単一時点、同じタイプの2つの時点、又は異なるタイプの2つの時点などの方法で解析することであってよく、例えば、表2に示すとおりである。
【0047】
【表2】
【0048】
上記時間記述情報は、上記クエリテキストから抽出された時間関連情報であってよい。例えば、言語モデルによる抽出又は意味解析方法による抽出などであってよく、これは限定されない。
【0049】
該実施形態では、時点情報及び時間帯情報のうちの少なくとも一方を解析して得ることができるため、時間情報の正確性を向上させることができ、さらに、クエリ結果の正確性を向上させることができる。
【0050】
好ましくは、上記時点情報は、
上記時間記述情報を正規化して、時間正規化情報を取得し、
上記時間正規化情報に合致する時間解析ルールをクエリし、
上記時間正規化情報に合致する時間解析ルールが複数あれば、予め設定された衝突解決ポリシを用いてターゲット時間解析ルールを選択し、上記時間正規化情報を解析して、上記時点情報を取得し、上記時間正規化情報に合致する時間解析ルールが1つしかなければ、上記時間解析ルールを用いて上記正規化情報を解析して、上記時点情報を取得するという方法によって得られる。
【0051】
上記時間記述情報を正規化して、時間正規化情報を取得することは、時間情報を同じタイプの時間情報に正規化することであってよく、例えば、大文字の時間情報を数字で表される時間情報に正規化する。
【0052】
該実施形態では、複数の時間解析ルール、例えば、時間粒度の異なる時間解析ルールを予め設定することができ、当然のことながら、同一時間粒度に対して複数の時間解析ルールを設定することができるが、これは限定されない。また、異なる時間解析ルールから解析した時点情報のタイプは異なってよく、例えば、一部の時間解析ルールから年、月、日、時を解析することができるが、別の時間解析ルールから月、日、時などを解析することができる。
【0053】
上記時間正規化情報に合致する時間解析ルールをクエリすることは、予め設定された複数の時間解析ルールにおいて、上記時間正規化情報を解析できる時間解析ルールをクエリすることであってよい。
【0054】
上記時間正規化情報に合致する時間解析ルールが複数あれば、予め設定された衝突解決ポリシを用いてターゲット時間解析ルールを選択し、上記時間正規化情報を解析することは、複数の時間解析ルールにおいて、時間粒度の最も小さい時間解析ルールをターゲット時間解析ルールとして選択して解析することであってよく、当然のことながら、これは限定されず、例えば、時間粒度の2番目に小さい時間解析ルールをターゲット時間解析ルールとして選択して解析することもでき、具体的には、上記衝突解決ポリシを予め設定することができる。
【0055】
該実施形態では、上記衝突解決ポリシによりターゲット時間解析ルールを選択して正規化情報を解析することで、時間情報が衝突して不正確になるという問題を解決することができる。
【0056】
例えば、図3に示すように、時点情報及び時間帯情報について、時間記述抽出、正規化、ルール適合、衝突解決、時点解析、及び時間帯解析などのプロセスにより、正確な時間情報を取得することができる。
【0057】
さらに、該実施形態では、時間記述情報を正規化するため、時間情報解析の正確性を向上させることができる。
【0058】
好ましい実施形態として、上記意図情報は、マルチレベルの意図情報を含み、上記クエリインタフェースは、ターゲット意図情報が表すターゲット意図をクエリするためのクエリインタフェースであり、上記ターゲット意図情報は、上記マルチレベルの意図情報のうちのレベル1の意図情報であり、
上記クエリインタフェースにより、上記意図に対応する情報において、上記特徴情報に合致するクエリ結果をクエリすることは、
上記クエリインタフェースにより、上記ターゲット意図に対応するターゲット種別情報において、上記特徴情報に合致するクエリ結果をクエリすることを含み、上記ターゲット種別情報の情報種別は、他の意図情報が表す意図に合致し、かつ上記ターゲット種別情報は、上記ターゲット意図に対応する情報であり、上記他の意図情報は、上記マルチレベルの意図情報のうち、上記ターゲット意図情報以外の意図情報である。
【0059】
上記マルチレベルの意図情報は、認識されるクエリテキストの意図、及び具体的な条件を表す。また、上記マルチレベルの意図情報は、3つのレベルの意図情報、例えば、
レベル1の意図種別:人、オブジェクト、記録など、
レベル2の意図種別:社会背景、関連関係など、
及び第3のレベル3の意図種別:旅行、宿泊などを含んでよい。
【0060】
上記ターゲット意図情報は、旅行、宿泊、天気などのレベル3の意図であってよい。
【0061】
さらに、同じ又は異なる方法で、異なるレベルの意図情報を認識することができ、例えば、svm/lstm言語モデルなどの言語モデルによりレベル1の意図情報を認識することができ、キーワド正規マッチング方法でレベル2/レベル3の意図を認識することができ、当然のことながら、これは限定されない。
【0062】
上記ターゲット意図情報が旅行であり、他の意図情報が人及び社会背景を含む場合を例として、旅行に対応する情報において、情報種別が人、社会背景である関連情報をクエリすることができる。
【0063】
該実施形態では、クエリインタフェースは内部インタフェースであってよく、これらの内部インタフェースは、drools又は他のルールファイルなどのルールファイル内で定義することができる。
【0064】
上記ターゲット意図情報(例えば、レベル3の意図)の種別がある条件を満たすと、対応する内部インタフェースをトリガし、自動的に呼び出し、対応するクエリ結果をクエリする。
【0065】
該実施形態では、対応する種別情報においてクエリするだけで、マルチレベルの意図情報を取得することができるため、テキストクエリの効率がさらに向上する。
【0066】
次に、「旅行(chuxing)」種別のクエリルールを定義する。クエリテキスト(query)が、レベル1の意図が人であり、レベル3の意図が旅行であることを満たす場合に、指定された内部apiを実行する。クエリ要素(queryElement)は、エンティティ認識と時間解析結果を含む。このようにして、旅行という意図に対応するインタフェースを呼び出し、該インタフェースにより、旅行に対応する情報において、人という種別に合致し、かつ特徴情報に合致するクエリ結果をクエリする。
【0067】
また、複数のクエリインタフェースが同時にトリガ及び実行される場合に、属性(例えば、salience属性)を設定することで優先度を指定することができる。
【0068】
本願において、上記方法により、意図に対応するクエリ結果で特徴情報に合致するクエリ結果を直接クエリして、テキストクエリの効率を向上させることを実現することができる。
【0069】
図4は、本願に係るテキストクエリ装置の構造図であり、図4に示すように、テキストクエリ装置400は、
クエリテキストの、意図を表す意図情報及び特徴情報を認識する認識モジュール401と、
意図情報に基づいて、上記意図をクエリするためのクエリインタフェースを決定する決定モジュール402と、
上記クエリインタフェースにより、上記意図に対応する情報において、上記特徴情報に合致するクエリ結果をクエリするクエリモジュール403とを含む。
【0070】
好ましくは、上記特徴情報は、
エンティティ情報及び時間情報のうちの少なくとも一方を含む。
【0071】
好ましくは、上記エンティティ情報は、言語モデルによって認識された上記クエリテキストのエンティティ情報であり、及び/又は
上記時間情報は、時間記述情報から解析した時点情報、及び上記時点情報に基づいて上記時間記述情報から解析した時間帯情報のうちの少なくとも一方を含み、上記時間記述情報は、上記クエリテキストから抽出された時間記述情報である。
【0072】
好ましくは、上記時点情報は、
上記時間記述情報を正規化して、時間正規化情報を取得し、
上記時間正規化情報に合致する時間解析ルールをクエリし、
上記時間正規化情報に合致する時間解析ルールが複数あれば、予め設定された衝突解決ポリシを用いてターゲット時間解析ルールを選択し、上記時間正規化情報を解析して、上記時点情報を取得し、上記時間正規化情報に合致する時間解析ルールが1つしかなければ、上記時間解析ルールを用いて上記正規化情報を解析して、上記時点情報を取得するという方法によって得られる。
【0073】
好ましくは、上記意図情報は、マルチレベルの意図情報を含み、上記クエリインタフェースは、ターゲット意図情報が表すターゲット意図をクエリするためのクエリインタフェースであり、上記ターゲット意図情報は、上記マルチレベルの意図情報のうちのレベル1の意図情報であり、
上記クエリモジュール403は、上記クエリインタフェースにより、上記ターゲット意図に対応するターゲット種別情報において、上記特徴情報に合致するクエリ結果をクエリし、上記ターゲット種別情報の情報種別は、他の意図情報が表す意図に合致し、かつ上記ターゲット種別情報は、上記ターゲット意図に対応する情報であり、上記他の意図情報は、上記マルチレベルの意図情報のうち、上記ターゲット意図情報以外の意図情報である。
【0074】
本実施例に係る装置は、本願における方法の実施例において実現される各プロセスを実現することができ、かつ同様の有益な効果を達成することができ、重複を避けるために、ここでは説明を省略する。
【0075】
本願の実施例によれば、本願は、電子機器と読み取り可能な記録媒体をさらに提供する。
【0076】
図5に示すように、本願の実施例に係るテキストクエリ方法の電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ、その他の適切なコンピュータなどの、様々な形式のデジタルコンピュータを表すことを意図している。電子機器は、パーソナルデジタル処理、セルラー電話、スマートフォン、ウェアラブルデバイス、及びその他の類似するコンピューティングデバイスなどの、様々な形式のモバイルデバイスを表すこともできる。本明細書で示されるコンポーネントと、それらの接続及び関係と、それらの機能とは例示的なものに過ぎず、本明細書で説明及び/又は特許請求された本願の実施形態を制限することを意図しない。
【0077】
図5に示すように、該電子機器は、1つ又は複数のプロセッサ501と、メモリ502と、高速インタフェース及び低速インタフェースを含む、各コンポーネントを接続するインタフェースとを含む。各コンポーネントは、異なるバスを介して相互に接続され、共通のマザーボードに取り付けられてもよく、必要に応じて他の方法で取り付けられてもよい。プロセッサは、メモリ内又はメモリに記憶されて、外部入力/出力装置(例えば、インタフェースに結合された表示装置)にGUIのグラフィック情報を表示する命令を含む、電子機器内で実行される命令を処理することができる。他の実施形態では、必要があれば、複数のプロセッサ及び/又は複数のバスを複数のメモリと共に使用することができる。同様に、複数の電子機器が接続されてよく、各機器は、(例えば、サーバアレイ、ブレードサーバのグループ、又はマルチプロセッサシステムとして)必要な操作の一部を提供する。図5では、1つのプロセッサ501を例とする。
【0078】
メモリ502は、本願に係る非一時的なコンピュータ読み取り可能な記憶媒体である。上記メモリには、少なくとも1つのプロセッサによって実行されると、上記少なくとも1つのプロセッサに本願に係るテキストクエリ方法を実行させる命令が記憶されている。本願に係る非一時的なコンピュータ読み取り可能な記憶媒体には、コンピュータに本願に係るテキストクエリ方法を実行させるコンピュータ命令が記憶されている。
【0079】
メモリ502は、非一時的なコンピュータ読み取り可能な記憶媒体として、非一時的ソフトウェアプログラム、非一時的なコンピュータ実行可能プログラム及びモジュール、例えば、本願の実施例におけるテキストクエリ方法に対応するプログラム命令/モジュール(例えば、図4に示す認識モジュール401、決定モジュール402及びクエリモジュール403)を記憶することができる。プロセッサ501は、メモリ502内に記憶された非一時的ソフトウェアプログラム、命令及びモジュールを実行することにより、サーバの各機能アプリケーション及びデータ処理を実行し、即ち、上記方法の実施例におけるテキストクエリ方法を実現する。
【0080】
メモリ502は、オペレーティングシステム、少なくとも1つの機能に必要なアプリケーションを記憶できるプログラム記憶領域と、テキストクエリ方法を採用する電子機器の使用に基づいて作成されたデータなどを記憶できるデータ記憶領域とを含んでよい。さらに、メモリ502は、高速ランダムアクセスメモリを含んでもよく、少なくとも1つの磁気ディスク記憶装置、フラッシュメモリ装置、又は他の非一時的固体メモリ装置などの非一時的メモリを含んでもよい。いくつかの実施例では、メモリ502は、好ましくは、プロセッサ501に対して遠隔設置されたメモリを含んでよく、これらのリモートメモリは、ネットワークを介してテキストクエリ方法を採用する電子機器に接続することができる。上記ネットワークの例は、インターネット、企業イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びそれらの組み合わせを含むが、これらに限定されない。
【0081】
テキストクエリ方法を採用する電子機器は、入力装置503及び出力装置504をさらに含んでよい。プロセッサ501、メモリ502、入力装置503、及び出力装置504は、バス又は他の方法で接続することができ、図5では、バスによる接続を例とする。
【0082】
入力装置503は、入力された数字又は文字情報を受信し、かつテキストクエリ方法を採用する電子機器のユーザ設定及び機能制御に関連するキー信号入力を生成することができ、入力装置は、例えば、タッチスクリーン、テンキー、マウス、トラックパッド、タッチパッド、ポインティングスティック、1つ又は複数のマウスボタン、トラックボール、ジョイスティックである。出力装置504は、表示装置、補助照明装置(例えば、LED)、触覚フィードバック装置(例えば、振動モータ)などを含んでよい。該表示装置は、液晶ディスプレイ(LDC)、発光ダイオード(LED)ディスプレイ、及びプラズマディスプレイを含んでよいが、これらに限定されない。いくつかの実施形態では、表示装置はタッチスクリーンであってよい。
【0083】
本明細書で説明されたシステム及び技術の各実施形態は、デジタル電子回路システム、集積回路システム、専用ASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせで実現することができる。これらの様々な実施形態は、1つ又は複数のコンピュータプログラムでの実施を含んでよく、該1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステム上で実行及び/又は解釈することでき、該プログラマブルプロセッサは、専用又は汎用のプログラマブルプロセッサであってよく、記憶システム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータ及び命令を受信し、かつデータ及び命令を該記憶システム、該少なくとも1つの入力装置、及び該少なくとも1つの出力装置に送信することができる。
【0084】
これらのコンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとも呼ばれる)は、プログラマブルプロセッサの機械命令を含み、高水準手続き型プログラミング言語及び/又はオブジェクト指向のプログラミング言語、及び/又はアセンブリ言語/機械語によって実行することができる。本明細書で使用された用語「機械読み取り可能な媒体」及び「コンピュータ読み取り可能な媒体」は、機械命令及び/又はデータをプログラマブルプロセッサに提供する任意のコンピュータプログラム製品、機器、及び/又は装置(例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD))を指し、機械読み取り可能な信号である機械命令を受信する機械読み取り可能な媒体を含む。用語「機械読み取り可能な信号」は、機械命令及び/又はデータをプログラマブルプロセッサに提供する任意の信号を指す。
【0085】
ユーザとの対話を提供するために、本明細書で説明されたシステム及び技術をコンピュータ上で実行することができ、該コンピュータは、ユーザに情報を表示する表示装置(例えば、CRT(ブラウン管)又はLCD(液晶ディスプレイ)モニタ)と、キーボード及びポインティングデバイス(例えば、マウス又はトラックボール)とを有し、ユーザは、該キーボードと該ポインティングデバイスによりコンピュータに入力を提供することができる。他のタイプの装置も、ユーザとの対話を提供することができ、例えば、ユーザに提供されるフィードバックは、任意の形式の感覚フィードバック(例えば、視覚的フィードバック、聴覚的フィードバック、又は触覚的フィードバック)であってよく、また、任意の形式(音響入力、音声入力、又は触覚入力を含む)でユーザからの入力を受信することができる。
【0086】
本明細書で説明されたシステム及び技術は、バックエンドコンポーネントを(例えば、データサーバとして)含むコンピューティングシステム、又はミドルウェアコンポーネント(例えば、アプリケーションサーバ)を含むコンピューティングシステム、又はフロントエンドコンポーネント(例えば、それを介して、ユーザが本明細書で説明されたシステム及び技術の実施形態と対話できるグラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ)を含むコンピューティングシステム、又はこのようなバックエンドコンポーネント、ミドルウェアコンポーネント、若しくはフロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムで実行することができる。任意の形式又は媒体のデジタルデータ通信(例えば、通信ネットワーク)を介してシステムのコンポーネントを相互に接続することができる。通信ネットワークの例は、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、及びインターネットを含む。
【0087】
コンピュータシステムは、クライアントとサーバを含んでよい。クライアントとサーバは通常、互いに遠く離れ、かつ一般的には通信ネットワークを介して対話する。対応するコンピュータ上で実行し、相互にクライアント-サーバの関係を持つコンピュータプログラムによりクライアントとサーバの関係を生成する。
【0088】
本願の実施例の技術手段によれば、意図に対応するクエリ結果で特徴情報に合致するクエリ結果を直接クエリして、テキストクエリの効率を向上させることを実現することができる。
【0089】
上述した各形式のフローを使用して、ステップを並べ替え、追加、又は削除することができることを理解されたい。例えば、本願に開示されている技術手段の所望の結果を達成できる限り、本願に記載の各ステップは、並行して、順次、又は異なる順序で実行されてよいが、本明細書はこれを限定しない。
【0090】
上記具体的な実施形態は、本願の保護範囲を限定するものではない。当業者は、設計要件及び他の要因に応じて、様々な修正、組み合わせ、部分組み合わせ及び置換を行うことができることを理解すべきである。本願の精神及び原則の範囲内で行われた修正、同等置換、及び改良などは、いずれも本願の保護範囲に含まれるべきである。
図1
図2
図3
図4
図5