IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ リップコード インコーポレイテッドの特許一覧

特開2022-65108電子記録の文脈検索のためのシステム及び方法
<>
  • 特開-電子記録の文脈検索のためのシステム及び方法 図1
  • 特開-電子記録の文脈検索のためのシステム及び方法 図2
  • 特開-電子記録の文脈検索のためのシステム及び方法 図3
  • 特開-電子記録の文脈検索のためのシステム及び方法 図4
  • 特開-電子記録の文脈検索のためのシステム及び方法 図5
  • 特開-電子記録の文脈検索のためのシステム及び方法 図6
  • 特開-電子記録の文脈検索のためのシステム及び方法 図7
  • 特開-電子記録の文脈検索のためのシステム及び方法 図8
  • 特開-電子記録の文脈検索のためのシステム及び方法 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022065108
(43)【公開日】2022-04-26
(54)【発明の名称】電子記録の文脈検索のためのシステム及び方法
(51)【国際特許分類】
   G06F 16/90 20190101AFI20220419BHJP
   G06F 16/36 20190101ALI20220419BHJP
【FI】
G06F16/90 100
G06F16/36
【審査請求】有
【請求項の数】16
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2022022532
(22)【出願日】2022-02-17
(62)【分割の表示】P 2019506714の分割
【原出願日】2017-08-09
(31)【優先権主張番号】62/372,565
(32)【優先日】2016-08-09
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/372,577
(32)【優先日】2016-08-09
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/372,571
(32)【優先日】2016-08-09
(33)【優先権主張国・地域又は機関】US
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.ANDROID
(71)【出願人】
【識別番号】518208233
【氏名又は名称】リップコード インコーポレイテッド
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】モスクウィンスキー,マイケル
(72)【発明者】
【氏名】フィールディング,アレックス
(72)【発明者】
【氏名】ホール,ケビン,クリストファー
(72)【発明者】
【氏名】レンボ,キンバリー
(57)【要約】
【課題】電子記録の文脈的検索のためのシステム及び方法を向上させる。
【解決手段】電子記録の文脈的検索のためのシステム及び方法が提供されている。本明細書において提供されているシステム及び方法は、(i)自然言語処理(NLP)モデル、(ii)ユーザーの振る舞い、及び/又は(iii)ユーザー、記録、及び/又は専門分野の間などの、サーチに関与する様々なエンティティの間の関係に基づいて、サーチクエリ及び/又はサーチ結果を改善することができる。改善されたサーチクエリは、サーチクエリのタイプに相対的に固有である、又はこれとの相対的に高度な互換性を有する、メカニズムを使用して実行することができる。サーチ結果は、文脈的な関連性を有することができる。サーチ結果は、ユーザーに固有のものであってもよい。
【選択図】図1
【特許請求の範囲】
【請求項1】
サーチクエリに基づいて電子記録を文脈的に検索するコンピュータ実装された方法であって、
(a)1つ又は複数のコンピュータプロセッサの支援により、クエリタイプの自然言語処理(NLP)モデル定義に少なくとも基づいて前記サーチクエリの前記クエリタイプを判定することと、
(b)クエリタイプのレジストリにアクセスすることであって、前記レジストリは、クエリタイプを実行方法にマッピングしており、且つ、それぞれのクエリタイプと関連する優先順位重み値と実行方法のペアを前記レジストリ内において有する、ことと、
(c)前記クエリタイプにマッピングされた1つ又は複数の実行方法を解明することと、
(d)サーチ結果として複数の電子記録を検索するべく、前記クエリタイプにマッピングされた前記1つ又は複数の実行方法を使用して前記サーチクエリを実行することであって、前記複数の電子記録のうちの所与の電子記録は、前記所与の電子記録を検索するべく使用される前記実行方法と関連する前記優先順位重み値によって重み付けされている、ことと、
(e)前記複数の電子記録の優先順位重み値に少なくとも部分的に基づいて前記複数の電子記録を表示することと、
を有する方法。
【請求項2】
(d)の前に、前記サーチクエリ内において元々存在していない1つ又は複数のキーワードを付加することにより、或いは、分類法フィルタを付加することにより、前記サーチクエリを改善することを更に有する請求項1に記載の方法。
【請求項3】
前記1つ又は複数のキーワードは、前記サーチクエリを提供したユーザーのユーザー振る舞いデータに少なくとも部分的に基づいている請求項2に記載の方法。
【請求項4】
(d)の前に、
前記サーチクエリに対応する第1のNLPモデルを判定することであって、前記第1のNLPモデルは、1つ又は複数のキーワードの第1の組に対応しており、前記サーチクエリのコンポーネントは、前記1つ又は複数のキーワードの第1の組の少なくとも1つのキーワードにマッチングしている、ことと、
前記第1のNLPモデルに近接した第2のNLPモデルを判定することであって、前記第2のNLPモデルは、1つ又は複数のキーワードの第2の組に対応しており、前記第1のNLPモデル及び第2のNLPモデルは、既定の閾値以上の重み値を有する近接性関係を有する、ことと、
前記サーチクエリ内において元々存在していない前記1つ又は複数のキーワードの第2の組のキーワードにより、前記サーチクエリを改善することと、
を更に有する請求項2に記載の方法。
【請求項5】
(d)の前に、前記分類法フィルタを判定するべく、NLPモデル定義を使用して前記サーチクエリに対して分類法抽出を実行することを更に有する請求項2に記載の方法。
【請求項6】
前記NLPモデル定義は、発話の一部のパターン又は正規表現のパターンに少なくとも部分的に基づいている請求項5に記載の方法。
【請求項7】
前記実行方法は、キーワードサーチ及びグラフサーチを有する請求項1に記載の方法。
【請求項8】
前記グラフサーチは、前記複数の電子記録、前記サーチクエリを提供したユーザー、又はこれらの両方に文脈的に関連する更なる電子記録を検索するべく、1つ又は複数のエンティティ及び前記1つ又は複数のエンティティの間の文脈関係を有するグラフデータベースを調査することを有する請求項1に記載の方法。
【請求項9】
前記1つ又は複数のエンティティは、記録、ユーザー、及び専門分野からなる群からの少なくとも1つの構成要素である請求項8に記載の方法。
【請求項10】
前記クエリタイプの前記NLPモデル定義は、発話の一部のパターンに少なくとも基づいている請求項1に記載の方法。
【請求項11】
サーチクエリに基づいて電子記録を文脈的に検索するコンピュータシステムであって、
1つ又は複数のプロセッサと、
電子記録を分類する方法を実装するべく、個々に又は集合的に、前記1つ又は複数のプロセッサによって実行可能である命令を含む、前記1つ又は複数のプロセッサに通信自在に結合されたメモリと、
を有し、
前記方法は、
(a)ユーザーから、コンピュータネットワーク上において、前記サーチクエリを受け取ることと、
(b)グラフデータベースから、自然言語処理(NLP)モデルライブラリにアクセスすることであって、前記NLPモデルライブラリは、複数のNLPモデルを有しており、前記複数のNLPモデルのうちの所与のNLPモデルは、キーワードの1つ又は複数の組に対応している、ことと、
(c)前記サーチクエリに対応する第1のNLPモデルを判定するべく、前記サーチクエリを前記NLPモデルライブラリに照らしてマッチングすることであって、前記サーチクエリのコンポーネントは、前記第1のNLPモデルの前記キーワードの1つ又は複数の組のうちの少なくとも1つのキーワードとマッチングしている、ことと、
(d)前記第1のNLPモデルに近接した1つ又は複数のその他のNLPモデルを判定することであって、前記第1のNLPモデル及び前記1つ又は複数のその他のNLPモデルのそれぞれは、既定の閾値以上の重み値を有する近接性関係を有する、ことと、
(e)前記サーチクエリ内において元々存在していない前記1つ又は複数のその他のNLPモデルに対応する1つ又は複数のキーワードを付加することにより、前記サーチクエリを改善することと、
(f)サーチ結果として複数の電子記録を検索するべく、前記改善されたサーチクエリを実行することと、
(g)ユーザーに対して、前記1つ又は複数のプロセッサに通信自在に結合されたグラフィカルユーザーインターフェイス上において、前記複数の電子記録を表示することと、
を有する、コンピュータシステム。
【請求項12】
前記方法は、
前記1つ又は複数のコンピュータプロセッサの支援により、前記クエリタイプの自然言語処理(NLP)モデル定義に少なくとも基づいて前記サーチクエリのクエリタイプを判定することと、
クエリタイプのレジストリにアクセスすることであって、前記レジストリは、クエリタイプを実行方法にマッピングしており、且つ、それぞれのクエリタイプと関連する優先順位重み値と実行方法のペアを前記レジストリ内において有する、ことと、
前記複数の電子記録を検索するべく、前記クエリタイプにマッピングされた前記1つ又は複数の実行方法を使用して前記改善されたサーチクエリを実行することであって、前記複数の電子記録のうちの所与の電子記録は、前記所与の電子記録を検索するべく使用される前記実行方法と関連する前記優先順位重み値によって重み付けられている、ことと、
を更に有し、
前記複数の電子記録は、前記複数の電子記録の優先順位重み値に少なくとも部分的に基づいた順序において表示される請求項11に記載のコンピュータシステム。
【請求項13】
前記実行方法は、キーワードサーチ及びグラフサーチを有する請求項12に記載のコンピュータシステム。
【請求項14】
前記グラフサーチは、前記複数の電子記録、前記サーチクエリを提供したユーザー、又はこれらの両方に文脈的に関連する更なる電子記録を検索するべく、1つ又は複数のエンティティ及び前記1つ又は複数のエンティティの間の文脈的関係を有するグラフデータベースを調査することを有する請求項13に記載の方法。
【請求項15】
前記1つ又は複数のエンティティは、記録、ユーザー、及び専門分野からなる群からの少なくとも1つの構成要素である請求項14に記載の方法。
【請求項16】
前記サーチクエリは、前記ユーザーのユーザー振る舞いデータに少なくとも部分的に基づいた1つ又は複数のキーワードを付加することにより、更に改善される請求項11に記載のコンピュータシステム。
【請求項17】
前記ユーザー振る舞いデータは、グラフデータベース内において保存されており、且つ、これからアクセスされる請求項16に記載のコンピュータシステム。
【請求項18】
前記方法は、(f)の前に、前記ユーザー振る舞いデータを判定するべく、前記ユーザーに対してユーザー振る舞いフィードバックループを実行することを更に有する請求項16に記載のコンピュータシステム。
【請求項19】
前記方法は、(g)の後に、ユーザー振る舞いデータを前記ユーザーから受け取ることを更に有する請求項16に記載のコンピュータシステム。
【請求項20】
前記ユーザー振る舞いデータは、前記複数の電子記録のうちの電子記録が選択されたのか又は選択されなかったのかに関するデータ、前記複数の電子記録の選択された電子記録を閲覧するべく使用された時間、及び記録においてユーザーが実行したスクロール又はページングの程度のうちの少なくとも1つを有する請求項18に記載のコンピュータシステム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
[0001] 本出願は、2016年8月9日付けで出願された米国仮特許出願第62/372,565号、2016年8月9日付けで出願された米国仮特許出願第62/372,571号、及び2016年8月9日付けで出願された米国仮特許出願第62/372,577号の利益を主張するものであり、これらの出願は、引用により、そのすべてが本明細書に包含される。
【背景技術】
【0002】
発明の背景
[0002] 情報は、多くの場合に、物理的な文書ファイル上において保存することができる。但し、このような物理的保存システムは、不定の持続時間にわたる極めて大容量の空間の利用可能性を必要としうる。例えば、物理的文書ファイルは、記録保管所、倉庫、図書館、及び/又は貯蔵所内において、離れた状態で、梱包される場合がある。また、物理的文書は、一旦保存されたら、文書の損傷、破壊、又は劣化(例えば、自然な劣化)を防止するなどのために、定期的な保守を必要としうる。更には、物理的文書ファイル上において保存されている情報のアクセスには、費用及び時間を所要しうる。物理的文書は、発見及び搬送が困難でありうるのみならず、物理的文書が識別された後の、物理的ファイルからの情報の抽出にも、時間を所要しうる。
【0003】
[0003] 代替肢として、物理的文書からの情報は、電子媒体に転送することができると共に、メモリ内において保存することができる。いくつかの例においては、情報は、電子的に生成及び保存することができる。この結果、保存の際の保存空間及び保守に対するニーズを除去することができる。情報は、このような電子記録から電子的にサーチすることができる。例えば、ユーザーによって提供されるサーチクエリに応答してサーチ結果を検索することができる。
【発明の概要】
【発明が解決しようとする課題】
【0004】
発明の概要
[0004] 電子記録として保存される場合にも、ソートするべき無数のその他の電子記録が存在している際には、特定の情報、及び/又は文書の発見及び隔離が困難になりうる。ユーザー提供のサーチクエリに応答して検索されたサーチ結果は、いくつかの側面において、ユーザー提供のサーチクエリと関連性を有しうるが、このような関連性は、しばしば、非常に希薄となる可能性があり、或いは、サーチ結果が、まったく誤った側面において関連性を有する可能性もある。ユーザーが探している正確な情報を見出するべく、ユーザーがサーチクエリを反復的に生成し直さなければならないことは、珍しいことではない。複数のサーチクエリを実行した後にも、ユーザーが、依然として、求めている情報を発見できない場合もある。これは、ユーザーの側における相当な時間及び努力に結び付く可能性がある。本明細書においては、少なくとも以上において識別されている問題点に対処する、電子記録の文脈検索用のシステム及び方法に対するニーズが認識されている。
【0005】
[0005] 本明細書において提供されているシステム及び方法は、ユーザークエリの文脈的な処理、及び/又は自然言語に基づいた処理に少なくとも部分的に基づいて電子記録を文脈的に検索することができる。電子記録は、ユーザーの振る舞いに少なくとも部分的に基づいて検索することができる。検索されたサーチ結果は、文脈固有のものでありうる。検索されたサーチ結果は、ユーザー固有のものでありうる。
【課題を解決するための手段】
【0006】
[0006] 本明細書において提供されているシステム及び方法は、(i)自然言語処理(NLP:Natural Language Processing)モデル、(ii)ユーザーの振る舞い、及び/又は(iii)ユーザー、記録、及び/又は専門分野の間などの、サーチに関与する様々なエンティティの間の関係に基づいたサーチクエリ、及び/又はサーチ結果の改善を許容している。本明細書において提供されているシステム及び方法は、サーチクエリのタイプに相対的に固有である、又はこれとの間において相対的に高度な互換性を有する、メカニズムを使用した改善されたサーチクエリの実行を許容している。有益には、サーチ結果は、相対的に高度な正確性を有することができる、及び/又はユーザー及び/又は文脈に対して相対的に個人化されたものとなりうる。
【0007】
[0007] 一態様においては、サーチクエリに基づいて電子記録を文脈的に検索するコンピュータ実装された方法が提供されており、方法は、1つ又は複数のコンピュータプロセッサの支援により、クエリタイプの自然言語処理(NLP)モデル定義に少なくとも部分的に基づいてサーチクエリのクエリタイプを判定することと、クエリタイプのレジストリにアクセスすることであって、レジストリは、クエリタイプを実行方法にマッピングしており、且つ、それぞれのクエリタイプと関連する優先順位重み値と実行方法のペアをレジストリ内において有する、ことと、クエリタイプにマッピングされた1つ又は複数の実行方法を解明することと、サーチ結果として複数の電子記録を検索するべく、クエリタイプにマッピングされた1つ又は複数の実行方法を使用してサーチクエリを実行することであって、複数の電子記録のうちの所与の電子記録は、所与の電子記録を検索するべく使用される実行方法と関連する優先順位重み値によって重み付けされている、ことと、複数の電子記録の優先順位重み付け値に少なくとも部分的に基づいて複数の電子記録を表示することと、を有する。
【0008】
[0008] いくつかの実施形態においては、方法は、実行の前に、サーチクエリ内において元々存在していない1つ又は複数のキーワードを付加することにより、或いは、分類法フィルタを付加することにより、サーチクエリを改善することを更に有することができる。
【0009】
[0009] いくつかの実施形態においては、1つ又は複数のキーワードは、サーチクエリを提供するユーザーのユーザー振る舞いデータに少なくとも部分的に基づいている。
【0010】
[0010] いくつかの実施形態においては、方法は、実行の前に、サーチクエリに対応する第1のNLPモデルを判定することであって、第1のNLPモデルは、1つ又は複数のキーワードの第1の組に対応しており、サーチクエリのコンポーネントは、1つ又は複数のキーワードの第1の組のうちの少なくとも1つのキーワードとマッチングしている、ことと、第1のNLPモデルに近接した第2のNLPモデルを判定することであって、第2のNLPモデルは、1つ又は複数のキーワードの第2の組に対応しており、第1のNLPモデル及び第2のNLPモデルは、既定の閾値以上の重み値を有する近接性関係を有している、ことと、サーチクエリ内において元々存在していない1つ又は複数のキーワードの第2の組のキーワードによってサーチクエリを改善することと、を更に有することができる。
【0011】
[0011] いくつかの実施形態においては、方法は、実行の前に、分類法フィルタを判定するべく、NLPモデル定義を使用して分類法抽出をサーチクエリに対して実行することを更に有することができる。
【0012】
[0012] いくつかの実施形態においては、NLPモデル定義は、発話の一部のパターン又は正規表現のパターンに少なくとも部分的に基づいている。
【0013】
[0013] いくつかの実施形態においては、実行方法は、キーワードサーチ及びグラフサーチを有する。
【0014】
[0014] いくつかの実施形態においては、グラフサーチは、複数の電子記録、サーチクエリを提供するユーザー、又はこれらの両方と文脈的に関連している更なる電子記録を検索するべく、1つ又は複数のエンティティ及び1つ又は複数のエンティティの間の文脈的関係を有するグラフデータベースを調査することを有する。
【0015】
[0015] いくつかの実施形態においては、1つ又は複数のエンティティは、記録、ユーザー、及び専門分野からなる群からの少なくとも1つの構成要素である。
【0016】
[0016] いくつかの実施形態においては、クエリタイプのNLPモデル定義は、発話の一部のパターンに少なくとも基づいている。
【0017】
[0017] 別の態様においては、サーチクエリに基づいて電子記録を文脈的に検索するコンピュータシステムが提供されており、システムは、1つ又は複数のプロセッサと、電子記録を分類する方法を実装するべく、個別に又は集合的に、1つ又は複数のプロセッサによって実行可能である命令を含む、1つ又は複数のプロセッサに通信自在に結合されたメモリと、を有し、方法は、ユーザーから、コンピュータネットワーク上において、サーチクエリを受け取ることと、グラフデータベースから、自然言語処理(NLP)モデルライブラリにアクセスすることであって、NLPモデルライブラリは、複数のNLPモデルを有しており、複数のNLPモデルのうちの所与のNLPモデルは、キーワードの1つ又は複数の組に対応している、ことと、サーチクエリに対応する第1のNLPモデルを判定するべくサーチクエリをNLPモデルライブラリに照らしてマッチングすることであって、サーチクエリのコンポーネントは、第1のNLPモデルのキーワードの1つ又は複数の組の少なくとも1つのキーワードにマッチングしている、ことと、第1のNLPモデルに近接した1つ又は複数のその他のNLPモデルを判定することであって、第1のNLPモデル及び1つ又は複数のその他のNLPモデルのそれぞれは、既定の閾値以上の重み値を有する近接性関係を有している、ことと、サーチクエリ内において元々存在していない1つ又は複数のその他のNLPモデルに対応する1つ又は複数のキーワードを付加することにより、サーチクエリを改善することと、サーチ結果として複数の電子記録を検索するべく、改善されたサーチクエリを実行することと、ユーザーに対して、1つ又は複数のプロセッサに通信自在に結合されたグラフィカルユーザーインターフェイス上において、複数の電子記録を表示することと、を有する。
【0018】
[0018] いくつかの実施形態においては、方法は、1つ又は複数のコンピュータプロセッサの支援により、クエリタイプの自然言語処理(NLP)モデル定義に少なくとも基づいてサーチクエリのクエリタイプを判定することと、クエリタイプのレジストリにアクセスすることであって、レジストリは、クエリタイプを実行方法にマッピングしており、且つ、それぞれのクエリタイプと関連する優先順位重み値と実行方法のペアをレジストリ内において有する、ことと、複数の電子記録を検索するべく、クエリタイプにマッピングされた1つ又は複数の実行方法を使用して改善されたサーチクエリを実行することであって、複数の電子記録のうちの所与の電子記録は、所与の電子記録を検索するべく使用される実行方法と関連する優先順位重み値によって重み付けされており、複数の電子記録は、複数の電子記録の優先順位重み値に少なくとも部分的に基づいた順序において表示される、ことと、を更に有することができる。
【0019】
[0019] いくつかの実施形態においては、実行方法は、キーワードサーチ及びグラフサーチを有する。
【0020】
[0020] いくつかの実施形態においては、グラフサーチは、複数の電子記録、サーチクエリを提供したユーザー、及びこれらの両方に文脈的に関連している更なる電子記録を検索するべく、1つ又は複数のエンティティ及び1つ又は複数のエンティティの間の文脈的関係を有するグラフデータベースを調査することを有する。
【0021】
[0021] いくつかの実施形態においては、1つ又は複数のエンティティは、記録、ユーザー、及び専門分野からなる群からの少なくとも1つの構成要素である。
【0022】
[0022] いくつかの実施形態においては、サーチクエリは、ユーザーのユーザー振る舞いデータに少なくとも部分的に基づいた1つ又は複数のキーワードを付加することにより、更に改善されている。
【0023】
[0023] いくつかの実施形態においては、ユーザー振る舞いデータは、グラフデータベース内において保存されており、且つ、これからアクセスされる。
【0024】
[0024] いくつかの実施形態においては、方法は、実行の前に、ユーザー振る舞いデータを判定するべく、ユーザーに対してユーザー振る舞いフィードバックループを実行することを更に有する。
【0025】
[0025] いくつかの実施形態においては、方法は、表示の後に、ユーザーからユーザー振る舞いデータを受け取ることを更に有する。
【0026】
[0026] いくつかの実施形態においては、ユーザー振る舞いデータは、複数の電子記録のうちの電子記録が選択されるか又は選択されないかに関するデータ、複数の電子記録のうちの選択された電子記録を閲覧するべく使用される時間、及びユーザーが記録において実行するスクロール及びページングの程度、のうちの少なくとも1つを有する。
【0027】
[0027] 本開示の更なる態様及び利点については、本開示の例示用の実施形態のみが図示及び記述されている以下の詳細な説明から、当業者に容易に明らかとなろう。理解されるように、本開示は、その他の且つ異なる実施形態を有する能力を有しており、且つ、本開示を逸脱することなしに、様々な明白な観点において、そのいくつかの詳細事項を変更することができる。従って、図面及び説明は、その特性が、限定ではなく、例示を目的としているものと見なされたい。
【0028】
引用による包含
[0028] 本明細書において言及されているすべての出版物、特許、及び特許出願は、それぞれの個々の出版物、特許、又は特許出願が引用によって包含されることが具体的に且つ個別に示されているのと同程度に、引用により、本明細書に包含される。引用によって包含された出版物及び特許又は特許出願が本明細書において含まれている開示と矛盾している場合には、本明細書が、すべてのそのような矛盾する記述に取って代わる及び/又はそれらよりも優先するものと解釈されたい。
【0029】
図面の簡単な説明
[0029] 本発明の新規の特徴については、添付の請求項において詳細事項を伴って記述されている。本発明の特徴及び利点の更に十分な理解は、本発明の原理が利用されている例示用の実施形態について記述する以下の詳細な説明を参照することにより、得られることになるが、添付図面(本明細書においては、「図(Figure)」及び「図(FIG.)とも表現されている」)は、以下のとおりである。
【図面の簡単な説明】
【0030】
図1】[0030]記録管理システムにおける記録の文脈検索のための方法の概略フローチャートを示す。
図2】[0031]NLPモデルライブラリのグラフデータベースの一部分を示す。
図3】[0032]発話の一部のタグの例を示す。
図4】[0033]サンプルクエリ及びその対応するクエリタイプを示す。
図5】[0034]サンプルクエリタイプレジストリを示す。
図6】[0035]ユーザー振る舞いフィードバックループの一例を示す。
図7】[0036]サーチ結果を改善するべく調査されうる様々なエンティティの知識グラフデータベースを示す。
図8】[0037]本開示のシステム及び方法によるサンプルクエリ及び処理方法を示す。
図9】[0038]本開示の方法を実装するように、プログラミングされた又はその他の方法で構成されたコンピュータシステムを示す。
【発明を実施するための形態】
【0031】
本発明の詳細な説明
[0039] 本明細書には、本発明の様々な実施形態が図示及び記述されているが、当業者には、このような実施形態は、例として提供されているに過ぎないことが明らかとなろう。本発明を逸脱することなしに、当業者は、多数の変形、変更、及び置換を想起することができる。本明細書において記述されている本発明の実施形態の様々な代替肢が利用されうることを理解されたい。
【0032】
[0040] 政府機関とプライベート及びパブリックエンティティの両方により、膨大な量の情報を物理的文書上において保存することができる。このような文書は、巨大な記録保管所、倉庫、図書館、及び/又は貯蔵所内において保管することができる。但し、物理的文書は、手作業による発見、アクセス、サーチ、及び/又は操作が困難でありうる。更には、このような物理的文書からの情報の発見、アクセス、サーチ、及び/又は抽出も、困難でありうる。手作業による方法は、費用を所要し、非効率的であり、信頼性が低く、及び/又はプライバシーの懸念を有する可能性がある。例えば、大量の文書の人間による取扱いは、低速となる場合があり、エラーが発生しやすい場合があり、文書内の化学物質に対する曝露及び留め具に対する曝露に起因して人間の健康を損なう場合があり、文書を損なう場合があり、及び/又は機密情報を含む文書が関係している際にはセキュリティ漏洩を起こす場合がある。特定の文書の発見及び/又はそのような文書の搬送は、骨が折れると共に費用を所要する場合がある。また、物理的文書上における情報の保存は、物理的文書が失われた際などに、失われやすい場合があり、損なわれる場合があり、さもなければ、実質的に劣化する場合があり(例えば、インキの薄れ、シートの完全性の弱化など)、破壊される場合があり、及び/又は誤ったラベルが付与される場合がある。少なくとも本明細書において記述されている理由に起因し、物理的文書上において保存されている情報の抽出は、困難であり、これにより、保存されている膨大な量の情報に対するアクセスが妨げられる又は妨害される場合がある。
【0033】
[0041] 物理的文書上において保存されている情報をデジタル情報に変換することにより、情報をデジタルサーチを通じて容易にアクセス可能なものにすることができる。例えば、物理的文書は、カメラ又はその他の撮像装置又は光学センサなどにより、デジタル的にスキャンすることが可能であり、或いは、その他の方法で撮像することができる。いくつかの例においては、自動化された又は半自動化されたシステム及び方法を介して、大量の(例えば、数百万個の)物理的文書を電子記録に変換することができる。このような自動化された又は半自動化されたシステム及び方法は、物理的文書の電子記録への変換において、さもなければ手作業で実行される、1つ又は複数のプロセス(例えば、組織化されていない文書スタックをソートする、文書スタックからシートを隔離する、1つ又は複数のシートに付着した留め具を取り外す、文書を装置に供給する、文書をスキャンする、文書を方向付けする、スキャンされた文書を処分するなど)を自動化するなどにより、大量の物理的文書を効率的に且つ高度な均一性を伴って処理するように、構成することができる。本明細書において記述されているシステム及び方法は、電子記録への物理的文書の変換、電子記録のタグ付け、及びタグ付けされた電子記録のサーチ、を伴う自動化されたエンドツーエンドプロセスの一部分でありうる。いくつかの例においては、タグ付けされていない電子記録をサーチすることができる。
【0034】
[0042] いくつかの例においては、デジタル化された情報は、テキスト認識(例えば、光学文字認識(OCR:Optical Character Recognition))を経験するなどのように、更に処理することができる。デジタル化された情報は、安全な場所におけるオンサイトの又は遠隔地のサーバー内において保存することが可能であり、及び/又は要求に応じて容易に且つ確実に複製することができる。情報のデジタル化により、信頼性を改善することが可能であり、費用を低減することが可能であり、及び/又は機密情報の曝露を回避することができる。但し、デジタル情報は、物理的文書上において保存されている情報よりも容易にサーチすることができると共に、デジタル化の後にターゲット宛先に容易に送信することができる一方で、電子記録である場合にも、ソートするべき無数のその他の電子記録が存在している際には、特定の情報及び/又は文書を発見及び隔離することが困難でありうる。
【0035】
[0043] 電子記録の文脈検索を促進するシステム及び方法が提供されている。本明細書において提供されているシステム及び方法は、ユーザークエリの文脈的な処理及び/又は自然言語に基づいた処理に少なくとも部分的に基づいて電子記録を文脈的に検索することができる。システム及び方法は、1つ又は複数の自然言語処理(NLP)モデルを使用することができる。電子記録は、ユーザーの振る舞いに少なくとも部分的に基づいて検索することができる。検索されたサーチ結果は、文脈固有のものでありうる。検索されたサーチ結果は、ユーザー固有のものでありうる。有益には、サーチ結果をユーザーに対して個人化することができる。サーチ結果は、自然言語に基づいたユーザークエリに応答するものであってもよい。有益には、ユーザーは、文脈的に関連する及び/又はユーザー固有であるサーチ結果を取得するべく、特別なサーチ構文(例えば、演算子など)を学習しなくてもよい。
【0036】
[0044] 本明細書において記述されているシステム及び方法は、物理的ファイルから変換された(例えば、デジタル的にスキャンされた又はその他の方法で撮像された)電子記録と電子ファイルとして生成及び保存された電子記録の両方の検索に適用することができる。
【0037】
[0045] 本明細書において記述されているシステム及び方法は、記録管理システム内における電子記録のサーチ及び検索に適用することができる。記録管理システムは、複数の電子記録を有することができる。本明細書において記述されている記録管理システムは、任意の数の電子記録を有することができる。例えば、記録管理は、少なくとも1つ、10個、100個、10個、10個、10個、10個、10個、10個、10個、1012個、1015個、又はこれらを上回る数の電子記録を有することができる。電子記録は、例えば、テキスト及び/又は画像などの、情報を含む任意のデジタル記録でありうる。電子記録は、電子文書又は電子文書からの抜粋(例えば、単語、フレーズ、文章、段落、節、章、ページ、その他のセグメントなど)でありうる。電子記録は、物理的文書の、或いは、物理的文書からの抜粋の、デジタル画像でありうる。電子記録は、オフライン及び/又はオンラインで(例えば、インターネット上において)電子的に入手可能である、投稿、リスト、コメント、注記、パンフレット、ガイド、マニュアル、写真、絵、画像、グラフィック、グラフ、表、チャート、ブログ、ウェブサイト、ハイパーリンク(例えば、URL)、記事、任意のテキスト、及び/又は画像、任意のその他の情報、及び/又はこれらの組合せでありうる。
【0038】
[0046] 或いは、この代わりに、又はこれに加えて、本明細書において記述されているシステム及び方法は、任意のストレージシステム、データベース、データ構造、サーチエンジン、グラフ、チャート、表、これらのうちの複数の任意のもの、及び/又はこれらの任意の組合せにおける電子記録のサーチ及び検索に適用することができる。
【0039】
[0047] 本明細書において記述されているシステム及び方法は、タグ付けされた電子記録とタグ付けされていない電子記録の両方の検索に適用することができる。タグは、電子記録を記述するべく使用されるラベルでありうる。タグは、共通主題を有する異なる電子記録をグループ化するべく使用されるラベルでありうる。タグは、テキストストリングでありうる。タグは、数値でありうる。タグは、キーワード及び/又はフレーズでありうる。タグは、名称でありうる。タグは、レーティングでありうる。タグは、カテゴリ、グループ、トピック、及び/又はタイプでありうる。タグは、注記でありうる。タグは、構造化されていない分類法の1つ又は複数のコンポーネントでありうる。タグは、標準化された情報でありうる。タグは、電子記録又はファイル用の任意のメタデータフィールドでありうる。タグは、電子記録に割り当てられる際などに、電子記録用のメタデータフィールドとして保存することができる。いくつかの例においては、タグは、2値(例えば、はい/いいえ、○/×、0/1など)でありうる。タグは、電子記録に割り当て可能でありうる及び/又はこれから除去可能でありうる。タグは、電子記録をインデックス付けするべく使用されてもよい。タグは、電子記録を分類するべく使用されてもよい。タグは、電子記録をサーチ及びフィルタリングするべく使用されてもよい。タグは、変更されてもよく、修正されてもよく、及び/又はその他の方法で更新されてもよい。いくつかの例においては、タグは、1つ又は複数の電子記録に割り当てられている間に、変更されてもよく、修正されてもよく、及び/又はその他の方式で更新されてもよい。
【0040】
[0048] 本明細書において提供されているシステム及び方法は、(i)自然言語処理(NLP)モデル、(ii)ユーザーの振る舞い、及び/又は(iii)ユーザー、記録、及び/又は専門分野の間のなどの、サーチに関与する様々なエンティティの間の関係に基づいたサーチクエリ及び/又はサーチ結果の改善を許容している。本明細書において提供されているシステム及び方法は、サーチクエリのタイプに相対的に固有である又はこれとの間において相対的に高度な互換性を有するメカニズムを使用した改善されたサーチクエリの実行を許容している。異なるタイプのクエリを実行するべく、異なるメカニズムを使用することができる。有益には、サーチ結果は、相対的に高度な正確さを有することができる。有益には、サーチ結果は、ユーザー及び/又は文脈に対して相対的に個人化することができる。
【0041】
[0049] いくつかの例においては、第1のNLPモデルは、発話の一部のパターン又は正規表現のパターンを使用するなどにより、クエリタイプを判定するべく、使用することができる。更には、サーチクエリ内において元々存在していないその他のNLPモデルに対応するキーワードを付加するなどにより、サーチクエリを改善するべく、第1のNLPモデルに近接していると判定されたその他のNLPモデルを使用することができる。
【0042】
[0050] いくつかの例においては、サーチクエリは、ユーザーの振る舞いによって改善することできる。記録管理システムは、例えば、ユーザー振る舞いフィードバックを介して、ユーザーの振る舞いを学習することができると共に、サーチクエリを改善するべく、このようなユーザー振る舞いデータを使用することができる。システムは、記録の共有、記録の閲覧、記録を通じたサーチ、及び/又はサーチ結果からの記録に対するクリックなどの、ユーザーの活動からユーザーの振る舞いを学習することができる。
【0043】
[0051] いくつかの例においては、サーチクエリ及び/又はサーチ結果を改善して電子記録の文脈的サーチを促進するべく、ユーザー、記録、及び/又は専門分野の間などの、サーチに関与する様々なエンティティの間の関係を有する知識グラフを調査することができる。
【0044】
[0052] 図1は、記録管理システムにおける記録の文脈検索のためのシステム及び方法の概略フローチャートを示している。
【0045】
[0053] ユーザーは、システムによって実行される1つ又は複数の動作の後にサーチ結果104を取得するべく、サーチクエリ102を記録管理システムに提供することができる。ユーザーは、記録管理システムのユーザーであってもよく、或いは、そうでなくてもよい。例えば、ユーザーは、記録管理システムの操作者、管理者、又はアドミニストレータでありうる。ユーザーは、記録管理システムの顧客でありうる。ユーザーは、記録管理システムに対する文書及び/又は記録の提供者でありうる。ユーザーは、記録管理システムに対する文書及び/又は記録の生成者でありうる。ユーザーは、個人でありうる。ユーザーは、エンティティでありうる。ユーザーは、複数の個人でありうる。ユーザーは、複数のエンティティでありうる。いくつかの例においては、記録管理システムは、一意の識別子(例えば、ユーザー名、ユーザーアカウント、ユーザーIDなど)により、ユーザーを識別することができる。ユーザーの振る舞いなどの、ユーザーのユーザー固有の情報は、ユーザーの一意の識別子と関連付けることができると共に、1つ又は複数のデータベース内において保存することができる。
【0046】
[0054] サーチクエリ102は、システムによって提供されるユーザーインターフェイスを介して、ユーザーが提供することができる。ユーザーインターフェイスは、グラフィカルユーザーインターフェイス(GUI:Graphical User Interface)及び/又はウェブに基づいたインターフェイスであってもよい。ユーザーインターフェイスは、サーチクエリを受け取るための入力フィールド(例えば、グラフィカルな矩形のボックス)を有することができる。システムは、例えば、ユーザー装置のディスプレイ(例えば、電子ディスプレイ)上においてユーザーインターフェイスを表示することができる。ディスプレイは、別個のものでありうると共に、ユーザー装置に通信自在に結合することができる。ユーザー装置は、例えば、モバイル装置(例えば、スマートフォン、タブレット、ページャ、パーソナルデジタルアシスタント(PDA:Personal Digital Assistant))、コンピュータ(例えば、ラップトップコンピュータ、デスクトップコンピュータ、サーバー)、及び/又はウェアラブル装置(例えば、スマートウォッチ)であってもよい。また、ユーザー装置は、例えば、セットトップボックス、テレビ受像機、ビデオゲームシステム、又はデータを提供又はレンダリングする能力を有する任意の電子装置などの、任意のその他のメディアコンテンツプレーヤーを含みうる。ユーザー装置は、任意選択により、携帯型であってもよい。ユーザー装置は、ハンドヘルド型であってもよい。ユーザー装置は、ローカルエリアネットワーク(LAN:Local Area Network)、インターネットなどのワイドエリアネットワーク(WAN:Wide Area Network)、電気通信ネットワーク、データネットワーク、或いは、ネットワークの任意のその他のタイプ(例えば、エクストラネット、イントラネットなど)などの、ネットワークに接続する能力を有するネットワーク装置であってもよい。
【0047】
[0055] ユーザー装置は、本明細書において記述されている1つ又は複数の動作を実行するためのコード、ロジック、又は命令を有する一時的ではないコンピュータ可読媒体を有しうるメモリストレージユニットを有することができる。ユーザー装置は、例えば、一時的ではないコンピュータ可読媒体に従って1つ又は複数のステップを実行する能力を有する1つ又は複数のプロセッサを有することができる。ユーザー装置は、ユーザー対話型装置を介して、サーチクエリなどの、入力を受け付ける能力を有することができる。このようなユーザー対話型装置の例は、キーボード、ボタン、マウス、タッチスクリーン、タッチパッド、ジョイスティック、トラックボール、カメラ、マイクロフォン、モーションセンサ、熱センサ、慣性センサ、又は任意のその他のタイプのユーザー対話型装置を含みうる。ユーザー装置は、記録管理システムによって提供されるソフトウェア又はアプリケーションを実行する及び/又は記録管理システムによって提供されるユーザーインターフェイスにアクセスする能力を有することができる。ユーザー装置は、更に後述するコンピュータ制御システムでありうる。ユーザー装置は、サーバー、データネットワーク(例えば、クラウド演算ネットワークなど)、又はデータベースなどの、その他のコンピュータシステム、又はその1つ又は複数のコンポーネント、と通信する能力を有することができる。
【0048】
[0056] サーチクエリ102は、テキストの形態(例えば、ストリング)でありうる。サーチクエリは、自然言語において提供することができる。いくつかのケースにおいては、テキストクエリは、音声-テキスト変換を介して提供することができる。クエリは、ストリングの形態において提供することができる。クエリは、ハイパーリンク(例えば、URL)を含みうる。いくつかの例においては、ストリングは、約1000文字、500文字、400文字、300文字、200文字、150文字、140文字、130文字、120文字、110文字、1000文字、50文字、40文字、30文字、20文字、10文字、又はこれら未満の文字限度を有することができる。或いは、この代わりに、ストリングは、1000個超の文字を有することもできる。ストリングは、文字制限を有していなくてもよい。いくつかの例においては、クエリは、約1000ワード、500ワード、400ワード、300ワード、200ワード、150ワード、100ワード、50ワード、40ワード、30ワード、20ワード、10ワード、又はこれら未満のワード限度を有することができる。或いは、この代わりに、クエリは、100超のワードを有することもできる。クエリは、ワード制限を有していなくてもよい。クエリは、英語及び非英語言語を含む、任意の言語におけるものであってもよい。
【0049】
[0057] ユーザー提供のサーチクエリ102がシステムに提供された際に、システムは、サーチクエリを改善するべく、サーチクエリの初期処理106を開始することができる。初期処理において、システムは、関連するNLPモデルに対応する1つ又は複数のキーワードを付加することにより、サーチクエリを改善するべく、サーチクエリ又はサーチクエリのコンポーネントを潜在的に関連する自然言語処理(NLP)モデルにマッチングさせることができる。後述するように、サーチクエリは、NLPモデルのライブラリに照らしてマッチングさせることができる。
【0050】
[0058] NLPモデルは、構文(例えば、文法)、意味論(例えば、意味)、語用論(例えば、目的、目標、意図)、及び/又は言語学のその他の単位(例えば、様々な語彙関係)などの、人間の自然言語を学習、解釈、及び理解する能力を有することができる。NLPモデルは、1つ又は複数のNLP及び/又は自然言語理解(NLU:Natural Language Understanding)技法を利用することができる。NLPモデルは、限定を伴うことなしに、サーチの反復の数又はその他のユーザーのやり取りの数などの、反復の数の増大に伴って、相対的に正確なものになりうる。
【0051】
[0059] いくつかの例においては、NLPモデルは、機械学習及び/又は深層学習の大規模な統計的方式などの、分散型の方式を採用することができる。例えば、分散型の方式により、コンテンツをワードベクトルに変換することが可能であり、且つ、例えば、ワードの間の関係を理解するべく、数学的分析を実行することができる。分散型のNLPモデルは、エンドツーエンド注意メモリネットワーク及びジョイントマルチタスクモデルなどのニューラルネットワークモデルを含むことができる。いくつかの例においては、NLPモデルは、コンテンツを解析すると共にフレームパラメータを入力することにより、意味的に同一のもの(例えば、但し、構文又は語用的には異なっているもの)をフレーム(或いは、データ構造)にフレーム化するなどの、フレームに基づいた方式を採用することができる。いくつかの例においては、NLPモデルは、モデル-理論的方式(model-theoretical approach)を採用することができる。モデル-理論的方式は、組成へのコンテンツの意味論的解析、組成の再組合せ、及び実行を実行することができる。モデル-理論的方式は、人間による監督を受けることができると共に、フルワールド表現、豊富な意味、エンドツーエンド処理、及び難しく且つ微妙なサーチクエリの理解が可能となることから利益を享受することできる。いくつかの例においては、NLPモデルは、対話型の学習方式を採用することができる。対話型の学習NLPモデルは、人間とやり取りすることが可能であり、且つ、このようなやり取りに少なくとも部分的に基づいて、人間の自然言語を徐々に学習することができる。例えば、対話型の学習モデルは、同一の動作を実行するべく、或いは、同一の結果をもたらすべく、一貫性を有する方式で使用されている言語を同一の動作又は同一の結果のための正しい言語であるとして解釈することができる。或いは、この代わりに、又はこれに加えて、NLPモデルは、自然言語を学習、解釈、及び/又は理解するべく、異なる方式を採用することもできる。いくつかの例においては、NLPモデルは、異なる方式の組合せでありうる。
【0052】
[0060] 初期処理106においては、サーチクエリ102及び/又はそのコンポーネント(例えば、トークン)をNLPモデルのライブラリに照らして評価することができる。NLPモデルは、NLPモデルライブラリ内において保存することができる。NLPモデルライブラリは、1つ又は複数のデータベース内などのように、コンピュータシステム(例えば、サーバー)のメモリ内において保存することができる。NLPモデルライブラリは、更に後述するように、グラフデータベース130内において保存することができる。コンピュータシステムは、クラウド演算ネットワークなどの、データネットワークを有していてもよく、及び/又はこれとの通信状態にあってもよい。いくつかの例においては、1つ又は複数のデータベース(例えば、グラフデータベース)は、データネットワーク内において保存されていてもよく、及び/又はこれとの通信状態にあってもよく、且つ、コンピュータシステムは、このような1つ又は複数のデータベースにデータネットワークを介してアクセスすることができる。いくつかの例においては、NLPモデルライブラリは、少なくとも1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10個、15個、20個、25個、30個、35個、40個、45個、50個、100個、200個、300個、400個、500個、1000個、又はこれらを上回る数のNLPモデルを有することができる。いくつかの例においては、NLPモデルライブラリは、最大で約1000個、500個、400個、300個、200個、100個、50個、45個、40個、35個、30個、25個、20個、15個、10個、9つ、8つ、7つ、6つ、5つ、4つ、3つ、2つ、又は1つのNLPモデルを有することができる。
【0053】
[0061] NLPモデルは、1つ又は複数のキーワード又はキーワードの1つ又は複数の組に対応することができる。NLPモデルは、1つ又は複数の用語又は用語の1つ又は複数の組に対応することができる。いくつかの例においては、NLPモデルは、少なくとも約1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10個、15個、20個、25個、30個、35個、40個、45個、50個、100個、200個、300個、400個、500個、1000個、又はこれらを上回る数のキーワード(又は、用語)、或いは、キーワード(又は、用語)の組に対応することができる。いくつかの例においては、NLPモデルは、最大で約1000個、500個、400個、300個、200個、100個、50個、45個、40個、35個、30個、25個、20個、15個、10個、9つ、8つ、7つ、6つ、5つ、4つ、3つ、2つ、又は1つのキーワード(用語)、或いは、キーワード(又は、用語)の組に対応することできる。
【0054】
[0062] 例えば、キーワードに基づいたクエリは、1つ又は複数のトークンにトークン化することができる。トークンは、キーワードでありうる。トークンは、トピックでありうる。トークンは、語彙関係でありうる。トークンは、任意の語彙のサブ単位(例えば、段落、文章、単語、文字、発話の一部、意味、構文、語用、キーワードなど)でありうる。システムは、トークン化されたクエリをNLPモデルのライブラリに照らして評価することができる。いくつかの例においては、例えば、システムは、トークン化されたクリエ内のトークンをNLPモデル内のキーワード又はキーワードの組と比較することができる。
【0055】
[0063] システムは、トークン化されたクエリに対応する1つ又はNLPモデルを判定することができる。いくつかの例においては、サーチクエリは、少なくとも約1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10個、15個、20個、25個、30個、35個、40個、45個、50個、100個、又はこれらを上回る数のNLPモデルに対応することができる。いくつかの例においては、サーチクエリは、最大で約100個、50個、45個、40個、35個、30個、25個、20個、15個、10個、9つ、8つ、7つ、6つ、5つ、4つ、3つ、2つ、又は1つのNLPモデルに対応することできる。
【0056】
[0064] 上述のように、NLPモデルライブラリは、グラフデータベース130内において保存することができる。グラフデータベースは、NLPモデル及びNLPモデルの間の近接性関係を有することができる。図2は、NLPモデルライブラリのグラフデータベース200の一部分を示している。グラフデータベース200は、第1のNLPモデル202、第2のNLPモデル204、第3のNLPモデル206、第1のNLPモデル202と第2のNLPモデル204の間の第1の近接性関係208、並びに、第1のNLPモデル202と第3のNLPモデル206の間の第2の近接性関係210を有することができる。グラフデータベースは、任意の数のNLPモデルを有することができる。いくつかの例においては、グラフデータベースは、すべてのNLPモデルをNLPモデルライブラリ内において有することができる。いくつかの例においては、グラフデータベースは、いくつかのNLPモデルのみをNLPモデルライブラリ内において有することができる。いくつかの例においては、複数のグラフデータベースは、個々に又は集合的に、NLPモデルライブラリ内においてNLPモデルを保存することができる。
【0057】
[0065] NLPモデル(例えば、NLPモデル202、204、206など)の間の近接性関係(例えば、近接性関係208、210など)は、NLPモデルの間の関連性レベルを定義することができる。近接性関係は、任意の2つのNLPモデルの間のものでありうる。近接性関係は、NLPモデルの任意の組合せの間におけるものでありうる。関連性レベルは、重み値によって表すことができる。重み値は、NLPモデルの間の近接性の程度を通知することができる。例えば、相対的に大きな重み値は、相対的に小さな重み値よりも高度な近接性に対応しうる。重み値は、2値(例えば、近接していない、或いは、近接しているに対応する0又は1)でありうる。重み値は、任意のスケール(例えば、0~1、0~5、0~10、0~100、50~100など)を有することができる。例として、重み値スケールが0~1である場合に、第1のNLPモデル202と第2のNLPモデル204の間の第1の近接性関係208は、0.7の重み値を有することができる。第1のモデル202と第3のモデル206の間の第2の近接性関係210は、0.8の重み値を有することができる。この例においては、第1のNLPモデル202は、第3のNLPモデル206よりも第2のNLPモデル204に近接している可能性がある。また、有益には、2つのNLPモデルの間の近接性関係は、2つのNLPモデルに属するキーワードの間の近接性関係をも通知することができる。或いは、この代わりに、又はこれに加えて、重み値のために、その他のスコアリングシステム又はスケール(例えば、百分率、5、10、100などの異なる最大値から逸脱、0又は1などの2値など)を使用することもできる。
【0058】
[0066] いくつかの例においては、近接性関係は、重み値が、例えば、0.8、80%、80/100などの、閾値レベル、或いは、別の対応するスケールにおけるその他の対応する値、以上である場合にのみ、2つのNLPモデルの間に存在しうる。或いは、この代わりに、近接性関係は、重み値が、(0.8又は対応するスケールにおける対応する値以外の)別の値以上である場合にのみ、2つのNLPモデルの間に存在しうる。いくつかの例においては、近接性関係は、例えば、重み値が、2つのNLPモデルの間に関連性がほとんど又はまったく存在していないことを表す0である場合にも、任意の2つのNLPモデルの間に存在しうる。
【0059】
[0067] 図1を再度参照すれば、システムがサーチクエリ102に対応する1つ又は複数のNLPモデルを判定したら、システムは、サーチクエリに対応する1つ又は複数のNLPモデルに近接しているその他のNLPモデルについてNLPモデルライブラリグラフ130をサーチすることができる。例えば、システムは、既定の閾値(例えば、0.5、0.6、0.7、0.8、0.9、0.95、0.99など)超の近接性関係重み値を有するその他のNLPモデルを選択することができる。別の例においては、システムは、サーチクエリに対応する1つ又は複数のNLPモデルに最も近接した特定数(例えば、5つ、6つ、7つ、8つ、9つ、10個など)のNLPモデルを選択することができる。キーワードサーチであるサーチクエリの場合には、システムは、ユーザー提供のサーチクエリ内において元々存在していないその他のNLPモデル内の1つ又は複数のキーワード又はキーワードの組を付加することができる。有益には、サーチクエリは、ユーザーによって元々想定されていないが、依然として、関連している、キーワード及び/又はキーワードの組により、改善することができる。
【0060】
[0068] また、いくつかの例においては、初期処理106において、類似のクエリにおいて頻繁に使用されている任意の関連するキーワードをサーチクエリ102に付加することもできる。例えば、システムは、類似のクエリにおいて頻繁に使用されている任意の関連するキーワードを付加することにより、サーチクエリを改善することができる。クエリの類似性は、更に後述する知識グラフなどを介して様々なエンティティ(例えば、記録、ユーザー、専門分野など)の間の関係を分析することにより、判定することできる。
【0061】
[0069] システムは、クエリタイプを判定することにより、サーチクエリ102用の実行方法を解明することができる108。クエリタイプは、クエリをサブミットしたユーザーの意図のタイプを識別することができる。いくつかの例においては、クエリタイプは、クエリの分類のタイプでありうる。例えば、クエリタイプは、「who(だれ)」形態、「what(なに)」形態、「when(いつ)」形態、「where(どこ)」形態、「how(どのように)」形態、「why(なぜ)」形態、「list(リスト)」形態、又はその他の形態でありうる。クエリタイプに応じて、異なる改善のメカニズム(例えば、NLPに基づいたもの、ユーザーの振る舞いに基づいたもの、異なるエンティティの間の関係に基づいたものなど)を使用することができる。
【0062】
[0070] クエリタイプは、予めトレーニングされたショートテキストNLPモデルによって判定することができる。例えば、モデル定義は、キーワード及び発話の一部のタグのシーケンスとして定義することができる。発話の一部のタグは、発話の一部によってタグ付けされたテキスト(例えば、普通名詞、複数形の普通名詞、固有名詞、法助動詞、動詞の基本形、形容詞、比較級形容詞など)を有することができる。例として、「looking/VBG, for/IN, [NN], … , in/IN, [NN], …」という定義は、VBG(動詞動名詞)、IN(前置詞又は従属接続詞)、及びNN(普通名詞)というタグを有することができる。図3には、その他の発話の一部のタグの例が示されている。発話の一部のタグは、図3に示されているものに限定されるものではない。NLPモデルは、クエリタイプの認識のみならず、サーチクエリ内の情報の抽出のために使用することもできる。修飾サーチ(qualified search)などの、いくつかのサーチ方法は、ユーザー提供のサーチクエリから抽出された情報に依存しうると共に、抽出された情報に基づいた分類法コンポーネント又はその他のフィルタリング基準を含むことができる。
【0063】
[0071] 一例として、発話の一部のタグが付与されたパターンは、「[NN] [VBG] tax/NN records/NNS」でありうる。このケースにおいては、第1のトークンは、非修飾名詞「[NN]」に、非修飾動詞「[VBG]」及び2つの修飾名詞「tax/NN」及び「records/NNS」が後続するものである。ユーザーは、パターンの合計重みが1となるようなパターンにおいて、それぞれのトークンごとに重みを定義することができる。トークン重みは、特定のパターンが、NLPモデル定義の最小閾値スコアと比較されうるパターン近接性スコアを判定するべく、スコアリングされる方式を決定することができる。以前の例を継続すれば、重み定義を有する同一のパターンは、「[NN-0.2] [VBG-0.1] tax/NN-0.4 records/NNS-0.3」であることが可能であり、この場合に、[NN]という非修飾名詞は、0.2の重みを有し、[VBG]という非修飾動詞は、0.1の重みを有し、「tax/NN」という修飾名詞は、0.4の重みを有し、且つ、「records/NNS」という修飾名詞は、0.3の重みを有する。ユーザーは、0.8などの、パターンに準拠するものとしてのテキストの受け付けのための最小閾値を更に定義することができる。1という相対的に厳格な最小閾値は、テキストが発話の一部のパターンに正確に準拠することを必要としうる。いくつかの例においては、0という最小閾値は、分類方法が、発話の一部のタグが付与されたパターンに対する準拠とは無関係に、任意のパターンのテキストを受け付けることを許容しうる。ユーザーは、任意の最小閾値を定義することができる。
【0064】
[0072] システムは、サーチクエリテキストを発話の一部のタグによって自動的にタグ付けすることができる。タグ付けの後に、テキストは、キーワード及び発話の一部のタグを含むトークンにトークン化することができる。例えば、「information containing tax records」というテキストは、タグ付けすることが可能であり、且つ、「information/NN, containing/VBG, tax/NN, records/NNS」にトークン化することができる。テキストがタグ付けされ、且つ、トークン化されたら、システムは、NLPモデル内において定義されているパターンがテキスト内に存在しているかどうかを判定することにより、テキストをスコアリングすることができる。テキストは、個々のトークンと比較することができる。1つ又は複数の個々のトークンがマッチングしている場合には、パターン近接性スコアを判定するべく、パターン内の個々のトークンと関連している重みを集計することができる。すべてのトークンが処理されたら、パターン近接性スコアを最小閾値と比較することができる。いくつかの例においては、パターン近接性スコアが最小閾値以上である場合には、クエリをNLPモデルのクエリタイプに分類することができる。
【0065】
[0073] 図4は、サンプルクエリ及びその対応するクエリタイプを示している。例えば、「I need tax audit records」というサンプルサーチクエリは、クエリ内の発話の一部の「I need」パターンに少なくとも部分的に基づいて「what」のクエリタイプを有するものと判定することができる。別の例においては、「I need to audit tax records」というサンプルサーチクエリは、クエリ内の発話の一部の「I need to」パターン及びキーワードに少なくとも部分的に基づいて「how」のクエリタイプを有するものと判定することができる。別の例においては、「looking for tax forms in box 123」というサンプルサーチクエリは、クエリ内の発話の一部の「looking for」パターン及びキーワードに少なくとも部分的に基づいて「what qualified」のクエリタイプを有するものと判定することができる。別の例においては、「content of box 123」というサンプルサーチクエリは、クエリ内の発話の一部の「content of」パターン及びキーワードに少なくとも部分的に基づいて「list」のクエリタイプを有するものと判定することができる。
【0066】
[0074] いくつかの例においては、クエリタイプ用のNLPモデル定義は、以前のサーチから取得されたトレーニングデータからなどのように、それぞれのサーチの反復によってトレーニングすることができる。或いは、この代わりに、クエリタイプは、その他のNLPモデルによって判定することもできる。
【0067】
[0075] 異なるクエリタイプは、異なる実行方法に対してマッピングすることができる。いくつかの例においては、クエリタイプは、1つの実行方法に対してのみマッピングすることができる。いくつかの例においては、クエリタイプは、複数の実行方法に対してマッピングすることができる。いくつかの例においては、実行方法は、複数のクエリタイプに対してマッピングすることができる。クエリタイプが複数の実行方法にマッピングされる場合には、それぞれの実行方法によって検索されたサーチ結果を相対的な優先順位重み値によって重み付けすることができる。クエリタイプ、対応する実行方法、及び相対的な優先順位重み値は、システムの1つ又は複数のデータベース内などのように、クエリタイプレジストリ内において保存することができる。いくつかの例においては、すべてのクエリタイプ-実行方法のペアは、0の優先順位重み値を有するペアの場合にも、レジストリ内において保存することができる。その他の例においては、既定の閾値超の優先順位重み値(例えば、0.5、0.6、0.7、0.8、0.9、0.95、0.96、0.97、0.98、0.99など)を有するクエリタイプ-実行方法のペアのみをレジストリ内において保存することができる。クエリタイプを実行するのに特に適した実行方法は、その他の実行方法よりも大きな優先順位重み値を有しうる。例えば、「what」形態を有するクエリタイプは、ユーザー振る舞いサーチよりもキーワードサーチに適する可能性があり、且つ、従って、「search_engine」実行方法が、「knowledge_graph」実行方法よりも大きな重み値を有しうる。別の例においては、「how」形態は、「search_engine」実行方法よりも「knowledge_graph」実行方法に適する可能性がある。
【0068】
[0076] 図5は、サンプルクエリタイプレジストリを示している。クエリタイプレジストリ500は、クエリタイプ列502、優先順位重み列504、及び実行方法列506を有することができる。いくつかの例においては、サーチクエリは、複数の方法、サーチ集合体、及びデータストアを使用することにより、実行することができる。優先順位重み値は、サーチクエリ用の実行方法を使用して検索されたサーチ結果に対して適用される優先順位係数を表することができる。例えば、クエリタイプレジストリ500の場合に、サーチクエリのクエリタイプが「list」であり、且つ、サーチ結果を検索するべく、「search_engine」方法及び「knowledge_graph」方法の両方が使用される場合には、「search_engine」方法を使用して検索されるサーチ結果の部分を「0.6」という優先順位重み値によって重み付けすることが可能であり、且つ、「knowledge_graph」方法を使用して検索されるサーチ結果の部分を「0.8」という優先順位重み値によって重み付けすることができる。有益には、組み合わせられたサーチ結果が関連性などによってソートされる際には、相対的な優先順位重み値によって相対的に関連しているものと推測される「knowledge_graph」方法を使用して検索されたサーチ結果を「search_engine」方法を使用して検索されたサーチ結果よりも高い優先順位において提示することができる。或いは、この代わりに、又はこれに加えて、異なる優先順位重み及び/又は係数スコアリングシステム及び/又はスケールを適宜使用することができる。
【0069】
[0077] クエリタイプレジストリは、手作業で定義することができる。例えば、当初、なんらかのサーチ反復がシステムによって実行される前に、実行方法をクエリタイプに手作業でマッピングすることが可能であり、且つ、優先順位重みをそれぞれのクエリタイプ-実行方法のペアごとに手作業で割り当てることができる。但し、例えば、ユーザーの振る舞いに基づいたサーチ結果の実際の優先順位に関するデータ(例えば、サーチ結果の実際の図など)などの、十分なトレーニングデータがサーチ反復から収集された後には、レジストリが、半教師付き状態となるように、或いは、場合によっては、教師付き状態とならないように、フィードバックループアルゴリズムなどを介して、クエリタイプレジストリを更新することができる。それぞれのサーチ反復は、トレーニングデータをもたらすことができる。例えば、十分なトレーニングデータにより、限られた手作業による介入を伴って、或いは、場合によっては、これを伴うことなしに、レジストリを更新することができる及び/又はレジストリは、動作することができる。いくつかの例においては、既定の実行方法は、従来のサーチエンジン(例えば、「search_engine」方法)でありうる。
【0070】
[0078] 図1を再度参照すれば、システムは、ユーザーの振る舞いに基づいてサーチクエリ102を改善することができる110。ユーザー振る舞いフィードバックループ150は、特定のユーザーからの学習済みのユーザーの振る舞い160に関するデータを生成することができる。ユーザー振る舞いフィードバックループは、特定のユーザーにおけるユーザー提供のサーチクエリのすべての以前の改善に関係する情報のみならず、特定のサーチ結果との間における特定のユーザーのやり取りに関係する情報をも収集することができる。サーチ結果との間におけるユーザーのやり取りは、例えば、記録が選択されたのか又は選択されなかったのか、選択された記録を閲覧するべく使用された時間、記録内においてユーザーが実行したスクロール又はページングの程度、及びその他のやり取りでありうる。また、いくつかの例においては、システムは、いずれの記録が、一緒にアクセスされたのか、及び/又はユーザーの同一のサーチセッションにおいてアクセスされたのかに関する情報を収集することもできる。このような情報によれば、システムは、ユーザーの関心のエリアを判定することができる。ユーザーによる後続のクエリを改善することができると共にユーザーの振る舞い及び/又はユーザーの関心エリアに対して個人化することができる。
【0071】
[0079] 図6は、ユーザー振る舞いフィードバックループの一例を示している。ユーザー振る舞いフィードバックループ600は、ユーザーの個人的なサーチの好み及び関心のエリアを微細チューニングすることができる。このプロセスは、ユーザーが、サーチクエリ600を提供し、サーチクエリに応答してサーチ結果を受け取り、且つ、サーチ結果内の特定の項目をクリックすることにより607、始まっている。サーチクエリは、本明細書のどこか別の場所において記述されているように、サーチクエリ自体の改善などのために601、実行される前に、分類法抽出602を経験することができる。同様に、いくつかの記録は、自身と関連する分類法項目を有することができる608。フィードバックループのプロセスにおいて、システムは、サーチクエリ及びユーザーがクリックした結果項目の両方から抽出された分類法に関する情報を収集することが可能であり、且つ、この情報を時系列で保存することができる606。時系列データは、それぞれのユーザーごとに、3か月分以下のデータを含むことができる。例えば、3か月よりも旧いすべてのデータは、削除することができる。その他の例においては、時系列データは、(例えば、数分、数時間、数日、数か月、数年、数10年などの程度の)その他の持続時間のデータを含むことができる。この期限切れの目的は、ユーザーの振る舞いの変化に対して流動的に適合するというものである。例えば、ユーザーは、1つの仕事から別の仕事に、及び/又は1つの部署から別の部署に、移動する場合があり、これにより、いくつかの相対的に旧いデータが、相対的に関連性を失うことになり、或いは、いくつかの例においては、完全に関連性を失うことになる。従って、システムは、そのサーチの改善を採用することができる。時系列データを調節モジュール605によって処理することができる。調節モジュールは、まず、すべての異常値を除去し、且つ、次いで、ユーザーごとに最も使用された分類法に関する頻度情報を収集することにより、時系列データを分析することができる。そして、ユーザーの好み及び関心のエリアを判定するべく、この情報を使用することができる604。即ち、ユーザーの好み及び/又は関心のエリアが判定されたら(された場合には)、システムは、このようなユーザーの好み及び/又は関心のエリアに対応する分類法項目をユーザーのサーチクエリに付加することができる。
【0072】
[0080] 学習済みのユーザー振る舞いデータに基づいた改善により、有益には、サーチクエリ及び後続のサーチ結果を特定のユーザーに対して個人化することができる。
【0073】
[0081] 図1を再度参照すれば、システムは、ユーザー、記録、及び専門分野の間などの、様々なエンティティの間の文脈的関係を有する知識グラフ140に基づいて、サーチクエリ102及び/又はサーチ結果104を改善することができる112。
【0074】
[0082] 知識グラフ140は、記録及び/又は電子記録の属性との間におけるユーザーのやり取りを分析するなどにより、異なる記録の間の文脈的関係を有することができる。例えば、記録の間の文脈的関係は、例えば、同一の組織又は同一の部署内において働くことにより、或いは、同一の専門分野を共有することにより、関係付けられたユーザーにより、同一のサーチセッションにおいて頻繁にアクセスされる、一緒に共有される、閲覧される、或いは、コメントされる、同一のフォルダ又は同一のボックス内において存在し、同一のサーチ結果において頻繁に出現する、記録について、判定することができる。いくつかの例においては、ユーザーは、タグ及び/又はメタデータの形態などにおいて、電子記録に対する特定の属性を定義することができる。特定の属性は、ユーザー固有のものであってもよく、或いは、そうでなくてもよい。特定の属性は、記録の間の文脈的関係を定義するための分類法要素として使用することができる。記録の間の文脈的関係は、それぞれのサーチ反復の実行に伴うなどのように、時間に伴って変化しうる。例えば、異なるサーチセッションにおいて関係するユーザーによってコメントされた2つの記録の間の関係は、相対的に近接したものになりうる。
【0075】
[0083] 知識グラフは、異なる記録の間のみならず、異なるユーザーの間、異なる専門分野の間、異なる記録及びユーザーの間、異なる記録及び専門分野の間、異なるユーザー及び専門分野の間、及び/又は異なるエンティティの間の、文脈的関係を保存することができる。有益には、知識グラフは、記録の文脈的関係及びネットワーク、並びに、記録とユーザーの間の文脈的関係及び活動の両方を有することができる。このような文脈的関係を保存することにより、電子記録と分類法コンポーネントの間の関係のみならず、ユーザーの振る舞いの集計された機械学習済みのコンポーネントと記録又は分類法コンポーネントに対するその関係の間の関係をも含む情報クラスタの生成を許容することができる。グラフデータ構造は、機械学習アルゴリズムを動作させることにより、且つ、記録の操作及び/又はサーチセッションの追加データにより、常に更新することができる。
【0076】
[0084] 図7は、サーチ結果を改善するべく調査することができる様々なエンティティの知識グラフデータベースを示している。知識グラフデータベース700は、第1の記録702、第2の記録704、第1のユーザー706、第2のユーザー708、及び第1の専門分野710というエンティティを有することができる。知識グラフデータベースは、第1の記録702と第1のユーザー706の間の第1の記録関係712、第2の記録704と第1のユーザー706の間の第2の記録関係714、第1の記録702と第2のユーザー716の間の第3の記録関係716、第1のユーザー706と第2のユーザー708の間の第1のユーザー関係718、及び第1のユーザー706と第1の専門分野710の間の専門家関係、という、様々なエンティティの間の関係を有することができる。
【0077】
[0085] ユーザーと記録の間の記録関係(例えば、712、714、716)は、例えば、ユーザーによる記録の閲覧の回数、記録の著者、並びに、記録を検索するべくユーザーによって使用されたサーチクエリを有することができる。2つのユーザーの間のユーザー関係(例えば、718)は、例えば、関係のタイプ(例えば、同僚関係、家族関係、友人関係、職務上の関係など)を有することができる。知識グラフ800内のすべての文脈的関係は、近接性値に対応することができる。近接性値は、任意の2つのエンティティの間の関係の関連性又は近接性を通知することができる。いくつかの例においては、知識グラフ内のすべての2つのエンティティは、近接性関係を有することができる。いくつかの例においては、知識グラフ内の2つのエンティティは、近接性値が既定の閾値(例えば、0.5、0.6、0.7、0.8、0.9、又はその他のスケールなど)以上である場合にのみ、近接性関係を有することができる。
【0078】
[0086] 知識グラフ700の調査の例として、第2のユーザー708によって実行されたサーチが第1の記録702を検索する場合には、少なくとも3つの経路により、第2の記録704を文脈によって検索することができる。第1の経路は、第1の記録702とその他のユーザーの間の記録関係を伴っている。第1の記録702は、第2の記録704をも閲覧した第1のユーザー706によって閲覧されていることから、システムは、第2のユーザー708について、第2の記録704を文脈的に検索することができる。第2の経路は、第2のユーザー708と第1のユーザー706の間のユーザー関係を伴っている。第2のユーザー708及び第1のユーザー706は、同僚関係を有していることから、システムは、第2のユーザー708について、第2のユーザーの同僚である第1のユーザー706も閲覧した第2の記録704を文脈的に検索することができる。別の例においては、第1の記録702及び第2の記録704は、記録間関係(inter-records relationship)(図示されてはいない)を有することが可能であり、且つ、システムは、この記録間関係に基づいて、第2のユーザー708について第2の記録704を文脈的に検索することができる。或いは、この代わりに、又はこれに加えて、任意の2つのエンティティの間の知識グラフ700を調査するべく、文脈関係の任意の組合せを使用することができる。
【0079】
[0087] いくつかの例においては、システムは、文脈的関係の近接性値が既定の閾値以上である場合にのみ、2つのエンティティの間の知識グラフ(例えば、ユーザー、記録、専門分野など)を調査することができる。いくつかの例においては、知識グラフの文脈的調査によって検索される記録の優先順位値は、知識グラフ内において調査される文脈的関係の近接性値に少なくとも部分的に基づいたものでありうる。サーチ結果において検索された複数の記録の優先順位値は、(例えば、関連性の)優先順位によってサーチ結果をソートするべく、使用することができる。
【0080】
[0088] いくつかの例においては、知識グラフは、以前の動作において判定された文脈情報を有することができる。更に詳しくは、知識グラフは、分類法に関係する情報のみならず、(例えば、図6のユーザー振る舞いフィードバックループを介して)過去のユーザーの振る舞いの分析を通じて判定されたユーザーの好みをも有することができる。システムは、例えば、グラフに基づいたデータ構造を調査するための開始点を判定するべく、このような文脈情報を使用することができる。例えば、システムは、サーチクエリに最も近接した特定数(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10個、20個、30個、40個、50個など)の記録を識別することができる。識別された記録のそれぞれは、個々の調査の開始点として使用することができる。いくつかの例においては、システムは、記録の間の類似性スコアを判定する調査アルゴリズムを使用することができる。類似性スコアは、調査済みの文脈関係の近接性値に少なくとも基づいたものであってもよい。いくつかの例においては、上述の、知識グラフ検索の結果の優先順位値は、類似性スコアに少なくとも部分的に基づいたものでありうる。
【0081】
[0089] いくつかの例においては、システムは、既定の閾値(例えば、0.7、0.8、0.9など)を上回る類似性スコアを有する更なる記録のみを検索することができると共に改善されたサーチ結果として提示することができる。或いは、この代わりに、又はこれに加えて、システムは、その分野の専門家が関連性を有するものとして識別した記録を改善済みのサーチ結果として検索してもよく、この場合に、このような関連性は、記録関係にある専門家ユーザーによる記録の閲覧回数によって判定され、且つ、次いで、ユーザーの専門は、ユーザーと専門分野の間の専門家関係の近接性値により、判定される。
【0082】
[0090] 例えば、本明細書において記述されているシステム及び方法によって改善された改善済みのサーチクエリは、サーチを実行するべく、ディスパッチすることができる114。クエリマッパ及びリデューサ170は、例えば、レジストリなどからの、(例えば、実行方法の解明108などの)クエリタイプから予め判定された1つ又は複数の実行方法に基づいて、サーチクエリを異なる実行モジュールにルーティングしてもよく、(「search_engine」実行方法のための)サーチエンジン172として、(「knowledge_graph」実行方法について)知識グラフ174をサーチしてもよく、及び/又は(「records_graph」実行方法について)記録グラフ176をサーチしてもよい。記録グラフは、上述の知識グラフに類似したものであってもよいが、記録及び記録の間の文脈関係を有する。いくつかの例においては、記録グラフは、知識グラフのサブユニットでありうる。システムは、実行に基づいてサーチ結果104を検索することができる。
【0083】
[0091] いくつかの例においては、システムは、「ホット(hot)」及び「コールド(cold)」記録を弁別することができる。ホット記録は、最近6か月以内においてアクセスされた記録でありうると共に、コールド記録は、最近6か月以内においてアクセスされてはいない記録でありうる。或いは、この代わりに、ホット及びコールド記録を分割する時間フレームは、直近の1秒、直近の1分、直近の1時間、直近の2時間、直近の3時間、直近の4時間、直近の6時間、直近の12時間、直近の1日、直近の2日、直近の3日、直近の4日、直近の1週間、直近の2週間、直近の3週間、直近の1か月、直近の2か月、直近の3か月、直近の4か月、直近の1年、直近の2年、直近の3年、直近の4年、直近の5年、直近の10年、或いは、任意のその他の時間フレームなどの、任意のその他の時間フレームでありうる。いくつかの例においては、システムは、ホット記録のみを検索してもよい。有益には、ユーザーは、その他のユーザーがアクセスするべく十分な関連性を少なくとも有するものと既に見出した結果をすることができる。ユーザーは、コールド記録を更に検索するべく、サーチを反復するための選択肢を有することができる。例えば、ディスプレイなどの、結果をユーザーに提示するグラフィカルユーザーインターフェイス上において、システムは、ユーザーがサーチをトリガするべくやり取りしうる、ユーザー対話型オブジェクト(例えば、ボタン、スライダなど)を提供することができる。
【0084】
[0092] 検索されたサーチ結果104は、その後、記録について割り当てられた優先順位値などにより、ソートすることができる。検索されたサーチクエリとの関係における、サーチクエリ、トークン化されたサーチクエリ、改善されたサーチクエリ、サーチ結果、改善されたサーチ結果、及びユーザー活動を含む、サーチセッションは、1つ又は複数のデータベース(例えば、知識グラフ、記録グラフ、トレーニングデータなど)内などにおいて、システムによって保存することができる。
【0085】
[0093] 図1との関係における改善動作などの、本明細書において記述されている動作は、必ずしも、それらが記述されている順序において実行する必要はないことを理解されたい。例えば、知識グラフに基づいた改善は、ユーザーの振る舞いに基づいた改善の前に実行することができる。別の例においては、クエリが、NLPモデル、知識グラフ、及び/又はユーザーの振る舞いのうちの1つ又は複数を介して改善された後に、実行方法を解明することができる。システム及び方法は、流動的なものでありうる。
【0086】
[0094] 図8は、本開示のシステム及び方法によるサンプルクエリ及び処理方法を示している。ユーザー生成されたクエリのクエリタイプは、例えば、図4を参照して記述されている、発話の一部に基づいたNLPモデルを適用するなどにより、識別することができる。例えば、「I need tax audit records」というクエリは、「I need」という発話の一部のパターンに少なくとも部分的に基づいて「what」のクエリタイプとして識別することができる。「I need tax audit records」というクエリは、「I need to」という発話の一部のパターンに少なくとも基づいて「how」のクエリタイプとして識別することができる。「looking for tax forms in box 123」というクエリは、「looking for」という発話の一部のパターンに少なくとも基づいて「what qualified」のクエリタイプとして識別することができる。システムは、例えば、キーワードを判定するべく、クエリに対して分類法抽出を実行することができる。いくつかの例においては、分類法抽出は、正規表現(例えば、regex)及び/又は発話の一部のパターンに基づいたものでありうる。例えば、「looking for tax forms in box 123」というクエリは、修飾クエリタイプについて「box 123」という分類法コンポーネントを抽出することができる。
【0087】
[0095] システムは、NLPモデルライブラリを有するグラフデータベースなどを介してサーチクエリをNLPモデルライブラリにマッチングすることにより、クエリタイプの文脈を判定することができる。「I need tax audit records」というクエリの場合には、システムは、「options for tax」、「corporate tax」、及び「employee tax」という文脈を判定することができる。「looking for tax forms in box 123」というクエリの場合には、システムは、「options for tax」、「corporate tax」、及び「employee tax」という文脈を判定することができる。
【0088】
[0096] システムは、クエリをサブミットしたユーザーに固有の使用法パターンを判定することができる。いくつかの例においては、システムは、本明細書のどこか別の場所において記述されているユーザー振る舞いフィードバックループを実行することができる。例えば、上述の3つのクエリサンプルを有するすべての3つのユーザーを企業金融において働いているものと識別することができると共に、システムは、「corporate tax(法人税)」の文脈に対して相対的に大きな重みを付与することを推奨することができる。
【0089】
[0097] システムは、クエリタイプ、抽出された分類法、文脈、及び/又はサンプルクエリの使用法パターンに少なくとも部分的に基づいてサンプルクエリを改善することができる。例えば、「what」クエリタイプを有する「I need tax audit records」というクエリの場合に、システムは、(例えば、語彙辞書から)相対的に良好な同義語又はクエリの文脈に関係するオリジナルのクエリ内において含まれていない任意の更なるキーワードを識別することができる。例えば、これらのキーワードは、クエリについて識別された文脈NLPモデルに近接したNLPモデルから識別することができる(例えば、「options for tax」、「corporate tax」、「employee tax」など)。例として、システムは、「IRS filings」というキーワードをオリジナルのクエリに付加することができる。別の例においては、「how」クエリタイプを有する「I need to audit tax audit records」というクエリの場合に、システムは、クエリを最良に実行するべく使用される分類法コンポーネントを識別することができる。例として、システムは、サーチの時点において使用される記録共有活動及び分類法を利用することができる。更に別の例においては、「what qualified」クエリタイプを有する「looking for tax forms in box 123」というクエリタイプの場合に、システムは、「box 123」という抽出された分類法コンポーネントの分類法フィルタを追加することができる。サーチは、クエリタイプにマッピングされた実行方法に基づいて実行することができる。例えば、「what」及び「what qualified」クエリタイプの場合に、キーワードタイプサーチ(例えば、「search_engine」方法)は、グラフタイプサーチ(例えば、「knowledge_graph」方法や「records_graph」方法など)よりも大きな重み(例えば、相対的に大きな優先順位重み値)を有することができる。別の例においては、「how」クエリタイプの場合に、グラフタイプサーチ(例えば、「knowledge_graph」方法や「records_graph」方法など”は、キーワードタイプサーチよりも大きな重みを有することができる。
【0090】
[0098] いくつかの例においては、クエリの受け取り、初期処理、実行方法の解明、ユーザーの振る舞いに基づいた改善、ユーザー振る舞いフィードバックループの実行、サーチクエリの改善、サーチのディスパッチ、クエリのマッピング及び/又は低減、サーチの実行、サーチ結果の供給、及びその他の動作などの、本明細書において記述されている動作は、(例えば、プロセッサ及びメモリを有する)1つ又は複数のモジュールによって実行することができる又は稼働させることができる。1つ又は複数のモジュールは、個々に又は集合的に、本開示の動作又は動作の組合せを実行することができる。モジュールは、コンピュータシステムでありうる。
【0091】
コンピュータ制御システム
[0099] 本開示は、本開示の方法を実装するべくプログラミングされるコンピュータ制御システムを提供している。図9は、その他の動作の加えて、クエリの受け取り、クエリの初期処理、クエリタイプの判定、クエリタイプ用の実行方法の解明、ユーザーの振る舞いに基づいたクエリの改善、ユーザー振る舞いフィードバックループの実行、知識グラフに基づいたクエリの改善、グラフデータベースの保存及びナビゲーション、サーチのディスパッチ、クエリのマッピング、及び/又は低減、サーチの実行、サーチ結果の供給、サーチ結果のフィルタリング及び/又はソート、トレーニングデータの保存及びこれからの学習のためにプログラミングされる又はその他の方法で構成されるコンピュータシステム901を示している。コンピュータシステム901は、ユーザーの電子装置でありうるか、又は電子装置との関係において遠隔配置されたコンピュータシステムでありうる。電子装置は、モバイル電子装置でありうる。
【0092】
[0100] コンピュータシステム901は、中央処理ユニット(CPUであり、本明細書においては、「プロセッサ」及び「コンピュータプロセッサ」とも呼称される)を含み、中央処理ユニットは、シングルコア又はマルチコアのプロセッサ、或いは、並列処理用の複数のプロセッサ、でありうる。プロセッサ905は、コントローラ、マイクロプロセッサ、及び/又はマイクロコントローラでありうる。また、コンピュータシステム901は、メモリ又はメモリ場所910(例えば、ランダムアクセスメモリ、読み出し専用メモリ、フラッシュメモリ)、電子ストレージユニット915(例えば、ハードディスク)、1つ又は複数のその他のシステムと通信するための通信インターフェイス920(例えば、ネットワークアダプタ)、並びに、キャッシュ、その他のメモリ、データストレージ、及び/又は電子表示アダプタなどの、周辺装置925をも含む。メモリ910、ストレージユニット915、インターフェイス920、及び周辺装置925は、マザーボードなどの、通信バス(実線)を通じて、CPU905との通信状態にある。ストレージユニット915は、データを保存するためのデータストレージユニット(或いは、データリポジトリ)でありうる。コンピュータシステム901は、通信インターフェイス920の支援により、コンピュータネットワーク(「ネットワーク」)930に動作自在に結合することができる。ネットワーク930は、インターネット、インターネット、及び/又はエクストラネント、或いは、インターネットとの通信状態にあるイントラネット及び/又はエクストラネットでありうる。いくつかのケースにおけるネットワーク930は、電気通信及び/又はデータネットワークである。ネットワーク930は、1つ又は複数のコンピュータサーバーを含むことが可能であり、これらのコンピュータサーバーにより、クラウド演算などの、分散型の演算が可能となる。ネットワーク930は、コンピュータシステム901の支援を有するいくつかのケースにおいては、ピアツーピアネットワークを実装することが可能であり、ピアツーピアネットワークにより、コンピュータシステム901に結合された装置がクライアント又はサーバーとして振る舞うことが可能となりうる。
【0093】
[0101] CPU905は、機械可読命令のシーケンスを実行することが可能であり、機械可読命令のシーケンスは、プログラム又はソフトウェアにおいて実施することができる。命令は、メモリ910などの、メモリ場所において保存することができる。命令は、CPU905に送付することが可能であり、命令は、その後に、本開示の方法を実装するように、CPU905をプログラミングすることが可能であり、或いは、その他の方法で構成することができる。CPU905によって実行される動作の例は、フェッチ、デコード、実行、及び書き戻しを含みうる。
【0094】
[0102] CPU905は、集積回路などの、回路の一部分でありうる。回路内には、システム901の1つ又は複数のその他のコンポーネントを含むことができる。いくつかのケースにおいては、回路は、用途固有の集積回路(ASIC:Application Specific Integrated Circuit)である。
【0095】
[0103] ストレージユニット915は、ドライバ、ライブラリ、及び保存されたプログラムなどの、ファイルを保存することができる。ストレージユニット915は、例えば、ユーザーの好み及びユーザープログラムなどの、ユーザーデータを保存することができる。いくつかのケースにおけるコンピュータシステム901は、イントラネット又はインターネットを通じてコンピュータシステム901との通信状態にあるリモートサーバー上に配置されているものなどの、コンピュータシステム901の外部の1つ又は複数の更なるデータストレージユニットを含むことができる。
【0096】
[0104] コンピュータシステム901は、ネットワーク930を通じて1つ又は複数のリモートコンピュータシステムと通信することができる。例えば、コンピュータシステム901は、ユーザー(例えば、記録管理システムのユーザー)のリモートコンピュータシステムと通信することができる。リモートコンピュータシステムの例は、パーソナルコンピュータ(例えば、携帯型のPC)、スレート又はタブレットPC(例えば、Apple(登録商標) iPad、Samsung(登録商標) Galaxy Tab)、電話機、スマートフォン(例えば、Apple(登録商標) iPhone、Android対応型の装置、Blackberry(登録商標))、或いは、パーソナルデジタルアシスタントを含む。ユーザーは、ネットワーク930を介してコンピュータシステム901にアクセスすることができる。
【0097】
[0105] 本明細書において記述されている方法は、例えば、メモリ910又は電子ストレージユニット915上などの、コンピュータシステム901の電子的ストレージ場所上において保存されている機械(例えば、コンピュータプロセッサ)実行可能コードによって実装することができる。機械実行可能又は機械可読コードは、ソフトウェアの形態において提供することができる。使用の際に、コードは、プロセッサ905によって実行することができる。いくつかのケースにおいては、コードは、ストレージユニット915から取得することができると共に、プロセッサ905による容易なアクセスのために、メモリ910上において保存することができる。いくつかの状況においては、電子ストレージユニット915を除外することが可能であり、且つ、機械実行可能命令は、メモリ910上において保存されている。
【0098】
[0106] コードは、事前コンパイルすることができると共に、コードを実行するように適合されたプロセッサを有する機械と共に使用されるように、構成することが可能であり、或いは、実行時にコンパイルすることもできる。コードは、コードが予めコンパイルされる又は実行時にコンパイルされる方式において稼働することを可能にするように選択されうるプログラミング言語において供給することができる。
【0099】
[0107] コンピュータシステム901などの、本明細書において提供されているシステム及び方法の態様は、プログラミングにおいて実施することができる。技術の様々な態様は、通常は、機械可読媒体のタイプにおいて担持された又は実施された、機械(或いは、プロセッサ)実行可能コード及び/又は関連するデータの形態における、「製品」又は「製造物品」であるものと見なすことができる。機械実行可能コードは、メモリ(例えば、読み出し専用メモリ、ランダムアクセスメモリ、フラッシュメモリ)又はハードディスクなどの、電子ストレージユニット上において保存することができる。「ストレージ」タイプのメディアは、ソフトウェアプログラミングのために、任意の時点において一時的ではない保存を提供することができる、様々な半導体メモリ、テープドライブ、ディスクドライブ、及びこれらに類似したものなどの、コンピュータ、プロセッサ、又はこれらに類似したもの、或いは、これらの関連するモジュール、の有体のメモリのいずれか又はすべてを含みうる。ソフトウェアのすべて又は一部分は、多くの場合に、インターネット又は様々なその他の電気通信ネットワークを通じて伝達することができる。例えば、このような通信は、例えば、管理サーバー又はホストコンピュータからアプリケーションサーバーのコンピュータプラットフォーム内へなどの、1つのコンピュータ又はプロセッサから別のものへの、ソフトウェアの読み込みを可能にすることができる。従って、ソフトウェア要素を搬送しうる、媒体の別のタイプは、有線又は光ランドラインネットワークを通じて、且つ、様々な無線リンク上において、ローカル装置の間において物理的なインターフェイスに跨って使用されているものなどの、光、電気、及び電磁波を含む。また、有線又は無線リンク、光リンク、或いは、これらに類似したものなどの、このような波を搬送する物理的要素も、ソフトウェアを担持する媒体と見なすことができる。本明細書において使用されている、コンピュータ又は機械「可読媒体」などの用語は、一時的ではない有体の「ストレージ」媒体に限定されていない限り、実行のためにプロセッサに命令を提供することに参画する任意の媒体を意味している。
【0100】
[0108] 従って、コンピュータ実行可能コードなどの、機械可読媒体は、限定を伴うことなしに、有体のストレージ媒体、搬送波媒体、又は物理的な送信媒体を含む、多くの形態を有することができる。不揮発性ストレージ媒体は、例えば、図面に示されている、データベースを実装するべく使用されうるものなどのような、任意のコンピュータ内のストレージ装置又はこれに類似したもののうちの任意のものなどの、光又は磁気ディスクを含む。揮発性ストレージ媒体は、このようなコンピュータプラットフォームのメインメモリなどの、ダイナミックメモリを含む。有体の送信媒体は、コンピュータシステム内においてバスを構成しているワイヤを含む、同軸ケーブル、銅ワイヤ、及び光ファイバを含む。搬送波送信媒体は、高周波(RF:Radio Frequency)及び赤外線(IR:InfraRed)データ通信の際に生成されるものなどの、電気又は電磁信号、或いは、音波又は光波の形態を有することができる。従って、コンピュータ可読媒体の一般的な形態は、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、任意のその他の磁気媒体、CD-ROM、DVD又はDVD-ROM、任意のその他の光媒体、パンチカード、紙テープ、孔のパターンを有する任意のその他の物理的ストレージ媒体、RAM、ROM、PROM、及びEPROM、FLASH-EPROM、任意のその他のメモリチップ又はカートリッジ、データ又は命令を搬送する搬送波、このような搬送波を搬送するケーブル又はリンク、或いは、コンピュータがプログラミングコード及び/又はデータを読み取りうる任意のその他の媒体を含む。コンピュータ可読媒体のこれらの形態の多くは、実行のための1つ又は複数の命令の1つ又は複数のシーケンスのプロセッサへの搬送に関与することができる。
【0101】
[0109] コンピュータシステム901は、ユーザーが、例えば、命令を記録管理システムに提供するための、及び/又は記録管理システムによってユーザー管理可能なインターフェイスとして提示される、ユーザーインターフェイス(UI:User Interface)940を有する、電子ディスプレイ935を含むことが可能であり、或いは、これとの通信状態にありうる。UIの例は、限定を伴うことなしに、グラフィカルユーザーインターフェイス(GUI:Graphical User Interface)及びウェブに基づいたユーザーインターフェイスを含む。コンピュータシステムは、サーチを促進するなどのために、グラフィカルユーザーインターフェイス及び/又はウェブに基づいたユーザーインターフェイスを表示することができる。ユーザーは、GUI及び/又はウェブに基づいたユーザーインターフェイスを介して、サーチクエリを提供してもよく、サーチ結果を受け取ってもよく、クエリタイプレジストリの定義を提供してもよく、且つ、その他の動作を実行してもよい。
【0102】
[0110] 本開示の方法及びシステムは、1つ又は複数のアルゴリズムによって実装することができる。アルゴリズムは、中央処理ユニット905によって実行された際にソフトウェアによって実装することができる。アルゴリズムは、その他の動作に加えて、例えば、クエリの受け取り、クエリの初期処理、クエリタイプの判定、クエリタイプ用の実行方法の解明、ユーザーの振る舞いに基づいたクエリの改善、ユーザー振る舞いフィードバックループの実行、知識グラフに基づいたクエリの改善、グラフデータベースの保存及びナビゲーション、サーチのディスパッチ、クエリのマッピング、及び/又は低減、サーチの実行、サーチ結果の供給、サーチ結果のフィルタリング、及び/又はソート、並びに、トレーニングデータの保存及び学習のためにプログラミングすることができる。
【0103】
[0111] 本発明の好適な実施形態が本明細書において図示及び記述されているが、当業者には、これらの実施形態は、例として提供されたものに過ぎないことが明らかであろう。本発明は、本明細書において提供されている特定の例によって限定されるべく意図されてはいない。本発明は、上述の仕様を参照して記述されているが、本明細書における実施形態の記述及び図示は、限定の意味において解釈されるべく意図されてはいない。いまや、当業者には、本発明を逸脱することなしに、多数の変形、変更、及び置換が想起されよう。更には、本発明のすべての態様は、様々な条件及び変数に依存する、本明細書において記述されている特定の描画、構成、又は相対的な割合に限定されるものではないことを理解されたい。本発明を実施する際には、本明細書において記述されている本発明の実施形態にする様々な代替肢が利用されうることを理解されたい。従って、本発明は、任意のその他の代替肢、変更、変形、又は均等物をも包含するものと想定されている。添付の請求項は、本発明の範囲を定義しており、且つ、これらの請求項及びその均等物の範囲に含まれる方法及び構造は、これにより、包含されることが意図されている。
図1
図2
図3
図4
図5
図6
図7
図8
図9
【手続補正書】
【提出日】2022-03-18
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
サーチクエリの文脈的改善のためのコンピュータ実装された方法であって、
(a)ユーザーから、ユーザインターフェースを介して、サーチクエリを受け取ることと、
(b)1つ又は複数のコンピュータプロセッサの支援により、前記サーチクエリに対応する複数の自然言語処理(NLP)モデルのうちの第1のNLPモデルを判定することであって、前記第1のNLPモデルは、1つ又は複数のキーワードの第1の組に対応する、ことと、
(c)1つ又は複数のコンピュータプロセッサの支援により、前記複数のNLPモデルのうちの第2のNLPモデルを判定することであって、前記第2のNLPモデルは、1つ又は複数キーワードの第2の組に対応し、前記第1のNLPモデル及び前記第2のNLPモデルは、既定の閾値以上の重み値を有する近接性関係を有する、ことと、
(d)前記サーチクエリ内において元々存在していない前記1つ又は複数のキーワードの第2の組のキーワードによって前記サーチクエリを改善して改善されたサーチクエリを生成することと、
(e)前記改善されたサーチクエリを実行することと
を含む、コンピュータ実装された方法。
【請求項2】
前記複数のNLPモデルは、1つ又は複数のデータベース内に保存される、請求項1に記載のコンピュータ実装された方法。
【請求項3】
前記複数のNLPモデルは、グラフデータベース内に保存される、請求項2に記載のコンピュータ実装された方法。
【請求項4】
前記グラフデータベースは、前記複数のNLPモデルの間の近接性関係を更に保存する、請求項3に記載のコンピュータ実装された方法。
【請求項5】
前記1つ又は複数のコンピュータプロセッサの支援により、前記複数のNLPモデルのうちの追加の1つ又は複数のNLPモデルを判定することであって、前記追加の1つ又は複数のNLPモデル及び前記第1のNLPモデルのぞれぞれは、前記既定の閾値以上のそれぞれの重み値を有するそれぞれの近接性関係を有し、前記追加の1つ又は複数のNLPモデルのぞれぞれは、1つ又は複数のキーワードのそれぞれの組に対応する、ことを更に含む、請求項1に記載のコンピュータ実装された方法。
【請求項6】
前記1つ又は複数のキーワードのそれぞれの組によって前記サーチクエリを改善して前記改善されたサーチクエリを生成することを更に含む、請求項5に記載のコンピュータ実装された方法。
【請求項7】
前記第1のNLPモデルは、前記サーチクエリを1つ又は複数のトークンにトークン化してトークン化されたクエリを生成し、かつ前記トークン化されたクエリを前記1つ又は複数のキーワードの第1の組に対して処理することによって、前記サーチクエリに対応すると判定される、請求項5に記載のコンピュータ実装された方法。
【請求項8】
前記サーチクエリは、前記複数のNLPモデルのそれぞれに対して処理されて前記第1のNLPモデルが前記サーチクエリに対応すると判定する、請求項5に記載のコンピュータ実装された方法。
【請求項9】
サーチクエリの文脈的改善のためのコンピュータシステムであって、
1つ又は複数のプロセッサと、
以下の
(a)ユーザーから、ユーザインターフェースを介して、サーチクエリを受け取ることと、
(b)1つ又は複数のコンピュータプロセッサの支援により、前記サーチクエリに対応する複数の自然言語処理(NLP)モデルのうちの第1のNLPモデルを判定することであって、前記第1のNLPモデルは、1つ又は複数のキーワードの第1の組に対応する、ことと、
(c)1つ又は複数のコンピュータプロセッサの支援により、前記複数のNLPモデルのうちの第2のNLPモデルを判定することであって、前記第2のNLPモデルは、1つ又は複数キーワードの第2の組に対応し、前記第1のNLPモデル及び前記第2のNLPモデルは、既定の閾値以上の重み値を有する近接性関係を有する、ことと、
(d)前記サーチクエリ内において元々存在していない前記1つ又は複数のキーワードの第2の組のキーワードによって前記サーチクエリを改善して改善されたサーチクエリを生成することと、
(e)前記改善されたサーチクエリを実行することと
を行うべく、個々に又は集合的に、前記1つ又は複数のプロセッサによって実行可能である命令を含む、前記1つ又は複数のプロセッサに通信自在に結合されたメモリと
を含む、コンピュータシステム。
【請求項10】
1つ又は複数のデータベースを更に含み、前記複数のNLPモデルは、前記1つ又は複数のデータベース内に保存される、請求項9に記載のコンピュータシステム。
【請求項11】
グラフデータベースを更に含み、前記複数のNLPモデルは、前記グラフデータベース内に保存される、請求項9に記載のコンピュータシステム。
【請求項12】
前記グラフデータベースは、前記複数のNLPモデルの間の近接性関係を更に保存する、請求項11に記載のコンピュータシステム。
【請求項13】
前記1つ又は複数のプロセッサは、個々に又は集合的に、前記複数のNLPモデルのうちの追加の1つ又は複数のNLPモデルを判定するように更に構成され、前記追加の1つ又は複数のNLPモデル及び前記第1のNLPモデルのぞれぞれは、前記既定の閾値以上のそれぞれの重み値を有するそれぞれの近接性関係を有し、前記追加の1つ又は複数のNLPモデルのぞれぞれは、1つ又は複数のキーワードのそれぞれの組に対応する、請求項9に記載のコンピュータシステム。
【請求項14】
前記1つ又は複数のプロセッサは、個々に又は集合的に、前記1つ又は複数のキーワードのそれぞれの組によって前記サーチクエリを改善して前記改善されたサーチクエリを生成するように更に構成される、請求項13に記載のコンピュータシステム。
【請求項15】
前記1つ又は複数のプロセッサは、個々に又は集合的に、前記サーチクエリを1つ又は複数のトークンにトークン化してトークン化されたクエリを生成し、かつ前記トークン化されたクエリを前記1つ又は複数のキーワードの第1の組に対して処理することによって、前記第1のNLPモデルが前記サーチクエリに対応すると判定するように更に構成される、請求項13に記載のコンピュータシステム。
【請求項16】
前記1つ又は複数のプロセッサは、個々に又は集合的に、前記サーチクエリを前記複数のNLPモデルのそれぞれに対して処理して前記第1のNLPモデルが前記サーチクエリに対応すると判定するように更に構成される、請求項13に記載のコンピュータシステム。
【外国語明細書】