【課題を解決するための手段】
【0002】
システムおよび方法が、コンテキスト用語、静的ナレッジグラフ、および時間的ナレッジグラフに基づいて、テキストセグメント内の曖昧な用語の意味を決定するために本明細書で提供される。これらのシステムおよび方法は、テキストセグメント内の未知の用語を識別することに応じて、コンテキスト用語に関してテキストセグメントを分析する。システムおよび方法は、コンテキスト用語と関連付けられる第1のナレッジグラフ(すなわち、静的ナレッジグラフ)にアクセスし、未知の用語の意味である潜在的用語を決定する。システムおよび方法は、未知の用語の意味であり得る、1つを上回る潜在的用語が第1のナレッジグラフの中にあることを決定することに応じて、未知の用語が曖昧な用語であることを決定する。この場合、システムおよび方法は、未知の用語の意味の曖昧性を除去するためのエンティティの間の関係の時間次元を考慮する。システムおよび方法は、テキストセグメントのタイムスタンプを決定し、第1のコンテキスト用語と関連付けられ、タイムスタンプに関連する第2のナレッジグラフ(すなわち、時間的ナレッジグラフ)にアクセスして、第1の未知の用語の意味である潜在的用語を決定することによって、これを達成する。
【0003】
いくつかの側面では、双方向メディアガイドアプリケーションは、テキストセグメント内の第1の未知の用語を識別する。例えば、双方向メディアガイドアプリケーションは、ユーザのためにテキストセグメント「Bernie Sanders has called out Clinton for soliciting donations from banks and corporations」を表示するために生成してもよい。双方向メディアガイドアプリケーションは、用語「Clinton」が、その意味を提供する、それと関連付けられるメタデータまたは識別子タグを有していないことを決定してもよい。この場合、双方向メディアガイドアプリケーションは、用語「Clinton」が未知の用語であることを決定する。双方向メディアガイドアプリケーションは、第1のコンテキスト用語に関してテキストセグメントを分析する。双方向メディアガイドアプリケーションは、テキストマイニング技法(例えば、名前を付けられたエンティティ認識、同一指示、感情分析、意味論分析等)を使用し、第1のコンテキスト用語を決定してもよい。例えば、双方向メディアガイドアプリケーションは、「Bernie Sanders」を第1のコンテキスト用語として識別する。
【0004】
双方向メディアガイドアプリケーションは、第1のコンテキスト用語と関連付けられる第1のナレッジグラフにアクセスし、第1の未知の用語の意味である潜在的用語を識別することによって、第1の未知の用語の意味を決定する。ナレッジリポジトリは、数百万ものエンティティおよび他のエンティティとのそれらの関係についての情報を含有する。ナレッジリポジトリは、多種多様なソース(例えば、百科事典、Wikipedia、ニュース記事、ソーシャルメディア、および他の類似ソース)からのエンティティについての情報を含有し、エンティティと関連付けられる包括的ナレッジグラフを提供することができる。これらのナレッジグラフは、典型的には、全ての時間周期にわたって蓄積される、エンティティと他のエンティティとの間の全ての関係を含む。いくつかの実施形態では、双方向メディアガイドアプリケーションは、潜在的用語と未知の用語との間の類似性に基づいて、未知の用語の意味であり得る潜在的用語を識別してもよい。例えば、第1のコンテキスト用語「Bernie Sanders」と関連付けられる第1のナレッジグラフは、Wikipedia等の一般的ナレッジコーパスから導出されてもよい。双方向メディアガイドアプリケーションは、未知の用語「Clinton」へのそれらの類似性により、用語「Bill Clinton」、「Hillary Clinton」、および「Ryan Clinton」を潜在的用語として識別してもよい。
【0005】
いくつかの実施形態では、双方向メディアガイドアプリケーションは、第1のナレッジグラフ内の用語のメタデータ記述子を使用し、用語が潜在的用語であるかどうかを決定してもよい。例えば、第1のナレッジグラフは、用語「Secretary of State」を含んでもよく、関連付けられるメタデータの一部は、「Hillary Clinton」であってもよい。この場合、双方向メディアガイドアプリケーションは、「Secretary of State」を潜在的用語として決定してもよい。いくつかの実施形態では、双方向メディアガイドアプリケーションは、第2のステップとして用語と第1のコンテキスト用語との間の関連性の強度を使用し、最も可能性の高い潜在的用語を除外してもよい。関連性の強度は、ナレッジグラフ内の2つの用語の間の正規化された距離の逆数であってもよい。例えば、「Bernie Sanders」と、「Bill Clinton」、「Hillary Clinton」、「Ryan Clinton」、および「Secretary of State」のそれぞれとの間の関連性の正規化された強度は、それぞれ、0.7、0.7、0.2、および0.2である。関連性の要求される閾値強度が0.5である場合には、双方向メディアガイドアプリケーションは、第1のナレッジグラフに基づいて、用語「Bill Clinton」および「Hillary Clinton」が第1の未知の用語の意味であり得る潜在的用語であることを決定してもよい。
【0006】
双方向メディアガイドアプリケーションは、第1のナレッジグラフが第1の未知の用語の意味であり得る1つを上回る潜在的用語を含むかどうかを決定する。例えば、双方向メディアガイドアプリケーションは、ブール比較関数を使用し、潜在的用語の数に対応するカウンタの値が1を上回るかどうかを決定してもよい。第1のナレッジグラフが第1の未知の用語の意味であり得る1つを上回る潜在的用語を含むことを決定するステップに応答して、双方向メディアガイドアプリケーションは、テキストセグメントと関連付けられるタイムスタンプを決定する。タイムスタンプは、テキストセグメントの起源およびコンテンツに応じて、任意の時間周期であり得る。例えば、テキストセグメントが2010年〜2016年の間の選挙運動寄付方針の変更を詳述するレポートである場合、タイムスタンプは、2010年〜2016年であってもよい。ソーシャルメディアステータス更新(例えば、Twitter投稿)または自然言語クエリに関して、タイムスタンプは、更新またはクエリの正確な日付および時間であってもよい。タイムスタンプは、テキストセグメントのコンテンツが関連する時間についての情報を導出するために使用される。
【0007】
双方向メディアガイドアプリケーションは、テキストセグメントと関連付けられるメタデータを使用し、タイムスタンプを決定してもよい。例えば、オンライン記事は、それらと関連付けられる起源の日付を有してもよい。代替として、双方向メディアガイドアプリケーションは、テキストマイニング技法を使用し、テキストセグメント自体から時間インジケータを抽出してもよい。例えば、テキストセグメントは、テキストセグメント内で詳述されるイベントの日付(例えば、「On January 11, 2016, Bernie Sanders called out Clinton…」)またはタイムスタンプを推定するために使用され得る他の文脈情報(例えば、「Speaking to his supporters on the coldest winter day recorded in 30 years, Bernie Sanders called out Clinton…」)を含有してもよい。例えば、双方向メディアガイドアプリケーションは、テキストセグメントと関連付けられるタイムスタンプが2016年1月11日であることを決定してもよい。
【0008】
双方向メディアガイドアプリケーションは、第1のコンテキスト用語と関連付けられ、タイムスタンプに関連する第2のナレッジグラフにアクセスし、第1の未知の用語の意味である潜在的用語を決定することによって、第1の未知の用語の意味を決定する。エンティティの間の関連性は、経時的に変化する。第2のナレッジグラフは、全ての時間周期ではなくてタイムスタンプに関連する特定の時間と関連付けられるため、エンティティの間の関連性の時間次元を捕捉する。例えば、男子生徒「Ryan Clinton」が自分の昼食代をBernie Sandersの選挙運動に寄付したというニュースが、特定の1週間の間にトレンドになっていた場合、用語「Bernie Sanders」と「Ryan Clinton」との間の関連性は、その1週間と関連付けられるコーパスのみから導出されるナレッジグラフの中では強いであろう。しかしながら、同一の2つの用語の間の関連性は、全ての時間周期にわたってコーパスから導出されるナレッジグラフ(例えば、第1のナレッジグラフ)の中では弱いであろう。
【0009】
双方向メディアガイドアプリケーションは、タイムスタンプに関連する第2のナレッジグラフにアクセスすることによって、テキストセグメントに関連する時間周期中に最も重要であった関連性を決定することができる。例えば、第1のコンテキスト用語「Bernie Sanders」と関連付けられ、タイムスタンプ2016年1月11日に関連する、第2のナレッジグラフは、2016年1月11日までの1週間の間のニュース記事、ソーシャルメディア、および他のコーパスからの情報を捕捉する、ナレッジグラフであってもよい。前述で議論された、双方向メディアガイドアプリケーションが第2のナレッジグラフから第1の未知の用語の意味である潜在的用語を決定し得る、技法は、ここで適用可能である。
【0010】
いくつかの実施形態では、第2のナレッジグラフは、その位置がテキストセグメントのタイムスタンプに基づいて決定される、特定の時間間隔と関連付けられる。例えば、特定の時間間隔は、1週間であってもよい。特定の時間間隔は、デフォルト時間間隔であってもよい。特定の時間間隔を使用することによって、双方向メディアガイドアプリケーションは、ナレッジグラフが導出されるコーパスの量を限定し、トレンド関連性の識別を促進することができる。特定の時間間隔の位置は、第2のナレッジグラフがテキストセグメント内の曖昧な用語の曖昧性を除去することに役立つ可能性が最も高いコーパスから導出されることを確実にするように、タイムスタンプに基づいて決定される。タイムスタンプが2016年1月11日であった、前の実施例から、双方向メディアガイドアプリケーションは、1週間の位置が2016年1月11日までの1週間であると決定してもよい。この場合、双方向メディアガイドアプリケーションは、2016年1月4日〜11日の1週間からのコーパスから導出される第2のナレッジグラフにアクセスするであろう。
【0011】
いくつかの実施形態では、第2のナレッジグラフと関連付けられる特定の時間間隔の持続時間は、第1のナレッジグラフと関連付けられる時間間隔の持続時間よりも短い。例えば、第1のナレッジグラフは、何年にも及ぶコーパスから導出される静的ナレッジグラフであってもよい。第2のナレッジグラフは、一方で、ある日と関連付けられるコーパスから導出される時間的ナレッジグラフであってもよい。
【0012】
いくつかの実施形態では、第2のナレッジグラフと関連付けられる特定の時間間隔の位置は、第2のナレッジグラフと関連付けられる特定の時間間隔がタイムスタンプと重複するようなものである。特定の時間間隔とタイムスタンプとの間の重複は、部分的または完全であり得る。例えば、タイムスタンプは、2016年1月11日であってもよく、特定の時間間隔は、2016年1月7日〜14日であってもよい。例えば、タイムスタンプは、2016年1月11日〜3月11日であってもよく、特定の時間間隔は、2016年1月1日〜31日であってもよい。いくつかの実施形態では、第2のナレッジグラフと関連付けられる特定の時間間隔の位置は、第2のナレッジグラフと関連付けられる特定の時間間隔がテキストセグメントのタイムスタンプに先行するようなものである。例えば、曖昧な用語を含有するテキストセグメントは、2016年1月11日に受信された過去のイベントについての自然言語クエリであってもよい。この場合、第2のナレッジグラフと関連付けられる特定の時間間隔は、2016年1月3日〜6日であってもよい。いくつかの実施形態では、第2のナレッジグラフと関連付けられる特定の時間間隔の位置は、第2のナレッジグラフと関連付けられる特定の時間間隔がテキストセグメントのタイムスタンプの後に続くようなものである。例えば、曖昧な用語を含有するテキストセグメントは、2016年1月11日午後3時33分のソーシャルメディア投稿であってもよい。双方向メディアガイドアプリケーションは、最初のソーシャルメディア投稿に応答して書かれたソーシャルメディア投稿が、第2のナレッジグラフを導出する最良のコーパスであろうことを決定してもよい。故に、第2のナレッジグラフと関連付けられる特定の時間間隔は、2016年1月11日午後3時34分〜午後6時であってもよい。
【0013】
いくつかの実施形態では、特定の時間間隔の持続時間は、テキストセグメントを分析することによって識別される、時間インジケータに部分的に基づく。例えば、双方向メディアガイドアプリケーションは、テキストマイニング技法を使用し、テキストセグメント内に存在し得、曖昧な用語と関連付けられ得る、時間インジケータ(例えば、今日、1週間の間、先月の全体、過去2年の間等)を識別してもよい。例えば、双方向メディアガイドアプリケーションは、自然言語クエリ「What did Clinton say to Bernie Sanders at the fund raiser today?」を分析し、「today」が曖昧な用語「Clinton」と関連付けられる時間インジケータであることを決定してもよい。双方向メディアガイドアプリケーションは、時間インジケータ「today」に基づいて、特定の時間間隔の持続時間が1日であるはずであることを決定してもよい。
【0014】
いくつかの実施形態では、特定の時間間隔の持続時間は、テキストセグメントのソースに部分的に基づく。例えば、双方向メディアガイドアプリケーションは、テキストセグメントのソースが日刊新聞(例えば、New York Times)であることを決定してもよい。この場合、双方向メディアガイドアプリケーションは、日刊新聞が過去数日の間に起こったイベントを参照する可能性が最も高いため、1週間であるように特定の時間間隔の持続時間を設定してもよい。テキストセグメントのソースが、議論されている話題がより頻繁に変化するマイクロブログプラットフォーム(例えば、Twitter)であることを、双方向メディアガイドアプリケーションが決定する場合、双方向メディアガイドアプリケーションは、1日であるように特定の時間間隔の持続時間を設定してもよい。ユーザから受信される自然言語クエリに関して、双方向メディアガイドアプリケーションは、(例えば、ユーザプロファイル情報を使用することによって)ユーザを識別してもよい。双方向メディアガイドアプリケーションは、次いで、ユーザと関連付けられる情報(例えば、ユーザプロファイルと関連付けられるクエリ履歴、メディア消費パターン、および他のそのような情報)を使用し、特定の時間間隔の持続時間を決定してもよい。例えば、双方向メディアガイドアプリケーションは、クエリがユーザTommyから受信されることを決定してもよい。双方向メディアガイドアプリケーションは、Tommyのユーザプロファイルから、彼が主に日刊新聞を読み、これらの新聞の中のイベントに関連する頻繁なクエリを有することを決定してもよい。この場合、双方向メディアガイドアプリケーションは、Tommyのクエリの中の曖昧な用語が最近のイベントを指す可能性が最も高いことを決定し、1週間であるように特定の時間間隔を設定してもよい。
【0015】
いくつかの実施形態では、双方向メディアガイドアプリケーションは、第1のナレッジグラフが、第1の未知の用語の意味であり得る、いかなる潜在的用語も含まないことを決定する。例えば、テキストセグメント「Megan Kelly, Bernie Sander, and Clinton were all at the debate」に関して、双方向メディアガイドアプリケーションは、「Clinton」を未知の用語として、「Megan Kelly」を第1のコンテキスト用語として識別してもよい。双方向メディアガイドアプリケーションは、第1のコンテキスト用語「Megan Kelly」と関連付けられる第1のナレッジグラフにアクセスし、未知の用語「Clinton」の意味であり得る潜在的用語が第1のナレッジグラフの中にないことを決定してもよい。双方向メディアガイドアプリケーションは、次いで、テキストセグメント内の第2のコンテキスト用語を識別してもよい。例えば、双方向メディアガイドアプリケーションは、「Bernie Sanders」を第2のコンテキスト用語として識別してもよい。
【0016】
いくつかの実施形態では、双方向メディアガイドアプリケーションは、第2のコンテキスト用語に基づいて、第1の未知の用語の意味を決定する。この場合、双方向メディアガイドアプリケーションは、Bernie Sandersと関連付けられるナレッジグラフにアクセスすることによって、第2のコンテキスト用語「Bernie Sanders」に基づいて第1の未知の用語「Clinton」の意味を決定してもよい。用語「Clinton」が曖昧であると決定することに応じて、双方向メディアガイドアプリケーションは、用語「Bernie Sanders」と関連付けられ、テキストセグメントのタイムスタンプと関連付けられるスタンプに関連する、別のナレッジグラフにアクセスし、用語「Clinton」の意味を決定してもよい。
【0017】
いくつかの実施形態では、双方向メディアガイドアプリケーションは、第2のナレッジグラフが第1の未知の用語の意味であり得る1つを上回る潜在的用語を含むことを決定してもよい。例えば、テキストセグメント「Bernie Sanders has just called out Clinton for soliciting donations from banks and corporations」に関して、双方向メディアガイドアプリケーションは、第2のナレッジグラフが用語「Hillary Clinton」および「Bill Clinton」を含有し、その両方が第1の未知の用語の意味であり得ることを決定してもよい。いくつかの実施形態では、双方向メディアガイドアプリケーションは、特定の時間間隔の持続時間および特定の時間間隔の位置のうちの少なくとも1つを調節してもよい。双方向メディアガイドアプリケーションは、位置を一定に保ちながら、特定の時間間隔の持続時間を変更(すなわち、増加または減少)してもよい。代替として、双方向メディアガイドアプリケーションは、特定の時間間隔の位置を変更しながら、特定の時間間隔の持続時間を一定に保ってもよい。いくつかの実施形態では、双方向メディアガイドアプリケーションは、特定の時間間隔の持続時間および位置の両方を変更してもよい。
【0018】
例えば、テキストセグメントのタイムスタンプは、2016年1月11日となっている場合があり、特定の時間間隔の持続時間は、1週間となっている場合があり、特定の時間間隔の位置は、その終点がタイムスタンプと一致するようなものとなっている場合がある。この場合、第2のナレッジグラフは、2016年1月5日〜11日のコーパスから導出されるであろう。本第2のナレッジグラフが、第1の未知の用語「Clinton」の意味であり得る1つを上回る潜在的用語を含むため、双方向メディアガイドアプリケーションは、特定の時間間隔がここで、(例えば、外来コーパスの量を限定するために)2016年1月9日〜11日に及ぶように、3日であるように特定の時間間隔の持続時間を減少させてもよい。代替として、双方向メディアガイドアプリケーションは、特定の時間間隔の持続時間を7日において一定に保ち、特定の時間間隔の始点がタイムスタンプと一致する(すなわち、特定の時間間隔がここで2016年1月11日〜17日である)ように、位置を変更してもよい。
【0019】
いくつかの実施形態では、双方向メディアガイドアプリケーションは、第1のコンテキスト用語および特定の時間間隔と関連付けられる第3のナレッジグラフにアクセスし、第1の未知の用語の意味である潜在的用語を決定することによって、第1の未知の用語の意味を決定してもよい。例えば、双方向メディアガイドアプリケーションは、調節された特定の時間間隔2016年1月9日〜11日と関連付けられる第3のナレッジグラフにアクセスし、第1の未知の用語「Clinton」の意味である潜在的用語を決定してもよい。前述で議論された、双方向メディアガイドアプリケーションが第3のナレッジグラフから第1の未知の用語の意味である潜在的用語を決定し得る、技法は、ここで適用可能である。
【0020】
いくつかの実施形態では、双方向メディアガイドアプリケーションは、第2のナレッジグラフが、第1の未知の用語の意味であり得る、いかなる潜在的用語も含まないことを決定する。例えば、双方向メディアガイドアプリケーションは、未知の用語「Clinton」に類似する用語が第2のナレッジグラフの中にないことを決定してもよい。双方向メディアガイドアプリケーションは、特定の時間間隔の持続時間および特定の時間間隔の位置のうちの少なくとも1つを調節してもよい。前の実施例から、特定の時間間隔は、2016年1月5日〜11日であってもよい。双方向メディアガイドアプリケーションは、特定の時間間隔の持続時間を2週間まで増加させ、さらなるコーパスを組み込んでもよい。この場合、特定の時間間隔はここで、2015年12月29日〜2016年1月11日に及ぶ。
【0021】
いくつかの実施形態では、双方向メディアガイドアプリケーションは、第1のコンテキスト用語および特定の時間間隔と関連付けられる第4のナレッジグラフにアクセスし、第1の未知の用語の意味である潜在的用語を決定することによって、第1の未知の用語の意味を決定してもよい。例えば、双方向メディアガイドアプリケーションは、調節された特定の時間間隔2015年12月29日〜2016年1月11日と関連付けられる第4のナレッジグラフにアクセスし、第1の未知の用語「Clinton」の意味である潜在的用語を決定してもよい。
【0022】
自然言語テキストの量が増加すると、用語と関連付けら得る意味の数が増加し、曖昧な用語の数の増加をもたらす。これは、曖昧な用語と関連付けられる正しい意味を識別するタスクをより複雑にする。例えば、システムは、自然言語テキストクエリ「Who are the major donors for Bernie Sanders and Clinton campaigns?」を受信してもよい。この場合、システムが、間違った回答を提供する確率を最小限にするために、クエリの中で参照されているいずれかの「Clinton」を識別することが必要である。同様に、システムがテキストセグメント「Clinton received a major donation from the Koch brothers」を分析している場合、システムは、テキストセグメントの中で参照されているいずれかの「Clinton」を決定し、「Koch brothers」がクエリ結果の中に含まれるはずであるかどうかを決定しなければならない。曖昧な用語への意味の誤った割当は、自然言語処理の効率を減少させ、ユーザ体験に悪影響を及ぼし得る。
【0023】
従来のシステムは、コンテキスト用語および全ての時間周期と関連付けられるナレッジグラフ(例えば、静的ナレッジグラフ)を使用して、テキストセグメント内の曖昧な用語の意味を識別することに限定される。しかしながら、用語の間の関連性が経時的に変化し、静的ナレッジグラフが本時間次元を捕捉することができないため、従来のシステムは、所与の時点で最も関連する関連性を識別することができない。その結果として、従来のシステムは、主要な推論に失敗し、誤った意味を曖昧な用語に頻繁に割り当てる。
【0024】
本明細書で提供されるシステムおよび方法は、コンテキスト用語、静的ナレッジグラフ、および時間的ナレッジグラフを使用し、テキストセグメント内の曖昧な用語の意味を識別することによって、本問題に対処する。時間的ナレッジグラフは、特定の時間周期中に、コンテキスト用語と曖昧な用語の種々の意味との間の関係を捕捉する。テキストセグメントのタイムスタンプに関連する時間的ナレッジグラフを使用することによって、システムおよび方法は、テキストセグメントの時間において最も関連したいずれかの関連性を識別し、これらの関連性に基づいて曖昧な用語の意味を決定することができる。
【0025】
上記に説明されるシステム、方法、装置、および/または側面は、本開示に説明される他のシステム、方法、装置、および/または側面に適用され得る、もしくはそれらに従って使用され得ることに留意されたい。
本発明は、例えば、以下を提供する。
(項目1)
時間的ナレッジグラフに基づいて、テキストセグメント内の曖昧な用語の意味を識別するための方法であって、前記方法は、
前記テキストセグメントと関連付けられるタイムスタンプを決定することと、
前記テキストセグメント内のコンテキスト用語と関連付けられ、前記タイムスタンプに関連する前記時間的ナレッジグラフにアクセスし、前記曖昧な用語の前記意味である潜在的用語を決定することによって、前記曖昧な用語の前記意味を決定することと
を含む、方法。
(項目2)
テキストセグメント内の曖昧な用語の意味を識別するための方法であって、前記方法は、
前記テキストセグメント内の第1の未知の用語を識別することと、
第1のコンテキスト用語に関して前記テキストセグメントを分析することと、
前記第1のコンテキスト用語と関連付けられる第1のナレッジグラフにアクセスし、前記第1の未知の用語の意味である潜在的用語を識別することによって、前記第1の未知の用語の前記意味を決定することと、
前記第1のナレッジグラフが前記第1の未知の用語の前記意味であり得る1つを上回る潜在的用語を含むことを決定することに応答して、
前記テキストセグメントと関連付けられるタイムスタンプを決定することと、
前記第1のコンテキスト用語と関連付けられ、前記タイムスタンプに関連する第2のナレッジグラフにアクセスし、前記第1の未知の用語の前記意味である潜在的用語を決定することによって、前記第1の未知の用語の前記意味を決定することと
を含む、方法。
(項目3)
前記第2のナレッジグラフは、特定の時間間隔と関連付けられ、前記特定の時間間隔の位置は、前記テキストセグメントの前記タイムスタンプに基づいて決定される、項目2に記載の方法。
(項目4)
前記第2のナレッジグラフと関連付けられる前記特定の時間間隔の持続時間は、前記第1のナレッジグラフと関連付けられる時間間隔の持続時間よりも短い、項目3に記載の方法。
(項目5)
前記第2のナレッジグラフと関連付けられる前記特定の時間間隔の前記位置は、前記第2のナレッジグラフと関連付けられる前記特定の時間間隔が前記タイムスタンプと重複するようなものである、項目3に記載の方法。
(項目6)
前記第2のナレッジグラフと関連付けられる前記特定の時間間隔の前記位置は、
前記第2のナレッジグラフと関連付けられる前記特定の時間間隔が、前記テキストセグメントの前記タイムスタンプに先行すること、および
前記第2のナレッジグラフと関連付けられる前記特定の時間間隔が、前記テキストセグメントの前記タイムスタンプの後に続くこと
のうちの1つである、項目3に記載の方法。
(項目7)
前記特定の時間間隔の持続時間は、前記テキストセグメントを分析することによって識別される時間インジケータに部分的に基づく、項目3に記載の方法。
(項目8)
前記特定の時間間隔の持続時間は、前記テキストセグメントのソースに部分的に基づく、項目3に記載の方法。
(項目9)
前記第1のナレッジグラフが、前記第1の未知の用語の前記意味であり得る、いかなる潜在的用語も含まないことを決定することと、
前記テキストセグメント内の第2のコンテキスト用語を識別することと、
前記第2のコンテキスト用語に基づいて、前記第1の未知の用語の前記意味を決定することと
をさらに含む、項目2に記載の方法。
(項目10)
前記第2のナレッジグラフが前記第1の未知の用語の前記意味であり得る1つを上回る潜在的用語を含むことを決定することと、
前記特定の時間間隔の持続時間および前記特定の時間間隔の前記位置のうちの少なくとも1つを調節することと、
前記第1のコンテキスト用語および前記特定の時間間隔と関連付けられる第3のナレッジグラフにアクセスし、前記第1の未知の用語の前記意味である前記潜在的用語を決定することによって、前記第1の未知の用語の前記意味を決定することと
をさらに含む、項目3に記載の方法。
(項目11)
前記第2のナレッジグラフが、前記第1の未知の用語の前記意味であり得る、いかなる潜在的用語も含まないことを決定することと、
前記特定の時間間隔の持続時間および前記特定の時間間隔の前記位置のうちの少なくとも1つを調節することと、
前記第1のコンテキスト用語および前記特定の時間間隔と関連付けられる第4のナレッジグラフにアクセスし、前記第1の未知の用語の前記意味である前記潜在的用語を決定することによって、前記第1の未知の用語の前記意味を決定することと
をさらに含む、項目3に記載の方法。
(項目12)
テキストセグメント内の曖昧な用語の意味を識別するためのシステムであって、前記システムは、
制御回路であって、前記制御回路は、
前記テキストセグメント内の第1の未知の用語を識別することと、
第1のコンテキスト用語に関して前記テキストセグメントを分析することと、
前記第1のコンテキスト用語と関連付けられる第1のナレッジグラフにアクセスし、前記第1の未知の用語の意味である潜在的用語を識別することによって、前記第1の未知の用語の前記意味を決定することと、
前記第1のナレッジグラフが前記第1の未知の用語の前記意味であり得る1つを上回る潜在的用語を含むことを決定することに応答して、
前記テキストセグメントと関連付けられるタイムスタンプを決定することと、
前記第1のコンテキスト用語と関連付けられ、前記タイムスタンプに関連する第2のナレッジグラフにアクセスし、前記第1の未知の用語の前記意味である潜在的用語を決定することによって、前記第1の未知の用語の前記意味を決定することと
を行うように構成される、制御回路
を備える、システム。
(項目13)
前記第2のナレッジグラフは、特定の時間間隔と関連付けられ、前記特定の時間間隔の位置は、前記テキストセグメントの前記タイムスタンプに基づいて決定される、項目12に記載のシステム。
(項目14)
前記第2のナレッジグラフと関連付けられる前記特定の時間間隔の持続時間は、前記第1のナレッジグラフと関連付けられる時間間隔の持続時間よりも短い、項目13に記載のシステム。
(項目15)
前記第2のナレッジグラフと関連付けられる前記特定の時間間隔の前記位置は、前記第2のナレッジグラフと関連付けられる前記特定の時間間隔が前記タイムスタンプと重複するようなものである、項目13に記載のシステム。
(項目16)
前記第2のナレッジグラフと関連付けられる前記特定の時間間隔の前記位置は、
前記第2のナレッジグラフと関連付けられる前記特定の時間間隔が、前記テキストセグメントの前記タイムスタンプに先行すること、および
前記第2のナレッジグラフと関連付けられる前記特定の時間間隔が、前記テキストセグメントの前記タイムスタンプの後に続くこと
のうちの1つである、項目13に記載のシステム。
(項目17)
前記特定の時間間隔の持続時間は、前記テキストセグメントを分析することによって識別される、時間インジケータに部分的に基づく、項目13に記載のシステム。
(項目18)
前記特定の時間間隔の持続時間は、前記テキストセグメントのソースに部分的に基づく、項目13に記載のシステム。
(項目19)
前記第1のナレッジグラフが、前記第1の未知の用語の前記意味であり得る、いかなる潜在的用語も含まないことを決定することと、
前記テキストセグメント内の第2のコンテキスト用語を識別することと、
前記第2のコンテキスト用語に基づいて、前記第1の未知の用語の前記意味を決定することと
を行うように構成される、前記制御回路
をさらに備える、項目12に記載のシステム。
(項目20)
前記第2のナレッジグラフが前記第1の未知の用語の前記意味であり得る1つを上回る潜在的用語を含むことを決定することと、
前記特定の時間間隔の持続時間および前記特定の時間間隔の前記位置のうちの少なくとも1つを調節することと、
前記第1のコンテキスト用語および前記特定の時間間隔と関連付けられる第3のナレッジグラフにアクセスし、前記第1の未知の用語の前記意味である前記潜在的用語を決定することによって、前記第1の未知の用語の前記意味を決定することと
を行うように構成される、前記制御回路
をさらに備える、項目13に記載のシステム。
(項目21)
前記第2のナレッジグラフが、前記第1の未知の用語の前記意味であり得る、いかなる潜在的用語も含まないことを決定することと、
前記特定の時間間隔の持続時間および前記特定の時間間隔の前記位置のうちの少なくとも1つを調節することと、
前記第1のコンテキスト用語および前記特定の時間間隔と関連付けられる第4のナレッジグラフにアクセスし、前記第1の未知の用語の前記意味である前記潜在的用語を決定することによって、前記第1の未知の用語の前記意味を決定することと
を行うように構成される、前記制御回路
をさらに備える、項目13に記載のシステム。
(項目22)
テキストセグメント内の曖昧な用語の意味を識別するためのシステムであって、前記システムは、
前記テキストセグメント内の第1の未知の用語を識別するための手段と、
第1のコンテキスト用語に関して前記テキストセグメントを分析するための手段と、
前記第1のコンテキスト用語と関連付けられる第1のナレッジグラフにアクセスし、前記第1の未知の用語の意味である潜在的用語を識別することによって、前記第1の未知の用語の前記意味を決定するための手段と、
前記第1のナレッジグラフが前記第1の未知の用語の前記意味であり得る1つを上回る潜在的用語を含むことを決定することに応答して、
前記テキストセグメントと関連付けられるタイムスタンプを決定するための手段と、
前記第1のコンテキスト用語と関連付けられ、前記タイムスタンプに関連する第2のナレッジグラフにアクセスし、前記第1の未知の用語の前記意味である潜在的用語を決定することによって、前記第1の未知の用語の前記意味を決定するための手段と
を備える、システム。
(項目23)
前記第2のナレッジグラフは、特定の時間間隔と関連付けられ、前記特定の時間間隔の位置は、前記テキストセグメントの前記タイムスタンプに基づいて決定される、項目22に記載のシステム。
(項目24)
前記第2のナレッジグラフと関連付けられる前記特定の時間間隔の持続時間は、前記第1のナレッジグラフと関連付けられる時間間隔の持続時間よりも短い、項目23に記載のシステム。
(項目25)
前記第2のナレッジグラフと関連付けられる前記特定の時間間隔の前記位置は、前記第2のナレッジグラフと関連付けられる前記特定の時間間隔が前記タイムスタンプと重複するようなものである、項目23に記載のシステム。
(項目26)
前記第2のナレッジグラフと関連付けられる前記特定の時間間隔の前記位置は、
前記第2のナレッジグラフと関連付けられる前記特定の時間間隔が、前記テキストセグメントの前記タイムスタンプに先行すること、および
前記第2のナレッジグラフと関連付けられる前記特定の時間間隔が、前記テキストセグメントの前記タイムスタンプの後に続くこと
のうちの1つである、項目23に記載のシステム。
(項目27)
前記特定の時間間隔の持続時間は、前記テキストセグメントを分析することによって識別される、時間インジケータに部分的に基づく、項目23に記載のシステム。
(項目28)
前記特定の時間間隔の持続時間は、前記テキストセグメントのソースに部分的に基づく、項目23に記載のシステム。
(項目29)
前記第1のナレッジグラフが、前記第1の未知の用語の前記意味であり得る、いかなる潜在的用語も含まないことを決定するための手段と、
前記テキストセグメント内の第2のコンテキスト用語を識別するための手段と、
前記第2のコンテキスト用語に基づいて、前記第1の未知の用語の前記意味を決定するための手段と
をさらに備える、項目22に記載のシステム。
(項目30)
前記第2のナレッジグラフが前記第1の未知の用語の前記意味であり得る1つを上回る潜在的用語を含むことを決定するための手段と、
前記特定の時間間隔の持続時間および前記特定の時間間隔の前記位置のうちの少なくとも1つを調節するための手段と、
前記第1のコンテキスト用語および前記特定の時間間隔と関連付けられる第3のナレッジグラフにアクセスし、前記第1の未知の用語の前記意味である前記潜在的用語を決定することによって、前記第1の未知の用語の前記意味を決定するための手段と
をさらに備える、項目23に記載のシステム。
(項目31)
前記第2のナレッジグラフが、前記第1の未知の用語の前記意味であり得る、いかなる潜在的用語も含まないことを決定するための手段と、
前記特定の時間間隔の持続時間および前記特定の時間間隔の前記位置のうちの少なくとも1つを調節するための手段と、
前記第1のコンテキスト用語および前記特定の時間間隔と関連付けられる第4のナレッジグラフにアクセスし、前記第1の未知の用語の前記意味である前記潜在的用語を決定することによって、前記第1の未知の用語の前記意味を決定するための手段と
をさらに備える、項目23に記載のシステム。
(項目32)
メモリを備える非一過性の機械可読媒体であって、前記メモリは、テキストセグメント内の曖昧な用語の意味を識別するための前記メモリ上に符号化された命令を伴い、前記命令は、
前記テキストセグメント内の第1の未知の用語を識別する命令と、
第1のコンテキスト用語に関して前記テキストセグメントを分析する命令と、
前記第1のコンテキスト用語と関連付けられる第1のナレッジグラフにアクセスし、前記第1の未知の用語の意味である潜在的用語を識別することによって、前記第1の未知の用語の前記意味を決定する命令と、
前記第1のナレッジグラフが前記第1の未知の用語の前記意味であり得る1つを上回る潜在的用語を含むことを決定することに応答して、
前記テキストセグメントと関連付けられるタイムスタンプを決定する命令と、
前記第1のコンテキスト用語と関連付けられ、前記タイムスタンプに関連する第2のナレッジグラフにアクセスし、前記第1の未知の用語の前記意味である潜在的用語を決定することによって、前記第1の未知の用語の前記意味を決定する命令と
を備える、非一過性の機械可読媒体。
(項目33)
前記第2のナレッジグラフは、特定の時間間隔と関連付けられ、前記特定の時間間隔の位置は、前記テキストセグメントの前記タイムスタンプに基づいて決定される、項目32に記載の非一過性の機械可読媒体。
(項目34)
前記第2のナレッジグラフと関連付けられる前記特定の時間間隔の持続時間は、前記第1のナレッジグラフと関連付けられる時間間隔の持続時間よりも短い、項目33に記載の非一過性の機械可読媒体。
(項目35)
前記第2のナレッジグラフと関連付けられる前記特定の時間間隔の前記位置は、前記第2のナレッジグラフと関連付けられる前記特定の時間間隔が前記タイムスタンプと重複するようなものである、項目33に記載の非一過性の機械可読媒体。
(項目36)
前記第2のナレッジグラフと関連付けられる前記特定の時間間隔の前記位置は、
前記第2のナレッジグラフと関連付けられる前記特定の時間間隔が、前記テキストセグメントの前記タイムスタンプに先行すること、および
前記第2のナレッジグラフと関連付けられる前記特定の時間間隔が、前記テキストセグメントの前記タイムスタンプの後に続くこと
のうちの1つである、項目33に記載の非一過性の機械可読媒体。
(項目37)
前記特定の時間間隔の持続時間は、前記テキストセグメントを分析することによって識別される時間インジケータに部分的に基づく、項目33に記載の非一過性の機械可読媒体。
(項目38)
前記特定の時間間隔の持続時間は、前記テキストセグメントのソースに部分的に基づく、項目33に記載の非一過性の機械可読媒体。
(項目39)
前記第1のナレッジグラフが、前記第1の未知の用語の前記意味であり得る、いかなる潜在的用語も含まないことを決定する命令と、
前記テキストセグメント内の第2のコンテキスト用語を識別する命令と、
前記第2のコンテキスト用語に基づいて、前記第1の未知の用語の前記意味を決定する命令と
をさらに備える、項目32に記載の非一過性の機械可読媒体。
(項目40)
前記第2のナレッジグラフが前記第1の未知の用語の前記意味であり得る1つを上回る潜在的用語を含むことを決定する命令と、
前記特定の時間間隔の持続時間および前記特定の時間間隔の前記位置のうちの少なくとも1つを調節する命令と、
前記第1のコンテキスト用語および前記特定の時間間隔と関連付けられる第3のナレッジグラフにアクセスし、前記第1の未知の用語の前記意味である前記潜在的用語を決定することによって、前記第1の未知の用語の前記意味を決定する命令と
をさらに備える、項目33に記載の非一過性の機械可読媒体。
(項目41)
前記第2のナレッジグラフが、前記第1の未知の用語の前記意味であり得る、いかなる潜在的用語も含まないことを決定する命令と、
前記特定の時間間隔の持続時間および前記特定の時間間隔の前記位置のうちの少なくとも1つを調節する命令と、
前記第1のコンテキスト用語および前記特定の時間間隔と関連付けられる第4のナレッジグラフにアクセスし、前記第1の未知の用語の前記意味である前記潜在的用語を決定することによって、前記第1の未知の用語の前記意味を決定する命令と
をさらに備える、項目33に記載の非一過性の機械可読媒体。
(項目42)
テキストセグメント内の曖昧な用語の意味を識別するための方法であって、前記方法は、
前記テキストセグメント内の第1の未知の用語を識別することと、
第1のコンテキスト用語に関して前記テキストセグメントを分析することと、
前記第1のコンテキスト用語と関連付けられる第1のナレッジグラフにアクセスし、前記第1の未知の用語の意味である潜在的用語を識別することによって、前記第1の未知の用語の前記意味を決定することと、
前記第1のナレッジグラフが前記第1の未知の用語の前記意味であり得る1つを上回る潜在的用語を含むことを決定することに応答して、
前記テキストセグメントと関連付けられるタイムスタンプを決定することと、
前記第1のコンテキスト用語と関連付けられ、前記タイムスタンプに関連する第2のナレッジグラフにアクセスし、前記第1の未知の用語の前記意味である潜在的用語を決定することによって、前記第1の未知の用語の前記意味を決定することと
を含む、方法。
(項目43)
前記第2のナレッジグラフは、特定の時間間隔と関連付けられ、前記特定の時間間隔の位置は、前記テキストセグメントの前記タイムスタンプに基づいて決定される、項目42に記載の方法。
(項目44)
前記第2のナレッジグラフと関連付けられる前記特定の時間間隔の持続時間は、前記第1のナレッジグラフと関連付けられる時間間隔の持続時間よりも短い、項目43に記載の方法。
(項目45)
前記第2のナレッジグラフと関連付けられる前記特定の時間間隔の前記位置は、前記第2のナレッジグラフと関連付けられる前記特定の時間間隔が前記タイムスタンプと重複するようなものである、項目43−44のいずれかに記載の方法。
(項目46)
前記第2のナレッジグラフと関連付けられる前記特定の時間間隔の前記位置は、
前記第2のナレッジグラフと関連付けられる前記特定の時間間隔が、前記テキストセグメントの前記タイムスタンプに先行すること、および
前記第2のナレッジグラフと関連付けられる前記特定の時間間隔が、前記テキストセグメントの前記タイムスタンプの後に続くこと
のうちの1つである、項目43−44のいずれかに記載の方法。
(項目47)
前記特定の時間間隔の持続時間は、前記テキストセグメントを分析することによって識別される時間インジケータに部分的に基づく、項目43−46のいずれかに記載の方法。(項目48)
前記特定の時間間隔の持続時間は、前記テキストセグメントのソースに部分的に基づく、項目43−47のいずれかに記載の方法。
(項目49)
前記第1のナレッジグラフが、前記第1の未知の用語の前記意味であり得る、いかなる潜在的用語も含まないことを決定することと、
前記テキストセグメント内の第2のコンテキスト用語を識別することと、
前記第2のコンテキスト用語に基づいて、前記第1の未知の用語の前記意味を決定することと
をさらに含む、項目42−48のいずれかに記載の方法。
(項目50)
前記第2のナレッジグラフが前記第1の未知の用語の前記意味であり得る1つを上回る潜在的用語を含むことを決定することと、
前記特定の時間間隔の持続時間および前記特定の時間間隔の前記位置のうちの少なくとも1つを調節することと、
前記第1のコンテキスト用語および前記特定の時間間隔と関連付けられる第3のナレッジグラフにアクセスし、前記第1の未知の用語の前記意味である前記潜在的用語を決定することによって、前記第1の未知の用語の前記意味を決定することと
をさらに含む、項目43−49のいずれかに記載の方法。
(項目51)
前記第2のナレッジグラフが、前記第1の未知の用語の前記意味であり得る、いかなる潜在的用語も含まないことを決定することと、
前記特定の時間間隔の持続時間および前記特定の時間間隔の前記位置のうちの少なくとも1つを調節することと、
前記第1のコンテキスト用語および前記特定の時間間隔と関連付けられる第4のナレッジグラフにアクセスし、前記第1の未知の用語の前記意味である前記潜在的用語を決定することによって、前記第1の未知の用語の前記意味を決定することと
をさらに含む、項目43−49のいずれかに記載の方法。