IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッドの特許一覧

特許7395377コンテンツ検索方法、装置、機器、および記憶媒体
<>
  • 特許-コンテンツ検索方法、装置、機器、および記憶媒体 図1
  • 特許-コンテンツ検索方法、装置、機器、および記憶媒体 図2
  • 特許-コンテンツ検索方法、装置、機器、および記憶媒体 図3
  • 特許-コンテンツ検索方法、装置、機器、および記憶媒体 図4
  • 特許-コンテンツ検索方法、装置、機器、および記憶媒体 図5
  • 特許-コンテンツ検索方法、装置、機器、および記憶媒体 図6
  • 特許-コンテンツ検索方法、装置、機器、および記憶媒体 図7
  • 特許-コンテンツ検索方法、装置、機器、および記憶媒体 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-12-01
(45)【発行日】2023-12-11
(54)【発明の名称】コンテンツ検索方法、装置、機器、および記憶媒体
(51)【国際特許分類】
   G06F 16/907 20190101AFI20231204BHJP
   G06F 16/78 20190101ALI20231204BHJP
【FI】
G06F16/907
G06F16/78
【請求項の数】 8
(21)【出願番号】P 2020018496
(22)【出願日】2020-02-06
(65)【公開番号】P2020129377
(43)【公開日】2020-08-27
【審査請求日】2020-02-06
【審判番号】
【審判請求日】2022-11-29
(31)【優先権主張番号】201910110096.X
(32)【優先日】2019-02-11
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】514322098
【氏名又は名称】ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド
【氏名又は名称原語表記】Beijing Baidu Netcom Science Technology Co., Ltd.
【住所又は居所原語表記】2/F Baidu Campus, No.10, Shangdi 10th Street, Haidian District, Beijing 100085, China
(74)【代理人】
【識別番号】100118913
【弁理士】
【氏名又は名称】上田 邦生
(72)【発明者】
【氏名】ワン, カン
(72)【発明者】
【氏名】クアン, ツィジー
【合議体】
【審判長】須田 勝巳
【審判官】林 毅
【審判官】稲垣 良一
(56)【参考文献】
【文献】中国特許出願公開第106095804(CN,A)
【文献】特開2009-15516(JP,A)
【文献】国際公開第2014/002462(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F16/907
G06F16/78
(57)【特許請求の範囲】
【請求項1】
コンピュータが処理対象コンテンツの識別情報を取得するステップであって、前記識別情報は複数の情報項目を含み、各情報項目は前記処理対象コンテンツの一部に関連付けられているステップと、
コンピュータが、前記識別情報に基づいて、前記処理対象コンテンツの少なくとも一部に対応するキーワードを決定するステップであって、前記キーワードは前記処理対象コンテンツを特異的に識別するためのものであるステップと、
コンピュータが、前記キーワードと前記処理対象コンテンツの少なくとも一部に関する指示情報とを関連付けてコンテンツ検索ライブラリに記憶するステップと、
コンピュータが、前記少なくとも一部に関連付けられた情報項目における前記キーワードの出現回数と、前記処理対象コンテンツのダウンロード回数と、前記処理対象コンテンツのコメント数と、のうちの少なくとも1つに基づいて、前記処理対象コンテンツの少なくとも一部に関連付けられた追加情報を生成するステップと、
コンピュータが、前記追加情報と前記キーワードとを関連付けて前記コンテンツ検索ライブラリに記憶するステップと、
を含み、
前記コンピュータが、前記キーワードを決定するステップは、
前記コンピュータが、前記複数の情報項目のうち、前記処理対象コンテンツの前記少なくとも一部に関連付けられたターゲット情報項目の第1の数を決定するステップと、
前記コンピュータが、前記第1の数が第1の閾値数を超えたこと、および前記第1の数と前記複数の情報項目の合計との比が閾値比を超えたことの少なくとも1つに応答して、前記ターゲット情報項目に基づいて複数の候補単語を取得し、前記コンピュータが、前記複数の候補単語のうち、同じまたは語義的に関連する候補単語の第2の数を決定し、前記コンピュータが、前記第2の数が第2の閾値数を超えたことに応答して、前記同じまたは語義的に関連する候補単語に基づいて前記キーワードを決定するステップと
を含む、コンテンツ検索ライブラリを構築する方法。
【請求項2】
前記コンピュータが、前記ターゲット情報項目に基づいて前記複数の候補単語を取得することは、
前記コンピュータが、前記ターゲット情報項目に対して、前記ターゲット情報項目における、所定のテキストにマッチングする単語の削除と、前記ターゲット情報項目における、単語数が閾値単語数より少ないターゲット情報項目の削除と、前記ターゲット情報項目における句読点の削除と、前記ターゲット情報項目における所定のカテゴリの単語の削除と、のうちの少なくとも1つを実行して、前記複数の候補単語を取得することを含む請求項1に記載の方法。
【請求項3】
前記指示情報は、
前記処理対象コンテンツの前記少なくとも一部を取得するためのリンクと、前記少なくとも一部の、前記処理対象コンテンツにおける相対位置を示す位置情報と、前記少なくとも一部が前記処理対象コンテンツに含まれていることを示すテキスト情報と、のうちの少なくとも1つを含む請求項1に記載の方法。
【請求項4】
処理対象コンテンツの識別情報を取得するように構成される識別情報取得モジュールであって、前記識別情報は複数の情報項目を含み、各情報項目は前記処理対象コンテンツの一部に関連付けられている識別情報取得モジュールと、
前記識別情報に基づいて前記処理対象コンテンツの少なくとも一部に対応するキーワードを決定するように構成されるキーワード決定モジュールであって、前記キーワードは前記処理対象コンテンツを特異的に識別するためのものであるキーワード決定モジュールと、
前記キーワードと前記処理対象コンテンツの少なくとも一部に関する指示情報とを関連付けてコンテンツ検索ライブラリに記憶するように構成されるキーワード記憶モジュールと、
前記少なくとも一部に関連付けられた情報項目における前記キーワードの出現回数と、前記処理対象コンテンツのダウンロード回数と、前記処理対象コンテンツのコメント数と、のうちの少なくとも1つに基づいて、前記処理対象コンテンツの少なくとも一部に関連付けられた追加情報を生成するように構成される追加情報決定モジュールと、
前記追加情報と前記キーワードとを関連付けて前記コンテンツ検索ライブラリに記憶するように構成される追加情報記憶モジュールと、
を含み、
前記キーワード決定モジュールは、
前記複数の情報項目のうち、前記処理対象コンテンツの前記少なくとも一部に関連付けられたターゲット情報項目の第1の数を決定するように構成される第1の数決定モジュールと、
前記第1の数が第1の閾値数を超えたこと、および前記第1の数と前記複数の情報項目の合計との比が閾値比を超えたことの少なくとも1つに応答して、前記ターゲット情報項目に基づいて少なくとも1つの候補単語を取得するように構成される情報項目使用モジュールと、
を含み、
前記情報項目使用モジュールは、前記少なくとも1つの候補単語に基づいて前記キーワードを決定するように構成される候補単語使用モジュールを含み、
前記少なくとも1つの候補単語は複数の候補単語を含み、
前記候補単語使用モジュールは、
前記複数の候補単語のうち同じまたは語義的に関連する候補単語の第2の数を決定するように構成される第2の数決定モジュールと、
前記第2の数が第2の閾値数を超えたことに応答して、前記同じまたは語義的に関連する候補単語に基づいて前記キーワードを決定するように構成されるキーワード抽出モジュールと、
を含む、コンテンツ検索ライブラリを構築する装置。
【請求項5】
前記情報項目使用モジュールは、
前記ターゲット情報項目に対して、前記ターゲット情報項目における、所定テキストにマッチングする単語の削除と、前記ターゲット情報項目のうち、単語数が閾値単語数より少ないターゲット情報項目の削除と、前記ターゲット情報項目における句読点の削除と、前記ターゲット情報項目における所定のカテゴリの単語の削除と、のうちの少なくとも1つを実行して、少なくとも1つの候補単語を取得するように構成される候補単語取得モジュールを含む請求項4に記載の装置。
【請求項6】
前記指示情報は、
前記処理対象コンテンツの前記少なくとも一部を取得するためのリンクと、
前記少なくとも一部の、前記処理対象コンテンツにおける相対位置を示す位置情報と、
前記少なくとも一部が前記処理対象コンテンツに含まれていることを示すテキスト情報と、のうちの少なくとも1つを含む請求項4に記載の装置。
【請求項7】
1つまたは複数のプロセッサと、
1つまたは複数のプログラムを記憶するための記憶装置と、を含む機器であって、
前記1つまたは複数のプログラムが前記1つまたは複数のプロセッサによって実行されるとき、前記1つまたは複数のプロセッサが請求項1から3のいずれかに記載の方法を実現する機器。
【請求項8】
コンピュータプログラムが記憶されているコンピュータ読み取り可能な記憶媒体であって、前記コンピュータプログラムがプロセッサによって実行されるとき、請求項1から3のいずれかに記載の方法が実現される、コンピュータ読み取り可能な記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示の実施例は、主にコンピュータの分野に関し、より具体的には、コンテンツ検索方法、装置、機器、およびコンピュータ読み取り可能な記憶媒体に関する。
【背景技術】
【0002】
ビデオの数の増加および品質の向上に伴い、ビデオ検索に対する需要が益々高まっている。重要な側面の1つは、ビデオ内のクラシッククリップまたは人気クリップの検索である。ビデオクリップに対する人々の認知は、「シンケイが皇宮に帰還」などの周囲の人々の説明、または「妾である私にはできません」などのクラシックセリフから得られる可能性がある。本明細書では、このような説明やクラシックセリフをホットワードと言う。ユーザは、ホットワードを用いて、ホットワードに対応するビデオ内のクリップを取得し、当該クリップのビデオにおける位置およびコンテキストなどを取得することを望んでいる。しかしながら、従来のビデオ検索方式では、ユーザが、ホットワードに基づいて対応するビデオまたはビデオクリップを直接に見つけることはできない。
【発明の概要】
【発明が解決しようとする課題】
【0003】
本開示の例示的な実施例によれば、コンテンツ検索の解決案が提供される。
【課題を解決するための手段】
【0004】
本開示の第1の態様では、コンテンツ検索ライブラリを構築する方法が提供され、当該方法は、処理対象コンテンツの識別情報を取得するステップであって、識別情報は複数の情報項目を含み、各情報項目はコンテンツの一部に関連付けられているステップと、識別情報に基づいてコンテンツの少なくとも一部に対応するキーワードを決定するステップと、キーワードとコンテンツの少なくとも一部に関する指示情報とを関連付けてコンテンツ検索ライブラリに記憶するステップと、を含む。
【0005】
本開示の第2の態様では、コンテンツ検索方法が提供され、当該方法は、コンテンツのターゲット部分に対するクエリ要求に基づいて検索語を決定するステップと、コンテンツ検索ライブラリから検索語にマッチングするキーワードを決定するステップであって、コンテンツ検索ライブラリは、少なくとも、キーワードと、キーワードに関連付けて記憶されたターゲット部分に関する指示情報とを含み、キーワードは、ターゲット部分に関連付けられた情報項目に基づいて決定され、情報項目はコンテンツの識別情報に含まれているステップと、コンテンツ検索ライブラリからキーワードに関連付けて記憶された指示情報を取得するステップと、ターゲット部分を示すように指示情報を提供するステップとを含む。
【0006】
本開示の第3の態様では、コンテンツ検索ライブラリを構築する装置が提供され、当該装置は、処理対象コンテンツの識別情報を取得するように構成される識別情報取得モジュールであって、識別情報は複数の情報項目を含み、各情報項目はコンテンツの一部に関連付けられている識別情報取得モジュールと、識別情報に基づいてコンテンツの少なくとも一部に対応するキーワードを決定するように構成されるキーワード決定モジュールと、キーワードとコンテンツの少なくとも一部に関する指示情報とを関連付けてコンテンツ検索ライブラリに記憶するように構成されるキーワード記憶モジュールと、を含む。
【0007】
本開示の第4態様では、コンテンツ検索装置が提供され、当該装置は、コンテンツのターゲット部分に対するクエリ要求に基づいて検索語を決定するように構成される検索語決定モジュールと、コンテンツ検索ライブラリから検索語にマッチングするキーワードを決定するように構成されるキーワード検索モジュールであって、コンテンツ検索ライブラリは、少なくとも、キーワードと、キーワードに関連付けて記憶された、ターゲット部分に関する指示情報とを含み、キーワードは、ターゲット部分に関連付けられた情報項目に基づいて決定され、情報項目はコンテンツの識別情報に含まれているキーワード検索モジュールと、コンテンツ検索ライブラリからキーワードに関連付けて記憶された指示情報を取得するように構成される指示情報取得モジュールと、ターゲット部分を示すように、指示情報を提供するように構成される指示情報提供モジュールと、を含む。
【0008】
本開示の第5の態様では、機器が提供され、前記機器は、1つまたは複数のプロセッサと、1つまたは複数のプログラムを記憶するための記憶装置とを含み、1つまたは複数のプログラムが1つまたは複数のプロセッサによって実行されるとき、1つまたは複数のプロセッサが本開示の第1の態様に係る方法を実現する。
【0009】
本開示の第6の態様では、機器が提供され、前記機器は、1つまたは複数のプロセッサと、1つまたは複数のプログラムを記憶するための記憶装置とを含み、1つまたは複数のプログラムが1つまたは複数のプロセッサによって実行されるとき、1つまたは複数のプロセッサが本開示の第2の態様に係る方法を実現する。
【0010】
本開示の第7の態様では、コンピュータプログラムが記憶されているコンピュータ読み取り可能な記憶媒体が提供され、当該プログラムがプロセッサによって実行されるとき、本開示の第1の態様に係る方法が実現される。
【0011】
本開示の第8の態様では、コンピュータプログラムが記憶されているコンピュータ読み取り可能な記憶媒体が提供され、当該プログラムがプロセッサによって実行されるとき、本開示の第1の態様に係る方法が実現される。
【0012】
なお、発明の概要に記載された内容は、本開示の実施例の肝心なまたは重要な特徴を限定することを意図するものではなく、そして本開示の範囲を限定することを意図するものでもない。本開示の他の特徴は、以下の説明によって容易に理解される。
【図面の簡単な説明】
【0013】
図面を合わせながら以下の詳細な説明を参照することにより、本開示の各実施例の上記および他の特徴、利点および態様はより明らかになる。図面において、同一または類似の符号は、同一または類似の要素を示す。
図1】本開示の複数の実施例を実現することができる例示的な環境の概略図を示す。
図2】本開示のいくつかの実施例に係るコンテンツ検索ライブラリを構築するプロセスを示すフローチャートである。
図3】本開示のいくつかの実施例に係るキーワードを決定するプロセスを示すフローチャートである。
図4】本開示のいくつかの実施例に係るコンテンツの少なくとも一部を決定する概略図を示す。
図5】本開示のいくつかの実施例に係るコンテンツ検索プロセスを示すフローチャートである。
図6】本開示のいくつかの実施例に係るコンテンツ検索ライブラリを構築するための装置の概略ブロック図を示す。
図7】本開示のいくつかの実施例に係るコンテンツ検索装置の概略ブロック図を示す。
図8】本開示の複数の実施例を実施することができるコンピューティング機器のブロック図を示す。
【発明を実施するための形態】
【0014】
本開示の実施例を、図面を参照して以下により詳細に説明する。図面に本開示のいくつかの実施例が示されているが、本発明は様々な形態で実現することができ、本明細書に記載の実施例に限定されると解釈されるべきではないことを理解されたい。逆に、これらの実施例を提供する目的は、本開示がより明確かつ完全で理解されることである。本開示の図面および実施例は例示するものに過ぎず、本開示の保護範囲を限定するものではないと理解されたい。
【0015】
本開示の実施例の説明において、「含む」という用語およびその類似の用語が、開放的な含む、すなわち「含むがこれに限定されない」と理解されるべきである。「に基づく」という用語は、「少なくとも部分的に基づく」ことを意味すると理解されるべきである。「一実施例」または「当該実施例」という用語は、「少なくとも一実施例」を意味すると理解されるべきである。「第1の」、「第2の」等の用語は、異なる対象または同一対象を指すことができる。他の明示的および暗黙的な定義も以下に含まれ得る。
【0016】
前述したように、ユーザは、ホットワードを用いて対応するビデオまたはビデオクリップを取得することを望んでいる。従来、検索には2つの方式がある。1つめは、ユーザがホットワードを直接検索することである。現在、テキストに基づくビデオ検索は、主にビデオのタイトルに基づくものであり、ユーザがビデオに関するホットワードを検索する場合、通常、タイトルにこれらのホットワードが含まれる手動で編集されたビデオクリップであることを返信結果とする。この方式は、ビデオの人工編集に依存しており、不適合な検索結果が多い。この方式で取得されたビデオクリップには、例えば、品質の保証がない、シャープネスによる分類がない、粗い画質のクリップに由来する可能性がある、ユーザが当該ビデオに関連する前後の話に簡単にジャンプできない、オリジナルビデオの弾幕やコメントなどの情報が見られない、ユーザが必要とするビデオクリップの長さを編集者が理解できないためクリップのビデオクリップが短すぎてユーザがコンテキストを理解できず、ビデオクリップの素晴らしさを十分に感じることができない、またはビデオクリップが長すぎてユーザが必要とする時点をマークできず、ユーザが必要とするクリップをすばやく見つけることができない等といった問題がある。
【0017】
もう1つの方式では、ユーザは連続した検索を複数回実行する必要がある。例えば、ユーザは「瓔珞~紫禁城に燃ゆる逆襲の王妃~で魏瓔珞が円明園に行くのは何話目」を検索し、検索結果に基づいてビデオウェブサイトから対応する話数を見つけて対応するクリップを探すか、またはユーザが「瓔珞~紫禁城に燃ゆる逆襲の王妃~で魏瓔珞が円明園に行くのは54話目のどの時点ですか」を引き続き検索する必要がある。この方法による結果の応答は直接的ではない。このようなホットワードに対応するドラマの話および時間帯を連続的に検索する解決方式では、ユーザは検索を複数回実行する必要がある。また、異なるバージョンのビデオリソースでは同じクリップの話数および時点も異なる場合があるため、ユーザは正しい答えを取得できない可能性がある。
【0018】
現在、ほとんどのビデオウェブサイトは、弾幕機能を開放しており、ビデオを視聴するユーザは、お気に入りのビデオクリップの説明に自発的に貢献する。ホットビデオクリップに対応する弾幕の量は膨大である。「妾である私にはできません」などの一部のクラシックセリフはネチズンによって弾幕で繰り返される。一部のネチズンは、「シンケイが皇宮に帰還」などのようにクラシッククリップをまとめて説明する。セリフを直接使用する場合と比較して、弾幕にはビデオのまとめがある。例えば、「シンケイが皇宮に帰還」は弾幕に表示されるが、対応するクリップのセリフには表示されない。したがって、弾幕などの識別情報を用いてコンテンツ検索ライブラリを構築することで、ユーザにビデオやビデオクリップなどの興味を持っているコンテンツを提供することができる。
【0019】
本開示の実施例によれば、コンテンツ検索解決案が提案される。この解決案では、コンテンツの異なる部分に関連付けられた識別情報に基づいて、コンテンツの少なくとも一部に対応するキーワードおよび関連する指示情報を決定することにより、コンテンツ検索ライブラリを構築する。コンテンツ検索時に、コンテンツ検索ライブラリから検索語にマッチングするキーワードを決定し、ユーザにキーワードに関連付けて記憶された、コンテンツまたはコンテンツの一部に関する指示情報を提供する。このようにして、ユーザが複数の検索を実行することなく、ユーザに興味を持っているのコンテンツ(例えば、ビデオクリップ)に関する情報を迅速かつ正確に提供できる。この解決案により、ユーザが興味を持つコンテンツに関連付けられた他のコンテンツを閲覧することが便利になる。したがって、本開示の解決策は、効率的かつユーザ体験を向上するコンテンツ検索を有利に達成することができる。
【0020】
以下、本開示の実施例について、図面を参照して具体的に説明する。
図1は、本開示の複数の実施例を実現することができる例示的な環境100の概略図を示す。例示的な環境100では、コンピューティング機器102は、コンテンツ103の識別情報130に基づいてコンテンツ検索ライブラリ101を構築する。識別情報130は、複数の情報項目131~133を含み、各情報項目は、コンテンツ103の一部に関連付けられている。
【0021】
コンテンツ103は複数のタイプであってもよい。識別情報130は、識別情報130がコンテンツ103の異なる部分に関連付けられるか、または対応する情報項目を含むことさえできれば、複数の形態を採用することができる。このような識別情報は、時間上でビデオまたは音声クリップに関連付けられた弾幕、ライブビデオのライブコメント、ドキュメントまたは電子書籍のマークまたは注釈などであってもよい。
【0022】
例えば、コンテンツ103は、1つの映画、1つのテレビドラマの1話または複数の話、バラエティ番組の1つまたは複数のフェーズなどのビデオであってもよい。識別情報130は、ビデオの弾幕であってもよく、各情報項目は、1つの弾幕であってもよい。コンテンツ103は、クロストークなどの音声であってもよい。識別情報130は、リスナーからの弾幕のようなコメントまたはフィードバック情報であってもよい。いくつかの実施例では、ビデオの字幕は、識別情報として使用されてもよく、例えば、弾幕とともに使用してもよい。コンテンツ103は、電子書籍などの電子文書であってもよい。識別情報130は、読者による電子文書の異なる段落の注釈であってもよく、各情報項目は注釈であってもよい。
【0023】
コンピューティング機器102は、識別情報130および他のコンテンツの識別情報に基づいてコンテンツ検索ライブラリ101を構築することができる。例えば、コンピューティング機器102は、識別情報130に基づいて、コンテンツ130の少なくとも一部に対応するキーワード111、およびコンテンツの少なくとも一部に関する指示情報112を生成することができる。例えば、キーワード111は、あるテレビドラマのクラシッククリップに対応することができる。コンピューティング機器102は、他のコンテンツの識別情報に基づいて、他のキーワード113およびその関連する指示情報114を生成することもできる。キーワード111、113およびその関連する指示情報112、114は、それぞれ関連付けられてコンテンツ検索ライブラリ101に記憶される。なお、図1には2つのキーワード111、113のみが示されているが、これは単なる例であり、コンテンツ検索ライブラリ101には、任意の数のコンテンツに基づいて生成された任意の数のキーワードおよび関連情報が含まれてもよいことを理解されたい。また、異なるキーワードが異なるコンピューティング機器によって生成されてもよい。
【0024】
例示的な環境100では、コンピューティング機器102によってコンテンツ検索は実行される。コンピューティング機器102は、ユーザ104からの、ターゲットコンテンツ(例えば、1つのビデオクリップ)についてのクエリ要求を受信し、コンテンツ検索ライブラリ101に対してクエリしてクエリ結果105を提供する。クエリ結果105は、指示情報112などを含んでもよい。これにより、ユーザ104は、指示情報112に基づいてターゲットコンテンツを取得でき、例えば、ユーザが興味を持っているビデオまたはビデオクリップを取得することができる。
【0025】
図1の例示的な環境100では、コンピューティング機器102によってコンテンツ検索ライブラリ101が構築され、コンテンツ検索ライブラリ101に対してクエリが行われる。なお、これは単なる例であり、コンテンツ検索ライブラリ102の構築およびクエリは異なるコンピューティング機器によって実行されてもよいことを理解されたい。また、コンピューティング機器102は、サーバなどの固定型コンピューティング機器であってもよく、または携帯電話、タブレットコンピュータなどのポータブルコンピューティング機器であってもよいことを理解されたい。
【0026】
本開示の実施例に係るコンテンツ検索解決案をより明確に理解するために、まず、図2を参照して本開示の実施例に係るコンテンツ検索ライブラリを構築する方法を説明する。図2は、本開示のいくつかの実施例に係るコンテンツ検索ライブラリを構築するプロセス200を示すフローチャートである。プロセス200は、図1のコンピューティング機器102によって実現することができる。検討を容易にするために、図1を合わせてプロセス200を説明する。
【0027】
ブロック210において、コンピューティング機器102は、処理対象コンテンツ103の識別情報130を取得する。識別情報130は、複数の情報項目131~133を含み、各情報項目は、コンテンツ103の一部に関連付けられている。例えば、コンピューティング機器102は、あるテレビドラマの1話のビデオをコンテンツ103として取得することができる。この場合、識別情報130は当該ビデオの弾幕であってもよく、情報項目131~133は、ビデオの異なる時間帯にそれぞれ現れた個々の弾幕であってもよい。ビデオの弾幕は、ビデオウェブサイトのメタデータから直接取得することもできるし、ビデオ画面を認識して取得することもできる。本開示の範囲はこの点に限定されない。識別情報130は、テレビドラマのセリフまたはドキュメンタリーのナレーションなどのビデオの字幕をさらに含むことができる。
【0028】
ブロック220において、コンピューティング機器102は、識別情報130に基づいてコンテンツ103の少なくとも一部に対応するキーワード111を決定する。例えば、コンピューティング機器102は、ビデオの弾幕に基づいて当該ビデオ内のあるクリップに対応するキーワード111を生成することができる。
【0029】
いくつかの実施例では、コンピューティング機器102は、コンテンツ103の各部分について、当該部分に関連付けられた各情報項目に基づいて、当該部分に対応するキーワードを生成することができる。例えば、コンピューティング機器102は、所定時間(例えば、5分)でビデオを複数のクリップに分割し、各クリップ中に現れた弾幕に基づいてキーワードを生成することができる。例えば、ノイズを除去された弾幕(下記の説明を参照)をキーワードとして使用する。
【0030】
いくつかの実施例では、コンピューティング機器102は、まず、識別情報130に基づいてコンテンツ103の一部または複数の部分を決定し、次に、決定された部分に関連付けられた情報項目を用いてキーワードを生成することができる。例えば、コンピューティング機器102は、まず、弾幕の数に基づいてビデオのクリップを決定し、次に、当該ビデオクリップに現れた弾幕を用いてキーワードを生成することができる。弾幕の頻度は、弾幕の人気度であると見さしてもよい。例えば、「妾である私にはできません」は、対応するビデオクリップのセリフに1回だけ現れたが、弾幕には何度も現れている。したがって、このような例では、生成されたキーワードは、通常、ビデオの人気クリップまたはクラシッククリップに対するものであるため、ユーザの検索ニーズを満たすことがさらに容易になる。
【0031】
以下、図3および4を参照してこのような実施例を説明する。図3は、本開示のいくつかの実施例に係るキーワードを決定するプロセス300を示すフローチャートである。プロセス300は、図2のブロック220の実現として見なすことができる。
【0032】
ブロック310において、コンピューティング機器102は、複数の情報項目131~133のうちのコンテンツ103の少なくとも一部に関連付けられたターゲット情報項目の第1の数を決定する。ブロック320において、コンピューティング機器102は、第1の数が所定条件を満たすか否かを判定する。このような所定条件は、第1の数が第1の閾値数を超えたこと、および複数の情報項目の合計に対する第1の数の比が閾値比を超えたこと、のうちの少なくとも1つを含むことができる。コンテンツ103の所定条件を満たす1つまたは複数の部分は、処理対象部分であると見なされてもよい。
【0033】
以下、ビデオをコンテンツ103の一例とし、弾幕を識別情報130の一例として、上記のプロセスを詳細に説明する。図4は、本開示のいくつかの実施例に係るコンテンツの少なくとも一部を決定することを示す概略図400を示す。コンピューティング機器102は、ビデオの時間軸における弾幕の分布402に基づいて、弾幕が大量に表示されたビデオクリップ401を処理対象部分として決定することができる。
【0034】
いくつかの実施例では、コンピューティング機器102は、ビデオを大きな粒度(例えば、5分)で複数のクリップに分割した後、各クリップの弾幕の数を算出することができる。例えば、ビデオクリップ401の弾幕の数が所定閾値数を超えた場合、ビデオクリップ401は処理対象部分と見なすことができる。この例では、ビデオクリップ401の弾幕の数は第1の数と見なすことができ、所定閾値は第1の閾値と見なすことができる。
【0035】
いくつかの実施例では、コンピューティング機器102は、より小さな粒度でビデオを分割することができる。例えば、コンピューティング機器102は、ビデオを長さ10秒の複数のクリップに分割し、長さ10秒の各クリップの弾幕の数を算出し、弾幕の数が所定条件を満たすと決定された1つのクリップまたは複数の連続したクリップを処理対象部分(例えば、ビデオクリップ401)として決定することができる。この場合、処理対象ビデオクリップ401は、長さ10秒の複数の連続したクリップを含むことができる。この実施例では、より小さな粒度でビデオを分割することにより、ビデオの人気クリップまたはクラシッククリップをより正確に見つけることが可能である。
【0036】
所定条件は、分割されたビデオクリップの弾幕の絶対数および/または相対数に基づいて定義されてもよい。例えば、所定条件は、分割された(例えば、長さ10秒)ビデオクリップの弾幕の数が第1の閾値数を超えたこと、または分割されたビデオクリップの弾幕の数と当該ビデオのすべての弾幕の数(または、中央値)との比が閾値比を超えたことを含むことができる。第1の閾値および閾値比は、分割されたビデオクリップの長さによって異なる。例えば、分割されたビデオクリップの長さが5分であるときの第1の閾値は、分割されたビデオクリップの長さが10秒であるときの第1の閾値より大きくてもよい。
【0037】
一例では、以下の2つの条件を定義することができる。条件i)分割されたビデオクリップの弾幕の数が閾値Xを超える。条件ii)分割されたビデオクリップの弾幕の数とビデオクリップ全体の弾幕の数の中央値との比はY以上である。条件i)は、スクリーニングされたビデオクリップ(処理対象部分)の絶対人気度を確保する。条件ii)は、スクリーニングされたクリップが現在のビデオ内の相対的な人気クリップであることを確保する。XおよびYの具体的な数値は、さまざまな要因に応じて選択可能である。例えば、リコール率を向上させたい場合はXおよびYを小さくし、リコール品質を向上させたい場合は、XおよびYを大きくすることができる。また、XおよびYの具体的な値は、コンテンツ103の具体的なタイプによって異なり、例えば、異なるタイプのビデオ(例えば、メロドラマ、コマーシャルビデオ)に応じて変化する。
【0038】
図4には1つのビデオクリップ401のみが示されているが、1つのビデオから所定条件を満たす複数のビデオクリップを決定することができる。また、上記で定義された所定条件は単なる例であり、情報項目の絶対数および/または相対数に基づく他の条件も想定されてもよいことを理解されたい。
【0039】
引き続き図3を参照すると、ブロック320において第1の数が所定条件を満たすと判定された場合、コンピューティング機器102は、次に、ターゲット情報項目に基づいてキーワードを決定することができる。例えば、コンピューティング機器102は、ビデオクリップ401の弾幕に基づいてキーワード(本明細書ではホットワードともいう)を決定することができる。
【0040】
いくつかの実施例では、コンピューティング機器102は、例えばノイズを除去するために、ターゲット情報項目を処理することができる。そうすると、プロセス300はブロック330に進むことができる。ブロック330において、コンピューティング機器102は、ターゲット情報項目を処理して、少なくとも1つの候補単語を取得することができる。このような処理は、ターゲット情報項目に対して、所定文字にマッチングするターゲット情報項目内の単語の削除と、ターゲット情報項目のうち単語数が閾値単語数より少ないターゲット情報項目の削除と、ターゲット情報項目における句読点の削除と、ターゲット情報項目における所定カテゴリ(語気助詞など)の単語の削除と、のうちの少なくとも1つを実行することを含む。
【0041】
依然としてビデオおよび弾幕を例として説明する。図4中のビデオクリップ401の弾幕は、ターゲット情報項目と見なすことができる。コンピューティング機器102は、ビデオクリップ401の弾幕に対してノイズ除去処理を実行することができる。例えば、「高エネルギー警告」、「666」など、所定テキストにマッチングする単語を削除することができる。このような言葉は、個別の弾幕であってもよいし、弾幕に含まれてもよい。これは、このような単語が異なるビデオに繰り返して現れることがあり、あるビデオクリップを特異的に識別するために使用できないからである。単語数が閾値単語数より少ない弾幕など、長さが短すぎる弾幕を削除することもできる。このような弾幕も特異性を有さない。また、「なんと」や「まさか」のような語気助詞などの所定のカテゴリの単語を削除することもできる。これにより、取得された候補単語(すなわち、ノイズを除去された弾幕)が平叙文の表現方式に合うようになり、検索語と更に類似するようになる。また、弾幕内の句読点も削除することができる。
【0042】
本明細書では、情報項目に対して上記の処理の1つまたは複数を実行して取得された単語または文は、候補単語といい、例えば、「康熙帝が知恵でオボイを捕まえる」。ブロック330で1つの候補単語のみが取得された場合、当該候補単語をキーワードとすることができる。
【0043】
弾幕などの識別情報は一般に高い重複性を有するため、ブロック330で複数の候補単語が取得された場合、これらの候補単語に対してさらなる処理を実行することができ、すなわち、この場合、プロセス300がブロック340に進むことができる。
【0044】
ブロック340において、コンピューティング機器102は、複数の候補単語における同一または語義的に関連する候補単語の第2の数(以下、単語頻度ともいう)を決定することができる。ここでの複数の候補単語は、処理対象部分(例えば、ビデオクリップ401の弾幕)に対応する情報項目に基づいて決定されるため、第2の数または単語頻度は、処理対象部分(ビデオクリップ401)の統計結果である。
【0045】
いくつかの実施例では、コンピューティング機器102は、複数の候補単語における同じ候補単語の単語頻度を簡単に決定することができる。例えば、これらの候補単語には合計10個の「康熙帝が知恵でオボイを捕まえる」という候補単語がある場合、「康熙帝が知恵でオボイを捕まえる」という候補単語の単語頻度が10であると決定することができる。
【0046】
いくつかの実施例では、コンピューティング機器102は、複数の候補単語における語義的に関連する候補単語の数を決定することができる。例えば、コンピューティング機器102は、ノイズを除去された弾幕(すなわち、候補単語)を語義的類似性に従ってクラスタリングすることができる。例えば、「康熙帝が知恵でオボイを捕まえる」、「康熙帝がオボイを捕まえる」「康熙帝がオボイをキャッチする」などの候補単語は、同じカテゴリにクラスタリングされる可能性がある。この場合、一定の時間帯における弾幕の単語頻度は、当該弾幕が属するカテゴリのすべての弾幕が該当時間帯内の出現回数の合計として定義される。
【0047】
ブロック350において、コンピューティング機器102は、ブロック340で決定された第2の数(すなわち、単語頻度)が単語頻度閾値などの第2の閾値数を超えたか否かを判定する。ここでの第2の閾値または単語頻度閾値は、固定値であってもよく、またはコンピューティング機器102によって処理対象部分のサイズ(例えば、ビデオクリップ401の時間の長さ)に基づいて決定されてもよい。第2の数が第2の閾値数を超えた場合、プロセス300はブロック360に進む。ブロック360において、コンピューティング機器102は、同じまたは語義的に関連する候補単語に基づいてキーワードを決定することができる。例えば、単語頻度閾値が8であり、「康熙帝が知恵でオボイを捕まえる」という候補単語の単語頻度が10である場合、「康熙帝が知恵でオボイを捕まえる」または類似文をキーワードとして決定することができる。
【0048】
この実施例では、単語頻度によって弾幕などの識別情報をスクリーニングして、キーワードを決定することにより、低い人気度であるワードを効果的にフィルタリングすることができる。このようにして取得されたキーワード及びその関連情報は、ホットコンテンツ(例えば、ホットビデオクリップ)に対するユーザの検索需要をさらに満たすことができる。
【0049】
上記のプロセスによって、コンピューティング機器102は、キーワード、単語頻度、前記コンテンツ、および所在部分などの情報を取得することができる。例えば、上記のビデオおよび弾幕の例では、コンピューティング機器102は、4タプル(キーワード、単語頻度、所属ビデオ、所属ビデオにおける時間帯)を取得することができる。コンテンツ103が電子書籍であり、且つ識別情報130が電子書籍の読者の注釈である場合、コンピューティング機器102が取得できる情報は、キーワード、単語頻度、所属電子書籍、電子書籍におけるページ番号または段落などの情報である。また、コンテンツ103の同じ部分(例えば、ビデオクリップ401)に対して複数のキーワードを決定することができ、このような4タプルを複数取得できることを理解されたい。
【0050】
図3に示されるプロセス300は、ブロック220の一実施例である。いくつかの実施例では、図3に示されるブロック310~360のうちのいくつかは省略されてもよい。
【0051】
引き続き図2を参照する。ブロック230において、コンピューティング機器102は、キーワード111と、コンテンツ103の少なくとも一部に関する指示情報112とを関連付けてコンテンツ検索ライブラリ101に記憶する。例えば、コンピューティング機器102は、コンテンツ検索ライブラリ101に上記の4タプルを記憶することができる。
【0052】
指示情報112は、複数の形態を採用することができる。例えば、指示情報112は、コンテンツ103の少なくとも一部を取得するためのリンクを含んでもよい。上記のビデオの例では、指示情報112は、当該ビデオのURLリンクを含んでもよい。指示情報112は、少なくとも一部の、コンテンツ103における相対位置を示す位置情報をさらに含んでもよい。例えば、指示情報112は、8分~12分など、ビデオクリップ401のビデオにおける時間帯を含んでもよい。コンテンツ103が電子書籍である例では、指示情報112は、決定されたキーワードに対応する部分の、当該電子書籍における段落などを含んでもよい。指示情報112は、決定されたキーワードに対応する部分がコンテンツ103に含まれていることを示すテキスト情報をさらに含んでもよい。例えば、このような指示情報112は、『検索するコンテンツは、テレビドラマ《瓔珞~紫禁城に燃ゆる逆襲の王妃~》の第54話の「8分から12分」に位置する』などのテキスト情報を含んでもよい。指示情報112は、後続の検索で提供されるように、上記の1つの形態または複数の形態の組み合わせで記憶されてもよい。
【0053】
いくつかの実施例では、コンピューティング機器102は、コンテンツ103の少なくとも一部(例えば、ビデオクリップ401)に関連付けられた追加情報を生成し、追加情報とキーワード111とを関連付けてコンテンツ検索ライブラリ101に記憶することができる。コンピューティング機器102は、コンテンツ103の閲覧回数、クリック回数またはダウンロード回数、コンテンツ103のコメント数、コンテンツ103の評価点数、および少なくとも一部に関連付けられた情報項目におけるキーワードの出現回数(すなわち、単語頻度)のうちの1つまたは複数を取得し、取得された情報に基づいて追加情報を生成することができ、このような追加情報は総合ホットスコアとも呼ばれてもよい。いくつかの実施例では、コンピューティング機器102は、ビデオ内の人々の数およびボリュームなどをさらに識別して、総合ホットスコアを決定することができる。
【0054】
例えば、コンピューティング機器102は、ビデオの視聴回数、クリック回数、またはダウンロード回数、ビデオサイトで当該ビデオに対するコメント数、および当該ビデオに対応するエピソード(例えば、テレビドラマ)のドゥーバン評価点数、バイドゥ評価点数などを得ることができる。次に、コンピューティング機器102は、これらの情報の1つまたは複数をキーワードの頻度で加重平均して、追加情報として総合ホットスコアを取得し、追加情報とキーワード111とを関連付けてコンテンツ検索ライブラリ101に記憶することができる。例えば、取得された(キーワード、所属ビデオ、所属ビデオにおける時間帯、総合ホットスコア)4タプルをコンテンツ検索ライブラリ101に記憶してもよい。また、(キーワード、単語頻度、所属ビデオ、所属ビデオにおける時間帯、総合ホットスコア)をコンテンツ検索ライブラリ101に記憶してもよい。
【0055】
上記は、本開示のいくつかの実施例に係るコンテンツ検索ライブラリを構築するプロセス200を説明した。このようにして、コンテンツの異なる部分に関連付けられた識別情報に基づいてコンテンツ検索ライブラリを構築することができる。例えば、ホットビデオまたはホットビデオクリップに関するコンテンツ検索ライブラリを構築することができる。このようなコンテンツ検索ライブラリを使用すると、ユーザは複数回検索することなく、興味を持っているコンテンツに直接アクセスすることができる。
【0056】
図5は、本開示のいくつかの実施例に係るコンテンツ検索プロセス500のフローチャートを示す。プロセス500は、図1のコンピューティング機器102によって実現することができる。検討しやすくなるために、図1を参照してプロセス500を説明する。プロセス500は、コンピューティング機器102以外のコンピューティング機器によって実現することもできることを理解されたい。
【0057】
ブロック510において、コンピューティング機器102は、コンテンツ103のターゲット部分(例えば、ビデオクリップ)に対するクエリ要求(例えば、ユーザ104から)に基づいて、検索語を決定する。例えば、ユーザ104からのクエリ要求は、『「康熙帝がオボイを捕まえる」のは《鹿鼎記》の何話目ですか」、「鹿鼎記 「康熙帝がオボイを捕まえる」』などであってもよい。そして、コンピューティング機器102は、このクエリ要求に基づいて例えば「康熙帝がオボイを捕まえる」である検索語と決定することができる。クエリ要求は、例えば、「康熙帝がオボイを捕まえる」のみを含んでもよい。この場合、コンピューティング機器102は、「康熙帝がオボイを捕まえる」を直接検索語とすることができる。
【0058】
ブロック520において、コンピューティング機器102は、コンテンツ検索ライブラリ101から検索語にマッチングするキーワードを決定する。コンテンツ検索ライブラリ101は、図2から図4を参照して上述した解決案を用いて構築することができる。検索語とキーワードとのマッチングは、両者同一、語義的に関連するまたは類似することを含んでもよい。コンテンツ検索ライブラリ101は、少なくとも、キーワード111と、キーワード111に関連付けて記憶された、ターゲット部分に関する指示情報112とを含む。キーワード111は、ターゲット部分に関連付けられた情報項目(例えば、ビデオの弾幕)に基づいて決定され、情報項目はコンテンツ103の識別情報130に含まれている。例えば、コンピューティング機器102は、コンテンツ検索ライブラリ101から「康熙帝が知恵でオボイを捕まえる」というキーワードが「康熙帝がオボイを捕まえる」という検索語にマッチングしていることを決定することができる。
【0059】
ブロック530において、コンピューティング機器102は、コンテンツ検索ライブラリ101から、キーワード111に関連付けて記憶された指示情報112を検索する。例えば、コンピューティング機器102は、コンテンツ検索ライブラリ101から、「康熙帝が知恵でオボイを捕まえる」というキーワードに関連付けて記憶された指示情報を取得することができ、例えば、所在ビデオのURLリンクおよび/または「康熙帝が知恵でオボイを捕まえる」の関連エピソードの、ビデオにおける時間帯を取得することができる。
【0060】
ブロック540において、コンピューティング機器102は、ターゲット部分を示すように、指示情報112を(例えば、ユーザ104へ)提供する。指示情報を提供することは、ターゲット部分のリンクを提供すること、ターゲット部分の、コンテンツ103における相対位置を示すように、位置情報を提供すること、およびターゲット部分がコンテンツ103に含まれていることを示すテキスト情報を提供することと、のうちの少なくとも1つを含んでもよい。
【0061】
コンピューティング機器102は、「あなたが興味を持っているコンテンツは、テレビドラマ「鹿鼎記」第18話の20分~28分に位置する」などのテキスト情報を提供することができる。コンピューティング機器102は、さらに、テレビドラマ「鹿鼎記」内の「康熙帝が知恵でオボイを捕まえる」エピソードを含む話(例えば、第18話)のリンクを提供するとともに、当該エピソードの当該ビデオにおける時間帯、例えば、20分~28分を提供することもできる。この場合、ユーザ104は、興味を持っているビデオクリップに対応する時点およびビデオのリンクを直接取得することができ、これにより、リンクをクリックして対応する時点に位置決めすることにより興味を持っているクリップを便利に視聴することができる。また、ユーザ104は、興味を持っているクリップに関連する前後のエピソードを便利に視聴することもできる。
【0062】
なお、このような指示情報は、コンテンツ検索101の構築中に生成され、対応するキーワードに関連付けられてコンテンツ検索101に記憶され得ることを理解されたい。
【0063】
コンテンツ検索ライブラリ101に、総合ホットスコアなど、キーワード111に関連付けられた追加情報も記憶されてもよい。上述したように、コンテンツ検索ライブラリ101を構築することを参照してこのような追加情報は、ターゲット部分に関連付けられた情報項目におけるキーワード111の出現回数(例えば、キーワードの単語頻度)、コンテンツ103の閲覧回数、クリック回数、またはダウンロード回数、コンテンツ103のコメント数、およびコンテンツ103の評価点数のうちの少なくとも1つに基づいて生成され得る。
【0064】
コンピューティング機器102は、決定されたキーワードに基づいて、コンテンツ検索ライブラリ101からキーワードに関連付けて記憶された追加情報を取得することができ、例えば、総合ホットスコアを取得することができる。いくつかの実施例では、コンピューティング機器102は、例えば、ユーザ104に総合ホットスコアなどの追加情報を提供することにより、ユーザ104は、コンテンツ検索結果における各コンテンツ項目(例えば、各ビデオ)のホット状況を把握することができ、ユーザ104がどのコンテンツ項目をクリックするかを決定することが支援される。
【0065】
いくつかの実施例では、コンピューティング機器102は、追加情報に基づいて、クエリ結果105において指示情報112を提供することができる。例えば、コンピューティング機器102は、ブロック520で、検索語にマッチングする複数のキーワード、またはコンテンツ検索ライブラリ101内の複数の項目を決定することができる。この場合、コンピューティング機器102は、追加情報に基づいて、複数のキーワードに関連付けられた複数の指示情報の、クエリ結果105における出現順序を決定することができる。例えば、コンピューティング機器102は、取得したキーワードを総合ホットスコアにソートし、トップ(top)Nの結果を提供ことができ、例えば、キーワード、時間区間、所属ビデオなどを提供することができる。
【0066】
上記では本開示のいくつかの実施例に係るコンテンツ検索プロセス500を説明した。このようにして、ユーザは、興味を持っているビデオのリンク(例えば、URL)をクリックして、関連するビデオページに入り、時間区間に基づいて、視聴する時間クリップを絞る。総合ホットスコアに基づいてトップNの結果を提供することにより、ビデオの品質を確保することができ、ユーザが弾幕、コメント、および前後のエピソードを視聴することが便利になる。
【0067】
図6は、本開示のいくつかの実施例に係るコンテンツ検索ライブラリを構築するための装置600の概略ブロック図を示す。装置600は、図1のコンピューティング機器102に含まれてもよく、またはコンピューティング機器102として実現されてもよい。図6に示すように、装置600は、処理対象コンテンツの識別情報を取得するように構成される識別情報取得モジュール610を含み、識別情報は複数の情報項目を含み、各情報項目はコンテンツの一部に関連付けられている。装置600は、識別情報に基づいてコンテンツの少なくとも一部に対応するキーワードを決定するように構成されるキーワード決定モジュール620をさらに含む。装置600は、キーワードと、コンテンツの少なくとも一部に関する指示情報とを関連付けてコンテンツ検索ライブラリに記憶するように構成されるキーワード記憶モジュール630をさらに含む。
【0068】
いくつかの実施例では、キーワード決定モジュール620は、複数の情報項目のうち、コンテンツの少なくとも一部に関連付けられたターゲット情報項目の第1の数を決定するように構成される第1の数決定モジュールと、第1の数が第1の閾値数を超えたこと、および第1の数と複数の情報項目の合計との比が閾値比を超えたことの少なくとも1つに応答して、ターゲット情報項目に基づいてキーワードを決定するように構成される情報項目使用モジュールと、を含む。
【0069】
いくつかの実施例では、情報項目使用モジュールは、ターゲット情報項目に対して、ターゲット情報項目における、所定テキストにマッチングする単語の削除と、ターゲット情報項目のうちの、単語数が閾値単語数より少ないターゲット情報項目の削除と、ターゲット情報項目における句読点の削除と、ターゲット情報項目における所定カテゴリの単語の削除とのうちの少なくとも1つを実行して、少なくとも1つの候補単語を取得するように構成される候補単語取得モジュールと、少なくとも1つの候補単語に基づいてキーワードを決定するように構成される候補単語使用モジュールと、を含む。
【0070】
いくつかの実施例では、少なくとも1つの候補単語は複数の候補単語を含み、候補単語使用モジュールは、複数の候補単語における同じまたは語義的に関連する候補単語の第2の数を決定するように構成される第2の数決定モジュールと、第2の数が第2の閾値数を超えたことに応答して、同じまたは語義的に関連する候補単語に基づいてキーワードを決定するように構成されるキーワード抽出モジュールと、を含む。
【0071】
いくつかの実施例では、装置600は、少なくとも一部に関連付けられた情報項目におけるキーワードの出現回数と、コンテンツの閲覧回数、クリック回数またはダウンロード回数と、コンテンツのコメント数と、コンテンツの評価点数とのうちの少なくとも1つに基づいて、コンテンツの少なくとも一部に関連付けられた追加情報を生成するように構成される追加情報決定モジュールと、追加情報とキーワードとを関連付けてコンテンツ検索ライブラリに記憶するように構成される追加情報記憶モジュールと、を含む。
【0072】
いくつかの実施例では、指示情報は、コンテンツの少なくとも一部を取得するためのリンクと、少なくとも一部の、コンテンツにおける相対位置を示す位置情報と、少なくとも一部がコンテンツに含まれていることを示すテキスト情報と、のうちの少なくとも1つを含む。
【0073】
図7は、本開示のいくつかの実施例に係るコンテンツ検索装置700の概略ブロック図を示す。装置700は、図1のコンピューティング機器102に含まれてもよく、またはコンピューティング機器102として実現されてもよい。図6に示すように、装置700は、コンテンツのターゲット部分に対するクエリ要求に基づいて検索語を決定するように構成される検索語決定モジュール710を含む。装置700は、コンテンツ検索ライブラリから検索語にマッチングするキーワードを決定するように構成されるキーワード検索モジュール720をさらに含み、コンテンツ検索ライブラリは、少なくとも、キーワードと、キーワードに関連付けて記憶された、ターゲット部分に関する指示情報とを含み、キーワードは、ターゲット部分に関連付けられた情報項目に基づいて決定され、情報項目はコンテンツの識別情報に含まれている。装置700は、コンテンツ検索ライブラリからキーワードに関連付けて記憶された指示情報を取得するように構成される指示情報取得モ。ジュール730をさらに含む。装置700は、ターゲット部分を示すように、指示情報を提供するように構成される指示情報提供モジュール740をさらに含む。
【0074】
いくつかの実施例では、指示情報提供モジュール730は、ターゲット部分のリンクを提供するように構成されるリンク提供モジュールと、ターゲット部分のコンテンツにおける相対位置を示すように、位置情報を提供するように構成される位置情報提供モジュールと、ターゲット部分がコンテンツに含まれていることを示すように、テキスト情報を提供するように構成されるテキスト情報提供モジュールと、のうちの少なくとも1つを含む。
【0075】
いくつかの実施例では、装置700は、キーワードに基づいて、コンテンツ検索ライブラリからキーワードに関連付けて記憶された追加情報を取得するように構成される追加情報取得モジュールと、追加情報を提供するように構成される追加情報提供モジュールであって、追加情報は、ターゲット部分に関連付けられた情報項目におけるキーワードの出現回数と、コンテンツの閲覧回数と、クリック回数またはダウンロード回数と、コンテンツのコメント数と、コンテンツの評価点数と、のうちの少なくとも1つに基づいて生成される追加情報提供モジュールと、をさらに含む。
【0076】
いくつかの実施例では、装置700は、コンテンツの識別情報を取得するように構成される識別情報取得モジュールであって、識別情報は複数の情報項目を含み、各情報項目はコンテンツの一部に関連付けられている識別情報取得モジュールと、識別情報に基づいてコンテンツの少なくとも一部に対応するキーワードを決定するように構成されるキーワード決定モジュールと、決定されたキーワードと、コンテンツの少なくとも一部に関する指示情報とを関連付けてコンテンツ検索ライブラリに記憶するように構成されるキーワード記憶モジュールと、さらに含む。
【0077】
図8は、本開示の実施例を実施することができる例示的な機器800の概略ブロック図を示す。機器800は、図1のコンピューティング機器102を実現することができる。図に示すように、機器800は、リードオンリーメモリ(ROM)802に記憶されているコンピュータプログラム命令または記憶装置808からランダムアクセスメモリ(RAM)803にロードされたコンピュータプログラム命令に従って様々な適切な動作および処理を実行することができる中央処理装置(CPU)801を含む。RAM803には、機器800の動作に必要な各種プログラムおよびデータも記憶することができる。CPU801、ROM802、およびRAM803は、バス804を介して相互に接続されている。入力/出力(I/O)インターフェイス805もバス804に接続されている。
【0078】
キーボード、マウスなどの入力ユニット806と、各種のディスプレイ、スピーカなどの出力ユニット807と、磁気ディスク、光学ディスクなどの記憶ユニット808と、ネットワークカード、モデム、無線通信トランシーバなどの通信ユニット809とを含む機器800内の複数のコンポーネントは、I/Oインターフェイス805に接続されている。通信ユニット809は、機器800がインターネットなどのコンピュータネットワークおよび/または様々な電気通信ネットワークを介して他の機器と情報/データを交換することを許可する。
【0079】
中央処理装置801は、プロセス200、300、および500のいずれかなど、上記の様々な方法および処理を実行する。いくつかの実施例では、プロセス200、300、および500のいずれかは、記憶装置808などの機械読み取り可能な媒体に有形に含まれているコンピュータソフトウェアプログラムとして実現することができる。いくつかの実施例において、コンピュータプログラムの一部または全部は、ROM802および/または通信ユニット809を介して機器800にロードおよび/またはインストールすることができる。コンピュータプログラムがRAM803にロードされ、CPU801によって実行されるとき、上記のプロセス200、300、および500のいずれかの1つまたは複数のステップを実行することができる。代替的に、他の実施例では、CPU801は、他の任意の適切な形態によって(例えば、ファームウェアによって)プロセス200、300、および500のいずれかを実行するように構成することができる。
【0080】
本明細書で上述した機能は、少なくとも部分的に、1つまたは複数のハードウェアロジックコンポーネントによって実行することができる。例えば、非限定的には、使用できる例示的なタイプのハードウェアロジックコンポーネントは、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、特定用途向け標準製品(ASSP)、システムオンチップ(SOC)、ロードプログラマブルロジックデバイス(CPLD)などを含むがこれらに限定されない。
【0081】
本開示の方法を実施するためのプログラムコードは、1つまたは複数のプログラミング言語の任意の組み合わせで作成することができる。これらのプログラムコードは、汎用コンピュータ、専用コンピュータ、または他のプログラマブルデータ処理装置のプロセッサまたはコントローラに提供されてもよく、その結果、プログラムコードがプロセッサまたはコントローラによって実行されるとき、フローチャートおよび/またはブロック図において特定された機能および/または動作が実施される。プログラムコードは、全てマシンで、部分的にマシンで、スタンドアロンソフトウェアパッケージの一部として、部分的にリモートマシンで、または全てリモートマシンまたはサーバで実行することができる。
【0082】
本開示の説明において、機械読み取り可能な媒体は、有形な媒体であってもよく、命令実行システム、装置又は機器によって、又は命令実行システム、装置又は機器と合わせて使用されるプログラムを含み、又は記憶する。機械読み取り可能な媒体は、機械読み取り可能な信号媒体又は機械読み取り可能な記憶媒体であってもよい。機械読み取り可能な媒体は、電子、磁気、光学、電磁、赤外線、又は半導体システム、装置、又はデバイス、又は前述した内容の任意の適切な組み合わせを含むことができるがこれらに限定されない。機械読み取り可能な記憶媒体のさらなる具体例として、1つ又は複数の配線に基づいた電気的接続、ポータブルコンピュータディスクカートリッジ、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、消去可能なプログラマブルリードオンリーメモリ(EPROM又はフラッシュメモリ)、光ファイバー、ポータブルコンパクトディスクリードオンリーメモリ(CD-ROM)、光学記憶装置、磁気記憶装置、又は前述した内容の任意の組み合わせを含む。
【0083】
また、動作を特定の順序で説明したが、これは、このような動作が示された特定の順序または順番で実行されること、または所望の結果を達成するために示されたすべての動作が実行されることを要求することを理解されたい。一定の環境においてマルチタスキングおよび並列処理は有利な場合がある。同様に、いくつかの具体的な実装の詳細が上記の説明に含まれているが、これらは本開示の範囲を限定するものとして解釈されるべきではない。別々の実施例で説明されているいくつかの特徴は、単一の実施例において組み合わせて実現することもできる。逆に、単一の実施例で説明されている様々な特徴は、個別にまたは任意の適切なサブ組み合わせで複数の実施例で実現することもできる。
【0084】
構成の特徴および/または方法の論的動作に特有の言語で本テーマを説明したが、添付の特許請求の範囲に定義されたテーマは上述した特定の特徴または動作に限定されないことを理解されたい。逆に、上記の特定の特徴および動作は単に特許請求の範囲を実現する例示的な形態である。
図1
図2
図3
図4
図5
図6
図7
図8