(58)【調査した分野】(Int.Cl.,DB名)
前記字幕処理システムが、クライアントからアップロードされたビデオファイルの識別コード及び対応する字幕ファイルの識別コードに基づいて該ビデオ字幕マッピングデータベースを更新することをさらに含むことを特徴とする請求項2に記載の字幕処理方法。
字幕マッピングインタフェースサーバにより、クライアントからアップロードされた字幕ファイルを受信し、受信した字幕ファイルを字幕データベースに格納することをさらに含むことを特徴とする請求項2に記載の字幕処理方法。
該識別コードに対応する字幕ファイルが検索された場合、検索結果返信ユニットにより、字幕検索結果を該クライアントに返信することを更に含むこと特徴とする請求項5に記載の字幕処理方法。
対応する字幕ファイルが検索され且つ該字幕マッピングインタフェースサーバから字幕ファイルアップロード要請が返信された場合、ユーザの設定によって該字幕ファイルを該字幕マッピングインタフェースサーバにアップロードするか否かを決定することをさらに
含むことを特徴とする請求項7に記載の字幕処理方法。
ビデオファイルクラスタモジュールと字幕マッピング拡張モジュールをさらに備え、該ビデオファイルクラスタモジュールと字幕マッピング拡張モジュールは前記字幕検索モジュールを実行する前に実行され、
該ビデオファイルクラスタモジュールはビデオファイルにクラスター分析を行ってクラスタ結果を得ることに用いられ、
該字幕マッピング拡張モジュールは同一クラスタ内のビデオファイルと字幕ファイルのマッピング関係に基づいて該クラスタ内の他のビデオファイルと字幕ファイルのマッピング関係を拡張し、且つビデオ字幕マッピングデータベースに格納することに用いられ、
前記検索結果返信ユニットが、該ビデオ字幕マッピングデータベースにおいて該識別コードに対応する字幕ファイルが検索された場合、該識別コードに対応する字幕ファイルを前記字幕検索結果として該クライアントに返信することに用いられることを特徴とする請求項9に記載の字幕処理システム。
字幕マッピングインタフェースモジュールをさらに備え、該字幕マッピングインタフェースモジュールがクライアントからアップロードされたビデオファイルの識別コード及び対応する字幕ファイルの識別コードを受信し、受信したビデオファイルの識別コード及び対応する字幕ファイルの識別コードをビデオ字幕マッピングデータベースに格納することに用いられることを特徴とする請求項10に記載の字幕処理システム。
該字幕マッピングインタフェースモジュールはさらにクライアントからアップロードされた字幕ファイルを受信し、該字幕ファイルを字幕データベースに格納することに用いられることを特徴とする請求項10に記載の字幕処理システム。
対応する字幕ファイルが検索され且つ該字幕マッピングインタフェースサーバから字幕ファイルアップロード要請が返信された場合、ユーザの設定によって該字幕ファイルを該字幕マッピングインタフェースサーバにアップロードすること用いられる字幕アップロードユニットをさらに備えることを特徴とする請求項14に記載の字幕処理装置。
【発明を実施するための形態】
【0012】
本発明が採用する技術的手段を更に説明するために、以下、図面と好ましい実施例を参照しながら、本発明の具体的な実施形態、構造、特徴及びその効果について、以下のように詳しく説明する。
【0013】
第1実施例は、ビデオファイル再生機能を有するパソコン、スマートフォン、タブレットPC等のような電子装置によって実行することができる字幕処理方法を提供する。
【0014】
図1に示すように、上記字幕処理方法は下記ステップを含み、
(S110)自機器でカレントの再生ビデオファイルに対応する字幕ファイルがあるか否かを検索する。ここでの自機器は前記各種の電子装置を指すことが理解できる。一般的には、ビデオファイルが字幕ファイルと一緒にダウンロードされ、同一ディレクトリに位置し、ビデオファイルと同じ名前、異なる拡張子を有する。従って、ビデオファイルを再生する時、ビデオファイルと同一ディレクトリで字幕ファイルがあるか否かを走査すればよい。もちろん、字幕ファイルの名前、ルートは上記に限定されなく、任意ディレクトリ下にあっても、任意ファイル名であってもよく、この場合はユーザが対応の字幕ファイルを指定してロードして表示することが必要である。
【0015】
対応する字幕ファイルが検索された場合、ステップS120を行う。
(ステップS120)該ビデオファイルの識別コード及び該字幕ファイルの識別コードを字幕マッピングインタフェースサーバにアップロードする。ビデオファイルの識別コード及び字幕ファイルの識別コードは、例えばハッシュ(Hash)コードであってよく、もちろん本実施例はこれに限定されなく、他のアルゴリズムを用いて算出したフィーチャー
コードであってもよく、又は直接にビデオファイル及び字幕ファイルの名前を識別コードとしてもいい。
【0016】
字幕マッピングインタフェースサーバはビデオファイルの識別コード及び該字幕ファイルの識別コードを受信した後、更に該字幕ファイルの識別コードを用いて字幕データベースにおいて該字幕ファイルがあるか否かを検索することができ、字幕データベースに該字幕ファイルがなければ字幕ファイルのアップロード要請を上記電子装置に返信することができる。電子装置は上記字幕ファイルアップロード要請を受信した後、ユーザの設定によって該上記字幕ファイルを字幕マッピングインタフェースサーバにアップロードするか否かを決定する。例えば、ユーザはすべての字幕ファイルをアップロードし、またはいずれの字幕ファイルもアップロードしないことを選択でき、或いはアップロードする前に確認する。字幕マッピングインタフェースサーバはアップロードされた字幕ファイルを受信した後、それを字幕データベースに格納することで字幕データベースに保存された内容を拡充することができる。
【0017】
対応する字幕ファイルが検索されなければ、下記ステップを行う。
(ステップS130)、該ビデオファイルの識別コードを字幕検索サーバにアップロードする。ビデオファイルの識別コードは、例えば上記ハッシュコードである。字幕検索サーバはビデオファイルの識別コードを受信した後、それを用いてそれに対応する字幕ファイルを検索し、且つ相応な字幕検索結果を生成する。
【0018】
具体的に、字幕検索サーバはまずビデオ字幕マッピングデータベースにおいて上記ビデオファイルの識別コードに対応する字幕ファイルがあるか否かを検索するが、検索結果として対応する字幕ファイルはなしであることも可能であり、1つ又は複数であることも可能である。字幕ファイルが検索された場合、字幕ファイルのダウンロードリンク又は直接に字幕ファイルを上記電子装置に返信する。
【0019】
字幕ファイルが検索されなければ、ビデオクラスタデータベースにおいて上記ビデオファイルの識別コードと同一クラスタに位置する他の識別コードを検索する。更に、各他の識別コードそれぞれについて、それを用いてビデオ字幕マッピングデータベースにおいて対応する字幕ファイルを検索し、且つ検索されたすべての字幕ファイルのダウンロードリンク又は字幕ファイル自体を上記電子装置に返信する。
【0020】
(ステップS140)、該字幕検索サーバから返信された字幕検索結果を受信する。字幕検索結果は検索された字幕ファイルのダウンロードリンクを含み、更に、例えばファイル名、バージョン番号など他の説明情報を含むことができる。且つ検索された字幕ファイルは複数個ある可能性があり、例えば、異なる言語バージョンに対応する字幕ファイルである。
【0021】
(ステップS150)、該字幕検索結果に基づいて選定された字幕をロードして再生する。検索された字幕ファイルが1つだけであれば、直接にそれを用いて再生できるが、字幕ファイルが複数個である場合は、ユーザが再生する字幕ファイルを選定することができる。
【0022】
(ステップS160)、再生が予定時間を超えた後、選定された字幕の識別コード及び該ビデオファイルの識別コードを該字幕マッピングインタフェースサーバにアップロードする。つまり、ある字幕ファイルによる再生が予定時間を超えるなら、該字幕ファイルとカレントのビデオファイルがマッチングすることを表明し、この時、ビデオファイルと字幕ファイルのマッピング関係、即ちビデオファイルの識別コードと字幕ファイルの識別コードのペア関係を字幕マッピングインタフェースサーバにアップロードすることができる
。字幕マッピングインタフェースサーバがビデオファイルの識別コードと字幕ファイルの識別コードを受信した後、それをビデオ字幕マッピングデータベースに格納し、それによりビデオ字幕マッピングデータベースのマッピング関係ペアを豊富させ、後続検索時の使用に便利である。
【0023】
本実施例の字幕処理方法では、自機器で確認したビデオファイルと字幕ファイルのペア関係を字幕マッピングインタフェースサーバにアップロードすることによって、ビデオ字幕マッピングデータベースのマッピング関係を豊富させ、字幕ファイルマッチング時のヒット率を向上させる。
【0024】
第2実施例は字幕処理方法を提供し、
図2に示すように、それは下記ステップを含む。
(ステップS210)、ビデオファイルにクラスター分析を行う。
【0025】
ここでのビデオファイルはクラウドビデオストレージサーバからのものであってもよく、例えば、オフラインダウンロードサービスでは、サーバ端に一時的に大量の原始ビデオファイルを保存し、ビデオクラスター分析を行ってビデオクラスタデータベースを充填することができる。ビデオファイルのもう1つのソースはクライアントからアップロードされたビデオセグメントであってもよく、この時、ビデオファイルの一部の内容だけに基づいてクラスター分析を行うが、検索条件の一致性のために、さらにクライアントがビデオファイル全体の識別コード、例えばハッシュコードを同時にアップロードすることが必要である。
【0026】
ビデオクラスタ技術に基づき、ビデオ内容が同一のビデオファイルを同一クラスタ中に置くことができ、同一クラスタ中のビデオファイルが同じビデオ内容を有すべき、同じ字幕ファイルを共有できる。
【0027】
ビデオファイルのクラスター分析結果はビデオクラスタデータベースに保存されることができる。
【0028】
(ステップS220)、同一クラスタ中のビデオファイルの対応する字幕ファイルに基づいてビデオ字幕マッピングデータベースにおけるマッピング関係を広める。
【0029】
例えば、ビデオファイルAとBはクラスター分析によって同一クラスタ内にされ、ビデオ字幕マッピングデータベースにおいて、ビデオファイルAは対応する字幕ファイルCを有するが、ビデオファイルBは対応する字幕ファイルを有しない。この時、クラスター分析結果に基づいて、ビデオ字幕マッピングデータベースを更新し、それによりビデオファイルBも対応する字幕ファイルCを有するようにさせることができる。
【0030】
(ステップS230)、クライアントからアップロードされたビデオファイルの識別コードを受信する。ここでのクライアントは例えば上記電子装置である。電子装置がビデオファイルを再生する時、自機器で対応する字幕ファイルが検索されなければ、ビデオファイルの識別コードを字幕検索サーバにアップロードし、相応的に、字幕検索サーバはアップロードされたビデオファイルの識別コードを受信し、すなわち、ステップS230である。
【0031】
(ステップS240)、ビデオ字幕マッピングデータベースにおいて該識別コードに対応する字幕ファイルがあるか否かを検索する。
【0032】
ビデオ字幕マッピングデータベースには少なくともビデオファイルの識別コード及び対応する字幕ファイルの識別コードが保存され、各ビデオファイルの識別コードは複数の字
幕ファイルの識別コードに対応できる。
【0033】
該識別コードに対応する字幕ファイルが検索された場合、ステップS250を行う。
(ステップS250)、該識別コードに対応する字幕ファイルを字幕検索結果として、且つ該字幕検索結果を該クライアントに返信する。
【0034】
字幕検索結果は検索された字幕ファイルのダウンロードリンク又は字幕ファイル自体を含み、更に、例えばファイル名、バージョン番号、翻訳者又は機構等のような他の説明情報を含むことができる。複数の字幕ファイルが検索できた場合、字幕検索結果は検索されたすべての字幕ファイルの情報を含むことができる。
【0035】
本実施例の字幕処理方法において、ビデオクラスター分析によってビデオ字幕マッピングデータベースを拡充して、字幕ファイルマッチングのヒット率を向上させる。
【0036】
また、理解すべきのは、ビデオファイルと字幕ファイルのマッピング関係、即ちビデオ字幕マッピングデータベースにおける内容は上記ビデオクラスター分析結果によって充填されることに限定されない。
【0037】
例えば、クライアントからアップロードされたビデオファイルと字幕ファイルのマッピング関係に基づいてビデオ字幕マッピングデータベースの内容を更新することができる。
【0038】
第1実施例に記載したように、電子装置は、ビデオファイルを再生する時、自機器で対応する字幕ファイルが検索された場合、ビデオファイルの識別コードと対応する字幕ファイルの識別コードを字幕マッピングインタフェースサーバにアップロードし、相応的に、字幕マッピングインタフェースサーバは電子装置(クライアント)からアップロードされたビデオファイルの識別コード及び対応する字幕ファイルの識別コードを受信する。
【0039】
アップロードされたビデオファイルの識別コード及び対応する字幕ファイルの識別コードを受信した後、まずビデオファイル識別コードを検索キーワードとしてビデオ字幕マッピングデータベースにおいて対応する字幕ファイルの識別コードをクエリーし、取得した字幕ファイルの識別コードには、すでにアップロードされた字幕ファイルの識別コードを含んでいるか否かを探すことができる。含んでいない場合、1つの記録を追加し又は既存の記録を修正することができ、アップロードされた字幕ファイルの識別コードを追加することで、ビデオ字幕マッピングデータベースにビデオファイルと字幕ファイルのマッピング関係を1つ追加する。逆に、すでに含んでいる場合、他の操作を行わないのが良い。
【0040】
更に、アップロードされたビデオファイルの識別コード及び対応する字幕ファイルの識別コードを受信した後、更に字幕データベースにおいてアップロードされた字幕ファイルの識別コードに対応する字幕ファイルがあるか否かを検索することができる。
【0041】
字幕データベースは字幕ファイル自体及び例えば識別コード、バージョン、作者等、字幕ファイルに関連する他の情報を格納するために用いられる。アップロードされた字幕ファイルの識別コードに基づいて字幕データベースにおいて対応する字幕ファイルがあるか否かを検索することができる。
【0042】
対応する字幕ファイルが検索されなければ、下記ステップを行う。字幕ファイルのアップロード要請をクライアントに返信する。字幕ファイルのアップロード要請は予定の文字又は文字列を用いて表示することができる。クライアントが字幕ファイルのアップロード要請を受信した後、ユーザの設定によって字幕ファイルをアップロードするか否かを決定することができる。例えば、ユーザは、自動的に字幕ファイルをアップロードすることあ
るいは確認してから字幕ファイルをアップロードするように設定できる。字幕ファイルがクライアントによって字幕マッピングインタフェースサーバにアップロードされ、相応的に、字幕マッピングインタフェースサーバはクライアントからアップロードされた字幕ファイルを受信する。
【0043】
アップロードされた字幕ファイルを受信した後、字幕マッピングインタフェースサーバはそれを字幕データベースに格納する。このように、クライアントからのアップロードによって、字幕データベースの内容を拡充した。
【0044】
また、上記のクライアントからアップロードされた字幕ファイルを用いて字幕データベースの内容を拡充する以外、ネットワークにおいて字幕ファイルを主動的に抽出することもできる。
【0045】
字幕ファイルを主動的に抽出するステップは以下の通りである。ネットワークにおいて字幕ファイル情報を抽出する。例えば、字幕発行ウエブサイトにおける内容を抽出し、分析して例えばファイル名、ダウンロードリンク等の字幕ファイル情報を抽出する。該字幕ファイル情報に基づいて字幕ファイルをダウンロードし、ダウンロードされた字幕ファイル及び該字幕ファイル情報を字幕データベースに保存する。
【0046】
第3実施例は字幕処理方法を提供し、
図3に示すように、それは下記ステップを含み、
(ステップS310)、クライアントからアップロードされたビデオファイルの識別コードを受信する。ここでのクライアントが例えば上記電子装置である。電子装置がビデオファイルを再生する時、自機器で対応する字幕ファイルが検索されなければ、ビデオファイルの識別コードを字幕検索サーバにアップロードし、相応的に、字幕検索サーバがアップロードされたビデオファイルの識別コードを受信するステップS310。
【0047】
(ステップS320)、ビデオ字幕マッピングデータベースにおいて該識別コードに対応する字幕ファイルがあるか否かを検索する。
【0048】
ビデオ字幕マッピングデータベースには少なくともビデオファイルの識別コード及び対応する字幕ファイルの識別コードが保存され、各ビデオファイルの識別コードは複数の字幕ファイルの識別コードに対応できる。
【0049】
該識別コードに対応する字幕ファイルが検索された場合、ステップS330を行う。
(ステップS330)、字幕検索結果を該クライアントに返信する。
【0050】
字幕検索結果は検索された字幕ファイルのダウンロードリンク又は字幕ファイル自体を含むことができ、更に例えばファイル名、バージョン番号、翻訳者又は機構等他の説明情報を含むことができる。複数の字幕ファイルが検索できた場合、字幕検索結果は検索されたすべての字幕ファイルの情報を含むことができる。
【0051】
該識別コードに対応する字幕ファイルが検索されなければ、下記ステップを行う。
(ステップS340)、ビデオクラスタデータベースにおいて該識別コードと同じクラスタに含まれる他の識別コードを検索する。
【0052】
ビデオクラスタデータベースはビデオクラスタ結果を保存するためのデータベースである。同一クラスタに複数のビデオファイルが含まれてもいい。ビデオクラスタデータベースで検索を行うために、まずビデオクラスタデータベースを作成する必要があり、即ちステップS340の前に、ビデオファイルをクラスター分析してクラスタ結果を得て、且つクラスタ結果を該ビデオクラスタデータベースに保存することを更に含むことを理解する
であろう。
【0053】
ここでのビデオファイルがクラウドビデオストレージサーバからのものであってもよく、例えばオフラインダウンロードサービスではサーバ端に一時的に大量の原始ビデオファイルを保存し、ビデオクラスター分析を行ってビデオクラスタデータベースを充填する。ビデオファイルのもう1つのソースはクライアントからアップロードされたビデオセグメントであってもよく、この時、ビデオファイルの部分的な内容のみに基づいてクラスター分析を行うが、検索条件の一致性のために、クライアントがビデオファイル全体の識別コード、例えばハッシュコードを同時にアップロードすることが必要である。
【0054】
ビデオクラスタ技術に基づいて、ビデオ内容が同一のビデオファイルを同一クラスタに置くことができ、理論上、同一クラスタ内におけるビデオファイルが同じビデオ内容を有すべきであり、同じ字幕ファイルを共有できる。
【0055】
(ステップS350)、該ビデオ字幕マッピングデータベースにおいて該他の識別コードに対応する字幕ファイルがあるか否かを検索する。
【0056】
ステップS320に類似し、それぞれ各同一クラスタのビデオファイルの識別コードを用いてビデオ字幕マッピングデータベースにおいて対応する字幕ファイルを検索する。理解できるのは、このステップを通して、1つ又は複数の字幕ファイルが検索される可能性がある。
【0057】
(ステップS360)、ビデオ字幕マッピングデータベースで該他の識別コードに対応する字幕ファイルが検索された場合、該他の識別コードに対応する字幕ファイルを字幕検索結果として該クライアントに返信する。
【0058】
字幕検索結果には検索された字幕ファイルのダウンロードリンク又は字幕ファイル自体を含むことができが、更に例えばファイル名、バージョン番号、翻訳者又は機構等他の説明情報も含むことができる。複数の字幕ファイルが検索できた場合、字幕検索結果には検索されたすべての字幕ファイルの情報を含むことができる。
【0059】
クライアントが字幕検索結果を受信した後、検索された字幕ファイルをユーザに選択させるようにリストして表示し、ユーザが字幕ファイルを選定した後、字幕ファイルをロードして再生する。
【0060】
本実施例の字幕処理方法では、ビデオファイルに対応する字幕ファイルが直接に検索されなければ、更にビデオクラスタ結果によって拡張検索を達成し、字幕ファイルマッチングのヒット率を向上させる。
【0061】
第4実施例は字幕処理装置を提供し、該字幕処理装置が上記電子装置で実行される。
図4に示すように、該字幕処理装置は、字幕検索モジュール410及びマッピングアップロードモジュール420を備える。
【0062】
字幕検索モジュール410は自機器でカレントの再生ビデオファイルに対応する字幕ファイルがあるか否かを検索することに用いられる。一般的に、ビデオファイルは、字幕ファイルと一緒にダウンロードされ、同一ディレクトリに位置し、ビデオファイルと同じ名称、異なる拡張子を有する。従って、ビデオファイルを再生する時、ビデオファイルと同一ディレクトリで字幕ファイルがあるか否かを走査すればよい。もちろん、字幕ファイルの名称、ルートが上記に規制されなく、任意のディレクトリ下にあっても、任意のファイル名称であってもよい。
【0063】
マッピングアップロードモジュール420は、第1アップロードユニット421、第2アップロードユニット422、検索結果受信ユニット423、字幕ロードユニット424、及び第3アップロードユニット425を備える。
【0064】
第1アップロードユニット421は対応する字幕ファイルが検索された場合、該ビデオファイルの識別コード及び該字幕ファイルの識別コードを字幕マッピングインタフェースサーバにアップロードすることに用いられる。ビデオファイルの識別コード及び字幕ファイルの識別コードは例えばハッシュ(Hash)コードであり、もちろん本実施例がこれに限定されなく、他のアルゴリズムを用いて計算されるフィーチャーコードであってもよく、又は直接にビデオファイル及び字幕ファイルの名前を識別コードとしてもいい。
【0065】
第2アップロードユニット422は対応する字幕ファイルが検索されなければ、該ビデオファイルの識別コードを字幕検索サーバにアップロードすることに用いられる。ビデオファイルの識別コードは例えば上記ハッシュコードである。字幕検索サーバがビデオファイルの識別コードを受信した後、それを用いて対応する字幕ファイルを検索し、且つ相応な字幕検索結果を生成する。
【0066】
検索結果受信ユニット423は該字幕検索サーバから返信された字幕検索結果を受信することに用いられる。字幕検索結果は検索された字幕ファイルのダウンロードリンクを含むことができるが、更に例えばファイル名、バージョン番号等他の説明情報を含むことができる。且つ検索された字幕ファイルが複数個である可能性もあり、例えば異なる言語バージョンに対応する字幕ファイルである。
【0067】
字幕ロードユニット424は該字幕検索結果に基づいて選定された字幕をロードして再生することに用いられる。検索された字幕ファイルが1つだけであれば、直接にそれを用いて再生するが、字幕ファイルが複数個ある場合、ユーザが再生する字幕ファイルを選定することができる。
【0068】
第3アップロードユニット425は該選定された字幕ファイルを用いて再生が予定時間を超えた後、選定された字幕の識別コード及び該ビデオファイルの識別コードを該字幕マッピングインタフェースサーバにアップロードすることに用いられる。理解できるのは、ある字幕ファイルによる再生が予定時間を超えるなら、該字幕ファイルとカレントのビデオファイルがマッチングすることを表明し、この時、ビデオファイルと字幕ファイルのマッピング関係、即ちビデオファイルの識別コードと字幕ファイルの識別コードのペア関係を字幕マッピングインタフェースサーバにアップロードする。
【0069】
また、マッピングアップロードモジュール420は字幕アップロードユニット426を更に含むことができ、次のような操作に用いられる。対応する字幕ファイルが検索され且つ該字幕マッピングインタフェースサーバから字幕ファイルアップロード要請が返信された場合、ユーザの設定によって該字幕ファイルを該字幕マッピングインタフェースサーバにアップロードする。
【0070】
本実施例の字幕処理装置の詳細について、更に
図1及び関連説明を参照できる。
【0071】
本実施例の字幕処理装置では、自機器が確認したビデオファイルと字幕ファイルのペア関係を字幕マッピングインタフェースサーバにアップロードすることによって、ビデオ字幕マッピングデータベースのマッピング関係を豊富させ、字幕ファイルマッチング時のヒット率を向上させる。
【0072】
第5実施例は字幕処理システムを提供し、
図5に示すように、それはビデオファイルクラスタモジュール510、字幕検索モジュール520、字幕マッピング拡張モジュール530、字幕マッピングインタフェースモジュール540、字幕抽出モジュール550、及び字幕ダウンロードインタフェースモジュール560を備える。また、字幕処理システムはビデオクラスタデータベース501、ビデオ字幕マッピングデータベース502、及び字幕データベース503をさらに備える。本実施例では、該字幕処理システムは上記字幕検索サーバであってもよい。
【0073】
ビデオファイルクラスタモジュール510はビデオファイルにクラスター分析を行ってクラスタ結果を得て、クラスタ結果をビデオクラスタデータベース501に保存することに用いられる。ここでのビデオファイルはクラウドビデオストレージサーバからのものであってもよく、例えばオフラインダウンロードサービスがサーバ端に一時的に大量の原始ビデオファイルを保存し、ビデオクラスター分析を行ってビデオクラスタデータベースを充填できる。ビデオファイルのもう1つのソースはクライアントからアップロードされたビデオセグメントであってもよく、この時、ビデオファイルの一部の内容だけに基づいてクラスター分析を行うが、検索条件の一致性のために、クライアントがビデオファイル全体の識別コード、例えばハッシュコードを同時にアップロードすることが必要である。ビデオクラスタ技術に基づいて、ビデオ内容が同一のビデオファイルを同一クラスタに置くことができ、同一クラスタ中のビデオファイルが同じビデオ内容を有すべきであり、同じ字幕ファイルを共有できる。
【0074】
図6に示すように、字幕検索モジュール520は識別コード受信ユニット521、字幕検索ユニット522、及び検索結果返信ユニット523を備える。
【0075】
識別コード受信ユニット521はクライアントからアップロードされたビデオファイルの識別コードを受信することに用いられ、字幕検索ユニット522はビデオ字幕マッピングデータベースにおいて該識別コードに対応する字幕ファイルがあるか否かを検索することに用いられ、検索結果返信ユニット523は該識別コードに対応する字幕ファイルが検索された場合、字幕検索結果を該クライアントに返信することに用いられる。
【0076】
字幕マッピング拡張モジュール530は同一クラスタ中のビデオファイルの対応する字幕ファイルに基づいてビデオ字幕マッピングデータベースにおけるマッピング関係を拡張することに用いられる。例えばビデオファイルAとBがビデオファイルクラスタモジュール510によってクラスター分析をされた後、同一クラスタ内にあり、ビデオ字幕マッピングデータベース502において、ビデオファイルAは対応する字幕ファイルCを有するが、ビデオファイルBは対応する字幕ファイルを有しない。この時、クラスター分析結果に基づいて、ビデオ字幕マッピングデータベースを更新でき、それによりビデオファイルBも対応する字幕ファイルCを有させる。
【0077】
字幕マッピングインタフェースモジュール540はクライアントからアップロードされたビデオファイルの識別コード及び対応する字幕ファイルの識別コードを受信し、受信したビデオファイルの識別コード及び対応する字幕ファイルの識別コードをビデオ字幕マッピングデータベースに格納することに用いられる。
【0078】
アップロードされたビデオファイルの識別コード及び対応する字幕ファイルの識別コードを受信した後、まずビデオファイル識別コードを検索キーワードとしてビデオ字幕マッピングデータベースで対応する字幕ファイル識別コードをクエリーし、取得した字幕ファイル識別コードにおいてアップロードされ字幕ファイルの識別コードをすでに含んでいるか否かを探すことができる。含んでいない場合、1つの記録を追加し又は既存の記録を修正することができ、アップロードされた字幕ファイルの識別コードを追加することで、ビ
デオ字幕マッピングデータベースにおいてビデオファイルと字幕ファイルのマッピング関係を1つ追加する。逆に、すでに含んでいる場合、他の操作を行わないが良い。
【0079】
また、字幕マッピングインタフェースモジュール540は更にクライアントからアップロードされた字幕ファイルを受信し、受信した字幕ファイルを字幕データベース503に格納することに用いられる。
【0080】
字幕データベース503は字幕ファイル自体及び識別コード、バージョン、作者等字幕ファイルに関連する他の情報を格納することに用いられる。アップロードされた字幕ファイルの識別コードに基づいて字幕データベースにおいて対応する字幕ファイルがあるか否かを検索することができる。
【0081】
上記のアップロードされたビデオファイルの識別コード及び対応する字幕ファイルの識別コードを受信した後、検索された字幕ファイル識別コードにはアップロードされた字幕ファイルの識別コードを含んでいない場合、下記ステップを行う。該ステップにおいて、字幕ファイルアップロード要請をクライアントに返信する。字幕ファイルアップロード要請は予定の文字又は文字列を用いて表示することができる。クライアントが字幕ファイルアップロード要請を受信した後、ユーザの設定によって字幕ファイルをアップロードするか否かを決定することができる。例えば、ユーザは字幕ファイルを自動的にアップロードするあるいは確認してから字幕ファイルをアップロードするように設定できる。字幕ファイルがクライアントによって字幕マッピングインタフェースサーバにアップロードされ、相応的に、字幕マッピングインタフェースサーバがクライアントからアップロードされた字幕ファイルを受信する。
【0082】
アップロードされた字幕ファイルを受信した後、字幕マッピングインタフェースモジュール540がそれを字幕データベース503に格納する。このように、クライアントのアップロードによって、字幕データベース503の内容が拡充された。
【0083】
字幕抽出モジュール550はネットワークで字幕及び関連情報を抽出することに用いられ、具体的に、字幕発行ウエブサイトにおける内容を抽出し、分析して例えばファイル名、ダウンロードリンク等の字幕ファイル情報を抽出する。該字幕ファイル情報に基づいて字幕ファイルをダウンロードし、ダウンロードした字幕ファイル及び該字幕ファイル情報を字幕データベースに保存する。
【0084】
字幕ダウンロードインタフェースモジュール560はクライアントの字幕ファイルダウンロード要請を受信し、字幕データベース503から字幕ファイルの内容を読み取って、クライアントに返信することに用いられる。
【0085】
理解できるのは、上記ビデオファイルクラスタモジュール510、字幕検索モジュール520、字幕マッピング拡張モジュール530、字幕マッピングインタフェースモジュール540、字幕抽出モジュール550、及び字幕ダウンロードインタフェースモジュール560はそれぞれ独立のサーバであってもよく、同一サーバの異なる機能モジュールであってもよい。
【0086】
本実施例の字幕処理システムにおいて、字幕抽出モジュール550によってネットワークから字幕を抽出し、及び字幕マッピングインタフェースモジュール540によってクライアントからアップロードされた字幕又はビデオファイルと字幕ファイルのマッピング関係を受信し、字幕データベース503及びビデオ字幕マッピングデータベース502の内容を豊富させる。また、字幕マッピング拡張モジュール530によって、ビデオファイルクラスタ結果に基づいてビデオファイルと字幕ファイルのマッピング関係を拡張した。上
記技術的手段によって、本実施例の字幕処理システムでは字幕検索のヒット率を大幅に向上させることができる。
【0087】
第6実施例は字幕処理システムを提供し、第5実施例に近似、本実施例において、該字幕処理システムは上記字幕検索サーバであってもよい。
図5及び
図7に示すように、それが第5実施例と異なるところは、本実施例の字幕処理システムが字幕マッピング拡張モジュール530を備えなく、拡張検索モジュール570を備えることにある。字幕検索モジュール520がビデオ字幕マッピングデータベース502でアップロードされたビデオファイルの識別コードに対応する字幕ファイルが検索されなければ、拡張検索モジュール570を呼び出しする。
【0088】
拡張検索モジュール570は、ビデオファイルクラスタデータベース501でクライアントから字幕検索を要請されたビデオファイルの識別コードと同一クラスタにある他の識別コードを検索すること、それぞれ該ビデオ字幕マッピングデータベース502で該他の識別コードに対応する字幕ファイルがあるか否かを検索すること、且つ検索結果を字幕検索モジュール520に返信し、字幕検索モジュール520によって更に該他の識別コードに対応する字幕ファイルが字幕検索結果としてクライアントに返信されること、に用いられる。
【0089】
本実施例の字幕処理システムは、第5実施例に比べて、直接にビデオファイルクラスタ結果に基づいてビデオ字幕マッピングデータベースに拡張せず、具体的な字幕検索ニーズが発生してから拡張検索を行うことができ、同様に字幕検索ヒット率を向上させる目的を達成できる。
【0090】
また、本発明の実施例はコンピュータ可読記憶媒体をさらに提供し、その中にコンピュータで実行可能な命令が格納されており、上記コンピュータ可読記憶媒体は例えば光学ディスク、ハードディスク、又はフラッシュメモリのような非揮発性メモリである。上記コンピュータで実行可能な命令はコンピュータ又は類似の計算装置に上記字幕処理方法中の各操作を完成させることに用いられる。
【0091】
以上は、本発明の好ましい実施例だけであり、本発明に対していずれかの形式の限定ではなく、本発明では好ましい実施形態を前述の通り開示したが、これは本発明を限定するものではなく、当業者が、本発明の技術方案を離脱しない範囲内で、上記開示した技術内容に多少の変動や修飾を加えることが等同変化の等効実施例と見なされ、本発明技術方案の内容を離脱しない限り、本発明の技術により実質に上記実施例に対していずれかの簡単な修正や等同変化や修飾をしても、いずれも本発明技術方案の範囲に属する。