IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本放送協会の特許一覧

特開2023-162609字幕データ変換装置、字幕データ変換システム、及び字幕データ変換プログラム
<>
  • 特開-字幕データ変換装置、字幕データ変換システム、及び字幕データ変換プログラム 図1
  • 特開-字幕データ変換装置、字幕データ変換システム、及び字幕データ変換プログラム 図2
  • 特開-字幕データ変換装置、字幕データ変換システム、及び字幕データ変換プログラム 図3
  • 特開-字幕データ変換装置、字幕データ変換システム、及び字幕データ変換プログラム 図4
  • 特開-字幕データ変換装置、字幕データ変換システム、及び字幕データ変換プログラム 図5
  • 特開-字幕データ変換装置、字幕データ変換システム、及び字幕データ変換プログラム 図6
  • 特開-字幕データ変換装置、字幕データ変換システム、及び字幕データ変換プログラム 図7
  • 特開-字幕データ変換装置、字幕データ変換システム、及び字幕データ変換プログラム 図8
  • 特開-字幕データ変換装置、字幕データ変換システム、及び字幕データ変換プログラム 図9
  • 特開-字幕データ変換装置、字幕データ変換システム、及び字幕データ変換プログラム 図10
  • 特開-字幕データ変換装置、字幕データ変換システム、及び字幕データ変換プログラム 図11
  • 特開-字幕データ変換装置、字幕データ変換システム、及び字幕データ変換プログラム 図12
  • 特開-字幕データ変換装置、字幕データ変換システム、及び字幕データ変換プログラム 図13
  • 特開-字幕データ変換装置、字幕データ変換システム、及び字幕データ変換プログラム 図14
  • 特開-字幕データ変換装置、字幕データ変換システム、及び字幕データ変換プログラム 図15
  • 特開-字幕データ変換装置、字幕データ変換システム、及び字幕データ変換プログラム 図16
  • 特開-字幕データ変換装置、字幕データ変換システム、及び字幕データ変換プログラム 図17
  • 特開-字幕データ変換装置、字幕データ変換システム、及び字幕データ変換プログラム 図18
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023162609
(43)【公開日】2023-11-09
(54)【発明の名称】字幕データ変換装置、字幕データ変換システム、及び字幕データ変換プログラム
(51)【国際特許分類】
   H04N 21/235 20110101AFI20231101BHJP
【FI】
H04N21/235
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2022073051
(22)【出願日】2022-04-27
(71)【出願人】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】100106002
【弁理士】
【氏名又は名称】正林 真之
(74)【代理人】
【識別番号】100120891
【弁理士】
【氏名又は名称】林 一好
(72)【発明者】
【氏名】阿部 晋矢
(72)【発明者】
【氏名】藤井 翔子
(72)【発明者】
【氏名】小松 佑人
(72)【発明者】
【氏名】藤津 智
(72)【発明者】
【氏名】西本 友成
(72)【発明者】
【氏名】藤沢 寛
【テーマコード(参考)】
5C164
【Fターム(参考)】
5C164GA04
5C164MA06S
5C164MB01S
5C164SB06P
(57)【要約】
【課題】ARIB-TTMLで符号化された字幕データをIMSCの符号化方式の字幕データに変換することができる字幕データ変換装置、字幕データ変換システム、及び字幕データ変換プログラムを提供すること。
【解決手段】字幕データ変換装置は、ARIB-TTMLの符号化方式の字幕データを入力する入力部と、前記字幕データをIMSCの符号化方式の字幕データに変換する変換部と、変換された前記IMSCの符号化方式の字幕データと変換内容を記録したログファイルとを出力する出力部と、を備える。
【選択図】図1
【特許請求の範囲】
【請求項1】
ARIB-TTMLの符号化方式の字幕データを入力する入力部と、
前記字幕データをIMSCの符号化方式の字幕データに変換する変換部と、
変換された前記IMSCの符号化方式の字幕データと変換内容を記録したログファイルとを出力する出力部と、
を備える字幕データ変換装置。
【請求項2】
前記変換部は、前記ARIB-TTMLの符号化方式の字幕データのうちarib-tt:audio要素を削除し、及びarib-tt:border属性、arib-tt:letter-spacing属性、arib-tt:marquee属性のみを削除して前記IMSCの符号化方式の字幕データに変換する、請求項1に記載の字幕データ変換装置。
【請求項3】
前記変換部は、前記ARIB-TTMLの符号化方式の字幕データのうちarib-tt:font-face要素を、前記IMSCの符号化方式のfont要素とsource要素とに置き換えて前記IMSCの符号化方式の字幕データに変換する、請求項1又は請求項2に記載の字幕データ変換装置。
【請求項4】
前記変換部は、前記ARIB-TTMLの符号化方式の字幕データのうちarib-tt:keyframes要素及びarib-tt:animation属性を、前記IMSCの符号化方式のset要素に置き換えて前記IMSCの符号化方式の字幕データに変換する、請求項1又は請求項2に記載の字幕データ変換装置。
【請求項5】
前記変換部は、前記ARIB-TTMLの符号化方式の字幕データのうちarib-tt:text-shadow属性を、前記IMSCの符号化方式のtts:textShadow属性に置き換えて前記IMSCの符号化方式の字幕データに変換する、請求項1又は請求項2に記載の字幕データ変換装置。
【請求項6】
前記変換部は、前記ARIB-TTMLの符号化方式の字幕データからarib-tt:ruby属性を削除して前記IMSCの符号化方式の字幕データに変換する、請求項1又は請求項2に記載の字幕データ変換装置。
【請求項7】
請求項1又は請求項2に記載の字幕データ変換装置を備える字幕データ変換システム。
【請求項8】
ARIB-TTMLの符号化方式の字幕データを入力する入力ステップと、
前記字幕データをIMSCの符号化方式の字幕データに変換する変換ステップと、
前記IMSCの符号化方式に変換された字幕データと変換内容を記録したログファイルとを出力する出力ステップと、をコンピュータに実行させるための字幕データ変換プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ARIB-TTMLの符号化方式の字幕データからIMSCの符号化方式の字幕データに変換する字幕データ変換装置、字幕データ変換システム、及び字幕データ変換プログラムに関する。
【背景技術】
【0002】
従来より、テレビの放送番組やインターネットを経由した動画配信等のサービスが広く利用されている。これらの動画サービスではマルチメディアサービスを提供しており、主となる動画、音声データの他に、音声の発話情報等を補助、補完する字幕データを多く提供している。字幕データは映像や音声等とは別に、テキストデータの形で放送、配信され、テレビ受信機や動画配信サービスの専用アプリケーション等でコンテンツを再生する際、定められた提示時刻にしたがって映像や音声等と同期させながら表示を行う。
字幕データの方式は放送や通信、それぞれで標準規格が定められている。放送の標準規格としてはARIB(Association of Radio Industries and Business:一般社団法人電波産業会)により定められたARIB-TTMLがある(例えば、非特許文献1参照)。ARIB-TTMLは新衛星4K8K放送等広く利用されている。一方、通信の標準規格としてIMSC(TTML Profiles for Internet Media Subtitles and Captions)があげられる(例えば、非特許文献2参照)。IMSCはWorld Wide Web Consortium(W3C)により勧告された標準であり、最新のバージョンは1.2となっている。IMSCは主にインターネットでの動画配信向けに用意された標準であるが、放送での利用も広がっており米国のATSC 3.0では放送字幕の符号化方式としてIMSCを採用している(例えば、非特許文献3参照)。
ARIB-TTML及びIMSCはどちらもTimed Text Markup Language(TTML)(例えば、非特許文献4参照)をベースに拡張して規定、及び勧告された標準である。しかし、規定された時期や放送と通信というそれぞれの要件の違いから、異なる仕様となっている。異なる仕様は、互換性のない仕様と、機能として互換性があるが、記述方法が異なる仕様と、に分けられる。特許文献1には放送局で使用されるベースバンド信号に含まれる字幕データから放送と同時に通信用の字幕データをリアルタイムに生成する技術が開示されている。特許文献1に開示された発明はコンテンツを放送だけでなく、通信も含めて様々な配信方法で提供するために発明されたものである。一方で、出力対象にARIB-TTMLは含んでいるもののIMSCは考慮していない。放送コンテンツとして字幕をARIB-TTMLにより符号化したコンテンツ、通信コンテンツとして字幕をIMSCにより符号化したコンテンツが増加し、放送と通信でコンテンツ交換も多く行われている現在、異なる符号化同士を変換するための装置(システム、プログラム)が求められる。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2017-204695号公報
【非特許文献】
【0004】
【非特許文献1】ARIB STD-B62, デジタル放送におけるマルチメディア符号化方式(第2世代), 2.0版, 2018年10月.
【非特許文献2】TTML Profiles for Internet Media Subtitles and Captions 1.2, https://www.w3.org/TR/ttml-imsc1.2/
【非特許文献3】ATSC Standard: Captions and Subtitles, Doc. A/343:2022-02, ATSC, Washington, DC, Feb. 2022.
【非特許文献4】Timed Text Markup Language 1 (TTML1) (Third Edition), https://www.w3.org/TR/2018/REC-ttml1-20181108/
【発明の概要】
【発明が解決しようとする課題】
【0005】
前述の通り、異なる符号化方式であるARIB-TTMLとIMSCとの間で符号化された字幕データの変換が求められるが、従来はARIB-TTMLとIMSCとの間の変換を対象としておらず、ARIB-TTMLで符号化された字幕データを、IMSCの符号化方式のみ再生できる受信機へ配信しようと思った場合利用できなかった。
【0006】
本発明は、ARIB-TTMLで符号化された字幕データをIMSCの符号化方式の字幕データに変換することができる字幕データ変換装置、字幕データ変換システム、及び字幕データ変換プログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
(1)本発明の字幕データ変換装置は、ARIB-TTMLの符号化方式の字幕データを入力する入力部と、前記字幕データをIMSCの符号化方式の字幕データに変換する変換部と、変換された前記IMSCの符号化方式の字幕データと変換内容を記録したログファイルとを出力する出力部と、を備える。
【0008】
上記(1)によれば、ARIB-TTMLで符号化された字幕データをIMSCの符号化方式の字幕データに変換することができる。
【0009】
(2) (1)に記載の字幕データ変換装置によれば、前記変換部は、前記ARIB-TTMLの符号化方式の前記字幕データのうちarib-tt:audio要素を削除し、及びarib-tt:border属性、arib-tt:letter-spacing属性、arib-tt:marquee属性のみを削除して前記IMSCの符号化方式の字幕データに変換する。
【0010】
上記(2)によれば、ARIB-TTMLの符号化方式の字幕データのうちIMSCと互換性のない機能を削除することで、IMSCの符号化方式の字幕データに変換することができる。
【0011】
(3) (1)又は(2)の字幕データ変換装置によれば、前記ARIB-TTMLの符号化方式の前記字幕データのうちarib-tt:font-face要素を、前記IMSCの符号化方式のfont要素とsource要素とに置き換えて前記IMSCの符号化方式の字幕データに変換する。
【0012】
上記(3)によれば、ARIB-TTMLの符号化方式の字幕データのうちIMSCと互換性のある機能をIMSCの機能に置き換えることで、IMSCの符号化方式の字幕データに変換することができる。
【0013】
(4) (1)又は(2)の字幕データ変換装置によれば、前記ARIB-TTMLの符号化方式の前記字幕データのうちarib-tt:keyframes要素及びarib-tt:animation属性を、前記IMSCの符号化方式のset要素に置き換えて前記IMSCの符号化方式の字幕データに変換する。
【0014】
上記(4)によれば、(3)と同様の効果を奏することができる。
【0015】
(5) (1)又は(2)の字幕データ変換装置によれば、前記ARIB-TTMLの符号化方式の前記字幕データのうちarib-tt:text-shadow属性を、前記IMSCの符号化方式のtts:textShadow属性に置き換えて前記IMSCの符号化方式の字幕データに変換する。
【0016】
上記(5)によれば、(3)と同様の効果を奏することができる。
【0017】
(6) (1)又は(2)の字幕データ変換装置によれば、前記ARIB-TTMLの符号化方式の前記字幕データからarib-tt:ruby属性を削除して前記IMSCの符号化方式の字幕データに変換する。
【0018】
上記(6)によれば、ARIB-TTMLの符号化方式の字幕データのうちIMSCと互換性のある機能のうち表示に関連しない機能を削除することで、IMSCの符号化方式の字幕データに変換することができる。
【0019】
(7)本発明の字幕データ変換システムは、(1)又は(2)の字幕データ変換装置を備える。
【0020】
上記(7)によれば、(1)と同様の効果を奏することができる。
【0021】
(8)本発明の字幕データ変換プログラムは、ARIB-TTMLの符号化方式の字幕データを入力する入力ステップと、前記字幕データをIMSCの符号化方式の字幕データに変換する変換ステップと、前記IMSCの符号化方式に変換された前記字幕データと変換内容を記録したログファイルとを出力する出力ステップと、をコンピュータに実行させるための字幕データ変換プログラム。
【0022】
上記(8)によれば、(1)と同様の効果を奏することができる。
【発明の効果】
【0023】
本発明によれば、ARIB-TTMLで符号化された字幕データをIMSCの符号化方式の字幕データに変換することができる。
【図面の簡単な説明】
【0024】
図1】一実施形態に係る字幕データ変換装置の構成の一例を示す図である。
図2】ARIB-TTMLについてIMSCと互換性のない機能及び変換処理内容の一例を示す図である。
図3】IMSCと互換性のない機能を含むARIB-TTMLファイルの一例を示す図である。
図4図3のARIB-TTMLファイルから変換されたIMSCファイルの一例を示す図である。
図5】ARIB-TTMLについてIMSCと互換性のある機能と変換処理内容の一例を示す図である。
図6】arib-tt:font-face要素を持つARIB-TTMLファイルの一例を示す図である。
図7図6のARIB-TTMLファイルから変換されたIMSCファイルの一例を示す図である。
図8】arib-tt:keyframes要素及びarib-tt:animation属性を持つARIB-TTMLファイルの一例を示す図である。
図9図8のARIB-TTMLファイルから変換されたIMSCファイルの一例を示す図である。
図10】arib-tt:text-shadow属性を持つARIB-TTMLファイルの一例を示す図である。
図11図10のARIB-TTMLファイルから変換されたIMSCファイルの一例を示す図である。
図12】字幕データ変換装置の変換処理について説明するフローチャートである。
図13図12においてステップS1で示した入力処理の詳細な処理内容を説明するフローチャートである。
図14図12においてステップS2で示した変換処理の詳細な処理内容を説明するフローチャートである。
図15図14においてステップS22で示したIMSCと互換性のある機能の変換処理の詳細な処理内容を説明するフローチャートである。
図16図15においてステップS221で示したarib-tt:font-face要素に対する変換処理の詳細な処理内容を説明するフローチャートである。
図17図15においてステップS222で示したarib-tt:keyframes要素及びarib-tt:animation属性に対する変換処理の詳細な処理内容を説明するフローチャートである。
図18図15においてステップS223で示したarib-tt:text-shadow属性に対する変換処理の詳細な処理内容を説明するフローチャートである。
【発明を実施するための形態】
【0025】
以下、本発明の一実施形態について図面を用いて説明する。
<一実施形態>
図1は、一実施形態に係る字幕データ変換装置の構成の一例を示す図である。
図1に示すように、字幕データ変換システムとしての字幕データ変換装置10は、例えば、コンピュータ等であり、制御部100を有する。また、制御部100は、入力部110、変換部120、及び出力部130を有する。
【0026】
制御部100は、CPU、ROM、RAM、CMOSメモリ等を有し、これらはバスを介して相互に通信可能に構成される、当業者にとって公知のものである。
CPUは字幕データ変換装置10を全体的に制御するプロセッサである。CPUは、ROMに格納されたシステムプログラム及び字幕データ変換プログラム等のアプリケーションプログラムを、バスを介して読み出し、システムプログラム及びアプリケーションプログラムにしたって字幕データ変換装置10全体を制御する。これにより、図1に示すように、制御部100は、入力部110、変換部120、及び出力部130の機能を実現するように構成される。RAMには一時的な計算データや表示データ等の各種データが格納される。CMOSメモリは図示しないバッテリでバックアップされ、字幕データ変換装置10の電源がオフされても記憶状態が保持される不揮発性メモリとして構成される。
【0027】
入力部110は、例えば、外部から入力される放送信号を取り込み、取得した放送信号から字幕データを抽出する。放送信号は、SDI(Serial Digital Interface)で字幕データ変換装置10に伝送されてくる。SDIは、放送用機器に用いられる標準的なインターフェースである。放送信号の形式は、ARIBで策定された標準規格に基づくものである。字幕データも、ARIBの規定にしたがって、ARIB-TTMLファイルに符号化されたデータであって入力される放送信号に重畳されている。
入力部110は、入力された字幕データがARIB-TTMLファイルか否かを判定する。具体的には、入力部110は、字幕データがARIB-TTMLファイルか否かの判定を、入力された字幕データの記述内容から判定する。すなわち、ARIB-TTMLファイルはXMLで記述され、使用される語彙についてARIB-TTMLの名前空間を指定している。このため、字幕データが例えばIMSC等の名前空間を指定している場合、入力部110は、ARIB-TTMLファイルでないことを容易に判定することができる。
入力部110は、入力された字幕データがARIB-TTMLファイルである場合、当該ARIB-TTMLファイルと変換を開始する旨を記載したログファイルとを後述する変換部120に出力する。一方、入力部110は、字幕データがARIB-TTMLファイルでない場合、変換対象外であることを示すエラーメッセージを出力するとともに、変換対象外であることをログファイルに記録し、変換処理を実施せず終了する。
【0028】
なお、ARIB-TTMLファイルの拡張子がARIB-TTMLファイルであることを示す場合には、入力部110は、拡張子に基づいて入力された字幕データがARIB-TTMLファイルか否かを判定してもよい。
また、放送事業者により字幕データがARIB-TTMLファイルで固定されている場合には、入力部110は、当該放送事業者からの字幕データについてARIB-TTMLファイルか否かを判定することなく、後述する変換部120に出力するようにしてもよい。
【0029】
変換部120は、入力された字幕データ(ARIB-TTMLファイル)をIMSCの符号化方式の字幕データ(IMSCファイル)に変換する。
具体的には、ARIB-TTMLの符号化方式とIMSCの符号化方式とは互いに異なる仕様となっていることから、変換部120は、ARIB-TTMLファイルのうち機能として互換性のない仕様と、機能として互換性があるが記述方法が異なる仕様と、に分ける。
図2は、ARIB-TTMLについてIMSCと互換性のない機能及び変換処理内容の一例を示す図である。
図2に示すように、IMSCと互換性のないARIB-TTMLの機能には、XMLのタグとして提供されるarib-tt:audio要素と、XMLのタグすなわち要素内の属性値として提供されるarib-tt:border属性、arib-tt:letter-spacing属性、及びarib-tt:marquee属性がある。
そこで、変換部120は、IMSCと互換性のないarib-tt:audio要素をそのまま削除し、IMSCと互換性のないarib-tt:border属性、arib-tt:letter-spacing属性、及びarib-tt:marquee属性について当該属性のみを削除して要素そのものを残すことで、IMSCファイルに変換する。そして、変換部120は、IMSCと互換性のない仕様で記述され削除した箇所についてログファイルに記録し保存する。
図3は、IMSCと互換性のない機能を含むARIB-TTMLファイルの一例を示す図である。図4は、図3のARIB-TTMLファイルから変換されたIMSCファイルの一例を示す図である。
図3に示すように、ARIB-TTMLファイルには、arib-tt:audio要素とarib-tt:border属性とが含まれている。変換部120は、図4に示すように、arib-tt:audio要素を削除するとともに、arib-tt:border属性のみを削除して要素そのものを残してIMSCファイルに変換している。
【0030】
図5は、ARIB-TTMLについてIMSCと互換性のある機能と変換処理内容の一例を示す図である。
図5に示すように、IMSCと互換性のあるARIB-TTMLの機能には、arib-tt:font-face要素、arib-tt:keyframes要素、arib-tt:animation属性、arib-tt:text-shadow属性、及びarib-tt:ruby属性がある。
例えば、arib-tt:font-face要素の場合、当該要素の内部にsource要素を持ち、source要素内で指定されるformatには「woff」と「svg」とがあるが、IMSCと互換性のあるのは「woff」のみである。また、ARIB-TTMLのarib-tt:font-face要素とIMSCのfont要素とは各要素名、属性名、属性値等が1対1の関係にあるため、該当の値へ置き換えることが可能である。そこで、変換部120は、formatが「woff」の場合、ARIB-TTMLのarib-tt:font-face要素をIMSCのfont要素とsource要素とに置き換えることで、ARIB-TTMLファイルをIMSCファイルに変換する。一方、変換部120は、formatが「svg」の場合、arib-tt:font-face要素を削除し、エラーメッセージをログファイルに記録する。
図6は、arib-tt:font-face要素を持つARIB-TTMLファイルの一例を示す図である。図7は、図6のARIB-TTMLファイルから変換されたIMSCファイルの一例を示す図である。
図7に示すように、変換部120は、ARIB-TTMLのarib-tt:font-face要素をIMSCのfont要素とsource要素とに置き換えている。
【0031】
また、ARIB-TTMLでアニメーションを記述するarib-tt:keyframes要素及びarib-tt:animation属性の場合、arib-tt:keyframes要素及びarib-tt:animation属性は一部IMSCと互換性があり、変換部120は、IMSCのset要素へ置き換える。具体的には、変換部120は、ARIB-TTMLのarib-tt:animation属性の値として記述される<animation-timing-function>のうち、「step-end」のみ変換が可能であり、他の値について動作が異なるため完全な変換とはならないが、「step-end」として変換を実施する。また、変換部120は、ARIB-TTMLファイルにおけるarib-tt:keyframes要素及びarib-tt:animation属性から各ステップの開始時間、繰り返し回数、遅延を取得し、IMSCのset要素へ置き換える。
図8は、arib-tt:keyframes要素及びarib-tt:animation属性を持つARIB-TTMLファイルの一例を示す図である。図9は、図8のARIB-TTMLファイルから変換されたIMSCファイルの一例を示す図である。
図8に示すように、ARIB-TTMLファイルは、「フラッシング」という文字色を、10秒から20秒の間、1秒毎に黒から白、白から黒へ変更する字幕データである。すなわち、ARIB-TTMファイルの「<style xml:id="s1" arib-tt:animation="blink 2000ms step-end 0ms 5 normal"/>」では、2秒間(2000ms)のblankを5回繰り返すことが指定されている。animationName=”blink”であるarib-tt:keyframes要素にて、50%の時間(すなわち1秒)経過後文字色を白にし、100%の時間(すなわち2秒)経過後文字色を黒にすることが指定されている。
この場合、変換部120は、図8のARIB-TTMLファイルから、1秒(1000ms)毎に10秒(10000ms)まで文字色を白、黒と繰り返すIMSCで利用可能なset要素に置き換えることで、図9のIMSCファイルに変換する。
【0032】
また、arib-tt:text-shadow属性の場合、ARIB-TTMLのarib-tt:text-shadow属性とIMSCのtts:textShadow属性は属性名、属性値等が1対1の関係にあるため、変換部120は、該当の値へ置き換えることが可能である。
図10は、arib-tt:text-shadow属性を持つARIB-TTMLファイルの一例を示す図である。図11は、図10のARIB-TTMLファイルから変換されたIMSCファイルの一例を示す図である。
図11に示すように、変換部120は、ARIB-TTMLのarib-tt:text-shadow属性をIMSCのtts:textShadow属性に置き換える。
【0033】
最後に、arib-tt:ruby属性の場合、arib-tt:ruby属性はルビの位置を示す属性であり、表示には関連しないため、変換部120は、ARIB-TTMLファイルからarib-tt:ruby属性を削除し、IMSCファイルに変換する。
【0034】
出力部130は、例えば、IMSCの符号化方式に変換された字幕データと変換内容を記録したログファイルとを出力する。
具体的には、出力部130は、変換されたIMSCファイルを、配信される動画とともにインターネット等の図示しないネットワークに出力するようにしてもよい。また、出力部130は、変換内容を記録したログファイルを図示しないネットワーク上に配置されたデータサーバ(図示しない)等に出力するようにしてもよい。
【0035】
<字幕データ変換装置10の変換処理>
次に、図12を参照しながら、字幕データ変換装置10の変換処理の流れを説明する。
図12は、字幕データ変換装置10の変換処理について説明するフローチャートである。ここで示すフローは、ARIB-TTMLの符号化方式の字幕データが入力されている間、繰り返し実行される。
【0036】
ステップS1において、入力部110は、外部から入力される放送信号を取り込み、当該放送信号に重畳された字幕データを入力し、入力された字幕データがARIB-TTMLファイルか否かを判定する入力処理を実行し、入力された字幕データがARIB-TTMLファイルの場合、ARIB-TTMLファイルを変換部120に出力し、入力された字幕データがARIB-TTMLファイルでない場合、ステップS1で待機する。なお、入力処理の詳細なフローについては、後述する。
【0037】
ステップS2において、変換部120は、ステップS1で入力されたARIB-TTMLファイルに対して変換処理を実行し、IMSCファイルに変換する。なお、変換処理の詳細なフローについては、後述する。
【0038】
ステップS3において、出力部130は、ステップS2で変換されたIMSCファイルと、変換内容を記録したログファイルとを出力する。
【0039】
図13は、図12においてステップS1で示した入力処理の詳細な処理内容を説明するフローチャートである。
【0040】
ステップS11において、入力部110は、入力された字幕データがARIB-TTMLファイルか否かを判定する。入力された字幕データがARIB-TTMLファイルの場合、処理はステップS12に進む。一方、入力された字幕データがARIB-TTMLファイルでない場合、処理はステップS14に進む。
【0041】
ステップS12において、入力部110は、ARIB-TTMLファイルとしてIMSCファイルに変換することをログファイルに記録する。
【0042】
ステップS13において、入力部110は、ARIB-TTMLファイルとログファイルとを変換部120に出力し、処理は図12のステップS2に進む。
【0043】
ステップS14において、入力部110は、入力された字幕データがARIB-TTMLファイルでないことをログファイルに記録する。
【0044】
ステップS15において、入力部110は、エラーである旨とログファイルとを出力し、処理は図12のステップS1で待機する。
【0045】
図14は、図12においてステップS2で示した変換処理の詳細な処理内容を説明するフローチャートである。
【0046】
ステップS21において、変換部120は、ARIB-TTMLファイルに対してIMSCと互換性のない機能の変換処理を実行し、IMSCと互換性のないarib-tt:audio要素をそのまま削除し、IMSCと互換性のないarib-tt:border属性、arib-tt:letter-spacing属性、及びarib-tt:marquee属性について当該属性のみを削除して要素そのものを残すことで、IMSCファイルに変換する。
【0047】
ステップS22において、変換部120は、ARIB-TTMLファイルに対してIMSCと互換性のある機能の変換処理を実行し、IMSCファイルに変換する。なお、IMSCと互換性のある機能の変換処理の詳細なフローについては、後述する。
【0048】
図15は、図14においてステップS22で示したIMSCと互換性のある機能の変換処理の詳細な処理内容を説明するフローチャートである。
【0049】
ステップS221において、変換部120は、ARIB-TTMLファイルに対してIMSCと互換性のある機能arib-tt:font-face要素に対する変換処理を実行し、IMSCファイルに変換する。なお、arib-tt:font-face要素に対する変換処理の詳細なフローについては、後述する。
【0050】
ステップS222において、変換部120は、ARIB-TTMLファイルに対してIMSCと互換性のある機能arib-tt:keyframes要素及びarib-tt:animation属性に対する変換処理を実行し、IMSCファイルに変換する。なお、arib-tt:keyframes要素及びarib-tt:animation属性に対する変換処理の詳細なフローについては、後述する。
【0051】
ステップS223において、変換部120は、ARIB-TTMLファイルに対してIMSCと互換性のある機能arib-tt:text-shadow属性に対する変換処理を実行し、IMSCファイルに変換する。なお、arib-tt:text-shadow属性に対する変換処理の詳細なフローについては、後述する。
【0052】
ステップS224において、変換部120は、ARIB-TTMLファイルに対してIMSCと互換性のある機能arib-tt:ruby属性を削除してIMSCファイルに変換し、arib-tt:ruby属性の削除をログファイルに記録する。処理は、図12のステップS3に進む。
【0053】
図16は、図15においてステップS221で示したarib-tt:font-face要素に対する変換処理の詳細な処理内容を説明するフローチャートである。
【0054】
ステップS2211において、変換部120は、arib-tt:font-face要素のformatが「woff」か否かを判定する。formatが「woff」の場合、処理はステップS2212に進む。一方、formatが「woff」でない、すなわちformatが「svg」の場合、処理はステップS2214に進む。
【0055】
ステップS2212において、変換部120は、ARIB-TTMLの「arib-tt:font-face」をIMSCの「font」に、ARIB-TTMLの「font-family」をIMSCの「family」に、ARIB-TTMLの「unicode-range」をIMSCの「range」に、ARIB-TTMLの「arib-tt:src」をIMSCの「source」に、ARIB-TTMLの「url」をIMSCの「src」に、ARIB-TTMLの「format」をIMSCの「type」に、ARIB-TTMLの「woff」をIMSCの「font/woff」にそれぞれ置き換え、IMSCファイルに変換する。
【0056】
ステップS2213において、変換部120は、arib-tt:font-face要素に対する変換処理をログファイルに記録する。そして、処理は図15のステップS222に進む。
【0057】
ステップS2214において、変換部120は、arib-tt:font-face要素を削除し、エラーメッセージをログファイルに記録する。そして、処理は図15のステップS222に進む。
【0058】
図17は、図15においてステップS222で示したarib-tt:keyframes要素及びarib-tt:animation属性に対する変換処理の詳細な処理内容を説明するフローチャートである。
【0059】
ステップS2221において、変換部120は、arib-tt:animation属性の<animation-timing-function>が「step-end」か否かを判定する。<animation-timing-function>が「step-end」の場合、処理はステップS2222に進む。一方、<animation-timing-function>が「step-end」でない場合、処理はステップS2225に進む。
【0060】
ステップS2222において、変換部120は、arib-tt:keyframes要素及びarib-tt:animation属性から開始時間Dk、繰り返し回数i、遅延dそれぞれを取得する。
【0061】
ステップS2223において、変換部120は、各要素をDk+dを開始時間としi回繰り返すようにIMSCのset要素に置き換える。
【0062】
ステップS2224において、変換部120は、arib-tt:keyframes要素及びarib-tt:animation属性に対する変換処理をログファイルに記録する。そして、処理は図15のステップS223に進む。
【0063】
ステップS2225において、変換部120は、「step-end」として変換する旨を警告としてログファイルに記録する。
【0064】
図18は、図15においてステップS223で示したarib-tt:text-shadow属性に対する変換処理の詳細な処理内容を説明するフローチャートである。
【0065】
ステップS2231において、変換部120は、arib-tt:text-shadow属性をIMSCのtts:textShadow属性に置き換える。
【0066】
ステップS2232において、変換部120は、arib-tt:text-shadow属性に対する変換処理をログファイルに記録する。そして、処理は図15のステップS224に進む。
【0067】
以上により、一実施形態に係る字幕データ変換装置10は、ARIB-TTMLファイルのうちIMSCと互換性のない機能については削除し、IMSCと互換性のある機能については対応するIMSCの機能に置き換えることにより、ARIB-TTMLで符号化された字幕データをIMSCの方式の字幕データに変換することができる。
また、字幕データ変換装置10は、主にテレビ等のデジタル放送向けの字幕データの符号化方式であるARIB-TTMLから、通信配信向けの字幕データの符号化方式であるIMSCヘ字幕データを変換することで、放送向けに作成したコンテンツの字幕データを、通信配信向けへ容易に再利用可能となる。
【0068】
以上、一実施形態について説明したが、字幕データ変換装置10は、上述の実施形態に限定されるものではなく、目的を達成できる範囲での変形、改良等を含む。
【0069】
<変形例>
一実施形態では、字幕データ変換装置10は、外部の放送用機器(図示しない)と異なる装置としたが、これに限定されない。例えば、字幕データ変換装置10は、放送用機器に含まれてもよい。
【0070】
なお、一実施形態における字幕データ変換装置10に含まれる各機能は、ハードウェア、ソフトウェア又はこれらの組み合わせによりそれぞれ実現することができる。ここで、ソフトウェアによって実現されるとは、コンピュータがプログラムを読み込んで実行することにより実現されることを意味する。
【0071】
プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(Non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(Tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えば、フレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば、光磁気ディスク)、CD-ROM(Read Only Memory)、CD-R、CD-R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM)を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(Transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は、無線通信路を介して、プログラムをコンピュータに供給できる。
【0072】
なお、記録媒体に記録されるプログラムを記述するステップは、その順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
【符号の説明】
【0073】
10 字幕データ変換装置
100 制御部
110 入力部
120 変換部
130 出力部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18