(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-01-31
(45)【発行日】2022-02-08
(54)【発明の名称】動画圧縮方法
(51)【国際特許分類】
H04N 19/114 20140101AFI20220201BHJP
H04N 19/137 20140101ALI20220201BHJP
H04N 19/172 20140101ALI20220201BHJP
H04N 19/20 20140101ALI20220201BHJP
【FI】
H04N19/114
H04N19/137
H04N19/172
H04N19/20
(21)【出願番号】P 2017148553
(22)【出願日】2017-07-31
【審査請求日】2020-07-17
(73)【特許権者】
【識別番号】518407272
【氏名又は名称】株式会社Free-D
(74)【代理人】
【識別番号】100205659
【氏名又は名称】齋藤 拓也
(74)【代理人】
【識別番号】100145713
【氏名又は名称】加藤 竜太
(74)【代理人】
【識別番号】100203105
【氏名又は名称】江口 能弘
(74)【代理人】
【識別番号】110001612
【氏名又は名称】きさらぎ国際特許業務法人
(72)【発明者】
【氏名】横内 直人
【審査官】岩井 健二
(56)【参考文献】
【文献】特表2011-514120(JP,A)
【文献】特開2011-239255(JP,A)
【文献】特開2002-010270(JP,A)
【文献】特開平10-304374(JP,A)
【文献】特開平09-051538(JP,A)
【文献】特開平07-135657(JP,A)
【文献】米国特許出願公開第2015/0208072(US,A1)
【文献】米国特許出願公開第2011/0069757(US,A1)
【文献】米国特許出願公開第2005/0147167(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00 - 19/98
(57)【特許請求の範囲】
【請求項1】
複数の被圧縮フレームを含む被圧縮動画の情報量を圧縮する動画圧縮方法であって、
前記被圧縮動画中の複数のオブジェクトそれぞれを静的オブジェクトと動的オブジェクトに分離し、
被圧縮フレーム群の先頭フレームが、必ずシーンの切り換えの直後のフレームとなるように、前記被圧縮動画のシーンの切り換えを検出して、前記被圧縮動画をシーン毎に分割して、複数の被圧縮フレーム群を生成し、
前記被圧縮フレーム群の先頭に位置する被圧縮フレームをIフレームとして抽出し、
前記動的オブジェクトの画像の変化量が閾値以上となる前記被圧縮フレームを検出し、この被圧縮フレームに基づいてPフレームを生成し、
前記Iフレームと前記Pフレームの間の1以上の前記被圧縮フレームそれぞれに基づいて1以上のBフレームを生成する
ことを特徴とする動画圧縮方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、動画圧縮方法に関する。
【背景技術】
【0002】
複数の被圧縮フレーム(静止画)を含む被圧縮動画の情報量を圧縮する動画圧縮方法が知られている。
【0003】
例えば、
図13に例示する通り、情報量が圧縮されていない動画は、複数のIフレーム(Intra-Picture)を含む。Iフレームは、動画中の1フレームを独立して再現可能なフレームであり、動画中のフレームの画像情報を全て含んでいる。
【0004】
図14に例示する通り、従来の動画圧縮方法によって圧縮された動画は、一定の間隔で配置された複数のIフレーム及びこれらIフレームの間にそれぞれ配置された複数のPフレーム(Predictive-Picture)を含む。Pフレームは、直前のIフレームを参照して動画中の1フレームを再現可能なフレームであり、被圧縮フレームと、この被圧縮フレームに対応する予測フレームとの差分の画像情報を含んでいる。Pフレームは、この様な差分の画像情報のみを含むため、Iフレームよりも情報量が少ない。従って、
図14に例示された動画は、
図13に例示された動画よりも情報量が少ない。
【0005】
図15に例示する通り、従来の動画圧縮方法によって更に圧縮された動画は、GOP(Group Of Pictures)と呼ばれる複数のフレーム群に分割されており、一つのGOPに、一のIフレーム、一定の間隔で配置された複数のPフレーム、及び、これらIフレーム及びPフレームの間に配置された複数のBフレーム(Bi-directionally Predictive-Picture)を含む。Bフレームは、このBフレームの前後に位置するIフレーム及びPフレームを参照して動画中の1フレームを再現可能なフレームであり、動画中のフレームと予測フレームとの差分の画像情報を含んでいる。Bフレームの生成に際しては、直前のIフレームだけでなく、Bフレームの前後に位置するPフレームをも参照して予測画像が生成される。従って、Pフレームの生成に際して行われる予測よりも予測の精度が高くなり、予測フレームと被圧縮フレームとの差分はPフレームよりも少なくなる。このため、この差分に基づいて生成されるBフレームは、Pフレームよりも情報量が少ない。従って、
図15に例示されたGOPは、
図14に例示されたフレーム群よりも更に情報量が少ない。
【先行技術文献】
【特許文献】
【0006】
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、近年の動画における高画質化等に伴うデータ量の増大や、インターネット上で流通するデータ量の増大等に伴い、情報量の更なる圧縮が求められている。
【0008】
そこで、本発明は、この様な課題に鑑み、情報量を効率良く圧縮可能な動画圧縮方法を提供することを目的とする。
【課題を解決するための手段】
【0009】
以上の目的を達成するため、本発明に係る動画圧縮方法は、複数の被圧縮フレームを含む被圧縮動画の情報量を圧縮する。また、この動画圧縮方法は、被圧縮動画中の複数のオブジェクトそれぞれを静的オブジェクトと動的オブジェクトに分離し、複数の被圧縮フレームからIフレームを抽出し、動的オブジェクトの画像の変化量が閾値以上となる被圧縮フレームを検出し、この被圧縮フレームに基づいてPフレームを生成し、IフレームとPフレームの間の1以上の被圧縮フレームそれぞれに基づいて1以上のBフレームを生成する。
【0010】
この様な方法においては、一定の間隔でPフレームを配置するのではなく、被圧縮動画中の動的オブジェクトの画像の変化量が閾値以上となるフレームを検出することにより、Pフレームが必要なフレームにのみ適切にPフレームが配置される。また、IフレームとPフレームの間の1以上の被圧縮フレームそれぞれに基づいて1以上のBフレームを生成することにより、従来はPフレームが配置されていたようなフレームにもBフレームが配置され、Pフレームの数が削減される。ここで上述の通り、Bフレームは、Pフレームよりも情報量が少ない。従って、本発明に係る画像圧縮方法によれば、従来の画像圧縮方法よりも更に情報量が圧縮される。
【発明の効果】
【0011】
以上の様に、本発明によれば、情報量を効率良く圧縮可能な動画圧縮方法を提供することが出来る。
【図面の簡単な説明】
【0012】
【
図1】本発明の実施形態に係る動画圧縮装置100の構成を示す機能ブロック図である。
【
図2】本発明の実施形態に係る動画圧縮方法を示すフローチャートである。
【
図3】被圧縮動画200について説明するための模式的な図である。
【
図4】動的オブジェクトの変化前の画像を示す図である。
【
図5】動的オブジェクトの変化後の画像を示す図である。
【
図6】抽出された動的オブジェクトの画像を示す図である。
【
図7】被圧縮動画200について説明するための模式的な図である。
【
図10】圧縮動画300について説明するための模式的な図である。
【
図11】圧縮動画300について説明するための模式的な図である。
【
図12】本発明の実施形態に係る動画圧縮方法によって生成された圧縮動画の情報量を示すグラフである。
【
図14】従来の動画圧縮方法によって生成された圧縮動画の情報量を示すグラフである。
【
図15】従来の動画圧縮方法によって生成された圧縮動画の情報量を示すグラフである。
【発明を実施するための形態】
【0013】
次に、図面を参照し、本発明の実施形態について説明する。尚、以下の説明は例示的なものであり、詳細については適宜変更可能である。
【0014】
まず、
図1を参照して、本実施形態に係る動画圧縮装置100について説明する。動画圧縮装置100は、被圧縮動画200の情報量を圧縮して圧縮動画300を生成するものであり、被圧縮動画200に分割処理を行って複数の被圧縮フレーム(静止画)からなる被圧縮フレーム群を複数出力する分割処理装置110と、この被圧縮フレーム群に圧縮処理を施してGOPを複数出力する並列分散圧縮処理装置120と、この複数のGOPを統合して圧縮動画を生成する統合処理装置130と、を備える。尚、ここで言う被圧縮動画200は、
図13に例示した様な非圧縮動画でも良く、
図14や
図15に例示した様な、圧縮済みの動画であっても良い。また、動画圧縮装置100中の各構成は、装置や電子回路等によって実現されても良いし、CPUやGPU及びソフトウェア等によって実現されても良い。
【0015】
尚、並列分散圧縮処理装置120は、後述の通り、被圧縮フレーム群毎にオブジェクトの動きを検出し、時間軸方向にも圧縮処理を行う。
【0016】
次に、
図2~
図11を参照して、本発明の実施形態に係る動画圧縮方法について説明する。
【0017】
分割処理装置110は、被圧縮動画200を読み込む(ステップS101)。
図3に示す通り、被圧縮動画200は、複数の被圧縮フレーム210を含む。
【0018】
次に、分割処理装置110は、被圧縮動画200のシーンの切り換え等を検出し、被圧縮動画200をシーンごとに分割して、複数の被圧縮フレーム群を生成する(ステップS102)。シーンの切り換えの検出は、例えば、背景や登場人物等のオブジェクトの切り換え等、画面が大きく変化する瞬間を検出することによって行われる。また、分割処理装置110は、被圧縮フレーム群毎に複数の被圧縮フレーム210を出力する。
【0019】
次に、並列分散圧縮処理装置120は、被圧縮フレーム群毎に静的オブジェクト及び動的オブジェクトの分離を行う(ステップS103)。例えば
図4に例示する被圧縮フレームには、飛行機320と、背景330とが表示されている。以下、飛行機320の様に背景に対して相対的に動くものを「動的オブジェクト」と、ビル、道路、地面及び空等の用に背景330に対して固定されたものを「静的オブジェクト」と呼ぶ。静的オブジェクト及び動的オブジェクトの分離に際しては、例えば、被圧縮フレーム群にモーション・トラッキング等の処理を行い、被圧縮フレーム群中のオブジェクトのうち、所定の閾値よりも動きの少ないものを静的オブジェクトと、この所定の閾値よりも動きの大きいものを動的オブジェクトとして、フレーム群から分離する。例えば、
図4に例示した様な、動的オブジェクトの移動前の被圧縮フレーム210と、
図5に例示した様な、動的オブジェクトの移動後の被圧縮フレーム210とを比較して、飛行機320を動的オブジェクトと、それ以外の背景330を静的オブジェクトとして分離する。
図6は、動的オブジェクトとして分離された飛行機320の画像を例示する。
【0020】
次に、並列分散圧縮処理装置120は、Iフレーム(Intra-Picture)の抽出を行う(ステップS104)。Iフレームは、動画中の1フレームを独立して再現可能なフレームであり、
図4に例示する通り、動画中のフレームの画像情報を全て含んでいる。例えば、
図7に示す通り、被圧縮フレーム群の先頭に位置する被圧縮フレーム210はIフレームとして抽出され、出力される。
【0021】
次に、並列分散圧縮処理装置120は、Pフレーム(Predictive-Picture)を生成する(ステップS105)。Pフレームは、直前のIフレームを参照して動画中の1フレームを再現可能なフレームであり、
図8に例示する通り、動画中のフレームと予測フレームとの差分の画像情報を含んでいる。Pフレームの生成に際しては、例えばまず、ステップS103において分離した動的オブジェクトの画像の変化量が閾値以上となる被圧縮フレームを検出する(
図7参照)。次に、例えばこの検出された被圧縮フレームの、この直前に位置するIフレームからの動きベクトルを算出し、Iフレーム及び動きベクトルから予測フレームを生成する。次に、検出された被圧縮フレームと生成された予測フレームとの差分の画像情報を生成し、これをPフレームとして出力する。尚、動的オブジェクトの画像の変化量は、種々の態様で定義されうる。例えば、動的オブジェクトの移動量、移動方向、傾き、変形、出現や消滅等が考えられる。また、この様な変化量に対する閾値も、種々の態様で定義され得る。
【0022】
次に、並列分散圧縮処理装置120は、Bフレーム(Bi-directionally Predictive-Picture)を生成する(ステップS106)。Bフレームは、このBフレームの前後に位置するIフレーム及びPフレームを参照して動画中の1フレームを再現可能なフレームであり、
図9に例示する通り、動画中のフレームと予測フレームとの差分の画像情報を含んでいる。Bフレームの生成に際しては、例えばまず、IフレームとPフレームの間の被圧縮フレームを選択する(
図7参照)。次に、この選択された被圧縮フレームの前後に位置するIフレーム及びPフレームの変化に応じて、選択された被圧縮フレームの動きベクトルを算出する。次に、これらIフレーム、Pフレーム及び動きベクトルから予測フレームを生成する。次に、選択された被圧縮フレームと生成された予測フレームとの差分の画像情報を生成し、これをBフレームとして出力する。
【0023】
次に、統合処理装置130は、出力されたIフレーム、Bフレーム及びPフレームをGOPとして統合し(
図10参照)、更に複数のGOPを統合して圧縮動画300を生成して(
図11参照)、出力する。尚、
図11の例において、Pフレームは一定の間隔には並んでいない。
【0024】
この様な方法においては、一定の間隔でPフレームを配置するのではなく、被圧縮動画中の動的オブジェクトの画像の変化量が閾値以上となるフレームを検出することにより、Pフレームが必要なフレームにのみ適切にPフレームが配置される。また、IフレームとPフレームの間の1以上の被圧縮フレームそれぞれに基づいて1以上のBフレームを生成することにより、従来はPフレームが配置されていたようなフレームにもBフレームが配置され、Pフレームの数が削減される。ここで上述の通り、Bフレームは、Pフレームよりも情報量が少ない。従って、本実施形態に係る画像圧縮方法によれば、従来の画像圧縮方法よりも更に情報量が圧縮される。
【符号の説明】
【0025】
100…動画圧縮装置、110…分割処理装置、120…並列分散圧縮処理装置、130…統合処理装置、200…圧縮動画、310…フレーム、320…飛行機、330…背景。