(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-12-07
(45)【発行日】2023-12-15
(54)【発明の名称】画像データ抽出装置および画像データ抽出方法
(51)【国際特許分類】
H04N 5/91 20060101AFI20231208BHJP
G06T 7/20 20170101ALI20231208BHJP
H04N 5/783 20060101ALI20231208BHJP
G06F 3/16 20060101ALI20231208BHJP
【FI】
H04N5/91
G06T7/20
H04N5/783
G06F3/16 630
(21)【出願番号】P 2019021389
(22)【出願日】2019-02-08
【審査請求日】2021-11-17
(73)【特許権者】
【識別番号】391017540
【氏名又は名称】東芝ITコントロールシステム株式会社
(74)【代理人】
【識別番号】100081961
【氏名又は名称】木内 光春
(74)【代理人】
【識別番号】100112564
【氏名又は名称】大熊 考一
(74)【代理人】
【識別番号】100163500
【氏名又は名称】片桐 貞典
(74)【代理人】
【識別番号】230115598
【氏名又は名称】木内 加奈子
(72)【発明者】
【氏名】戸崎 涼平
【審査官】松元 伸次
(56)【参考文献】
【文献】特開平10-187759(JP,A)
【文献】特開2015-115940(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F3/16
G06T7/00-7/90
G06V10/00-20/90
30/418
40/16
40/20
H04N5/76-5/775
5/782-5/956
(57)【特許請求の範囲】
【請求項1】
連続した複数のフレームにより構成された動画を再生する表示部と、
前記表示部により再生された再生中の動画に第1の座標と第2の座標が入力される入力部と、
前記第1の座標が入力された時点で前記表示部に表示されていたフレームをn番目のフレームとして記憶し、前記第2の座標が入力された時点で前記表示部に表示されていたフレームをn+k番目のフレームとして記憶する記憶部と、
前記入力部に入力された前記第1の座標から第1の座標データを作成し、前記第2の座標から第2の座標データを作成し、第1の座標データと前記第2の座標データに基づき構成された多角形または楕円形により囲まれた囲み領域の内側の画像を、前記n+k番目のフレームから基準画像として選択する選択部と、
前記選択部により選択された前記基準画像に基づき、前記動画を構成する連続した前記複数のフレームの各々から、前記基準画像に相当する画像を対象画像として抽出する抽出部と、
を有し、
前記記憶部は、前記抽出部により抽出された対象画像を記憶する、
画像データ抽出装置。
【請求項2】
前記囲み領域の縦方向または横方向の長さは、前記入力部に入力されたコマンドに基づき変更される、
請求項1に記載の画像データ抽出装置。
【請求項3】
前記動画を構成する連続した前記複数のフレームの再生速度は、前記入力部に入力されたコマンドに基づき変更される、
請求項1または2に記載の画像データ抽出装置。
【請求項4】
前記対象画像は、過去に記憶した画像のうち最も類似する画像の名称が付与され前記記憶部に記憶される、
請求項1乃至3のいずれか1項に記載の画像データ抽出装置。
【請求項5】
前記入力部は、マウス、キーボード、音声入力装置、視線追跡装置のうち少なくとも一つにより構成された、
請求項1乃至4のいずれか1項に記載の画像データ抽出装置。
【請求項6】
連続した複数のフレームにより構成された動画を再生する表示部により再生された再生中の動画に第1の座標と第2の座標を入力する入力手順と、
前記第1の座標が入力された時点で前記表示部に表示されていたフレームをn番目のフレームとして記憶し、前記第2の座標が入力された時点で前記表示部に表示されていたフレームをn+k番目のフレームとして記憶する記憶手順と、
前記入力手順により入力された前記第1の座標から第1の座標データを作成し、前記第2の座標から第2の座標データを作成し、前記第1の座標データと前記第2の座標データに基づき構成された多角形または楕円形により囲まれた囲み領域の内側の画像を、前記n+k番目のフレームから基準画像として選択する選択手順と、
前記選択手順により選択された前記基準画像に基づき、前記動画を構成する連続した前記複数のフレームの各々から、前記基準画像に相当する画像を対象画像として抽出する抽出手順と、
を有し、
前記記憶手順は、前記抽出手順により抽出された対象画像を記憶する、
画像データ抽出方法。
【発明の詳細な説明】
【技術分野】
【0001】
本実施形態は連続した複数のフレームにより構成された動画における対象となる画像を抽出する画像データ抽出装置および画像データ抽出方法に関する。
【背景技術】
【0002】
複数のフレームにより構成された動画における対象となる画像を抽出する画像データ抽出装置が知られている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2015-69432号公報
【文献】特開2016-212784号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
近年、デジタルムービーやスマートフォンが普及し、動画の撮影が多く行われている。また、防犯カメラ等により動画が撮影される場合もある。撮影された画像データは膨大なデータ量となる。
【0005】
また近年、機械学習による物体解析に、画像データが用いられる。機械学習による物体解析は、膨大な過去の基本データに基づき行われる。過去の基本データの数量が多いほど解析の精度を向上させることができる。機械学習による物体解析に用いられる基本データとして、多数の画像データが予め記憶されていることが望ましい。
【0006】
動画は連続した複数のフレームにより構成されている。さらに作業者の所望する画像データは、動画として撮影された画面の一部分である場合が多い。したがって、作業者の所望する画像データは、動画として撮影された画面の一部分を切り出して対象画像として抽出される。しかしながら、動画は多数のフレームにより構成されており、この多数のフレームから1枚ずつ画面の一部分を切りだして対象画像を作成するには、多大な労力が費やされる。
【0007】
このため、動画を構成する多数のフレームから画面の一部分を切り出して対象画像を作成する場合、コンピュータにより構成された装置が用いられる。しかしながら、多数のフレームから画面の一部分を切りだして対象画像を作成するには、手作業の依存が多く、作業者にとって作業を行いにくい、との問題点があった。
【0008】
本実施形態は、上記問題点を解決するために、作業者による短時間かつ単純な作業で、動画を構成する連続した複数のフレームの各々から、所望する画像を対象画像として抽出することができる画像データ抽出装置および画像データ抽出方法を提供することを目的とする。
【課題を解決するための手段】
【0009】
本実施形態の画像データ抽出装置は、次のような構成を有することを特徴とする。
(1)連続した複数のフレームにより構成された動画を再生する表示部。
(2)前記表示部により再生された再生中の動画に第1の座標と第2の座標が入力される入力部。
(3)前記第1の座標が入力された時点で前記表示部に表示されていたフレームをn番目のフレームとして記憶し、前記第2の座標が入力された時点で前記表示部に表示されていたフレームをn+k番目のフレームとして記憶する記憶部。
(4)前記入力部に入力された前記第1の座標から第1の座標データを作成し、前記第2の座標から第2の座標データを作成し、第1の座標データと前記第2の座標データに基づき構成された多角形または楕円形により囲まれた囲み領域の内側の画像を、前記n+k番目のフレームから基準画像として選択する選択部。
(5)前記選択部により選択された前記基準画像に基づき、前記動画を構成する連続した前記複数のフレームの各々から、前記基準画像に相当する画像を対象画像として抽出する抽出部。
(6)前記記憶部は、前記抽出部により抽出された対象画像を記憶する。
【図面の簡単な説明】
【0010】
【
図1】第1実施形態にかかる画像データ抽出装置を示す図
【
図2】第1実施形態にかかる画像データ抽出装置の外観図
【
図3】第1実施形態にかかる画像データ抽出装置の選択部のプログラムのフローを示す図
【
図4】第1実施形態にかかる画像データ抽出装置の抽出部のプログラムのフローを示す図
【
図5】第1実施形態にかかる画像データ抽出装置の画像抽出にかかる動作を説明する図
【
図6】第1実施形態にかかる画像データ抽出装置の画像調整部のプログラムのフローを示す図
【発明を実施するための形態】
【0011】
[1.第1実施形態]
[1-1.構成]
図1~2を参照して本実施形態の一例としての画像データ抽出装置1について説明する。画像データ抽出装置1は、マイクロコンピュータ等により構成された装置である。画像データ抽出装置1は、作業者により操作され、動画からの画像データの抽出に用いられる。画像データ抽出装置1は、対象となる人物、物品、設備等の物体解析を行うためのデータ抽出に利用される。抽出された画像および特徴の位置を示す座標データは、機械学習における教師データ等に用いられる。
【0012】
画像データ抽出装置1において、以下のコマンド、データが、入力、出力、記憶される。
コマンドJ1:抽出する画像のポイントAを示す指令
コマンドJ2:抽出する画像のポイントBを示す指令
コマンドK1:囲み領域の縦方向の拡大を指示する指令
コマンドK2:囲み領域の縦方向の縮小を指示する指令
コマンドK3:囲み領域の横方向の拡大を指示する指令
コマンドK4:囲み領域の横方向の縮小を指示する指令
コマンドL1:動画の再生停止を指示する指令
コマンドL2:動画の再生開始を指示する指令
コマンドL3:動画の低速再生を指示する指令
コマンドL4:動画の高速再生を指示する指令
コマンドL5:動画の巻き戻し再生を指示する指令
座標データA:抽出する画像のポイントAの座標を示すデータ
座標データB:抽出する画像のポイントBの座標を示すデータ
動画データD1:連続した複数のフレームにより構成された動画のデータ
基準画像データE1:動画D1のうち作業者により選択された対象画像のデータ
対象画像データF1:動画D1の複数のフレームから抽出された複数の対象画像のデータ
図5のポイントAの座標が請求項における第1の座標、ポイントBの座標が請求項における第2の座標に相当する。囲み領域は、ポイントAの座標と、ポイントBの座標に基づき、画面上に構成された図形により囲まれた領域である。囲み領域の内側の画像が抽出される。
【0013】
画像データ抽出装置1は、入力部2、表示部3、演算部4、記憶部5を有する。演算部4は、選択部41、抽出部42、画像調整部43を含む。画像データ抽出装置1の画像データ抽出に関する機能は、搭載されたコンピュータプログラムにより実現される。
【0014】
(入力部2)
入力部2は、入力部2は、マウス21、キーボード22により構成された入力装置である。入力部2は、演算部4に接続される。入力部2は、作業者により操作されコマンドJ1~J2、K1~K4、L1~L5が入力される。入力部2は、入力されたコマンドを演算部4に出力する。
【0015】
(表示部3)
表示部3は、プラズマディスプレイ、液晶パネル等により構成された表示装置である。表示部3は、演算部4に接続される。表示部3は、演算部4から出力された動画データD1、基準画像データE1に基づき画像を表示する。
【0016】
(記憶部5)
記憶部5は、半導体メモリやハードディスクのような記憶媒体にて構成される。記憶部5は、演算部4に接続される。記憶部5は、座標データA、座標データB、動画データD1、基準画像データE1、対象画像データF1を記憶する。記憶部5は、演算部4に書込み、読み出しを制御される。記憶部5は、コンソール9に内蔵される。
【0017】
(演算部4)
演算部4は、マイクロコンピュータのCPU等により構成される。演算部4は、選択部41、抽出部42、画像調整部43を含む。選択部41、抽出部42、画像調整部43は、プログラムモジュールにより構成される。選択部41、抽出部42、画像調整部43は、後述するコンピュータプログラムを内蔵する。演算部4は、入力部2、表示部3、記憶部5に接続される。演算部4は、入力部2、表示部3、記憶部5と連携し、以下の演算および制御を行う。演算部4は、コンソール9に内蔵される。
【0018】
a.選択部41の演算、制御
選択部41は、入力部2から前述のコマンドJ1、コマンドJ2を受信する。選択部41は、コマンドJ1、コマンドJ2に基づき座標データA(抽出する画像のポイントAの座標を示すデータ)、座標データB(抽出する画像のポイントBの座標を示すデータ)を作成し記憶部5に記憶させる。
【0019】
選択部41は、ポイントAの座標にかかる座標データAと、ポイントBの座標にかかる座標データBに基づき、画面上に四角形を構成し、構成された四角形により囲まれた囲み領域の内側の画像を、連続した複数のフレームのうちの一つのフレームから基準画像として選択し、基準画像データE1(動画D1のうち作業者により選択された対象画像のデータ)を作成し記憶部5に記憶させる。選択部41は、
図2に示すプログラムに基づき動作を行う。
【0020】
b.抽出部42の演算、制御
抽出部42は、記憶部5に記憶された基準画像データE1(動画D1のうち作業者により選択された対象画像のデータ)に基づき、動画データD1(連続した複数のフレームにより構成された動画のデータ)にかかる動画を構成する連続した複数のフレームの各々から、基準画像に相当する画像を対象画像として抽出し、対象画像データF1(動画D1の複数のフレームから抽出された複数の対象画像のデータ)を作成し記憶部5に記憶させる。抽出部42は、
図3に示すプログラムに基づき動作を行う。
【0021】
抽出部42は、抽出した対象画像にかかる対象画像データF1(動画D1の複数のフレームから抽出された複数の対象画像のデータ)に、予め設定した名称を付与し、記憶部5に記憶させる。
【0022】
c.画像調整部43の演算、制御
画像調整部43は、入力部2からコマンドL1~L5を受信する。画像調整部43は、コマンドL1~L5に基づき、記憶部5に記憶された動画データD1(連続した複数のフレームにより構成された動画のデータ)を表示部3に表示させる。
【0023】
画像調整部43は、入力部2からコマンドK1~K4を受信する。画像調整部43は、コマンドK1~K4に基づき、囲み領域の縦方向または横方向の長さを変更し、表示部3に表示させる。囲み領域は、ポイントAの座標にかかる座標データAと、ポイントBの座標にかかる座標データBに基づき、画面上に構成された四角形により囲まれた領域である。囲み領域の内側の画像が、選択部41により基準画像として選択される。画像調整部43は、
図6に示すプログラムに基づき上記動作を行う。
【0024】
以上が、画像データ抽出装置1の構成である。
【0025】
[1-2.作用]
次に、本実施形態の画像データ抽出装置1の作用を、
図1~
図6に基づき説明する。画像データ抽出装置1は、対象となる人物、物品、設備を検出し、物体解析を行うためのデータ抽出に利用される。抽出された画像は、機械学習における教師データ等に用いられる。画像データ抽出装置1は、作業者により操作され、動画からの画像データの抽出を行う。
【0026】
画像データ抽出装置1の選択部41は、入力部2に入力された第1の座標であるポイントAの座標と第2の座標であるポイントBの座標に基づき構成された四角形により囲まれた囲み領域の内側の画像を、動画を構成する連続した複数のフレームのうちの一つのフレームから基準画像として選択する。
【0027】
画像データ抽出装置1の抽出部42は、選択部41により選択された基準画像に基づき、動画を構成する連続した複数のフレームの各々から、基準画像に相当する画像を対象画像として抽出する。
【0028】
[a.選択部41の動作]
以下に選択部41の動作を説明する。選択部41は、
図3に示すプログラムに従って動作を行う。
図3に示すプログラムは、演算部4に内蔵される。
図3に示すプログラムは、演算部4により、繰り返し実行される。
【0029】
(ステップS01:動画を再生する)
選択部41は、対象画像抽出の対象となる動画を再生する。予め、動画データD1(連続した複数のフレームにより構成された動画)が記憶部5に記憶されている。動画データD1にかかる動画が表示部3に表示される。動画の再生中に、対象画像の抽出を行う作業者によりコマンドJ1~J2、K1~K4、L1~L5が、入力部2から入力される。本実施形態では、コマンドJ1、J2の入力は、入力部2を構成するマウス21により、K1~K4、L1~L5の入力は、入力部2を構成するキーボード22により行われるものとする。
【0030】
(ステップS02:コマンドJ1が入力されたか判断する)
次に選択部41は、コマンドJ1(抽出する画像のポイントAを示す指令)が入力されたかの判断を行う。作業者は、表示部3に再生された動画を見て、表示部3に表示されたカーソルをマウス21によりポイントAに移動させる。ポイントAは、抽出を所望する画像の始点である。選択部41は、入力部2を構成するマウス21の左クリックがONとされたことを検出し、コマンドJ1が入力されたと判断する。
【0031】
コマンドJ1が入力されたと判断した場合(ステップS02のYES)、選択部41は、ステップS03に移行する。コマンドJ1が入力されたと判断しない場合(ステップS02のNO)、コマンドJ1の入力待ち状態となる。
【0032】
(ステップS03:座標データAを作成、記憶し、ポイントAを表示する)
ステップS02にてコマンドJ1が入力されたと判断した場合、選択部41は、コマンドJ1が入力された、動画上のポイントAの座標を検出し座標データA(抽出する画像のポイントAの座標を示すデータ)を作成する。選択部41は、座標データAを記憶部5に記憶させる。また、
図5に示すように選択部41は、座標データAに基づき表示部3に表示された動画上のポイントAにドット「・」を表示する。
【0033】
(ステップS04:コマンドJ2が入力されたか判断する)
次に選択部41は、コマンドJ2(抽出する画像のポイントBを示す指令)が入力されたかの判断を行う。作業者は、表示部3に再生された動画を見て、表示部3に表示されたカーソルをマウス21によりポイントBに移動させる。ポイントBは、抽出を所望する画像の終点である。ポイントAとポイントBを対頂角とする四角形が、表示部3に表示された動画上に描かれる。選択部41は、入力部2を構成するマウス21の左クリックがOFFされたことを検出し、コマンドJ2が入力されたと判断する。
【0034】
コマンドJ2が入力されたと判断した場合(ステップS03のYES)、選択部41は、ステップS05に移行する。コマンドJ2が入力されたと判断しない場合(ステップS03のNO)、コマンドJ2の入力待ち状態となる。
【0035】
(ステップS05:座標データBを作成、記憶し、ポイントBおよび囲み領域を表示する)
ステップS04にてコマンドJ2が入力されたと判断した場合、選択部41は、コマンドJ2が入力された、動画上のポイントBの座標を検出し座標データB(抽出する画像のポイントBの座標を示すデータ)を作成する。選択部41は、座標データBを記憶部5に記憶させる。また、
図5に示すように選択部41は、座標データA、座標データBに基づき、表示部3に表示された動画上にポイントAとポイントBを対頂角とする四角形を形成し、囲み領域として表示する。
【0036】
(ステップS06:コマンドJ2が入力された時点のフレームを記憶する)
選択部41は、コマンドJ2が入力された時点の動画にかかるフレームを記憶する。例えば、
図5に示すように、コマンドJ1がn番目のフレームの表示時点に入力され、コマンドJ2がn+k番目のフレームの表示時点に入力された場合、選択部41は、コマンドJ2が入力されたフレームは、「n+k」番目のフレームであることを記憶部5に記憶させる。
【0037】
(ステップS07:基準画像データE1を作成、記憶する)
選択部41は、入力部2に入力された座標データAと座標データBに基づき構成された四角形により囲まれた囲み領域の内側の画像を、連続した複数のフレームのうちの一つのフレームから基準画像として選択する。座標データAにかかる座標が請求項における第1の座標に、座標データBにかかる座標が請求項における第2の座標に相当する。
【0038】
選択部41は、「n+k」番目のフレームにおける、座標データAにかかるポイントAと座標データBにかかるポイントBを対頂角とする四角形により囲まれた、囲み領域の内側の画像を基準画像として選択し、基準画像データE1(動画D1のうち作業者により選択された対象画像のデータ)を作成し、記憶部5に記憶させる。
【0039】
以上が、選択部41の動作である。
【0040】
[b.抽出部42の動作]
以下に抽出部42の動作を説明する。抽出部42は、
図4に示すプログラムに従って動作を行う。
図4に示すプログラムは、演算部4に内蔵される。
図4に示すプログラムは、演算部4により、繰り返し実行される。
【0041】
(ステップS11:対象画像データF1を作成、記憶する)
抽出部42は、選択部41により選択された基準画像に基づき、動画を構成する連続した複数のフレームの各々から、基準画像に相当する画像を対象画像として抽出する。
【0042】
具体的には、抽出部42は、選択部41により作成され記憶部5に記憶された、基準画像データE1(動画D1のうち作業者により選択された対象画像のデータ)に基づき、動画データD1(連続した複数のフレームにより構成された動画のデータ)を構成する複数のフレームから基準画像データE1に相当する画像を抽出し、対象画像データF1(動画D1の複数のフレームから抽出された複数の対象画像のデータ)を作成し、記憶部5に記憶させる。
【0043】
(ステップS12:対象画像データF1に画像の名称を付ける)
抽出部42は、対象画像データF1(動画D1の複数のフレームから抽出された複数の対象画像のデータ)に、既に記憶部5に記憶されている過去の画像に、予め設定された名称を付与し記憶部5に記憶させる。
【0044】
以上が、抽出部42の動作である。
【0045】
[c.画像調整部43の動作]
以下に画像調整部43の動作を説明する。画像調整部43は、
図6に示すプログラムに従って動作を行う。
図6に示すプログラムは、演算部4に内蔵される。
図6に示すプログラムは、選択部41または抽出部42の実行中に、割り込みにより実行される。入力部2を構成するキーボード22のいずれかのキーが押された場合、割り込みが発生し、
図6に示すプログラムが起動する。
【0046】
コマンドK1~K4、L1~L5は、キーボード22の下記に示すキーが押されることにより入力される。
コマンドK1(囲み領域の縦方向の拡大を指示する指令):キー[↑]
コマンドK2(囲み領域の縦方向の縮小を指示する指令):キー[↓]
コマンドK3(囲み領域の横方向の拡大を指示する指令):キー[→]
コマンドK4(囲み領域の横方向の縮小を指示する指令):キー[←]
コマンドL1(動画の再生停止を指示する指令):キー[S]
コマンドL2(動画の再生開始を指示する指令):キー[R]
コマンドL3(動画の低速再生を指示する指令):キー[T]
コマンドL4(動画の高速再生を指示する指令):キー[U]
コマンドL5(動画の巻き戻し再生を指示する指令):キー[V]
【0047】
(ステップS21:コマンドL1が入力された場合、動画の再生を停止する)
画像調整部43は、キーボード22のキー[S]が押され、コマンドL1が入力されたと判断した場合(ステップS21a)、記憶部5に記憶された動画データD1にかかる動画の再生を停止し、静止画像を表示部3に表示させる(ステップS21b)。
【0048】
(ステップS22:コマンドL2が入力された場合、動画の再生を行う)
画像調整部43は、キーボード22のキー[R]が押され、コマンドL2が入力されたと判断した場合(ステップS22a)、記憶部5に記憶された動画データD1にかかる動画を再生し、表示部3に表示させる(ステップS22b)。
【0049】
(ステップS23:コマンドL3が入力された場合、動画の低速再生を行う)
画像調整部43は、キーボード22のキー[T]が押され、コマンドL3が入力されたと判断した場合(ステップS23a)、再生速度を低速にして動画データD1にかかる動画を表示部3に表示させる(ステップS23b)。画像調整部43は、現在再生している動画の再生速度を、例えば20%低速にする。コマンドL3が複数回入力された場合、動画の再生速度は累積して低速にされる。
【0050】
(ステップS24:コマンドL4が入力された場合、動画の高速再生を行う)
画像調整部43は、キーボード22のキー[U]が押され、コマンドL4が入力されたと判断した場合(ステップS24a)、再生速度を高速にして動画データD1にかかる動画を表示部3に表示させる(ステップS24b)。画像調整部43は、現在再生している動画の再生速度を、例えば20%高速にする。コマンドL3が複数回入力された場合、動画の再生速度は累積して高速にされる。
【0051】
(ステップS25:コマンドL5が入力された場合、動画の巻き戻し再生を行う)
画像調整部43は、キーボード22のキー[V]が押され、コマンドL5が入力されたと判断した場合(ステップS25a)、動画データD1にかかる動画を巻き戻し再生にて表示部3に表示させる(ステップS25b)。コマンドL3が複数回入力された場合、動画の巻き戻し再生速度は累積して高速にされる。
【0052】
基準画像データE1(動画D1のうち作業者により選択された対象画像のデータ)の作成は、作業者により上記のステップS21~S25により調整された動画上にて行われる。
【0053】
(ステップS26:コマンドK1が入力された場合、囲み領域の縦の長さを拡大する)
画像調整部43は、キーボード22のキー[↑]が押され、コマンドK1が入力されたと判断した場合(ステップS26a)、囲み領域の縦方向の長さを拡大する(ステップS26b)。囲み領域は、座標データAと座標データBの座標に基づき構成された四角形に囲まれた領域である。囲み領域は、表示部3に再生された動画上に表示される。画像調整部43は、現在表示されている囲み領域の縦方向の長さを、例えば10ピクセル拡大する。コマンドK1が複数回入力された場合、囲み領域の縦方向の長さは累積して拡大される。
【0054】
(ステップS27:コマンドK2が入力された場合、囲み領域の縦の長さを縮小する)
画像調整部43は、キーボード22のキー[↓]が押され、コマンドK2が入力されたと判断した場合(ステップS27a)、囲み領域の縦方向の長さを縮小する(ステップS27b)。画像調整部43は、現在表示されている囲み領域の縦方向の長さを、例えば10ピクセル縮小する。コマンドK2が複数回入力された場合、囲み領域の縦方向の長さは累積して縮小される。
【0055】
(ステップS28:コマンドK3が入力された場合、囲み領域の横の長さを拡大する)
画像調整部43は、キーボード22のキー[→]が押され、コマンドK3が入力されたと判断した場合(ステップS28a)、囲み領域の横方向の長さを拡大する(ステップS28b)。画像調整部43は、現在表示されている囲み領域の横方向の長さを、例えば10ピクセル拡大する。コマンドK3が複数回入力された場合、囲み領域の横方向の長さは累積して拡大される。
【0056】
(ステップS29:コマンドK4が入力された場合、囲み領域の横の長さを縮小する)
画像調整部43は、キーボード22のキー[←]が押され、コマンドK4が入力されたと判断した場合(ステップS29a)、囲み領域の横方向の長さを縮小する(ステップS29b)。画像調整部43は、現在表示されている囲み領域の横方向の長さを、例えば10ピクセル縮小する。コマンドK4が複数回入力された場合、囲み領域の横方向の長さは累積して縮小される。
【0057】
基準画像データE1(動画D1のうち作業者により選択された対象画像のデータ)は、上記のステップS26~S29にて囲み領域の大きさが調整され作成される。
【0058】
以上が、画像調整部43の動作である。
【0059】
以上が、画像データ抽出装置1の動作である。上記のように画像データ抽出装置1の表示部3に表示された動画データD1にかかる動画上に囲み領域が表示され、囲み領域に基づき基準画像データE1(動画D1のうち作業者により選択された対象画像のデータ)が作成される。基準画像データE1に基づき、対象画像データF1(動画D1の複数のフレームから抽出された複数の対象画像のデータ)が作成される。
【0060】
[1-3.効果]
(1)本実施形態によれば、画像データ抽出装置1は、連続した複数のフレームにより構成された動画を再生する表示部3と、表示部3により再生された動画における第1の座標と第2の座標が入力される入力部2と、入力部2に入力された第1の座標と第2の座標に基づき構成された多角形または楕円形により囲まれた囲み領域の内側の画像を、連続した複数のフレームのうちの一つのフレームから基準画像として選択する選択部41と、選択部41により選択された基準画像に基づき、動画を構成する連続した複数のフレームの各々から、基準画像に相当する画像を対象画像として抽出する抽出部42と、抽出部42により抽出された対象画像を記憶する記憶部5とを有するので、作業者による単純な作業で、動画を構成する連続した複数のフレームの各々から、所望する画像を対象画像として抽出することができる画像データ抽出装置を提供することができる。
【0061】
本実施形態によれば、作業者は、表示部3に表示された動画上で第1の座標と第2の座標を入力部2から入力し、所望の画像を基準画像として選択することができるので、簡単な作業で基準画像を選択することができる。作業者は、動画を静止させ、静止画像から基準画像を個別に選択することを必要とされない。
【0062】
本実施形態によれば、抽出部42は、選択部41により選択された基準画像に基づき、動画を構成する連続した複数のフレームの各々から、基準画像に相当する画像を対象画像として抽出するので、作業者は、動画を静止させ、静止画像から多数の画像を選択することが必要とされない。その結果、短時間に大量の画像データを抽出することができる。抽出された大量の画像データは、機械学習による物体解析等に利用される。
【0063】
(2)本実施形態によれば、囲み領域の縦方向または横方向の長さは、入力部2に入力されたコマンドに基づき変更されるので、作業者は、容易に基準画像の大きさを変更することができる。
【0064】
(3)本実施形態によれば、動画を構成する連続した複数のフレームの再生速度は、入力部2に入力されたコマンドに基づき変更されるので、作業者は、任意の再生速度で再生された動画上で、基準画像の選択を行うことができる。これにより、作業者による基準画像の選択作業は、より容易なものとなる。
【0065】
(4)本実施形態によれば、対象画像は、過去に記憶した画像のうち最も類似する画像の名称が付与され記憶部5に記憶されるので、作業者は容易に、記憶部5に記憶されたデータの内容を知ることができる。また、類似した対象画像は、同様の名称が付与されて記憶部5に記憶されるので、作業者は、容易にデータの分類を行うことができる。また、作業者は、対象画像の名称を頼りに、データを抽出し、時間的な経緯の把握に役立てることができる。
【0066】
(5)本実施形態によれば、入力部2は、マウス21、キーボード22、音声入力装置、視線追跡装置のうち少なくとも一つにより構成されるので、作業者は、安価に容易に一般的な装置により画像データ抽出装置1を構成することができる。
【0067】
[2.他の実施形態]
変形例を含めた実施形態を説明したが、これらの実施形態は例として提示したものであって、発明の範囲を限定することを意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略や置き換え、変更を行うことができる。これらの実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。以下は、その一例である。
【0068】
(1)上記実施形態では、入力部2は、マウス21、キーボード22により構成され、コマンドJ1~J2はマウス21、K1~K4、L1~L5はキーボード22により入力されるものとした。しかしながらこれらのコマンドは、他の入力装置により構成された入力部2により入力されるようにしてもよい。例えば、入力部2は、音声入力装置が含まれ構成されるようにし、以下のコマンドが音声により音声入力装置に入力されるようにしてもよい。
コマンドK1(囲み領域の縦方向の拡大を指示する指令):音声[うえ]
コマンドK2(囲み領域の縦方向の縮小を指示する指令):音声[した]
コマンドK3(囲み領域の横方向の拡大を指示する指令):音声[みぎ]
コマンドK4(囲み領域の横方向の縮小を指示する指令):音声[ひだり]
コマンドL1(動画の再生停止を指示する指令):音声[一時停止]
コマンドL2(動画の再生開始を指示する指令):音声[再生]
コマンドL3(動画の低速再生を指示する指令):音声[低速]
コマンドL4(動画の高速再生を指示する指令):音声[高速]
コマンドL5(動画の巻き戻し再生を指示する指令):音声[巻き戻し]
【0069】
(2)上記実施形態では、作業者に操作された入力部2のマウス21により、コマンドJ1(抽出する画像のポイントAを示す指令)、コマンドJ2(抽出する画像のポイントBを示す指令)が入力されるものとした。しかしながらこれらのコマンドは、他の入力装置により構成された入力部2により入力されるようにしてもよい。例えば、視線追跡装置を含め入力部2を構成するようにし、コマンドJ1、J2は、作業者の視線の方向により視線追跡装置に入力されるようにしてもよい。
【0070】
(3)上記実施形態では、囲み領域は、ポイントAの座標とポイントBの座標に基づき構成された四角形であるものとした。しかしながら囲み領域の形状は、これに限られない。囲み領域の形状は、ポイントAの座標とポイントBの座標に基づき構成された、例えば三角形、五角形以上の多角形または楕円形であってもよい。
【0071】
(4)上記実施形態ではコマンドJ2が入力された時点の動画のフレームから基準画像データE1を作成するものとしたが、基準画像データE1が作成される動画のフレームはこれに限られない。コマンドJ1が入力された動画のフレームから基準画像データE1が作成されるようにしてもよい。またはコマンドJ1コマンドJ2が入力された間の動画のフレームが選択され、基準画像データE1が作成されるようにしてもよい。
【符号の説明】
【0072】
1・・・画像データ抽出装置
2・・・入力部
3・・・表示部
4・・・演算部
5・・・記憶部
9・・・コンソール
21・・・マウス
22・・・キーボード
41・・・選択部
42・・・抽出部
43・・・画像調整部