特許7547676 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ セーフィー株式会社の特許一覧

特許7547676映像提供システム、映像提供方法および映像提供プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B1)

(11)【特許番号】

(24)【登録日】2024-08-30

(45)【発行日】2024-09-09

(54)【発明の名称】映像提供システム、映像提供方法および映像提供プログラム

(51)【国際特許分類】

H04N 7/18 20060101AFI20240902BHJP

G06Q 50/10 20120101ALI20240902BHJP

【ＦＩ】

H04N7/18 D

H04N7/18 K

G06Q50/10

【請求項の数】 12

(21)【出願番号】P 2024061810

(22)【出願日】2024-04-06

【審査請求日】2024-04-09

【早期審査対象出願】

(73)【特許権者】

【識別番号】515029558

【氏名又は名称】セーフィー株式会社

(74)【代理人】

【識別番号】100190414

【弁理士】

【氏名又は名称】芹澤友之

(72)【発明者】

【氏名】菅原宏明

【審査官】塚本丈二

(56)【参考文献】

【文献】国際公開第２０２３／００２６６１（ＷＯ，Ａ１）

【文献】特開２０２２－０１６１３２（ＪＰ，Ａ）

【文献】特開２０１４－０６７１３１（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１６／０２８６１５６（ＵＳ，Ａ１）

【文献】特開２０２０－０６８４２５（ＪＰ，Ａ）

【文献】特開２０２０－１４１２４６（ＪＰ，Ａ）

【文献】特開２０１９－０７９３５７（ＪＰ，Ａ）

【文献】特開２０２１－０２７３８４（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｈ０４Ｎ７／１８

Ｇ０６Ｑ５０／１０

Ｇ０９Ｇ５／００－５／４２

Ｇ０６Ｔ１／００

(57)【特許請求の範囲】

【請求項1】

カメラにより撮影された映像をサーバに保存して端末に提供する映像提供システムであって、
第１映像に含まれる人の個人情報が除去される一方で、当該人の性別、年齢、及び表情を含む属性情報が除去されないディープマスキング処理と、ぼかし処理又はモザイク処理と、を含む複数のマスキング処理の種類のうち、実行すべきマスキング処理の種類を設定するための設定画面を第１端末に表示させ、
前記設定画面に対するユーザの入力操作に応じて、実行すべきマスキング処理の種類を決定し、
前記第１映像に含まれる人に対して、前記決定された種類のマスキング処理を実行することにより、第２映像を生成し、
前記第２映像を前記サーバに保存し、
前記第２映像を前記サーバから第２端末に提供する、
映像提供システム。

【請求項2】

前記第２映像において前記マスキング処理が適切に実行されているか確認するための確認画面を前記第１端末に表示させ、
前記確認画面に対するユーザの入力操作に応じて、前記第２映像の利用可否を決定し、
前記第２映像を利用可能と決定した場合に、前記第２映像を前記サーバに保存する、
請求項１に記載の映像提供システム。

【請求項3】

前記確認画面において、前記第１映像と前記第２映像を並べて表示する、
請求項２に記載の映像提供システム。

【請求項4】

前記第２映像を保存した後に、前記第１映像を削除する、
請求項１に記載の映像提供システム。

【請求項5】

前記人の属性情報を取得し、
前記第２映像とともに前記属性情報を提供する、
請求項１に記載の映像提供システム。

【請求項6】

前記第２映像に関連付けられたメタデータを保存し、
前記メタデータは、
前記映像の識別情報と、
前記映像の撮影時間と、
前記映像の撮影場所と、
前記映像に対して実行された前記マスキング処理と、
のうちの少なくとも一つを含む、
請求項１に記載の映像提供システム。

【請求項7】

複数の前記第２映像の中から所望の前記第２映像を検索するための検索画面を前記第２端末に表示させ、
前記検索画面に対するユーザの入力操作に応じて、前記第２映像の検索条件を決定し、
前記サーバに保存された複数の前記第２映像の中から、前記決定された検索条件に対応する前記第２映像を少なくとも一つ抽出し、
前記抽出された前記第２映像を前記第２端末に提供する、
請求項１に記載の映像提供システム。

【請求項8】

前記検索条件は、
前記映像の時間と、
前記映像のデータサイズと、
前記映像に対して実行されたマスキング処理と、
前記映像が撮影された場所と、
前記映像が撮影された業態と、
前記映像が撮影された地域と、
前記映像が撮影された時間帯と、
前記映像に関連付けられたメタデータと、
のうちの少なくとも一つを含む、
請求項７に記載の映像提供システム。

【請求項9】

カメラにより撮影された映像をサーバに保存して端末に提供する映像提供システムであって、
第１映像に含まれる人に対してマスキング処理を実行することにより、第２映像を生成し、
前記第２映像を前記サーバに保存し、
複数の前記第２映像の中から所望の前記第２映像を検索するための検索画面であって、前記第１映像に含まれる人の個人情報が除去される一方で、当該人の性別、年齢、及び表情を含む属性情報が除去されないディープマスキング処理を含むマスキング処理の種類のうち、検索条件とすべきマスキング処理の種類を設定するための検索画面を第２端末に表示させ、
前記検索画面に対するユーザの入力操作に応じて、前記第２映像の検索条件を決定し、
前記サーバに保存された複数の前記第２映像の中から、前記決定された検索条件に対応する前記第２映像を少なくとも一つ抽出し、
前記抽出された前記第２映像を前記第２端末に提供する、
映像提供システム。

【請求項10】

前記マスキング処理は、前記人の顔に対して実行される、
請求項１又は請求項９に記載の映像提供システム。

【請求項11】

カメラにより撮影された映像をサーバに保存して端末に提供する映像提供システムにより実行される映像提供方法であって、
第１映像に含まれる人の個人情報が除去される一方で、当該人の性別、年齢、及び表情を含む属性情報が除去されないディープマスキング処理と、ぼかし処理又はモザイク処理と、を含む複数のマスキング処理の種類のうち、実行すべきマスキング処理の種類を設定するための設定画面を第１端末に表示させるステップと、
前記設定画面に対するユーザの入力操作に応じて、実行すべきマスキング処理の種類を決定するステップと、
前記第１映像に含まれる人に対して、前記決定された種類のマスキング処理を実行することにより、第２映像を生成するステップと、
前記第２映像を前記サーバに保存するステップと、
前記第２映像を前記サーバから第２端末に提供するステップと、
を含む、
映像提供方法。

【請求項12】

請求項１１に記載の映像提供方法を映像提供システムに実行させる映像提供プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、映像提供システム、映像提供方法および映像提供プログラムに関する。

【背景技術】

【0002】

ＡＩ（人工知能）技術の発展に伴い、機械学習モデルの構築に必要な学習データの需要が益々高まっている。特に、精度が高い機械学習モデル（特に、機械学習を活用した画像認識モデル）を構築するためには、大量の学習データが必要とされている。この点において、カメラと、サーバと、ユーザ端末とを備えた映像提供システムでは、日々大量の映像データがサーバ内に蓄積されるため、サーバ内に蓄積された映像データを学習データとして有効活用することが考えられる。その一方で、学習データとして利用されうる映像データには人の顔や車両のナンバープレート等の個人情報が含まれているため、個人情報保護法等の法令を遵守するために映像データに含まれる個人情報を除去した上で、映像データを学習データとして利活用する必要がある。

【0003】

この点において、特許文献１では、映像データ中に含まれる人の顔の領域（顔領域）を特定した上で、当該特定された顔領域にモザイク処理（マスキング処理の一例）を実行する画像処理技術が開示されている。

【先行技術文献】

【特許文献】

【0004】

【文献】特開２０１８－２０５８３５号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

特許文献１の開示では、映像データ中の人の顔にモザイク処理が実行される結果、映像データ中から個人情報が除去されるため、モザイク処理後の映像データを学習データとして利活用することが可能となる。その一方で、カメラと、サーバと、ユーザ端末とを備えた映像提供システムにおいて、サーバ内に蓄積された映像データを学習データとして効率よく利活用するための仕組みについては現時点では殆ど提案されていないのが実情である。特に、映像データに対して実行されるマスキング処理の文脈において当該映像提供システムのユーザビリティを向上させるための新しい仕組みについては検討の余地がある。

【0006】

本開示は、上記観点に鑑み、映像に対するマスキング処理の文脈において映像提供システムのユーザビリティを向上させることを目的とする。

【課題を解決するための手段】

【0007】

本開示の一態様に係る映像提供システムは、カメラにより撮影された映像をサーバに保存して端末に提供するシステムであって、実行すべきマスキング処理の設定画面を第１端末に表示させ、前記設定画面に対するユーザの入力操作に応じて、前記マスキング処理の種類を決定し、第１映像に含まれる個人情報を示す対象物に対して、前記決定された種類のマスキング処理を実行することにより、第２映像を生成し、前記第２映像を前記サーバに保存し、前記第２映像を前記サーバから第２端末に提供する。

【0008】

上記構成によれば、マスキング処理（換言すれば、個人情報の匿名化処理）の設定に関連する設定画面が第１端末に表示された上で、設定画面に対するユーザの入力操作に応じてマスキング処理の種類が決定される。その後、第１映像に含まれる個人情報を示す対象物（例えば、人や車両等）に対して当該決定された種類のマスキング処理が実行された上で、第２映像が第２端末に提供される。このように、ユーザは、第１映像に対してどのような種類のマスキング処理を実行するべきかを設定画面を通じて決定することができるため、映像に対するマスキング処理の文脈において映像提供システムのユーザビリティを向上させることが可能となる。また、第２映像が第２端末に提供されるため、サーバに保存された映像を有効活用することが可能となる。例えば、機械学習モデル（機械学習を活用した画像認識モデル）を構築するための学習データとしてマスキング処理後の映像を有効活用することができる。

【0009】

また、前記映像提供システムは、前記第２映像において前記マスキング処理が適切に実行されているか確認するための確認画面を前記第１端末に表示させ、前記確認画面に対するユーザの入力操作に応じて、前記第２映像の利用可否を決定し、前記第２映像を利用可能と決定した場合に、前記第２映像を前記サーバに保存してもよい。

【0010】

上記構成によれば、確認画面が第１端末に表示された上で、確認画面に対するユーザの入力操作に応じて、第２映像の利用可否が決定される。このように、ユーザは、確認画面を通じて第２映像においてマスキング処理が適切に実行されているかどうかを把握することができるため、映像に対するマスキング処理の文脈において映像提供システムのユーザビリティを向上させることが可能となる。さらに、個人情報保護法等の法令に合致した適切なマスキング処理が映像に対して行われていることをユーザが客観的な視点から確認することができるため、マスキング処理に対する透明性や信頼性を十分に確保することが可能となる。このため、マスキング処理された映像を提供された第三者は、安心して当該映像を活用することが可能となる。また、マスキング処理された映像が第２端末に提供されるため、サーバに保存された映像を有効活用することが可能となる。例えば、機械学習モデル（機械学習を活用した画像認識モデル）を構築するための学習データとしてマスキング処理後の映像を有効活用することができる。

【0011】

また、前記映像提供システムは、前記確認画面において、前記第１映像と前記第２映像を並べて表示してもよい。

【0012】

上記構成によれば、ユーザは、第１映像と第２映像が並べて表示された確認画面を通じて第２映像においてマスキング処理が適切に実行されているかどうかを明確に把握することができる。

【0013】

また、前記映像提供システムは、前記第２映像を保存した後に、前記第１映像を削除してもよい。

【0014】

上記構成によれば、第２映像が保存された後に第１映像が削除されるため、サーバ内に蓄積されたデータ容量を好適に抑えることが可能となり、サーバの維持管理コストを好適に低減することが可能となる。

【0015】

また、前記映像提供システムは、前記対象物の属性情報を取得し、前記第２映像とともに前記属性情報を提供してもよい。

【0016】

上記構成によれば、属性情報と第２映像とが第２端末に提供される。このため、対象物の属性が第２映像からは特定不可能である場合であっても（例えば、モザイク処理やぼかし処理等が第２映像に実行されている場合であっても）、属性情報によって当該対象物の属性を特定することが可能となる。このように、機械学習モデルを構築するための学習データとしてマスキング処理後の映像を有効活用することができる。

【0017】

また、前記対象物は、人であってもよい。前記属性情報は、性別と、年齢と、顔角度と、表情と、のうちの少なくとも一つを含んでもよい。

【0018】

上記構成によれば、第２映像に含まれる人の属性が特定不可能である場合であっても、性別、年齢、顔角度、表情のうちの少なくとも一つを含む属性情報によって人の属性を特定することが可能となる。このように、人の動作等に関連する機械学習モデルを構築するための学習データとしてマスキング処理後の映像を有効活用することができる。

【0019】

また、前記第２映像に関連付けられたメタデータを保存してもよい。前記メタデータは、前記映像の識別情報と、前記映像の撮影時間と、前記映像の撮影場所と、前記映像に対して実行された前記マスキング処理と、のうちの少なくとも一つを含んでもよい。

【0020】

上記構成によれば、映像の識別情報、撮影時間、撮影場所、マスキング処理とのうちの少なくとも一つを含むメタデータにより、サーバに保存された第２映像の検索性を向上させることが可能となる。

【0021】

また、前記映像提供システムは、複数の前記第２映像の中から所望の前記第２映像を検索するための検索画面を前記第２端末に表示させ、前記検索画面に対するユーザの入力操作に応じて、前記第２映像の検索条件を決定し、前記サーバに保存された複数の前記第２映像の中から、前記決定された検索条件に対応する前記第２映像を少なくとも一つ抽出し、前記抽出された前記第２映像を前記第２端末に提供してもよい。

【0022】

上記構成によれば、サーバに保存された複数の第２映像の中から検索条件に合致する所望の第２映像を第２端末に提供することが可能となる。

【0023】

また、前記検索条件は、前記映像の時間と、前記映像のデータサイズと、前記映像に対して実行されたマスキング処理と、前記映像に含まれる対象物の種類と、前記映像が撮影された場所と、前記映像が撮影された業態と、前記映像が撮影された地域と、前記映像が撮影された時間帯と、前記映像に関連付けられたメタデータと、のうちの少なくとも一つを含んでもよい。

【0024】

上記構成によれば、第２端末を操作する操作者は、上記のこれらの情報のうちの少なくとも一つに合致する所望の第２映像を取得することが可能となる。

【0025】

また、前記設定画面は、複数種類のマスキング処理のうちの一つを選択可能なマスキング処理選択領域を有してもよい。前記複数種類のマスキング処理は、前記対象物の属性情報及び個人情報の両方の特定が不可能となる第一マスキング処理と、前記対象物の属性情報の特定が可能となる一方で、前記対象物の個人情報の特定が不可能となる第二マスキング処理と、を含んでもよい。

【0026】

上記構成によれば、マスキング処理選択領域を有する設定画面が第１端末に表示された上で、設定画面に対するユーザの入力操作に応じてマスキング処理が決定される。このように、ユーザは、第１映像に対して第一マスキング処理（例えば、モザイク処理やぼかし処理等）および第二マスキング処理（例えば、ディープマスキング処理）のうちのいずれかを実行するべきかを設定画面を通じて決定することができるため、映像に対するマスキング処理の文脈において映像提供システムのユーザビリティを向上させることが可能となる。

【0027】

本開示の別の一態様に係る映像提供システムは、カメラにより撮影された映像をサーバに保存して端末に提供するシステムであって、第１映像に含まれる個人情報を示す対象物に対してマスキング処理を実行することにより、第２映像を生成し、前記第２映像において前記マスキング処理が適切に実行されているか確認するための確認画面を第１端末に表示させ、前記確認画面に対するユーザの入力操作に応じて、前記第２映像の利用可否を決定し、前記第２映像を利用可能と決定した場合に、前記第２映像を前記サーバに保存し、前記第２映像を前記サーバから第２端末に提供する。

【0028】

【0029】

本開示の別の一態様に係る映像提供システムは、カメラにより撮影された映像をサーバに保存して端末に提供するシステムであって、第１映像に含まれる個人情報を示す対象物に対してマスキング処理を実行することにより、第２映像を生成し、前記第２映像を前記サーバに保存し、複数の前記第２映像の中から所望の前記第２映像を検索するための検索画面を第２端末に表示させ、前記検索画面に対するユーザの入力操作に応じて、前記第２映像の検索条件を決定し、前記サーバに保存された複数の前記第２映像の中から、前記決定された検索条件に対応する前記第２映像を少なくとも一つ抽出し、前記抽出された前記第２映像を前記第２端末に提供する。

【0030】

上記構成によれば、サーバに保存された複数の第２映像の中から検索条件に合致する所望の第２映像を第２端末に提供することが可能となるため、映像の検索性の文脈において映像提供システムのユーザビリティを向上させることが可能となる。

【0031】

本開示の一態様に係る映像提供方法は、カメラにより撮影された映像をサーバに保存して端末に提供する映像提供システムにより実行され、実行すべきマスキング処理の設定画面を第１端末に表示させるステップと、前記設定画面に対するユーザの入力操作に応じて、前記マスキング処理の種類を決定するステップと、第１映像に含まれる個人情報を示す対象物に対して、前記決定された種類のマスキング処理を実行することにより、第２映像を生成するステップと、前記第２映像を前記サーバに保存するステップと、前記第２映像を前記サーバから第２端末に提供するステップと、を含む。

【0032】

また、前記映像提供方法を映像提供システムに実行させる映像提供プログラムが提供される。

【発明の効果】

【0033】

本開示によれば、映像に対するマスキング処理の文脈において映像提供システムのユーザビリティを向上させることができる。

【図面の簡単な説明】

【0034】

【図1】本開示の実施形態（以下、本実施形態という。）に係る映像提供システムを示す図である。

【図2】カメラのハードウェア構成の一例を示す図である。

【図3】サーバのハードウェア構成の一例を示す図である。

【図4】ユーザ端末のハードウェア構成の一例を示す図である。

【図5】本実施形態に係る映像提供システムによって実行される一連の処理を説明するためのフローチャートである。

【図6】ユーザ端末上に表示される映像表示画面の一例を示す図である。

【図7】ユーザ端末上に表示される設定画面の一例を示す図である。

【図8】人の顔に実行されるマスキング処理を説明するための図であって、（ａ）は、元の顔を示す図であり、（ｂ）は、モザイク処理を説明するための図であり、（ｃ）は、ぼかし処理を説明するための図であり、（ｄ）は、ディープマスキング処理を説明するための図である。

【図9】マスキングタスク一覧画面の一例を示す図である。

【図10】ユーザ端末上に表示される映像比較画面の一例を示す図である。

【図11】ユーザ端末上に表示されるデータ登録画面の一例を示す図である。

【図12】映像管理データの一例を示す図である。

【図13】映像検索画面の一例を示す図である。

【発明を実施するための形態】

【0035】

（システムの構成）
以下、本実施形態に係る映像提供システム１について図面を参照しながら説明する。図１は、本実施形態に係る映像提供システム１を示す図である。図１に示すように、映像提供システム１は、カメラ２と、サーバ３と、ユーザ端末４と、企業側端末５とを備える。これらは通信ネットワーク８に接続されている。複数のカメラ２の各々は、通信ネットワーク８を介してサーバ３に通信可能に接続されている。本例では、２台のカメラ２が図示されているが、映像提供システム１に設けられるカメラ２の台数は特に限定されるものではなく、３台以上のカメラ２が設けられてもよい。サーバ３は、通信ネットワーク８を介してユーザ端末４及び企業側端末５に通信可能に接続されている。通信ネットワーク８は、ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）、ＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）、インターネット、無線コアネットワークのうちの少なくとも一つによって構成されている。尚、本実施形態に係る映像提供システム１では、説明の便宜上、それぞれ一つのサーバ３、ユーザ端末４、企業側端末５が図示されているが、これらの台数は特に限定されるものではない。

【0036】

（カメラ２の構成）
次に、カメラ２のハードウェア構成について以下に説明する。図２は、カメラ２のハードウェア構成の一例を示す図である。カメラ２は、撮影を通じて自身の周辺環境を示す映像データを取得するように構成されており、コンビニやレストラン等の店舗の内部若しくは周辺に配置されてもよい。図２に示すように、カメラ２は、制御部２０と、記憶装置２１と、位置情報取得部２２と、通信部２４と、入力操作部２５と、撮像部２６と、ＰＴＺ機構２７とを備える、これらの要素は通信バス２８に接続されている。また、カメラ２にはバッテリ（図示せず）が内蔵されてもよい。さらに、カメラ２にはマイクやスピーカが設けられてもよい。

【0037】

制御部２０は、メモリとプロセッサを備えている。メモリは、コンピュータ可読命令（プログラム）を記憶するように構成されている。例えば、メモリは、各種プログラム等が格納されたＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）やプロセッサにより実行される各種プログラム等が格納される複数ワークエリアを有するＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）等から構成される。プロセッサは、例えば、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、ＭＰＵ（ＭｉｃｒｏＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）及びＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）のうちの少なくとも一つにより構成される。ＣＰＵは、複数のＣＰＵコアによって構成されてもよい。ＧＰＵは、複数のＧＰＵコアによって構成されてもよい。プロセッサは、記憶装置２１又はＲＯＭに組み込まれた各種プログラムから指定されたプログラムをＲＡＭ上に展開し、ＲＡＭとの協働で各種処理を実行するように構成されてもよい。

【0038】

記憶装置２１は、例えば、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）、フラッシュメモリ等の記憶装置（ストレージ）であって、プログラムや各種データを格納するように構成されている。位置情報取得部２２は、カメラ２の位置情報（経度、緯度）を取得するように構成されており、例えば、ＧＰＳ（ＧｌｏｂａｌＰｏｓｉｔｉｏｎｉｎｇＳｙｓｔｅｍ）受信機である。

【0039】

通信部２４は、カメラ２を通信ネットワーク８に接続するように構成されている。通信部２４は、例えば、基地局や無線ＬＡＮルータ等の外部機器と無線通信するための無線通信モジュールを含んでいる。無線通信モジュールは、送受信アンテナと、信号処理回路とを備える。無線通信モジュールは、Ｗｉ－Ｆｉ（登録商標）やＢｌｕｅｔｏｏｔｈ（登録商標）等の近距離無線通信規格に対応した無線通信モジュールであってもよいし、ＳＩＭ（ＳｕｂｓｃｒｉｂｅｒＩｄｅｎｔｉｔｙＭｏｄｕｌｅ）を用いた第Ｘ世代移動体通信システム（例えば、ＬＴＥ等の第４世代移動通信システム）に対応する無線通信モジュールであってもよい。

【0040】

入力操作部２５は、操作者の入力操作を受け付けると共に、操作者の入力操作に応じた操作信号を生成するように構成されている。撮像部２６は、カメラ２の周辺環境を撮像するように構成されている。特に、撮像部２６は、カメラ２の周辺環境を示す映像信号を生成するように構成されており、光学系と、イメージセンサと、アナログ処理回路とを備える。光学系は、例えば、光学レンズと、カラーフィルタとを含む。イメージセンサは、ＣＣＤ（Ｃｈａｒｇｅ－ＣｏｕｐｌｅｄＤｅｖｉｃｅ）又はＣＭＯＳ（相補型ＭＯＳ）等によって構成される。アナログ処理回路は、イメージセンサによって光電変換された映像信号（アナログ信号）を処理するように構成され、例えば、増幅器及びＡＤ変換器を含む。

【0041】

ＰＴＺ機構２７は、パン（Ｐａｎｏｒａｍａｃ）機構と、チルト（Ｔｉｌｔ）機構と、ズーム（Ｚｏｏｍ）機構とを備える。パン機構は、水平方向におけるカメラ２の向きを変更するように構成されている。チルト機構は、垂直方向におけるカメラ２の向きを変更するように構成されている。ズーム機構は、カメラ２の画角を変更することで、撮像対象物を示す画像を拡大（ズームイン）または縮小（ズームアウト）するように構成されている。ズーム機構は、撮像部２６に含まれる光学レンズの焦点距離を変更することで光学的にカメラ２の画角を変更してもよいし、デジタル的にカメラ２の画角を変更してもよい。本実施形態では、ユーザ端末４に対するユーザＵの入力操作に応じて、カメラ２をパン、チルト及び／又はチルトを指示する指示信号がユーザ端末４からサーバ３を介してカメラ２に送信される。この場合、制御部２０は、受信した指示信号に応じてＰＴＺ機構２７を駆動させることで、カメラ２のパン・チルト・ズームの各機能（ＰＴＺ機能）をリアルタイムで実現させる。このように、ユーザ端末４の遠隔操作を通じてカメラ２のＰＴＺ機能を実現することができる。

【0042】

カメラ２は、通信ネットワーク８を介してカメラ２の周辺環境を示す映像（映像データストリーム）をサーバ３にリアルタイムに送信することができる。

【0043】

（サーバ３の構成）
次に、サーバ３のハードウェア構成について以下に説明する。図３は、サーバ３のハードウェア構成の一例を示す図である。サーバ３は、通信ネットワーク８を介してカメラ２から映像データを受信すると共に、ユーザ端末４からの映像送信要求に応じて当該映像データをユーザ端末４に送信するように構成されている。サーバ３は、複数のサーバによって構成されてもよい。サーバ３は、ＷＥＢアプリケーションとしてクラウド型の映像配信アプリケーションを提供するように構成されたＷＥＢサーバとして機能する。この点において、サーバ３は、映像表示画面５０（図６参照）をユーザ端末４のＷＥＢブラウザに表示するためのデータ（例えば、ＨＴＭＬファイル、ＣＳＳファイル、画像・映像ファイル、プログラムファイル等）を送信するように構成されている。このように、サーバ３は、ＳａａＳ（ＳｙｓｔｅｍａｓａＳｅｒｖｉｃｅ）を提供するためのサーバとして機能している。サーバ３は、オンプレミスで構築されてもよいし、クラウドサーバであってもよい。

【0044】

図３に示すように、サーバ３は、制御部３０と、記憶装置３１と、入出力インターフェース３２と、通信部３３と、入力操作部３４と、表示部３５とを備える。これらの要素は通信バス３６に接続されている。

【0045】

制御部３０は、メモリとプロセッサを備えている。メモリは、コンピュータ可読命令を記憶するように構成されている。特に、メモリには、サーバ３によって実行される一連の処理をプロセッサに実行させるためのプログラムが記憶されてもよい。メモリは、ＲＯＭ及びＲＡＭにより構成されている。プロセッサは、ＣＰＵ、ＭＰＵ及びＧＰＵのうちの少なくとも一つにより構成される。

【0046】

記憶装置３１は、例えば、ＨＤＤ、ＳＳＤ、フラッシュメモリ等の記憶装置（ストレージ）であって、プログラムや各種データを格納するように構成されている。記憶装置３１には、ユーザ管理データと、カメラ管理データとが保存されている。また、記憶装置３１には、元の映像データ（マスキング処理前の映像データ）と、元の映像データに関連付けられたメタデータと、マスキングタスクデータと、画像認識モデル（学習モデル）とが保存されている。さらに、記憶装置３１には、マスキング処理後の映像データ（学習データ）と、マスキング処理後の映像データに関連付けられたメタデータと、映像データに含まれる各対象物（例えば、人や車両等）の属性を示す属性情報が保存されている。さらに、記憶装置３１には、マスキング処理後の複数の映像データを管理するための映像管理データ（映像管理テーブル）が保存されている。

【0047】

ユーザ管理データは、映像提供システム１を利用する各ユーザＵの管理情報を含む。カメラ管理データは、各カメラ２の管理情報を含む。元の映像データには、人の顔や車両のナンバープレート等の個人情報が含まれているため、個人情報保護法の順守の観点より映像データに対する外部からのアクセスは制限されている。この点において、映像提供システム１を提供する事業者であっても元の映像データに対するアクセスは制限され、カメラ２が設置された店舗を運営するユーザＵ（例えば、カメラ２のオーナーである店長や、オーナーからカメラの映像へのアクセスを許可された店員等）のみが映像データにアクセスすることができる。複数のカメラ２によって撮影された複数の映像データが記憶装置３１に保存されており、各元の映像データは所定日数が経過した後に記憶装置３１から削除されてもよい。

【0048】

元の映像データに関連付けられたメタデータは、映像データの管理に関する一連の情報を含んでもよい。映像データの管理に関する一連の情報は、例えば、映像データの識別情報、撮影時間情報、撮影場所情報、ユーザ情報、カメラ情報を含んでもよい。マスキングタスクデータは、マスキング処理のタスクに関する情報を含む（例えば、図９参照）。ここで、マスキング処理とは、映像データに含まれている個人情報を除去するための処理である。マスキング処理の種類や詳細については後述する。

【0049】

画像認識モデルは、機械学習により構築された学習済みモデルである。画像認識モデルは、互いに異なる種類の複数の画像認識モデルにより構成されてもよい。画像認識モデルは、画像データと、当該画像データに含まれる対象物（例えば、人や車両等）に関する情報とからなる学習データにより構築される。学習データは、画像データに対するアノテーション作業（タグ付け作業）により用意される。対象物に関する情報は、対象物の種類、属性、位置等を示す情報を含んでもよい。

【0050】

例えば、対象物の種類が人である場合には、対象物に関する情報は、対象物が人であることを示す情報と、人の属性情報と、人の顔の位置を示す顔領域情報とを含んでもよい。顔領域情報は、人の顔を囲む矩形領域を構成する４つの頂点のうち対角線上の２つの頂点の座標情報により特定されてもよい。人の属性情報は、性別、年齢、マスク着用の有無、顔角度や表情等の顔情報を含んでもよい。また、対象物の種類が車両（自動車やバイク等）である場合には、対象物に関する情報は、対象物が車両であることを示す情報と、車両の属性情報と、車両のナンバープレートの位置を示すナンバープレート領域情報とを含んでもよい。

【0051】

複数の対象物を示す映像データが画像認識モデルに入力される場合には、当該映像データを構成する各フレームに含まれる対象物の種類、属性、位置等を示す情報が画像認識モデルから出力されてもよい。例えば、複数の人を示す映像データが画像認識モデルに入力される場合には、各人の属性情報（性別、年齢、マスク着用の有無、顔角度、表情等）、顔領域情報が画像認識モデルから出力されてもよい。また、複数の車両を示す映像データが画像認識モデルに入力される場合には、各車両のナンバープレート領域情報が画像認識モデルから出力されてもよい。

【0052】

マスキング処理後の映像データ（マスキング処理が実行された映像データ）では、マスキング処理を通じて映像データ中に含まれている個人情報が除去されている。このため、マスキング処理後の映像データに対する外部からのアクセスは制限されていない。このように、人工知能（ＡＩ）を開発するＡＩ開発会社Ｋは、機械学習モデル（機械学習を活用した画像認識モデル）を構築するための学習データとしてマスキング処理後の映像データを利活用することが可能となる。マスキング処理後の映像データに関連付けられたメタデータは、マスキング処理後の映像データに関する一連の情報（例えば、映像データの識別情報、撮影時間情報、撮影場所情報、マスキング処理情報等）を含んでもよい。マスキング処理後の映像データは学習データとして利活用されるため、メタデータには映像データの検索性を向上させるための情報が含まれている。

【0053】

映像データに含まれる対象物が人である場合には、当該対象物の属性情報は、人の性別情報、年齢情報、顔角度情報、表情情報とのうちの少なくとも一つを含んでもよい。この点において、制御部３０は、記憶装置３１内に保存された画像認識モデルを用いることで映像データに含まれる各対象物の属性情報を取得してもよい。このように、画像認識モデルを通じて取得された各対象物の属性情報は、マスキング処理後の映像データに関連付けられた状態で記憶装置３１内に保存される。具体的には、映像データに含まれる各対象物には識別情報が付与されており、各対象物の識別情報と属性情報が互いに関連付けられてもよい。

【0054】

入出力インターフェース３２は、外部装置とサーバ３との間の接続を可能とするインターフェースであって、ＵＳＢ規格やＨＤＭＩ（登録商標）規格等の所定の通信規格に応じたインターフェースを含む。通信部３３は、通信ネットワーク８上の外部端末と通信するための各種有線通信モジュールを含んでもよい。入力操作部３４は、例えば、タッチパネル、マウス、及び／又はキーボード等であって、操作者の入力操作を受け付けると共に、操作者の入力操作に応じた操作信号を生成するように構成されている。表示部３５は、例えば、映像表示ディスプレイと映像表示回路とによって構成されている。

【0055】

（ユーザ端末４の構成）
次に、ユーザ端末４（第一端末の一例）の構成について以下に説明する。図４は、ユーザ端末４のハードウェア構成の一例を示す図である。図１に示すように、ユーザ端末４は、カメラ２が配置された店舗を運営するユーザＵにより操作される。ユーザ端末４は、通信ネットワーク８を介してサーバ３に通信可能に接続されている。ユーザ端末４は、例えば、パーソナルコンピュータ、スマートフォン、タブレット又はユーザＵに装着されたウェアラブルデバイスであってもよい。ユーザ端末４は、ＷＥＢブラウザを有する。サーバ３によって提供される映像配信アプリケーションは、ユーザ端末４のＷＥＢブラウザ上で動作するものとする。なお、映像配信アプリケーションは、特にユーザ端末４がスマートフォンやタブレット等である場合、ＷＥＢブラウザの代わりに、ユーザ端末４にダウンロードされるソフトウェア上で動作してもよい。

【0056】

図４に示すように、ユーザ端末４は、制御部４０と、記憶装置４１と、入出力インターフェース４２と、通信部４３と、入力操作部４４と、表示部４５とを備えている。これらの要素は通信バス４６に接続されている。ユーザ端末４は、サーバ３の記憶装置３１内に保存されたデータのうち、そのユーザがオーナーとなっているカメラで撮影された映像であれば、マスキング処理後の映像データのみならず、アクセス制限領域のデータにもアクセス可能である。一方、そのユーザ以外がオーナーとなっているカメラで撮影された映像については、マスキング処理後の映像データのみならず、アクセス制限領域のデータにもアクセス不可能である。

【0057】

制御部４０は、メモリとプロセッサを備えている。メモリは、コンピュータ可読命令を記憶するように構成されている。特に、メモリには、ユーザ端末４によって実行される一連の処理をプロセッサに実行させるためのプログラムが記憶されてもよい。メモリは、ＲＯＭ及びＲＡＭにより構成されている。プロセッサは、ＣＰＵ、ＭＰＵ及びＧＰＵのうちの少なくとも一つにより構成される。記憶装置４１は、例えば、ＨＤＤ、ＳＳＤ、フラッシュメモリ等の記憶装置であって、プログラムや各種データを格納するように構成されている。

【0058】

入出力インターフェース４２は、外部装置とユーザ端末４との間の接続を可能とするインターフェースである。通信部４３は、ユーザ端末４を通信ネットワーク８に接続するように構成されている。通信部４３は、例えば、基地局や無線ＬＡＮルータ等の外部機器と無線通信するための無線通信モジュールと有線通信モジュールとを含んでいる。入力操作部４４は、例えば、表示部４５の映像表示ディスプレイに重ねて配置されたタッチパネル、マウス、及び／又はキーボードであって、ユーザＵの入力操作を受け付けると共に、当該入力操作に応じた操作信号を生成するように構成されている。表示部４５は、例えば、映像表示ディスプレイと、当該映像表示ディスプレイを駆動制御する映像表示回路とによって構成される。

【0059】

（企業側端末５の構成）
図１に示すように、企業側端末５（第二端末の一例）は、ＡＩ開発会社Ｋによって操作される端末である。企業側端末５は、例えば、パーソナルコンピュータ、スマートフォン、タブレット又はＡＩ開発会社Ｋの担当者に装着されたウェアラブルデバイスであってもよい。企業側端末５のハードウェア構成は、ユーザ端末４のハードウェア構成と同一であってもよい。企業側端末５は、通信ネットワーク８を介してサーバ３に通信可能に接続されている。企業側端末５は、サーバ３の記憶装置３１内に保存されたデータのうち、様々なユーザがオーナーとなっているカメラで撮影された映像について、マスキング処理後の映像データにアクセス可能であるが、アクセス制限領域のデータにはアクセス不可能である。

【0060】

（映像提供システムによって実行される一連の処理の流れ）
次に、図５を参照して本実施形態に係る映像提供システム１によって実行される一連の処理の流れについて以下に説明する。図５は、映像提供システム１によって実行される一連の処理を説明するためのフローチャートである。図５に示すように、ステップＳ１において、サーバ３は、通信ネットワーク８を介して各カメラ２から映像データを受信した上で、当該受信した映像データ（元の映像データ）を記憶装置３１に保存する。次に、ステップＳ２において、サーバ３は、ユーザ端末４から映像データの送信要求を受信する。ステップＳ３において、サーバ３は、ユーザ端末４からの送信要求に応じて、映像データをユーザ端末４に送信する。より具体的には、サーバ３は、映像データが表示された映像表示画面５０（図６参照）を表示するためのデータ（ＨＴＭＬファイル、ＣＳＳファイル、画像・映像ファイル、プログラムファイル等）をユーザ端末４に送信する。その後、ユーザ端末４のＷＥＢブラウザ上に映像表示画面５０が表示される（ステップＳ４）。

【0061】

図６に示すように、映像表示画面５０は、映像データが表示される映像表示領域５２と、再生時間を示すタイムライン８２と、タイムライン８２上をスライド可能なスライダ８３とを有する。この様な画面をビューアという。ユーザＵは、ビューアのタイムライン８２上においてスライダ８３を移動させることで、映像データの再生時刻を変更することができる。例えば、ユーザＵがスライダ８３の位置を１５：００に変更した場合、ユーザ端末４は、１５：００の前後の時間帯における映像データの送信要求をサーバ３に送信する。サーバ３は、当該送信要求に応じて、１５：００の前後の時間帯における映像データをユーザ端末４に送信する。このように、１５：００の前後の時間帯における映像データが映像表示領域５２に表示される。なお、時刻以外に、例えばカレンダー等により年月日の情報をそれぞれ指定可能としてもよい。また、タイムライン８２上でユーザＵが期間（始点／終点）を指定することにより、その期間を切り取ってムービークリップを作成可能としてもよい。

【0062】

次に、ユーザ端末４は、ユーザ端末４に対するユーザＵの入力操作に応じて、映像データに対して実行されるマスキング処理の設定に関連する設定画面６０（図７参照）の送信要求をサーバ３に送信する（ステップＳ５）。サーバ３は、ユーザ端末４の送信要求に応じて、設定画面６０を表示するためのデータをユーザ端末４に送信する（ステップＳ６）。その後、ユーザ端末４は、設定画面６０を表示するためのデータを受信した上で、ＷＥＢブラウザ上に設定画面６０を表示する（ステップＳ７）。

【0063】

図７に示すように、設定画面６０は、マスキング処理の設定に関連する画面、特に、マスキングタスクを登録するための画面である。設定画面６０上には、マスキングタスク名入力領域６３と、登録日時表示領域６４と、映像データ選択領域６５と、マスキング処理選択領域６７と、タスク登録ボタン６８がそれぞれ設けられている。マスキングタスク名入力領域６３においてマスキングタスク名が入力可能となる。登録日時表示領域６４において、マスキングタスクを登録する日時が表示される。映像データ選択領域６５において、マスキング処理が実行される映像データが選択可能となる。例えば、ユーザＵに関連付けられた複数のカメラ２がＡ店舗を示す映像データ、Ｂ店舗を示す映像データ、Ｃ店舗を示す映像データ、Ｄ店舗を示す映像データを取得する場合に、映像データ選択領域６５には、Ａ店舗からＤ店舗の映像データが選択可能となる。

【0064】

また、サーバ３の記憶装置３１には所定日数分の連続した各映像データ（Ａ店舗からＤ店舗の映像データ）が保存されているため、マスキング処理が実行される映像データについて、その映像を撮影した店舗を指定する店舗指定領域（図示せず）、その映像を撮影したカメラを指定するカメラ指定領域（図示せず）、その映像が撮影された期間を指定するための期間指定領域（図示せず）等が設定画面６０上に設けられてもよい。その場合、例えば、カメラ指定領域でカメラを指定すると、図６の画面が表示され、そこで前述したムービークリップの機能を利用して所望の期間を指定可能としてもよい。また、例えば、カメラ指定領域でカメラを指定すると、そのカメラでムービークリップの機能を利用して作成済の映像の一覧が表示され、その中から所望の映像を選択可能としてもよい。また、カメラを指定する前に、店舗指定領域で店舗を指定すると、その店舗のカメラを絞り込んでカメラ指定領域に表示するようにしてもよい。

【0065】

マスキング処理選択領域６７には、映像データに含まれる個人情報を示す対象物（例えば、人の顔等）に対して実行されるマスキング処理が選択可能となる。図７では、マスキング処理の一例として、ディープマスキング処理、モザイク処理、ぼかし処理、文字モザイク処理等がマスキング処理選択領域６７上において選択可能となっている。本例では、ユーザＵは、マスキング処理選択領域６７に示すディープマスキング処理、モザイク処理、ぼかし処理のうちのいずれか一つのマスキング処理を選択することができる。さらに、ユーザＵは、文字モザイク処理を追加で選択可能となる。

【0066】

次に、マスキング処理の種類について図８を参照することで以下に説明する。なお、図８の情報は、例えばマスキング処理選択領域６７等のヘルプとして表示可能としてもよい。図８（ａ）に示すように、マスキング処理前の元の顔（対象物の一例）は、個人情報の特定を可能にする。また、マスキング処理前の元の顔は、ＡＩ（画像認識モデル）による人の認識を可能にすると共に、属性情報の特定を可能にする。属性情報の一例としては、対象物の年齢、性別、マスク着用の有無、顔角度、表情に関する情報が挙げられるが、属性情報の種類は特に限定されるものではない。

【0067】

図８（ｂ）に示すように、モザイク処理後の顔は、個人情報の特定を不可能にする。また、モザイク処理後の顔は、ＡＩによる人の認識を不可能とすると共に、属性情報の特定を不可能とする。このように、モザイク処理（第１マスキング処理の一例）では、対象物の個人情報だけでなく対象物の種類と属性に関する情報も除去される。

【0068】

図８（ｃ）に示すように、ぼかし処理後の顔は、個人情報の特定を不可能にする。また、ぼかし処理後の顔は、ＡＩによる人の認識を可能とする一方で、属性情報の特定を不可能とする。このように、ぼかし処理（第２マスキング処理の一例）では、対象物の個人情報だけでなく対象物の属性に関する情報も除去される。その一方、ぼかし処理では、対象物の種類に関する情報は除去されない。

【0069】

図８（ｄ）に示すように、ディープマスキング処理後の顔は、個人情報の特定を不可能にする。また、ディープマスキング処理後の顔は、ＡＩによる人の認識を可能とすると共に、属性情報の特定を可能とする。このように、ディープマスキング処理（第３マスキング処理の一例）では、対象物の個人情報が除去される一方で、対象物の種類及び属性に関する情報は除去されない。

【0070】

このように、モザイク処理＞ぼかし処理＞ディープマスキング処理の順番で、映像データに示される対象物に関する情報の削除量が大きくなる。マスキング処理後の映像データに含まれる人の属性情報を機械学習において利用してもらっても良いと考える場合には、ユーザＵは、マスキング処理選択領域６７を通じて対象物の属性情報が削除されないディープマスキング処理を選択するであろう。その一方で、人の顔の属性情報を機械学習において利用してもらっては困ると考える場合には、ユーザＵは、マスキング処理選択領域６７を通じてモザイク処理又はぼかし処理を選択するであろう。

【0071】

文字モザイク処理は、個人情報に相当する文字情報に対して実行される。例えば、車両のナンバープレートに示される車両識別情報は個人情報に相当するため、当該車両識別情報に対してモザイク処理が実行される。その場合において、ユーザのマスキング処理の種類に対する考え方は、人の顔に対するものと同様である。

【0072】

図５に戻ると、ステップＳ８において、ユーザ端末４は、表示部４５に表示された設定画面６０に対するユーザＵの入力操作（具体的には、タスク登録ボタン６８に対するユーザＵの操作）に応じて、マスキング処理の設定に関連する一連の情報（より具体的には、マスキングタスク名、登録日時、映像データの選択、マスキング処理の選択に関する情報）をサーバ３に送信する。

【0073】

次に、サーバ３（具体的には、サーバ３の制御部３０）は、ユーザ端末４から受信したマスキング処理の設定に関連する一連の情報に基づいて、マスキング処理の対象となる映像データと、当該映像データに対して実行されるマスキング処理を決定する。その後、サーバ３は、マスキング処理の対象となる映像データに含まれる個人情報を示す各対象物（特に、人）の属性情報を取得及び保存する（ステップＳ９）。より具体的には、サーバ３は、画像認識モデルを用いることで映像データに含まれる各対象物の属性情報を取得した上で、当該取得した属性情報を記憶装置３１に保存する。

【0074】

ステップＳ１０において、サーバ３は、選択対象となる映像データに対してマスキング処理を実行する。例えば、ユーザＵによってディープマスキング処理が選択されている場合には、サーバ３は、映像データに含まれる個人情報を示す各対象物に対してディープマスキング処理を実行する。より具体的には、サーバ３は、画像認識モデルを用いることで映像データの各フレームに含まれる人の顔領域情報と属性情報を特定する。次に、サーバ３は、特定された顔領域情報と属性情報に基づいて、個人情報を示す人の顔に対してディープマスキング処理を実行する。また、ユーザＵによってモザイク処理又はぼかし処理が選択されている場合には、サーバ３は、映像データに含まれる個人情報を示す各対象物に対してモザイク処理又はぼかし処理を実行する。より具体的には、サーバ３は、画像認識モデルを用いることで映像データの各フレームに含まれる人の顔領域情報を特定する。次に、サーバ３は、特定された顔領域情報に基づいて、個人情報を示す人の顔に対してモザイク処理又はぼかし処理を実行する。なお、これらマスキング処理は元の映像データをコピーしたものに対して行うが、処理が正常に完了した後、元の映像データは削除してもよいし、保持し続けてもよい。

【0075】

映像データに対してマスキング処理が実行された後に、サーバ３は、記憶装置３１に保存されたマスキングタスクデータを更新する（ステップＳ１１）。図９に示すように、マスキングタスクデータは、マスキング処理のタスクに関する情報を含む。図９に示すように、マスキングタスクデータは、マスキングタスク名に関する情報と、マスキングタスクの登録日時に関する情報と、マスキング処理の結果に関する情報と、マスキング処理の評価に関する情報と、マスキング処理が実行される映像データ名に関する情報とを含んでもよい。サーバ３は、映像データに対してマスキング処理を実行した後に、当該マスキング処理のタスクに関する情報をマスキングタスクデータ上に登録する。例えば、マスキング処理が正常終了した場合には、マスキング処理が正常終了したことを示す情報がマスキングタスクデータ上に記録される。一方、マスキング処理が異常終了した場合には、マスキング処理が異常終了したことを示す情報（エラー情報）がマスキングタスクデータ上に記録される。

【0076】

ステップＳ１２において、サーバ３は、更新されたマスキングタスクデータに基づいてマスキングタスク一覧画面７０（図９参照）を生成した上で、マスキングタスク一覧画面７０を表示するためのデータ（ＨＴＭＬファイル、ＣＳＳファイル、画像・映像ファイル、プログラムファイル等）をユーザ端末４に送信する。その後、ユーザ端末４のＷＥＢブラウザ上にマスキングタスク一覧画面７０が表示される。

【0077】

図９に示すように、マスキングタスク一覧画面７０では、マスキング処理のタスクに関する各種情報が表示される。具体的には、マスキングタスク名に関する情報と、マスキングタスクの登録日時に関する情報と、マスキング処理の結果に関する情報と、マスキング処理の評価に関する情報と、マスキング処理が実行される映像データ名に関する情報がマスキングタスク一覧画面７０上に表示される。なお、その他の情報として、店舗指定領域にて指定された店舗（図示せず）、カメラ指定領域にて指定されたカメラ（図示せず）、期間指定領域（図示せず）にて指定された期間等を併せて表示してもよい。

【0078】

マスキング処理の評価に関する情報は、映像データに含まれる各対象物に対してマスキング処理が適切に実行されているかどうかを示す評価情報を含む。より具体的には、マスキング処理の評価に関する情報は、マスキング処理が適切に実行されていることを示す情報（マスキング処理の承認）と、マスキング処理が適切に実行されていないことを示す情報（マスキング処理の非承認）とを含む。さらに、所定の映像データに対するマスキング処理が未だ評価されていない場合には、当該所定の映像データに視覚的に関連付けられた状態で評価ボタン７２がマスキングタスク一覧画面７０上に表示されてもよい。図９に示す例では、Ａ店舗の映像データに対するマスキング処理が未だ評価されていないため、Ａ店舗の映像データに視覚的に関連付けられた状態で評価ボタン７２がマスキングタスク一覧画面７０上に表示される。

【0079】

ステップＳ１３において、ユーザ端末４は、ユーザ端末４に対するユーザＵの入力操作に応じて、映像比較画面８０（図１０参照）の送信要求をサーバ３に送信する。具体的には、ユーザ端末４は、マスキングタスク一覧画面７０上に表示された評価ボタン７２に対するユーザＵの操作に応じて、映像比較画面８０の送信要求をサーバ３に送信する。サーバ３は、ユーザ端末４の送信要求に応じて、映像比較画面８０を表示するためのデータをユーザ端末４に送信する（ステップＳ１４）。その後、ユーザ端末４は、映像比較画面８０を表示するためのデータを受信した上で、ＷＥＢブラウザ上に映像比較画面８０を表示する（ステップＳ１５）。

【0080】

図１０に示すように、映像比較画面８０（映像の確認画面の一例）には、マスキング処理が実行された映像データＶ２（例えば、マスキング処理前のＡ店舗の映像データ）とマスキング処理が実行される前の映像データＶ１（例えば、マスキング処理後のＡ店舗の映像データ）とが並んで表示される。映像比較画面８０は、マスキング処理前の映像データＶ１が表示される映像表示領域８７と、マスキング処理後の映像データＶ２が表示される映像表示領域８８とを有する。映像表示領域８７と映像表示領域８８は並んで配置されている。映像比較画面８０では、映像表示領域８７に関連付けられたタイムライン８２ａとスライダ８３ａが設けられると共に、映像表示領域８８に関連付けられたタイムライン８２ｂとスライダ８３ｂが設けられる。映像データＶ１と映像データＶ２は、互いに連動（時間的に同期）して再生されてもよい。このとき、タイムライン８２ａとタイムライン８２ｂ、スライダ８３ａとスライダ８３ｂも、互いに連動してもよい。また、タイムラインとスライダのセットは、映像データＶ１と映像データＶ２で共通するものとして１セットのみ表示させてもよい。

【0081】

図１０に示す例では、映像表示領域８７に表示されたマスキング処理前の映像データＶ１において、個人情報を示す対象物Ｍ１～Ｍ４が存在するものとする。対象物Ｍ１は、個人情報を示す文字である。対象物Ｍ２～Ｍ４の各々は、人（より具体的には、人の顔）である。映像表示領域８８に表示されたマスキング処理後の映像データＶ２では、文字情報を示す対象物Ｍ１に対して文字モザイク処理が実行される。人の顔を示す対象物Ｍ２～Ｍ４の各々に対してディープマスキング処理が実行される。

【0082】

また、映像比較画面８０では、マスキング処理の承認を示す承認ボタン８４と、マスキング処理の非承認を示す非承認ボタン８５と、マスキング修正ボタン８６とがそれぞれ設けられる。ステップＳ１６において、ユーザ端末４は、ユーザ端末４に対するユーザＵの入力操作に応じて、マスキング処理に対する評価情報をサーバ３に送信する。ここで、マスキング処理に対する評価情報は、映像データに含まれる対象物に対してマスキング処理が適切に実行されているかどうかを示す情報である。例えば、ユーザＵが承認ボタン８４を操作した場合には、ユーザ端末４は、マスキング処理が適切に実行されていることを示す評価情報（マスキング処理の承認を示す情報）をサーバ３に送信する。一方、ユーザＵが非承認ボタン８５を操作した場合には、マスキング処理が適切に実行されていないことを示す評価情報（マスキング処理の非承認を示す情報）をサーバ３に送信する。例えば、対象物の顔領域内に適切にマスキング処理が施されていない場合に、ユーザＵは、映像データに含まれる対象物に対してマスキング処理が適切に実行されていないと決定するであろう。

【0083】

ステップＳ１７において、サーバ３は、ユーザ端末４から受信したマスキング処理に対する評価情報に基づいて、映像データに含まれる各対象物に対してマスキング処理が適切に実行されているかどうかを決定すると共に、マスキングタスクデータを更新する。特に、サーバ３は、当該評価情報に基づいて、マスキングタスクデータに含まれるマスキング処理の評価に関する情報を更新する。ここで、サーバ３は、マスキング処理が適切に実行されていることを示す評価情報を受信した場合には、映像データに含まれる各対象物に対してマスキング処理が適切に実行されていることを決定すると共に、マスキングタスクデータを更新する。その後、サーバ３は、データ登録画面９０（図１１参照）を表示するためのデータをユーザ端末４に送信する（ステップＳ１８）。その後、ユーザ端末４は、データ登録画面９０を表示するためのデータを受信した上で、ＷＥＢブラウザ上にデータ登録画面９０を表示する。

【0084】

尚、サーバ３は、マスキング処理が適切に実行されていないことを示す評価情報を受信した場合には、映像データに含まれる各対象物に対してマスキング処理が適切に実行されていないことを決定すると共に、マスキングタスクデータを更新する。その後、サーバ３は、映像データに対してマスキング処理を再度実行してもよい。また、ユーザＵは、マスキング修正ボタン８６を操作した上で、入力操作部４４を通じた入力操作（例えば、マウス操作等）により映像データＶ２のマスキング処理を修正してもよい。例えば、図１０の映像Ｖ２上で、Ｍ１～Ｍ４を選択してマスキング対象として除外したり、他の顔や文字の部分を選択してマスキング対象として追加したりしてもよい。また、併せてマスキングの種類を選択するＵＩを表示させ、その中から何れかを選択することによりマスキングの種類を変更可能としてもよい。この場合、ユーザ端末４は、ユーザＵの入力操作によるマスキング処理の修正に関する情報をサーバ３に送信する。次に、サーバ３は、ユーザ端末４から受信したマスキング処理の修正に関する情報に基づいて、マスキング処理後の映像データを更新してもよい。その後、サーバ３は、データ登録画面９０を表示するためのデータをユーザ端末４に送信してもよい。

【0085】

図１１に示すように、データ登録画面９０は、マスキング処理が実行された映像データを登録するための画面である。データ登録画面９０上には、マスキングタスク名表示領域９３と、マスキング処理表示領域９４と、映像データ名表示領域９５と、メタデータ利用可否選択領域９７と、映像関連情報表示領域９９と、データ登録ボタン９８がそれぞれ設けられている。マスキングタスク名表示領域９３には、マスキングタスク名が表示される。マスキング処理表示領域９４には、映像データに対して実行されたマスキング処理に関する情報が表示される。映像データに対してディープマスキング処理と文字モザイク処理が実行された場合には、マスキング処理表示領域９４上においてディープマスキング処理と文字モザイク処理が初期状態として選択されている。ユーザＵは、マスキング処理表示領域９４に対する入力操作を通じて、映像データに対して実行されたマスキング処理の種類を変更及び／又は追加することができる。映像データ名表示領域９５には、映像データ名に関する情報が表示される。なお、その他の情報として、店舗指定領域にて指定された店舗（図示せず）、カメラ指定領域にて指定されたカメラ（図示せず）、期間指定領域（図示せず）にて指定された期間等を併せて表示してもよい。

【0086】

メタデータ利用可否選択領域９７は、ユーザＵ以外の第三者（本例では、ＡＩ開発会社Ｋ）が映像データに紐づくメタデータを利用できるかどうかを選択するための領域である。ユーザＵは、メタデータ利用可否選択領域９７に対する入力操作を通じて、映像データに紐づくメタデータの利用可否を決定することができる。

【0087】

映像関連情報表示領域９９には、映像の時間（撮影時間）に関する情報と、映像のデータサイズに関する情報と、映像に含まれる対象物の種類に関する情報と、映像が撮影された場所に関する情報と、映像が撮影された業態に関する情報と、映像が撮影された地域に関する情報と、映像が撮影された時間帯に関する情報と、映像データの識別情報（ＩＤ）と、映像データに紐づくメタデータのＩＤとが表示される。

【0088】

対象物の種類に関する情報は、対象物が人若しくは車両（より具体的には、乗用車、自転車、バイク、特殊車両）であることを示す情報であってもよい。場所に関する情報は、撮影場所が屋内若しくは屋外を示す情報であってもよい。業態に関する情報は、業態が飲食（具体的には、居酒屋、レストラン）、小売（具体的には、コンビニ、スーパー、百貨店）、又は建設現場（具体的には、ビル、戸建て、道路）であることを示す情報であってもよい。地域に関する情報は、映像が撮影された国、都道府県、市区町村を示す情報であってもよい。この点において、映像が撮影された地域が国内（日本国内）である場合には、地域に関する情報は、都道府県および市区町村に関する情報を示してもよい。映像が撮影された地域が外国である場合には、地域に関する情報は、国及び都市に関する情報を示してもよい。時間帯に関する情報は、昼、夜、早朝、若しくは夕方を示す情報であってもよい。これらの情報は、カメラごとに予め設定された情報を基にセットしてもよいし、映像データを解析することによりセットしてもよい。

【0089】

図５に戻ると、ステップＳ１９において、ユーザ端末４は、データ登録画面９０に対するユーザＵの入力操作（具体的には、データ登録ボタン９８に対するユーザＵの操作）に応じて、マスキング処理後の映像データの登録指示を示す情報をサーバ３に送信する。映像データの登録指示を示す情報は、マスキング処理表示領域９４上において選択されたマスキング処理に関する情報（本例では、ディープマスキング処理と文字モザイク処理を示す情報）と、メタデータの利用可否に関する情報（本例では、メタデータの利用が可能であることを示す情報）とを含んでもよい。その後、サーバ３は、ユーザ端末４からの映像データの登録指示に応じて、マスキング処理後の映像データとメタデータとを記憶装置３１に保存する（ステップＳ２０）。ここで、元の映像データ（マスキング処理前の映像データ）には個人情報が含まれているため、元の映像データに対するユーザＵ以外の第三者のアクセスは制限されている。一方で、マスキング処理後の映像データには個人情報が含まれていないため、マスキング処理後の映像データに対する第三者（本例では、ＡＩ開発会社Ｋ）のアクセスは制限されていない。さらに、サーバ３は、記憶装置３１に保存された複数の映像データを管理するための映像管理データ（映像管理テーブル）を更新する（図１２参照）。

【0090】

図１２に示すように、映像管理データは、映像データのＩＤと、映像の時間と、映像のデータサイズと、映像に含まれる対象物の種類と、映像が撮影された場所（撮影場所）と、映像が撮影された業態と、映像が撮影された地域と、映像が撮影された時間帯と、メタデータの利用可否と、メタデータのＩＤとを含む。

【0091】

また、マスキング処理後の映像データに関連付けられたメタデータは、映像データの識別情報、映像データの撮影時間情報、映像データの撮影場所情報、映像データに対して実行されたマスキング処理に関する情報のうちの少なくとも一つを含んでもよい。メタデータの存在により、マスキング処理後の映像データの検索性を向上させることが可能となる。複数のマスキング処理後の映像データが記憶装置３１に保存される場合には、複数のメタデータの各々が複数のマスキング処理後の映像データのうちの対応する一つに関連付けられた状態で複数のメタデータが記憶装置３１に保存されてもよい。

【0092】

また、映像データに含まれる各対象物の属性情報は、マスキング処理後の映像データに関連付けられた状態で記憶装置３１に保存される。映像データに含まれる対象物が人である場合には、当該対象物の属性情報は、人の性別情報、年齢情報、顔角度情報、表情情報とのうちの少なくとも一つを含んでもよい。例えば、図１０に示すように、映像データに含まれる対象物Ｍ１～Ｍ４の識別情報と属性情報が映像データに関連付けられた状態で保存されてもよい。この場合、各対象物Ｍ１～Ｍ４の識別情報は、対象物Ｍ１～Ｍ４のうちの対応する一つに視覚的に関連付けられた状態で、マスキング処理後の映像データ上に表示されてもよい。

【0093】

ステップＳ２１において、サーバ３は、元の映像データを記憶装置３１から削除する。例えば、マスキング処理後のＡ店舗の映像データが記憶装置３１に保存された場合には、Ａ店舗の元の映像データが記憶装置３１から削除されてもよい。このように、マスキング処理が実行される前の元の映像データがサーバ３から削除されるため、サーバ３内に蓄積されたデータの容量を好適に抑えることが可能となり、サーバ３の維持管理コストを好適に低減することが可能となる。なお、元の映像データは、すぐに削除されるのではなく、少なくとも一定期間（ユーザの契約に係るクラウド利用の料金／容量／期間等に応じて）保持されるようにしてもよい。

【0094】

次に、ステップＳ２２において、企業側端末５は、ＡＩ開発会社Ｋの担当者の入力操作に応じて、映像検索画面１００（図１３参照）の送信要求をサーバ３に送信する。サーバ３は、当該送信要求の受信に応じて、映像検索画面１００を企業側端末５に送信する（ステップＳ２３）。

【0095】

ステップＳ２４において、企業側端末５は、映像検索画面１００に対するＡＩ開発会社Ｋの担当者の入力操作に応じて、映像データの検索条件に関する情報を取得する。その後、企業側端末５は、当該検索条件に関する情報をサーバ３に送信する（ステップＳ２５）。

【0096】

図１３に示すように、映像検索画面１００では、検索条件指定領域１０４と、送信ボタン１０５が表示される。検索条件指定領域１０４では、映像時間（撮影時間）、映像のデータサイズ、マスキング処理の種類、映像に映っている対象物の種類、映像が撮影された場所、映像が撮影された業態、映像が撮影された地域、映像が撮影された時間帯、及びメタデータの利用可否を検索条件として指定することができる。例えば、ＡＩ開発会社Ｋの担当者は、検索条件指定領域１０４を通じて映像データの検索条件を指定した上で、送信ボタン１０５を押したときに、企業側端末５は、当該指定された検索条件に関する情報をサーバ３に送信する。

【0097】

次に、ステップＳ２６において、サーバ３は、企業側端末５から映像データの検索条件に関する情報を受信する。その後、サーバ３は、当該受信した検索条件に関する情報に基づいて、記憶装置３１に保存された映像管理データを参照することで、記憶装置３１に保存された複数のマスキング処理後の映像データのうち検索条件に合致する少なくとも一つのマスキング処理後の映像データを抽出する。より具体的には、サーバ３は、映像管理データを参照することで、検索条件に合致する映像データのＩＤを特定した上で、当該映像データのＩＤに対応する映像データを記憶装置３１から取得する。

【0098】

次に、サーバ３は、当該抽出された少なくとも一つのマスキング処理後の映像データ（即ち、検索条件に合致する少なくとも一つのマスキング処理後の映像データ）と、当該抽出された少なくとも一つの映像データに含まれる各対象物の属性情報とを企業側端末５に送信する。このように、企業側端末５を操作するＡＩ開発会社Ｋは、映像検索画面１００に対する入力操作を通じて、検索条件に合致する所望の映像データを取得することが可能となる。より具体的には、ＡＩ開発会社Ｋは、映像データの時間に関する情報と、映像データのデータサイズに関する情報と、映像データに対して実行されたマスキング処理に関する情報と、映像データに含まれる対象物の種類に関する情報と、映像データが撮影された場所に関する情報と、映像データが撮影された業態に関する情報と、映像データが撮影された地域に関する情報と、映像データが撮影された時間帯に関する情報と、映像データに関連付けられたメタデータに関する情報の観点より、所望の映像データを取得することが可能となる。

【0099】

尚、マスキング処理としてモザイク処理又はぼかし処理が映像データに対して実行されている場合には、マスキング処理後の映像データには各対象物の属性情報が削除されているため、映像データと共に各対象物の属性情報が企業側端末５に送信されてもよい。この場合、各対象物の属性情報の存在によって、マスキング処理後の映像データを人の動作等に関連する機械学習モデルを構築するための学習データとして有効活用することができる。

【0100】

また、ステップＳ２６において、サーバ３は、検索条件に合致した少なくとも一つのマスキング処理後の映像データを企業側端末５に送信する前に、検索条件に合致した映像データのリストを示す映像リスト画面を企業側端末５に送信してもよい。この場合、企業側端末５は、映像リスト画面に対する担当者の入力操作を通じて、所望の映像データの送信要求をサーバ３に送信する。その後、サーバ３は、当該送信要求に応じて所望の映像データを企業側端末５に送信する。

【0101】

その一方で、マスキング処理としてディープマスキング処理が映像データに対して実行されている場合には、マスキング処理後の映像データには各対象物の属性情報が残されているため、各対象物の属性情報は企業側端末５に送信されなくてもよい。

【0102】

ステップＳ２７において、企業側端末５は、マスキング処理後の映像データと各対象物の属性情報をサーバ３から受信する。ＡＩ開発会社Ｋは、機械学習モデルを構築するための学習データとして、当該受信した映像データ等を有効活用する（ステップＳ２８）。

【0103】

本実施形態によれば、マスキング処理（換言すれば、個人情報の匿名化処理）の設定に関連する設定画面６０がユーザ端末４に表示された上で、設定画面６０に対するユーザＵの入力操作に応じてマスキング処理が決定される。その後、映像データに含まれる個人情報を示す対象物（例えば、人や車両等）に対して当該決定されたマスキング処理が実行された上で、マスキング処理が実行された映像データが企業側端末５に提供される。このように、ユーザＵは、映像データに対してどのようなマスキング処理を実行するべきかを設定画面６０を通じて決定することができるため、映像データに対するマスキング処理の文脈において映像提供システム１のユーザビリティを向上させることが可能となる。また、マスキング処理された映像データが企業側端末５に提供されるため、サーバ３に保存された映像データを有効活用することが可能となる。例えば、機械学習モデル（機械学習を活用した画像認識モデル）を構築するための学習データとしてマスキング処理された映像データを有効活用することができる。

【0104】

また、本実施形態によれば、映像比較画面８０がユーザ端末４に表示された上で、ユーザ端末４に対するユーザＵの入力操作に応じて、映像データに含まれる対象物（例えば、人や車両等）に対してマスキング処理が適切に実行されているかどうかが決定される。その後、マスキング処理が実行された映像データが企業側端末５に提供される。このように、ユーザＵは、映像比較画面８０を通じて映像データに対して適切にマスキング処理が実行されているかどうかを把握することができるため、映像データに対するマスキング処理の文脈において映像提供システム１のユーザビリティを向上させることが可能となる。さらに、個人情報保護法等の法令に合致した適切なマスキング処理が映像データに対して行われていることをユーザＵが客観的な視点から確認することができるため、マスキング処理に対する透明性や信頼性を十分に確保することが可能となる。このため、マスキング処理された映像データを提供されたＡＩ開発会社Ｋは、安心して当該映像データを機械学習モデルを構築するための学習データとして活用することが可能となる。

【0105】

以上、本発明の実施形態について説明をしたが、本発明の技術的範囲が本実施形態の説明によって限定的に解釈されるべきではない。本実施形態は一例であって、特許請求の範囲に記載された発明の範囲内において、様々な実施形態の変更が可能であることが当業者によって理解されるところである。本発明の技術的範囲は特許請求の範囲に記載された発明の範囲及びその均等の範囲に基づいて定められるべきである。

【符号の説明】

【0106】

１：映像提供システム、２：カメラ、３：サーバ、４：ユーザ端末、５：企業側端末、８：通信ネットワーク、２０：制御部、２１：記憶装置、２２：位置情報取得部、２４：通信部、２５：入力操作部、２６：撮像部、２７：ＰＴＺ機構、２８：通信バス、３０：制御部、３１：記憶装置、３２：入出力インターフェース、３３：通信部、３４：入力操作部、３５：表示部、３６：通信バス、４０：制御部、４１：記憶装置、４２：入出力インターフェース、４３：通信部、４４：入力操作部、４５：表示部、４６：通信バス、５０：映像表示画面、５２：映像表示領域、６０：設定画面、６３：マスキングタスク名入力領域、６４：登録日時表示領域、６５：映像データ選択領域、６７：マスキング処理選択領域、６８：タスク登録ボタン、７０：マスキングタスク一覧画面、７２：評価ボタン、８０：映像比較画面、８２，８２ａ，８２ｂ：タイムライン、８３，８３ａ，８３ｂ：スライダ、８４：承認ボタン、８５：非承認ボタン、８６：マスキング修正ボタン、８７，８８：映像表示領域、９０：データ登録画面、９３：マスキングタスク名表示領域、９４：マスキング処理表示領域、９５：映像データ名表示領域、９７：メタデータ利用可否選択領域、９８：データ登録ボタン、９９：映像関連情報表示領域、１００：映像検索画面、１０４：検索条件指定領域、１０５：送信ボタン、Ｋ：ＡＩ開発会社、Ｍ１，Ｍ２，Ｍ３，Ｍ４：対象物、Ｕ：ユーザ、Ｖ１，Ｖ２：映像データ

【要約】

【課題】映像に対するマスキング処理の文脈において映像提供システムのユーザビリティを向上させる。
【解決手段】映像提供システム１は、カメラ２により撮影された映像をサーバ３に保存して端末に提供する。映像提供システム１は、実行すべきマスキング処理の設定画面をユーザ端末４に表示させ、前記設定画面に対するユーザＵの入力操作に応じて、前記マスキング処理の種類を決定し、第１映像に含まれる個人情報を示す対象物に対して、前記決定された種類のマスキング処理を実行することにより、第２映像を生成し、前記第２映像をサーバ３に保存し、前記第２映像をサーバ３から企業側端末５に提供する。
【選択図】図１