IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社フロンティアの特許一覧

特開2023-72567ライブ配信システム、ライブ配信方法、及びライブ配信プログラム
<>
  • 特開-ライブ配信システム、ライブ配信方法、及びライブ配信プログラム 図1
  • 特開-ライブ配信システム、ライブ配信方法、及びライブ配信プログラム 図2
  • 特開-ライブ配信システム、ライブ配信方法、及びライブ配信プログラム 図3
  • 特開-ライブ配信システム、ライブ配信方法、及びライブ配信プログラム 図4
  • 特開-ライブ配信システム、ライブ配信方法、及びライブ配信プログラム 図5
  • 特開-ライブ配信システム、ライブ配信方法、及びライブ配信プログラム 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023072567
(43)【公開日】2023-05-24
(54)【発明の名称】ライブ配信システム、ライブ配信方法、及びライブ配信プログラム
(51)【国際特許分類】
   H04N 21/2343 20110101AFI20230517BHJP
   H04N 21/258 20110101ALI20230517BHJP
   G06Q 50/10 20120101ALI20230517BHJP
   G06Q 30/0217 20230101ALI20230517BHJP
【FI】
H04N21/2343
H04N21/258
G06Q50/10
G06Q30/02 338
【審査請求】有
【請求項の数】14
【出願形態】OL
(21)【出願番号】P 2021185206
(22)【出願日】2021-11-12
(11)【特許番号】
(45)【特許公報発行日】2022-05-12
(71)【出願人】
【識別番号】521496504
【氏名又は名称】株式会社フロンティア
(74)【代理人】
【識別番号】110002516
【氏名又は名称】弁理士法人白坂
(72)【発明者】
【氏名】市橋 秀幸
【テーマコード(参考)】
5C164
5L049
【Fターム(参考)】
5C164PA31
5C164SB02P
5C164SB41S
5C164SC11P
5C164YA08
5C164YA11
5L049CC18
(57)【要約】
【課題】配信者と視聴者とがコミュニケーションをとりながらリアルタイムで画像処理方法を決定可能なライブ配信システム、ライブ配信方法、及びライブ配信プログラムを提供する。
【解決手段】カメラと、マイクロフォンと、映像調整装置と、映像変換装置と、動画データを視聴者端末へ送信する配信サーバとを備えるライブ配信システムであって、映像変換装置は、映像編集部と、入出力部と、視聴者情報管理部と、視聴者情報記憶部とを備え、映像編集部は、特定の人物の顔画像データを用いて構築された学習モデルを記憶する画像データ記憶部と、動画データに映っている人物の顔の画像を抽出し、学習モデルの、特定の人物の顔の画像と一致する画像を判定する顔画像判定部と、顔の画像にたいして画像処理を行ったのち、データに基づき画像処理の方法を決定する画像処理部と、視聴者端末から送信されたデータに基づき画像処理を行う画像表示部とを備える。
【選択図】図5
【特許請求の範囲】
【請求項1】
ライブを撮影して1又は複数の映像データを生成するための1又は複数のカメラと、
前記ライブの音声を録音して1又は複数の音声データを生成するための1又は複数のマイクロフォンと、
前記1又は複数の映像データ及び前記1又は複数の音声データから動画データを生成する映像調整装置と、
前記動画データを編集する映像変換装置と、
編集された前記動画データを視聴者端末へ送信する配信サーバと
を備えるライブ動画を配信するライブ配信システムであって、前記映像変換装置は、
映像編集部と、
前記視聴者端末と、前記ライブ動画に対するコメントを前記ライブ動画において表現するための情報を含むコメントデータと、顔の画像に対する画像処理の方法をリクエストする情報を含むリクエストデータの送受信をする入出力部と、
1又は複数の視聴者の登録と認証を行う視聴者情報管理部と、
前記1又は複数の視聴者の視聴者情報、視聴者ID及びパスワードを記憶する視聴者情報記憶部と
を備え、前記映像編集部は、
予め撮影された画像データ内の、1又は複数の特定の人物に関するタグを付与された、1又は複数の特定の人物の顔画像データを用いて構築された学習モデルを記憶する画像データ記憶部と、
画像認識により、前記動画データの画像に映っている1又は複数の人物の顔の画像を抽出し、抽出された前記1又は複数の顔の画像の中に、前記学習モデルの、前記1又は複数の特定の人物の顔の画像と一致する画像があるかどうかを判定する顔画像判定部と、
前記顔画像判定部によって判定された前記1又は複数の顔の画像のうち、前記1又は複数の特定の人物の顔の画像と一致しない画像に対して顔の個人を特定することが困難となるように画像処理を行ったのち、前記視聴者端末から送信された前記リクエストデータに基づき画像処理を行う画像処理部と、
前記視聴者端末から送信された前記コメントデータに基づき前記コメントを前記ライブ動画に表示する画像処理を行う画像表示部と
を備えることを特徴とするライブ配信システム。
【請求項2】
前記画像処理は顔の画像に対するモザイク処理であり、前記画像処理部は、抽出された前記1又は複数の顔の画像のうち、前記1又は複数の特定の人物の顔の画像と一致しない画像にのみモザイク処理を行うことを特徴とする請求項1に記載のライブ配信システム。
【請求項3】
前記画像処理部は、抽出された前記1又は複数の顔の画像のうち、前記1又は複数の特定の人物の顔の画像と一致する画像と、一致しない画像とは、互いに異なる画像処理を行うことを特徴とする請求項1に記載のライブ配信システム。
【請求項4】
前記画像処理は顔の画像に対するモザイク処理であり、前記画像処理部は、前記リクエストデータに基づき、抽出された前記1又は複数の顔の画像に対して行うモザイク処理のモザイクの粗さを決定することを特徴とする請求項1に記載のライブ配信システム。
【請求項5】
前記画像処理は顔の画像に対するモザイク処理であり、前記画像処理部は、前記リクエストデータに基づき、抽出された前記1又は複数の顔の画像に対して行うモザイク処理のモザイクの範囲を決定することを特徴とする請求項1に記載のライブ配信システム。
【請求項6】
前記画像処理部は、前記リクエストデータに基づき、抽出された前記1又は複数の顔の画像のうち、画像処理を行う画像を決定することを特徴とする請求項1に記載のライブ配信システム。
【請求項7】
前記画像処理部による、前記リクエストデータに基づく画像処理の方法は、課金によって視聴者が決定可能となることを特徴とする請求項1に記載のライブ配信システム。
【請求項8】
前記画像処理部による、前記リクエストデータに基づく画像処理の方法は、前記視聴者による多数決によって決定されることを特徴とする請求項1に記載のライブ配信システム。
【請求項9】
前記視聴者による多数決によって決定される前記画像処理の方法の選択肢の内容は、前記画像表示部によって前記ライブ動画に表示された前記コメントにおいて提案され、前記1又は複数の特定の人物が前記コメントにおいて提案された前記選択肢の内容を了承することにより、前記ライブ動画に提案された前記選択肢が表示されることを特徴とする請求項8に記載のライブ配信システム。
【請求項10】
前記画像処理部は、前記リクエストデータに基づき、抽出された前記1又は複数の顔の画像のうち、どの顔画像に対して画像処理を行うかを決定することを特徴とする請求項1に記載のライブ配信システム。
【請求項11】
前記データ記憶部は、予め撮影されたマーカーの画像データを用いて構築されたマーカー学習モデルを更に記憶し、
前記画像処理部は、前記リクエストデータに基づき、マーカーを装着した人物の顔の画像に対して画像処理を行うことを特徴とする請求項1に記載のライブ配信システム。
【請求項12】
前記画像処理部による、前記リクエストデータに基づく画像処理の方法の決定は、前記視聴者が所定の条件を満たすことによって可能となることを特徴とする請求項1に記載のライブ配信システム。
【請求項13】
視聴者端末にライブ動画を配信するライブ配信方法であって、
ライブを撮影して1又は複数の映像データを生成する映像データ生成ステップと、
前記ライブの音声を録音して1又は複数の音声データを生成する音声データ生成ステップと、
前記1又は複数の映像データ及び前記1又は複数の音声データから動画データを生成する動画データ生成ステップと、
前記動画データを編集する映像編集ステップと、
編集された前記動画データを前記視聴者端末へ送信する配信ステップと、
1又は複数の視聴者の視聴者情報、視聴者ID及びパスワードを記憶する視聴者情報記憶ステップと、
前記1又は複数の視聴者の登録と認証を行う視聴者情報管理ステップと、
前記視聴者端末と、前記ライブ動画に対するコメントを前記ライブ動画において表現するための情報を含むコメントデータと、顔の画像に対する画像処理の方法をリクエストする情報を含むリクエストデータの送受信をする入出力ステップと、
を備え、前記映像編集ステップは、
画像認識により、前記動画データの画像に映っている1又は複数の人物の顔の画像を抽出する抽出ステップと、
抽出された前記1又は複数の顔の画像の中に、予め撮影された画像データ内の、1又は複数の特定の人物に関するタグを付与された、前記1又は複数の特定の人物の顔画像データを用いて構築された学習モデルの、前記1又は複数の特定の人物の顔の画像と一致する画像があるかどうかを判定する顔画像判定ステップと、
前記顔画像判定ステップにおいて判定された前記1又は複数の顔の画像のうち、前記1又は複数の特定の人物の顔の画像と一致しない画像に対して顔の個人を特定することが困難となるように画像処理を行ったのち、前記視聴者端末から送信された前記リクエストデータに基づき画像処理を行う画像処理ステップと、
前記視聴者端末から送信された前記コメントデータに基づき前記コメントを前記ライブ動画に表示する画像処理を行う画像表示ステップと
を備えることを特徴とするライブ配信方法。
【請求項14】
コンピュータに、
ライブを撮影して1又は複数の映像データを生成する映像データ生成機能と、
前記ライブの音声を録音して1又は複数の音声データを生成する音声データ生成機能と、
前記1又は複数の映像データ及び前記1又は複数の音声データから動画データを生成する動画データ生成機能と、
前記動画データを編集する映像編集機能と、
編集された前記動画データを視聴者端末へ送信する配信機能と、
1又は複数の視聴者の視聴者情報、視聴者ID及びパスワードを記憶する視聴者情報記憶機能と、
前記1又は複数の視聴者の登録と認証を行う視聴者情報管理機能と、
前記視聴者端末と、前記ライブ動画に対するコメントを前記ライブ動画において表現するための情報を含むコメントデータと、顔の画像に対する画像処理の方法をリクエストする情報を含むリクエストデータの送受信をする入出力機能と、
を備え、前記映像編集機能は、
画像認識により、前記動画データの画像に映っている1又は複数の人物の顔の画像を抽出する抽出機能と、
抽出された前記1又は複数の顔の画像の中に、予め撮影された画像データ内の、1又は複数の特定の人物に関するタグを付与された、前記1又は複数の特定の人物の顔画像データを用いて構築された学習モデルの、前記1又は複数の特定の人物の顔の画像と一致する画像があるかどうかを判定する顔画像判定機能と、
前記顔画像判定機能によって判定された前記1又は複数の顔の画像のうち、前記1又は複数の特定の人物の顔の画像と一致しない画像に対して顔の個人を特定することが困難となるように画像処理を行ったのち、前記視聴者端末から送信された前記リクエストデータに基づき画像処理を行う画像処理機能と、
前記視聴者端末から送信された前記コメントデータに基づき前記コメントを前記ライブ動画に表示する画像処理を行う画像表示機能と
を備えることを実現させるためのライブ配信プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ライブ配信システム、ライブ配信方法、及びライブ配信プログラムに関する。
【背景技術】
【0002】
スポーツ、音楽の演奏等をライブ配信する際、出演者に加えて観客が撮影されていることがある。観客席を撮影する場合、出演者と観客席とが互いに離れていれば、観客の個人が特定できない程度の解像度によって撮影されるなどの措置が取られる。出演者と観客との距離が近い場合など、出演者と観客が同時に映像内に映る場合は、特許文献1及び特許文献2に開示されているように、映像内の特定人物を除く人物の顔画像を画像処理することにより、観客の個人が特定できないようにすることができる。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2002-191044号公報
【特許文献2】特開2001―256496号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1及び特許文献2に開示されている方法によれば、画像処理を行わない特定人物、及び画像処理方法は配信者が決定しており、視聴者は配信された映像を視聴するのみであった。
【0005】
上記問題点を鑑み、本発明は、配信者と視聴者とがコミュニケーションをとりながらリアルタイムで画像処理方法を決定可能なライブ配信システム、ライブ配信方法、及びライブ配信プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の第1の態様は、ライブを撮影して1又は複数の映像データを生成するための1又は複数のカメラと、ライブの音声を録音して1又は複数の音声データを生成するための1又は複数のマイクロフォンと、1又は複数の映像データ及び又は複数の音声データから動画データを生成する映像調整装置と、動画データを編集する映像変換装置と、編集された動画データを視聴者端末へ送信する配信サーバとを備えるライブ動画を配信するライブ配信システムであって、映像変換装置は、映像編集部と、視聴者端末と、ライブ動画に対するコメントをライブ動画において表現するための情報を含むコメントデータと、顔の画像に対する画像処理の方法をリクエストする情報を含むリクエストデータの送受信をする入出力部と、1又は複数の視聴者の登録と認証を行う視聴者情報管理部と、1又は複数の視聴者の視聴者情報、視聴者ID及びパスワードを記憶する視聴者情報記憶部とを備え、映像編集部は、予め撮影された画像データ内の、1又は複数の特定の人物に関するタグを付与された、1又は複数の特定の人物の顔画像データを用いて構築された学習モデルを記憶する画像データ記憶部と、画像認識により、動画データの画像に映っている1又は複数の人物の顔の画像を抽出し、抽出された1又は複数の顔の画像の中に、学習モデルの、1又は複数の特定の人物の顔の画像と一致する画像があるかどうかを判定する顔画像判定部と、顔画像判定部によって判定された1又は複数の顔の画像のうち、1又は複数の特定の人物の顔の画像と一致しない画像に対して顔の個人を特定することが困難となるように画像処理を行ったのち、視聴者端末から送信されたリクエストデータに基づき画像処理を行う画像処理部と、視聴者端末から送信されたコメントデータに基づきコメントをライブ動画に表示する画像処理を行う画像表示部とを備えることを要旨とする。
【0007】
本発明の第1の態様において、画像処理は顔の画像に対するモザイク処理であり、画像処理部は、抽出された又は複数の顔の画像のうち、1又は複数の特定の人物の顔の画像と一致しない画像にのみモザイク処理を行ってもよい。
【0008】
本発明の第1の態様において、画像処理部は、抽出された1又は複数の顔の画像のうち、1又は複数の特定の人物の顔の画像と一致する画像と、一致しない画像とは、互いに異なる画像処理を行ってもよい。
【0009】
本発明の第1の態様において、画像処理は顔の画像に対するモザイク処理であり、画像処理部は、リクエストデータに基づき、抽出された1又は複数の顔の画像に対して行うモザイク処理のモザイクの粗さを決定してもよい。
【0010】
本発明の第1の態様において、画像処理は顔の画像に対するモザイク処理であり、画像処理部は、リクエストデータに基づき、抽出された1又は複数の顔の画像に対して行うモザイク処理のモザイクの範囲を決定してもよい。
【0011】
本発明の第1の態様において、画像処理部は、リクエストデータに基づき、抽出された1又は複数の顔の画像のうち、画像処理を行う画像を決定してもよい。
【0012】
本発明の第1の態様において、画像処理部による、リクエストデータに基づく画像処理の方法は、課金によって視聴者が決定可能としてもよい。
【0013】
本発明の第1の態様において、画像処理部による、リクエストデータに基づく画像処理の方法は、視聴者による多数決によって決定されてもよい。
【0014】
本発明の第1の態様において、視聴者による多数決によって決定される画像処理の方法の選択肢の内容は、画像表示部によってライブ動画に表示された前記コメントにおいて提案され、1又は複数の特定の人物がコメントにおいて提案された選択肢の内容を了承することにより、ライブ動画に提案された選択肢が表示されてもよい。
【0015】
本発明の第1の態様において、画像処理部は、リクエストデータに基づき、抽出された1又は複数の顔の画像のうち、どの顔画像に対して画像処理を行うかを決定してもよい。
【0016】
本発明の第1の態様において、データ記憶部は、予め撮影されたマーカーの画像データを用いて構築されたマーカー学習モデルを更に記憶し、画像処理部は、データに基づき、マーカーを装着した人物の顔の画像に対して画像処理を行ってもよい。
【0017】
本発明の第1の態様において、画像処理部による、リクエストデータに基づく画像処理の方法の決定は、視聴者が所定の条件を満たすことによって可能となってよい。
【0018】
本発明の第2の態様は、視聴者端末にライブ動画を配信するライブ配信方法であって、ライブを撮影して1又は複数の映像データを生成する映像データ生成ステップと、ライブの音声を録音して1又は複数の音声データを生成する音声データ生成ステップと、1又は複数の映像データ及び1又は複数の音声データから動画データを生成する動画データ生成ステップと、動画データを編集する映像編集ステップと、編集された動画データを前記視聴者端末へ送信する配信ステップと、1又は複数の視聴者の視聴者情報、視聴者ID及びパスワードを記憶する視聴者情報記憶ステップと、1又は複数の視聴者の登録と認証を行う視聴者情報管理ステップと、視聴者端末と、ライブ動画に対するコメントをライブ動画において表現するための情報を含むコメントデータと、顔の画像に対する画像処理の方法をリクエストする情報を含むリクエストデータの送受信をする入出力ステップとを備え、映像編集ステップは、画像認識により、動画データの画像に映っている1又は複数の人物の顔の画像を抽出する抽出ステップと、抽出された1又は複数の顔の画像の中に、予め撮影された画像データ内の、1又は複数の特定の人物に関するタグを付与された、1又は複数の特定の人物の顔画像データを用いて構築された学習モデルの、1又は複数の特定の人物の顔の画像と一致する画像があるかどうかを判定する顔画像判定ステップと、画像判定ステップにおいて判定された1又は複数の顔の画像のうち、1又は複数の特定の人物の顔の画像と一致しない画像に対して顔の個人を特定することが困難となるように画像処理を行ったのち、視聴者端末から送信されたリクエストデータに基づき画像処理を行う画像処理ステップと、視聴者端末から送信されたコメントデータに基づきコメントをライブ動画に表示する画像処理を行う画像表示ステップとを備えることを要旨とする。
【0019】
本発明の第3の態様は、コンピュータに、ライブを撮影して1又は複数の映像データを生成する映像データ生成機能と、ライブの音声を録音して1又は複数の音声データを生成する音声データ生成機能と、1又は複数の映像データ及び1又は複数の音声データから動画データを生成する動画データ生成機能と、動画データを編集する映像編集機能と、編集された動画データを視聴者端末へ送信する配信機能と、1又は複数の視聴者の視聴者情報、視聴者ID及びパスワードを記憶する視聴者情報記憶機能と、1又は複数の視聴者の登録と認証を行う視聴者情報管理機能と、視聴者端末と、ライブ動画に対するコメントをライブ動画において表現するための情報を含むコメントデータと、顔の画像に対する画像処理の方法をリクエストする情報を含むリクエストデータの送受信をする入出力機能とを備え、映像編集機能は、画像認識により、動画データの画像に映っている1又は複数の人物の顔の画像を抽出する抽出機能と、抽出された1又は複数の顔の画像の中に、予め撮影された画像データ内の、1又は複数の特定の人物に関するタグを付与された、又は複数の特定の人物の顔画像データを用いて構築された学習モデルの、又は複数の特定の人物の顔の画像と一致する画像があるかどうかを判定する顔画像判定機能と、顔画像判定機能によって判定された1又は複数の顔の画像のうち、1又は複数の特定の人物の顔の画像と一致しない画像に対して顔の個人を特定することが困難となるように画像処理を行ったのち、視聴者端末から送信されたリクエストデータに基づき画像処理を行う画像処理機能と視聴者端末から送信されたコメントデータに基づきコメントをライブ動画に表示する画像処理を行う画像表示機能とを備えるためのライブ配信プログラムであることを要旨とする。
【発明の効果】
【0020】
本発明によれば、配信者と視聴者とがコミュニケーションをとりながらリアルタイムで画像処理方法を決定可能なライブ配信システム、ライブ配信方法、及びライブ配信プログラムを提供できる。
【図面の簡単な説明】
【0021】
図1】本発明の実施形態に係るライブ配信システムの全体構成の一例を示す概要図である。
図2】本実施形態に係るライブ配信システムの映像調整装置の構成の一例を示すブロック図である。
図3】本実施形態に係るライブ配信システムの映像変換装置の構成の一例を示すブロック図である。
図4】本実施形態に係るライブ配信システムの映像編集部の構成の一例を示すブロック図である。
図5】本実施形態に係るライブ配信システムの動作を説明するためのフローチャートである。
図6】本実施形態に係るライブ配信システムの動作を説明するためのフローチャートである。
【発明を実施するための形態】
【0022】
次に、図面を参照して、本発明の実施形態を説明する。実施形態に係る図面の記載において、同一又は類似の部分には同一又は類似の符号を付している。但し、図面は模式的なものである。
【0023】
又、実施形態は、本発明の技術的思想を具体化するための装置や方法を例示するものであって、本発明の技術的思想は、各構成要素の構成や配置、レイアウト等を下記のものに特定するものでない。本発明の技術的思想は、特許請求の範囲に記載された請求項が規定する技術的範囲内において、種々の変更を加えることができる。
【0024】
(実施形態)
本発明の第1の実施形態に係るライブ配信システムを以下に説明する。図1に、本実施形態に係るライブ配信システム10の構成の一例を示す。図1に示すライブ配信システム10は、第1カメラ101a、第2カメラ101b、第3カメラ101c、第1マイクロフォン102a、第2マイクロフォン102b、第3マイクロフォン102c、映像調整装置103、映像変換装置104、配信サーバ105、ネットワーク106、視聴者端末107a、107b、107cから構成される。
【0025】
1又は複数の視聴者端末107a、107b、107cは、モバイル端末、パーソナルコンピュータ等、視聴者がライブ配信システムからネットワーク106を介して動画データを受信して閲覧し、かつ映像変換装置104とデータの送受信を行うことのできる端末である。
【0026】
映像変換装置104は、パーソナルコンピュータ(PC)、メインフレーム、ワークステーション、クラウドコンピューティングシステム等、種々の電子計算機(計算リソース)であり、ディスプレイ、その他、入力用のキーボード、マウス等が接続されている。ネットワーク106は、インターネット、光ネットワーク、電話回線網等、いかなる通信網であってもよい。
【0027】
図2に、映像調整装置103の構成の一例を示す。図2に示す映像調整装置103は、第1映像データ変換器201a、第2映像データ変換器201b、第3映像データ変換器201c、第1音声データ変換器202a、第2音声データ変換器202b、第3音声データ変換器202c、第1合成器203a、第2合成器203b、第3合成器203c、スイッチャー204、エンコーダー205、ストリーミングサーバ206から構成される。
【0028】
図3に、映像変換装置104の構成の一例を示す。図3に示す映像変換装置104は、映像編集部301、入出力部302、視聴者情報管理部303、視聴者情報記憶部304から構成される。
【0029】
ライブ会場において、出演者によるライブパフォーマンスが行われ、第1カメラ101a、第2カメラ101b、第3カメラ101cによる撮影が行われ、それぞれのカメラによって第1映像データ、第2映像データ、第3映像データが生成される。同様に、第1マイクロフォン102a、第2マイクロフォン102b、第3マイクロフォン102cによる録音が行われ、それぞれのマイクロフォンによって第1音声データ、第2音声データ、第3音声データが生成される。
【0030】
第1カメラ101a、第2カメラ101b、第3カメラ101cによって得られた第1映像データ、第2映像データ、第3映像データは、それぞれ、第1映像データ変換器201a、第2映像データ変換器201b、第3映像データ変換器201cによってアナログデータからデジタルデータに変換され、さらに、圧縮処理がなされる。第1マイクロフォン102a、第2マイクロフォン102b、第3マイクロフォン102cによって得られた第1音声データ、第2音声データ、第33音声データについても同様に、それぞれ、第1音声データ変換器202a、第2音声データ変換器202b、第3音声データ変換器202cによってアナログデータからデジタルデータに変換され、さらに、圧縮処理がなされる。
【0031】
これらの第1~第3映像データ及び第1~第3音声データは、それぞれ、第1合成器203a、第2合成器203b、第3合成器203cにおいて同期がとられ、合成されて、第1動画データ、第2動画データ、第3動画データが生成される。
【0032】
第1動画データ、第2動画データ、第3動画データは、それぞれ、スイッチャー204に入力され、スイッチャー204において、配信される動画が選択される。第1動画データ、第2動画データ、第3動画データのうち、配信される動画として選択された動画データは、エンコーダー205及びストリーミングサーバ206において、ストリーミング形式のデータに変換される。
【0033】
ストリーミング形式に変換された動画データは、映像編集部301において編集がなされたのち、配信サーバ105から、ネットワーク106を介して、視聴者端末107a、107b、107cへ配信される。
【0034】
図4に、映像編集部301の構成の一例を示す。図4に示す映像編集部301は、顔画像判定部401、画像データ記憶部402、画像処理部403、画像表示部404とから構成される。
【0035】
顔画像判定部401は、画像認識により、動画データの画像に映っている全ての人物の顔の画像を抽出し、抽出された顔の画像の中に、画像データ記憶部402に記憶されている、1又は複数の特定の人物の顔の画像と一致する画像があるかどうかを判定する。
【0036】
画像データ記憶部402は、顔画像判定部401が画像認識を行う際に用いられる機械学習モデルを記憶する。この機械学習モデルは、予め学習されたモデルであり、本実施形態において、予め撮影された画像データ内の、1又は複数の特定の人物に関するタグを付与された、1又は複数の特定の人物の顔画像データを用いて構築されたものである。本実施形態において、1又は複数の特定の人物とは、例えば、ライブパフォーマンスを行う出演者、司会者、等である。
【0037】
画像処理部403は、顔画像判定部401によって抽出された顔の画像に対して、画像処理を行う。ここで、本実施形態において、画像処理部403によって行われる画像処理とは、顔画像判定部401によって抽出された顔の画像の少なくとも一部に対して、モザイクを掛ける、ぼかす、他の画像で覆う等、個人の特定が困難となるように加工することを指す。
【0038】
本実施形態においては、動画配信の開始時点で、顔画像判定部401は、抽出された顔の画像の中の、1又は複数の特定の人物の顔の画像と一致すると判定された顔の画像に対しては、モザイク処理を行わない等、1又は複数の特定の人物を除く人物の顔画像とは異なる処理を行うように設定される。
【0039】
視聴者は視聴者端末107a、107b、107cにおいて、本実施形態に係るライブ配信システムによって配信されるライブ動画を視聴し、ライブ動画に対するコメント、感想、メッセージ等をライブ動画において表現するための情報等を含むコメントデータを視聴者端末107a、107b、107cから入出力部302に送信することができる。
【0040】
コメントデータは、視聴者端末107a、107b、107cから、ネットワーク106を介して、映像変換装置104の入出力部302に送信されたのち、画像表示部404に送信される。画像表示部404は、コメントデータに基づき、コメント、感想、メッセージ等がライブ動画の画面のコメント欄に表示されるように画像処理を行う。
【0041】
視聴者、及び、司会者、出演者、観客等の、ライブ動画に映る人物は、画像表示部404によってライブ動画の画面のコメント欄に表示されるコメントの内容を、ライブ会場にライブ動画の画面を表示するディスプレイを設置する等の方法によって知ることができる。コメントの内容に対して、ライブ動画に映る人物が応答することによって、視聴者とライブ動画に映る人物とが、コミュニケーションをとることができる。
【0042】
視聴者は、更に、視聴者端末107a、107b、107cにおいて、本実施形態に係るライブ動画を視聴し、画像処理部403が顔画像判定部401によって抽出された顔の画像に対してモザイク処理等を行う際の、処理方法をリクエストする情報を含むリクエストデータを視聴者端末107a、107b、107cから入出力部302に送信することができる。
【0043】
リクエストデータは、視聴者端末107a、107b、107cから入出力部302に送信されたのち、画像処理部403に送信される。画像処理部403は、リクエストデータに含まれる、処理方法をリクエストする情報に基づき、顔画像判定部401によって抽出された顔の画像に対してモザイク処理等を行う。
【0044】
視聴者によってリクエストされる、画像処理部403が顔画像判定部401によって抽出された顔の画像に対してモザイク処理等を行う際の、処理方法としては、モザイク処理を行う人物の顔の画像を指定してもよい。本実施形態において、動画配信開始時点で、顔画像判定部401によって抽出された顔の画像に対して、出演者および司会者等、画像データ記憶部402に記憶されている、1又は複数の特定の人物の顔の画像と一致しない画像にのみモザイク処理を行うとするが、視聴者のリクエストにより、例えば、出演者、司会者等、1又は複数の特定の人物の顔の画像にもモザイク処理を行うとしてもよい。
【0045】
例えば、ライブの出演者、司会者等、1又は複数の特定の人物が、視聴者の好まないパフォーマンスを行ったとき、そのパフォーマンスを行った特定の人物の顔の画像に対して、画像処理部403によってモザイク処理をするように視聴者がリクエストする等、視聴者の反応や要望をリアルタイムに反映させることができる。
【0046】
視聴者によってリクエストされる、画像処理部403が顔画像判定部401によって抽出された顔の画像に対してモザイク処理等を行う際の、他の処理方法としては、例えば、モザイクの粗さを指定することができる。モザイクの粗さの指定方法としては、例えば、各モザイクの1単位のサイズを数値で指定してもよい。
【0047】
顔の画像に掛けるモザイクの粗さは、粗さが小さい程、顔の個人を特定しやすく、粗さが大きい程、顔の個人を特定することが困難になる。例えば、ライブ動画の画像に映っている観客の顔の画像に掛けられているモザイクの粗さが十分でなく、観客の個人が特定される可能性がある場合、視聴者は、観客の個人が特定されないように、モザイクの粗さを大きくするようにリクエストすることができる。また、例えば、特定の人物の顔の画像に対して、画像処理部403によってモザイク処理を行う場合、特定の人物に欠けるモザイクの粗さを小さくし、観客とは区別できるようにすることができる。
【0048】
また、顔画像判定部401によって抽出された顔の画像に対してモザイク処理等を行う際の、他の処理方法としては、モザイク処理等を行う範囲を指定することができる。モザイク処理を行う範囲を広く指定すると、顔の画像だけでなく、例えば、モザイク処理をする人物の首、衣服の部分等、広い範囲でモザイク処理がなされる。モザイク処理を行う範囲を狭く指定すると、顔の画像の一部だけにモザイク処理がなされる。モザイク処理を行う範囲を指定する方法としては、モザイク処理をする範囲の大きさ、位置を指定してもよい。例えば、眼だけにモザイク処理をする、等の方法である。
【0049】
顔の画像に掛けるモザイク処理等の範囲の広さは、範囲が小さい程、顔の個人を特定しやすく、範囲が大きい程、顔の個人を特定することが困難になる。モザイクの粗さを指定する場合と同様、観客の個人が特定されないように、モザイクの範囲を大きくするようにリクエストすることができ、また、特定の人物に欠けるモザイクの範囲を小さくし、観客とは区別できるようにすることができる。
【0050】
顔画像判定部401によって抽出された顔の画像に対してモザイク処理等を行う際の、他の処理方法としては、モザイク処理として指定部分にモザイクを掛ける方法のほかに、例えば、他の画像によって覆い隠す方法がある。他の画像としては、他の人物の顔や、イラスト等が挙げられ、他の画像を視聴者が指定できるようにしてもよい。
【0051】
例えば、ライブ動画の出演者等、特定の人物が行ったパフォーマンスに応じた画像によって、特定の人物の顔の画像を覆い隠す等、視聴者の意向をリアルタイムにライブに反映させることにより、ライブをより興味を引き付けるものとすることができる。
【0052】
顔画像判定部401によって抽出された顔の画像に対してモザイク処理等を行う際の、他の処理方法としては、モザイク処理として指定部分にモザイクを掛ける代わりに、ぼかしを入れる方法であってもよい。
【0053】
また、ライブをより興味を引き付けるものとするために、リクエスト内容は、視聴者の多数決によって決定されてもよい。ライブ動画の画面内に、例えば、モザイク処理の方法について1又は複数の選択肢が表示され、各視聴者が、視聴者端末107a、107b、107cから入出力部302に、1又は複数の選択肢のうち希望するモザイク処理方法を送信してもよい。
【0054】
上記のように、リクエスト内容を視聴者の多数決によって決定する際、モザイク処理の方法についての1又は複数の選択肢は、ライブ動画の画面のコメント欄に表示される視聴者から送信されたコメントによって選出されてもよい。例えば、視聴者から選択肢の内容について提案するコメントがコメント欄に表示され、司会者が選択肢の内容についての提案を了承すること等により、提案された選択肢の内容が採用され、ライブ動画の画面内に、採用された選択肢の内容が表示されてもよい。
【0055】
また、例えば、観客等、1又は複数の特定の人物以外の人物のうちの特定の顔の画像に対する画像処理方法を、視聴者のリクエストによって決定してもよい。この場合、画像データ記憶部402に記憶されていない顔画像に対する画像処理であるので、例えば、帽子、名札、番号札等をマーカーとし、予め撮影されたマーカーの画像データを用いて構築されたマーカー機械学習モデルを画像データ記憶部402に記憶させておき、マーカーを観客等に装着させ、マーカーに基づき、画像処理を行う人物を特定するようにしてもよい。
【0056】
視聴者が、モザイク処理等を行う際の、処理方法をリクエストする情報を含むリクエストデータを視聴者端末107a、107b、107cから入出力部302に送信する際、配信者が、リクエストを希望する視聴者に対して課金することによってリクエストを可能としてもよい。また、リクエスト内容によって、課金の金額が決定されてもよく、課金額によって、リクエストが通るかどうかが決定されてもよい。
【0057】
視聴者による、モザイク処理等を行う際の、処理方法のリクエストは、対価の支払いによって可能となるとしてもよい。又は、例えば、出演者に関連した物品等を購入し、購入した物品や購入金額等に応じて、処理方法のリクエストが可能となるようにしてもよい。あるいは、動画配信中に、出演者、司会者が視聴者とコミュニケーションをとり、コミュニケーションの内容に基づき、所定の条件を満たす等、視聴者が配信される動画を閲覧中に、特定の条件を満たすことによって処理方法のリクエストが可能となるようにしてもよい。出演者、司会者が視聴者とコミュニケーションをとり、コミュニケーションの内容に基づき、所定の条件を満たす場面としては、例えば、ライブ動画において、司会者が視聴者に対して質問等を行い、視聴者が司会者の質問に対してメッセージで回答し、司会者が視聴者の回答に対して適切な回答であると判断してその旨を本実施形態に係るライブ配信システムに入力すること、等が挙げられる。
【0058】
本実施形態に係るライブ配信システムにおいて、視聴者がモザイク処理等を行う際の処理方法をリクエストする場合、視聴者は、前もってライブ配信システムに視聴者登録を行う。視聴者登録を行う際は、視聴者によって、視聴者端末107a、107b、107cから、ネットワーク106及び入出力部302を介して、視聴者情報管理部303へ視聴者登録を行うための視聴者情報が送信される。視聴者情報管理部303は、受信した視聴者情報をもとに、視聴者IDとパスワードを生成し、視聴者情報記憶部304に視聴者情報、視聴者ID及びパスワードを記憶させ、視聴者ID及びパスワードを、視聴者端末107a、107b、107cに送信する。視聴者は、視聴者ID及びパスワードを用いて視聴者情報管理部303によって認証を受けることによって、処理方法のリクエストが可能となる。
【0059】
図5及び図6のフローチャートを参照しながら、本実施形態に係るライブ配信方法を説明する。なお、図5及び図6のフロー開始時点で視聴者登録及び視聴者認証はすでに行われているものとする。
【0060】
図5に示すフローは、ライブの動画が撮影されてから視聴者端末107a、107b、107cへ配信されるまでのフローである。
【0061】
ステップS501において、第1~第3カメラ101a~101cによる撮影、及び第1~第3マイクロフォン102a~102cによる録音が行われる。
【0062】
ステップS502において、第1~第3映像データ変換器201a~201c、第1~第3音声データ変換器202a~202cによって、第1~第3動画データが生成される。
【0063】
ステップS503において、スイッチャー204によって、第1~第3動画データの中から、配信される動画が選択され、選択された動画データが、エンコーダー205及びストリーミングサーバ206によって、ストリーミング形式のデータに変換される。
【0064】
ステップS504において、顔画像判定部401が、画像認識により、動画データの画像に映っている全ての人物の顔の画像を抽出する。
【0065】
ステップS505において、顔画像判定部401が、抽出された全ての人物の顔の画像の中に、画像データ記憶部402に記憶されている、1又は複数の特定の人物の顔の画像と一致する画像があるかどうかを判定する。
【0066】
ステップS506において、画像処理部403は、顔画像判定部401によって抽出された全ての人物の顔のうち、条件に適合する人物の顔の画像に対して、モザイク処理等を行う。
【0067】
ステップS507において、編集された動画データが、配信サーバ105から、ネットワーク106を介して、視聴者端末107a、107b、107cへ配信される。
【0068】
図6に示すフローは、視聴者端末107a、107b、107cへライブ動画が配信されてから、視聴者によってリクエストされた顔の画像に対するモザイク処理方法が実行された動画が配信されるまでのフローである。
【0069】
ステップS601において、画像処理部403が顔画像判定部401によって抽出された顔の画像に対してモザイク処理等を行う際の、処理方法をリクエストする情報を含むリクエストデータが視聴者端末107a、107b、107cから入出力部302へ送信される。
【0070】
ステップS602において、入出力部302は、リクエストデータを受信すると、リクエストデータを画像処理部403に送信する。
【0071】
ステップS603において、画像処理部403が、リクエストデータに含まれる、処理方法をリクエストする情報に基づき、顔画像判定部401によって抽出された顔の画像に対してモザイク処理等を行う。
【0072】
以上、本発明はここでは記載していない様々な実施形態等を含むことは勿論である。したがって、本発明の技術的範囲は上記の説明から妥当な特許請求の範囲に係る発明特定事項によってのみ定められるものである。
【符号の説明】
【0073】
10 ライブ配信システム
101a 第1カメラ
101b 第2カメラ
101c 第3カメラ
102a 第1マイクロフォン
102b 第2マイクロフォン
102c 第3マイクロフォン
103 映像調整装置
104 映像変換装置
105 配信サーバ
106 ネットワーク
107a、107b、107c 視聴者端末
201a 第1映像データ変換器
201b 第2映像データ変換器
201c 第3映像データ変換器
202a 第1音声データ変換器
202b 第2音声データ変換器
202c 第3音声データ変換器
203a 第1合成器
203b 第2合成器
203c 第3合成器
204 スイッチャー
205 エンコーダー
206 ストリーミングサーバ
301 映像編集部
302 入出力部
303 視聴者情報管理部
304 視聴者情報記憶部
401 顔画像判定部
402 画像データ記憶部
403 画像処理部
404 画像表示部
図1
図2
図3
図4
図5
図6
【手続補正書】
【提出日】2022-01-11
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
ライブを撮影して1又は複数の映像データを生成するための1又は複数のカメラと、
前記ライブの音声を録音して1又は複数の音声データを生成するための1又は複数のマイクロフォンと、
前記1又は複数の映像データ及び前記1又は複数の音声データから動画データを生成する映像調整装置と、
前記動画データを編集する映像変換装置と、
編集された前記動画データを視聴者端末へ送信する配信サーバと
を備えるライブ動画を配信するライブ配信システムであって、前記映像変換装置は、
映像編集部と、
前記視聴者端末と、前記ライブ動画に対するコメントを前記ライブ動画において表現するための情報を含むコメントデータと、顔の画像に対する画像処理の方法をリクエストする情報を含むリクエストデータの送受信をする入出力部と、
1又は複数の視聴者の登録と認証を行う視聴者情報管理部と、
前記1又は複数の視聴者の視聴者情報、視聴者ID及びパスワードを記憶する視聴者情報記憶部と
を備え、前記映像編集部は、
予め撮影された画像データ内の、1又は複数の特定の人物に関するタグを付与された、1又は複数の特定の人物の顔画像データを用いて構築された学習モデルを記憶する画像データ記憶部と、
画像認識により、前記動画データの画像に映っている1又は複数の人物の顔の画像を抽出し、抽出された前記1又は複数の顔の画像の中に、前記学習モデルの、前記1又は複数の特定の人物の顔の画像と一致する画像があるかどうかを判定する顔画像判定部と、
前記顔画像判定部によって判定された前記1又は複数の顔の画像のうち、前記1又は複数の特定の人物の顔の画像と一致しない画像に対して顔の個人を特定することが困難となるように画像処理を行ったのち、前記視聴者端末から送信された前記リクエストデータに基づき画像処理を行う画像処理部と、
前記視聴者端末から送信された前記コメントデータに基づき前記コメントを前記ライブ動画に表示する画像処理を行う画像表示部と
を備えることを特徴とするライブ配信システム。
【請求項2】
前記画像処理は顔の画像に対するモザイク処理であり、前記画像処理部は、抽出された前記1又は複数の顔の画像のうち、前記1又は複数の特定の人物の顔の画像と一致しない画像にのみモザイク処理を行うことを特徴とする請求項1に記載のライブ配信システム。
【請求項3】
前記画像処理部は、抽出された前記1又は複数の顔の画像のうち、前記1又は複数の特定の人物の顔の画像と一致する画像と、一致しない画像とは、互いに異なる画像処理を行うことを特徴とする請求項1に記載のライブ配信システム。
【請求項4】
前記画像処理は顔の画像に対するモザイク処理であり、前記画像処理部は、前記リクエストデータに基づき、抽出された前記1又は複数の顔の画像に対して行うモザイク処理のモザイクの粗さを決定することを特徴とする請求項1に記載のライブ配信システム。
【請求項5】
前記画像処理は顔の画像に対するモザイク処理であり、前記画像処理部は、前記リクエストデータに基づき、抽出された前記1又は複数の顔の画像に対して行うモザイク処理のモザイクの範囲を決定することを特徴とする請求項1に記載のライブ配信システム。
【請求項6】
前記画像処理部は、前記リクエストデータに基づき、抽出された前記1又は複数の顔の画像のうち、画像処理を行う画像を決定することを特徴とする請求項1に記載のライブ配信システム。
【請求項7】
前記画像処理部による、前記リクエストデータに基づく画像処理の方法は、課金によって視聴者が決定可能となることを特徴とする請求項1に記載のライブ配信システム。
【請求項8】
前記画像処理部による、前記リクエストデータに基づく画像処理の方法は、前記視聴者による多数決によって決定されることを特徴とする請求項1に記載のライブ配信システム。
【請求項9】
前記視聴者による多数決によって決定される前記画像処理の方法の選択肢の内容は、前記画像表示部によって前記ライブ動画に表示された前記コメントにおいて提案され、前記1又は複数の特定の人物が前記コメントにおいて提案された前記選択肢の内容を了承することにより、前記ライブ動画に提案された前記選択肢が表示されることを特徴とする請求項8に記載のライブ配信システム。
【請求項10】
前記画像処理部は、前記リクエストデータに基づき、抽出された前記1又は複数の顔の画像のうち、どの顔画像に対して画像処理を行うかを決定することを特徴とする請求項1に記載のライブ配信システム。
【請求項11】
前記画像データ記憶部は、予め撮影されたマーカーの画像データを用いて構築されたマーカー学習モデルを更に記憶し、
前記画像処理部は、前記リクエストデータに基づき、マーカーを装着した人物の顔の画像に対して画像処理を行うことを特徴とする請求項1に記載のライブ配信システム。
【請求項12】
前記画像処理部による、前記リクエストデータに基づく画像処理の方法の決定は、前記視聴者が所定の条件を満たすことによって可能となることを特徴とする請求項1に記載のライブ配信システム。
【請求項13】
視聴者端末にライブ動画を配信するライブ配信方法であって、
ライブを撮影して1又は複数の映像データを生成する映像データ生成ステップと、
前記ライブの音声を録音して1又は複数の音声データを生成する音声データ生成ステップと、
前記1又は複数の映像データ及び前記1又は複数の音声データから動画データを生成する動画データ生成ステップと、
前記動画データを編集する映像編集ステップと、
編集された前記動画データを前記視聴者端末へ送信する配信ステップと、
1又は複数の視聴者の視聴者情報、視聴者ID及びパスワードを記憶する視聴者情報記憶ステップと、
前記1又は複数の視聴者の登録と認証を行う視聴者情報管理ステップと、
前記視聴者端末と、前記ライブ動画に対するコメントを前記ライブ動画において表現するための情報を含むコメントデータと、顔の画像に対する画像処理の方法をリクエストする情報を含むリクエストデータの送受信をする入出力ステップと、
を備え、前記映像編集ステップは、
画像認識により、前記動画データの画像に映っている1又は複数の人物の顔の画像を抽出する抽出ステップと、
抽出された前記1又は複数の顔の画像の中に、予め撮影された画像データ内の、1又は複数の特定の人物に関するタグを付与された、前記1又は複数の特定の人物の顔画像データを用いて構築された学習モデルの、前記1又は複数の特定の人物の顔の画像と一致する画像があるかどうかを判定する顔画像判定ステップと、
前記顔画像判定ステップにおいて判定された前記1又は複数の顔の画像のうち、前記1又は複数の特定の人物の顔の画像と一致しない画像に対して顔の個人を特定することが困難となるように画像処理を行ったのち、前記視聴者端末から送信された前記リクエストデータに基づき画像処理を行う画像処理ステップと、
前記視聴者端末から送信された前記コメントデータに基づき前記コメントを前記ライブ動画に表示する画像処理を行う画像表示ステップと
を備えることを特徴とするライブ配信方法。
【請求項14】
コンピュータに、
ライブを撮影して1又は複数の映像データを生成する映像データ生成機能と、
前記ライブの音声を録音して1又は複数の音声データを生成する音声データ生成機能と、
前記1又は複数の映像データ及び前記1又は複数の音声データから動画データを生成する動画データ生成機能と、
前記動画データを編集する映像編集機能と、
編集された前記動画データを視聴者端末へ送信する配信機能と、
1又は複数の視聴者の視聴者情報、視聴者ID及びパスワードを記憶する視聴者情報記憶機能と、
前記1又は複数の視聴者の登録と認証を行う視聴者情報管理機能と、
前記視聴者端末と、ライブ動画に対するコメントを前記ライブ動画において表現するための情報を含むコメントデータと、顔の画像に対する画像処理の方法をリクエストする情報を含むリクエストデータの送受信をする入出力機能と、
を備え、前記映像編集機能は、
画像認識により、前記動画データの画像に映っている1又は複数の人物の顔の画像を抽出する抽出機能と、
抽出された前記1又は複数の顔の画像の中に、予め撮影された画像データ内の、1又は複数の特定の人物に関するタグを付与された、前記1又は複数の特定の人物の顔画像データを用いて構築された学習モデルの、前記1又は複数の特定の人物の顔の画像と一致する画像があるかどうかを判定する顔画像判定機能と、
前記顔画像判定機能によって判定された前記1又は複数の顔の画像のうち、前記1又は複数の特定の人物の顔の画像と一致しない画像に対して顔の個人を特定することが困難となるように画像処理を行ったのち、前記視聴者端末から送信された前記リクエストデータに基づき画像処理を行う画像処理機能と、
前記視聴者端末から送信された前記コメントデータに基づき前記コメントを前記ライブ動画に表示する画像処理を行う画像表示機能と
を備えることを実現させるためのライブ配信プログラム。