IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社電通の特許一覧

<>
  • 特開-実況音声リアルタイム生成システム 図1
  • 特開-実況音声リアルタイム生成システム 図2
  • 特開-実況音声リアルタイム生成システム 図3
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024011105
(43)【公開日】2024-01-25
(54)【発明の名称】実況音声リアルタイム生成システム
(51)【国際特許分類】
   H04N 5/262 20060101AFI20240118BHJP
   H04N 21/233 20110101ALI20240118BHJP
【FI】
H04N5/262 010
H04N21/233
【審査請求】未請求
【請求項の数】3
【出願形態】OL
(21)【出願番号】P 2022112830
(22)【出願日】2022-07-14
(71)【出願人】
【識別番号】320005501
【氏名又は名称】株式会社電通
(74)【代理人】
【識別番号】230104019
【弁護士】
【氏名又は名称】大野 聖二
(74)【代理人】
【識別番号】100106840
【弁理士】
【氏名又は名称】森田 耕司
(74)【代理人】
【識別番号】100131451
【弁理士】
【氏名又は名称】津田 理
(74)【代理人】
【識別番号】100167933
【弁理士】
【氏名又は名称】松野 知紘
(74)【代理人】
【識別番号】100174137
【弁理士】
【氏名又は名称】酒谷 誠一
(74)【代理人】
【識別番号】100184181
【弁理士】
【氏名又は名称】野本 裕史
(72)【発明者】
【氏名】志村 和広
【テーマコード(参考)】
5C023
5C164
【Fターム(参考)】
5C023AA40
5C023BA01
5C023CA01
5C023CA04
5C164FA22
5C164MA07S
5C164PA46
5C164SA25S
5C164SB01S
5C164SB04P
(57)【要約】
【課題】 対象スポーツゲームの実況音声をリアルタイムで自動的に生成することのできる実況音声リアルタイム生成システムを提供する。
【解決手段】 実況音声リアルタイム生成システム1は、実況音声をリアルタイム生成する対象スポーツゲームの所定シーンの映像が入力されると、第1機械学習部14で分析した関係に基づいて、入力された対象スポーツゲームの所定シーンの映像を入力として、その対象スポーツゲームの所定シーンにおける実況情報を推定して出力する。そして、対象スポーツゲームに関するファクト情報を取得すると、第2機械学習部15で分析した関係に基づいて、取得したファクト情報および出力された実況情報を入力として、その対象スポーツゲームの所定シーンにおける実況音声を推定して出力する。
【選択図】 図1
【特許請求の範囲】
【請求項1】
過去のスポーツゲームの所定シーンの映像と、当該過去のスポーツゲームの所定シーンにおける実況情報との関係を、機械学習により分析する第1機械学習部と、
前記過去のスポーツゲームに関するファクト情報および前記過去のスポーツゲームの所定シーンにおける実況情報と、当該過去のスポーツゲームの所定シーンにおける実況音声との関係を、機械学習により分析する第2機械学習部と、
実況音声をリアルタイム生成する対象スポーツゲームの所定シーンの映像が入力される映像入力部と、
前記第1機械学習部で分析した関係に基づいて、前記映像入力部から入力された前記対象スポーツゲームの所定シーンの映像を入力として、当該対象スポーツゲームの所定シーンにおける実況情報を推定して出力する第1推定部と、
前記対象スポーツゲームに関するファクト情報を取得するファクト情報取得部と、
前記第2機械学習部で分析した関係に基づいて、前記ファクト情報取得部で取得した前記対象スポーツゲームに関するファクト情報および前記第1推定部から出力された前記対象スポーツゲームの所定シーンにおける実況情報を入力として、当該対象スポーツゲームの所定シーンにおける実況音声を推定して出力する第2推定部と、
を備える、実況音声リアルタイム生成システム。
【請求項2】
過去のスポーツゲームの会場に設置された複数のカメラで撮影される複数の所定シーンの映像と、前記複数の所定シーンの映像うち当該過去のスポーツゲームの実況中継に用いられる所定シーンの映像との関係を、機械学習により分析する第3機械学習部と、
前記第3機械学習部で分析した関係に基づいて、前記対象スポーツゲームの会場に設置された複数のカメラで撮影される複数の所定シーンの映像を入力として、前記複数の所定シーンの映像うち当該対象スポーツゲームの実況中継に用いられる所定シーンの映像を推定して出力する第3推定部と、
を備え、
前記第3推定部から出力された前記対象スポーツゲームの実況中継に用いられる所定シーンの映像が前記映像入力部に入力される、請求項1に記載の実況音声リアルタイム生成システム。
【請求項3】
過去のスポーツゲームの所定シーンの映像と、当該過去のスポーツゲームの所定シーンにおける実況情報との関係を、機械学習により分析する第1機械学習ステップと、
前記過去のスポーツゲームに関するファクト情報および前記過去のスポーツゲームの所定シーンにおける実況情報と、当該過去のスポーツゲームの所定シーンにおける実況音声との関係を、機械学習により分析する第2機械学習ステップと、
実況音声をリアルタイム生成する対象スポーツゲームの所定シーンの映像が入力される映像入力ステップと、
前記第1機械学習ステップで分析した関係に基づいて、前記映像入力ステップから入力された前記対象スポーツゲームの所定シーンの映像を入力として、当該対象スポーツゲームの所定シーンにおける実況情報を推定して出力する第1推定ステップと、
前記対象スポーツゲームに関するファクト情報を取得するファクト情報取得ステップと、
前記第2機械学習ステップで分析した関係に基づいて、前記ファクト情報取得ステップで取得した前記対象スポーツゲームに関するファクト情報および前記第1推定ステップから出力された前記対象スポーツゲームの所定シーンにおける実況情報を入力として、当該対象スポーツゲームの所定シーンにおける実況音声を推定して出力する第2推定ステップと、
を含む、実況音声リアルタイム生成方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、スポーツゲームの所定シーンの実況音声をリアルタイムで生成する実況音声リアルタイム生成システムに関する。
【背景技術】
【0002】
従来、携帯端末を利用するスポーツ実況システムが提案されている(例えば、特許文献1参照)。従来のシステムでは、携帯機器にアニメーション化した実況画像が表示され、リアルタイムでスポーツ実況が行われる。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2006-260554号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来のシステムでは、アニメーション化した野球の実況画面(例えば、ピッチャーが投球し、バッターがバットを振る動作がアニメーションで表示される画面)が表示されるが、視覚障害者(その画面を見ることに障害のある者)がスポーツ観戦を楽しむことは困難である。従来、視覚障害者がスポーツ観戦を楽しむためのシステム(例えば、そのシーンの実況音声をリアルタイムで生成するシステム)について、何らの提案もなされていない。
【0005】
本発明は、上記の課題に鑑みてなされたもので、スポーツゲームの所定シーンの実況音声をリアルタイムで生成することのできる実況音声リアルタイム生成システムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の実況音声リアルタイム生成システムは、過去のスポーツゲームの所定シーンの映像と、当該過去のスポーツゲームの所定シーンにおける実況情報との関係を、機械学習により分析する第1機械学習部と、前記過去のスポーツゲームに関するファクト情報および前記過去のスポーツゲームの所定シーンにおける実況情報と、当該過去のスポーツゲームの所定シーンにおける実況音声との関係を、機械学習により分析する第2機械学習部と、実況音声をリアルタイム生成する対象スポーツゲームの所定シーンの映像が入力される映像入力部と、前記第1機械学習部で分析した関係に基づいて、前記映像入力部から入力された前記対象スポーツゲームの所定シーンの映像を入力として、当該対象スポーツゲームの所定シーンにおける実況情報を推定して出力する第1推定部と、前記対象スポーツゲームに関するファクト情報を取得するファクト情報取得部と、前記第2機械学習部で分析した関係に基づいて、前記ファクト情報取得部で取得した前記対象スポーツゲームに関するファクト情報および前記第1推定部から出力された前記対象スポーツゲームの所定シーンにおける実況情報を入力として、当該対象スポーツゲームの所定シーンにおける実況音声を推定して出力する第2推定部と、を備えている。
【0007】
この構成によれば、まず、実況音声をリアルタイム生成する対象スポーツゲーム(例えば、野球など)の所定シーンの映像が入力されると、第1機械学習部で分析した関係を用いて、その対象スポーツゲームの所定シーンにおける実況情報(例えば、「ピッチャー投げました。バッター空振り。」など)が推定される。つぎに、対象スポーツゲームに関するファクト情報(例えば、選手名「ピッチャーA、バッターB」、ボールカウント「ワンボール・ワンストライク」、アウトカウント「ノーアウト」、スコア「0対0」など)を取得すると、第2機械学習部で分析した関係を用いて、その対象スポーツゲームの所定シーンにおける実況音声(例えば、「ピッチャーAが投げました。バッターBが空振り。ワンボール・ワンストライク。」など)が推定される。このようにして、対象スポーツゲームの実況音声をリアルタイムで自動的に生成することが可能になる。
【0008】
また、本発明の実況音声リアルタイム生成システムは、過去のスポーツゲームの会場に設置された複数のカメラで撮影される複数の所定シーンの映像と、前記複数の所定シーンの映像うち当該過去のスポーツゲームの実況中継に用いられる所定シーンの映像との関係を、機械学習により分析する第3機械学習部と、前記第3機械学習部で分析した関係に基づいて、前記対象スポーツゲームの会場に設置された複数のカメラで撮影される複数の所定シーンの映像を入力として、前記複数の所定シーンの映像うち当該対象スポーツゲームの実況中継に用いられる所定シーンの映像を推定して出力する第3推定部と、を備え、前記第3推定部から出力された前記対象スポーツゲームの実況中継に用いられる所定シーンの映像が前記映像入力部に入力されてもよい。
【0009】
この構成によれば、対象スポーツゲームの会場に設置された複数のカメラで撮影される複数の所定シーンの映像が入力されると、第3機械学習部で分析した関係を用いて、複数の所定シーンの映像うち対象スポーツゲームの実況中継に用いられる所定シーンの映像が推定される。このようにして、対象スポーツゲームの会場に設置された複数のカメラで撮影される複数の所定シーンの映像の中から、映像入力部に入力される所定シーンの映像(対象スポーツゲームの実況音声のリアルタイム生成に用いられる所定シーンの映像)を適切に選択することができる。
【0010】
本発明の実況音声リアルタイム生成方法は、過去のスポーツゲームの所定シーンの映像と、当該過去のスポーツゲームの所定シーンにおける実況情報との関係を、機械学習により分析する第1機械学習ステップと、前記過去のスポーツゲームに関するファクト情報および前記過去のスポーツゲームの所定シーンにおける実況情報と、当該過去のスポーツゲームの所定シーンにおける実況音声との関係を、機械学習により分析する第2機械学習ステップと、実況音声をリアルタイム生成する対象スポーツゲームの所定シーンの映像が入力される映像入力ステップと、前記第1機械学習ステップで分析した関係に基づいて、前記映像入力ステップから入力された前記対象スポーツゲームの所定シーンの映像を入力として、当該対象スポーツゲームの所定シーンにおける実況情報を推定して出力する第1推定ステップと、前記対象スポーツゲームに関するファクト情報を取得するファクト情報取得ステップと、前記第2機械学習ステップで分析した関係に基づいて、前記ファクト情報取得ステップで取得した前記対象スポーツゲームに関するファクト情報および前記第1推定ステップから出力された前記対象スポーツゲームの所定シーンにおける実況情報を入力として、当該対象スポーツゲームの所定シーンにおける実況音声を推定して出力する第2推定ステップと、を含んでいる。
【0011】
この方法によっても、上記のシステムと同様に、まず、実況音声をリアルタイム生成する対象スポーツゲーム(例えば、野球など)の所定シーンの映像が入力されると、第1機械学習部で分析した関係を用いて、その対象スポーツゲームの所定シーンにおける実況情報(例えば、「ピッチャー投げました。バッター空振り。」など)が推定される。つぎに、対象スポーツゲームに関するファクト情報(例えば、選手名「ピッチャーA、バッターB」、ボールカウント「ワンボール・ワンストライク」、アウトカウント「ノーアウト」、スコア「0対0」など)を取得すると、第2機械学習部で分析した関係を用いて、その対象スポーツゲームの所定シーンにおける実況音声(例えば、「ピッチャーAが投げました。バッターBが空振り。ワンボール・ワンストライク。」など)が推定される。このようにして、対象スポーツゲームの実況音声をリアルタイムで自動的に生成することが可能になる。
【発明の効果】
【0012】
本発明によれば、対象スポーツゲームの実況音声をリアルタイムで自動的に生成することができる。
【図面の簡単な説明】
【0013】
図1】本発明の実施の形態における実況音声リアルタイム生成システムの構成を示すブロック図である。
図2】本発明の実施の形態においてスポーツゲーム会場に設置される複数のカメラの例を模式的に示す図である。
図3】本発明の実施の形態における実況音声リアルタイム生成システムの動作を説明するためのフロー図である。
【発明を実施するための形態】
【0014】
以下、本発明の実施の形態の実況音声リアルタイム生成システムについて、図面を用いて説明する。本実施の形態では、視覚障害者がスポーツ観戦を楽しむシステム等に用いられる実況音声リアルタイム生成システムの場合を例示する。
【0015】
本発明の実施の形態の実況音声リアルタイム生成システムの構成を、図面を参照して説明する。図1は、本実施の形態の実況音声リアルタイム生成システムの構成を示すブロック図である。図1に示すように、実況音声リアルタイム生成システム1は、ネットワークNを介してスポーツゲーム撮影システム2と接続されている。スポーツゲーム撮影システム2は、野球などの試合中の映像を撮影する複数のカメラ21と、撮影した映像をネットワークNを介して配信する映像配信部22を備えている。なお、図2に示すように、スポーツゲームの会場Sには、スポーツゲームの様々なシーンの映像を取得できるように、複数のカメラ21(カメラA、カメラB、カメラC・・・)が様々な位置に設定されている。
【0016】
図1に示すように、実況音声リアルタイム生成システム1は、スポーツゲーム撮影システム2から配信された試合中の映像(カメラ映像)を取得する映像取得部11と、実況音声をリアルタイム生成するスポーツゲーム(対象スポーツゲーム)の所定シーンの映像が入力される映像入力部12と、対象スポーツゲームに関するファクト情報を取得するファクト情報取得部13を備えている。例えば、実況音声をリアルタイム生成する対象スポーツゲームが「野球」である場合、ファクト情報は「選手名、ボールカウント、アウトカウント、スコア」などである。ファクト情報は、例えば、スポーツゲーム主催者の情報データベース(図示せず)などから取得することができる。
【0017】
また、実況音声リアルタイム生成システム1は、過去の試合の映像データが記憶される映像記憶部3を備えている。なお、映像記憶部3には、スポーツゲーム撮影システム2から配信された試合中の映像が記憶されてもよい。
【0018】
さらに、実況音声リアルタイム生成システム1は、3つの機械学習部(第1機械学習部14、第2機械学習部15、第3機械学習部16)と、3つの推定部(第1推定部17、第2推定部18、第3推定部19)を備えている。
【0019】
第1機械学習部14は、過去のスポーツゲームの所定シーンの映像と、その過去のスポーツゲームの所定シーンにおける実況情報との関係を、機械学習により分析する。この機械学習には、ニューラルネットワークによるディープラーニング等の任意の手法が用いられる。例えば、ニューラルネットワークであれば、過去のスポーツゲームの所定シーンの映像を入力層に入力し、その過去のスポーツゲームの所定シーンにおける実況情報を出力層から出力するように構成する。そして、入力層に入力するデータと出力層から出力されるデータとが紐付けられた分析用データを用いた教師あり学習によって、ニューラルネットワークのニューロン間の重み付け係数が最適化される。
【0020】
第1推定部17は、第1機械学習部14で分析した関係に基づいて、映像入力部12から入力された対象スポーツゲームの所定シーンの映像を入力として、その対象スポーツゲームの所定シーンにおける実況情報を推定して出力する。例えば、上記のニューラルネットワークであれば、映像入力部12から入力された対象スポーツゲームの所定シーンの映像を入力層に入力し、その対象スポーツゲームの所定シーンにおける実況情報を出力層から出力することにより、推定が行われる。例えば、実況音声をリアルタイム生成する対象スポーツゲームが「野球」である場合、実況情報は「ピッチャー投げました。バッター空振り。」などである。
【0021】
第2機械学習部15は、過去のスポーツゲームに関するファクト情報および過去のスポーツゲームの所定シーンにおける実況情報と、その過去のスポーツゲームの所定シーンにおける実況音声との関係を、機械学習により分析する。この機械学習にも、ニューラルネットワークによるディープラーニング等の任意の手法が用いられる。例えば、ニューラルネットワークであれば、過去のスポーツゲームに関するファクト情報および過去のスポーツゲームの所定シーンにおける実況情報を入力層に入力し、その過去のスポーツゲームの所定シーンにおける実況音声を出力層から出力するように構成する。そして、入力層に入力するデータと出力層から出力されるデータとが紐付けられた分析用データを用いた教師あり学習によって、ニューラルネットワークのニューロン間の重み付け係数が最適化される。
【0022】
第2推定部18は、第2機械学習部15で分析した関係に基づいて、ファクト情報取得部13で取得した対象スポーツゲームに関するファクト情報および第1推定部17から出力された対象スポーツゲームの所定シーンにおける実況情報を入力として、その対象スポーツゲームの所定シーンにおける実況音声を推定して出力する。例えば、上記のニューラルネットワークであれば、ファクト情報取得部13で取得した対象スポーツゲームに関するファクト情報および第1推定部17から出力された対象スポーツゲームの所定シーンにおける実況情報を入力層に入力し、その対象スポーツゲームの所定シーンにおける実況音声を出力層から出力することにより、推定が行われる。例えば、実況音声をリアルタイム生成する対象スポーツゲームが「野球」である場合、実況音声は「ピッチャーA(選手名)が投げました。バッターB(選手名)が空振り。ワンボール・ワンストライク。」などである。
【0023】
第3機械学習部16は、過去のスポーツゲームの会場に設置された複数のカメラ21で撮影される複数の所定シーンの映像と、複数の所定シーンの映像うちその過去のスポーツゲームの実況中継に用いられる所定シーンの映像との関係を、機械学習により分析する。この機械学習にも、ニューラルネットワークによるディープラーニング等の任意の手法が用いられる。例えば、ニューラルネットワークであれば、過去のスポーツゲームの会場に設置された複数のカメラ21で撮影される複数の所定シーンの映像を入力層に入力し、複数の所定シーンの映像うちその過去のスポーツゲームの実況中継に用いられる所定シーンの映像を出力層から出力するように構成する。そして、入力層に入力するデータと出力層から出力されるデータとが紐付けられた分析用データを用いた教師あり学習によって、ニューラルネットワークのニューロン間の重み付け係数が最適化される。
【0024】
第3推定部19は、第3機械学習部16で分析した関係に基づいて、対象スポーツゲームの会場に設置された複数のカメラ21で撮影される複数の所定シーンの映像を入力として、複数の所定シーンの映像うち対象スポーツゲームの実況中継に用いられる所定シーンの映像を推定して出力する。例えば、上記のニューラルネットワークであれば、対象スポーツゲームの会場に設置された複数のカメラ21で撮影される複数の所定シーンの映像を入力層に入力し、それら複数の所定シーンの映像うち対象スポーツゲームの実況中継に用いられる所定シーンの映像を出力層から出力することにより、推定が行われる。第3推定部19から出力された対象スポーツゲームの実況中継に用いられる所定シーンの映像が映像入力部12に入力される。
【0025】
以上のように構成された実況音声リアルタイム生成システム1について、図3のフロー図を参照してその動作を説明する。
【0026】
本実施の形態の実況音声リアルタイム生成システム1では、まず事前の準備として、第1機械学習部14において、過去のスポーツゲームの所定シーンの映像と、その過去のスポーツゲームの所定シーンにおける実況情報との関係を、機械学習により分析する(第1機械学習ステップ)。また、第2機械学習部15において、過去のスポーツゲームに関するファクト情報および過去のスポーツゲームの所定シーンにおける実況情報と、その過去のスポーツゲームの所定シーンにおける実況音声との関係を、機械学習により分析する(第2機械学習ステップ)。さらに、第3機械学習部16において、過去のスポーツゲームの会場に設置された複数のカメラ21で撮影される複数の所定シーンの映像と、複数の所定シーンの映像うちその過去のスポーツゲームの実況中継に用いられる所定シーンの映像との関係を、機械学習により分析する(第3機械学習ステップ)。
【0027】
そして、図3に示すように、対象スポーツゲームの実況音声をリアルタイム生成する場合には、スポーツゲーム撮影システム2から配信された試合中の複数のカメラ映像を取得し(S1)、第3機械学習部16で分析した関係に基づいて、対象スポーツゲームの会場に設置された複数のカメラ映像(複数の所定シーンの映像)を入力として、複数の所定シーンの映像うち対象スポーツゲームの実況中継に用いられる所定シーンの映像(中継映像)を推定して出力する(S2)。そして、推定された所定シーンの映像(中継映像)が映像入力部12に入力される。なお、実際に対象スポーツゲームの実況中継が行われてる場合には、中継映像を推定するステップS2は不要であり、実際の中継映像が映像入力部12に入力される。
【0028】
つぎに、第1機械学習部14で分析した関係に基づいて、映像入力部12から入力された対象スポーツゲームの所定シーンの映像を入力として、その対象スポーツゲームの所定シーンにおける実況情報を推定して出力する(S3)。その後、ファクト情報取得部13において、対象スポーツゲームに関するファクト情報を取得し(S4)、第2機械学習部15で分析した関係に基づいて、ファクト情報取得部13で取得した対象スポーツゲームに関するファクト情報および第1推定部17から出力された対象スポーツゲームの所定シーンにおける実況情報を入力として、その対象スポーツゲームの所定シーンにおける実況音声を推定して出力する(S5)。
【0029】
このような本実施の形態の実況音声リアルタイム生成システム1によれば、まず、実況音声をリアルタイム生成する対象スポーツゲーム(例えば、野球など)の所定シーンの映像が入力されると、第1機械学習部14で分析した関係を用いて、その対象スポーツゲームの所定シーンにおける実況情報(例えば、「ピッチャー投げました。バッター空振り。」など)が推定される。つぎに、対象スポーツゲームに関するファクト情報(例えば、選手名「ピッチャーA、バッターB」、ボールカウント「ワンボール・ワンストライク」、アウトカウント「ノーアウト」、スコア「0対0」など)を取得すると、第2機械学習部15で分析した関係を用いて、その対象スポーツゲームの所定シーンにおける実況音声(例えば、「ピッチャーAが投げました。バッターBが空振り。ワンボール・ワンストライク。」など)が推定される。このようにして、対象スポーツゲームの実況音声をリアルタイムで自動的に生成することが可能になる。
【0030】
また、本実施の形態では、対象スポーツゲームの会場に設置された複数のカメラ21で撮影される複数の所定シーンの映像が入力されると、第3機械学習部16で分析した関係を用いて、複数の所定シーンの映像うち対象スポーツゲームの実況中継に用いられる所定シーンの映像が推定される。このようにして、対象スポーツゲームの会場に設置された複数のカメラ21で撮影される複数の所定シーンの映像の中から、映像入力部12に入力される所定シーンの映像(対象スポーツゲームの実況音声のリアルタイム生成に用いられる所定シーンの映像)を適切に選択することができる。
【0031】
以上、本発明の実施の形態を例示により説明したが、本発明の範囲はこれらに限定されるものではなく、請求項に記載された範囲内において目的に応じて変更・変形することが可能である。
【0032】
以上の説明では、実況音声をリアルタイム生成する対象スポーツゲームが「野球」である場合、例えば、ファクト情報が「選手名、ボールカウント、アウトカウント、スコア」などであり、実況情報が「ピッチャー投げました。バッター空振り。」などであり、実況音声が「ピッチャーA(選手名)が投げました。バッターB(選手名)が空振り。ワンボール・ワンストライク。」などである例について説明したが、その他のスポーツゲームについても同様に実施可能である。
【0033】
例えば、実況音声をリアルタイム生成する対象スポーツゲームが「競馬」である場合には、ファクト情報は「馬名、馬番、騎手名、順位」などであり、実況情報は「各馬一斉にスタート。」などであり、実況音声は「各場一斉にスタート。先頭はC(馬名)。」などであってもよい。
【0034】
また、実況音声をリアルタイム生成する対象スポーツゲームが「モータースポーツ」である場合には、ファクト情報は「チーム名、ドライバー名、順位」などであり、実況情報は「バックストレートで先頭が2番手に抜かれた。」などであり、実況音声は「バックストレートで先頭のD(ドライバー名)が2番手のE(ドライバー名)に抜かれた。」などであってもよい。
【産業上の利用可能性】
【0035】
以上のように、本発明にかかる実況音声リアルタイム生成システムは、対象スポーツゲームの実況音声をリアルタイムで自動的に生成することができるという効果を有し、視覚障害者がスポーツ観戦を楽しむシステム等として有用である。
【符号の説明】
【0036】
1 実況音声リアルタイム生成システム
2 スポーツゲーム撮影システム
3 映像記憶部
11 映像取得部
12 映像入力部
13 ファクト情報取得部
14 第1機械学習部
15 第2機械学習部
16 第3機械学習部
17 第1推定部
18 第2推定部
19 第3推定部
21 カメラ
22 映像配信部
N ネットワーク
図1
図2
図3