IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ミクシィの特許一覧

特許7502624配信動画生成装置、配信動画生成方法及びプログラム
<>
  • 特許-配信動画生成装置、配信動画生成方法及びプログラム 図1
  • 特許-配信動画生成装置、配信動画生成方法及びプログラム 図2
  • 特許-配信動画生成装置、配信動画生成方法及びプログラム 図3
  • 特許-配信動画生成装置、配信動画生成方法及びプログラム 図4
  • 特許-配信動画生成装置、配信動画生成方法及びプログラム 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-06-11
(45)【発行日】2024-06-19
(54)【発明の名称】配信動画生成装置、配信動画生成方法及びプログラム
(51)【国際特許分類】
   H04N 21/235 20110101AFI20240612BHJP
   G06N 20/00 20190101ALI20240612BHJP
【FI】
H04N21/235
G06N20/00 130
【請求項の数】 10
(21)【出願番号】P 2020137295
(22)【出願日】2020-08-17
(65)【公開番号】P2022033421
(43)【公開日】2022-03-02
【審査請求日】2023-04-25
(73)【特許権者】
【識別番号】500033117
【氏名又は名称】株式会社MIXI
(74)【代理人】
【識別番号】110004222
【氏名又は名称】弁理士法人創光国際特許事務所
(74)【代理人】
【識別番号】100166006
【弁理士】
【氏名又は名称】泉 通博
(74)【代理人】
【識別番号】100154070
【弁理士】
【氏名又は名称】久恒 京範
(74)【代理人】
【識別番号】100153280
【弁理士】
【氏名又は名称】寺川 賢祐
(72)【発明者】
【氏名】橋口 昂矢
(72)【発明者】
【氏名】馬淵 俊弥
(72)【発明者】
【氏名】吉野 純平
(72)【発明者】
【氏名】佐藤 太一
【審査官】醍醐 一貴
(56)【参考文献】
【文献】特開2002-044654(JP,A)
【文献】特開平09-034959(JP,A)
【文献】特開2007-089648(JP,A)
【文献】特開2018-098573(JP,A)
【文献】特許第5801985(JP,B1)
【文献】国際公開第2020/160563(WO,A1)
【文献】特開2002-366698(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 21/00-21/858
G06F 18/00-18/40
G06N 3/00-99/00
(57)【特許請求の範囲】
【請求項1】
レースの動画を取得動画として取得する動画取得部と、
過去に開催されたレースの動画である過去レース動画と当該過去レース動画に対応するレースの状態とに基づいて学習した、レースの動画の入力に対して当該レースの状態を示す状態情報を出力するモデルを用いて、前記動画取得部が取得した前記取得動画に対応するレースの状態を推定する状態推定部と、
前記状態推定部が推定した前記レースの状態に対応する画像と音の少なくともいずれかと、前記取得動画とに基づいて配信動画を生成する生成部と、
前記生成部が生成した前記配信動画を出力する出力部と、
を有する配信動画生成装置。
【請求項2】
前記状態推定部は、前記過去レース動画を構成する画像と、当該画像に対応するレースの状態とに基づいて学習した、レースの動画を構成する画像の入力に対して当該レースの状態を示す状態情報を出力するモデルを用いて、前記取得動画に対応する当該レースの状態を推定する、
請求項1に記載の配信動画生成装置。
【請求項3】
前記状態推定部は、前記過去レース動画に対応する音と、当該音に対応するレースの状態とに基づいて学習した、レースに対応する音の入力に対して当該レースの状態を示す状態情報を出力するモデルを用いて、前記動画取得部が取得した前記取得動画に含まれる音に対応するレースの状態を推定する、
請求項1又は2に記載の配信動画生成装置。
【請求項4】
前記レースの経過に伴う状態遷移を示す状態遷移情報を記憶する記憶部をさらに有し、
前記状態推定部は、前記モデルを用いて推定したレースの第1時点における第1状態と、前記状態遷移情報とに基づいて、前記第1時点より後の前記レースの第2時点における第2状態を推定する、
請求項1から3のいずれか一項に記載の配信動画生成装置。
【請求項5】
前記状態推定部は、前記状態遷移情報において前記第1状態から遷移可能な1以上の状態の中から、前記モデルと前記第2時点の前記取得動画とに基づいて前記第2状態を選択する、
請求項4に記載の配信動画生成装置。
【請求項6】
前記状態推定部は、前記取得動画における前記第1時点から前記第2時点までに対してそれぞれ前記モデルが出力する状態情報に基づいて、前記第1状態から前記第2状態への遷移を判定する、
請求項4又は5に記載の配信動画生成装置。
【請求項7】
前記状態遷移情報は、前記取得動画に対応するレースが開始してからの経過時間と、複数の状態とを関連付けた情報を含み、
前記状態推定部は、前記取得動画に対応するレースが開始してからの経過時間に基づいて、前記第1状態から前記第2状態への遷移を判定する、
請求項4から6のいずれか一項に記載の配信動画生成装置。
【請求項8】
前記レースは、競技体が競技トラックを周回するレースであり、
前記取得動画に対応するレースの周回数を示す周回情報を取得するレース情報取得部をさらに有し、
前記状態推定部は、推定したレースの状態に基づいて、前記取得動画に対応するレースにおける競技体の周回済み回数を推定し、
前記生成部は、前記周回情報が示す周回数と、前記状態推定部が推定した前記競技体の周回済み回数とに対応する画像及び音の少なくともいずれかを前記配信動画に含める、
請求項1から7のいずれか一項に記載の配信動画生成装置。
【請求項9】
コンピュータが実行する、
レースの動画を取得動画として取得するステップと、
過去に開催されたレースの動画である過去レース動画と当該過去レース動画に対応するレースの状態とに基づいて学習した、レースの動画の入力に対して当該レースの状態を示す状態情報を出力するモデルを用いて、取得した前記取得動画に対応するレースの状態を推定するステップと、
推定された前記レースの状態に対応する画像と音の少なくともいずれかと、前記取得動画とに基づいて配信動画を生成するステップと、
生成された前記配信動画を出力するステップと、
を有する配信動画生成方法。
【請求項10】
コンピュータを、
レースの動画を取得動画として取得する動画取得部、
過去に開催されたレースの動画である過去レース動画と当該過去レース動画に対応するレースの状態とに基づいて学習した、レースの動画の入力に対して当該レースの状態を示す状態情報を出力するモデルを用いて、前記動画取得部が取得した前記取得動画に対応するレースの状態を推定する状態推定部、
前記状態推定部が推定した前記レースの状態に対応する画像と音の少なくともいずれかと、前記取得動画とに基づいて配信動画を生成する生成部、及び、
前記生成部が生成した前記配信動画を出力する出力部、
として機能させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、配信動画生成装置、配信動画生成方法及びプログラムに関する。
【背景技術】
【0002】
競輪、競馬、オートレース又は競艇等の投票が行われる各種公営競技のレース動画をリアルタイムで配信することが行われている。レース動画には、演出性を高めるため、テロップや演出音等の情報が合成される。レース動画は、リアルタイムで配信されるため、人手により情報を合成すると、合成するタイミングが遅れたり、誤った情報を合成したりしてしまう可能性がある。このため、人手を介さずに画像や音声を合成することが望まれている。
【0003】
例えば、特許文献1には、撮像装置の状態の変化や、撮像装置の操作に関するイベントを検出し、撮像装置により撮像された動画において、検出したイベントに対応する区間をシーンとして定義するシステムが開示されている。シーンを定義することにより、シーンに対応する画像や音声を合成することができる。
【先行技術文献】
【特許文献】
【0004】
【文献】国際公開第99/03273号
【発明の概要】
【発明が解決しようとする課題】
【0005】
レース動画に適切な情報を合成するには、レースがどのような状況であるかを特定する必要がある。これに対し、特許文献1に開示されているシステムは、動画中のシーンを分けるに過ぎず、レース動画において、レースがどのような状況であるかを特定することができなかった。このため、特許文献1に開示されているシステムは、レースの状況に応じて適切な情報を合成することができなかった。
【0006】
そこで、本発明は、レースの状況を特定し、適切な情報を合成したレースの配信動画を生成することを目的とする。
【課題を解決するための手段】
【0007】
本発明の一態様に係る配信動画生成装置は、レースの動画を取得動画として取得する動画取得部と、過去に開催されたレースの動画である過去レース動画と当該過去レース動画に対応するレースの状態とに基づいて学習した、レースの動画の入力に対して当該レースの状態を示す状態情報を出力するモデルを用いて、前記動画取得部が取得した前記取得動画に対応するレースの状態を推定する状態推定部と、前記状態推定部が推定した前記レースの状態に対応する画像と音の少なくともいずれかと、前記取得動画とに基づいて配信動画を生成する生成部と、前記生成部が生成した前記配信動画を出力する出力部と、を有する。
【発明の効果】
【0008】
本発明によれば、レースの状況を特定し、適切な情報を合成したレースの配信動画を生成することができるという効果を奏する。
【図面の簡単な説明】
【0009】
図1】本実施形態に係る投票システムのシステム構成の一例を示す図である。
図2】情報処理装置のハードウェア構成例を示す図である。
図3】状態遷移情報の一例を示す図である。
図4】プロセッサの機能ブロック構成例を示す図である。
図5】配信動画生成装置がレースの状況に対応する情報を合成した配信動画を配信する処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0010】
<システム構成>
図1は、本実施形態に係る配信システム1のシステム構成の一例を示す図である。図1に示す配信システム1は、配信動画生成装置10と、一以上の撮像装置20と、一以上の端末30を備える。配信動画生成装置10及び撮像装置20は、インターネット、イントラネット、無線LAN、又は移動通信網等の通信ネットワークNを介して互いに通信可能に接続されている。配信動画生成装置10及び端末30は、通信ネットワークNを介して互いに通信可能に接続されている。
【0011】
配信動画生成装置10は、撮像装置20が撮像した開催中のレースの動画を取得動画として取得し、取得動画に基づいて端末30に配信する配信動画を生成する装置である。配信動画生成装置10は、例えば1又は複数の物理的なサーバから構成されている。配信動画生成装置10は、ハイパーバイザー(hypervisor)上で動作する仮想的なサーバを用いて構成されていてもよく、クラウドサーバを用いて構成されていてもよい。本実施形態では、レースは、競輪、競馬、競艇及びオートレース等の競技体(自転車、競走馬、モーターボート、オートバイ)が競技トラック(レースコース)を周回するレースであるものとする。
【0012】
撮像装置20は、レース場及び競技場の周辺に設置されており、レース場に入場する選手、競走馬等の競技体を撮影したり、レース中の競技体を撮影したりして、動画を生成する。撮像装置20は、生成した動画を配信動画生成装置10に送信する。
【0013】
端末30は、レースに投票する投票者が利用する端末であり、例えば、携帯電話(スマートフォンを含む)、タブレット端末又はパーソナルコンピュータ等の情報処理端末である。端末30は、投票者の操作に応じて、配信動画生成装置10から配信された配信動画を表示する。端末30は、投票対象の入力を投票者から受け付け、レースに投票することができる。
【0014】
配信動画生成装置10は、レースの状況に対応する情報を取得動画に合成した配信動画を生成する。レースの状況に対応する情報は、例えば、「選手入場」、「スタート」といった選手又は競技の状態を示す文字情報、又は残りの周回数を示す数字情報である。配信動画生成装置10が端末30に対してレースの状況に合った情報を合成した配信動画を配信するには、レースがどのような状況であるかを特定し、レース動画に適切な情報を合成する必要がある。
【0015】
これに対し、配信動画生成装置10は、過去に開催されたレースの動画である過去レース動画と当該過去レース動画に対応するレースの状態とに基づいて学習した、レースの動画の入力に対して当該レースの状態を示す状態情報を出力するモデルを用いて、撮像装置20から取得した取得動画に対応するレースの状態を推定する。当該モデルは、例えば、過去レース動画と当該過去レース動画に対応するレースの状態とを教師データとして機械学習することにより作成されたモデルである。配信動画生成装置10は、推定したレースの状態に対応する画像と音の少なくともいずれかと、取得動画に基づいて配信動画を生成する。これにより、配信動画生成装置10は、適切な情報を合成したレースの配信動画を生成することができる。
以下、配信動画生成装置10の構成及び動作を詳細に説明する。
【0016】
<ハードウェア構成>
図2は、配信動画生成装置10のハードウェア構成例を示す図である。配信動画生成装置10は、プロセッサ11、記憶部12、通信IF(Interface)13、入力デバイス14、及び出力デバイス15を有する。
【0017】
プロセッサ11は、例えばCPU(Central Processing Unit)、GPU(Graphical Processing Unit)又はASIC(Application Specific Integrated Circuit)等であり、記憶部12に記憶されたプログラムを実行することにより各種の機能を実現する。一例として、ASICは、TPU(Tensor Processing Unit)、Edge TPUを含む。
【0018】
記憶部12は、メモリ、HDD(Hard Disk Drive)又はSSD(Solid State Drive)等の記憶媒体を有する。記憶部12は、プロセッサ11が実行するプログラムを記憶する。また、記憶部12は、レースの経過に伴う状態遷移を示す状態遷移情報を記憶する。状態遷移情報は、レースに関する状態を示す状態情報と、当該状態から遷移可能なレースに関する状態を示す遷移先状態情報とを関連付けた情報である。図3は、状態遷移情報に基づくレースの状態遷移の一例を示す図である。
【0019】
図3に示す例では、レースに関する状態として、入場、レース開始、周回、ジャン(打鐘音)鳴動、レース終了が定義されている。図3に示す例では、複数のレースに関する状態が矢印で接続されている。矢印の始端に接続されているレースの状態は、遷移元のレースの状態を示している。矢印の終端に接続されているレースの状態は、遷移先のレースの状態を示している。図3に示す例では、「入場」から「レース開始」に遷移可能であり、「レース開始」から「周回」に遷移可能であり、「ジャン鳴動」から「周回」に遷移可能であり、「周回」から「ジャン鳴動」及び「レース終了」に遷移可能なことが示されている。
【0020】
通信IF13は、通信ネットワークNを介して撮像装置20及び端末30との間で有線通信又は無線通信を行うための通信コントローラを有する。通信IF13は、撮像装置20から受信した取得動画をプロセッサ11に出力する。また、通信IF13は、プロセッサ11から入力された配信動画を端末30に送信する。
【0021】
入力デバイス14は、例えば配信動画生成装置10の操作者から入力操作を受け付ける。入力デバイス14は、例えば、キーボード、タッチパネル、マウス又はマイクである。出力デバイス15は、例えば配信動画生成装置10の管理者に対して情報を出力する。出力デバイス15は、例えば、ディスプレイ又はスピーカ等である。
【0022】
<機能ブロック構成>
図4は、プロセッサ11の機能ブロック構成例を示す図である。プロセッサ11は、動画取得部111と、状態推定部112と、レース情報取得部113と、生成部114と、出力部115とを有する。プロセッサ11は、記憶部12に記憶されたプログラムを実行することにより、動画取得部111と、状態推定部112と、レース情報取得部113と、生成部114と、出力部115として機能する。
【0023】
動画取得部111は、一以上の撮像装置20が撮影したレースに関する動画を取得動画として取得する。レースに関する動画には、レースそのものの動画だけではなく、競技体のレース場への入場場面や、パドック等のレース前の競技体の状況を撮影した動画も含まれる。動画取得部111は、入力デバイス14を介して操作者から取得動画の選択を受け付け、選択されたレースの動画を取得動画として取得してもよい。
【0024】
状態推定部112は、過去に開催されたレースに関する動画である過去レース動画と当該過去レース動画に対応するレースの状態とに基づいて学習した、レースに関する動画の入力に対して当該レースの状態を示す状態情報を出力する状態推定モデルを用いて、動画取得部111が取得した取得動画に対応するレースの状態を推定する。
【0025】
状態推定モデルは、第1状態推定モデルと、第2状態推定モデルとを含んでおり、例えば、記憶部12に記憶されている。第1状態推定モデルは、過去レース動画を構成する画像と、当該画像に対応するレースの状態とに基づいて学習した、レースに関する動画を構成する画像の入力に対して、当該レースの状態を示す第1状態情報を出力するモデルである。第2状態推定モデルは、過去レース動画を構成する音と、当該音に対応するレースの状態とに基づいて学習した、レースに対応する音の入力に対して、当該レースの状態を示す第2状態情報を出力するモデルである。
【0026】
例えばレースが競輪である場合、第1状態情報が示すレースの状態には、競技体としての選手がバックストレッチを走行している状態、第1コーナー又は第2コーナーを走行している状態、第3コーナー又は第4コーナーを走行している状態、ゴールラインを走行している状態、ホームストレッチを走行している状態、レース場に入場している状態、発走準備をしている状態、発走台からスタートした状態が含まれる。また、レースの状態には、レースのオープニング、入場待機等の状態が含まれる。
【0027】
第2状態情報が示すレースの状態には、ファンファーレが鳴った状態、選手の入場曲が鳴った状態、選手の残りの周回が所定回数となったことを通知するジャンが鳴った状態、レース結果等を通知するための効果音が鳴った状態、アナウンス音が鳴った状態、レース終了後に流れるBGMが鳴った状態、発走時の発砲音が鳴った状態、笛が鳴った状態、ウグイス嬢が発走を案内している状態、電話投票締め切り音が鳴った状態、実況者や解説者が発話している状態等が含まれる。
【0028】
第2状態推定モデルは、過去レース動画を構成する音を所定期間(例えば、0.5秒間)ごとに区切ったときの、所定期間の音を示す画像である音変換画像と、当該所定期間の音に対応するレースの状態とを教師データとして学習することにより生成される。音変換画像は、例えば、横軸が時刻を示し、縦軸が音の周波数を示すメルスペクトログラムである。
【0029】
音変換画像は、所定期間における音そのものを示す音変換画像の他に、所定期間における音をシフトさせたシフト変換画像、所定期間における音を伸長させたストレッチ変換画像、又はホワイトノイズ等のノイズが付加されたノイズ付加画像であってもよい。第2状態推定モデルは、これらの音変換画像と、当該音変換画像に対応するレースの状態とに基づいて学習することにより生成される。このようにすることで、第2状態推定モデルは、所定期間の音に対応するレースの状態を精度良く推定することができる。
【0030】
状態推定部112は、第1状態推定モデルを用いて取得動画に対応するレースの状態を推定するとともに、第2状態推定モデルを用いて取得動画に対応するレースの状態を推定する。状態推定部112は、取得動画を構成する画像を第1状態推定モデルに入力し、第1状態推定モデルから出力された第1状態情報を取得する。また、状態推定部112は、取得動画に対応する音を音変換画像に変換し、当該音変換画像を第2状態推定モデルに入力し、第2状態推定モデルから出力された第2状態情報を取得する。このようにすることで、配信動画生成装置10は、レース風景に基づいてレースの状態を推定することができるとともに、ファンファーレやジャン等のレースに関する音声に基づいてレースの状態を推定することができる。
【0031】
記憶部12は、第1状態情報と第2状態情報との組み合わせと、当該組み合わせに対応するレースの状態とが関連付けたレース状態情報を記憶している。状態推定部112は、レース状態情報を参照し、第1状態推定モデルから取得した第1状態情報と、第2状態推定モデルから取得した第2状態情報との組み合わせに関連付けられているレースの状態を、取得動画に対応するレースの状態として推定する。
【0032】
なお、状態推定モデルは、状態情報とともに、状態情報が示すレースの状態の信頼性を示すスコアを出力してもよい。状態推定部112は、状態推定モデルから出力されたスコアが所定の閾値を超えた場合に、状態推定モデルから出力された状態情報に基づいてレースの状態を推定してもよい。
【0033】
また、状態推定部112は、状態推定モデルを用いて推定したレースの第1時点におけるレースの状態である第1状態と、記憶部12に記憶されている状態遷移情報とに基づいて、第1時点より後のレースの第2時点におけるレースの状態である第2状態を推定する。
【0034】
例えば、状態推定部112が、第1時点に対応する取得動画を状態推定モデルに入力した結果、第1時点におけるレースの状態である第1状態を「周回」と推定したとする。この場合、状態推定部112は、図3に示すように、「周回」から遷移可能な1以上のレースの状態である第2状態を「ジャン鳴動」又は「レース終了」と推定する。
【0035】
その後、状態推定部112は、状態遷移情報において第1状態から遷移可能な1以上の状態の中から、状態推定モデルと、第2時点の取得動画とに基づいて、第2状態を選択する。そして、状態推定部112は、取得動画における第1時点から第2時点までに対してそれぞれモデルが出力する状態情報に基づいて、第1状態から第2状態への遷移を判定する。
【0036】
例えば、状態推定部112が、上述したように第1時点におけるレースの状態である第1状態を「周回」と推定し、第2時点において「周回」から遷移可能なレースの状態である第2状態を「ジャン鳴動」及び「レース終了」と推定したとする。そして、状態推定部112が、第2時点に対応する取得動画を状態推定モデルに入力した結果、第2時点の取得動画に対応するレースの状態を「ジャン鳴動」と推定したものとする。この場合、状態推定部112は、第1状態から遷移可能な第2状態「ジャン鳴動」及び「レース終了」のうち、状態推定モデルを用いて推定した「ジャン鳴動」に遷移すると判定する。
【0037】
他方、状態推定部112が第2時点に対応する取得動画を状態推定モデルに入力した結果、「周回」等の「ジャン鳴動」及び「レース終了」とは異なるレースの状態を推定した場合、第2時点におけるレースの状態を「周回」に維持する。このようにすることで、配信動画生成装置10は、レース状態の推定精度を向上させ、レース経過と一致しない状態に対応する画像、音声が合成された配信動画が生成されてしまうことを抑制することができる。
【0038】
なお、状態遷移情報は、レースに関する状態を示す状態情報と、当該状態から遷移可能な遷移先状態を示す遷移先状態情報とを関連付けた情報であることとしたが、これに限らない。状態遷移情報は、取得動画に対応するレースが開始してからの経過時間と、複数のレースの状態とを関連付けたタイムテーブル情報を含んでいてもよい。この場合、状態推定部112は、取得動画に対応するレースが開始してからの経過時間に基づいて、第1時点に対応するレースの状態を示す第1状態から、第2時点に対応するレースの状態を示す第2状態への遷移を判定してもよい。
【0039】
例えば、状態推定部112は、タイムテーブル情報を参照し、レースが開始してからの実際の経過時間に対して所定の範囲内の経過時間に関連付けられている複数のレースの状態から選択した状態を第1の状態として特定する。そして、状態推定部112は、第1の状態に対応する経過時間よりも後の経過時間に関連付けられている複数の状態を第2状態と特定し、特定した第2状態のいずれかに遷移するか否かを判定する。このようにすることで、配信動画生成装置10は、現時点の状態を、その時点で生じ得ない状態であると誤って特定しないので、レースの状態の推定精度が向上する。
【0040】
また、状態推定部112は、取得動画に対応するレースにおける競技体の周回済み回数を推定してもよい。この場合、まず、レース情報取得部113が、取得動画に対応するレースの周回数を示す周回情報を取得する。例えば、記憶部12には、レースを識別するためのレース識別情報と、当該レースの周回数とが関連付けられて記憶されている。レース情報取得部113は、記憶部12を参照し、現時点で開始するレース、又は最も早く開始するレースのレース識別情報に関連付けられている周回情報を、取得動画に対応するレースの周回情報として取得する。
【0041】
状態推定部112は、レース情報取得部113が取得した周回情報と、状態推定モデルを用いて推定したレースの状態とに基づいて、取得動画に対応するレースにおける競技体の周回済み回数を推定する。具体的には、まず、状態推定部112は、レースの状態を「レース開始」と推定したことに応じて、周回済み回数を0とする。続いて、状態推定部112は、第1状態推定モデルを用いて推定したレースの状態が、競技体がバックストレッチを走行している状態から第1コーナー又は第2コーナーを走行している状態に変化すると、周回済み回数に1を加算する。状態推定部112は、推定した周回済み回数を生成部114に通知する。このようにすることで、配信動画生成装置10は、レースの周回に関する画像や情報を取得動画に合成することができる。
【0042】
生成部114は、状態推定部112が推定したレースの状態に対応する画像と音の少なくともいずれかと、取得動画とに基づいて配信動画を生成する。例えば、記憶部12に、レースの状態と、当該レースの状態に対応する画像、音等の情報を関連付けて記憶させておく。生成部114は、記憶部12を参照し、状態推定部112が取得動画から推定したレースの状態に関連付けられている情報を取得動画に合成することにより配信動画を生成する。
【0043】
例えば、状態推定部112が推定したレースの状態が「ジャン鳴動」に遷移すると、生成部114は、記憶部12において、「ジャン鳴動」に関連付けられているレースの周回が残り1周半であることを示す画像を取得動画に合成して配信動画を生成する。また、生成部114は、取得動画に対応する音に、レースの状態に対応する効果音や音声等の音を合成することにより配信動画を生成する。
【0044】
生成部114は、状態推定部112が取得動画から推定したレースの状態が遷移したことに応じて、推定したレースの状態に対応する画像等の情報を取得動画に合成することにより配信動画を生成してもよい。生成部114は、取得動画の一部を切り出した部分画像に、テロップ等の情報を合成して配信動画を生成してもよい。
【0045】
また、生成部114は、レース情報取得部113が取得した周回情報が示す周回数と、状態推定部112が推定した競技体の周回済み回数とに対応する画像及び音の少なくともいずれかを前記配信動画に含めてもよい。例えば、生成部114は、レース情報取得部113が取得した周回情報が示す周回数から、状態推定部112が推定した周回済み回数を減算し、残り周回数を算出する。そして、生成部114は、取得動画に残り周回数を示す画像を合成することにより配信動画を生成する。
【0046】
ここで、状態推定部112によるレースの状態の推定には処理時間が発生することから、取得動画の取得時刻である第1時刻から、状態推定部112の処理時間だけ遅延した第2時刻に、当該取得動画に対応するレースの状態が推定される。そこで、生成部114は、第2時刻以降において、第1時刻に対応する取得動画に、推定したレースの状態に対応する画像を合成して配信動画を生成する。このようにすることで、配信動画生成装置10は、配信動画の配信時刻が、当該配信動画に対応する取得動画の取得時刻(第1時刻)より遅延したとしても、取得動画に対応するレースの状態と一致した情報を付加した配信動画を生成することができる。
【0047】
出力部115は、生成部114が生成した配信動画を出力する。例えば、出力部115は、生成部114が生成した配信動画を、通信IF13を介して端末30に配信する。上述したように、状態推定部112によるレースの状態の推定には処理時間が発生し、取得動画に対応する配信動画の生成にも処理時間が発生する。したがって、出力部115は、第1時刻に取得した取得動画にレースの状態に対応する情報を合成した配信動画を、第1時刻よりも遅い時刻に端末30に配信する。これにより、出力部115は、ほぼリアルタイムで配信動画を端末30に配信する。
【0048】
<配信動画生成装置10の処理の流れ>
続いて、配信動画生成装置10の処理の流れを説明する。図5は、配信動画生成装置10がレースの状況に対応する情報を合成した配信動画を配信する処理の流れを示すフローチャートである。
【0049】
まず、動画取得部111は、撮像装置20が撮影したレースに関する動画を取得動画として取得する(S11)。
続いて、状態推定部112は、状態推定モデルに取得動画を入力し、状態推定モデルからレースの状態を示す状態情報を取得することによりレースの状態を推定する(S12)。
【0050】
続いて、生成部114は、状態推定部112が推定したレースの状態に対応する画像と音の少なくともいずれかと、取得動画とに基づいて配信動画を生成する(S13)。
続いて、出力部115は、生成部114が生成した配信動画を端末30に配信する(S14)。全ての配信動画の配信が終了した場合(S15においてYES)、配信動画生成装置10は配信処理を終了する。全ての配信動画の配信が終了していない場合、配信動画生成装置10は処理をS11に戻して、動画取得部111は、再び取得動画を取得する。これにより、取得動画に対応する配信動画が連続して生成され、配信動画が端末30に配信される。
【0051】
<配信システム1による効果>
以上説明したように、状態推定部112は、過去に開催されたレースの動画である過去レース動画と当該過去レース動画に対応するレースの状態とに基づいて学習した、レースの動画の入力に対して当該レースの状態を示す状態情報を出力するモデルを用いて、動画取得部111が取得した取得動画に対応するレースの状態を推定する。生成部114は、状態推定部112が推定したレースの状態に対応する画像と音の少なくともいずれかと、取得動画とに基づいて配信動画を生成する。これにより、配信動画生成装置10は、レースの状況を特定し、レースの状況に合う適切な情報を合成したレースの配信動画を生成することができる。
【0052】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、上述の実施の形態では、配信動画生成装置10は、開催中のレースの動画を取得動画として取得し、当該取得動画に基づいて生成した配信動画をほぼリアルタイムで配信するものとしたが、これに限らない。配信動画生成装置10は、撮像装置20により過去に撮像されたレースの動画を取得動画として取得し、当該取得動画に対応するレースの状態を推定し、当該取得動画と、推定したレースの状態に対応する画像と音の少なくともいずれかに基づいて配信動画を生成してもよい。また、レースの状態は、画像と音の少なくともいずれかに基づいて推論するようにしても構わない。
【0053】
また、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。
【0054】
上記実施形態に加えて、さらに以下を付記する。
(付記1)
レースの動画を取得動画として取得する動画取得部と、
過去に開催されたレースの動画である過去レース動画と当該過去レース動画に対応するレースの状態とに基づいて学習した、レースの動画の入力に対して当該レースの状態を示す状態情報を出力するモデルを用いて、前記動画取得部が取得した前記取得動画に対応するレースの状態を推定する状態推定部と、
前記状態推定部が推定した前記レースの状態に対応する画像と音の少なくともいずれかと、前記取得動画とに基づいて配信動画を生成する生成部と、
前記生成部が生成した前記配信動画を出力する出力部と、
を有する配信動画生成装置。
このように配信動画生成装置が構成されていることにより、レースの状況を特定し、適切な情報を合成したレースの配信動画を生成することができる。
(付記2)
前記状態推定部は、前記過去レース動画を構成する画像と、当該画像に対応するレースの状態とに基づいて学習した、レースの動画を構成する画像の入力に対して当該レースの状態を示す状態情報を出力するモデルを用いて、前記取得動画に対応する当該レースの状態を推定する、
付記1に記載の配信動画生成装置。
このように配信動画生成装置が構成されていることにより、レース風景に基づいてレースの状態を推定することができる。
(付記3)
前記状態推定部は、前記過去レース動画に対応する音と、当該音に対応するレースの状態とに基づいて学習した、レースに対応する音の入力に対して当該レースの状態を示す状態情報を出力するモデルを用いて、前記動画取得部が取得した前記取得動画に含まれる音に対応するレースの状態を推定する、
付記1又は2に記載の配信動画生成装置。
このように配信動画生成装置が構成されていることにより、ファンファーレやジャン等のレースに関する音声に基づいてレースの状態を推定することができる。
(付記4)
前記レースの経過に伴う状態遷移を示す状態遷移情報を記憶する記憶部をさらに有し、
前記状態推定部は、前記モデルを用いて推定したレースの第1時点における第1状態と、前記状態遷移情報とに基づいて、前記第1時点より後の前記レースの第2時点における第2状態を推定する、
付記1から3のいずれか一項に記載の配信動画生成装置。
このように配信動画生成装置が構成されていることにより、レース状態の推定精度を向上させることができる。
(付記5)
前記状態推定部は、前記状態遷移情報において前記第1状態から遷移可能な1以上の状態の中から、前記モデルと前記第2時点の前記取得動画とに基づいて前記第2状態を選択する、
付記4に記載の配信動画生成装置。
このように配信動画生成装置が構成されていることにより、レース経過と一致しない状態に対応する画像、音声が合成されることを抑制することができる。
(付記6)
前記状態推定部は、前記取得動画における前記第1時点から前記第2時点までに対してそれぞれ前記モデルが出力する状態情報に基づいて、前記第1状態から前記第2状態への遷移を判定する、
付記4又は5に記載の配信動画生成装置。
このように配信動画生成装置が構成されていることにより、時間経過が通常のレースとは異なる場合であっても状態遷移に基づいて状態を推定することができる。
(付記7)
前記状態遷移情報は、前記取得動画に対応するレースが開始してからの経過時間と、複数の状態とを関連付けた情報を含み、
前記状態推定部は、前記取得動画に対応するレースが開始してからの経過時間に基づいて、前記第1状態から前記第2状態への遷移を判定する、
付記4から6のいずれか一項に記載の配信動画生成装置。
このように配信動画生成装置が構成されていることにより、レース開始からの時間経過に対応して現在の状態を推定することができる。
(付記8)
前記レースは、競技体が競技トラックを周回するレースであり、
前記取得動画に対応するレースの周回数を示す周回情報を取得するレース情報取得部をさらに有し、
前記状態推定部は、推定したレースの状態に基づいて、前記取得動画に対応するレースにおける競技体の周回済み回数を推定し、
前記生成部は、前記周回情報が示す周回数と、前記状態推定部が推定した前記競技体の周回済み回数とに対応する画像及び音の少なくともいずれかを前記配信動画に含める、
付記1から7のいずれか一項に記載の配信動画生成装置。
このように配信動画生成装置が構成されていることにより、レースの周回に関する画像、情報を合成することができる。
(付記9)
コンピュータが実行する、
レースの動画を取得動画として取得するステップと、
過去に開催されたレースの動画である過去レース動画と当該過去レース動画に対応するレースの状態とに基づいて学習した、レースの動画の入力に対して当該レースの状態を示す状態情報を出力するモデルを用いて、取得した前記取得動画に対応するレースの状態を推定するステップと、
推定された前記レースの状態に対応する画像と音の少なくともいずれかと、前記取得動画とに基づいて配信動画を生成するステップと、
生成された前記配信動画を出力するステップと、
を有する配信動画生成方法。
このような配信動画生成方法を実行することにより、レースの状況を特定し、適切な情報を合成したレースの配信動画を生成することができる。
(付記10)
コンピュータを、
レースの動画を取得動画として取得する動画取得部、
過去に開催されたレースの動画である過去レース動画と当該過去レース動画に対応するレースの状態とに基づいて学習した、レースの動画の入力に対して当該レースの状態を示す状態情報を出力するモデルを用いて、前記動画取得部が取得した前記取得動画に対応するレースの状態を推定する状態推定部、
前記状態推定部が推定した前記レースの状態に対応する画像と音の少なくともいずれかと、前記取得動画とに基づいて配信動画を生成する生成部、及び、
前記生成部が生成した前記配信動画を出力する出力部、
として機能させるプログラム。
このようなプログラムをプロセッサが実行することにより、レースの状況を特定し、適切な情報を合成したレースの配信動画を生成することができる。
【符号の説明】
【0055】
1 配信システム
10 情報処理装置
11 プロセッサ
12 記憶部
13 通信IF
14 入力デバイス
15 出力デバイス
20 撮像装置
30 端末
111 動画取得部
112 状態推定部
113 レース情報取得部
114 生成部
115 出力部
図1
図2
図3
図4
図5