(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022048237
(43)【公開日】2022-03-25
(54)【発明の名称】メッセージ出力装置、メッセージ出力方法及びプログラム
(51)【国際特許分類】
H04N 5/92 20060101AFI20220317BHJP
A63F 13/79 20140101ALI20220317BHJP
A63F 13/85 20140101ALI20220317BHJP
A63F 13/53 20140101ALI20220317BHJP
H04N 5/232 20060101ALI20220317BHJP
【FI】
H04N5/92 010
A63F13/79
A63F13/85
A63F13/53
H04N5/232 290
【審査請求】有
【請求項の数】14
【出願形態】OL
(21)【出願番号】P 2022008101
(22)【出願日】2022-01-21
(62)【分割の表示】P 2020537908の分割
【原出願日】2018-08-20
(71)【出願人】
【識別番号】310021766
【氏名又は名称】株式会社ソニー・インタラクティブエンタテインメント
(74)【代理人】
【識別番号】110000154
【氏名又は名称】特許業務法人はるか国際特許事務所
(72)【発明者】
【氏名】浅山 弘孝
(57)【要約】
【課題】コミュニケーションが行われているかのような気分をユーザが味わうことができるメッセージ出力装置、学習装置、メッセージ出力方法、学習方法及びプログラムを提供する。
【解決手段】入力部66は、連続する複数のフレームの学習画像を含む学習入力データと、学習入力データに対応付けられるメッセージを含む教師データと、を含む学習データを用いた学習が実行された学習済の機械学習モデル50に、連続する複数のフレームのターゲット画像を少なくとも含むターゲット入力データを入力する。メッセージ特定部68は、ターゲット入力データを機械学習モデル50に入力した際の出力に応じたメッセージを特定する。メッセージ出力部70は、特定されるメッセージを出力する。
【選択図】
図4
【特許請求の範囲】
【請求項1】
連続する複数のフレームの学習画像を含む学習入力データと、前記学習入力データに対応付けられるメッセージを含む教師データと、を含む学習データを用いた学習が実行された学習済の機械学習モデルと、
連続する複数のフレームのターゲット画像を少なくとも含むターゲット入力データを前記機械学習モデルに入力する入力部と、
前記ターゲット入力データを前記機械学習モデルに入力した際の出力に応じたメッセージを特定するメッセージ特定部と、
特定される前記メッセージを出力するメッセージ出力部と、
を含むことを特徴とするメッセージ出力装置。
【請求項2】
前記入力部は、ゲームのプレイ中に生成される、当該ゲームのプレイ状況を表す連続する複数のフレームの前記ターゲット画像を少なくとも含む前記ターゲット入力データを前記機械学習モデルに入力し、
前記メッセージ出力部は、特定される前記メッセージを、前記ゲームのプレイ中に出力する、
ことを特徴とする請求項1に記載のメッセージ出力装置。
【請求項3】
前記学習入力データは、前記学習画像に対応付けられるプレイヤの情報をさらに含み、
前記ターゲット入力データは、前記ゲームをプレイしているプレイヤの情報をさらに含む、
ことを特徴とする請求項2に記載のメッセージ出力装置。
【請求項4】
前記プレイヤの情報には、前記プレイヤによるコントローラ入力の情報が含まれる、
ことを特徴とする請求項3に記載のメッセージ出力装置。
【請求項5】
前記プレイヤの情報には、コントローラの入力頻度を示す値が含まれる、
ことを特徴とする請求項4に記載のメッセージ出力装置。
【請求項6】
前記プレイヤの情報には、前記プレイヤの顔を撮影した画像が含まれる、
ことを特徴とする請求項3から5のいずれか一項に記載のメッセージ出力装置。
【請求項7】
前記学習入力データは、前記教師データが示すメッセージとは異なるメッセージをさらに含み、
前記ターゲット入力データは、前記メッセージ出力部により既に出力されたメッセージをさらに含む、
ことを特徴とする請求項1から6のいずれか一項に記載のメッセージ出力装置。
【請求項8】
連続する複数のフレームの学習画像を含む学習入力データと、前記学習入力データに対応付けられるメッセージを含む教師データと、を含む学習データを取得する学習データ取得部と、
前記学習データを用いて機械学習モデルの学習を実行する学習部と、
を含むことを特徴とする学習装置。
【請求項9】
現在配信中である、あるいは、過去に配信された、ゲームの配信の状況を示す配信データに基づいて、前記学習データを生成する学習データ生成部、をさらに含む、
ことを特徴とする請求項8のいずれか一項に記載の学習装置。
【請求項10】
連続する複数のフレームの学習画像を含む学習入力データと、前記学習入力データに対応付けられるメッセージを含む教師データと、を含む学習データを用いた学習が実行された学習済の機械学習モデルに、連続する複数のフレームのターゲット画像を少なくとも含むターゲット入力データを入力するステップと、
前記ターゲット入力データを前記機械学習モデルに入力した際の出力に応じたメッセージを特定するステップと、
特定される前記メッセージを出力するステップと、
を含むことを特徴とするメッセージ出力方法。
【請求項11】
連続する複数のフレームの学習画像を含む学習入力データと、前記学習入力データに対応付けられるメッセージを含む教師データと、を含む学習データを取得するステップと、
前記学習データを用いて機械学習モデルの学習を実行するステップと、
を含むことを特徴とする学習方法。
【請求項12】
連続する複数のフレームの学習画像を含む学習入力データと、前記学習入力データに対応付けられるメッセージを含む教師データと、を含む学習データを用いた学習が実行された学習済の機械学習モデルに、連続する複数のフレームのターゲット画像を少なくとも含むターゲット入力データを入力する手順、
前記ターゲット入力データを前記機械学習モデルに入力した際の出力に応じたメッセージを特定する手順、
特定される前記メッセージを出力する手順、
をコンピュータに実行させることを特徴とするプログラム。
【請求項13】
連続する複数のフレームの学習画像を含む学習入力データと、前記学習入力データに対応付けられるメッセージを含む教師データと、を含む学習データを取得する手順、
前記学習データを用いて機械学習モデルの学習を実行する手順、
をコンピュータに実行させることを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、メッセージ出力装置、学習装置、メッセージ出力方法、学習方法及びプログラムに関する。
【背景技術】
【0002】
例えばゲーム実況や映像によるスポーツ観戦などにおいて、プレイヤや観客などのユーザによって投稿されたメッセージの文字列や発せられたメッセージの音声が共有されるようにすることでコミュニケーションを促進する技術が知られている。
【発明の概要】
【発明が解決しようとする課題】
【0003】
ここでプレイヤや観客などのユーザが例えば一人でいる状況でも上述のコミュニケーションが行われているかのような気分を味わうことができれば、当該ユーザはよりゲーム実況や映像によるスポーツ観戦などを楽しめるものと期待できる。
【0004】
本発明は上記課題に鑑みてなされたものであって、その目的の1つは、コミュニケーションが行われているかのような気分をユーザが味わうことができるメッセージ出力装置、学習装置、メッセージ出力方法、学習方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0005】
上記課題を解決するために、本発明に係るメッセージ出力装置は、連続する複数のフレームの学習画像を含む学習入力データと、前記学習入力データに対応付けられるメッセージを含む教師データと、を含む学習データを用いた学習が実行された学習済の機械学習モデルと、連続する複数のフレームのターゲット画像を少なくとも含むターゲット入力データを前記機械学習モデルに入力する入力部と、前記ターゲット入力データを前記機械学習モデルに入力した際の出力に応じたメッセージを特定するメッセージ特定部と、特定される前記メッセージを出力するメッセージ出力部と、を含む。
【0006】
本発明の一態様では、前記入力部は、ゲームのプレイ中に生成される、当該ゲームのプレイ状況を表す連続する複数のフレームの前記ターゲット画像を少なくとも含む前記ターゲット入力データを前記機械学習モデルに入力し、前記メッセージ出力部は、特定される前記メッセージを、前記ゲームのプレイ中に出力する。
【0007】
この態様では、前記学習入力データは、前記学習画像に対応付けられるプレイヤの情報をさらに含み、前記ターゲット入力データは、前記ゲームをプレイしているプレイヤの情報をさらに含んでいてもよい。
【0008】
ここで、前記プレイヤの情報には、前記プレイヤによるコントローラ入力の情報が含まれていてもよい。
【0009】
この場合、前記プレイヤの情報には、コントローラの入力頻度を示す値が含まれていてもよい。
【0010】
また、この態様では、前記プレイヤの情報には、前記プレイヤの顔を撮影した画像が含まれていてもよい。
【0011】
また、本発明の一態様では、前記学習入力データは、前記教師データが示すメッセージとは異なるメッセージをさらに含み、前記ターゲット入力データは、前記メッセージ出力部により既に出力されたメッセージをさらに含む。
【0012】
また、本発明に係る学習装置は、連続する複数のフレームの学習画像を含む学習入力データと、前記学習入力データに対応付けられるメッセージを含む教師データと、を含む学習データを取得する学習データ取得部と、前記学習データを用いて機械学習モデルの学習を実行する学習部と、を含む。
【0013】
本発明の一態様では、現在配信中である、あるいは、過去に配信された、ゲームの配信の状況を示す配信データに基づいて、前記学習データを生成する学習データ生成部、をさらに含む。
【0014】
また、本発明に係るメッセージ出力方法は、連続する複数のフレームの学習画像を含む学習入力データと、前記学習入力データに対応付けられるメッセージを含む教師データと、を含む学習データを用いた学習が実行された学習済の機械学習モデルに、連続する複数のフレームのターゲット画像を少なくとも含むターゲット入力データを入力するステップと、前記ターゲット入力データを前記機械学習モデルに入力した際の出力に応じたメッセージを特定するステップと、特定される前記メッセージを出力するステップと、を含む。
【0015】
また、本発明に係る学習方法は、連続する複数のフレームの学習画像を含む学習入力データと、前記学習入力データに対応付けられるメッセージを含む教師データと、を含む学習データを取得するステップと、前記学習データを用いて機械学習モデルの学習を実行するステップと、を含む。
【0016】
また、本発明に係るプログラムは、連続する複数のフレームの学習画像を含む学習入力データと、前記学習入力データに対応付けられるメッセージを含む教師データと、を含む学習データを用いた学習が実行された学習済の機械学習モデルに、連続する複数のフレームのターゲット画像を少なくとも含むターゲット入力データを入力する手順、前記ターゲット入力データを前記機械学習モデルに入力した際の出力に応じたメッセージを特定する手順、特定される前記メッセージを出力する手順、をコンピュータに実行させる。
【0017】
また、本発明に係る別のプログラムは、連続する複数のフレームの学習画像を含む学習入力データと、前記学習入力データに対応付けられるメッセージを含む教師データと、を含む学習データを取得する手順、前記学習データを用いて機械学習モデルの学習を実行する手順、をコンピュータに実行させる。
【図面の簡単な説明】
【0018】
【
図1】本発明の一実施形態に係るエンタテインメントシステムの全体構成の一例を示す図である。
【
図2】本発明の一実施形態に係るエンタテインメント装置の構成の一例を示す図である。
【
図4】本発明の一実施形態に係るエンタテインメント装置で実装される機能の一例を示す機能ブロック図である。
【
図6】本発明の一実施形態に係るエンタテインメント装置で行われる学習処理の流れの一例を示すフロー図である。
【
図7】本発明の一実施形態に係るエンタテインメント装置で行われるメッセージ出力処理の流れの一例を示すフロー図である。
【発明を実施するための形態】
【0019】
以下、本発明の一実施形態について図面に基づき詳細に説明する。
【0020】
図1は、本発明の一実施形態に係るエンタテインメントシステム10の全体構成の一例を示す図である。本実施形態に係るエンタテインメントシステム10は、エンタテインメント装置12、ディスプレイ14、カメラ16、マイク18、コントローラ20などを含んでいる。
【0021】
本実施形態に係るエンタテインメント装置12は、例えばゲームコンソール、DVDプレイヤ、Blu-ray(登録商標)プレイヤなどといったコンピュータである。本実施形態に係るエンタテインメント装置12は、例えば記憶されている、あるいは、光ディスクに記録された、ゲームプログラムの実行やコンテンツの再生などによって映像や音声を生成する。そして本実施形態に係るエンタテインメント装置12は、生成される映像を表す映像信号や生成される音声を表す音声信号を、ディスプレイ14に出力する。
【0022】
本実施形態に係るエンタテインメント装置12には、例えば
図2に示すように、プロセッサ30、記憶部32、通信部34、入出力部36が含まれる。
【0023】
プロセッサ30は、例えばエンタテインメント装置12にインストールされるプログラムに従って動作するCPU等のプログラム制御デバイスである。本実施形態に係るプロセッサ30には、CPUから供給されるグラフィックスコマンドやデータに基づいてフレームバッファに画像を描画するGPU(Graphics Processing Unit)も含まれている。
【0024】
記憶部32は、例えばROMやRAM等の記憶素子やハードディスクドライブなどである。記憶部32には、プロセッサ30によって実行されるプログラムなどが記憶される。また、本実施形態に係る記憶部32には、GPUにより画像が描画されるフレームバッファの領域が確保されている。
【0025】
通信部34は、例えば無線LANモジュールなどの通信インタフェースなどである。
【0026】
入出力部36は、HDMI(登録商標)(High-Definition Multimedia Interface)ポート、USBポートなどの入出力ポートである。
【0027】
ディスプレイ14は、例えば液晶ディスプレイ等であり、エンタテインメント装置12から出力される映像信号が表す映像などを表示させる。またディスプレイ14は、エンタテインメント装置12から出力される音声信号が表す音声を出力する。
【0028】
カメラ16は、例えば被写体を撮像した画像などといった、カメラ16の周辺の様子を表すデータをエンタテインメント装置12に出力するデジタルカメラ等のデバイスである。
【0029】
マイク18は、周囲の音声を取得して当該音声を表す音声データをエンタテインメント装置12に出力するデバイスである。
【0030】
エンタテインメント装置12とディスプレイ14とは、例えば、HDMIケーブルなどを介して接続されている。エンタテインメント装置12とカメラ16やマイク18とは、例えば、AUXケーブルなどを介して接続されている。
【0031】
コントローラ20は、エンタテインメント装置12に対する操作入力を行うための操作入力装置である。ユーザは、コントローラ20が備える方向キーやボタンを押下したり、操作スティックを傾けたりすることで、コントローラ20を用いて各種の操作入力を行うことができる。そして本実施形態では、コントローラ20は、操作入力に対応付けられる入力データをエンタテインメント装置12に出力する。また本実施形態に係るコントローラ20は、USBポートを備えている。そしてコントローラ20は、USBケーブルでエンタテインメント装置12と接続することで、有線で入力データをエンタテインメント装置12に出力することができる。また本実施形態に係るコントローラ20は、無線通信モジュール等を備えており、無線で入力データをエンタテインメント装置12に出力することができるようにもなっている。
【0032】
またコントローラ20が、加速度センサや感圧センサやタッチパッドなどのセンサを備えていてもよい。そしてコントローラ20は、コントローラ20が備えるセンサによる測定値を示すセンシングデータをエンタテインメント装置12に送信してもよい。
【0033】
本実施形態では例えば、エンタテインメント装置12でゲームプログラムが実行されることにより、ゲームのプレイ状況を表す映像や音声が生成される。そして当該映像が、当該ゲームのプレイヤが見るディスプレイ14に表示され、当該音声がディスプレイ14から出力される。
【0034】
図3は、本実施形態においてディスプレイ14に表示されるゲーム画面40の一例を示す図である。
図3の例ではゲーム画面40の左側にゲームのプレイ状況を表すフレーム画像であるプレイ状況画像42が配置されている。またゲーム画面40の右上隅には、例えばゲームのプレイ状況を実況するキャラクタ44の画像が配置される。そしてゲームのプレイ状況に応じたメッセージを表す文字列が、当該キャラクタ44が発するセリフとして右下のメッセージ領域46に表示されたり、当該メッセージを表す音声がディスプレイ14から出力されたりする。
【0035】
そして本実施形態では例えば、ニューラルネットワークやサポートベクタマシンなどといった学習済の機械学習モデルを用いて特定されるメッセージが出力される。以下、当該機械学習モデルの学習、及び、学習済の当該機械学習モデルを用いたメッセージの出力を中心に、本実施形態に係るエンタテインメント装置12の機能、及び、エンタテインメント装置12で実行される処理について説明する。
【0036】
図4は、本実施形態に係るエンタテインメント装置12で実装される機能の一例を示す機能ブロック図である。なお、本実施形態に係るエンタテインメント装置12で、
図4に示す機能のすべてが実装される必要はなく、また、
図4に示す機能以外の機能が実装されていても構わない。
【0037】
図4に示すように、エンタテインメント装置12は、機能的には例えば、機械学習モデル50、配信データ取得部52、学習データ生成部54、学習データ記憶部56、学習データ取得部58、学習部60、ターゲット入力データ生成部62、ターゲット入力データ取得部64、入力部66、メッセージ特定部68、メッセージ出力部70、を含んでいる。
【0038】
機械学習モデル50は、プロセッサ30及び記憶部32を主として実装される。配信データ取得部52は、プロセッサ30及び通信部34を主として実装される。学習データ生成部54、学習データ取得部58、学習部60、ターゲット入力データ生成部62、ターゲット入力データ取得部64、入力部66、メッセージ特定部68は、プロセッサ30を主として実装される。学習データ記憶部56は、記憶部32を主として実装される。メッセージ出力部70は、プロセッサ30及び入出力部36を主として実装される。
【0039】
機械学習モデル50、配信データ取得部52、学習データ生成部54、学習データ記憶部56、学習データ取得部58、学習部60の機能は、機械学習モデル50の学習を実行する学習装置としての機能に相当する。
【0040】
機械学習モデル50、ターゲット入力データ生成部62、ターゲット入力データ取得部64、入力部66、メッセージ特定部68、メッセージ出力部70の機能は、学習済の機械学習モデル50を用いたメッセージの出力を実行するメッセージ出力装置の機能に相当する。
【0041】
以上の機能は、コンピュータであるエンタテインメント装置12にインストールされた、以上の機能に対応する指令を含むプログラムをプロセッサ30で実行することにより実装されてもよい。このプログラムは、例えば、光ディスク、磁気ディスク、磁気テープ、光磁気ディスク、フラッシュメモリ等のコンピュータ読み取り可能な情報記憶媒体を介して、あるいは、インターネットなどを介してエンタテインメント装置12に供給されてもよい。
【0042】
機械学習モデル50は、本実施形態では例えば、ニューラルネットワークやサポートベクタマシンなどの機械学習モデルである。
【0043】
配信データ取得部52は、本実施形態では例えば、ゲーム実況映像の配信サイトなどから、現在配信中である、あるいは、過去に配信された、ゲームの配信の状況を示す配信データを取得する。
【0044】
学習データ生成部54は、本実施形態では例えば、
図5に模式的に示されている学習データ80を生成する。ここで例えば、配信データ取得部52が取得する配信データに基づいて、学習データ80が生成されてもよい。
【0045】
学習データ生成部54は例えば、配信データから、プレイヤや観客などのユーザにより投稿されて画面に表示されたメッセージの文字列や、プレイヤや観客などのユーザが発した音声のメッセージなどといった、発生したメッセージを抽出する。以下、当該メッセージを学習メッセージ82と呼ぶこととする。ここで例えば、直前のメッセージが発生したタイミングから所定時間以上が経過してから発生したメッセージが学習メッセージ82として抽出されてもよい。また例えば、直前のメッセージが発生したタイミングから所定時間以上が経過してから連続して発生した所定数のメッセージが学習メッセージ82として抽出されてもよい。あるいは例えば、所定時間内に発生した一連のメッセージが学習メッセージ82として抽出されてもよい。
【0046】
そして学習データ生成部54は、例えば、抽出されたメッセージが発生したタイミングに相当するフレームを特定する。ここで複数のメッセージが抽出される場合には、例えば最初のメッセージが発生したタイミングに相当するフレームが特定されてもよい。ここでは、特定されるフレームのフレーム番号がnであるとする。そして学習データ生成部54は、フレーム番号が(n-a+1)以上(n+b)以下である、(a+b)個のフレーム画像を配信データから抽出する。以下、このようにして抽出されるフレーム画像を学習画像84と呼ぶこととする。
【0047】
そして学習データ生成部54は例えば、連続する複数のフレームの学習画像84を学習入力データとして含み、抽出された学習メッセージ82を教師データとして含む学習データ80を生成する。ここで学習データ生成部54は、ゲームのプレイ状況を表す連続する所定数のフレームの学習画像84を学習入力データとして含み、抽出された学習メッセージ82を教師データとして含む学習データ80を生成してもよい。ここでは例えば、(a+b)個の学習画像84を学習入力データとして含む学習データ80が生成される。この例では、学習データ80に含まれる教師データである学習メッセージ82は、当該学習データ80に含まれる、連続する(a+b)個のフレームの学習画像84が表示されている期間に発せられたメッセージであることとなる。そして、学習データ生成部54は、生成される学習データ80を学習データ記憶部56に記憶させる。
【0048】
なお後述するように、学習データ80に含まれる教師データに、当該メッセージが発せられた際の感情を表すラベルが含まれていてもよい。
【0049】
また学習データ80に含まれる教師データに、メッセージが発生したか否かを示すラベルが含まれていてもよい。
【0050】
この場合、学習データ生成部54は例えば、連続する複数のフレームの学習画像84を学習入力データとして含み、抽出された学習メッセージ82、及び、メッセージが発生したことを示すラベルを教師データとして含む学習データ80を生成してもよい。
【0051】
また学習データ生成部54は例えば、配信データから、メッセージが発生していない期間における複数のフレーム画像(例えば(a+b)個のフレーム画像)を学習画像84として抽出してもよい。そして、学習データ生成部54は、抽出される学習画像84を学習入力データとして含み、メッセージが発生していないことを示すラベルを教師データとして含む学習データ80を生成してもよい。
【0052】
学習データ記憶部56は、本実施形態では例えば、学習入力データと教師データとを含む学習データ80を記憶する。ここで学習入力データには、連続する複数のフレームの学習画像84が含まれていてもよい。また教師データには、当該学習入力データに対応付けられる学習メッセージ82(例えば、当該学習画像84が表示されている期間に発せられた学習メッセージ82)が含まれていてもよい。
【0053】
学習データ取得部58は、本実施形態では例えば、学習データ記憶部56が記憶する学習データ80を取得する。
【0054】
学習部60は、本実施形態では例えば、学習データ取得部58が取得する学習データ80を用いて機械学習モデル50の学習を実行する。ここで例えば学習データ80に含まれる学習入力データを機械学習モデル50に入力した際の出力と当該学習データ80に含まれる教師データとの差に基づいて、機械学習モデル50に設定されているパラメータの値が更新される教師あり学習が実行されてもよい。
【0055】
ターゲット入力データ生成部62は、本実施形態では例えば、連続する複数のフレームのターゲット画像を少なくとも含むターゲット入力データを生成する。ここでターゲット入力データ生成部62は、ゲームのプレイ中に生成される、当該ゲームのプレイ状況を表す連続する所定数のフレームのターゲット画像を少なくとも含むターゲット入力データを生成してもよい。ここで例えば表示されているプレイ状況画像42のフレーム番号がmであるとする。この場合、フレーム番号が(m-a-b+1)以上m以下である、直近に表示された(a+b)個のフレームのプレイ状況画像42が取得される。そして当該(a+b)個のフレームのプレイ状況画像42をターゲット画像として含むターゲット入力データが生成される。
【0056】
ターゲット入力データ取得部64は、本実施形態では例えば、ターゲット入力データ生成部62が生成するターゲット入力データを取得する。
【0057】
入力部66は、本実施形態では例えば、ターゲット入力データ取得部64が取得するターゲット入力データを学習済の機械学習モデル50に入力する。
【0058】
メッセージ特定部68は、本実施形態では例えば、ターゲット入力データ取得部64が取得するターゲット入力データを学習済の機械学習モデル50に入力した際の出力に応じたメッセージを特定する。
【0059】
メッセージ出力部70は、本実施形態では例えば、メッセージ特定部68が特定するメッセージを出力する。ここでメッセージ出力部70は、特定されるメッセージを、ゲームのプレイ中に出力してもよい。メッセージ出力部70は例えば、メッセージ特定部68が特定するメッセージを表す文字列をメッセージ領域46に表示させてもよい。またメッセージ出力部70は、メッセージ特定部68が特定するメッセージに基づいて音声合成技術を用いて生成される音声を出力させてもよい。
【0060】
本実施形態では、プレイヤや観客などのユーザによって投稿されたメッセージの文字列や発せられたメッセージの音声などを学習した学習済の機械学習モデル50を用いた、ゲームのプレイ状況に応じたメッセージの出力が行われる。このようにして本実施形態によれば、例えばプレイヤが一人でゲームをプレイしている状況などにおいても、ゲームのプレイ中におけるコミュニケーションが行われているかのような気分をプレイヤが味わうことができる。
【0061】
なお、本発明の適用範囲は、プレイヤに対するメッセージの出力には限定されない。例えば、ゲームのプレイ映像を視聴している観客に対するプレイの状況に応じたメッセージの出力や、スポーツの試合映像を鑑賞している視聴者に対する試合の状況に応じたメッセージの出力などに本実施形態が応用されてもよい。これらの場合もコミュニケーションが行われているかのような気分を観客や視聴者などのユーザは味わうことができる。
【0062】
なお、機械学習モデル50に入力可能な画像の数が固定である場合には、学習入力データに含まれる学習画像84の数と、ターゲット入力データに含まれるターゲット画像の数と、は同じ所定数にする必要がある。ここで、機械学習モデル50がニューラルネットワークである場合にニューラルネットワークの種類によっては入力可能な画像のフレーム数が可変なことがある。このような場合には、複数の学習データ80のそれぞれに含まれる学習画像84の数やターゲット入力データに含まれるターゲット画像の数は同じでなくてもよい。
【0063】
ここで上述の配信データに、例えば、ゲームをプレイするプレイヤの情報が含まれていてもよい。当該プレイヤの情報は、例えばゲーム実況映像の配信サイトに接続されたエンタテインメントシステム10から収集されるようにしてもよい。そして例えば学習データ生成部54が、学習画像84に対応付けられるプレイヤの情報をさらに学習入力データに含む学習データ80を生成してもよい。そしてこの場合に、ターゲット入力データ生成部62が、ゲームをプレイしているプレイヤの情報をさらに含むターゲット入力データを生成してもよい。
【0064】
学習入力データに含まれるプレイヤの情報には、例えば、キーログのデータなどといった、プレイヤによるコントローラ入力の情報が含まれていてもよい。例えば学習データ生成部54が、学習データ80に含まれる複数のフレームの学習画像84が表示された期間におけるプレイヤによるコントローラ入力の情報を特定してもよい。そして特定されるコントローラ入力の情報をさらに学習入力データに含む学習データ80を生成してもよい。
【0065】
この場合、ターゲット入力データ生成部62が、直近の複数のフレーム(上述の例では(a+b)個のフレーム)のプレイ状況画像42が表示されている期間における、ゲームをプレイしているプレイヤの情報をさらに含むターゲット入力データを生成してもよい。例えば当該期間における、ゲームをプレイしているプレイヤによるコントローラ入力の情報をさらに含むターゲット入力データが生成されてもよい。
【0066】
また例えば、学習データ生成部54は、学習データ80に含まれる複数のフレームの学習画像84が表示された期間におけるプレイヤによるコントローラ入力の情報に基づいて、当該期間におけるコントローラ20の入力頻度を特定してもよい。ここで例えば、当該期間における、コントローラ20に対する単位時間あたりの入力回数が入力頻度として特定されてもよい。そして学習データ生成部54は、当該入力頻度を示す値をさらに学習入力データに含む学習データ80を生成してもよい。
【0067】
この場合、ターゲット入力データ生成部62が、直近の複数のフレームのプレイ状況画像42が表示されている期間におけるプレイヤによるコントローラ入力の情報に基づいて、当該期間におけるコントローラ20の入力頻度を特定してもよい。そして学習データ生成部54は、当該入力頻度を示す値をさらに含むターゲット入力データを生成してもよい。
【0068】
また学習入力データに含まれるプレイヤの情報に、例えば、カメラ16がプレイヤの顔を撮影した画像であるプレイヤ顔画像が含まれていてもよい。例えば学習データ生成部54が、学習データ80に含まれる複数のフレームの学習画像84が表示された期間に撮影されたプレイヤ顔画像をさらに学習入力データに含む学習データ80を生成してもよい。
【0069】
この場合、ターゲット入力データ生成部62が、直近の複数のフレームのプレイ状況画像42が表示されている期間にカメラ16が撮影したプレイヤ顔画像をさらに含むターゲット入力データを生成してもよい。
【0070】
また学習入力データに含まれるプレイヤの情報に、例えば、学習データ80に含まれる複数のフレームの学習画像84が表示された期間にコントローラ20が備えるセンサによる測定値を示すセンシングデータが含まれていてもよい。ここで上述のように、当該センサは、例えば加速度センサや感圧センサやタッチパッドなどであってもよい。また上述のように当該センシングデータはコントローラ20からエンタテインメント装置12に送信されてもよい。この場合、ターゲット入力データ生成部62が、直近の複数のフレームのプレイ状況画像42が表示されている期間におけるコントローラ20が備えるセンサによる測定値を示すセンシングデータをさらに含むターゲット入力データを生成してもよい。
【0071】
また例えば、ヘッドマウントディスプレイ(HMD)を装着してプレイするゲームにおける当該プレイヤの情報に、HMDから取得可能な、HMDが備える視線センサや加速度センサなどのセンサによる測定値を示すセンシングデータが含まれていてもよい。例えば学習データ80に含まれる複数のフレームの学習画像84が表示された期間にHMDから取得されるセンシングデータをさらに学習入力データに含む学習データ80が生成されてもよい。この場合、ターゲット入力データ生成部62が、直近の複数のフレームのプレイ状況画像42が表示されている期間にHMDから取得されるセンシングデータをさらに含むターゲット入力データを生成してもよい。
【0072】
例えばゲームの状況がのんびりしている場合と緊迫している場合とでは、上述のようにして取得されるプレイヤの情報が異なるものと思われる。具体的には例えば、ゲームの状況がのんびりしている場合よりも緊迫している場合の方がコントローラ20の入力頻度は高くなるものと思われる。また例えばゲームの状況がのんびりしている場合よりも緊迫している場合の方がコントローラ20や視線やHMDの動きは激しくなるものと思われる。また例えば、ゲームの状況がのんびりしている場合よりも緊迫している場合とではプレイヤの表情は違うものと思われる。このようにプレイヤの情報は出力されるべきメッセージに応じたものとなっている可能性が高い。そのため例えば機械学習モデル50の学習に上述のプレイヤの情報を用いることで、機械学習モデル50からより的確なメッセージが出力されるようになるものと期待できる。
【0073】
また学習入力データに、学習データ80に教師データとして含まれる学習メッセージ82とは異なるメッセージが含まれていてもよい。ここで例えば学習データ生成部54は、学習データ80に教師データとして含まれる学習メッセージ82が発生したタイミングの所定時間前から当該学習メッセージ82が発生したタイミングまでに発生したメッセージを特定してもよい。そして学習データ生成部54は、特定されたメッセージをさらに学習入力データに含む学習データ80を生成してもよい。この場合、ターゲット入力データ生成部62が、所定時間前から現在までにメッセージ出力部70が出力したメッセージをさらに含むターゲット入力データを生成してもよい。
【0074】
メッセージは、当該メッセージよりも前に発せられたメッセージを受けて発せられることが多い。そのため、例えば機械学習モデル50の学習に当該メッセージよりも前に発生したメッセージ等の、当該メッセージとは異なるメッセージを用いることで、機械学習モデル50からより的確なメッセージが出力されるようになるものと期待できる。
【0075】
また学習入力データに、プレイされているゲームのタイトルや種類を示すデータが含まれていてもよい。この場合、ターゲット入力データ生成部62が、プレイされているゲームのタイトルや種類を示すデータを含むターゲット入力データを生成してもよい。
【0076】
また上述したように、学習データ80に含まれる教師データに感情を表すラベルが含まれる場合、メッセージ特定部68は、学習済の機械学習モデル50からの出力に基づいて、感情を特定する。そしてメッセージ出力部70は、特定される感情に応じたメッセージの出力を行ってもよい。例えば特定される感情が表現された音声が出力されてもよい。また例えば特定される感情に応じた動作のキャラクタ44が表示されるようにしてもよい。
【0077】
ここで例えば、学習データ生成部54は、上述したプレイヤの情報に基づいて感情を推定してもよい。そして、学習データ生成部54は、推定される感情を表すラベルをさらに教師データに含む学習データ80を生成してもよい。
【0078】
ここで、本実施形態に係るエンタテインメント装置12で行われる機械学習モデル50の学習処理の流れの一例を、
図6に例示するフロー図を参照しながら説明する。ここでは例えば、学習データ記憶部56に複数の学習データ80が記憶されていることとする。
【0079】
まず、学習データ取得部58が、学習データ記憶部56に記憶されている学習データ80のうちから、機械学習モデル50の学習に用いられていないものを1つ取得する(S101)。
【0080】
そして、学習部60が、S101に示す処理で取得された学習データ80を用いて機械学習モデル50の学習を実行する(S102)。
【0081】
そして、学習部60が、学習データ記憶部56に記憶されているすべての学習データ80についてS102に示す処理が実行されたか否かを確認する(S103)。
【0082】
ここですべての学習データ80についてS102に示す処理が実行されていないことが確認された場合は(S103:N)、S101に示す処理に戻る。
【0083】
すべての学習データ80についてS102に示す処理が実行されたことが確認された場合は(S103:Y)、本処理例に示す処理は終了される。
【0084】
次に、本実施形態に係るエンタテインメント装置12で行われる学習済の機械学習モデル50を用いたメッセージの出力処理の流れの一例を、
図7に例示するフロー図を参照しながら説明する。本処理例ではプレイ状況画像42の表示が行われるフレームレートでS201~S206に示す処理は繰り返し実行されることとする。
【0085】
まず、ターゲット入力データ生成部62が、当該フレームにおけるターゲット入力データを生成する(S201)。
【0086】
そして、ターゲット入力データ取得部64が、S201に示す処理で生成されたターゲット入力データを取得する(S202)。
【0087】
そして、入力部66が、S202に示す処理で取得されたターゲット入力データを学習済の機械学習モデル50に入力する(S203)。
【0088】
そして、メッセージ特定部68が、S203に示す処理での入力に応じた機械学習モデル50の出力に基づいて、出力すべきメッセージを特定する(S204)。ここで上述のように感情やメッセージが発生したか否かの判定結果が特定されてもよい。
【0089】
そして、メッセージ特定部68が、S204に示す処理でメッセージが特定されたか否かを確認する(S205)。メッセージが特定されなかったことが確認された場合は(S205:N)、S201に示す処理に戻る。メッセージが特定されたことが確認された場合は(S205:Y)、メッセージ出力部70が、S204に示す処理で特定されたメッセージを出力して(S206)、S201に示す処理に戻る。ここで上述のように特定された感情に応じた出力が行われてもよい。また、メッセージが発生したか否かの判定結果が出力されてもよい。
【0090】
上述の処理例において、例えばプレイ状況画像42の最初のフレーム番号が0であることとした場合における、フレーム番号が0以上(a+b-2)以下であるプレイ状況画像42が表示されている期間は、上述の処理が実行されないようにしてもよい。
【0091】
また上述の処理例のように毎フレームにおいてS201~S206に示す処理が実行される必要はない。例えばランダムに、あるいは、所定時間間隔でS201~S206に示す処理が実行されるようにしてもよい。
【0092】
なお、本発明は上述の実施形態に限定されるものではない。
【0093】
また、上記の具体的な文字列や数値及び図面中の具体的な文字列や数値は例示であり、これらの文字列や数値には限定されない。
【符号の説明】
【0094】
10 エンタテインメントシステム、12 エンタテインメント装置、14 ディスプレイ、16 カメラ、18 マイク、20 コントローラ、30 プロセッサ、32 記憶部、34 通信部、36 入出力部、40 ゲーム画面、42 プレイ状況画像、44 キャラクタ、46 メッセージ領域、50 機械学習モデル、52 配信データ取得部、54 学習データ生成部、56 学習データ記憶部、58 学習データ取得部、60 学習部、62 ターゲット入力データ生成部、64 ターゲット入力データ取得部、66 入力部、68 メッセージ特定部、70 メッセージ出力部、80 学習データ、82 学習メッセージ、84 学習画像。
【手続補正書】
【提出日】2022-02-07
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
ゲームのプレイ中に生成されるターゲット入力データを学習済の機械学習モデルに入力する入力部と、
前記ターゲット入力データを前記機械学習モデルに入力した際の出力に応じたメッセージを出力するメッセージ出力部と、
を含むことを特徴とするメッセージ出力装置。
【請求項2】
前記メッセージ出力部は、プレイ中の前記ゲームのプレイ状況を表す画像と、前記ターゲット入力データを前記機械学習モデルに入力した際の出力に応じたメッセージと、を出力する、
ことを特徴とする請求項1に記載のメッセージ出力装置。
【請求項3】
前記メッセージ出力部は、プレイ中の前記ゲームのプレイ状況を表す画像と、前記ターゲット入力データを前記機械学習モデルに入力した際の出力に応じたメッセージと、が配置された画面を出力する、
ことを特徴とする請求項1に記載のメッセージ出力装置。
【請求項4】
前記メッセージ出力部は、キャラクタが発するセリフとして、前記ターゲット入力データを前記機械学習モデルに入力した際の出力に応じたメッセージを出力する、
ことを特徴とする請求項1から3のいずれか一項に記載のメッセージ出力装置。
【請求項5】
前記機械学習モデルは、画像と、当該画像に対応付けられるメッセージと、を含む学習データを用いた学習が実行された学習済の機械学習モデルであり、
前記ターゲット入力データは、前記ゲームのプレイ中に生成されるターゲット画像を少なくとも含む、
ことを特徴とする請求項1から4のいずれか一項に記載のメッセージ出力装置。
【請求項6】
前記学習データに含まれるメッセージは、ユーザにより投稿されて画面に表示された文字列である、
ことを特徴とする請求項5に記載のメッセージ出力装置。
【請求項7】
前記学習データに含まれるメッセージは、ユーザが発した音声のメッセージである、
ことを特徴とする請求項5に記載のメッセージ出力装置。
【請求項8】
前記学習データには、ゲームの配信の状況を示す配信データに含まれる画像と、当該配信データから抽出されるメッセージと、が含まれる、
ことを特徴とする請求項5から7のいずれか一項に記載のメッセージ出力装置。
【請求項9】
前記学習データは、当該学習データに含まれる前記画像に対応付けられるプレイヤの情報をさらに含み、
前記ターゲット入力データは、プレイ中の前記ゲームをプレイしているプレイヤの情報をさらに含む、
ことを特徴とする請求項5から8のいずれか一項に記載のメッセージ出力装置。
【請求項10】
前記プレイヤの情報には、前記プレイヤによるコントローラ入力の情報が含まれる、
ことを特徴とする請求項9に記載のメッセージ出力装置。
【請求項11】
前記プレイヤの情報には、コントローラの入力頻度を示す値が含まれる、
ことを特徴とする請求項10に記載のメッセージ出力装置。
【請求項12】
前記プレイヤの情報には、前記プレイヤの顔を撮影した画像が含まれる、
ことを特徴とする請求項9から11のいずれか一項に記載のメッセージ出力装置。
【請求項13】
ゲームのプレイ中に生成されるターゲット入力データを学習済の機械学習モデルに入力するステップと、
前記ターゲット入力データを前記機械学習モデルに入力した際の出力に応じたメッセージを出力するステップと、
を含むことを特徴とするメッセージ出力方法。
【請求項14】
ゲームのプレイ中に生成されるターゲット入力データを学習済の機械学習モデルに入力する手順、
前記ターゲット入力データを前記機械学習モデルに入力した際の出力に応じたメッセージを出力する手順、
をコンピュータに実行させることを特徴とするプログラム。