(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2023-07-20
(45)【発行日】2023-07-28
(54)【発明の名称】サーバ
(51)【国際特許分類】
H04N 21/278 20110101AFI20230721BHJP
【FI】
H04N21/278
(21)【出願番号】P 2023070727
(22)【出願日】2023-04-24
【審査請求日】2023-04-24
【早期審査対象出願】
(73)【特許権者】
【識別番号】517287224
【氏名又は名称】17LIVE株式会社
(74)【代理人】
【識別番号】100199277
【氏名又は名称】西守 有人
(72)【発明者】
【氏名】柳瀬 綾子
【審査官】鈴木 隆夫
(56)【参考文献】
【文献】特開2019-097159(JP,A)
【文献】特開2021-019361(JP,A)
【文献】特表2020-517038(JP,A)
【文献】特表2020-521207(JP,A)
【文献】特許第7229497(JP,B1)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 21/00-21/858
(57)【特許請求の範囲】
【請求項1】
動画配信プラットフォームで配信される動画の配信者の情報を保持する配信者情報保持部と、
前記配信者により配信される動画の画像および音声を含む動画データを保持する動画データ保持部と、
前記動画データ保持部に保持される前記動画データをテキストデータに変換する変換部と、
それぞれが前記テキストデータおよび前記配信者情報保持部に保持される前記配信者の前記情報を入力とし、前記配信者を紹介する文章を出力とする複数の機械学習モデルであって、それぞれに異なる性格が設定された複数の機械学習モデルと、
前記配信者を特定するIDと、前記複数の機械学習モデルにより出力された前記配信者を紹介する複数の文章と、を対応付けて保持する文章保持部と、
前記動画配信プラットフォームのユーザのユーザ端末からネットワークを介して、検索要求を受け付ける要求受付部と、
前記検索要求に基づき前記文章保持部に対して検索を実行する検索部と、
前記検索部により実行された検索の結果を、前記ユーザ端末に前記ネットワークを介して提供する提供部と、を備えるサーバ。
【請求項2】
前記検索要求に含まれる検索対象のキーワードおよび前記ユーザ端末の前記ユーザの情報を入力とし、前記ユーザの要望を表す文章を出力とする別の機械学習モデルをさらに備え、
前記検索部は、前記別の機械学習モデルにより出力された文章と前記文章保持部に保持される文章とを比較することにより検索を実行する請求項1に記載のサーバ。
【請求項3】
前記別の機械学習モデルに、前記複数の機械学習モデルのうちのひとつの性格と同じ性格が設定される請求項2に記載のサーバ。
【請求項4】
前記動画配信プラットフォームで配信される前記動画は前記配信者によりリアルタイムで配信される請求項1に記載のサーバ。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、サーバに関する。
【背景技術】
【0002】
IT技術の発展と共に情報のやりとりの様も移り変わってきた。昭和の時代には新聞やテレビなどの一方通行の情報伝達が主であった。平成になると、ケータイやパソコンが普及し、インターネットの通信速度も大きく改善されたので、チャットサービスなどの即時双方向通信サービスが台頭し、また記憶コストの低減に伴ってオンデマンド型の動画配信サービスが受け入れられていった。そして、現在、令和の時代となり、スマートフォンの高機能化や5Gに代表されるネットワークの速度のさらなる向上を受けて、動画によるリアルタイムのコミュニケーションを実現するサービス、特にライブ配信(Live Streaming)サービスが急速に認知度を高めている。ライブ配信サービスは、離れた場所にいても皆が同じ楽しい時間を共有できるサービスとして、若者を中心に利用者が拡大している。
【0003】
ライブ配信プラットフォームでは、配信者は自分が好きなときにライブ配信を開始することができ、視聴者は自分の好きなときに興味のある配信者のライブ配信を視聴できる。特許文献1には、機械学習を用いてライブストリーミングコンテンツを推奨する技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【非特許文献】
【0005】
【文献】「ChatGPTにギルガメッシュ王の人格を与えるには?」、深津 貴之、URL:https://note.com/fladdict/n/neff2e9d52224
【文献】「画像の内容をAIが文章で答えるデモ」、株式会社エクサウィザーズ、URL:https://techblog.exawizards.com/entry/2019/02/15/175416
【文献】「文章間の類似度を測定する方法まとめ」、@shimi7o、URL:https://qiita.com/shimi7o/items/b3bc64e2fbe1103c7db9
【発明の概要】
【発明が解決しようとする課題】
【0006】
ライブ配信の配信者に関する情報は、ライブ配信の動画データ(画像、音声)、配信者のプロフィール、フォロー関係を示すデータ、コメント履歴、視聴履歴、タグなど多種多様なデータを含む。このような多種多様なデータをまとめて検索の対象とすることができれば、配信者検索の精度を高めることができる。
【0007】
本開示はこうした課題に鑑みてなされたものであり、その目的は、動画の配信者の検索を改善することができる技術の提供にある。
【課題を解決するための手段】
【0008】
本発明のある態様は、サーバに関する。このサーバは、動画配信プラットフォームで配信される動画の配信者の情報を保持する配信者情報保持部と、配信者により配信される動画の画像および音声を含む動画データを保持する動画データ保持部と、動画データ保持部に保持される動画データをテキストデータに変換する変換部と、それぞれがテキストデータおよび配信者情報保持部に保持される配信者の前記情報を入力とし、配信者を紹介する文章を出力とする複数の機械学習モデルであって、それぞれに異なる性格が設定された複数の機械学習モデルと、配信者を特定するIDと、複数の機械学習モデルにより出力された配信者を紹介する複数の文章と、を対応付けて保持する文章保持部と、動画配信プラットフォームのユーザのユーザ端末からネットワークを介して、検索要求を受け付ける要求受付部と、検索要求に基づき文章保持部に対して検索を実行する検索部と、検索部により実行された検索の結果を、ユーザ端末にネットワークを介して提供する提供部と、を備える。
【0009】
なお、以上の構成要素の任意の組み合わせや、本発明の構成要素や表現を装置、方法、システム、コンピュータプログラム、コンピュータプログラムを格納した記録媒体などの間で相互に置換したものもまた、本発明の態様として有効である。
【発明の効果】
【0010】
本発明によれば、動画の配信者の検索を改善することができる。
【図面の簡単な説明】
【0011】
【
図1】本開示の実施の形態に係るライブ配信システムの構成を示す模式図である。
【
図2】
図1のユーザ端末の機能および構成を示すブロック図である。
【
図3】
図1のサーバの機能および構成を示すブロック図である。
【
図4】
図3のストリームDBの一例を示すデータ構造図である。
【
図5】
図3のユーザDBの一例を示すデータ構造図である。
【
図6】
図3のギフトDBの一例を示すデータ構造図である。
【
図7】
図3の性格設定DBの一例を示すデータ構造図である。
【
図8】
図3の紹介文DBの一例を示すデータ構造図である。
【
図9】サーバにおける配信者検索に係る一連の処理の流れを示すフローチャートである。
【
図10】アクティブユーザのユーザ端末のディスプレイに表示される検索受付画面の代表画面図である。
【
図11】アクティブユーザのユーザ端末のディスプレイに表示される検索結果画面の代表画面図である。
【
図12】本実施の形態に係る情報処理装置のハードウェア構成例を示すブロック図である。
【発明を実施するための形態】
【0012】
以下、各図面に示される同一または同等の構成要素、部材、処理、信号には、同一の符号を付するものとし、適宜重複した説明は省略する。また、各図面において説明上重要ではない部材の一部は省略して表示する。
【0013】
実施の形態に係るライブ配信システムでは、配信者が行ったライブ配信のデータおよび当該配信者自身についての情報をGPT(Generative Pre-trained Transformer)などの生成系機械学習モデルに入力する。機械学習モデルは配信者を紹介する文章(以下、紹介文)を出力する。機械学習モデルには性格が設定され、性格が異なると同じ入力でも異なる紹介文が出力される。ライブ配信システムは、生成された紹介文を、配信者の検索のために使用する。
【0014】
ライブ配信の配信者に係る情報はライブ配信の画像データや音声データ、コメント、ギフト、内容を示すタグ、配信者自身のプロフィール、フォロー関係など多岐に亘るところ、本実施の形態に係るライブ配信システムではそれらの情報が紹介文という形で一つにまとめられて検索の対象となる。したがって、検索が効率化され、検索の精度も向上する。さらに、機械学習モデルに設定された性格に応じて異なる紹介文が生成されるので、ユーザの気分や嗜好に沿った検索結果を提供することができる。
【0015】
図1は、本開示の実施の形態に係るライブ配信システム1の構成を示す模式図である。ライブ配信システム1は、配信者(ライバー、ストリーマ(Streamer)ともいう)LVと視聴者(オーディエンスともいう)AU(AU1、AU2、…)とがリアルタイムでやりとりできる双方向型のライブ配信サービスを提供する。
図1に示すように、ライブ配信システム1は、サーバ10と、配信者側のユーザ端末20と、視聴者側のユーザ端末30(30a、30b、…)と、を備える。ライブ配信を配信している配信者、ライブ配信を視聴している視聴者の他に、ライブ配信プラットフォームにログインしたが配信も視聴もしていないユーザもいる。このようなユーザをアクティブユーザという。配信者、視聴者およびアクティブユーザをユーザと総称することがある。サーバ10は、ネットワークNWに接続された一または複数の情報処理装置によって構成されてもよい。ユーザ端末20、30は例えばスマートフォンやタブレット型端末やラップトップPCやレコーダや携帯型ゲーム機やウェアラブル装置などの携帯端末であってもよいし、デスクトップPCなどの据え置き型の装置であってもよい。サーバ10、ユーザ端末20およびユーザ端末30は、有線または無線の各種ネットワークNWにより互いに通信可能に接続される。
【0016】
ライブ配信システム1には、配信者LVと、視聴者AUと、サーバ10を管理する管理者(不図示)と、が関与する。配信者LVは、自分の歌や、トーク、パフォーマンス、占い、ゲーム実況などのコンテンツを自身のユーザ端末20で録音・録画してそのままサーバ10にアップロードすることで、リアルタイムにコンテンツを発信する者である。管理者は、サーバ10においてコンテンツのライブ配信のためのプラットフォームを提供し、また、配信者LVと視聴者AUとのリアルタイムのやりとりを仲介または管理する。視聴者AUは、ユーザ端末30でプラットフォームにアクセスして所望のコンテンツを選択し、視聴する。このコンテンツのライブ配信中に視聴者AUがユーザ端末30を介してコメントをしたり応援したり占いを依頼したりするための操作を行い、当該コンテンツを提供する配信者LVがそのようなコメントや応援や依頼に反応し、当該反応が映像および/または音声で視聴者AUに伝わることで、双方向のコミュニケーションが成立する。
【0017】
本明細書において「ライブ配信」は、配信者LVのユーザ端末20で録音・録画されたコンテンツが実質的にリアルタイムで視聴者AUのユーザ端末30で再生され視聴可能となる状態を実現するデータの伝送態様を意味するものであってもよく、またはそのような伝送態様により実現される配信そのものを意味してもよい。ライブ配信は、HTTP Live StreamingやCommon Media Application FormatやWeb Real-Time CommunicationsやReal-Time Messaging ProtocolやMPEG DASHなどの既存のライブ配信技術を用いて実現されてもよい。ライブ配信は、配信者LVがコンテンツを録音・録画しているときに、視聴者AUが所定の遅延をもって当該コンテンツを視聴可能な伝送態様を含む。遅延の大きさについて、少なくとも、配信者LVと視聴者AUとのやりとりが成立する程度の大きさの遅延は許される。ただし、ライブ配信は、コンテンツを録音・録画したデータ全体をいったんサーバに保存し、その後の任意のタイミングでユーザからの求めに応じて当該データをサーバからユーザに提供するいわゆるオンデマンド型の配信とは区別される。
【0018】
本明細書において「動画データ」は、ユーザ端末20、30の撮像機能により生成される画像データ(ビデオデータともいう)と、ユーザ端末20、30の音声入力機能により生成される音声データ(オーディオデータともいう)と、を含むデータである。動画データは、ユーザ端末20、30で再生されることで、ユーザによるコンテンツの視聴を可能とする。本実施の形態では、動画データが配信者のユーザ端末で生成されてから視聴者のユーザ端末で再生されるまでの間に、圧縮や伸張や符号化や復号やトランスコーディングなどの、データの形式やサイズや仕様を変更する処理が行われることが想定されている。このような処理の前後で動画データが表す内容(例えば、動画像や音声)は実質的に変わらないので、本実施の形態ではそのような処理が行われた後の動画データはそのような処理が行われる前の動画データと同じであるとして説明する。すなわち、動画データが配信者のユーザ端末で生成されてからサーバ10を経由して視聴者のユーザ端末で再生される場合、配信者のユーザ端末で生成された動画データと、サーバ10を通過する動画データと、視聴者のユーザ端末で受信されて再生される動画データと、は全て同じ動画データである。
【0019】
本明細書において「配信時間」は、ひとつのライブ配信に関連付けられたパラメータであって、当該ライブ配信が継続した期間の長さを指す。配信時間は、当該ライブ配信に視聴者がいるか否かとは無関係に算出される。
本明細書において「総配信時間」は、配信者に関連付けられたパラメータであって、所定の期間において対象の配信者が行ったライブ配信の配信時間を通算することで得られる時間である。
【0020】
図1の例では、配信者LVがトークをライブ配信している。配信者LVのユーザ端末20はトークを行っている配信者LVの像および音声を録画・録音することで動画データを生成し、ネットワークNWを介してサーバ10に送信する。併せてユーザ端末20は、録画された配信者LVの動画像VDをユーザ端末20のディスプレイに表示させることで、配信者LVによる配信内容の確認を可能とする。
【0021】
配信者LVのライブ配信の視聴をプラットフォームに要求した視聴者AU1、AU2のユーザ端末30a、30bはそれぞれ、ネットワークNWを介してライブ配信に係る動画データを受信し、受信した動画データを再生することでディスプレイに動画像VD1、VD2を表示させると共にスピーカーから音声を出力する。各ユーザ端末30a、30bで表示される動画像VD1、VD2は配信者LVのユーザ端末20が撮像した動画像VDと実質的に同一であり、各ユーザ端末30a、30bで出力される音声も配信者LVのユーザ端末20が録音した音声と実質的に同一である。
【0022】
配信者LVのユーザ端末20における録音・録画と、視聴者AU1、AU2のユーザ端末30a、30bにおける動画データの再生と、は実質的に同時に行われる。配信者LVのトークの内容についてひとりの視聴者AU1がコメントをユーザ端末30aに入力すると、サーバ10は当該コメントをリアルタイムで配信者LVのユーザ端末20に表示させると共に各視聴者AU1、AU2のユーザ端末30a、30bにも表示させる。当該コメントを読んだ配信者LVがその内容に被せたトークを展開すると、そのトークの動画像と音声が各視聴者AU1、AU2のユーザ端末30a、30bで出力され、これにより配信者LVと視聴者AU1との会話が成立したと認識される。このように、ライブ配信システム1では、一方通行でない双方向のコミュニケーションを可能とするライブ配信が実現される。
【0023】
図2は、
図1のユーザ端末20の機能および構成を示すブロック図である。ユーザ端末30はユーザ端末20と同様の機能および構成を有する。
図2および以後のブロック図に示す各ブロックは、ハードウェア的には、コンピュータのCPUをはじめとする素子や機械装置で実現でき、ソフトウェア的にはコンピュータプログラム等によって実現されるが、ここでは、それらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックはハードウェア、ソフトウェアの組み合せによっていろいろなかたちで実現できることは、本明細書に触れた当業者には理解されるところである。
【0024】
配信者LVおよび視聴者AUは、ダウンロードサイトからネットワークNWを介して、本実施の形態に係るライブ配信アプリケーションプログラム(以下、ライブ配信アプリという)をユーザ端末20、30にダウンロードし、インストールする。あるいはまた、ライブ配信アプリはユーザ端末20、30にプリインストールされていてもよい。ライブ配信アプリがユーザ端末20、30により実行されることにより、ユーザ端末20、30はネットワークNWを介してサーバ10と通信し、各種機能を実現する。以下、ユーザ端末20、30(のCPUなどのプロセッサ)がライブ配信アプリを実行することにより実現する機能をユーザ端末20、30の機能として説明する。それらの機能は実際はライブ配信アプリがユーザ端末20、30に実現させる機能である。なお、他の実施の形態では、これらの機能は、サーバ10からユーザ端末20、30のウェブブラウザにネットワークNWを介して送信され、そのウェブブラウザによって実行される、HTML(HyperText Markup Language)などのプログラミング言語により記述されたコンピュータプログラムにより実現されてもよい。
【0025】
ユーザ端末20は、ユーザの像および音声を記録した動画データを生成してサーバ10に提供する配信部100と、サーバ10から動画データを取得して再生する視聴部200と、アクティブユーザによる要求を処理する配信外処理部400と、を備える。ユーザは、配信を行う場合は配信部100を、視聴を行う場合は視聴部200を、視たいライブ配信を探したり配信者のプロフィールを視たりアーカイブを視たりする場合は配信外処理部400を、それぞれ起動する。配信部100がアクティブとなっているユーザ端末は配信者側、つまり動画データの生成側のユーザ端末であり、視聴部200がアクティブとなっているユーザ端末は視聴者側、つまり動画データの再生側のユーザ端末であり、配信外処理部400がアクティブとなっているユーザ端末はアクティブユーザのユーザ端末である。
【0026】
配信部100は、撮像制御部102と、音声制御部104と、動画送信部106と、配信側UI制御部108と、配信側通信部110と、を含む。撮像制御部102は
図2では不図示のカメラと接続され、カメラによる撮像を制御する。撮像制御部102はカメラから画像データを取得する。音声制御部104は
図2では不図示のマイクロフォンと接続され、マイクロフォンによる音声入力を制御する。音声制御部104は、マイクロフォンから音声データを取得する。動画送信部106は、撮像制御部102により取得された画像データおよび音声制御部104により取得された音声データを含む動画データを、ネットワークNWを介してサーバ10に送信する。動画送信部106による動画データの送信はリアルタイムで行われる。すなわち、撮像制御部102および音声制御部104による動画データの生成と、生成された動画データの動画送信部106による送信と、は実質的に同時に行われる。
【0027】
配信側UI制御部108は、配信者向けのUIを制御する。配信側UI制御部108は、
図2では不図示のディスプレイと接続され、動画送信部106による送信対象となっている動画データを再生することにより動画像をディスプレイに表示させる。配信側UI制御部108は、
図2では不図示のタッチパネルやキーボードやディスプレイなどの入力手段と接続され、それら入力手段を介して配信者による入力を取得する。配信側UI制御部108は、動画像に所定のフレーム画像を重畳させる。フレーム画像は、配信者から入力を受け付けるための様々なユーザインタフェースオブジェクト(以下、単にオブジェクトという)と、視聴者により入力されたコメントと、サーバ10から取得した情報と、を含む。配信側UI制御部108は例えば配信者によるオブジェクトに対するタップ入力を受け付ける。
【0028】
配信側通信部110は、ライブ配信中のサーバ10との間の通信を制御する。配信側通信部110は、配信側UI制御部108が取得した配信者による入力の内容を、サーバ10にネットワークNWを介して送信する。配信側通信部110は、ライブ配信に関連付けられた各種の情報をサーバ10からネットワークNWを介して受信する。
【0029】
視聴部200は、視聴側UI制御部202と、視聴側通信部204と、を含む。視聴側通信部204は、ライブ配信中のサーバ10との間の通信を制御する。視聴側通信部204は、ネットワークNWを介してサーバ10から、配信者と視聴者とが参加するライブ配信に係る動画データを受信する。
【0030】
視聴側UI制御部202は、視聴者向けのUIを制御する。視聴側UI制御部202は、
図2では不図示のディスプレイおよびスピーカと接続され、受信された動画データを再生することにより動画像をディスプレイに表示させると共に音声をスピーカから出力させる。ディスプレイに画像が出力されると共にスピーカから音声が出力されることを、合わせて「動画データが再生」されていると言うことができる。視聴側UI制御部202は、
図2では不図示のタッチパネルやキーボードやディスプレイなどの入力手段と接続され、それら入力手段を介して視聴者による入力を取得する。視聴側UI制御部202は、サーバ10から取得された動画データの画像に所定のフレーム画像を重畳させる。フレーム画像は、視聴者から入力を受け付けるための様々なオブジェクトと、視聴者により入力されたコメントと、サーバ10から取得した情報と、を含む。視聴側通信部204は、視聴側UI制御部202が取得した視聴者による入力の内容を、ネットワークNWを介してサーバ10に送信する。
【0031】
配信外処理部400は、配信外UI制御部402と、配信外通信部404と、を含む。配信外UI制御部402は、アクティブユーザ向けのUIを制御する。例えば、配信外UI制御部402は、現在参加可能なライブ配信のリストを表示してアクティブユーザによるライブ配信の選択を受け付けるライブ配信選択画面を生成し、ディスプレイに表示させる。配信外UI制御部402は、任意のユーザのプロフィール画面を生成し、ディスプレイに表示させる。配信外UI制御部402は、配信者を検索するための検索キーワードを受け付ける検索画面を生成し、ディスプレイに表示させる。配信外UI制御部402は、配信者の検索結果を含む検索結果表示画面を生成し、ディスプレイに表示させる。配信外UI制御部402は、過去のライブ配信を録音・録画することにより生成されたアーカイブを再生する。
【0032】
配信外通信部404は、ライブ配信外のサーバ10との間の通信を制御する。配信外通信部404は、ネットワークNWを介してサーバ10から、ライブ配信選択画面を生成するための情報や、配信者の検索結果や、プロフィール画面を生成するための情報や、アーカイブのデータを受信する。配信外通信部404は、アクティブユーザによる入力の内容を、ネットワークNWを介してサーバ10に送信する。
【0033】
図3は、
図1のサーバ10の機能および構成を示すブロック図である。サーバ10は、配信情報提供部302と、中継部304と、ギフト処理部308と、支払い処理部310と、ストリームDB314と、ユーザDB318と、ギフトDB320と、配信者検索部322と、紹介文生成部324と、性格設定DB326と、紹介文DB328と、を備える。
【0034】
図4は、
図3のストリームDB314の一例を示すデータ構造図である。ストリームDB314は現在行われているライブ配信の情報および過去に行われたライブ配信(アーカイブ)の情報を保持する。特にストリームDB314は、配信者により配信される動画の画像および音声を含む動画データを保持する。ストリームDB314は、ライブ配信システム1が提供するライブ配信プラットフォームにおいてライブ配信を特定するストリームIDと、当該ライブ配信の配信者を特定するユーザIDである配信者IDと、当該ライブ配信の視聴者を特定するユーザIDである視聴者IDと、当該ライブ配信の開始時刻と、当該ライブ配信の終了時刻(アーカイブの場合)と、当該ライブ配信の内容を表す配信内容タグと、当該ライブ配信の画像データと、当該ライブ配信の音声データと、当該ライブ配信で投稿されたコメントの履歴と、当該ライブ配信で使用されたギフトの履歴と、を対応付けて保持する。
【0035】
本実施の形態に係るライブ配信システム1が提供するライブ配信プラットフォームでは、ユーザがライブ配信を行う場合そのユーザは配信者となり、また同じユーザが他のユーザが配信するライブ配信を視聴する場合は視聴者となる。したがって、配信者・視聴者の別は固定的なものではなく、あるとき配信者IDとして登録されていたユーザIDが別のタイミングでは視聴者IDとして登録されることもある。
【0036】
ライブ配信の内容タグは、配信者がライブ配信を始める際に指定したタグであってもよいし、機械学習により生成されたモデルがライブ配信をリアルタイムで解析することで得られるタグであってもよい
【0037】
図5は、
図3のユーザDB318の一例を示すデータ構造図である。ユーザDB318は、ユーザに関する情報を保持する。特にユーザDB318は、ライブ配信プラットフォームで配信される動画の配信者の情報を保持する。ユーザDB318は、ユーザを特定するユーザIDと、当該ユーザが有しているポイントと、当該ユーザに付与された報酬と、当該ユーザのレベルと、当該ユーザの年齢の範囲と、当該ユーザの性別と、当該ユーザの髪の色と、当該ユーザがライブ配信アプリを使用している地域を示すリージョンと、当該ユーザに付されたユーザタグと、当該ユーザがライブ配信プラットフォームに登録した日付である登録日と、当該ユーザの総配信時間である配信時間累計と、当該ユーザがライブ配信プラットフォームに登録した自身のプロフィール画像と、当該ユーザがフォローしている他のユーザのユーザIDと、当該ユーザをフォローしている他のユーザのユーザIDと、当該ユーザが他の配信者のライブ配信やプロフィールを閲覧した履歴と、当該ユーザのコメントの履歴と、当該ユーザのログインの頻度と、当該ユーザの月間の消費ポイントと、当該ユーザの自己紹介と、を含む。
【0038】
ポイントは、ライブ配信プラットフォーム内で流通する電子的価値である。ユーザはクレジットカードや他の決済手段によりポイントを購入する。報酬はライブ配信プラットフォーム内で定義される電子的価値であり、配信者がライブ配信プラットフォームの管理者から受け取る金銭の額を決めるための指標である。ライブ配信プラットフォームでは、ライブ配信内やライブ配信外で視聴者が配信者にギフトを贈ると、視聴者のポイントが消費され、併せて配信者の報酬が相応分だけ増加する。
【0039】
レベルは、ライブ配信プラットフォームにおけるユーザの配信者としての実績を示す指標である。他の実施の形態では、レベルは、ライブ配信プラットフォームにおけるユーザの視聴者としての実績を示す指標であってもよいし、ユーザの配信者および視聴者の両方としての実績を示す指標であってもよい。レベルは、ライブ配信を行った回数、ライブ配信の配信時間、ギフトを贈った回数および/または量、ギフトをもらった回数および/または量、コメントの回数などに応じて増減してもよい。あるいはまた、レベルは、配信者に対するレビューやユーザ満足度や配信内のコメントを基に管理者により評価、決定されてもよい。あるいはまた、レベルは、所定のルールまたは機械学習モデルにより自動的に決定されてもよい。
【0040】
図6は、
図3のギフトDB320の一例を示すデータ構造図である。ギフトDB320は、ライブ配信において視聴者が使用可能なギフトに関する情報を保持する。ギフトは、以下の特徴を有する電子データである。
・ポイントや金銭を対価として購入可能、または無料で付与可能。
・視聴者が配信者に贈ることができるもの。配信者にギフトを贈ることを、ギフトを使用する、またはギフトを投げるともいう。
・ギフトの購入と使用とがセットで同時に発生するタイプのものもあれば、購入した後、視聴者が任意のタイミングで使用可能なタイプのものもある。
・視聴者が配信者にギフトを贈ると、その配信者に相応の報酬が付与される。
・ギフトが使用された場合、ギフトに関連付けられた効果が生じることがある。例えば、ギフトに対応するエフェクトがライブ配信ルーム画面に表れる。
【0041】
ギフトDB320は、ギフトを特定するギフトIDと、当該ギフトを配信者に贈った場合に当該配信者に付与される報酬である付与報酬と、当該ギフトを使用する際に支払うべき対価である対価ポイントと、を対応付けて保持する。視聴者は、ライブ配信の視聴中に、所望のギフトの対価ポイントを支払うことで配信者に当該ギフトを贈ることができる。この対価ポイントの支払いは適宜の電子的決済手段により行われてもよく、例えば対価ポイントを視聴者が管理者に支払うことで行われてもよい。あるいはまた、銀行振込やクレジットカードによる支払いが用いられてもよい。付与報酬と対価ポイントとの関係は管理者が任意に設定可能である。例えば、付与報酬=対価ポイントに設定してもよい。または付与報酬に1.2などの所定の係数を乗じて得られるポイントを対価ポイントに設定してもよいし、付与報酬に所定の手数料ポイントを加算して得られるポイントを対価ポイントに設定してもよい。
【0042】
図7は、
図3の性格設定DB326の一例を示すデータ構造図である。本実施の形態では紹介文を生成する機械学習モデルとしてopenAI社が提供するGPT-3、GPT-3.5、GPT-4等の生成系機械学習モデル(以下、単にモデルという場合がある)を用いる。モデルのプロンプトに制約条件や行動指針を入力することで、モデルに性格を設定することができる(例えば、非特許文献1参照)。性格設定DB326は、モデルに設定する性格を特定する性格IDと、当該性格に対応するプロンプトと、を対応付けて保持する。本実施の形態では5種類の性格に対応する5つのプロンプトを設けるが、これに限られず、性格の数や内容は任意に設定可能である。
【0043】
図8は、
図3の紹介文DB328の一例を示すデータ構造図である。紹介文DB328は、紹介対象の配信者の配信者IDと、モデルに設定された性格を特定する性格IDと、当該モデルにより出力されたキャッチコピーと、当該モデルにより出力された紹介文と、を対応付けて保持する。本実施の形態では5つの異なるプロンプトにより設定された5つのモデルがあるので、ひとつの配信者IDに対して5つの紹介文が対応付けられる。
【0044】
図3に戻り、紹介文生成部324は、ストリームDB314およびユーザDB318を参照することで、各配信者に対して複数の紹介文を生成し、生成された紹介文を紹介文DB328に登録する。紹介文生成部324は、それぞれに異なる性格が設定された複数のモデルを含む。紹介文生成部324は、変換部338と、第1紹介文章生成モデル340と、第2紹介文章生成モデル342と、第3紹介文章生成モデル344と、第4紹介文章生成モデル346と、第5紹介文章生成モデル348と、を含む。
【0045】
変換部338は、ストリームDB314に保持される動画データをテキストデータに変換する。画像データをその内容を表すテキストデータに変換するために、公知の画像解析技術を用いてもよい(例えば、非特許文献2参照)。音声データをテキストに変換するために、公知のSTT(Speech to Text)技術を用いてもよい。
【0046】
第1紹介文章生成モデル340は、
図7の性格設定DB326の性格ID「CH1」で特定される性格が設定されたモデルである。第1紹介文章生成モデル340は、デフォルトのモデルに、
図7の性格設定DB326の性格ID「CH1」に対応するプロンプトを入力することによって生成される。このモデルの生成は、ライブ配信プラットフォームの管理者によって手動で行われてもよいし、紹介文生成部324により性格設定DB326を参照することで自動で行われてもよい。
【0047】
第1紹介文章生成モデル340は、配信者のライブ配信の動画データを変換したテキストデータおよびユーザDB318に保持される当該配信者の情報を入力とし、当該配信者のキャッチコピーおよび紹介文を出力とする。
【0048】
第2紹介文章生成モデル342、第3紹介文章生成モデル344、第4紹介文章生成モデル346、第5紹介文章生成モデル348はそれぞれ、
図7の性格設定DB326の性格ID「CH2」、「CH3」、「CH4」、「CH5」で特定される性格が設定されたモデルである。第2紹介文章生成モデル342、第3紹介文章生成モデル344、第4紹介文章生成モデル346、第5紹介文章生成モデル348はいずれも、配信者のライブ配信の動画データを変換したテキストデータおよびユーザDB318に保持される当該配信者の情報を入力とし、当該配信者のキャッチコピーおよび紹介文を出力とする。
【0049】
配信者検索部322は、アクティブユーザのユーザ端末から配信者の検索要求を受けると、紹介文DB328を検索し、検索の結果を当該ユーザ端末に返す。配信者検索部322は、検索要求受付部330と、求人文章生成モデル332と、検索部334と、提供部336と、を含む。
【0050】
検索要求受付部330は、ライブ配信プラットフォームのアクティブユーザのユーザ端末からネットワークNWを介して、検索要求を受け付ける。検索要求は、要求元のアクティブユーザのユーザIDと、当該アクティブユーザが指定した性格の性格IDと、当該アクティブユーザが入力した検索対象のキーワード(以下、検索キーワードという)と、を含む。
【0051】
検索部334は、受け付けられた検索要求に基づき紹介文DB328に対して検索を実行する。
【0052】
提供部336は、検索部334により実行された検索の結果を、要求元のユーザ端末にネットワークNWを介して提供する。
【0053】
配信者検索部322では、以下の4つのモードでの配信者検索が可能となっている。
(1)キーワード検索、性格設定無し
(2)キーワード検索、性格設定有り
(3)文章マッチング検索、性格設定無し
(4)文章マッチング検索、性格設定有り
性格設定有りの場合、検索キーワードが同じでも性格が異なると検索結果も異なる場合がある。
【0054】
(1)キーワード検索、性格設定無しのモード
検索部334は、受け付けられた検索要求に含まれる検索キーワードをキーとして紹介文DB328に保持される紹介文を検索し、マッチングスコアの高い方から所定の数の配信者IDを検索結果として取得する。検索キーワードをキーとする文章検索の技術は公知であるから本明細書では詳述しない。
【0055】
検索部334は、検索要求に含まれる検索キーワードから推定により新たな検索キーワードを生成してもよい。一例として、検索要求に含まれる検索キーワードが「ギター初心者」および「XX」(アーティスト名)である場合、ワード推定により「ギター初心者」、「ギター弾き方入門」、「ギターの練習方法」、「ギターのコード」、「XXの曲のギターコード」、「オンラインギターレッスン」が生成され、検索キーワードに追加される。また、形容詞付き推定を用いる場合、「初心者向けギターレッスン」、「楽しくギターを学ぶ方法」、「ゆっくりと学ぶギターレッスン」、「信頼できる情報源ギターレッスン」、「XXのギターTAB譜」、「初心者におすすめのXX曲」が生成され、検索キーワードに追加される。
【0056】
提供部336は、検索部334によって取得された配信者IDのそれぞれについて、ストリームDB314を参照することで当該配信者IDで特定される配信者が現在行っているライブ配信の情報(以下、ライブ配信情報という)および当該配信者IDが行った過去のライブ配信のアーカイブの情報(以下、アーカイブ情報という)を取得する。提供部336は、検索部334によって取得された配信者IDと、当該配信者IDに対して取得されたライブ配信情報およびアーカイブ情報と、を含む検索結果リストを生成する。提供部336は、生成した検索結果リストを、ネットワークNWを介して要求元のユーザ端末に送信する。
【0057】
(2)キーワード検索、性格設定有りのモード
検索部334は、紹介文DB328に保持される紹介文のうち受け付けられた検索要求に含まれる性格IDに対応する紹介文を特定する。検索部334は、受信された検索要求に含まれる検索キーワードをキーとして、上記で特定された紹介文を検索し、マッチングスコアの高い方から所定の数の配信者IDを検索結果として取得する。以降の処理は(1)のモードのそれに準じる。
【0058】
(3)文章マッチング検索、性格設定無し
求人文章生成モデル332は、検索要求に含まれる検索キーワードおよび要求元のアクティブユーザの情報を入力とし、当該アクティブユーザの要望を表す文章(以下、探索文という)を出力とする。求人文章生成モデル332は、探索文として以下の2通りの文章を生成することができる。
(A)要求元のアクティブユーザが望んでいるであろう配信者のプロフィール
(B)要求元のアクティブユーザが配信者に求める人物像を記載した文章
【0059】
(A)について、求人文章生成モデル332は、ユーザDB318を参照し、検索要求に含まれるユーザIDに対応する情報を要求元のアクティブユーザの情報として取得する。求人文章生成モデル332は、検索要求に含まれる検索キーワードおよび要求元のアクティブユーザの情報から、当該アクティブユーザが望んでいるであろう配信者のプロフィールを生成する。プロフィールはユーザIDとプロフィール画像と自己紹介とを含む。以下にそのように生成されたプロフィールの一例を示す。
「ユーザID:HHH
プロフィール画像:「鮮やかなピンク色の背景に、ギターを持った女性のイラスト」
自己紹介:音楽大好きな女子高生です!流行に敏感で、常に新しい音楽にチャレンジしています!ギターを弾くのも大好きです!みんなで音楽の話しましょう。好きな音楽ジャンルはロック、ポップス、EDMです。趣味は音楽鑑賞、ギター弾き語り、コンサート参戦、SNSで音楽について語ることです。好きなアーティストはXX、YYです。」
【0060】
求人文章生成モデル332は、生成されたプロフィールに基づき、アクティブユーザが望んでいるであろう配信者が好きそうな人物の推測と簡易説明を生成し、プロフィールに追加してもよい。。以下にそのように生成された推測および簡易説明の一例を示す。
「XX:キャッチーなメロディーとストーリー性のある歌詞が特徴的なポップカントリーシンガーソングライターです。
YY:独自のスタイルとパーソナルな歌詞、ダークな雰囲気が特徴の若手シンガーソングライターです。
KK:ギターを使ったアコースティックな楽曲が人気のシンガーソングライターで、メロディーや歌詞が心に残ります。
LL:高い音域とパワフルなボーカルが印象的なポップシンガーで、エモーショナルな歌詞も魅力的です。
PP:ファンキーなビートとリズミカルなメロディーが特徴的なポップR&Bシンガーで、楽しいパフォーマンスも魅力です。」
【0061】
(B)について、求人文章生成モデル332は、検索要求に含まれる検索キーワードおよび要求元のアクティブユーザの情報から、要求元のアクティブユーザが配信者に求める人物像を記載した文章を生成する。以下にそのような文章の例を示す。
「ギターを弾くのが楽しいけど、なかなか上達できなくて悩んでいます。もっと上手になりたいけど、何をすればいいか分かりません。どうやったらもっと練習が効率的になるのか、もっと技術を磨くことができるのか知りたいです。とにかく、XXの曲を弾きたいんだけど、難しくて挫折しそうになっています。もっと分かりやすい方法や、コツがあったら教えてほしいです。」
「初心者でギターの練習方法が分からなくて困っています。XXの曲が弾きたいんですが、難しくて挫折しそうになっています。どうやったらもっと簡単に、でも上手に弾けるようになるのか知りたいです。特に、LLとYMを弾きたいと思っています。初心者向けの練習方法や、コード進行を覚えるコツなど、アドバイスがほしいです。また、オンラインでギターレッスンを受けられるサイトなど、おすすめがあれば教えてください。」
【0062】
検索部334は、求人文章生成モデル332により出力された探索文と紹介文DB328に保持される紹介文とを比較することにより検索を実行する。検索部334は、探索文と、紹介文DB328に保持される紹介文のそれぞれと、の類似度を算出する。文章と文章との類似度の算出は、例えば重要単語の数の一致や出現ワードの類似数やTF-IDF(term frequency - inverse document frequency)などを基に実現されてもよく、または例えば非特許文献3に記載されるような比較技術を用いて実現されてもよい。検索部334は算出された類似度が高い方から所定の数の配信者IDを検索結果として取得する。提供部336の処理は(1)のモードのそれに準じる。
【0063】
(4)文章マッチング検索、性格設定有り
求人文章生成モデル332に、受け付けられた検索要求に含まれる性格ID(
図7の性格設定DB326の性格ID「CH1」、「CH2」、「CH3」、「CH4」、「CH5」のうちのひとつ)で特定される性格が設定される。求人文章生成モデル332は、デフォルトのモデルに、検索要求に含まれる性格IDに対応するプロンプトを入力することによって生成される。配信者検索部322は、検索要求を受け付けると、性格設定DB326を参照して自動でそのような求人文章生成モデル332の生成を行う。以降の処理は(3)のモードのそれに準じる。
【0064】
あるいはまた、検索部334は、探索文と、紹介文DB328に保持される紹介文のうち検索要求に含まれる性格IDに対応する紹介文のそれぞれと、の類似度を算出してもよい。性格設定を探索文の生成に反映させるか、紹介文の絞り込みに適用するか、は適宜管理者により設定可能である。
【0065】
検索要求の要求元のユーザ端末の配信外UI制御部402は、受信した検索結果リストに基づいて検索結果画面を生成し、ユーザ端末のディスプレイに表示させる。配信外UI制御部402は、検索結果画面におけるアクティブユーザによるライブ配信の選択を受け付けると、選択されたライブ配信のストリームIDを含む配信要求を生成し、ネットワークNWを介してサーバ10に送信する。配信情報提供部302は、受信した配信要求に含まれるストリームIDにより特定されるライブ配信の、要求元のユーザ端末への提供を開始する。配信情報提供部302は、当該ストリームIDの視聴者IDに要求元のユーザ端末のアクティブユーザのユーザIDが含まれるようにストリームDB314を更新する。これにより、アクティブユーザは選択されたライブ配信の視聴者となる。
【0066】
中継部304は、配信情報提供部302によって開始されたライブ配信において、配信者のユーザ端末20から視聴者のユーザ端末30への動画データの伝送を中継する。中継部304は、ライブ配信中すなわち動画データの再生中における視聴者によるユーザ入力を示す信号を視聴側通信部204から受信する。ユーザ入力を示す信号は、ユーザ端末30のディスプレイに表示されたオブジェクトの指定を示すオブジェクト指定信号であってもよく、当該オブジェクト指定信号は、視聴者の視聴者IDと、視聴者が視聴しているライブ配信を行っている配信者の配信者IDと、オブジェクトを特定するオブジェクトIDと、を含む。オブジェクトがギフトアイコンである場合、オブジェクトIDはギフトIDとなる。その場合のオブジェクト指定信号は、視聴者による配信者に対するギフトの使用を示すギフト使用信号となる。同様に、中継部304は、動画データの再生中における配信者によるユーザ入力を示す信号、例えばオブジェクト指定信号をユーザ端末20の配信部100の配信側通信部110から受信する。
【0067】
ギフト処理部308は、ギフト使用信号に含まれるギフトIDで特定されるギフトの付与報酬に応じて配信者の報酬を増加させるようにユーザDB318を更新する。ギフト処理部308は、ギフトDB320を参照し、受信したギフト使用信号に含まれるギフトIDに対応する付与報酬を特定する。ギフト処理部308は、ギフト使用信号に含まれる配信者IDに対応する報酬に、特定された付与報酬を加えるようユーザDB318を更新する。
【0068】
支払い処理部310は、ギフト使用信号の受信に応じて、視聴者によるギフトの対価の支払いを処理する。支払い処理部310は、ギフトDB320を参照し、ギフト使用信号に含まれるギフトIDで特定されるギフトの対価ポイントを特定する。支払い処理部310は、ギフト使用信号に含まれる視聴者IDで特定される視聴者のポイントから特定された対価ポイントを差し引くようユーザDB318を更新する。
【0069】
以上の構成によるライブ配信システム1の動作を説明する。
図9は、サーバ10における配信者検索に係る一連の処理の流れを示すフローチャートである。サーバ10は、ストリームDB314に保持されている配信者のライブ配信の動画データをテキストデータに変換する(S202)。サーバ10は、紹介文章生成モデルごとに以下のステップS204、S206の処理を繰り返す。サーバ10は、テキストデータおよび配信者の情報を紹介文章生成モデルに入力する(S204)。サーバ10は、紹介文章生成モデルが出力するキャッチコピーおよび紹介文を紹介文DB328に登録する(S206)。
【0070】
サーバ10は、ネットワークNWを介してユーザ端末から検索要求を受け付ける(S208)。サーバ10は、検索要求に含まれる検索キーワードおよび検索要求者の情報を求人文章生成モデル332に入力する(S210)。サーバ10は、求人文章生成モデル332が出力する探索文と紹介文DB328に保持される紹介文とを比較することで、配信者の検索を実行する(S212)。サーバ10は、検索の結果得られた配信者の情報および当該配信者が行なっているライブ配信およびアーカイブの情報を、検索要求者のユーザ端末に送信する(S214)。
【0071】
図10は、アクティブユーザのユーザ端末のディスプレイに表示される検索受付画面600の代表画面図である。検索受付画面600は、アクティブユーザによるキーワードの入力を自由入力形式で受け付けるキーワード入力領域602と、アクティブユーザによる性格の指定をプルダウン形式で受け付ける性格指定領域604と、検索ボタン606と、を有する。
【0072】
アクティブユーザは、所望のキーワードをキーワード入力領域602に入力し、所望の性格を性格指定領域604で選択し、検索ボタン606を押す。ユーザ端末の配信外通信部404は、検索ボタン606の押下を検出すると、キーワード入力領域602に入力されたキーワードと、性格指定領域604で選択された性格の性格IDと、アクティブユーザのユーザIDと、を含む検索要求を生成し、ネットワークNWを介してサーバ10に送信する。
【0073】
図11は、アクティブユーザのユーザ端末のディスプレイに表示される検索結果画面610の代表画面図である。配信外通信部404は、
図10の検索受付画面600を介して送信された検索要求に対応する検索結果リストをサーバ10から受信する。配信外UI制御部402は、受信した検索結果リストに基づいて検索結果画面610を生成し、ディスプレイに表示させる。検索結果画面610は、検索結果リストに含まれる配信者ID612と、当該配信者IDで特定される配信者が現在行なっているライブ配信を表すサムネイル614と、当該配信者の過去のライブ配信のアーカイブを表すサムネイル616と、を含む。
【0074】
上述の実施の形態において、保持部の例は、ハードディスクや半導体メモリである。また、本明細書の記載に基づき、各部を、図示しないCPUや、インストールされたアプリケーションプログラムのモジュールや、システムプログラムのモジュールや、ハードディスクから読み出したデータの内容を一時的に記憶する半導体メモリなどにより実現できることは本明細書に触れた当業者には理解される。
【0075】
本実施の形態に係るライブ配信システム1によると、配信者ごとに紹介文が生成されて紹介文DB328に登録される。配信者を検索する際には紹介文DB328に保持される紹介文が使用される。動画データやプロフィールなど配信者に関する多種多様な情報をひとつにまとめた紹介文を検索するように構成したことで、検索の精度を高めることができ、および/または検索のスピードを向上することができる。
【0076】
また、本実施の形態に係るライブ配信システム1では、異なる性格を有する異なるモデルを用いて、同じ配信者に対して複数の紹介文を生成する。これにより、配信者の検索を行なうアクティブユーザの希望により沿った検索結果を提供することができる。さらに、アクティブユーザの側でも希望の性格を指定することにより、検索結果の精度がより向上する。
【0077】
図12を参照して、本実施の形態に係る情報処理装置のハードウェア構成について説明する。
図12は、本実施の形態に係る情報処理装置のハードウェア構成例を示すブロック図である。図示された情報処理装置900は、例えば、本実施の形態におけるサーバ10およびユーザ端末20、30のそれぞれを実現しうる。
【0078】
情報処理装置900は、CPU901、ROM(Read Only Memory)902、およびRAM(Random Access Memory)903を含む。また、情報処理装置900は、ホストバス907、ブリッジ909、外部バス911、インタフェース913、入力装置915、出力装置917、ストレージ装置919、ドライブ921、接続ポート925、通信装置929を含んでもよい。さらに、情報処理装置900は、カメラなどの撮像装置(不図示)を含む。また、情報処理装置900は、CPU901に代えて、またはこれとともに、DSP(Digital Signal Processor)またはASIC(Application Specific Integrated Circuit)と呼ばれるような処理回路を有してもよい。
【0079】
CPU901は、演算処理装置および制御装置として機能し、ROM902、RAM903、ストレージ装置919、またはリムーバブル記録媒体923に記録された各種プログラムに従って、情報処理装置900内の動作全般またはその一部を制御する。例えば、CPU901は、本実施の形態におけるサーバ10およびユーザ端末20、30のそれぞれに含まれる各機能部の動作全般を制御する。ROM902は、CPU901が使用するプログラムや演算パラメータなどを記憶する。RAM903は、CPU901の実行において使用するプログラムや、その実行において適宜変化するパラメータなどを一次記憶する。CPU901、ROM902、およびRAM903は、CPUバスなどの内部バスにより構成されるホストバス907により相互に接続されている。さらに、ホストバス907は、ブリッジ909を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス911に接続されている。
【0080】
入力装置915は、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチおよびレバーなど、ユーザによって操作される装置であってもよいし、マイクロフォンなどの音センサ、加速度センサ、傾きセンサ、赤外線センサ、深度センサ、温度センサ、湿度センサなど物理量を電気信号に変換する装置であってもよい。入力装置915は、例えば、赤外線やその他の電波を利用したリモートコントロール装置であってもよいし、情報処理装置900の操作に対応した携帯電話などの外部接続機器927であってもよい。入力装置915は、ユーザが入力した情報または感知した物理量に基づいて入力信号を生成してCPU901に出力する入力制御回路を含む。ユーザは、この入力装置915を操作することによって、情報処理装置900に対して各種のデータを入力したり処理動作を指示したりする。
【0081】
出力装置917は、取得した情報をユーザに対して視覚的または聴覚的に通知することが可能な装置で構成される。出力装置917は、例えば、LCD、PDP、OELDなどのディスプレイ、スピーカおよびヘッドホンなどの音響出力装置、ならびにプリンタ装置などでありうる。出力装置917は、情報処理装置900の処理により得られた結果を、テキストまたは画像などの映像として出力したり、音響などの音として出力したりする。
【0082】
ストレージ装置919は、情報処理装置900の記憶部の一例として構成されたデータ格納用の装置である。ストレージ装置919は、例えば、HDD(Hard Disk Drive)などの磁気記憶部デバイス、半導体記憶デバイス、光記憶デバイス、または光磁気記憶デバイスなどにより構成される。このストレージ装置919は、CPU901が実行するプログラムや各種データ、および外部から取得した各種のデータなどを格納する。
【0083】
ドライブ921は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブル記録媒体923のためのリーダライタであり、情報処理装置900に内蔵、あるいは外付けされる。ドライブ921は、装着されているリムーバブル記録媒体923に記録されている情報を読み出して、RAM903に出力する。また、ドライブ921は、装着されているリムーバブル記録媒体923に記録を書き込む。
【0084】
接続ポート925は、機器を情報処理装置900に直接接続するためのポートである。接続ポート925は、例えば、USB(Universal Serial Bus)ポート、IEEE1394ポート、SCSI(Small Computer System Interface)ポートなどでありうる。また、接続ポート925は、RS-232Cポート、光オーディオ端子、HDMI(登録商標)(High-Definition Multimedia Interface)ポートなどであってもよい。接続ポート925に外部接続機器927を接続することで、情報処理装置900と外部接続機器927との間で各種のデータが交換されうる。
【0085】
通信装置929は、例えば、ネットワークNWに接続するための通信デバイスなどで構成された通信インタフェースである。通信装置929は、例えば、有線または無線LAN(Local Area Network)、Bluetooth(登録商標)、またはWUSB(Wireless USB)用の通信カードなどでありうる。また、通信装置929は、光通信用のルータ、ADSL(Asymmetric Digital Subscriber Line)用のルータ、または、各種通信用のモデムなどであってもよい。通信装置929は、例えば、インターネットや他の通信機器との間で、TCP/IPなどの所定のプロトコルを用いて信号などを送受信する。また、通信装置929に接続される通信ネットワークNWは、有線または無線によって接続されたネットワークであり、例えば、インターネット、家庭内LAN、赤外線通信、ラジオ波通信または衛星通信などである。なお、通信装置929は、通信部としての機能を実現する。
【0086】
カメラなどの撮像装置(不図示)は、例えばCCD(Charge Coupled Device)またはCMOS(Complementary Metal Oxide Semiconductor)などの撮像素子、および撮像素子への被写体像の結像を制御するためのレンズなどの各種の部材を用いて実空間を撮像し、撮像画像を生成する装置である。当該撮像装置は、静止画を撮像するものであってもよいし、または動画を撮像するものであってもよい。
【0087】
以上、実施の形態に係るライブ配信システム1の構成と動作について説明した。この実施の形態は例示であり、各構成要素や各処理の組み合わせにいろいろな変形例が可能なこと、またそうした変形例も本開示の範囲にあることは当業者に理解される。
【0088】
実施の形態ではライブ配信プラットフォームを例として説明したが、これに限られず、VOD(Video On Demand)などの他の動画配信プラットフォームにも本実施の形態に係る技術的思想を適用可能である。
【0089】
実施の形態では、求人文章生成モデル332に、紹介文章生成モデルに設定した性格のうちのひとつを設定する場合を説明したが、これに限られず、例えば求人文章生成モデルは紹介文章生成モデルの性格に含まれていない性格を有してもよいし、性格を有しなくてもよい。
【0090】
実施の形態において、紹介文章生成モデルは紹介文に対する補足情報を生成してもよい。補足情報の例は以下のとおりである。
「関連楽曲のリストと紹介文
XX(アーティスト名)
「ABCDE」は、カントリーポップの曲で、キャッチーなメロディに加えて、音楽理論に基づいた構成を持っています。サビの部分において、G、D、Em、Cという和音進行が採用されており、それによって聴き手に安定感と高揚感を与えています。
「HHKKLL」は、ポップな曲調に加えて、ファンクやR&Bの要素も取り入れた楽曲です。曲の構成においては、I-V-vi-IVという和音進行が多用されており、聴き手に強い印象を与える構成になっています。
「PPQQQ」は、ポップな曲調に加えて、シンセサイザーの音色やビートボックスなど、現代的な要素も取り入れた楽曲です。曲の構成においては、I-V-vi-IVという和音進行が多用されており、聴き手に心地よい印象を与える構成になっています。
以上の曲は、XXが音楽理論を活かして作り上げた楽曲の一部です。彼女の楽曲は、聴き手に心地よさと印象深さを与えるだけでなく、音楽理論的にも興味深い要素が詰まっています。」
「「CCDDE」この曲は、ギターのリフやソロにおいて、多彩なコード進行や音楽理論が取り入れられていることで有名です。
「FFG」この曲は、複雑な和声や音階を使ったギターソロが特徴的で、音楽理論の応用例としてもよく使われます。
「HKLL」この曲は、メロディアスなイントロやギターソロが特徴的で、ハーモニー理論やメロディー構成についての解説に使われることがあります。」
「初心者リスト:
「TT」
…
その他のリスト:
「ZA」」
【0091】
実施の形態において、ユーザの情報としてSNSなど外部のプラットフォームで公開されている情報が用いられてもよい。
【0092】
実施の形態では、検索キーワードを指定して検索要求を生成する場合を説明したが、これに限られず、例えばユーザに配信者をリコメンドする場合にも本実施の形態に係る技術的思想を適用することができる。
【0093】
実施の形態におけるギフトの対価ポイントから付与報酬への換算率は一例であって、これらは例えばライブ配信システムの管理者により適宜設定されてもよい。
【0094】
実施の形態に係る技術的思想を、配信者の画像の代わりに配信者の動きと同期した動きをするアバターを用いるバーチャルライブ配信や、ライブコマースに適用してもよい。
【0095】
本明細書において説明された処理手順、特にフロー図、フローチャートを用いて説明された処理手順においては、その処理手順を構成する工程(ステップ)の一部を省略すること、その処理手順を構成する工程として明示されていない工程を追加すること、及び/又は当該工程の順序を入れ替えることが可能であり、このような省略、追加、順序の変更がなされた処理手順も本開示の趣旨を逸脱しない限り本開示の範囲に含まれる。
【0096】
サーバ10により実現される機能の少なくとも一部は、サーバ10以外の装置、例えばユーザ端末20、30により実現されてもよい。ユーザ端末20、30により実現される機能の少なくとも一部は、ユーザ端末20、30以外の装置、例えば、サーバ10により実現されてもよい。例えば、視聴者のユーザ端末で行われる動画データの画像への所定のフレーム画像の重畳は、サーバ10で行われてもよいし、配信者のユーザ端末で行われてもよい。
【要約】
【課題】動画の配信者の検索を改善する。
【解決手段】サーバは、動画配信プラットフォームで配信される動画の配信者の情報を保持する配信者情報保持部と、配信者により配信される動画の画像および音声を含む動画データを保持する動画データ保持部と、動画データ保持部に保持される動画データをテキストデータに変換する変換部と、それぞれがテキストデータおよび配信者情報保持部に保持される配信者の前記情報を入力とし、配信者を紹介する文章を出力とする複数の機械学習モデルであって、それぞれに異なる性格が設定された複数の機械学習モデルと、配信者を特定するIDと、複数の機械学習モデルにより出力された配信者を紹介する複数の文章と、を対応付けて保持する文章保持部と、動画配信プラットフォームのユーザのユーザ端末からネットワークを介して、検索要求を受け付ける要求受付部と、検索要求に基づき文章保持部に対して検索を実行する検索部と、検索部により実行された検索の結果を、ユーザ端末にネットワークを介して提供する提供部と、を備える。
【選択図】
図1