IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 井澤 佑斗の特許一覧

<>
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2025-03-04
(45)【発行日】2025-03-12
(54)【発明の名称】通信方法及び通信システム
(51)【国際特許分類】
   H04N 21/2543 20110101AFI20250305BHJP
   H04N 21/258 20110101ALI20250305BHJP
   H04N 21/6543 20110101ALI20250305BHJP
   G06Q 50/10 20120101ALI20250305BHJP
【FI】
H04N21/2543
H04N21/258
H04N21/6543
G06Q50/10
【請求項の数】 4
(21)【出願番号】P 2024177226
(22)【出願日】2024-10-09
【審査請求日】2024-10-27
【早期審査対象出願】
(73)【特許権者】
【識別番号】515120143
【氏名又は名称】井澤 佑斗
(72)【発明者】
【氏名】篠原 聡志
(72)【発明者】
【氏名】井澤 佑斗
【審査官】渡部 博樹
(56)【参考文献】
【文献】特許第7398171(JP,B1)
【文献】特開2021-077962(JP,A)
【文献】特開2023-8701(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 21/2543
H04N 21/258
H04N 21/6543
G06Q 50/10
(57)【特許請求の範囲】
【請求項1】
通信方法であって、
インターネットを通じて動画をライブ送信する送信端末と、
前記動画をライブ受信して再生する受信端末とを有し、
装置は、ライブ受信を行なっている受信端末を特定し、
ライブ送信者が、送信端末を介して、送信される動画の送信者が定める所定の時間のポイントを再生したという条件に合致する受信端末を特定し、
装置が、ライブ送信者によって特定された受信端末が指定する受金手段にライブ送信中に送金する、
通信方法。
【請求項2】
通信方法であって、
インターネットを通じて動画をライブ送信する送信端末と、
前記動画をライブ受信して再生する受信端末とを有し、
ライブ送信者が、送信端末を介して、送信される動画の送信者が定める所定の時間のポイントを再生したという条件に合致する受信端末を特定し、
装置が、ライブ送信者によって特定された受信端末が指定する受金手段に、ライブ送信が終了した後(送金処理のために必要な日時を経過することを含む)に送金する、
通信方法。
【請求項3】
通信システムであって、
インターネットを通じて動画をライブ送信する送信端末と、
前記動画をライブ受信して再生する受信端末とを有し、
装置は、ライブ受信を行なっている受信端末を特定し、
ライブ送信者が、送信端末を介して、送信される動画の送信者が定める所定の時間のポイントを再生したという条件に合致する受信端末を特定し、
装置が、ライブ送信者によって特定された受信端末が指定する受金手段にライブ送信中に送金する、
通信システム。
【請求項4】
通信システムであって、
インターネットを通じて動画をライブ送信する送信端末と、
前記動画をライブ受信して再生する受信端末とを有し、
ライブ送信者が、送信端末を介して、送信される動画の送信者が定める所定の時間のポイントを再生したという条件に合致する受信端末を特定し、
装置が、ライブ送信者によって特定された受信端末が指定する受金手段に、ライブ送信が終了した後(送金処理のために必要な日時を経過することを含む)に送金する、
通信システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、通信方法及び通信装置に関する。
【背景技術】
【0002】
この項における供述は、本開示に関する背景の情報を提供するだけであり、先行技術を必ずしも構成しない。
【0003】
特許文献1には、配信者端末装置から送信されるコンテンツを受信し、クライアント端末装置に対して前記コンテンツのストリーム配信を行う配信サーバの使用予約を予約管理装置に対して行い、当該予約に基づいて前記配信者端末装置から前記コンテンツを前記配信サーバに送信してコンテンツ配信を行う方法が公開されている。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2002-073541号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし発明者は少なくとも上記実施形態には、インターネットを通じた情報の送受信において、送信端末が指定した受信端末が指定する受金手段に送金をする手段が無いという短所が存在すると認識した。
【課題を解決するための手段】
【0006】
少なくとも一つの本開示は、
通信方法であって、
インターネットを通じて動画を送信する送信端末と、
前記動画を受信して再生する受信端末とを有し、
送信端末は、送信端末が指定した受信端末が指定する受金手段に送金をすることを装置に指示する、
通信方法
を提供する。
【発明の効果】
【0007】
本構成では少なくとも、動画を再生する動機づけが発生することで、送信する者の情報発信の影響力を増強できるという有用性がある。
【0008】
本開示のこれらおよび他の態様、特徴、および利点は、以下の図面と併せて取られる好ましい実施形態および態様の以下の詳細な書面の説明から明らかになるが、その変形および修正は、本開示の新規概念の精神および範囲から逸脱せずに実施され得る。本開示におけるある実施形態における態様は、矛盾しない限りにおいて、本開示される別の実施形態における態様の1以上と組み合わせ、又は置き換えることができる。
【発明を実施するための形態】
【0009】
以下の開示において、提示された主題の異なる特徴を実施するための多くの異なる実施形態や実施例を提供する。本開示を平易にするために、構成部品や配置の具体例を以下に開示する。もちろんこれらは単なる例であり、限定的であることを意図するものではない。例えば、第1の特徴が、続いて開示する第2の特徴に覆われる、あるいはこれと接する構造は、第1の特徴および第2の特徴が直接接触するように形成されている実施形態とともに、 第1の特徴と第2の特徴との間に付加的な特徴を形成して、第1の特徴と第2の特徴とが直接接触しないようになっている実施形態を含んで良い。さらに、本開示では、さまざまな例において参照番号および/または文字を反復している場合がある。このように反復するのは、簡潔明瞭にするためであり、それ自体が、さまざまな実施形態および/または説明されている構成との間に関係があることを必要とするものではない。さらに、第1の要素が第2の要素に「連結されている」または「結合されている」と記述するとき、そのような記述は、第1の要素と第2の要素とが互いに直接的に連結または結合されている実施形態を含むとともに、第1の要素と第2の要素とが、その間に介在する1以上の他の要素を有して互いに間接的に連結または結合されている実施形態も含む。
【0010】
本明細書中で使用されるように、「少なくとも1の(at least one of)」という記載は、例示するすべての変形例を包合する。例えば、「AとBとCの少なくとも1の(comprises at least one of !, B, or C)」の記載は、「AとBとCと、これらのコンビネーション(consisting of A, B, C and combinations thereof)」と同義である。そして、A、B、C、A+B、A+C、B+C、A+B+Cの考えうる限りの全ての変形例を抱合する。
【0011】
本開示において、機械、電子オペレータまたはコンピュータを使用する開示は、方法、記録媒体、装置、またはプログラムの実施形態を含むことができる。本明細書で使用される「AはBである」という記述は、矛盾がない限り、あるいは本明細書に別段の記載がない限り、「AはBを含む」と置き換えることができる。
【0012】
本開示における用語は、特許請求の範囲に記載された用語を含めて、明細書に記載された記載や図面を考慮して解釈でき、さらには、本開示における示唆と矛盾がない限り、過去もしくは現在、未来において、市民の一人以上がそのように呼称し、表示し、理解しもしくは実行した、またはその可能性のある事柄をもとに解釈できる。
【0013】
本明細書中で使用されるように、用語「コンピューター」は、当技術分野で知られているように、プロセッサー、メモリー、例えばハードドライブ、ディスクドライブ又はフラッシュドライブ又はメモリースティック、又は他の非一時的なコンピューター可読媒体又は非一時的記憶装置などの、少なくとも1つの情報記憶/検索装置、例えば、キーボード、マウス、ポイント及びタッチのデバイス、タッチスクリーン、又はマイクなどの、少なくとも一つの入力装置、及び、よく知られたコンピュータースクリーンのようなディスプレイ構造を概略的に含む。加えて、コンピューターは、有線又は無線接続などの、1以上のネットワーク接続を含み得る。当技術分野で知られるように、そのようなコンピューターまたはコンピューターシステムは、上に列挙されるものを多かれ少なかれ含んでもよく、例えばタブレットコンピューターやスマートデバイスに限定されないが、他の電子メディアや電子デバイスを包含する。
【0014】
本明細書で使用されるように、用語「クラウド」または「クラウドコンピューティング」は、すべてのコンピューティングリソースが共有される集中型の(centralized)および仮想型(virtualized)のコンピューティング設備を指す。 アプリケーションシステムやサブシステムについて、それらはすべて「クラウド」内にあるため、特定のマシンを指すことはもはやできない。
【0015】
本明細書中で使用されるように、用語「分散型インターネットサービスシステム」は、様々なコンピューティング環境で実行するために、インターネットアプリケーションを変換する分散型インターネットサービスプラットフォームを指す。DISシステムは、コンポーネント分散型サーバー(Component Distribution Server)/資産分散サーバー(Asset Distribution Server)を経由して、コンテンツ、データ及びロジックを含むインターネットアプリケーションを、適切な範囲に(to whatever extent appropriate)、およびネットワークに沿って、任意の数と任意の種類の機器に対して配信する。DISを介して、インターネットアプリケーションを、各ユーザーのニーズに基づいたサービスで、ホストしおよび一元管理し、その完全性を維持しながらユーザーのデバイスまたは近くの場所で局所的にキャッシュし実行することができる。Web対応のコンピューティングデバイスは、DISソフトウェアーでアップグレードして、分散型のインターネットサービスを楽しみ実行するようなDIS対応になることができる。分散型インターネットサービスシステムは、米国特許第7136857号、第7150015号、第7181731号、第7209921号、第7430610号、第7685183号、第7685577号、第7752214号、第8326883号、第8386525号、第8443035号、第8458142号、第8458222号、第8473468号、第8527545号、および第8650226号、および米国特許公開第20120005205号、および第20130091252号の特許ファミリーの何れか一つに完全に記載されており、これらすべては本発明と同様に、オーピー40,ホールディングス,インク.によって共有して所有されており、これらすべてが引用により組み入れられる。(以上、引用おわり)
【0016】
少なくとも1以上の実施形態で用いる作動方法について、分散型インターネットを使用しない従来のインターネットの方式について、以下の実施形態を取ることができる。少なくとも1以上の実施形態をよく説明するJP7113047の記載を引用して説明する(以下、引用開始)。
【0017】
本明細書で具体的に開示される事項を含む実施形態は、人工知能を基盤として実際に人間と会話するような形態で実現された自動応答システムを提供することができ、これによってユーザとのより自然な通話を実現しながら、問い合わせ、予約、配達注文などを迅速かつ便利に処理することができる。
【0018】
複数の電子機器110、120、130、140は、コンピュータシステムによって実現される固定端末や移動端末であってよい。複数の電子機器110、120、130、140の例としては、AIスピーカ、スマートフォン、携帯電話、ナビゲーション、PC(personal computer)、ノート型PC、デジタル放送用端末、PDA(Personal Digital Assistant)、PMP(Portable Multimedia Player)、タブレット、ゲームコンソール、ウェアラブルデバイス、IoT(internet of things)デバイス、VR(virtual reality)デバイス、AR(augmented reality)デバイスなどがある。一例として、図1では、電子機器110としてAIスピーカを示しているが、本発明の実施形態において、電子機器110は、実質的に無線または有線通信方式を利用し、ネットワーク170を介して他の電子機器120、130、140および/またはサーバ150、160と通信することのできる多様な物理的なコンピュータシステムのうちの1つを意味してよい。
【0019】
通信方式が限定されることはなく、ネットワーク170が含むことのできる通信網(一例として、移動通信網、有線インターネット、無線インターネット、放送網、衛星網など)を利用する通信方式だけではなく、機器間の近距離無線通信が含まれてもよい。例えば、ネットワーク170は、PAN(personal area network)、LAN(local area network)、CAN(campus area network)、MAN(metropolitan area network)、WAN(wide area network)、BBN(broadband network)、インターネットなどのネットワークのうちの1つ以上の任意のネットワークを含んでよい。さらに、ネットワーク170は、バスネットワーク、スターネットワーク、リングネットワーク、メッシュネットワーク、スターバスネットワーク、ツリーまたは階層的ネットワークなどを含むネットワークトポロジのうちの任意の1つ以上を含んでもよいが、これらに限定されることはない。
【0020】
サーバ150、160は、それぞれ、複数の電子機器110、120、130、140とネットワーク170を介して通信して、命令、コード、ファイル、コンテンツ、サービスなどを提供する、1つ以上のコンピュータ装置によって実現されてよい。例えば、サーバ150は、ネットワーク170を介して接続した複数の電子機器110、120、130、140に第1サービスを提供するシステムであってよく、サーバ160も、ネットワーク170を介して接続した複数の電子機器110、120、130、140に第2サービスを提供するシステムであってよい。より具体的な例として、サーバ150は、複数の電子機器110、120、130、140においてインストールされて実行されるコンピュータプログラムであるアプリケーションを通じ、該当のアプリケーションが目的とするサービス(一例として、自動応答サービスなど)を第1サービスとして複数の電子機器110、120、130、140に提供してよい。他の例として、サーバ160は、上述したアプリケーションのインストールおよび実行のためのファイルを複数の電子機器110、120、130、140に配布するサービスを第2サービスとして提供してよい。
【0021】
図2は、本発明の一実施形態における、電子機器およびサーバの内部構成を説明するためのブロック図である。図2では、電子機器に対する例として電子機器110の内部構成およびサーバ150の内部構成について説明する。また、他の電子機器120、130、140やサーバ160も、上述した電子機器110またはサーバ150と同一または類似の内部構成を有してよい。
【0022】
電子機器110およびサーバ150は、メモリ211、221、プロセッサ212、222、通信モジュール213、223、および入力/出力インタフェース214、224を含んでよい。メモリ211、221は、非一時的なコンピュータ読み取り可能な記録媒体であってよく、RAM(random access memory)、ROM(read only memory)、ディスクドライブ、SSD(solid state drive)、フラッシュメモリ(flash memory)などのような非一時的な大容量記録装置を含んでよい。ここで、ROM、SSD、フラッシュメモリ、ディスクドライブのような非一時的な大容量記録装置は、メモリ211、221とは区分される別の非一時的な記録装置として電子機器110やサーバ150に含まれてもよい。また、メモリ211、221には、オペレーティングシステムと、少なくとも1つのプログラムコード(一例として、電子機器110においてインストールされて実行されるブラウザや、特定のサービスの提供のために電子機器110にインストールされたアプリケーションなどのためのコード)が記録されてよい。このようなソフトウェア構成要素は、メモリ211、221とは別のコンピュータ読み取り可能な記録媒体からロードされてよい。このような別のコンピュータ読み取り可能な記録媒体は、フロッピー(登録商標)ドライブ、ディスク、テープ、DVD/CD―ROMドライブ、メモリカードなどのコンピュータ読み取り可能な記録媒体を含んでよい。他の実施形態において、ソフトウェア構成要素は、コンピュータ読み取り可能な記録媒体ではない通信モジュール213、223を通じてメモリ211、221にロードされてもよい。例えば、少なくとも1つのプログラムは、開発者またはアプリケーションのインストールファイルを配布するファイル配布システム(一例として、上述したサーバ160)がネットワーク170を介して提供するファイルによってインストールされるコンピュータプログラム(一例として、上述したアプリケーション)に基づいてメモリ211、221にロードされてよい。
【0023】
プロセッサ212、222は、基本的な算術、ロジック、および入出力演算を実行することにより、コンピュータプログラムの命令を処理するように構成されてよい。命令は、メモリ211、221または通信モジュール213、223によって、プロセッサ212、222に提供されてよい。例えば、プロセッサ212、222は、メモリ211、221のような記録装置に記録されたプログラムコードにしたがって受信される命令を実行するように構成されてよい。
【0024】
通信モジュール213、223は、ネットワーク170を介して電子機器110とサーバ150とが互いに通信するための機能を提供してもよいし、電子機器110および/またはサーバ150が他の電子機器(一例として、電子機器120)または他のサーバ(一例として、サーバ160)と通信するための機能を提供してもよい。一例として、電子機器110のプロセッサ212がメモリ211のような記録装置に記録されたプログラムコードにしたがって生成した要求が、通信モジュール213の制御にしたがってネットワーク170を介してサーバ150に伝達されてよい。これとは逆に、サーバ150のプロセッサ222の制御にしたがって提供される制御信号や命令、コンテンツ、ファイルなどが、通信モジュール223とネットワーク170を経て電子機器110の通信モジュール213を通じて電子機器110に受信されてよい。例えば、通信モジュール213を通じて受信されたサーバ150の制御信号や命令、コンテンツ、ファイルなどは、プロセッサ212やメモリ211に伝達されてよく、コンテンツやファイルなどは、電子機器110がさらに含むことのできる記録媒体(上述した非一時的な記録装置)に記録されてよい。
【0025】
入力/出力インタフェース214は、入力/出力装置215とのインタフェースのための手段であってよい。例えば、入力装置は、キーボード、マウス、マイクロフォン、カメラなどの装置を、出力装置は、ディスプレイ、スピーカ、触覚フィードバックデバイスなどのような装置を含んでよい。他の例として、入力/出力インタフェース214は、タッチスクリーンのように入力と出力のための機能が1つに統合された装置とのインタフェースのための手段であってもよい。入力/出力装置215は、電子機器110と1つの装置で構成されてもよい。また、サーバ150の入力/出力インタフェース224は、サーバ150に接続するかサーバ150が含むことのできる入力または出力のための装置(図示せず)とのインタフェースのための手段であってよい。より具体的な例として、電子機器110のプロセッサ212がメモリ211にロードされたコンピュータプログラムの命令を処理するにあたり、サーバ150や電子機器120が提供するデータを利用して構成されるサービス画面やコンテンツが、入力/出力インタフェース214を通じてディスプレイに表示されてよい。
【0026】
また、他の実施形態において、電子機器110およびサーバ150は、図2の構成要素よりも多くの構成要素を含んでもよい。しかし、大部分の従来技術的構成要素を明確に図に示す必要はない。例えば、電子機器110は、上述した入力/出力装置215のうちの少なくとも一部を含むように実現されてもよいし、トランシーバ、カメラ、各種センサ、データベースなどのような他の構成要素をさらに含んでもよい。より具体的な例として、電子機器110がAIスピーカである場合、一般的にAIスピーカが含んでいる各種センサ、カメラモジュール、物理的な各種ボタン、タッチパネルを利用したボタン、入力/出力ポート、振動のための振動器などのような多様な構成要素が、電子機器110にさらに含まれるように実現されてよい。(以上、引用おわり)
【0027】
機械について説明する。少なくとも1つの実施形態によれば、ユーザー端末は、制御部、RAM、ストレージ部、グラフィックス処理部、通信インタフェース、インタフェース部からなり、それぞれ内部バスにより接続されている。
【0028】
少なくとも1つの実施形態によれば、制御部は、CPUやROMから構成される。制御部は、ストレージ部に格納されたプログラムを実行し、ユーザ端末の制御を行なう。RAMは、制御部のワークエリアである。ストレージ部は、プログラムやデータを保存するための記憶領域である。制御部は、プログラム及びデータをRAMから読み出して処理を行なう。制御部は、RAMにロードされたプログラム及びデータを処理することで、描画命令をグラフィックス処理部に出力する。
【0029】
少なくとも1つの実施形態によれば、グラフィックス処理部は表示部に接続されている。表示部は表示画面を有している。制御部が描画命令をグラフィックス処理部に出力すると、グラフィックス処理部は、表示画面上に画像を表示するためのビデオ信号を出力する。ここで、表示部はタッチセンサを備えるタッチパネルであってもよい。この表示部のタッチパネルが入力部として機能する。
【0030】
少なくとも1つの実施形態によれば、通信インタフェースは無線又は有線により通信ネットワークに接続が可能であり、通信ネットワークを介して、サーバ装置とデータを送受信することが可能である。通信インタフェースを介して受信したデータは、RAMにロードされ、制御部により演算処理が行われる。インタフェース部には外部メモリ(例えば、SDカード等)が接続されている。
【0031】
少なくとも1つの実施形態によれば、ユーザー端末は、表示画面と入力部を有するコンピュータ装置であれば特に限定されない。ユーザー端末としては、例えば、従来型の携帯電話、タブレット型端末、スマートフォン、デスクトップ型・ノート型のパーソナルコンピュータなどが挙げられる。VRゴーグル、すなわち頭にストラップで固定または取り付けられたフレーム(またはヘッドセット)に取り付けられた画面(または2つのディスプレイパネル、各目に対し1つずつ)で構成されてもよい。ユーザー端末は、音声の出力部を有する。
【0032】
少なくとも1つの実施形態によれば、ユーザー端末は、通信ネットワークを介してサーバ装置と通信接続が可能である。通信ネットワークを介して通信接続をして、情報を送信し、若しくは情報を受信することができる。
【0033】
少なくとも1つの実施形態によれば、サーバ装置は、制御部、RAM、ストレージ部及び通信インタフェースを少なくとも備え、それぞれ内部バスにより接続されている。
【0034】
少なくとも1つの実施形態によれば、制御部は、CPUやROMから構成され、ストレージ部に格納されたプログラムを実行し、サーバ装置の制御を行う。また、制御部は時間を計時する内部タイマを備えている。RAMは、制御部のワークエリアである。ストレージ部は、プログラムやデータを保存するための記憶領域である。制御部は、プログラム及びデータをRAMから読み出し、ユーザー端末から受信した情報等をもとに、プログラム実行処理を行う。
【0035】
AIについて説明する。少なくとも1つの実施形態によれば、人工知能は、機械学習、深層学習、生成AI、大規模言語モデル、LLM、基盤モデル、生成AIを含む。生成AIはトランスフォーマーを使い、アテンションという機構を多数用いる。自己教師あり学習、Extract Predictionを用いる。この場合、AIは次の単語を当てることができる。文を与えられると、途中までの文章から次の単語を当てる。教師あり学習の問題を大量に作り出す。これらにより、次の単語を当てられるAIができる。生成AIは文法構造、トピックのつながり、こういう文体の人はこういう文を書きそうという予測をすることができる。さらに、生成AIは、次の文を当てるということだけで、その背後にある構造、因果関係、知識を学習できる。生成AIはスケール速があり、パラメーターの数が大きいほど精度が上がる。普通の統計、機械学習は、データのサンプルサイズに比べてモデルのパラメーターを大きくしすぎるとオーバーフィットする。LLMは、パラメーターの数を大きくすればするほど精度が上がる。ある生成AIは1750億パラメータを持っている、生成AIは、対話をスムーズにやるように教師あり学習を被せる。変なことを言わないように教師づけられている。感想文を書いたり、コールセンターのオペレーターを演じる。
【0036】
少なくとも1つの実施形態によれば、大規模言語モデル(Large Language Models/LLM)とは、非包括的に、大量のデータセットとディープラーニング技術を用いて構築された、機械学習の自然言語処理モデルのことである。一般的には、特定のタスクでトレーニングする「ファインチューニング」と呼ばれる手法を用いて、テキスト分類・生成や感情分析、文章要約、質問応答といったさまざまな自然言語処理(NLP)タスクに適応させる。少なくとも1つの実施形態によれば、自己教師あり学習は、人の本質的な知能に近い。人は、行動をする時に常に次に起こる事象を予測しており、次の入力を予測している。その過程で外界の構造を学んでいける。次の単語を予測するのは、本質的な知能であり、大脳皮質でやることに近いと考える。少なくとも1つの実施形態によれば、大規模言語モデルは、入力される情報をまる覚えするが、次の単語を予測するのに必要な程度で汎化する。最初から全ての情報を汎化しにいかない。大規模言語モデルは、情報を覚えておくために容量が必要である。また、そのためにパラメータが必要である。少なくとも1つの実施形態によれば、大規模言語モデルは、1750億パラメータや、2200 億パラメーターのモデルを8つ搭載する。
【0037】
少なくとも1つの実施形態によれば、ビデオや画像をLLMのテキストトークンに似た小さなデータ単位であるビジュアルパッチパッチの集合として表現する。パッチは、視覚データのモデルを効果的に表現し、さまざまな種類のビデオや画像で生成モデルをトレーニングするための非常にスケーラブルで効果的な表現として用いる。まず動画を低次元の潜在空間に圧縮し、次に表現を時空間パッチに分解することで、動画をパッチに変換する。
【0038】
少なくとも1つの実施形態によれば、Video compression network(ビデオ圧縮ネットワーク)は、視覚データの次元を削減するネットワークで、生の動画を入力として受け取り、時間的および空間的に圧縮された潜在表現を出力する。AIは、この圧縮された潜在空間でトレーニングされ、その後、この圧縮された潜在空間内で動画を生成する。
【0039】
少なくとも1つの実施形態によれば、Spacetime Latent Patches(時空潜在パッチ)は、圧縮された入力動画が与えられると、トランスフォーマートークンとして機能する一連の時空パッチを抽出する。パッチベースの表現により、Sora はさまざまな解像度、長さ、アスペクト比のビデオや画像でトレーニングでき、推論時にランダムに初期化されたパッチを適切なサイズのグリッドに配置することで、生成されるビデオのサイズを制御する。
【0040】
少なくとも1つの実施形態によれば、AIは、ディフュージョンモデルであり、ノイズの多いパッチ (およびテキスト プロンプトなどの条件付け情報) が入力されると、元の「きれいな」パッチを予測するようにトレーニングされる。AIはディフュージョントランスフォーマーであり、これは言語モデリング、コンピュータビジョン、画像生成など、様々な領域で顕著なスケーリング特性を示す。ディフュージョントランスフォーマーは動画生成モデルとしても効果的である。AIは、トレーニングの計算量が増えるにつれて、サンプルの品質は著しく向上する。
【0041】
少なくとも1つの実施形態によれば、AIは、キャプション再生成技術を応用し、非常に説明的なキャプションモデルをトレーニングし、次にそれを使用してトレーニングセット内のすべての動画のテキストキャプションを生成する。高度に説明的なキャプションの訓練は、生成動画の全体的な品質だけでなく、テキストの忠実度を向上させる。GPTを活用して短いユーザープロンプトを長い詳細なキャプションに変換し、モデルに送信する。これにより、AIはユーザーのプロンプトに正確に従った高品質の動画を生成することができる。
【0042】
少なくとも1の実施形態によれば、AIは、自然言語処理において、以下の流れに沿ってベクトル化が実施できる。まずはじめは、前処理として与えられた文章のクリーニング処理を実施する。クリーニング処理では、テキスト内に含まれるJavaScriptのコードやHTMLタグなどの不要な単語を削除する。これらのコードは、インターネット上に表示させるために利用されているコードであるため、自然言語処理では一般には利用されない情報である。続いて、形態素解析によって文章を単語レベルに分割していく。形態素解析とは、文字で表記された自然言語の文において、意味を持つ最小の言語単位に分類することである。形態素解析ツールとしては、「MeCab」「JUMAN」「JANOME」を使うことができる。正規化では、表記ゆれのような同じ意味の言葉を一つの単語に統一する。ストップワードは、自然言語処理で活用できないなどの理由で処理対象外とする単語のことである。ストップワードの例としては、単語の中でも助詞や助動詞といった単体で意味を持たないものがあげられる。ベクトルの計算に際し、これらを除去し、意味のある単語のみを対象とすることもある。これらのストップワードの除去は行わずにベクトル化を行うこともある。ベクトル化は、文字列である単語をベクトルに変換する処理である。ベクトル化により、単語データから数値データに変換する。単語をベクトルに変換するときには、Bag of Wordsや分散表現と呼ばれる方法で実施していく。Bag of Wordsとは、与えられた文章の中に出現する単語の出現数を用いて、文章をベクトル化する方法である。文章の中にどれだけ単語が出現したのかに着目するため、単語や文章の並びは考慮していない。分散表現とは、単語が持つ意味に着目してベクトル化する方法である。単語の意味をベクトル化することで、同じような意味や使われ方をする単語に近しいベクトルを与えることができる上に、単語同士の関係性もまたベクトルで表現できる。ベクトルでの表現により、単語の意味同士の加算や減算が可能である。応用処理は、数値データに変換した自然言語を機械学習の入力に活用できる。具体的には、ベクトル化した自然言語を分類器に投入し、文章の分類を実施する。ここで活用されるツールとしては「TensorFlow」、「scikit-learn」、「PyTorch」などがあげられる。
【0043】
インターネットを通じて動画を送信する送信端末について開示する。少なくとも1の実施形態において、送信端末は、上記の装置またはコンピューターなどのいずれか1以上の開示内容で実現できる。例えば、送信端末は、端末に備えられたカメラを通じて得た映像を、インターネットを通じて送信する。送信の方法は、無線や有線による送信を含む。少なくとも1の実施形態において、動画は一例に過ぎず、情報全般を送信することができる。情報全般は、動画、画像、文字、これらの組み合わせの1以上を含む。少なくとも1の実施形態において、送信は、ライブ配信、オンデマンド配信、疑似ライブ配信、これらの組み合わせのいずれか1以上を含む。少なくとも1の実施形態において、送信端末は、動画の配信者が操作する。
【0044】
少なくとも1の実施形態において、配信条件は以下のいずれか1以上を含む。ライブ配信とは、配信サーバーやインターネット回線を介して、映像や音声をリアルタイムで視聴者に配信する配信手法を含む。ライブ配信はインターネット上でリアルタイムに動画配信を行う方法で、視聴者とリアルタイムに繋がることで最新の情報をスピーディに伝えることができる。テレビの生放送に近い仕組みで、「インターネット生放送」「インターネット生中継」とも呼ばれるものを含む。オンデマンド配信とは、あらかじめ制作した動画を配信サーバーにアップロードしておき、視聴者が好きなタイミングで視聴できる配信方法を含む。オンデマンド配信は、ライブ配信と異なりリアルタイム性はありませんが、時間や場所を選ばずにコンテンツを視聴できるのが大きな特徴です。また、動画制作時に収録をやり直したり編集で伝わり方を工夫したりと、配信内容の質を高めることができる。疑似ライブ配信とは、事前に収録・編集した動画を配信しながら、視聴者とのコミュニケーションをリアルタイムで行う配信方法を含む。ライブ配信とオンデマンド配信の両方のメリットを活かしており、「File to Live」「Simulive」「録画配信」とも呼ばれる方法を含む。
【0045】
前記動画を受信して再生する受信端末について開示する。少なくとも1の実施形態において、受信端末は、上記の装置またはコンピューターなどのいずれか1以上の開示内容で実現できる。例えば、受信端末は、送信端末が送信した映像を、インターネットを通じて受信する。受信端末は、受信した映像を再生する。再生は、受信端末の備えるディスプレイで映像を再生する方法や、受信端末は中継機として他の装置や機械に当該映像を二次通信し、その通信先の装置や機械の有するディスプレイで映像をさ性する方法、これらの組み合わせのいずれか1以上を含む。少なくとも1の実施形態において、動画は一例に過ぎず、情報全般を送信することができる。情報全般は、動画、画像、文字、これらの組み合わせの1以上を含む。少なくとも1の実施形態において、送信は、ライブ配信、オンデマンド配信、疑似ライブ配信、これらの組み合わせのいずれか1以上を含む。
【0046】
送信端末が、送信端末が指定した受信端末が指定する受金手段に送金をすることを装置に指示する方法について開示する。少なくとも1の実施形態において、「装置」は、上記の装置またはコンピューターなどのいずれか1以上の開示内容で実現できる。装置は、受信端末の動画の受信や再生の様態を記録することができ、その記録情報を送受信することができる。一例として、装置は、受信端末への動画の送信が成功したことを示すステータス情報を生成する。装置は、プログラムまたはアプリケーションを受信端末にダウンロードさせることができる。受信端末は、そのプログラムまたはアプリケーションを通じて、受信した動画を再生することができる。そのプログラムまたはアプリケーションは、受信端末が再生した動画を特定し、またはその再生の条件をトラッキングし、そのステータス情報を生成して装置へ送信する。再生の条件は、動画を最後まで再生をした、複数回再生した、などの条件を含む。他にも、動画の一部を再生しないで非連続的に再生した、といった再生条件を含む。他にも、装置は受信端末のカメラにより視聴者の顔や表情、目の動き、これらの組み合わせのいずれか1以上を含むの画像または動画を取得し、その画像から視聴者が動画を実際に視聴したかどうか判断することを,AIに要求することもできる。AIは、キャプション再生成技術を応用し、非常に説明的なキャプションモデルをトレーニングし、次にそれを使用してトレーニングセット内のすべての動画のテキストキャプションを生成する。AIは、教師あり学習により、動画を視聴している人の例と、動画を視聴していない人の例を示すそれぞれの画像または動画により、学習を行う。AIは、ビデオや画像をLLMのテキストトークンに似た小さなデータ単位であるビジュアルパッチパッチの集合として表現する。パッチは、視覚データのモデルを効果的に表現し、さまざまな種類のビデオや画像で生成モデルをトレーニングするための非常にスケーラブルで効果的な表現として用いる。まず動画を低次元の潜在空間に圧縮し、次に表現を時空間パッチに分解することで、動画をパッチに変換する。AIは、受信端末が提供する、視聴者の顔や表情、目の動き、これらの組み合わせのいずれか1以上を含むの画像または動画をパッチに変換し、視聴者が動画を視聴したかを判断し、そのステータス情報を作成する実施形態を含む。ステータス情報は、受信端末を特定する固有番号、そのプログラムまたはアプリケーションに登録されるアカウント情報、上記の組み合わせのいずれか1以上と関連づけて生成される実施形態を含む。
【0047】
送信端末は、受信端末を指定する指定手段を有する。少なくとも1の実施形態において、送信装置は、受信端末を指定する指定条件を装置に登録できる。指定条件は、受信端末への動画の送信が成功したこと(または受信端末が動画を受信したこと)を含む。他にも、受信端末が、そのプログラムまたはアプリケーションを通じて、受信した動画を再生したことを含む。他にも、受信端末が、そのプログラムまたはアプリケーションを通じて、受信した動画を所定の再生条件で再生したことを含む。他にも、受信端末が、送信端末が定める所定の配信条件で再生したことを含む。条件は、上記の例の一以上の組み合わせの条件を含む。送信端末は、これらの各条件を示すステータス情報を有する受信端末を、装置を介して特定する。一例として、送信端末は、送信された動画を受信し、かつ動画を最後まで再生をしたという条件に合致する受信端末を指定する。他の例として、送信端末は、動画の一部を再生しないで非連続的に再生した、といった再生条件を含まない受信端末を指定する(このように特定の条件を含まない受信端末を指定することを、除外条件という)。他の例として、送信端末は、動画をライブ配信で再生をしたという条件に合致する受信端末を指定する。このように、条件は、送信端末を操作する者が任意に定めることができるから、装置や機械にとって特定可能な再生条件は、いずれも本開示における「指定条件」とみなすことができる。装置はその条件に合致する受信端末を探すことができる。装置は、受信端末のステータス情報と、送信端末が指定する指定条件とを照合し、指定条件に合致する送信端末を特定することができる。
【0048】
上記の実施形態において、「受信端末を指定する」は、「プログラムまたはアプリケーションに登録されるアカウントを指定する」に置き換えることができる。すなわち、受信端末は、プログラムまたはアプリケーションを通じて、動画を再生する。装置は、送信端末が指定する指定条件に合致する再生を行なったアカウントを特定できる。そのため、送信端末は、装置と通信することにより、送信端末が指定する指定条件に合致する再生を行なったアカウントを指定できる。
【0049】
受信端末が指定する受金手段について開示する。少なくとも1の実施形態において、受金手段は、電磁的方法または物理的方法を問わず、金員または経済的価値に換算可能なデータを含む経済的価値を受領する手段を含む。一例として、銀行口座、決済サービスのアカウント、インターネット上で決済や送金を行うことができるサービスまたはその登録アカウント、商品または役務の購入に利用できるポイントまたはそのポイントを管理するアカウント、これらのアカウントに関連する物理的または電磁的な経済的価値の受取手段、これらの組み合わせのいずれか1以上を含む。受信手段は、プロブラムまたはアプリケーションへのアカウント登録の際に、これらの受金手段又は受金手段を特定する情報の1以上を登録する。受信端末が指定する受金手段は、この登録された手段または情報であっても良いし、それらの中からアカウントのユーザーが指定した1の手段または情報でも良い。
【0050】
送信端末は、送信端末が指定した受信端末が指定する受金手段に送金をすることを装置に指示することができる。少なくとも1の実施形態において、送信端末は、送金の経済的価値を含む条件を装置に登録できる。例えば、金員、ポイント、それらの組み合わせの1以上を含む。送信端末を操作するユーザーは、プログラムまたはアプリケーションに送信者としてアカウントを登録することもできる。送信端末は、送金手段又は手段に関する情報を装置へ送信できる。送金手段は、一例として、銀行口座、決済サービスのアカウント、インターネット上で決済や送金を行うことができるサービスまたはその登録アカウント、商品または役務の購入に利用できるポイントまたはそのポイントを管理するアカウント、これらのアカウントに関連する物理的または電磁的な経済的価値の送信手段、これらの組み合わせのいずれか1以上を含む。送信端末は、プログラム又はアプリケーションを通じて、アカウントに金手段又は手段に関する情報を関連して登録することもできる。送信端末は、送信端末が指定した受信端末が指定する受金手段に、送金手段を利用して送金をすることを装置に指示することができる。
【0051】
少なくとも1の実施形態において、本開示における利用の一例を開示する。例えば、送信端末は、インターネットを通じて動画のライブ配信または疑似ライブ配信を行う。送信端末は、ライブ配信を受信して再生する受信端末またはアカウントに、送金をすることを装置に指示する。送信端末または装置は、ライブ配信を受信してくれた受信端末またはアカウントに1ドルを送金する。他の実施形態を開示する。例えば、送信端末は、インターネットを通じて動画のオンデマンド配信を行う。送信端末は、配信を受信または再生した受信端末またはアカウントに、送金をすることを装置に指示する。送信端末または装置は、配信を受信または再生してくれた受信端末またはアカウントに1ドルを送金する。これらの実施形態において、他の実施形態として、配信者は受信または再生について任意の条件を定めて、その条件を装置に登録する。装置はその条件に合致する受信端末またはアカウントに送金する。例えば、配信される動画の所定の時間のポイント(例えば、動画開始から五分経過したポイント、動画の最後のポイントを含む)を再生したことが条件の例である。他にも、動画を所定の時間の長さ(例えば、動画の全体の時間の8割を再生した、10分再生した、などの条件を含む)を再生したことも条件の例である。他にも、再生に関する所定の条件(動画を倍速再生していないこと、動画の再生をスキップしていないこと、動画の再生後にアンケートに答えていること、などを含む)が条件の例である。動画の再生をスキップするとは、動画の初めから終わりまで連続的に再生をせず、動画を非連続的に再生する形態を含む。この場合、受信者はすべての動画を見ていないことになる。アンケートが条件の場合、配信者は送信端末からアンケートの情報を装置に送信し、装置が受信端末にアンケートを送信する。受信端末はアンケートの回答を装置に送信する。これらの条件は、任意の1または組み合わせて条件とすることができる。配信者は、これらの条件を装置に登録する。装置は、配信を受信または再生した受信端末の中で、さらにこれらの条件に合致する受信端末を特定する。装置は、その特定された受信端末またはアカウントに1ドルを送金する。本構成は、少なくとも、配信者が望む条件で受信者が視聴したことを確認できるアプリケーションまたはプログラムを作成できる。そのため、送金を受ける目的で不真面目に再生する受信者を取り除くことができるとともに、配信者の配信訴求力の費用対効果が上がるという有用性や産業上の実施可能性がある。
【0052】
少なくとも1の実施形態において、送信はライブ送信であり、受信はライブ受信であり、送金の指示は、ライブ送信中またはライブ送信の略直後に行う。送信端末は、動画のライブ送信を行う。受信端末は、送信される動画のライブ受信を行う。装置は、ライブ受信を行なっている受信端末を特定する。特定の方法は、本明細書に記載のいずれか1の方法で行うことができる。一例として、装置は、ライブ受信をした受信端末を特定する固有番号、そのプログラムまたはアプリケーションに登録されるアカウント情報、上記の組み合わせのいずれか1以上と関連づけて生成されるステータス情報を生成する。装置は、ライブ受信をしている受信端末を、ステータス情報に基づいて特定する。装置は、ライブ送信中に、特定された受信端末が指定する受金手段に送金をする。もしくは、装置は、ライブ送信が終了した後(終了した後というのは、終了した略直後または可及的速やかに送金するのが望ましいが、送金処理のために必要な日時を経過しても構わない)特定された受信端末が指定する受金手段に送金をする。他の実施形態では、送信端末は、特定された受信端末が指定する受金手段にライブ送信中に送金をすることを装置に指示する。または、送信端末は、特定された受信端末が指定する受金手段にライブ送信後に送金をすることを装置に指示する。本構成は、少なくとも、ライブ配信を受信する意欲を増強させることで、動画の視聴に熱心な受信者を獲得できる。そのため、配信者の配信訴求力を顕著に向上させる有用性や産業上の実施可能性がある。
【0053】
上記の実施形態において、「送信端末」は、「プログラムまたはアプリケーションに登録される、情報を送信するユーザー」、「プログラムまたはアプリケーションに登録される、情報を送信するユーザーのアカウント」に置き換えることができる。
【0054】
以下、上記において説明した実施形態の概要について開示する。
【0055】
通信方法であって、
インターネットを通じて動画を送信する送信端末と、
前記動画を受信して再生する受信端末とを有し、
送信端末は、送信端末が指定した受信端末が指定する受金手段に送金をすることを装置に指示する、
通信方法。
【0056】
通信装置であって、
インターネットを通じて動画を送信する送信端末と、
前記動画を受信して再生する受信端末と、
送信端末が指定した受信端末が指定する受金手段に送金をすることを装置に指示する指示部と、
を備える通信装置。
【0057】
本構成では少なくとも、動画を再生する動機づけが発生することで、送信する者の情報発信の影響力を増強できるという有用性がある。
【0058】
上記構成であって、
前記送信はライブ送信であり、
前記受信はライブ受信であり、
指示は、ライブ送信中またはライブ送信後に行う、
方法。
【0059】
本構成は、少なくとも、ライブ配信を受信する意欲を増強させることで、動画の視聴に熱心な受信者を獲得できる。そのため、配信者の配信訴求力を顕著に向上させる有用性や産業上の実施可能性がある。
【0060】
送信端末が指定した受信端末は、再生に関する所定の条件に合致した受信端末である
【0061】
本構成は、少なくとも、配信者が望む条件で受信者が視聴したことを確認できるアプリケーションまたはプログラムを作成できる。そのため、送金を受ける目的で不真面目に再生する受信者を取り除くことができるとともに、配信者の配信訴求力の費用対効果が上がるという有用性や産業上の実施可能性がある。
【0062】
本開示に係る発明は、上述した各効果のうち、少なくとも1つを奏することができればよい。






【要約】      (修正有)
【課題】インターネットを通じた情報の送受信において、送信端末が指定した受信端末が指定する受金手段に送金できる方法及び装置を提供する。
【解決手段】通信装置は、インターネットを通じて動画を送信する送信端末と、前記動画を受信して再生する受信端末と、を有し、方法は、送信端末が指定した受信端末が指定する受金手段に送金をすることを装置に指示する。
【選択図】なし