IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社オープンエイトの特許一覧

<>
  • 特開-サーバおよびデータ割り当て方法 図1
  • 特開-サーバおよびデータ割り当て方法 図2
  • 特開-サーバおよびデータ割り当て方法 図3
  • 特開-サーバおよびデータ割り当て方法 図4
  • 特開-サーバおよびデータ割り当て方法 図5
  • 特開-サーバおよびデータ割り当て方法 図6
  • 特開-サーバおよびデータ割り当て方法 図7
  • 特開-サーバおよびデータ割り当て方法 図8
  • 特開-サーバおよびデータ割り当て方法 図9
  • 特開-サーバおよびデータ割り当て方法 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022061935
(43)【公開日】2022-04-19
(54)【発明の名称】サーバおよびデータ割り当て方法
(51)【国際特許分類】
   H04N 21/235 20110101AFI20220412BHJP
   G06F 40/211 20200101ALI20220412BHJP
   H04N 21/854 20110101ALI20220412BHJP
【FI】
H04N21/235
G06F40/211
H04N21/854
【審査請求】有
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2021051066
(22)【出願日】2021-03-25
(62)【分割の表示】P 2021050999の分割
【原出願日】2020-10-07
(11)【特許番号】
(45)【特許公報発行日】2021-07-14
(71)【出願人】
【識別番号】515124509
【氏名又は名称】株式会社オープンエイト
(74)【代理人】
【識別番号】110002790
【氏名又は名称】One ip特許業務法人
(72)【発明者】
【氏名】坪野 孝弘
(72)【発明者】
【氏名】石橋 尚武
(72)【発明者】
【氏名】高松 雄康
【テーマコード(参考)】
5B091
5C164
【Fターム(参考)】
5B091AA15
5B091CA06
5B091CA21
5C164MA06S
5C164MB11S
5C164MC01P
5C164SB06P
(57)【要約】      (修正有)
【課題】複合コンテンツデータを簡便に作成することを可能とするサーバおよびデータ割り当て方法(プログラム)を提供する。
【解決手段】サーバ1と、管理者端末2と、ユーザ端末3とが、ネットワークを介して互いに通信可能に接続されているシステムにおいて、サーバ1は、少なくとも被識別情報を含む第1のデータの入力を受け付け、被識別情報の少なくとも一部を含む一以上の第2のデータを生成する第2のデータ生成部130と、1つ以上のカットを含む第3のデータのカットに第2のデータを割り当てる第2のデータ割り当て部142と、第2のデータに含まれる被識別情報の少なくとも一部と、素材コンテンツデータから抽出された抽出情報に基づき、第2のデータと、素材コンテンツデータとを関連付ける関連付け部150と、関連付けに基づき、カットに素材コンテンツデータを割り当てる素材コンテンツデータ割り当て部144と、を備える。
【選択図】図4
【特許請求の範囲】
【請求項1】
少なくとも被識別情報を含む第1のデータの入力を受け付け、前記被識別情報の少なく
とも一部を含む一以上の第2のデータを生成する第2のデータ生成部と、
1つ以上のカットを含む第3のデータの前記カットに前記第2のデータを割り当てる第
2のデータ割り当て部と、
前記第2のデータに含まれる被識別情報の少なくとも一部と、素材コンテンツデータか
ら抽出された抽出情報に基づき、前記第2のデータと、前記素材コンテンツデータとを関
連付ける関連付け部と、
前記関連付けに基づき、前記カットに前記素材コンテンツデータを割り当てる素材コン
テンツデータ割り当て部と、
を備えることを特徴とするサーバ。
【請求項2】
前記被識別情報は、言語モデルにより定義された単語形式または文全体を表すベクトル
である、
ことを特徴とする請求項1に記載のサーバ。
【請求項3】
前記第1のデータは、前記被識別情報を含むテキストデータである、
ことを特徴とする請求項1または2に記載のサーバ。
【請求項4】
前記第2のデータは、前記第3のデータの各カットの最大文字数及び前記第1のデータ
の文節間の修飾関係を解析し、文章として自然な区間が各カットに収まるように文を区切
られたものである、
ことを特徴とする請求項1ないし3に記載のサーバ。
【請求項5】
素材コンテンツデータは、画像データ、動画データ、音データの少なくともいずれか1
つである、
ことを特徴とする請求項1ないし4に記載のサーバ。
【請求項6】
前記関連付け部は、前記第2のデータに含まれる被識別情報の少なくとも一部と、前記
素材コンテンツデータから抽出された抽出情報とを比較し、互いの類似度を判定して、前
記第2のデータに適した素材コンテンツデータと前記第2のデータとを互いに関連付けを
行う、
ことを特徴とする請求項1ないし5に記載のサーバ。
【請求項7】
学習データを用いて機械学習を行った学習済モデルであり、前記素材コンテンツデータ
の前記抽出情報を抽出する分類器を備え、
前記抽出情報は、前記分類器が出力したクラスラベルである、
ことを特徴とする請求項6に記載のサーバ。
【請求項8】
前記サーバは、さらに、前記第1のデータに含まれる文章情報を要約する機能を有し、
前記第2のデータ生成部は、前記要約から第2のデータを生成する、
ことを特徴とする請求項1ないし7のいずれかに記載のサーバ。
【請求項9】
前記素材コンテンツデータは、ネットワーク上から取得されて、素材コンテンツデータ
記憶部に格納される、
ことを特徴とする請求項1ないし8のいずれかに記載のサーバ。
【請求項10】
少なくとも被識別情報を含む第1のデータの入力を受け付け、前記被識別情報の少なく
とも一部を含む一以上の第2のデータを生成するステップと、
1つ以上のカットを含む第3のデータの前記カットに前記第2のデータを割り当てるス
テップと、
前記第2のデータに含まれる被識別情報の少なくとも一部と、素材コンテンツデータに
基づき、前記第2のデータと、前記素材コンテンツデータとを関連付けるステップと、
前記関連付けに基づき、前記カットに前記素材コンテンツデータを割り当てるステップ
と、を含む、
ことを特徴とするデータ割り当て方法。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複合コンテンツデータを生成するサーバおよびデータ割り当て方法に関する
【背景技術】
【0002】
従来から、動画等コンテンツデータ作成が行われており、例えば、特許文献1には、複
数のチャプタを有する動画から所望のシーン画像を効率的に検索する動画処理装置が提案
されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2011-130007号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
動画等コンテンツデータを作成することには多大な手間がかかり、特に、テキストデー
タや画像、音データなどの複数の素材コンテンツデータが用いられた複合コンテンツデー
タを作成する場合には、最適な組み合わせを考慮することがユーザの技術レベルによって
は難しいため、簡便に複合コンテンツデータを作成することができる装置の提供が求めら
れていた。
【0005】
そこで、本発明では、複合コンテンツデータを簡便に作成することを可能とするサーバ
およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するための本発明の主たる発明は、少なくとも被識別情報を含む第1の
データの入力を受け付け、前記被識別情報の少なくとも一部を含む一以上の第2のデータ
を生成する第2のデータ生成部と、1つ以上のカットを含む第3のデータの前記カットに
前記第2のデータを割り当てる第2のデータ割り当て部と、前記第2のデータに含まれる
被識別情報の少なくとも一部と、素材コンテンツデータから抽出された抽出情報に基づき
、前記第2のデータと、前記素材コンテンツデータとを関連付ける関連付け部と、前記関
連付けに基づき、前記カットに前記素材コンテンツデータを割り当てる素材コンテンツデ
ータ割り当て部と、を備えることを特徴とするサーバ、である。
【発明の効果】
【0007】
本発明によれば、複合コンテンツデータを簡便に作成することを可能とするサーバおよ
びデータ割り当て方法を提供することが可能となる。
【図面の簡単な説明】
【0008】
図1】実施形態例に係るシステムの構成図である。
図2】実施形態例に係るサーバの構成図である。
図3】実施形態例に係る管理端末、ユーザ端末の構成図である。
図4】実施形態例に係るシステムの機能ブロック図である。
図5】第3のデータを構成する画面レイアウト例を説明する図である。
図6】実施形態例に係るシステムのフローチャートである。
図7】複合コンテンツデータを構成する複数のカットを画面上に一覧表示する態様の説明図である。
図8】要約文作成機能の処理フローである。
図9】文書を形態素解析にかけ、トークンに分ける処理を説明する図である。
図10】第3のデータの各カットへの文章の挿入を説明する図である。
【発明を実施するための形態】
【0009】
本発明の実施形態の内容を列記して説明する。本発明の実施の形態によるサーバ及びデ
ータ割り当て方法は、以下のような構成を備える。
[項目1]
少なくとも被識別情報を含む第1のデータの入力を受け付け、前記被識別情報の少なく
とも一部を含む一以上の第2のデータを生成する第2のデータ生成部と、
1つ以上のカットを含む第3のデータの前記カットに前記第2のデータを割り当てる第
2のデータ割り当て部と、
前記第2のデータに含まれる被識別情報の少なくとも一部と、素材コンテンツデータか
ら抽出された抽出情報に基づき、前記第2のデータと、前記素材コンテンツデータとを関
連付ける関連付け部と、
前記関連付けに基づき、前記カットに前記素材コンテンツデータを割り当てる素材コン
テンツデータ割り当て部と、
を備えることを特徴とするサーバ。
[項目2]
前記被識別情報は、言語モデルにより定義された単語形式または文全体を表すベクトル
である、
ことを特徴とする項目1に記載のサーバ。
[項目3]
前記第1のデータは、前記被識別情報を含むテキストデータ、前記被識別情報を含む画
像データ若しくは動画データ、前記被識別情報を含む音声データの少なくともいずれか1
つである、
ことを特徴とする項目1または2に記載のサーバ。
[項目4]
前記第2のデータは、前記第3のデータの各カットの最大文字数及び前記第1のデータ
の文節間の修飾関係を解析し、文章として自然な区間が各カットに収まるように文を区切
られたものである、
ことを特徴とする項目1ないし3に記載のサーバ。
[項目5]
素材コンテンツデータは、画像データ、動画データ、音データの少なくともいずれか1
つである、
ことを特徴とする項目1ないし4に記載のサーバ。
[項目6]
前記関連付け部は、前記第2のデータに含まれる被識別情報の少なくとも一部と、前記
素材コンテンツデータから抽出された抽出情報とを比較し、互いの類似度を判定して、前
記第2のデータに適した素材コンテンツデータと前記第2のデータとを互いに関連付けを
行う、
ことを特徴とする項目1ないし5に記載のサーバ。
[項目7]
学習データを用いて機械学習を行った学習済モデルであり、前記素材コンテンツデータ
の前記抽出情報を抽出する分類器を備え、
前記抽出情報は、前記分類器が出力したクラスラベルである、
ことを特徴とする項目6に記載のサーバ。
[項目8]
前記サーバは、さらに、前記第1のデータに含まれる文章情報を要約する機能を有し、
前記第2のデータ生成部は、前記要約から第2のデータを生成する、
ことを特徴とする項目1ないし7のいずれかに記載のサーバ。
[項目9]
前記素材コンテンツデータは、ネットワーク上から取得されて、素材コンテンツデータ
記憶部に格納される、
ことを特徴とする項目1ないし8のいずれかに記載のサーバ。
[項目10]
少なくとも被識別情報を含む第1のデータの入力を受け付け、前記被識別情報の少なく
とも一部を含む一以上の第2のデータを生成するステップと、
1つ以上のカットを含む第3のデータの前記カットに前記第2のデータを割り当てるス
テップと、
前記第2のデータに含まれる被識別情報の少なくとも一部と、素材コンテンツデータに
基づき、前記第2のデータと、前記素材コンテンツデータとを関連付けるステップと、
前記関連付けに基づき、前記カットに前記素材コンテンツデータを割り当てるステップ
と、を含む、
ことを特徴とするデータ割り当て方法。
【0010】
<実施の形態の詳細>
以下、本発明の実施の形態による複合コンテンツデータを作成するためのシステム(以
下「本システム」という)等について説明する。添付図面において、同一または類似の要
素には同一または類似の参照符号及び名称が付され、各実施形態の説明において同一また
は類似の要素に関する重複する説明は省略することがある。また、各実施形態で示される
特徴は、互いに矛盾しない限り他の実施形態にも適用可能である。
【0011】
<構成>
実施形態例に係る本システムは、図1に示すように、サーバ1と、管理者端末2と、ユ
ーザ端末3とを備えて構成される。サーバ1と、管理者端末2と、ユーザ端末3は、ネッ
トワークを介して互いに通信可能に接続されている。ネットワークは、ローカルネットワ
ークであってもよいし、外部ネットワークに接続可能なものであってもよい。図1の例で
は、サーバ1を1台で構成する例を説明しているが、複数台のサーバ装置によりサーバ1
を実現することも可能である。また、サーバ1と管理者端末2が共通化されていてもよい
【0012】
<サーバ1>
図2は、図1に記載のサーバ1のハードウェア構成を示す図である。なお、図示された
構成は一例であり、これ以外の構成を有していてもよい。また、サーバ1は、例えばワー
クステーションやパーソナルコンピュータのような汎用コンピュータとしてもよいし、或
いはクラウド・コンピューティングによって論理的に実現されてもよい。
【0013】
サーバ1は、少なくとも、プロセッサ10、メモリ11、ストレージ12、送受信部1
3、入出力部14等を備え、これらはバス15を通じて相互に電気的に接続される。
【0014】
プロセッサ10は、サーバ1全体の動作を制御し、各要素間におけるデータの送受信の
制御、及びアプリケーションの実行及び認証処理に必要な情報処理等を行う演算装置であ
る。例えばプロセッサ10はCPU(Central Processing Unit
)およびGPU(Graphics Processing Unit)であり、ストレ
ージ12に格納されメモリ11に展開された本システムのためのプログラム等を実行して
各情報処理を実施する。なお、プロセッサ10の処理能力は、必要な情報処理を実行する
ために十分であればよいので、例えば、プロセッサ10はCPUのみで構成されていても
よいし、これに限るものでもない。
【0015】
メモリ11は、DRAM(Dynamic Random Access Memor
y)等の揮発性記憶装置で構成される主記憶と、フラッシュメモリやHDD(Hard
Disc Drive)等の不揮発性記憶装置で構成される補助記憶と、を含む。メモリ
11は、プロセッサ10のワークエリア等として使用され、また、サーバ1の起動時に実
行されるBIOS(Basic Input / Output System)、及び
各種設定情報等を格納してもよい。
【0016】
ストレージ12は、アプリケーション・プログラム等の各種プログラムを格納する。各
処理に用いられるデータを格納したデータベースがストレージ12に構築されていてもよ
い。
【0017】
送受信部13は、サーバ1をネットワークに接続する。
【0018】
入出力部14は、キーボード・マウス類等の情報入力機器、及びディスプレイ等の出力
機器である。
【0019】
バス15は、上記各要素に共通に接続され、例えば、アドレス信号、データ信号及び各
種制御信号を伝達する。
【0020】
<管理者端末2、ユーザ端末3>
図3に示される管理者端末2、ユーザ端末3もまた、プロセッサ20、メモリ21、ス
トレージ22、送受信部23、入出力部24等を備え、これらはバス25を通じて相互に
電気的に接続される。各要素の機能は、上述したサーバ1と同様に構成することが可能で
あることから、各要素の詳細な説明は省略する。管理者は、管理者端末2により、例えば
サーバ1の設定変更やデータベースの運用管理などを行う。ユーザは、ユーザ端末3によ
りサーバ1にアクセスして、例えば、作成された複合コンテンツデータを閲覧することな
どができる。
【0021】
<サーバ1の機能>
図4は、サーバ1に実装される機能を例示したブロック図である。本実施の形態におい
ては、サーバ1は、通信部110、被識別情報解析部120、第2のデータ生成部130
、複合コンテンツデータ生成部140、関連付け部150、記憶部160、分類器170
を備えている。複合コンテンツデータ生成部140は、第2のデータ割り当て部142、
素材コンテンツデータ割り当て部144を含む。また、記憶部160は、第3のデータ記
憶部162、素材コンテンツデータ記憶部164、複合コンテンツデータ記憶部166、
インターフェース情報記憶部168などの各種データベースを含む。
【0022】
通信部110は、管理端末2や、ユーザ端末3と通信を行う。通信部110は、ユーザ
端末2から、少なくとも被識別情報を含む第1のデータを受け付ける受付部としても機能
する。そして、第1のデータは、例えば、被識別情報を含む記事(例えば、プレスリリー
スや、ニュースなど)などのテキストデータ、被識別情報を含む画像データ(例えば、写
真や、イラストなど)若しくは動画データ、被識別情報を含む音声データなどであっても
よい。なお、ここでいうテキストデータは、サーバ1に送信された時点においてテキスト
データであるものに限らず、例えば、サーバ1に送信された音声データを既知の音声認識
技術により生成されたテキストデータであってもよい。また、第1のデータは、例えば記
事などのテキストデータなどが、既存の抽出的要約若しくは生成的要約などの自動要約技
術により要約されたもの(被識別情報を含む)であってもよく、その場合、第3のデータ
に含まれるカット数が減り、複合コンテンツデータ全体のデータ容量を小さくすることが
でき、内容も簡潔なものとなり得る。
【0023】
また、ここでいう音声データは、動画データから音声認識により抽出された音声データ
や、テキストデータから生成された音声データであってもよい。前者の場合、例えばラフ
スケッチなどの仮画像及び仮映像による動画といった仮動画から、ナレーションやセリフ
などの音声データだけを抽出し、後述されるように当該音声データを基に素材コンテンツ
データと共に複合コンテンツデータを生成するようにしてもよい。後者の場合、例えば、
ストーリーのあるテキストデータから音声データを作成し、例えば童話であれば、読み上
げられたストーリーと素材コンテンツデータによる紙芝居や動画を複合コンテンツデータ
として生成するようにしてもよい。
【0024】
第2のデータ生成部130は、例えば第1のデータを分割する必要がないと判定した場
合(例えば、テキストデータが予め設定された文字数以下の短文であったりするなど)に
は、第2のデータ生成部130は、そのまま第1のデータを第2のデータとして生成する
。一方で、例えば第1のデータを分割する必要があると判定した場合(例えば、予め設定
された文字数よりも長文であったりするなど)には、第2のデータ生成部130は、第1
のデータを分割し、それぞれ第1のデータの被識別情報の少なくとも一部を含む第2のデ
ータとして生成する。なお、第2のデータ生成部130による第1のデータ分割の方法は
、既知の何れの技術を利用してもよく、例えば、後述するように、第1のデータがテキス
ト化できるものであれば、第3のデータの各カットの最大文字数及び文節間の修飾関係を
解析し、文章として自然な区間が各カットに収まるように文を区切るようにしてもよい。
【0025】
被識別情報解析部120は、上述の第2のデータを解析し、被識別情報を取得する。こ
こで、被識別情報は、被識別情報解析部120により解析可能であれば、どのような情報
であってもよい。一つの態様としては、被識別情報は、言語モデルにより定義された単語
形式であり得る。より具体的には、後述の単語ベクトルを伴う一以上の単語(例えば、「
渋谷、新宿、六本木」や「渋谷、ランドマーク、若者」など)であってもよい。なお、当
該単語には、言語モデルに応じて「ん」などの通常はそれ単体では利用されない単語も含
み得る。また、上記単語形式の代わりに文全体を表すベクトルを伴う文書、または画像や
動画から抽出された特徴ベクトルであってもよい。
【0026】
複合コンテンツデータ生成部140は、第3のデータ記憶部162から一以上のカット
を含む第3のデータを読み出し、素材コンテンツデータ記憶部164に記憶された素材コ
ンテンツデータと上述の第2のデータが割り当てられた第3のデータを複合コンテンツデ
ータとして生成するとともに複合コンテンツデータ記憶部166に記憶し、ユーザ端末2
に複合コンテンツデータを表示する。なお、図5は、第3のデータを構成するカットの画
面レイアウトの一例である。同図中第2のデータフィールド31に編集された第2のデー
タ(例えば、区切られたテキスト文章など)が挿入され、素材コンテンツデータフィール
ド32に選択された素材コンテンツデータが挿入される。第3のデータの各カットには、
予め設定されている上述の最大文字数(テキストデータの場合)や、画面レイアウト、再
生時間(動画の場合)が規定されている。また、複合コンテンツデータは、必ずしも複合
コンテンツデータ記憶部166に保存される必要はなく、適当なタイミングで記憶されて
もよい。また、第2のデータのみが割り当てられた第3のデータを複合コンテンツデータ
の経過情報としてユーザ端末3に表示するようにしてもよい。
【0027】
第2のデータ割り当て部142は、例えば複数のカットに、カット1、カット2、カッ
ト3といったように番号がふられており、この番号順に、第2のデータを順次割り当てて
いく。なお、このような割り当て方法に限定されず、例えば、第2のデータ割り当て部1
42は、第2のデータの数に合わせて、第3のデータに含まれるカット数を予め設定され
た数から増減し、第2のデータを割り当てるようにしてもよい。
【0028】
関連付け部150は、上述の第2のデータに含まれる被識別情報の少なくとも一部と、
例えば、素材コンテンツデータから抽出される抽出情報(例えば、分類器が抽出したクラ
スラベルなど)と比較し、例えば、互いの類似度などを判定して、第2のデータに適した
素材コンテンツデータ(例えば、類似度が高いものなど)と第2のデータとを互いに関連
付けを行う。より具体的な例としては、例えば、第2のデータに含まれる被識別情報が「
先生」を表し、抽出情報が「顔」である素材コンテンツデータA(例えば、女性の画像)
と「山」である素材コンテンツデータB(例えば、富士山の画像)が用意されている場合
、「先生」から得られる単語ベクトルと「顔」から得られる単語ベクトルの関連は、「先
生」から得られる単語ベクトルと「山」から得られる単語ベクトルの関連よりも類似して
いるため、第2のデータは素材コンテンツデータAと関連付けられる。なお、素材コンテ
ンツデータの抽出情報は、ユーザが予め抽出して素材コンテンツデータ記憶部164に記
憶したものであってもよく、後述の分類器170により抽出されたものであってもよい。
また、上記類似度の判定は、単語ベクトルを学習した学習済モデルを用意し、そのベクト
ルを利用してコサイン類似度やWord Mover’s Distanceなどの方法により単語の類似度を
判定してもよい。
【0029】
素材コンテンツデータは、例えば、画像データや、動画データ、音データ(例えば、音
楽データ、音声データ、効果音など)などであり得るが、これに限定されない。また、素
材コンテンツデータは、ユーザまたは管理者が素材コンテンツデータ記憶部164に格納
するものであってもよいし、ネットワーク上から、素材コンテンツデータを取得し、素材
コンテンツデータ記憶部164に格納するものであってもよい。
【0030】
素材コンテンツデータ割り当て部144は、上述の関連付けに基づき、対応する第2の
データが割り当てられたカットに、適した素材コンテンツデータを割り当てる。
【0031】
インターフェース情報記憶部168は、管理端末2若しくはユーザ端末2の表示部(デ
ィスプレイ等)に表示するための各種制御情報を格納している。
【0032】
分類器170は、学習データを学習データ記憶部(不図示)から取得し、機械学習させ
ることで、学習済モデルとして作成される。分類器170の作成は、定期的に行われる(
例えば、年に数回程度)。分類器作成用の学習データは、ネットワークから収集したデー
タやユーザ保有のデータにクラスラベルをつけたものを利用してもよいし、クラスラベル
のついたデータセットを調達して利用してもよい。そして、分類器170は、例えば、畳
み込みニューラルネットワークを利用した学習済モデルであり、素材コンテンツデータを
入力すると、1つまたは複数の抽出情報(例えば、クラスラベルなど)を抽出する。分類
器170は、例えば、素材コンテンツデータに関連するオブジェクトを表すクラスラベル
(例えば、魚介、焼肉、人物、家具)を抽出する。
【0033】
図6は、複合コンテンツデータを作成する流れの一例を説明する図である。
【0034】
まず、サーバ1は、少なくとも被識別情報を含む第1のデータをユーザ端末2より通信
部110を介して受け付ける(ステップS101)。本例においては、被識別情報は、例
えば一以上の単語であり、第1のデータは、例えば一以上の単語を含む記事からなるテキ
ストデータまたはそのテキストデータを要約したものであり得る。
【0035】
次に、サーバ1は、複合コンテンツデータ生成部140により、一以上のカットを含む
第3のデータを第3のデータ記憶部162から読み出す(ステップS102)。本例にお
いては、第3のデータは、例えば複数のカットを含むテンプレートデータであり得る。
【0036】
次に、サーバ1は、被識別情報解析部120により、第1のデータを解析して被識別情
報を取得し、第2のデータ生成部130により、被識別情報の少なくとも一部を含む一以
上の第2のデータを生成する(ステップS103)。第2のデータは、第3のデータの各
カットの最大文字数及び文節間の修飾関係を解析し、文章として自然な区間が各カットに
収まるように文を区切った個々のテキストデータであり得る。
【0037】
次に、サーバ1は、第2のデータ割り当て部により、第2のデータをカットに割り当て
る(ステップS104)。なお、この状態の第3のデータをユーザ端末3にて表示をする
ようにして、経過を確認可能にしてもよい。
【0038】
次に、サーバ1は、第2のデータに含まれる被識別情報の少なくとも一部と、素材コン
テンツデータから抽出された抽出情報に基づき、関連付け部150により、素材コンテン
ツデータ記憶部164の素材コンテンツデータと第2のデータとを互いに関連付けし(ス
テップS105)、素材コンテンツデータ割り当て部144によりその素材コンテンツデ
ータをカットに割り当てる(ステップS106)。
【0039】
そして、サーバ1は、第2のデータ及び素材コンテンツデータが割り当てられた第3の
データを複合コンテンツデータとして生成するとともに複合コンテンツデータ記憶部16
6に記憶し、ユーザ端末2に複合コンテンツデータを表示する(ステップS107)。な
お、複合コンテンツデータの表示は、図7に例示するように、複合コンテンツデータを構
成する複数のカットを画面上に一覧表示することができる。各カットには、表示される素
材コンテンツデータおよび第2データと共に各カットの再生時間(秒数)の情報も表示さ
れてもよい。ユーザは、例えば、第2のデータフィールド31や対応するボタンをクリッ
クすることで、その内容を修正することができ、素材コンテンツデータフィールド32や
対応するボタンをクリックすることで素材コンテンツデータを差し替えることができる。
【0040】
なお、上述の複合コンテンツデータを作成する流れは一例であり、例えば、第3のデー
タを読み出すためのステップS102は、第2のデータまたは素材コンテンツデータの割
り当てまでに読み出されていればいつ実行されていてもよい。また、例えば、第2のデー
タの割り当てのためのステップS104と、関連付けのためのステップS105と、素材
コンテンツデータの割り当てのためのステップS106の順番も、互いに齟齬が生じなけ
れば何れの順番で実行されてもよい。
【0041】
(要約文作成機能)
図8図10を参照しながら、第1のデータがテキストデータを含むものである場合に
、サーバ1がテキストデータから要約文作成し、その要約文を含む第1のデータから第2
のデータを作成する一例について説明する。
【0042】
STEP91:段落分割・文書分割
サーバ1は、入力されたテキストデータの文書を段落に分割し、各段落内の文書を文に
分割する。また、動画のテロップとして1シーンで表示すると長すぎて可読性を落とす文
章(例えば80文字以上)については、特定の品詞、表記等の条件を満たす箇所で、さら
に複数の文章に分割する。
【0043】
STEP92:文書の形態素解析
サーバ1は、各文を形態素解析にかけ、構文解析の最小単位となるトークンを取り出す
図9に示すように、各トークンには品詞が付与されている。
【0044】
STEP93:不要語・不要段落の削除
サーバ1は、予め定義された無効な文の判定ルールより、無効と定義される文、段落を
削除する。例えば、「■」、「▼」などの特定記号から始まる行、特定記号で囲まれた段
落、URL、メールアドレス、住所・電話番号などが記載された段落を削除する。
【0045】
STEP94:ストップワード等の削除
サーバ1は、トークンから「に」、「から」、「これ」、「さん」などのあまり意味と
しては重要でないワード(ストップワード)や助詞などの特定品詞を削除する。
【0046】
STEP95:トークンバイグラムの作成
特定の条件(例えば、予め定義された品詞条件)を満たす複数のトークンを繋げ、トー
クンバイグラムを得る。例えば、「2014年」(名詞、固有名詞、一般)と「6月」(
名詞、固有名詞、一般)を繋げて「2014年6月」としたり、「ヴェルディ」(固有名
詞)と「協賛」(普通名詞)を繋げ、「ヴェルディ協賛」としたりする。
【0047】
STEP96:重要文の抽出
トークンおよびトークンバイグラムを元にTF-IDFなど単語の重要度を評価する指
標から特徴語となるトークンおよびトークンバイアグラムを抽出し、前述の単語類似度判
定などからテキストのセグメンテーションを行い、各セグメントから重要文を抽出するこ
とで要約とする。
【0048】
STEP97:テンプレートへの当てはめ
要約(重要文)を構文解析にかけ、文節と構文木に別ける。上述の第3のデータ(例え
ばテンプレートデータ)は各カットに挿入できる文字数が定義されているところ、文節間
の修飾関係から、文章として自然な区間が各テンプレートに収まるように文を区切り、第
3のデータに当てはめる。図10に、第3のデータの各カットへの文章の挿入例を示す。
以上に説明した要約文作成機能は、日本語のみならず、英語をはじめとする多言語に対応
が可能である。
【0049】
以上に説明した実施形態例の本システムによれば、編集用ソフト、サーバ、専門技術を
持った編集者などを自前で揃えなくとも、簡単に複合コンテンツデータを作成することが
可能となる。例えば、下記のような場面での活用が想定される。
1)ECショップで販売している商品情報の動画化
2)プレスリリース情報、CSR情報などを動画で配信
3)利用方法・オペレーションフローなどのマニュアルを動画化
4)動画広告として活用できるクリエイティブを制作
【0050】
以上、本発明の好ましい実施形態例について説明したが、本発明の技術的範囲は上記実
施形態の記載に限定されるものではない。上記実施形態例には様々な変更・改良を加える
ことが可能であり、そのような変更または改良を加えた形態のものも本発明の技術的範囲
に含まれる。
【符号の説明】
【0051】
1 サーバ
2 管理者端末
3 ユーザ端末

図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
【手続補正書】
【提出日】2021-03-25
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
第1のデータを一以上の第2のデータを生成する第2のデータ生成部と、
前記第2のデータに含まれる被識別情報の少なくとも一部と、素材コンテンツデータから抽出された抽出情報に基づき、前記第2のデータと、前記素材コンテンツデータとを関連付ける関連付け部と、
前記関連付けに基づき、 1つ以上のカットを含む第3のデータのカットに前記第2のデータ及び前記素材コンテンツデータを割り当てるデータ割り当て部と、
を備え
前記第1のデータは、HTML形式データを含まず、
前記第3のデータ及び前記カットには、前記第2のデータ及び前記素材コンテンツデータの割り当てのための被識別情報が付されていない、
ことを特徴とするサーバ。
【請求項2】
素材コンテンツデータは、画像データ、動画データ、音データの少なくともいずれか1つである、
ことを特徴とする請求項1に記載のサーバ。
【請求項3】
前記関連付け部は、前記第2のデータに含まれる被識別情報の少なくとも一部と、前記素材コンテンツデータから抽出された抽出情報とを比較し、互いの類似度を判定して、前記第2のデータに適した素材コンテンツデータと前記第2のデータとを互いに関連付けを行う、
ことを特徴とする請求項1または2に記載のサーバ。
【請求項4】
前記素材コンテンツデータは、ネットワーク上から取得されて、素材コンテンツデータ記憶部に格納される、
ことを特徴とする請求項1ないしのいずれかに記載のサーバ。
【請求項5】
第1のデータを一以上の第2のデータを生成するステップと、
前記第2のデータに含まれる被識別情報の少なくとも一部と、素材コンテンツデータから抽出された抽出情報に基づき、前記第2のデータと、前記素材コンテンツデータとを関連付けるステップと、
前記関連付けに基づき、 1つ以上のカットを含む第3のデータのカットに前記第2のデータ及び前記素材コンテンツデータを割り当てるステップと、
コンピュータに実行させる情報処理方法であって、
前記第1のデータは、HTML形式データを含まず、
前記第3のデータ及び前記カットには、前記第2のデータ及び前記素材コンテンツデータの割り当てのための被識別情報が付されていない、
ことを特徴とする情報処理方法。
【請求項6】
第1のデータを一以上の第2のデータを生成するステップと、
前記第2のデータに含まれる被識別情報の少なくとも一部と、素材コンテンツデータから抽出された抽出情報に基づき、前記第2のデータと、前記素材コンテンツデータとを関連付けるステップと、
前記関連付けに基づき、 1つ以上のカットを含む第3のデータのカットに前記第2のデータ及び前記素材コンテンツデータを割り当てるステップと、
をコンピュータに実行させるプログラムであって、
前記第1のデータは、HTML形式データを含まず、
前記第3のデータ及び前記カットには、前記第2のデータ及び前記素材コンテンツデータの割り当てのための被識別情報が付されていない、
ことを特徴とするプログラム。
【手続補正書】
【提出日】2021-05-06
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
少なくとも被識別情報を含む第1のデータから一以上の第2のデータを生成する第2のデータ生成部と、
前記第2のデータに含まれる前記被識別情報の少なくとも一部と、素材コンテンツデータから抽出された抽出情報に基づき、前記第2のデータと、前記素材コンテンツデータとを関連付ける関連付け部と、
前記関連付けに基づき、1つ以上のカットを含む第3のデータのカットに前記第2のデータ及び前記素材コンテンツデータを割り当てるデータ割り当て部と、
を備え、
前記第1のデータは、HTML形式データを含まず、
前記カットには、前記第2のデータの割り当てのための被識別情報が付されていない、
ことを特徴とするサーバ。
【請求項2】
素材コンテンツデータは、画像データ、動画データ、音データの少なくともいずれか1つである、
ことを特徴とする請求項1に記載のサーバ。
【請求項3】
前記関連付け部は、前記第2のデータに含まれる被識別情報の少なくとも一部と、前記素材コンテンツデータから抽出された抽出情報とを比較し、互いの類似度を判定して、前記第2のデータに適した素材コンテンツデータと前記第2のデータとを互いに関連付けを行う、
ことを特徴とする請求項1または2に記載のサーバ。
【請求項4】
前記素材コンテンツデータは、ネットワーク上から取得されて、素材コンテンツデータ記憶部に格納される、
ことを特徴とする請求項1ないし3のいずれかに記載のサーバ。
【請求項5】
少なくとも被識別情報を含む第1のデータから一以上の第2のデータを生成するステップと、
前記第2のデータに含まれる前記被識別情報の少なくとも一部と、素材コンテンツデータから抽出された抽出情報に基づき、前記第2のデータと、前記素材コンテンツデータとを関連付けるステップと、
前記関連付けに基づき、1つ以上のカットを含む第3のデータのカットに前記第2のデータ及び前記素材コンテンツデータを割り当てるステップと、
をコンピュータに実行させる情報処理方法であって、
前記第1のデータは、HTML形式データを含まず、
前記カットには、前記第2のデータの割り当てのための被識別情報が付されていない、
ことを特徴とする情報処理方法。
【請求項6】
少なくとも被識別情報を含む第1のデータから一以上の第2のデータを生成するステップと、
前記第2のデータに含まれる前記被識別情報の少なくとも一部と、素材コンテンツデータから抽出された抽出情報に基づき、前記第2のデータと、前記素材コンテンツデータとを関連付けるステップと、
前記関連付けに基づき、1つ以上のカットを含む第3のデータのカットに前記第2のデータ及び前記素材コンテンツデータを割り当てるステップと、
をコンピュータに実行させるプログラムであって、
前記第1のデータは、HTML形式データを含まず、
前記カットには、前記第2のデータの割り当てのための被識別情報が付されていない、
ことを特徴とするプログラム。