IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ みずほ情報総研株式会社の特許一覧

特許7599963コンテンツ生成システム、コンテンツ生成方法及びコンテンツ生成プログラム
<>
  • 特許-コンテンツ生成システム、コンテンツ生成方法及びコンテンツ生成プログラム 図1
  • 特許-コンテンツ生成システム、コンテンツ生成方法及びコンテンツ生成プログラム 図2
  • 特許-コンテンツ生成システム、コンテンツ生成方法及びコンテンツ生成プログラム 図3
  • 特許-コンテンツ生成システム、コンテンツ生成方法及びコンテンツ生成プログラム 図4
  • 特許-コンテンツ生成システム、コンテンツ生成方法及びコンテンツ生成プログラム 図5
  • 特許-コンテンツ生成システム、コンテンツ生成方法及びコンテンツ生成プログラム 図6
  • 特許-コンテンツ生成システム、コンテンツ生成方法及びコンテンツ生成プログラム 図7
  • 特許-コンテンツ生成システム、コンテンツ生成方法及びコンテンツ生成プログラム 図8
  • 特許-コンテンツ生成システム、コンテンツ生成方法及びコンテンツ生成プログラム 図9
  • 特許-コンテンツ生成システム、コンテンツ生成方法及びコンテンツ生成プログラム 図10
  • 特許-コンテンツ生成システム、コンテンツ生成方法及びコンテンツ生成プログラム 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-12-06
(45)【発行日】2024-12-16
(54)【発明の名称】コンテンツ生成システム、コンテンツ生成方法及びコンテンツ生成プログラム
(51)【国際特許分類】
   G06Q 50/10 20120101AFI20241209BHJP
   G06F 40/279 20200101ALI20241209BHJP
   G06F 40/247 20200101ALI20241209BHJP
【FI】
G06Q50/10
G06F40/279
G06F40/247
【請求項の数】 8
(21)【出願番号】P 2021005796
(22)【出願日】2021-01-18
(65)【公開番号】P2021136011
(43)【公開日】2021-09-13
【審査請求日】2023-10-27
(31)【優先権主張番号】P 2020031880
(32)【優先日】2020-02-27
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】592131906
【氏名又は名称】みずほリサーチ&テクノロジーズ株式会社
(74)【代理人】
【識別番号】100105957
【弁理士】
【氏名又は名称】恩田 誠
(74)【代理人】
【識別番号】100068755
【弁理士】
【氏名又は名称】恩田 博宣
(72)【発明者】
【氏名】相澤 祐一
(72)【発明者】
【氏名】笠間 俊夫
【審査官】田上 隆一
(56)【参考文献】
【文献】特開2004-226671(JP,A)
【文献】特開2011-065567(JP,A)
【文献】特許第6641045(JP,B1)
【文献】特開2012-004885(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
G06F 40/279
G06F 40/247
(57)【特許請求の範囲】
【請求項1】
コンテンツを作成するための生成変数を設定したコンテンツパッケージを記憶したパッケージ記憶部と、
前記コンテンツパッケージを用いて生成されたコンテンツの印象を評定した複数の単語からなる印象評定情報を記憶した印象評定記憶部と、
前記印象評定情報の分析により算出された各コンテンツパッケージの成分値からなる印象情報を記憶した印象情報記憶部と、
ユーザ端末に接続され、コンテンツを生成する制御部とを備えたコンテンツ生成システムであって、
前記制御部が、
前記ユーザ端末から対象テキストを取得して、前記対象テキストに含まれる単語を抽出し、前記印象評定情報に含まれる単語との相関性についての評価情報である評価値を算出し、
前記印象情報記憶部に記憶された印象情報の成分値の中で、前記評価に近いコンテンツパッケージを特定し、
前記パッケージ記憶部から、前記特定したコンテンツパッケージの生成変数を呼び出し、前記生成変数を用いて、コンテンツを生成し、前記ユーザ端末に出力することを特徴とするコンテンツ生成システム。
【請求項2】
前記制御部が、前記印象評定情報を用いて主成分分析を行なうことにより、各コンテンツパッケージの主成分値を算出することを特徴とする請求項1に記載のコンテンツ生成システム。
【請求項3】
前記印象評定情報は、コンテンツの印象を表現した形容語であり、
前記制御部が、
各コンテンツパッケージの印象情報により、前記形容語の重み付けを行ない、
前記形容語と前記対象テキストとを比較して、前記重み付けを用いて、前記対象テキストの評価情報を算出することを特徴とする請求項1又は2に記載のコンテンツ生成システム。
【請求項4】
前記制御部が、前記形容語の類義語と前記対象テキストとに基づいて、前記対象テキストの評価を算出することを特徴とする請求項3に記載のコンテンツ生成システム。
【請求項5】
前記制御部が、前記形容語と類義語との共起分析により算出された共起度を用いて、前記対象テキストの評価を算出することを特徴とする請求項4に記載のコンテンツ生成システム。
【請求項6】
前記制御部が、
前記対象テキストについて、文章種類予測情報を用いて、文章種類を特定し、
前記文章種類に利用可能なコンテンツパッケージ候補を特定し、
前記コンテンツパッケージ候補の中で、前記評価情報に近いコンテンツパッケージを特定することを特徴とする請求項1~5の何れか一項に記載のコンテンツ生成システム。
【請求項7】
コンテンツを作成するための生成変数を設定したコンテンツパッケージを記憶したパッケージ記憶部と、
前記コンテンツパッケージを用いて生成されたコンテンツの印象を評定した複数の単語からなる印象評定情報を記憶した印象評定記憶部と、
前記印象評定情報の分析により算出された各コンテンツパッケージの成分値からなる印象情報を記憶した印象情報記憶部と、
ユーザ端末に接続され、コンテンツを生成する制御部とを備えたコンテンツ生成システムを用いて、コンテンツを生成する方法であって、
前記制御部が、
前記ユーザ端末から対象テキストを取得して、前記対象テキストに含まれる単語を抽出し、前記印象評定情報に含まれる単語との相関性についての評価情報である評価値を算出し、
前記印象情報記憶部に記憶された印象情報の成分値の中で、前記評価に近いコンテンツパッケージを特定し、
前記パッケージ記憶部から、前記特定したコンテンツパッケージの生成変数を呼び出し、前記生成変数を用いて、コンテンツを生成し、前記ユーザ端末に出力することを特徴とするコンテンツ生成方法。
【請求項8】
コンテンツを作成するための生成変数を設定したコンテンツパッケージを記憶したパッケージ記憶部と、
前記コンテンツパッケージを用いて生成されたコンテンツの印象を評定した複数の単語からなる印象評定情報を記憶した印象評定記憶部と、
前記印象評定情報の分析により算出された各コンテンツパッケージの成分値からなる印象情報を記憶した印象情報記憶部と、
ユーザ端末に接続され、コンテンツを生成する制御部とを備えたコンテンツ生成システムを用いて、コンテンツを生成するプログラムであって、
前記制御部を、
前記ユーザ端末から対象テキストを取得して、前記対象テキストに含まれる単語を抽出し、前記印象評定情報に含まれる単語との相関性についての評価情報である評価値を算出し、
前記印象情報記憶部に記憶された印象情報の成分値の中で、前記評価に近いコンテンツパッケージを特定し、
前記パッケージ記憶部から、前記特定したコンテンツパッケージの生成変数を呼び出し、前記生成変数を用いて、コンテンツを生成し、前記ユーザ端末に出力する手段として機能させることを特徴とするコンテンツ生成プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、テキストに応じて、多様なコンテンツを生成するためのコンテンツ生成システム、コンテンツ生成方法及びコンテンツ生成プログラムに関する。
【背景技術】
【0002】
テキスト等に対して、音楽や画像等のコンテンツを付加する場合がある。このために、ユーザの気分により効果音や音楽を付加して通話するための技術が検討されている(例えば、特許文献1)。特許文献1に記載された技術では、音声通話装置において、センサのデータ又はメールの文字データからユーザの感情状態を分析して気分モードと気分レベルを設定する。そして、気分モードと気分レベルにより、効果音又は音楽を選択し、選択された効果音又は音楽をユーザの指示を検知して変更する。
【0003】
また、ユーザの嗜好に合致する楽曲を選択するための技術も検討されている(例えば、特許文献2)。特許文献2に記載された技術では、サーバ装置の記憶装置は、楽曲の評価を保持する。そして、情報処理端末が取得した発話内容を取得し、発話内容に関連する一以上の楽曲を選択する。更に、情報処理端末によって再生された楽曲に対するユーザの応答内容から、選択された楽曲の評価を更新する。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2012-4885号公報
【文献】特開2018-55440号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、予め準備された音楽等のコンテンツを提供していたのでは、状況に応じて、同じコンテンツが提供されるので、多様性に欠けるという課題がある。
【課題を解決するための手段】
【0006】
上記課題を解決するコンテンツ生成システムは、コンテンツを作成するための生成変数を設定したコンテンツパッケージを記憶したパッケージ記憶部と、前記コンテンツパッケージによるコンテンツ生成時の複数の印象評定情報を記憶した印象評定記憶部と、前記印象評定情報の分析により算出された各コンテンツパッケージの印象情報を記憶した印象情報記憶部と、コンテンツを生成する制御部とを備える。そして、前記制御部が、対象テキストを取得して、評価情報を算出し、前記印象情報記憶部に記憶された印象情報の中で、前記評価情報に近いコンテンツパッケージを特定し、前記パッケージ記憶部から、前記特定したコンテンツパッケージの生成変数を呼び出し、前記生成変数を用いて、コンテンツを生成する。
【発明の効果】
【0007】
本発明によれば、テキストに応じて、多様なコンテンツを生成することができる。
【図面の簡単な説明】
【0008】
図1】本実施形態のシステム概略図。
図2】本実施形態のハードウェア構成の説明図。
図3】本実施形態の情報記憶部の説明図であって、(a)はパッケージ記憶部、(b)は印象評定記憶部、(c)は形容語辞書記憶部、(d)は印象情報記憶部の説明図。
図4】本実施形態の辞書作成処理の処理手順の説明図。
図5】本実施形態で用いる情報の説明図であって、(a)は印象評定テーブル、(b)は印象評定情報、(c)は主成分分析の分析結果の説明図。
図6】本実施形態のマップの説明図であって、(a)は音パッケージマップ、(b)は形容語マップの説明図。
図7】本実施形態の処理手順の説明図であって、(a)は第1主成分の類義語の取得、(b)は第2主成分の類義語の取得の説明図。
図8】本実施形態の音再生処理の処理手順の説明図。
図9】本実施形態のテキスト分析処理の説明図。
図10】本実施形態の主成分の軸における位置に応じた音パッケージの特定処理の説明図。
図11】他の実施形態の分類処理、音再生処理の処理手順の説明図。
【発明を実施するための形態】
【0009】
以下、図1図10を用いて、コンテンツ生成システム、コンテンツ生成方法及びコンテンツ生成プログラムの一実施形態を説明する。本実施形態では、利用者が作成したテキストに基づいて、テキスト内容に応じたコンテンツを生成するサービスを提供する場合を想定する。本実施形態では、コンテンツとして音楽を生成するために自動作曲を行なう。この作曲においては、自動作曲に使用する複数の変数値を組み合わせた音パッケージ(コンテンツパッケージ)を用いて音楽を生成し、テキストに対して提供する。
このため、図1に示すように、ネットワークで接続されたユーザ端末10、支援装置20、自然言語処理サーバ30を用いる。
【0010】
(ハードウェア構成の説明)
図2を用いて、ユーザ端末10、支援装置20、自然言語処理サーバ30を構成する情報処理装置H10のハードウェア構成を説明する。情報処理装置H10は、通信装置H11、入力装置H12、表示装置H13、記憶部H14、プロセッサH15を備える。なお、このハードウェア構成は一例であり、他のハードウェアにより実現することも可能である。
【0011】
通信装置H11は、他の装置との間で通信経路を確立して、データの送受信を実行するインタフェースであり、例えばネットワークインタフェースや無線インタフェース等である。
【0012】
入力装置H12は、利用者等からの入力を受け付ける装置であり、例えばマウスやキーボード等である。表示装置H13は、各種情報を表示するディスプレイ等である。
記憶部H14は、ユーザ端末10、支援装置20、自然言語処理サーバ30の各種機能を実行するためのデータや各種プログラムを格納する記憶装置である。記憶部H14の一例としては、ROM、RAM、ハードディスク等がある。
【0013】
プロセッサH15は、記憶部H14に記憶されるプログラムやデータを用いて、ユーザ端末10、支援装置20、自然言語処理サーバ30における各処理を制御する。プロセッサH15の一例としては、例えばCPUやMPU等がある。このプロセッサH15は、ROM等に記憶されるプログラムをRAMに展開して、各サービスのための各種プロセスを実行する。
【0014】
プロセッサH15は、自身が実行するすべての処理についてソフトウェア処理を行なうものに限られない。例えば、プロセッサH15は、自身が実行する処理の少なくとも一部についてハードウェア処理を行なう専用のハードウェア回路(例えば、特定用途向け集積回路:ASIC)を備えてもよい。すなわち、プロセッサH15は、(1)コンピュータプログラム(ソフトウェア)に従って動作する1つ以上のプロセッサ、(2)各種処理のうち少なくとも一部の処理を実行する1つ以上の専用のハードウェア回路、或いは(3)それらの組み合わせ、を含む回路(circuitry)として構成し得る。プロセッサは、CPU並びに、RAM及びROM等のメモリを含み、メモリは、処理をCPUに実行させるように構成されたプログラムコード又は指令を格納している。メモリすなわちコンピュータ可読媒体は、汎用又は専用のコンピュータでアクセスできるあらゆる利用可能な媒体を含む。
【0015】
(システム構成)
次に、図1を用いて、ユーザ端末10、支援装置20、自然言語処理サーバ30のシステム構成を説明する。
【0016】
ユーザ端末10は、利用者が用いるコンピュータ端末である。本実施形態では、利用者には、音パッケージにより自動作曲された音楽の印象についてアンケートを行なう被験者と、自動作曲サービスの利用希望者とが含まれる。
【0017】
支援装置20は、テキストに応じて自動作曲を行ない、作曲した音楽を再生するためのコンピュータである。この支援装置20は、制御部21、パッケージ記憶部22、印象評定記憶部23、形容語辞書記憶部24、印象情報記憶部25を備える。
【0018】
制御部21は、制御手段(CPU、RAM、ROM等)を備え、後述する処理(学習段階、主成分分析段階、テキスト分析段階、コンテンツ生成段階等の各処理等)を行なう。そのためのコンテンツ生成プログラムを実行することにより、制御部21は、学習部211、主成分分析部212、テキスト分析部213、コンテンツ生成部214として機能する。
【0019】
学習部211は、各音パッケージを用いて作曲された音楽についての印象を学習する処理を実行する。
主成分分析部212は、各音パッケージの主要な印象を分析する処理を実行する。
テキスト分析部213は、サービス利用者のユーザ端末10から取得したテキストを分析し、テキストに付加する音楽を作曲するための音パッケージを特定する処理を実行する。
コンテンツ生成部214は、テキストに応じた音パッケージを用いた自動作曲を行なう処理を実行する。
【0020】
図3(a)に示すように、パッケージ記憶部22には、作曲を行なうために用いる変数値を組み合わせた音パッケージについてのパッケージ管理レコード220が記録される。このパッケージ管理レコード220は、サービスを提供する前に記録される。このパッケージ管理レコード220には、パッケージIDに対して、複数の変数に関するデータが記録される。
【0021】
パッケージIDデータ領域には、各音パッケージを特定するための識別子に関するデータが記録される。
変数データ領域には、この音パッケージにおいて作曲を行なう場合に用いる生成変数の変数値に関するデータが記録される。生成変数には、作曲を行なうために必要な要素(リズム、拍子、音階、音律、旋律等)を定める値を用いることができる。
【0022】
図3(b)に示すように、印象評定記憶部23には、音パッケージにより作曲された音楽について、各被験者の印象に関する印象評定管理レコード230が記録される。本実施形態では、被験者に対するアンケートにより、音楽の印象を取得した場合に記録される。印象評定管理レコード230には、被験者ID、パッケージID、形容語、評定値に関するデータが記録される。
【0023】
被験者IDデータ領域には、印象評定を行なった被験者を特定するための識別子に関するデータが記録される。
パッケージIDデータ領域には、各音パッケージを特定するための識別子に関するデータが記録される。
【0024】
形容語データ領域には、印象評定に用いる形容語に関するデータが記録される。
評定値データ領域には、音パッケージにより作曲された音楽の印象について、形容語が当てはまる割合(印象評定値)に関するデータが記録される。
【0025】
図3(c)に示すように、形容語辞書記憶部24には、音パッケージを表現する主成分の形容語の組み合わせについての形容語管理情報240が記録される。本実施形態では、二つの主成分を用いるため、第1形容語管理レコード241、第2形容語管理レコード242が記録される。この形容語管理情報240は、辞書作成処理を行なった場合に記録される。
【0026】
第1形容語管理レコード241には、形容語、重み付け値、類義語、相関値に関するデータが記録される。
形容語データ領域には、主成分分析により特定した第1主成分として用いられる形容語(第1形容語)に関するデータが記録される。本実施形態では、音楽の印象を形容するワードという意味で「形容語」を用いており、例えば形容詞を用いることができる。
【0027】
重み付け値データ領域には、この第1形容語について、第1主成分における重み付け値に関するデータが記録される。
類義語データ領域には、この第1形容語の類義語に関するデータが記録される。この類義語は、いわゆる共起分析により特定される。
【0028】
相関値データ領域には、第1形容語に対して、類義語の関連度に関するデータが記録される。本実施形態では、相関値として、共起分析における第1形容語と類義語との共起度を用いることができる。
【0029】
第2形容語管理レコード242には、形容語、重み付け値、類義語、相関値に関するデータが記録される。
形容語データ領域には、主成分分析により特定した第2主成分として用いられる形容語(第2形容語)に関するデータが記録される。本実施形態では、第2形容語として形容詞を用いる。
【0030】
重み付け値データ領域には、この第2形容語について、第2主成分における重み付け値に関するデータが記録される。
類義語データ領域には、この第2形容語の類義語に関するデータが記録される。この類義語は、いわゆる共起分析により特定される。
【0031】
相関値データ領域には、第2形容語に対して、類義語の関連度に関するデータが記録される。本実施形態では、相関値として、共起分析における第2形容語と類義語との共起度を用いることができる。
【0032】
図3(d)に示すように、印象情報記憶部25には、音パッケージにより作曲された音楽の印象についての印象管理レコード250が記録される。この印象管理レコード250は、辞書作成処理を行なった場合に記録される。印象管理レコード250には、パッケージID、第1主成分値、第2主成分値に関するデータが記録される。
【0033】
パッケージIDデータ領域には、各音パッケージを特定するための識別子に関するデータが記録される。
第1主成分値、第2主成分値の各データ領域には、それぞれ、各音パッケージを第1主成分、第2主成分で表した値に関するデータが記録される。
【0034】
自然言語処理サーバ30は、自然言語に関する情報を提供するコンピュータシステムである。本実施形態では、この自然言語処理サーバ30は、所定の単語について、類義語を特定する。そして、所定の単語と類義語との共起分析により算出された関連値を算出する。また、自然言語処理サーバ30は、2つの単語についての共起分析により算出された関連値を算出する。
【0035】
(辞書作成処理)
図4を用いて、辞書作成処理を説明する。ここでは、各被験者がユーザ端末10を用いて、支援装置20にアクセスする。複数の被験者に対して、音パッケージを用いて作曲した音楽を聴いてもらい、印象についてのアンケートを行なう。
【0036】
このため、被験者毎に、音パッケージ毎に、以下の処理を繰り返す。
まず、支援装置20の制御部21は、音パッケージにより音生成処理を実行する(ステップS1-1)。具体的には、制御部21の学習部211は、処理対象の音パッケージの変数値をコンテンツ生成部214に提供する。この場合、コンテンツ生成部214は、音パッケージの変数値を用いて作曲を行なう。ここでは、同じ音パッケージの変数値を用いた場合にも、他の要素の変数値の任意性により異なる楽曲が生成される。そして、学習部211は、作曲された音楽をユーザ端末10において再生する。
【0037】
次に、支援装置20の制御部21は、印象評定情報の取得処理を実行する(ステップS1-2)。具体的には、制御部21の学習部211は、音楽の印象を取得するためのアンケートのために、印象評定テーブルを含めた画面をユーザ端末10に出力する。
【0038】
図5(a)に示すように、この印象評定テーブル500には、相反する形容語(形容詞)を組み合わせた複数の形容語対において、音楽の印象を複数段階で評価する入力欄が設けられている。例えば、「暗い感じ」と「明るい感じ」の間で、中央値(図5(a)では「0」)を含めた7段階の入力欄で、音楽の印象として何れに近いかを表した割合(印象評定値)を選ぶことができる。なお、音楽の印象を特定できるものであれば、中央値や7段階には限定されない。音楽を聴いた被験者は、ユーザ端末10に出力された印象評定テーブル500に印象として印象評定値を入力する。この場合、学習部211は、入力された印象評定値をアンケート回答として取得する。
【0039】
この場合、図5(b)について、各被験者のアンケート回答510により、パッケージID(Pack)毎の印象評定値を取得する。そして、被験者IDを記録した印象評定管理レコード230を生成し、印象評定記憶部23に記録する。
そして、各被験者について、上記処理を各音パッケージについて繰り返す。
【0040】
次に、支援装置20の制御部21は、主成分分析処理を実行する(ステップS1-3)。具体的には、制御部21の学習部211は、印象評定管理レコード230の評定値の主成分分析を行なうことにより、各音パッケージにより作曲された音楽の印象の分散を表わす成分をプロットする主成分軸を作り直す。この場合、主成分分析により、各音パッケージを表現する複数の形容語(変数)と、各形容語の重み付け値を算出する。
【0041】
具体的には、図5(c)を用いて、この主成分分析処理を説明する。
図5(c)に示すように、主成分分析により分析結果520を取得する。この分析結果520では、各音パッケージの識別に有効な新軸(1~m)について、各形容語(1~n)の重み付け値(重み11~重みmn)が算出される。更に、各新軸における各音パッケージの識別に対する寄与率(c1~cm)が算出される。
【0042】
次に、学習部211は、主成分軸の累積寄与率により軸数を決定する。ここでは、主成分分析により算出される各主成分軸の寄与率を高い順番に加算し、累積寄与率を算出する。そして、累積寄与率が基準値(例えば、0.8)を超えたときの主成分軸を、評価に用いる新軸として特定する。本実施形態では、新軸として、第1主成分、第2主成分の2軸(新軸1、新軸2)を特定した場合を想定する。
【0043】
次に、支援装置20の制御部21は、マッピング処理を実行する(ステップS1-4)。具体的には、制御部21の学習部211は、新軸1(第1主成分)、新軸2(第2主成分)を用いて、各音パッケージの第1主成分値、第2主成分値を算出する。そして、学習部211は、パッケージID、第1主成分値、第2主成分値を記録した印象管理レコード250を生成し、印象情報記憶部25に記録する。
【0044】
ここで、図6(a)を用いて、新軸1(第1主成分)、新軸2(第2主成分)において、各音パッケージの主成分値を用いたマッピングを説明する。新軸1、新軸2の音パッケージマップ530において、座標(第1主成分値、第2主成分値)に、各音パッケージが配置される。音パッケージマップ530では、丸数字で各音パッケージのパッケージIDを示している。
【0045】
次に、支援装置20の制御部21は、第1、第2主成分の形容語群の抽出処理を実行する(ステップS1-5)。具体的には、制御部21の学習部211は、主成分分析の分析結果520において、各形容語の第1主成分、第2主成分における重み付け値を特定する。そして、学習部211は、重み付け値の絶対値が、予め定められた閾値以上の形容語を特定して形容語群を生成する。
【0046】
この場合、図6(b)に示すように、新軸1、新軸2の重み付け値を二軸とする形容語マップ540において、座標(新軸1の重み付け値、新軸2の重み付け値)に、各形容語が配置される。例えば、図5(c)を参照すると、「形容語1」の新軸1の重み付け値は「重み11」であり、新軸2の重み付け値は「重み21」であるため、形容語マップ540において、「形容語1」は、座標(重み11、重み21)に配置される。
【0047】
次に、支援装置20の制御部21は、形容語群の類義語辞書の抽出処理を実行する(ステップS1-6)。具体的には、制御部21の学習部211は、自然言語処理サーバ30から、各主成分における形容語の類義語を取得する。
【0048】
例えば、図7(a)に示すように、第1主成分の形容語群(1、2、7)に対して、それぞれ類義語(1A~1C)、類義語(2A、2B)、類義語(7A~7D)を取得する。
【0049】
また、図7(b)に示すように、第2主成分の形容語群(3、5、10)に対して、それぞれ類義語(3A~3C)、類義語(5A、5B)、類義語(10A、10B)を取得する。
【0050】
更に、学習部211は、自然言語処理サーバ30から、各形容語に対する各類義語の関連値を取得する。
そして、学習部211は、第1主成分、第2主成分の各形容語に対して、重み付け値、類義語、関連値をそれぞれ記録した第1形容語管理レコード241、第2形容語管理レコード242を生成し、形容語辞書記憶部24に記録する。
【0051】
(音再生処理)
次に、図8を用いて、音再生処理を説明する。テキストに対して音楽の付加を希望するサービス利用者は、ユーザ端末10を用いて、支援装置20にアクセスする。
【0052】
まず、支援装置20の制御部21は、テキスト取得処理を実行する(ステップS2-1)。具体的には、制御部21のテキスト分析部213は、ユーザ端末10にテキスト入力画面を出力する。そして、サービス利用者は、テキスト入力画面に、所望のテキストを入力する。次に、テキスト分析部213は、ユーザ端末10から音楽を付加する対象テキストを取得する。そして、テキスト分析部213は、取得したテキストに含まれる単語(表現要素)を抽出する。
【0053】
次に、支援装置20の制御部21は、テキスト分析処理を実行する(ステップS2-2)。具体的には、制御部21のテキスト分析部213は、形容語辞書記憶部24に記録された形容語、類義語と抽出語との関連性の評価値を算出する。
【0054】
図9を用いて、第1主成分についての処理を説明する、ここでは、テキスト分析部213は、形容語辞書記憶部24から、形容語(1、3、7)に対する重み付け値(重み11、重み31、重み71)を取得する。更に、テキスト分析部213は、形容語辞書記憶部24から、形容語に対する類義語及び相関値(第1相関値)を取得する。なお、この場合、各形容語の類義語は、形容語と同じ重み付け値を用いる。次に、テキスト分析部213は、抽出した各単語(抽出語)と形容語辞書記憶部24に記録された形容語、類義語との相関値(評価情報としての第2相関値)を、自然言語処理サーバ30から取得する。
【0055】
そして、テキスト分析部213は、各形容語、類義語について、重み付け値、第1相関値、第2相関値を所定の評価関数に代入して、評価値を算出する。例えば、評価値として、重み付け値、第1相関値、重み付け値の乗算値を用いることができる。
【0056】
そして、テキスト分析部213は、各形容語、類義語の評価値を用いて、第1主成分における第1評価値を算出する。例えば、各形容語、類義語の評価値の中で、最も高い値を第1評価値として算出する。同様に、第2主成分についても、第2評価値を算出する。
【0057】
次に、支援装置20の制御部21は、音パッケージの特定処理を実行する(ステップS2-3)。具体的には、制御部21のテキスト分析部213は、第1評価値及び第2評価値を用いて、主成分の軸における位置に応じて近い音パッケージを特定する。
【0058】
図10に示すように、音パッケージマップ530において、座標(第1評価値、第2評価値)により、位置531を特定する。そして、テキスト分析部213は、位置531に最も近い座標のパッケージIDを特定する。
【0059】
次に、支援装置20の制御部21は、音パッケージにより音生成処理を実行する(ステップS2-4)。具体的には、制御部21のテキスト分析部213は、特定したパッケージIDの変数値を、パッケージ記憶部22から取得する。次に、コンテンツ生成部214は、取得した変数値を用いて作曲を行なう。そして、コンテンツ生成部214は、作曲した音楽をユーザ端末10において再生する。
【0060】
以上、本実施形態によれば、以下のような効果を得ることができる。
(1)本実施形態によれば、音パッケージにより音生成処理(ステップS1-1)、印象評定情報の取得処理(ステップS1-2)を実行する。これにより、音パッケージにより作曲された音楽について、各被験者の印象を取得することができる。
【0061】
(2)本実施形態によれば、支援装置20の制御部21は、主成分分析処理を実行する(ステップS1-3)。これにより、音パッケージにより作曲された音楽を表現する主要な印象に関する情報を取得することができる。
【0062】
(3)本実施形態によれば、支援装置20の制御部21は、第1、第2主成分の形容語群の抽出処理(ステップS1-5)、形容語群の類義語辞書の抽出処理(ステップS1-6)を実行する。これにより、形容語や類義語により、被験者の印象を代表する表現要素を特定することができる。
【0063】
(4)本実施形態によれば、支援装置20の制御部21は、テキスト取得処理(ステップS2-1)、テキスト分析処理(ステップS2-2)を実行する。これにより、テキストに付加するコンテンツを作成するための表現要素を特定することができる。
【0064】
(5)本実施形態によれば、支援装置20の制御部21は、音パッケージの特定処理(ステップS2-3)、音パッケージにより音生成処理(ステップS2-4)を実行する。これにより、テキストに含まれる表現要素と印象が関連する作曲を行なうことができる。この場合、テキストに対して、所定の要素(生成変数)の変数値を用いて作曲が行なわれるので、予め音楽が準備されている場合と異なり、他の要素の変数値の任意性により多様なコンテンツを提供することができる。
【0065】
本実施形態は、以下のように変更して実施することができる。本実施形態及び以下の変更例は、技術的に矛盾しない範囲で互いに組み合わせて実施することができる。
・上記実施形態では、コンテンツとしての音楽を生成するために自動作曲を行なう。コンテンツは、聴覚に訴える音楽に限定されるものではなく、人間の五感に訴えることができるコンテンツであればよい。例えば、テキストに付加する画像(視覚)や香り(嗅覚)、手触り(触覚)、味(味覚)等を生成してもよい。
【0066】
・上記実施形態では、ネットワークで接続されたユーザ端末10、支援装置20、自然言語処理サーバ30を用いる。ハードウェア構成はこれに限定されるものではない。例えば、類義語辞書を支援装置20内に設けてもよい。
【0067】
・上記実施形態では、支援装置20の制御部21は、主成分分析処理を実行する(ステップS1-3)。各パッケージの印象を特定することができれば、分析方法は主成分分析に限定されるものではない。例えば、因子分析を用いてもよい。また、形容語や類義語を入力として、各パッケージの確からしさを予測するモデルを、機械学習により作成するようにしてもよい。
【0068】
・上記実施形態では、類義語の特定や相関値の算出において、共起分析を用いるが、分析方法は、これに限定されるものではない。
・上記実施形態では、支援装置20の制御部21は、マッピング処理を実行する(ステップS1-4)。ここでは、第1主成分、第2主成分を用いるが、主成分の軸数は「2」に限定されるものではない。
【0069】
・上記実施形態では、支援装置20の制御部21は、テキスト分析処理を実行する(ステップS2-2)。ここでは、評価値として、重み付け値、第1相関値、重み付け値の乗算値を用いる。評価値の算出方法は乗算に限定されるものではなく、各音パッケージを代表する表現要素と抽出語との関連性を算出できる方法であればよい。
【0070】
また、テキスト分析部213は、各形容語、類義語の評価値を用いて、第1主成分における第1評価値を算出する。この場合、上記実施形態では、各形容語、類義語の評価値の中で、最も高い値を第1評価値として算出する。同様に、第2主成分についても、第2評価値を算出する。ここで、第1評価値や第2評価値の決定方法は、所定の関数を用いる等、テキストに含まれる表現について、各種主成分に対応する値を取得できればよい。
【0071】
・上記実施形態では、支援装置20の制御部21は、音パッケージの特定処理(ステップS2-3)、音パッケージにより音生成処理(ステップS2-4)を実行する。ここで、サービス利用時の状況に応じた変数値を用いて、作曲を行なうようにしてもよい。この場合には、辞書作成処理において、被験者がアンケート回答を行なったときの状況情報(例えば、時間帯、季節等)を含めて主成分分析を行なう。
【0072】
・上記実施形態では、支援装置20の制御部21は、テキスト取得処理を実行する(ステップS2-1)。ここで、支援装置20の制御部21は、ユーザ端末10から対象テキストを取得する。テキストの取得方法は、これに限定されるものではない。例えば、支援装置20の制御部21やユーザ端末10において、サービス利用者の音声を集音し、音声認識により対象テキストを生成してもよい。
【0073】
・上記実施形態では、利用者が作成したテキストに基づいて、テキスト内容に応じた音楽を生成する。これに代えて、新たに取得した音楽に形容語を付加するようにしてもよい。この場合には、支援装置20に、形容語を付加する音楽(新規取得音楽)を入力する。この場合、制御部21は、新規取得音楽の音楽要素(リズム、拍子、音階、音律、旋律等)を特定する。そして、制御部21は、新規取得音楽の音楽要素と、音パッケージの音楽要素とを比較して、新規取得音楽に、各音楽要素の統計値が近い音パッケージを特定する。次に、制御部21は、音楽要素が近い音パッケージの第1主成分値、第2主成分値を用いて、形容語マップ540において、形容語を特定する。これにより、新規取得音楽に対して形容語を付与することができる。
【0074】
・上記実施形態では、支援装置20の制御部21は、テキスト取得処理(ステップS2-1)、テキスト分析処理(ステップS2-2)、音パッケージの特定処理(ステップS2-3)を実行する。ここでは、制御部21のテキスト分析部213は、テキスト分析処理により算出した座標(第1評価値、第2評価値)を用いて、新軸の座標空間内で位置が近い音パッケージを特定する。ここで、一つの音パッケージを特定するのではなく、複数の音パッケージを特定し、その中でユーザが選択できるようにしてもよい。この場合には、支援装置20の制御部21は、音パッケージを、新軸の座標空間内で予めクラスタリングしておく。更に、クラスタ毎に、クラスタの代表点(例えば、重心)を特定しておく。そして、制御部21は、音パッケージの特定処理(ステップS2-3)において、座標(第1評価値、第2評価値)に対応するクラスタを特定する。ここでは、座標(第1評価値、第2評価値)と各クラスタの代表点との距離を計算し、評価値との距離が最も近い代表点を特定し、この代表点のクラスタを特定する。
【0075】
次に、制御部21は、特定したクラスタに含まれる音パッケージを選択候補として、ユーザ端末10に出力する。そして、ユーザ端末10において音パッケージ候補が選択された場合、支援装置20の制御部21は、ステップS1-1と同様に、音パッケージにより音生成処理を実行する。
【0076】
また、テキスト分析処理により算出した座標(第1評価値、第2評価値)と各クラスタの代表点との距離が閾値以上の場合には、音パッケージのクラスタから外れていると判定してもよい。また、複数のクラスタの代表点からの距離が所定範囲内で等しい場合には、クラスタのほぼ間の境界に位置すると判定してもよい。このような場合には、評価値に、所定閾値内で近い点群に相応する音生成パッケージをユーザに対する選択候補として特定してもよい。
また、クラスタリング時に、すべての音生成パッケージがいずれかのクラスタに属するようなクラスタリング手法の他に、いずれかのクラスタに属さない音生成パッケージを許容するクラスタリング手法もある。後者のクラスタリング手法において、座標(第1評価値、第2評価値)が各クラスタの代表点よりも、クラスタに属さない音生成パッケージに近い場合には、この音生成パッケージを推薦するようにしてもよい。
【0077】
・上記実施形態では、支援装置20の制御部21は、テキスト取得処理(ステップS2-1)、テキスト分析処理(ステップS2-2)、音パッケージの特定処理(ステップS2-3)を実行する。ここで、テキストの内容に応じて文章種類を分類し、この分類に応じてコンテンツを選択して、音再生処理を実行するようにしてもよい。文章種類としては、例えば、ニュース、小説、昔話、ネット記事等の分類を用いる。また、文章種類として、文章が取り扱っている事物(エンティティ)や属性(アトリビュート)、或いは文章に含まれる複数の名詞群から想起される主題(トピック)を用いてもよい。更に、各文章が取り扱っている事物、属性、主題の少なくとも一つを機械学習によって判定するようにしてもよい。
【0078】
図11を用いて、分類処理及び音再生処理を説明する。ここでは、制御部21に、機械学習により、テキストから文章種類を予測する文章種類予測モデルを作成する学習部を設ける。更に、文章種類に応じて音パッケージを特定するためのパッケージ種類テーブルを準備しておく。このパッケージ種類テーブルでは、適用可能な文章種類を、音パッケージの各パッケージIDに関連付けて記録してもよいし、音パッケージのクラスタに関連付けて記録してもよい。
まず、分類処理において、支援装置20の制御部21は、教師情報の取得処理を実行する(ステップS3-1)。具体的には、制御部21の学習部は、テキストに対して文章種類を関連付けた教師情報を取得する。この文章種類は、人手により設定してもよいし、テキストを取得したリソース(出典)を用いて設定してもよい。
【0079】
そして、支援装置20の制御部21は、文章種類予測モデルの生成処理を実行する(ステップS3-2)。具体的には、制御部21の学習部は、機械学習により、テキストから文章種類を予測する文章種類予測モデル(文章種類予測情報)を生成する。
次に、音再生処理において、支援装置20の制御部21は、ステップS2-1と同様に、テキスト取得処理を実行する(ステップS4-1)。
次に、支援装置20の制御部21は、文章種類の予測処理を実行する(ステップS4-2)。具体的には、制御部21のテキスト分析部213は、取得したテキストを、文章種類予測モデルに入力して文章種類を予測する。
次に、支援装置20の制御部21は、ステップS2-2と同様に、テキスト分析処理を実行する(ステップS4-3)。
次に、支援装置20の制御部21は、利用可能な音パッケージ候補の特定処理を実行する(ステップS4-4)。具体的には、制御部21のテキスト分析部213は、パッケージ種類テーブルを用いて、予測した文章種類に対応した音パッケージ候補を特定する。
次に、支援装置20の制御部21は、ステップS2-3と同様に、音パッケージの特定処理を実行する(ステップS4-5)。ここでは、制御部21のテキスト分析部213は、パッケージ種類テーブルを用いて特定した音パッケージ候補において、第1評価値及び第2評価値を用いて、主成分の軸における位置に応じて近い音パッケージを特定する。
【0080】
そして、支援装置20の制御部21は、ステップS2-4と同様に、音パッケージにより音生成処理を実行する(ステップS4-6)。
異なるテキストに同じ形容語が用いられている場合にも、文章種類によって、形容語の使われ方が異なる場合があるが、文章種類に応じて適切な音パッケージを特定することができる。
【0081】
また、文章種類に応じて音パッケージを特定するためのパッケージ種類テーブルを、機械学習により作成してもよい。この場合には、音パッケージに文章種類を関連付けた教師情報を準備する。そして、支援装置20の制御部21は、教師情報の音パッケージの変数値から、適用可能な文章種類を予測するための音パッケージ分類モデルを、機械学習により生成する。そして、制御部21は、まだ分類されていない音パッケージの変数値を、音パッケージ分類モデルに入力し、適用可能な文章種類を予測して、パッケージ種類テーブルを作成する。
また、支援装置20の制御部21が、入力された文章を各文に分割し、文毎に、文の事物、属性、主題等に応じた音生成パッケージを推定するようにしてもよい。この場合には、各文の事物、属性、主題等に応じた音生成パッケージやクラスタを特定して、文章全体に対して推薦する音生成パッケージやクラスタをまとめて出力してもよい。
【0082】
・上記実施形態では、支援装置20の制御部21は、音パッケージにより音生成処理を実行する(ステップS2-4)。ここで、更に、ステップS2-3において特定した音パッケージに対するフィードバックを、ユーザから取得するようにしてもよい。この場合、テキストに基づいて推薦した音パッケージに対するユーザからの反応(例えば、好き、嫌い、無反応等)を取得して、各評価値、パッケージIDに関連付けて教師データとして蓄積する。そして、支援装置20の制御部21は、機械学習によって、ユーザからの反応を予測する反応予測モデルを生成する。新たなテキストを取得した場合、支援装置20の制御部21は、反応予測モデルを用いて、好反応を予測した音パッケージを特定して推薦する。
更に、この場合、支援装置20の制御部21が、テキストから文章種類、事物、属性、主題を特徴量として算出し、音パッケージ毎のユーザの反応と組み合わせて機械学習を行なうようにしてもよい。そして、支援装置20の制御部21は、反応予測モデルを用いて、文章種類、事物、属性、主題に応じて、好反応を予測した音パッケージを特定して推薦する。
【符号の説明】
【0083】
10…ユーザ端末、20…支援装置、21…制御部、211…学習部、212…主成分分析部、213…テキスト分析部、214…コンテンツ生成部、22…パッケージ記憶部、23…印象評定記憶部、24…形容語辞書記憶部、25…印象情報記憶部、30…自然言語処理サーバ
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11