IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ジールの特許一覧

<>
  • 特開-文章の分析装置 図1
  • 特開-文章の分析装置 図2
  • 特開-文章の分析装置 図3
  • 特開-文章の分析装置 図4
  • 特開-文章の分析装置 図5
  • 特開-文章の分析装置 図6
  • 特開-文章の分析装置 図7
  • 特開-文章の分析装置 図8
  • 特開-文章の分析装置 図9
  • 特開-文章の分析装置 図10
  • 特開-文章の分析装置 図11
  • 特開-文章の分析装置 図12
  • 特開-文章の分析装置 図13
  • 特開-文章の分析装置 図14
  • 特開-文章の分析装置 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024140928
(43)【公開日】2024-10-10
(54)【発明の名称】文章の分析装置
(51)【国際特許分類】
   G06F 40/279 20200101AFI20241003BHJP
   G06F 40/216 20200101ALI20241003BHJP
【FI】
G06F40/279
G06F40/216
【審査請求】有
【請求項の数】4
【出願形態】OL
(21)【出願番号】P 2023052301
(22)【出願日】2023-03-28
(11)【特許番号】
(45)【特許公報発行日】2023-10-25
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.JAVASCRIPT
(71)【出願人】
【識別番号】313002982
【氏名又は名称】株式会社ジール
(74)【代理人】
【識別番号】100185270
【弁理士】
【氏名又は名称】原田 貴史
(72)【発明者】
【氏名】川合 雅寛
(72)【発明者】
【氏名】奥出 泰葉
(57)【要約】
【課題】文章の特徴を容易に把握可能な分析結果を提供可能とすること。
【解決手段】本発明の分析装置1は、文章を取得可能な文章取得部111と、文章を複数の解析単位に分割可能な文章分割部112と、文章における解析単位ごとの感情ベクトルの推移を生成可能な感情ベクトル生成部113と、感情ベクトルの推移に対する評価を生成可能な評価生成部114と、評価の表示を指令可能な表示指令部118と、文章及び解析単位に基づく推移の生成を機械学習可能な第1機械学習部119と、を備え、感情ベクトルは、複数種類の感情の強さそれぞれを元とするベクトルであり、感情ベクトル生成部113は、文章と解析単位と第1機械学習部119による機械学習とに基づいて推移を生成可能であり、評価生成部114は、少なくとも、感情ベクトルのノルムと該ノルムの移動平均との相関に関する相関評価を生成可能である。
【選択図】図1

【特許請求の範囲】
【請求項1】
文章を取得可能な文章取得部と、
前記文章を複数の解析単位に分割可能な文章分割部と、
前記文章における前記解析単位毎の感情ベクトルの推移を生成可能な感情ベクトル生成部と、
前記感情ベクトルの推移に対する評価を生成可能な評価生成部と、
前記評価の表示を指令可能な表示指令部と、
前記文章及び前記解析単位に基づく前記感情ベクトルの生成を機械学習可能な第1機械学習部と、
を備え、
前記感情ベクトルは、複数種類の感情の強さそれぞれを元とするベクトルであり、
前記感情ベクトル生成部は、前記文章と前記解析単位と前記第1機械学習部による機械学習とに基づいて前記感情ベクトルの推移を生成可能であり、
前記評価生成部は、少なくとも、前記感情ベクトルのノルムと前記ノルムの移動平均との相関に関する相関評価を生成可能である、
文章の分析装置。
【請求項2】
前記文章の要約を生成可能な要約生成部と、
前記文章及び前記解析単位に基づく前記要約の生成を機械学習可能な第2機械学習部と、
をさらに備え、
前記要約生成部は、前記文章と前記第2機械学習部による機械学習とに基づいて前記要約を生成可能であり、
前記表示指令部は、前記要約の表示をさらに指令可能である、
請求項1に記載の分析装置。
【請求項3】
前記文章の登場人物の登場人物情報を取得可能な登場人物情報取得部と、
前記登場人物情報に基づいて前記登場人物の画像を生成可能な画像生成部と、
前記登場人物情報に基づく前記画像の生成を機械学習可能な第3機械学習部と、
をさらに備え、
前記画像生成部は、前記第3機械学習部による機械学習に基づいて前記画像を生成可能であり、
前記表示指令部は、前記画像の表示をさらに指令可能である、
請求項1に記載の分析装置。
【請求項4】
前記文章取得部は、画像を含む文章を取得可能であり、
前記文章分割部は、画像を含まない解析単位及び画像からなる解析単位からなる複数の解析単位に前記画像を含む文章を分割可能であり、
前記感情ベクトル生成部は、
前記画像を含まない解析単位について、前記第1機械学習部による機械学習に基づいて前記感情ベクトルの推移を生成可能であり、
前記画像からなる解析単位について、画像に基づく感情ベクトルの生成に係る所定の機械学習に基づいて前記感情ベクトルの推移を生成可能である、
請求項1に記載の分析装置。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文章の分析装置に関する。
【背景技術】
【0002】
文章を分析する要望がある。分析対象となる文章は、例えば、脚本、小説、論説文、エッセイ、ブログ等である。文章の分析に関し、物語性を有する文章等では、文章を読んだ場合に引き起こされる感情を分析する要望がある。感情の分析は、文章の特徴を把握する際に役立つのみならず、文章の要約、文章の登場人物の視覚的表現の生成等に活用され得る。
【0003】
文章の内容を分析することに関し、特許文献1は、文章の入力を受け付ける入力部と、前記文章を複数のシーンに分割する分割部と、前記シーン毎に複数の個別感情値を算出する第1算出部と、前記複数の個別感情値に基づいて、前記シーンの代表感情値を算出する第2算出部と、前記代表感情値のグラフを表示する表示部と、を備える文章解析装置を開示している。特許文献1の技術は、文章全体を通して感情的な盛り上がりを解析する技術を提供できる。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2022-26278号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、文章の分析では、文章の特徴を容易に把握したいとの要望がある。特許文献1の技術は、代表感情値のグラフを表示するにとどまる。そのため、ユーザは、該グラフを読み解く能力を求められる。よって、特許文献1の技術は、文章の特徴を容易に把握する点において、さらなる改良の余地がある。
【0006】
本発明の目的は、文章の特徴を容易に把握可能な分析結果を提供可能とすることである。
【課題を解決するための手段】
【0007】
本発明者らは、上記課題を解決するために鋭意検討した結果、感情ベクトルのノルムと該ノルムの移動平均との相関に関する相関評価を表示すること等によって、上記の目的を達成できることを見出した。そして、本発明者らは、本発明を完成させるに至った。具体的に、本発明は以下のものを提供する。
【0008】
第1の特徴に係る発明は、文章を取得可能な文章取得部と、前記文章を複数の解析単位に分割可能な文章分割部と、前記文章における前記解析単位毎の感情ベクトルの推移を生成可能な感情ベクトル生成部と、前記感情ベクトルの推移に対する評価を生成可能な評価生成部と、前記評価の表示を指令可能な表示指令部と、前記文章及び前記解析単位に基づく前記感情ベクトルの生成を機械学習可能な第1機械学習部と、を備え、前記感情ベクトルは、複数種類の感情の強さそれぞれを元とするベクトルであり、前記感情ベクトル生成部は、前記文章と前記解析単位と前記第1機械学習部による機械学習とに基づいて前記感情ベクトルの推移を生成可能であり、前記評価生成部は、少なくとも、前記感情ベクトルのノルムと前記ノルムの移動平均との相関に関する相関評価を生成可能である、文章の分析装置を提供する。
【0009】
第1の特徴に係る発明は、取得した文章を複数の解析単位に分割し、解析単位ごとの感情ベクトルの推移を機械学習に基づいて生成できる。すなわち、第1の特徴に係る発明は、取得した文章において、複数種類の感情値が解析単位ごとにどのように変化するかの推移を機械学習に基づく客観的なアルゴリズムによって生成できる。
【0010】
しかしながら、このような推移をグラフ等として表示する場合、利用者は、表示されたグラフ等を読み解くことへの習熟を求められる。本発明者らは、鋭意検討した結果、感情ベクトルのノルムと該ノルムの移動平均との相関に関する相関評価を用いることにより、文章の特徴をよりいっそう容易に把握可能とする表示を行えることを見出した。
【0011】
ノルムは、ベクトルの「長さ」の概念を一般化したものである。よって、感情ベクトルのノルムは、対応する解析単位における総合的な感情の強さに対応する。一方、感情ベクトルのノルムの移動平均は、対応する解析単位だけでなく、その周辺の解析単位をも含めた部分における総合的な感情の強さに対応する。
【0012】
そのため、総合的な感情の強さがあまり変化せず感情の強さも小さい部分、及び、総合的な感情の強さが急激に変化して感情の強さが大きい部分のそれぞれでは、該ノルムと該移動平均との相関は、大きくなる。一方、総合的な感情の強さがあまり変化しないが感情の強さが大きい部分、及び、総合的な感情の強さが急激に変化するが感情の強さが小さい部分のそれぞれでは、該ノルムと該移動平均との相関は、小さくなる。よって、該相関を用いれば、文章において、総合的な感情の強さが急激に変化して強くなる盛り上がりどころがいずれの解析単位に対応するかを評価できる。
【0013】
第1の特徴に係る発明は、感情ベクトルのノルムとノルムの移動平均との相関に関する相関評価を生成し、表示可能である。よって、第1の特徴に係る発明は、文章における盛り上がりどころに関する分析結果を表示できる。よって、利用者は、文章の特徴をよりいっそう容易に把握できる。
【発明の効果】
【0014】
本発明は、文章の特徴を容易に把握可能な分析結果を提供できる。
【図面の簡単な説明】
【0015】
図1図1は、本実施形態の分析システムSのハードウェア構成及びソフトウェア構成を示すブロック図である。
図2図2は、文章リスト131の一例である。
図3図3は、解析単位リスト132の一例である。
図4図4は、登場人物リスト133の一例である。
図5図5は、本実施形態の分析処理の好ましい流れの一例を示すメインフローチャートである。
図6図6は、図5に続く図である。
図7図7は、図6に続く図である。
図8図8は、本実施形態の分析装置1による分析結果の一例である。
図9図9は、変形例について、サーバ群である分析装置1で実行される分析処理の好ましい流れの一例を示すフローチャートである。
図10図10は、図9に続く図である。
図11図11は、変形例2について、サーバ群である分析装置1で実行される分析処理の好ましい流れの別の例を示すフローチャートである。
図12図12は、図11のステップS122で実行される解析単位生成処理のフローチャートである。
図13図13は、図12に続く図である。
図14図12は、図11のステップS125で実行される推論結果補正処理のフローチャートである。
図15図15は、図14に続く図である。
【発明を実施するための形態】
【0016】
以下は、本発明の実施形態の一例について、図面を参照しながら詳細に説明するものである。
【0017】
<分析システムS>
図1は、本実施形態の分析システムSのハードウェア構成及びソフトウェア構成を示すブロック図である。以下は、図1を用いた、本実施形態の分析システムSの好ましい態様の一例の説明である。
【0018】
〔分析装置1〕
分析装置1は、文章の内容を分析する装置である。分析装置1は、制御部11、記憶部13、通信部14等を備える。分析装置1は、パーソナルコンピュータ等の端末、1つのサーバ、複数のサーバを含むサーバ群等の各種態様でよい。
【0019】
サーバ群は、例えば、サーバ間の負荷を調整するロードバランサ、UI等を提供するフロントサーバ、分析処理に用いられる各種ソフトウェア構成要素のAPIを提供するAPIサーバ、及び文章分割部112が行う処理等の文章の前処理を行うテキスト前処理サーバ等の通常サーバ、感情ベクトル生成部113等を実現する推論サーバ(文章用推論サーバ)、並びに第1機械学習部119等を実現する学習サーバ(文章用学習サーバ)等の1以上を含んで構成される。
【0020】
[制御部11]
制御部11は、CPU(Central Processing Unit)、RAM(Random Access Memory)、及びROM(Read Only Memory)等を備える。
【0021】
制御部11は、必要に応じて記憶部13及び/又は通信部14等と協働する。そして、制御部11は、分析装置1で実行される本実施形態のプログラムのソフトウェア構成要素である、文章取得部111、文章分割部112、感情ベクトル生成部113、評価生成部114、要約生成部115、登場人物情報取得部116、画像生成部117、表示指令部118、第1機械学習部119、第2機械学習部120、第3機械学習部121等を実現する。本実施形態のプログラムのソフトウェア構成要素それぞれが提供する機能は、後述する分析処理の好ましい流れの説明において示される。
【0022】
[記憶部13]
記憶部13は、データ及び/又はファイルが記憶される装置であって、ハードディスク、半導体メモリ、記録媒体、及びメモリカード等の1以上を用いて構成されたデータのストレージ部を有する。
【0023】
記憶部13は、ネットワークNを介してNAS、SAN、クラウドストレージ、ファイルサーバ及び/又は分散ファイルシステム等の記憶装置又は記憶システムとの接続を可能にする仕組みを有してもよい。NASは、Network Attached Storageの略語である。SANは、Storage Area Networkの略語である。
【0024】
記憶部13には、マイクロコンピューターで実行されるプログラム、文章リスト131、解析単位リスト132、登場人物リスト133、第1機械学習部119の機械学習データ(第1機械学習データ)、第2機械学習部120の機械学習データ(第2機械学習データ)、第3機械学習部121の機械学習データ(第3機械学習データ)等が記憶されている。
【0025】
記憶部13は、文章の定義情報が格納されるリレーショナルデータベースを含むことが好ましい。文章リスト131は、独立したストレージに格納されることが好ましい。解析単位リスト132は、独立したデータストアに格納されることが好ましい。
【0026】
(文章リスト131)
文章リスト131には、分析装置1の分析対象となる文章及び該文章に関連する各種情報が格納される。格納される文章は、特に限定されない。該文章は、例えば、脚本、プロット、対談、小説、エッセイ、ブログ、議事録、報告書、論説文等でよい。各種情報のフォーマットは、特に限定されない。該フォーマットは、例えば、テキスト形式、json(JavaScript Object Notation)形式等でよい。
【0027】
文章は、文章の定義情報と関連付けられて格納されることが好ましい。定義情報は、文章の表題、作者、発行日、様式等によって例示される、文章本体に付随する各種情報の1以上を含む文章に関する情報である。様式は、例えば、脚本、プロット、対談、小説、エッセイ、ブログ、議事録、報告書、論説文等によって例示される文章の各種様式である。
【0028】
文章は、文章の分析結果と関連付けられて格納されることが好ましい。分析結果は、評価生成部114によって生成された評価、要約生成部115によって生成された要約等を含む。これにより、分析結果の再利用が可能となる。
【0029】
文章は、文章を識別可能な文章IDと関連付けられて格納されることが好ましい。これにより、分析装置1は、文章IDを用いて関連付けられた文章を利用できる。
【0030】
図2は、文章リスト131の一例である。図2に示す例では、文章ID「T0001」で識別される文章が格納されている。該文章は、該文章の定義情報及び分析結果と関連付けられて格納されている。
【0031】
図2に示す例では、該文章は、「△△グループの決算発表(注意1)を見ながら・・・」との書き出しを有し、「・・・我こそは、と思う方は是非ご一報ください。」と締めくくられている。
【0032】
図2に示す例では、該定義情報は、表題「△△の市場とは?」、発行日「2021年7月28日」、様式「ブログ」等の文章本体に付随する各種情報を含む。
【0033】
図2に示す例では、該分析結果は、該文章がオイディプス型に近いグラフ相関を有する等の評価を含んでいる。
【0034】
図2に示す例に上述の定義情報、分析結果と関連付けられた文章が格納されることにより、分析装置1は、文章を分析し、分析結果を定義情報と共に表示するよう指令できる。そして、利用者は、該表示を見て、文章の特徴を容易に把握できる。
【0035】
(解析単位リスト132)
解析単位リスト132には、文章分割部112によって分割された文章の解析単位及び該解析単位に関連する各種情報が格納される。
【0036】
解析単位は、本実施形態の分析装置1が文章を解析するときに用いる処理単位である。解析単位は、文章の様式に応じて、文1つ、形式段落1つ、意味段落1つ、セクション1つ、チャプター1つ、脚本におけるシーン1つ等から選択される。文章の様式の判別及び文章の様式に応じた解析単位の選択は、後に、本実施形態の分析処理の流れの説明において、より詳細に説明される。解析単位は、「シーン」とも称される。
【0037】
解析単位リスト132において、解析単位は、該解析単位に対応する感情ベクトルと関連付けられて格納されることが好ましい。これにより、分析装置1は、解析単位に対応する感情ベクトルを容易に取得できる。
【0038】
感情ベクトルは、複数種類の感情の強さを元とするベクトルである。感情の強さは、「感情値」「個別感情値」等とも称される。感情値の種類は、特に限定されない。感情値の種類は、例えば、プルチックの感情の輪における8種類の基本感情、エクマンの7種類の基本感情等でよい。なお、プルチックの感情の輪における8種類の基本感情は、怒り、期待、喜び、信頼、恐怖、驚き、悲しみ、嫌悪である。エクマンの7種類の基本感情は、驚き、恐れ、嫌悪、怒り、喜び、悲しみ、通常である。
【0039】
解析単位リスト132において、解析単位は、該解析単位に対応する感情ベクトルのノルムと関連付けられて格納されることが好ましい。これにより、分析装置1は、解析単位に対応する感情ベクトルのノルムを容易に取得できる。
【0040】
感情ベクトルのノルムは、特に限定されない。該ノルムは、例えば、最大値ノルム、ユークリッドノルム、p次平均ノルム、内積が定めるノルム等によって例示される任意のノルムでよい。最大値ノルムは、感情ベクトルの元のうち最も大きな値の元を値とするノルムである。ユークリッドノルムは、感情ベクトルが含む元の2乗和の平方根を値とするノルムである。p次平均ノルムは、感情ベクトルが含む元のp乗和のp乗根を値とするノルムである。内積が定めるノルムは、指定のベクトルと感情ベクトルとの内積の平方根を値とするノルムである。
【0041】
解析単位リスト132において、感情ベクトルのノルムは、1種類が格納されてもよく、複数種類が格納されてもよい。
【0042】
感情ベクトルのノルムは、なかでも、最大値ノルムであることが好ましい。これにより、感情ベクトルのノルムは、感情ベクトルに含まれる最も強い感情の強さを示すことができる。感情ベクトルのノルムが最大値ノルムである場合、最大値ノルムの値は、「代表感情値」とも称される。
【0043】
解析単位リスト132において、解析単位は、該解析単位に対応する感情ベクトルのノルムの移動平均と関連付けられて格納可能であることが好ましい。これにより、分析装置1は、解析単位に対応する感情ベクトルのノルムの移動平均を容易に取得できる。
【0044】
移動平均は、特に限定されない。該移動平均は、例えば、単純移動平均、加重移動平均、指数移動平均等によって例示される各種の移動平均でよい。該移動平均は、生成対象となる解析単位における感情ベクトルのノルムと、その前後の解析単位における感情ベクトルのノルムそれぞれとの移動平均であることが好ましい。これにより、分析装置1は、感情ベクトルのノルムが変化した解析単位との対応がわかりやすい移動平均を生成できる。
【0045】
解析単位リスト132において、解析単位は、該解析単位に対応する感情ベクトルのノルムと該ノルムの移動平均との相関と関連付けられて格納可能であることが好ましい。これにより、分析装置1は、解析単位に対応する相関を容易に取得できる。
【0046】
解析単位は、該解析単位に対応する文章を識別可能な文章IDと関連付けられて格納されることが好ましい。これにより、分析装置1は、解析単位に対応する文章を把握できる。
【0047】
解析単位は、解析単位を識別可能な解析単位IDと関連付けられて格納されることが好ましい。これにより、分析装置1は、解析単位IDを用いて解析単位を利用できる。
【0048】
図3は、解析単位リスト132の一例である。図3に示す例では、解析単位ID「U0001」で識別される解析単位が格納されている。該解析単位は、該解析単位に対応する感情ベクトル、ノルム、移動平均、及び文章IDと関連付けられて格納されている。
【0049】
図3に示す例では、該解析単位は、「△△グループの決算発表(注意1)を見ながら・・・」との書き出しを有し、「・・・これはとても短く書きます。」と締めくくられている。
【0050】
図3に示す例では、該解析単位は、感情ベクトル、値が「52」のノルム、及び文章ID「T0001」と関連付けられている。
【0051】
また、図3に示す例では、上述の解析単位と別の解析単位ID「U0002」で識別される別の解析単位が格納されている。該別の解析単位は、該別の解析単位に対応する感情ベクトル、ノルム、移動平均、及び文章IDと関連付けられて格納されている。
【0052】
図3に示す例では、該別の解析単位は、「グローバルのエンターテイメントの消費について・・・」との書き出しを有し、「・・・P△以降を御覧ください。」と締めくくられている。
【0053】
図3に示す例では、該別の解析単位は、感情ベクトル、値が「45」のノルム、値が「48」の移動平均、及び文章ID「T0001」と関連付けられている。
【0054】
図3に示す例に上述の感情ベクトル、ノルム、移動平均、文章IDと関連付けられた解析単位がそれぞれ格納されることにより、分析装置1は、感情ベクトル等の推移等の各種情報を利用できる。そして、分析装置1は、これら各種情報を用いて文章を分析できる。
【0055】
(登場人物リスト133)
登場人物リスト133には、文章の登場人物に関する登場人物情報が格納される。登場人物情報は、「キャラクター情報」とも称される。登場人物情報は、特に限定されない。登場人物情報には、例えば、登場人物の特徴を示す文章・キーワード、登場人物に関連する画像、登場人物に関連するネットワーク上の位置等が含まれる。また、登場人物リスト133には、画像生成部117が生成した画像が格納され得る。
【0056】
登場人物情報は、なかでも、登場人物の特徴を示す文章・キーワードを含むことが好ましい。これにより画像生成部117は、該文章及び/又は該キーワードに基づく画像生成を行える。
【0057】
登場人物情報は、登場人物情報を識別可能な登場人物IDと関連付けられて格納されることが好ましい。これにより、分析装置1は、登場人物IDを用いて登場人物情報を利用できる。
【0058】
登場人物情報は、該登場人物情報に対応する文章を識別可能な文章IDと関連付けられて格納されることが好ましい。これにより、分析装置1は、登場人物情報に対応する文章を把握できる。
【0059】
図4は、登場人物リスト133の一例である。図4に示す例では、登場人物ID「C0001」で識別され、文章ID「T0002」と対応する登場人物情報「眼鏡をかけ、前髪を中央で分けた男性」が格納されている。該登場人物情報は、該登場人物情報に基づいて生成された画像と関連付けられて格納されている。
【0060】
図4に示す例に上述の登場人物情報及び画像が格納されることにより、分析装置1は、該登場人物情報と該画像とを表示するよう指令できる。これにより、利用者は、登場人物の特徴をよりいっそう容易に把握できる。よって、利用者は、文章の特徴をよりいっそう容易に把握できる。
【0061】
[通信部14]
通信部14は、分析装置1をネットワークNに接続して端末T等と通信可能にするものであれば特に限定されない。通信部14として、例えば、携帯電話ネットワークに対応した無線装置、IEEE802.11に準拠したWi-Fi(Wireless Fidelity)対応デバイス、Bluetooth(登録商標)規格等に対応した近距離無線装置、及びイーサネット規格に対応したネットワークカード等が挙げられる。
【0062】
〔ネットワークN〕
ネットワークNの種類は、分析装置1と端末T等とを通信可能にするものであれば特に限定されない。ネットワークNは、例えば、ローカルエリアネットワーク、イントラネット、エクストラネット、インターネット、あるいはこれらネットワークを複数組み合わせたネットワーク等が挙げられる。
【0063】
〔端末T〕
端末Tは、ネットワークN等を介して分析装置1と通信可能であれば、特に限定されない。端末Tは、持ち運び可能な携帯端末であってもよいし、一定の場所に据え置かれている据え置き型端末であってもよい。端末Tの台数は、特に限定されない。
【0064】
携帯端末の種類は特に限定されるものでなく、例えば、スマートフォン、タブレット端末、及びノートパソコン等が挙げられる。また、据え置き型端末の種類も特に限定されるものでなく、例えば、デスクトップ式のパーソナルコンピュータ等が挙げられる。
【0065】
端末Tは、文章のデータ、ネットワーク上における文章の位置、及び/又は分析装置1に格納された文章を指定可能な文章指定情報を分析装置1に提供可能である。また、端末Tは、分析装置1からの指令に応じて、文章の分析結果を表示可能である。
【0066】
文章のデータのフォーマットは、特に限定されない。ネットワーク上における文章の位置のフォーマットは、特に限定されず、例えば、URI(Uniform Resource Identifier)、URL(Uniform Resource Locator)等でよい。文章指定情報は、特に限定されず、例えば、文章リスト131における文章ID、記憶部13に格納された文章ファイルのパス等でよい。
【0067】
〔分析処理のメインフローチャート〕
図5は、本実施形態の分析処理の好ましい流れの一例を示すメインフローチャートである。図6は、図5に続く図である。図7は、図6に続く図である。以下、図5乃至図7を用いて、該分析処理の好ましい流れの一例が説明される。
【0068】
まず、分析装置1は、文章を取得する文章取得ステップ(ステップS1からステップS2)を実行する。
【0069】
[ステップS1:文章を取得可能か判別]
制御部11は、記憶部13及び通信部14と協働して文章取得部111を実行する。そして、制御部11は、文章を取得可能か判別する処理を行う(ステップS1、文章取得可否判別ステップ)。取得可能であると判別したならば、制御部11は、処理をステップS2に移す。取得可能であると判別しなかったならば、制御部11は、処理をステップS1へ移す。
【0070】
文章を取得可能か判別する処理は、特に限定されない。該処理は、例えば、端末Tから文章のデータ、ネットワーク上における文章の位置、及び/又は分析装置1に格納された文章を指定可能な文章指定情報のいずれかを受信した場合に、文章を取得可能であると判別する処理等でよい。
【0071】
[ステップS2:文章を取得]
制御部11は、記憶部13及び通信部14と協働して文章取得部111を実行する。そして、制御部11は、ステップS1で取得可能であると判別された文章を取得する処理を行う(ステップS2、文章取得実行ステップ)。制御部11は、処理をステップS3へ移す。なお、文章を取得する処理は、取得された文章を文章リスト131に格納する処理を含む。
【0072】
続いて、分析装置1は、文章を解析単位に分割する文章分割ステップ(ステップS3からステップS4)を実行する。文章分割ステップは、文章の様式を判別する様式判別ステップ(ステップS3)を含むことが好ましい。これにより、分析装置1は、様式に応じた解析単位で文章を分割できる。
【0073】
[ステップS3:文章の様式を判別]
制御部11は、記憶部13と協働して文章分割部112を実行する。そして、制御部11は、ステップS2で取得した文章の様式を判別する処理を行う(ステップS3、様式判別ステップ)。制御部11は、処理をステップS4へ移す。
【0074】
文章の様式を判別する処理は、特に限定されない。文章の様式を判別する処理は、例えば、文章を脚本、プロット、対談、小説、エッセイ、ブログ、議事録、報告書、論説文等によって例示される各種様式の2以上を含む所定の様式群に含まれる様式のいずれかを判別結果とする判別でよい。
【0075】
文章の様式を判別する処理は、例えば、様式と関連する文章中のキーワードを用いて様式を判別する手順、段落の区切り方を用いて様式を判別する手順、段落の冒頭を用いて様式を判別する手順、機械学習を用いて様式を判別する手順等によって例示される各種手順の1以上を用いる処理でよい。
【0076】
[ステップS4:文章を解析単位に分割]
制御部11は、記憶部13と協働して文章分割部112を実行する。そして、制御部11は、ステップS2で取得した文章を解析単位に分割する処理を行う(ステップS4、文章分割実行ステップ)。制御部11は、処理をステップS5へ移す。なお、文章を解析単位に分割する処理は、分割された解析単位を解析単位リスト132に格納する処理を含む。
【0077】
分析処理が様式判別ステップを含む場合、文章分割実行ステップは、ステップS3で判別された様式に基づいて文章を解析単位に分割する手順を含むことが好ましい。これにより、分析装置1は、様式に応じた解析単位で文章を分割できる。様式に基づいて文章を解析単位に分割する手順は、例えば、文章が脚本であると判別した場合に脚本におけるシーンが解析単位に対応するよう文章を分割するプロセス、文章がブログであると判別した場合に形式段落が解析単位に対応するよう文章を分割するプロセス等を含む手順、文章が小説であると判別した場合にチャプターが解析単位に対応するよう文章を分割するプロセス等を含む手順、である。
【0078】
文章を解析単位に分割した後に、分析装置1は、解析単位ごとの感情ベクトルの推移を生成する感情ベクトル生成ステップ(ステップS5)を実行する。
【0079】
[ステップS5:解析単位ごとの感情ベクトルの推移を生成]
制御部11は、記憶部13と協働して感情ベクトル生成部113を実行する。そして、制御部11は、ステップS2で取得された文章におけるステップS4で分割された解析単位ごとの感情ベクトルの推移を生成する処理を行う(ステップS5、感情ベクトル生成ステップ)。制御部11は、処理をステップS6へ移す。
【0080】
感情ベクトルの推移を生成する処理は、ステップS2で取得された文章とステップS4で分割された解析単位と第1機械学習部119による機械学習(第1機械学習データ)とに基づいて解析単位ごとの感情ベクトルの推移を生成する手順を含む。該手順は、感情ベクトルに関する推論を、第1機械学習データを用いて行う手順を含む。
【0081】
感情ベクトルの生成に関し、感情に関する文章中の要素を予め感情と対応付け、該対応付けに基づいて感情ベクトルを生成する手順があり得る。しかしながら、感情に関する文章中の要素は、単語、表現、改行、記号等、多岐に渡る。そのため、この対応付けを手作業で行うことは、多大な労力を要し得る。また、対応付けに漏れがあった場合、不正確な感情ベクトルが生成され得る。流行語、新語、擬態語、擬音語、方言、俗語、隠語等を含む文章では、このような漏れが頻繁に生じることが懸念される。
【0082】
後述する第1機械学習部119による機械学習に基づいて解析単位ごとの感情ベクトルの推移を生成する手順は、この対応付けを手作業で行うことなく、感情ベクトルの推移を生成できる。これにより、該手順は、少ない労力でより正確な感情ベクトルを生成できる。
【0083】
感情ベクトルの推移を生成した後に、分析装置1は、感情ベクトルの推移に対する評価を生成する評価生成ステップを実行する。評価生成ステップにおいて生成される評価は、特に限定されない。
【0084】
(評価生成ステップにおいて生成される評価について)
評価生成ステップにおいて生成される評価は、感情ベクトルのノルムと該ノルムの移動平均との相関に関する相関評価を含む。該評価が上述の相関評価を含むことにより、文章の特徴をよりいっそう容易に把握できる。以下は、この点についての説明である。
【0085】
ノルムは、ベクトルの「長さ」の概念を一般化したものである。よって、感情ベクトルのノルムは、対応する解析単位における総合的な感情の強さに対応する。一方、感情ベクトルのノルムの移動平均は、対応する解析単位だけでなく、その周辺の解析単位をも含めた部分における総合的な感情の強さに対応する。
【0086】
そのため、総合的な感情の強さがあまり変化せず感情の強さも小さい部分、及び、総合的な感情の強さが急激に変化して感情の強さが大きい部分のそれぞれでは、該ノルムと該移動平均との相関は、大きくなる。一方、総合的な感情の強さがあまり変化しないが感情の強さが大きい部分、及び、総合的な感情の強さが急激に変化するが感情の強さが小さい部分のそれぞれでは、該ノルムと該移動平均との相関は、小さくなる。よって、該相関を用いれば、文章において、総合的な感情の強さが急激に変化して強くなる盛り上がりどころがいずれの解析単位に対応するかを評価できる。
【0087】
評価生成ステップにおいて生成される評価は、加えて、1以上の他の評価を含んでも良い。他の評価は、例えば、相関評価、感情平均幅に関する評価、感情変化率に関する評価、感情平均終始差に関する評価、感情値平均に関する評価等である。
【0088】
感情平均幅は、感情ベクトルのノルムの変化の幅である。感情変化率は、感情ベクトルのノルムの変化率である。感情平均終始差は、感情ベクトルのノルムの移動平均が所定の範囲で変化した量である。感情値終始差は、感情ベクトルのノルムが所定の範囲で変化した量である。感情値平均は、所定の範囲における感情ベクトルのノルムの平均である。所定の範囲は、特に限定されず、例えば、文章全体、連続する複数の解析単位に対応する範囲等でよい。
【0089】
該評価が感情平均幅に関する評価及び/又は感情変化率に関する評価を含むことにより、分析装置1は、文章における緩急・メリハリの評価を表示できる。該評価が感情平均終始差及び/又は感情値終始差に関する評価を含むことにより、分析装置1は、完結した文章であるか次に続く文章であるかどっちつかずの文章であるかの評価を表示できる。該評価が感情値平均に関する評価を含むことにより、分析装置1は、文章が感情に与える影響の評価を表示できる。
【0090】
以下ステップS6からステップS8は、上述の相関評価を生成する手順の一例である。分析装置1は、他の評価についても、同様の手順で評価を生成可能である。
【0091】
[ステップS6:感情ベクトルのノルムと該ノルムの移動平均とを生成]
制御部11は、記憶部13と協働して評価生成部114を実行する。そして、制御部11は、ステップS4で分割された解析単位ごとに、ステップS5で生成された感情ベクトルのノルムと該ノルムの移動平均とを生成する処理を行う(ステップS6、ノルム等生成ステップ)。制御部11は、処理をステップS7へ移す。
【0092】
ノルム等生成ステップが生成する感情ベクトルのノルムは、特に限定されない。該ノルムは、例えば、最大値ノルム、ユークリッドノルム、p次平均ノルム、内積が定めるノルム等によって例示される任意のノルムでよい。最大値ノルムは、感情ベクトルの元のうち最も大きな値の元を値とするノルムである。ユークリッドノルムは、感情ベクトルが含む元の2乗和の平方根を値とするノルムである。p次平均ノルムは、感情ベクトルが含む元のp乗和のp乗根を値とするノルムである。内積が定めるノルムは、指定のベクトルと感情ベクトルとの内積の平方根を値とするノルムである。
【0093】
該ノルムは、なかでも、最大値ノルムであることが好ましい。これにより、感情ベクトルのノルムは、感情ベクトルに含まれる最も強い感情の強さを示すことができる。
【0094】
ノルム等生成ステップが生成する移動平均は、特に限定されない。該移動平均は、例えば、単純移動平均、加重移動平均、指数移動平均等によって例示される公知の移動平均でよい。該移動平均は、生成対象となる解析単位における感情ベクトルのノルムと、その前後の解析単位における感情ベクトルのノルムそれぞれとの移動平均であることが好ましい。これにより、分析装置1は、感情ベクトルのノルムが変化した解析単位との対応がわかりやすい移動平均を生成できる。
【0095】
[ステップS7:ノルムと移動平均との相関を生成]
制御部11は、記憶部13と協働して評価生成部114を実行する。そして、制御部11は、ステップS6で生成されたノルムと移動平均との相関を生成する処理を行う(ステップS7、相関生成ステップ)。制御部11は、処理をステップS8へ移す。
【0096】
相関生成ステップが生成する相関は、特に限定されない。該相関は、例えば、ピアソンの積率相関係数、スピアマンの順位相関係数、ケンドールの順位相関係数等によって例示される公知の相関でよい。相関を生成する際に参照されるデータは、特に限定されず、例えば、生成対象となる解析単位及びその前後の解析単位における感情ベクトルのノルムの推移及び該ノルムの移動平均の推移等でよい。これにより、分析装置1は、感情ベクトルのノルムが変化した解析単位との対応がわかりやすい相関を生成できる。
【0097】
[ステップS8:相関評価を生成]
制御部11は、記憶部13と協働して評価生成部114を実行する。そして、制御部11は、ステップS7で生成された相関に基づく相関評価を生成する処理を行う(ステップS8、相関評価生成ステップ)。制御部11は、処理をステップS9へ移す。
【0098】
相関評価生成ステップにおいて相関評価を生成する手順は、特に限定されない。該手順は、例えば、文章全体における相関の値に対応する評価を生成する手順、文章全体における相関の値及びノルムの変化パターンに対応する評価を生成する手順等でよい。
【0099】
文章全体における相関の値及びノルムの変化パターンに対応する評価を生成する手順は、例えば、該変化パターンに応じて、立身出世型、悲劇型、起死回生型、失墜型、シンデレラ型、オイディプス型の6つの類型のいずれに近い文章であるかの評価を生成する手順等が挙げられる。
【0100】
立身出世型は、感情の強さが継続的に上昇する変化パターンに対応する。悲劇型は、感情の強さが継続的に下降する変化パターンに対応する。起死回生型は、感情の強さが下降から上昇に転じる変化パターンに対応する。失墜型は、感情の強さが上昇から下降に転じる変化パターンに対応する。シンデレラ型は、感情の強さが上昇、下降、上昇と変化する変化パターンに対応する。オイディプス型は、感情の強さが下降、上昇、下降と変化する変化パターンに対応する。
【0101】
本実施形態の評価生成ステップは、ノルムだけでなく相関の値も用いるため、分析装置1は、上昇・下降に相当する部分を容易に判別できる。これにより、分析装置1は、6つの型のいずれに近い文章であるかの評価を容易に生成できる。そして、利用者は、該評価によって、文章の特徴を容易に把握できる。
【0102】
(助言を含む評価)
評価生成ステップが生成する評価は、文章取得ステップで取得された文章を改善するための助言を含んでもよい。これにより、利用者は、該助言を用いて該文章を改善できる。該助言は、上述の評価に基づく助言であることが好ましい。このような助言として、例えば、上述の類型における好ましいノルム・相関の変化パターンから外れている部分を修正するよう促す助言、感情平均幅及び/又は感情変化率を類型に適した値に近づけるよう促す助言、感情平均終始差及び/又は感情値終始差を類型に適した値に近づけるよう促す助言、感情値平均をより大きくするよう促す助言等が挙げられる。
【0103】
必須の態様ではないが、分析装置1は、要約を生成する要約生成ステップ(ステップS9)を実行することが好ましい。
【0104】
[ステップS9:要約を生成]
制御部11は、記憶部13と協働して要約生成部115を実行する。そして、制御部11は、ステップS2で取得した文章の要約を生成する処理を行う(ステップS9、要約生成ステップ)。制御部11は、処理をステップS10へ移す。
【0105】
要約を生成する処理は、ステップS2で取得された文章とステップS4で分割された解析単位と第2機械学習部120による機械学習(第2機械学習データ)とに基づいて文章の要約を生成する手順を含む。該手順は、要約に関する推論を、第2機械学習データを用いて行う手順を含む。
【0106】
要約に関し、文章の主題に関する文章中の要素を予め列挙し、該列挙に基づいて要約を生成する手順があり得る。しかしながら、主題に関する文章中の要素は、単語、表現、改行、記号等、多岐に渡る。そのため、この列挙を手作業で行うことは、多大な労力を要し得る。また、列挙に漏れがあった場合、不正確な要約が生成され得る。
【0107】
後述する第2機械学習部120による機械学習に基づいて要約を生成する手順は、この列挙を手作業で行うことなく、要約を生成できる。これにより、該手順は、少ない労力でより正確な要約を生成できる。
【0108】
必須の態様ではないが、分析装置1は、登場人物情報を取得する登場人物情報取得ステップ(ステップS10からステップS11)と、登場人物の画像を生成する画像生成ステップ(ステップS12)とを実行することが好ましい。
【0109】
[ステップS10:登場人物情報を取得可能か判別]
制御部11は、記憶部13及び通信部14と協働して登場人物情報取得部116を実行する。そして、制御部11は、登場人物情報を取得可能か判別する処理を行う(ステップS10、登場人物情報取得可否判別ステップ)。取得可能であると判別したならば、制御部11は、処理をステップS2に移す。取得可能であると判別しなかったならば、制御部11は、処理をステップS13へ移す。
【0110】
登場人物情報を取得可能か判別する処理は、特に限定されない。該処理は、例えば、登場人物のデータを端末Tから受信可能である場合、ネットワーク上における登場人物情報の位置を端末Tから受信可能である場合、及び/又は分析装置1に格納された文章から登場人物情報を取得可能である場合に、登場人物情報を取得可能であると判別する処理等でよい。
【0111】
[ステップS11:登場人物情報を取得]
制御部11は、記憶部13及び通信部14と協働して登場人物情報取得部116を実行する。そして、制御部11は、ステップS10で取得可能であると判別された登場人物情報を取得する処理を行う(ステップS11、登場人物情報取得実行ステップ)。制御部11は、処理をステップS12へ移す。なお、登場人物情報を取得する処理は、取得された登場人物情報を登場人物リスト133に格納する処理を含む。
【0112】
登場人物情報を取得する処理は、特に限定されない。該処理は、例えば、登場人物のデータを端末Tから受信する手順、ネットワーク上における登場人物情報の位置に基づいて該位置から登場人物情報を取得する手順、文章及び/又は解析単位から機械学習を用いた処理によって登場人物情報を取得する手順等の1以上を含む処理でよい。
【0113】
登場人物情報は、特に限定されず、例えば、登場人物の特徴を示す単語及び/又は表現等を有するテキストを含む情報でよい。登場人物の特徴を示す単語及び/又は表現等は、「画像出力用の専用文言」とも称される。登場人物情報がこのようなテキストを含む場合、登場人物情報取得実行ステップは、画像出力用の専用文言を含むテキストから画像出力用の専用文言を抽出する手順を含むことが好ましい。これにより、分析装置1は、登場人物紹介等のテキストから画像出力用の専用文言を抽出できる。そして、分析装置1は、抽出された画像出力用の専用文言に基づいて画像を生成できる。
【0114】
[ステップS12:登場人物の画像を生成]
制御部11は、記憶部13と協働して画像生成部117を実行する。そして、制御部11は、ステップS11で取得した登場人物情報に基づいて登場人物の画像を生成する処理を行う(ステップS12、画像生成ステップ)。制御部11は、処理をステップS13へ移す。なお、登場人物の画像を生成する処理は、生成された画像を登場人物リスト133に格納する処理を含む。
【0115】
画像を生成する処理は、ステップS11で取得された登場人物情報と第3機械学習部121による機械学習(第3機械学習データ)とに基づいて画像を生成する手順を含む。該手順は、拡散モデル、潜在拡散モデル、及び/又は冷たい拡散(Cold Diffusion)モデルに基づく逆拡散プロセスを含むことが好ましい。これにより、分析装置1は、敵対的ネットワークを用いた画像生成より少ない計算量で画像を生成することと、登場人物情報を反映した画像を生成することとを両立できる。
【0116】
評価等を生成した後に、分析装置1は、生成された評価の表示を指令する表示指令ステップ(ステップS13)を実行する。
【0117】
[ステップS13:評価の表示を指令]
制御部11は、記憶部13及び通信部14と協働して表示指令部118を実行する。そして、制御部11は、ステップS8で生成された評価の表示を端末Tに指令する処理を行う(ステップS13、表示指令ステップ)。制御部11は、処理をステップS14へ移す。
【0118】
分析処理が要約生成ステップを含む場合、表示指令ステップは、要約生成ステップで生成された要約の表示を端末Tに指令する手順を含むことが好ましい。また、分析処理が画像生成ステップを含む場合、表示指令ステップは、画像生成ステップで生成された画像の表示を端末Tに指令する手順を含むことが好ましい。
【0119】
表示指令ステップは、ステップS6で生成された感情ベクトルのノルムのグラフを表示するよう指令可能であることが好ましい。これにより、利用者は、該グラフを介して文章における感情の強さの変化を容易に把握できる。
【0120】
表示指令ステップは、ステップS7で生成された相関のグラフを上述のノルムのグラフに重畳して表示するよう指令可能であることが好ましい。これにより、利用者は、これら重畳された2つのグラフを介して、文章における盛り上がりどころを容易に把握できる。
【0121】
表示指令ステップは、ステップS5で生成された感情ベクトルのうち、指定された感情の種類に対応する元のグラフを表示するよう指令可能であることが好ましい。これにより、利用者は、該グラフを介して文章における指定された感情の強さの変化を容易に把握できる。
【0122】
表示指令ステップは、感情ベクトルに関する上述の各種評価の1以上を表示するよう指令可能であることが好ましい。これにより、利用者は、これらの評価を用いて文章の特徴を容易に把握できる。
【0123】
[ステップS14:感情ベクトルの生成を機械学習するか判別]
制御部11は、記憶部13と協働して第1機械学習部119を実行する。そして、制御部11は、感情ベクトルの生成を機械学習するか判別する処理を行う(ステップS14、第1機械学習要否判別ステップ)。機械学習すると判別したならば、制御部11は、処理をステップS15に移す。機械学習すると判別しなかったならば、制御部11は、処理をステップS16へ移す。
【0124】
感情ベクトルの生成を機械学習するか判別する処理は、特に限定されず、例えば、感情ベクトルの生成を機械学習すべく定期的に設けられた所定のタイミングであれば感情ベクトルの生成を機械学習すると判別する処理等でよい。
【0125】
[ステップS15:感情ベクトルの生成を機械学習]
制御部11は、記憶部13と協働して第1機械学習部119を実行する。そして、制御部11は、ステップS2で取得された文章及びステップS4で分割された解析単位に基づく感情ベクトルの生成を機械学習する処理を行う(ステップS15、第1機械学習実行ステップ)。制御部11は、処理をステップS16へ移す。該手順は、機械学習によって得られた学習データ(第1機械学習データ)を、記憶部13に格納する手順を含む。
【0126】
感情ベクトルの生成を機械学習する処理は、特に限定されない。該処理は、例えば、条件付き確率場(Conditional random field、CRF)、構造化サポートベクターマシン、回帰型ニューラルネットワーク(Recurrent neural network、RNN)、及び長・短期記憶(Long short-term memory、LSTM)並びにこれらの手法の組合せ・改良手法等を用いて文章及び解析単位からの感情ベクトル生成を機械学習する手順等でよい。
【0127】
[ステップS16:要約の生成を機械学習するか判別]
制御部11は、記憶部13と協働して第2機械学習部120を実行する。そして、制御部11は、要約の生成を機械学習するか判別する処理を行う(ステップS16、第2機械学習要否判別ステップ)。機械学習すると判別したならば、制御部11は、処理をステップS17に移す。機械学習すると判別しなかったならば、制御部11は、処理をステップS18へ移す。
【0128】
要約の生成を機械学習するか判別する処理は、特に限定されず、例えば、要約の生成を機械学習すべく定期的に設けられた所定のタイミングであれば要約の生成を機械学習すると判別する処理等でよい。
【0129】
[ステップS17:要約の生成を機械学習]
制御部11は、記憶部13と協働して第2機械学習部120を実行する。そして、制御部11は、ステップS2で取得された文章及びステップS4で分割された解析単位に基づく要約の生成を機械学習する処理を行う(ステップS17、第2機械学習実行ステップ)。制御部11は、処理をステップS16へ移す。該手順は、機械学習によって得られた学習データ(第2機械学習データ)を、記憶部13に格納する手順を含む。
【0130】
要約の生成を機械学習する処理は、特に限定されない。該処理は、例えば、Encorder-Decorderモデル、注意(Attention)機構付きの回帰型ニューラルネットワーク、トランスフォーマー(Transformer)、及びReformer並びにこれらの手法の組合せ・改良手法等を用いて文章及び解析単位からの要約生成を機械学習する手順等でよい。
【0131】
[ステップS18:画像の生成を機械学習するか判別]
制御部11は、記憶部13と協働して第3機械学習部121を実行する。そして、制御部11は、画像の生成を機械学習するか判別する処理を行う(ステップS18、第3機械学習要否判別ステップ)。機械学習すると判別したならば、制御部11は、処理をステップS19に移す。機械学習すると判別しなかったならば、制御部11は、処理をステップS1へ移し、ステップS1からステップS19までの処理を繰り返す。
【0132】
画像の生成を機械学習するか判別する処理は、特に限定されず、例えば、画像の生成を機械学習すべく定期的に設けられた所定のタイミングであれば画像の生成を機械学習すると判別する処理等でよい。
【0133】
[ステップS19:画像の生成を機械学習]
制御部11は、記憶部13と協働して第3機械学習部121を実行する。そして、制御部11は、ステップS11で取得された登場人物情報に基づく画像の生成を機械学習する処理を行う(ステップS19、第3機械学習実行ステップ)。制御部11は、処理をステップS1へ移し、ステップS1からステップS19までの処理を繰り返す。該手順は、機械学習によって得られた学習データ(第3機械学習データ)を、記憶部13に格納する手順を含む。
【0134】
画像の生成を機械学習する処理は、特に限定されない。該処理は、例えば、拡散モデル、潜在拡散モデル、及び/又は冷たい拡散(Cold Diffusion)モデル並びにこれらの手法の組合せ・改良手法等を用いて登場人物情報からの画像生成を機械学習する手順等でよい。
【0135】
[分析処理の効果]
本実施形態の分析処理を実行することにより、分析装置1は、取得した文章を複数の解析単位に分割し、解析単位ごとの感情ベクトルの推移を生成できる。すなわち、分析装置1は、取得した文章において、複数種類の感情値が解析単位ごとにどのように変化するかの推移を生成できる。
【0136】
上述のとおり、感情ベクトルのノルムは、対応する解析単位における総合的な感情の強さに対応する。一方、感情ベクトルのノルムの移動平均は、対応する解析単位だけでなく、その周辺の解析単位をも含めた部分における総合的な感情の強さに対応する。そして、該ノルムと該ノルムの移動平均との相関を用いれば、文章において、総合的な感情の強さが急激に変化して強くなる盛り上がりどころがいずれの解析単位に対応するかを評価できる。
【0137】
本実施形態の分析処理を実行する分析装置1は、感情ベクトルのノルムとノルムの移動平均との相関に関する相関評価を生成し、表示可能である。よって、分析装置1は、文章における盛り上がりどころに関する分析結果を表示できる。よって、利用者は、文章の特徴をよりいっそう容易に把握できる。
【0138】
〔分析装置1の使用例〕
以下は、本実施形態における分析装置1の使用例の説明である。
【0139】
[分析対象とする文章を指定]
利用者は、分析対象とする文章を指定する。この指定は、分析対象とする文章の分析装置1へのアップロード、既にアップロードした文章を指定する情報の送信等によって実現される。
【0140】
[分析の実行]
分析装置1は、指定された文章を取得し、解析単位(シーン)に分割する。そして、分析装置1は、解析単位ごとの感情ベクトルの推移を生成する。分析装置1は、感情ベクトルのノルム及び該ノルムの移動平均を生成する。分析装置1は、該ノルム及び該移動平均の相関を生成し、該相関に基づく評価を生成する。
【0141】
図8は、本実施形態の分析装置1による分析結果の一例である。図8に示す例では、表題が「△△の市場とは?」である文章の分析結果が、端末Tに表示されている。
【0142】
この例では、分析対象となる文章の表題と、感情ベクトルのノルム(実線)、移動平均(一点破線)、相関(破線)のシーン(解析単位)ごとの推移を示すグラフと、評価を示すテキストと、が表示されている。
【0143】
利用者は、実線で示された感情ベクトルのノルムのグラフから、該文章における感情の強さの推移を容易に把握できる。利用者は、一点破線で示された感情ベクトルのノルムの移動平均のグラフから、該文章における感情の強さの推移の概略を把握できる。そして、利用者は、破線で示された感情ベクトルのノルムと該ノルムの移動平均との相関のグラフから、該文章における盛り上がりどころが序盤の第3シーン近傍と終盤の第9シーン近傍とにあることを容易に把握できる。
【0144】
加えて、利用者は、評価を示すテキストから、文章の類型がオイディプス型に近いことを把握できる。そして、利用者は、緩急がなく平坦な文章のミッドポイントを低くし、盛り上がるポイントのメリハリをつけるとの助言を用いて、文章を改善できる。
【0145】
したがって、本実施形態の分析装置1によれば、利用者は、文章の特徴を容易に把握し、該文章を改善できる。
【0146】
<変形例>画像を含む文章の分析
分析装置1は、画像を含む文章の特徴を分析するよう構成可能である。
【0147】
本変形例の分析装置1は、以下の点において実施形態の分析装置1と異なる。
【0148】
〔分析装置1〕
本変形例の分析装置1がサーバ群として構成される場合、該サーバ群は、文章に係る感情ベクトルの推移を生成する文字列用深層学習サーバと、画像に係る感情ベクトルの推移を生成する画像用深層学習サーバとをさらに含んで構成されることが好ましい。
【0149】
[記憶部13]
本変形例の記憶部13には、文章である解析単位に基づく感情ベクトルの生成の機械学習が行われた第1機械学習に加えて、画像である解析単位に基づく感情ベクトルの生成の機械学習が行われた第4機械学習(所定の機械学習)が格納される。また、本変形例の記憶部13に格納される文章リスト131は、画像を含む文章を格納可能であるよう構成される。加えて、本変形例の記憶部13に格納される解析単位リスト132は、画像である解析単位を格納可能であるよう構成される。
【0150】
〔本変形例の分析処理〕
本変形例の分析処理は、以下の点において実施形態の分析処理と異なる。
【0151】
[ステップS1からS2(文章取得ステップ)]
本変形例の文章取得ステップは、画像を含む文章を取得可能である。このような文章として、例えば、文章及び画像を含むWebページ、文章及び画像を含むPDFファイル、文章及び画像を含む電子書籍等の各種態様の文章が挙げられる。
【0152】
[ステップS3からS4(文章分割ステップ)]
本変形例の文章分割ステップは、文章の様式が画像を含む様式であると判別した場合に、画像それぞれが独立した解析単位となるよう文章を分割可能である。
【0153】
[ステップS5(感情ベクトル生成ステップ)]
本変形例の感情ベクトル生成ステップは、生成の対象となる解析単位が文章である場合、第1機械学習に基づいて感情ベクトルの推移を生成し、生成の対象となる解析単位が画像である場合、第4機械学習に基づいて感情ベクトルの推移を生成する。
【0154】
本変形例の感情ベクトル生成ステップは、第1機械学習に基づいて生成された感情ベクトルの推移と第4機械学習に基づいて生成された感情ベクトルの推移とが一群の感情ベクトルの推移を構成するよう、第1機械学習及び/又は第4機械学習に基づいて生成された感情ベクトルを補正する手順を含む。これにより、分析装置1は、異なる機械学習に基づいて生成された感情ベクトルを合成して一群の感情ベクトルの推移とすることができる。
【0155】
〔本変形例の分析装置1がもたらす効果〕
文章が写真、挿絵等の画像を含む場合、そのような画像は、文章によって引き起こされる感情に影響を及ぼし得る。例えば、悲惨な情景を写した写真を見た場合、読者は、悲しみ、怒り、恐怖等の感情を引き起こされ得る。また、例えば、笑顔の人物が描かれた挿絵を見た場合、読者は、期待、喜び等の感情を引き起こされ得る。したがって、画像を含む文章について、画像をも考慮した文章の特徴を分析する要望がある。
【0156】
本変形例の分析装置1は、画像を含む文章について、文章だけでなく画像をも考慮した文章の特徴を分析可能である。本変形例の分析装置1は、画像である解析単位に基づく感情ベクトルの生成の機械学習が行われた第4機械学習を用いて画像に係る感情ベクトルを生成するため、機械学習に基づく客観的なアルゴリズムによって画像に係る感情ベクトルを生成できる。
【0157】
よって、本変形例の分析装置1は、画像を含む文章の特徴を容易に把握可能な分析結果を提供できる。
【0158】
〔変形例の分析装置1がサーバ群である場合の分析処理〕
図9は、変形例について、サーバ群である分析装置1で実行される分析処理の好ましい流れの一例を示すフローチャートである。図10は、図9に続く図である。以下は、図9及び図10を用いた、本変形例の分析装置1が通常サーバ、画像用深層学習サーバ、文字列用深層学習サーバを含むサーバ群である場合の分析処理の好ましい流れの一例の説明である。
【0159】
まず、通常サーバにおける処理の流れ(ステップS101からステップS110)のうち、ステップS101からステップS104が説明される。
【0160】
[ステップS101:文章取得]
通常サーバは、分析対象となる文章を取得する処理を実行する(ステップS101、文章取得ステップ)。通常サーバは、処理をステップS102に移す。文章取得ステップは、図5のステップS1からステップS2と同様でよい。
【0161】
[ステップS102:解析単位に分割]
通常サーバは、ステップS101で取得された文章を解析単位に分割する処理を実行する(ステップS102、文章分割ステップ)。通常サーバは、処理をステップS103に移す。文章分割ステップは、図5のステップS3からステップS4と同様でよい。
【0162】
[ステップS103:解析単位を他サーバから取得可能とする]
通常サーバは、ステップS102で分割された解析単位のそれぞれを他サーバから取得可能とする処理を実行する(ステップS103、取得準備ステップ)。通常サーバは、処理をステップS104に移す。取得準備ステップは、例えば、URL等の識別子を用いて解析単位を取得可能とする手順等を含む。他サーバから取得可能な解析単位の格納先は、特に限定されない。該格納先は、例えば、通常サーバ、ステップS101で取得された文章を公開しているサーバ等でよい。
【0163】
[ステップS104:解析単位の解析を指令する]
通常サーバは、解析単位の種類に応じたサーバに、解析単位の解析を指令する処理を実行する(ステップS104、解析指令ステップ)。
【0164】
解析指令ステップにおいて、通常サーバは、画像からなる解析単位(解析単位(画像)D1)について、画像用深層学習サーバに解析を指令する。そして、感情ベクトルD3を画像用深層学習サーバから取得したときに、通常サーバは、処理をステップS105に移す。
【0165】
また、解析指令ステップにおいて、通常サーバは、画像を含まない解析単位(解析単位(文章)D2)について、文字列用深層学習サーバに解析を指令する。そして、感情ベクトルD4を文字列用深層学習サーバから取得したときに、通常サーバは、処理をステップS106に移す。
【0166】
ステップS105以降に係る説明の前に、画像用深層学習サーバにおける処理(ステップS201からステップS203)及び文字列用深層学習サーバにおける処理(ステップS301からステップS304)が説明される。
【0167】
以下は、画像用深層学習サーバにおける処理(ステップS201からステップS203)の説明である。
【0168】
[ステップS201:第4機械学習を取得]
画像用深層学習サーバは、画像に基づく感情ベクトルの生成に係る第4機械学習を取得する処理を実行する(ステップS201、第4機械学習取得ステップ)。画像用深層学習サーバは、処理をステップS202に移す。
【0169】
[ステップS202:画像に係る推論を実行]
画像用深層学習サーバは、第4機械学習に基づいて、ステップS104で解析を指令された解析単位D1の画像に係る感情ベクトルの推論を行う処理を実行する(ステップS202、画像推論ステップ)。画像用深層学習サーバは、処理をステップS203に移す。
【0170】
[ステップS203:推論結果を感情ベクトルとして返す]
画像用深層学習サーバは、ステップS202で推論された感情ベクトルの推論結果を感情ベクトルD3として通常サーバに返す処理を実行する(ステップS203、画像推論結果提供ステップ)。画像用深層学習サーバは、処理を終了する。
【0171】
以下は、文字列用深層学習サーバにおける処理(ステップS301からステップS304)の説明である。
【0172】
[ステップS301:分かち書きをする]
文字列用深層学習サーバは、ステップS104で解析を指令された解析単位D2の文章を分かち書きする処理を実行する(ステップS301、分かち書きステップ)。文字列用深層学習サーバは、処理をステップS303に移す。分かち書きステップは、特に限定されない。分かち書きステップは、解析単位D2の文章を第1機械学習における解析に適した処理単位で分かち書きする手順を含む。該処理単位は、例えば、文節、単語等である。
【0173】
[ステップS302:第1機械学習を取得]
文字列用深層学習サーバは、文章に基づく感情ベクトルの生成に係る第1機械学習を取得する処理を実行する(ステップS302、第1機械学習取得ステップ)。文字列用深層学習サーバは、処理をステップS303に移す。
【0174】
[ステップS303:文章に係る推論を実行]
文字列用深層学習サーバは、第1機械学習に基づいて、ステップS301で分かち書きされた解析単位D2の文章に係る感情ベクトルの推論を行う処理を実行する(ステップS303、文字列推論ステップ)。文字列用深層学習サーバは、処理をステップS304に移す。
【0175】
[ステップS304:推論結果を感情ベクトルとして返す]
文字列用深層学習サーバは、ステップS303で推論された感情ベクトルの推論結果を感情ベクトルD4として通常サーバに返す処理を実行する(ステップS203、文字列推論結果提供ステップ)。文字列用深層学習サーバは、処理を終了する。
【0176】
説明は、通常サーバにおける処理に係る内容に戻る。
【0177】
[ステップS105:画像に係る感情ベクトルを補正]
画像用深層学習サーバから感情ベクトルD3を取得した通常サーバは、画像に係る感情ベクトルD3を補正する処理を実行する(ステップS105、補正ステップ)。通常サーバは、処理をステップS106に移す。
【0178】
[ステップS106:感情ベクトルを抽出]
通常サーバは、ステップS105で補正された感情ベクトルD3又は文字列用深層学習サーバから取得された感情ベクトルD4を抽出する処理を実行する(ステップS106、抽出ステップ)。通常サーバは、処理をステップS107に移す。
【0179】
[ステップS107:解析単位全てを推論したか判別]
通常サーバは、ステップS102で分割された解析単位全てを推論したか判別する処理を実行する(ステップS107、推論完了判別ステップ)。全てを推論したと判別したならば、通常サーバは、処理をステップS108に移す。全てを推論したと判別しなかったならば、通常サーバは、処理をステップS104に移す。
【0180】
[ステップS108:結果を格納]
通常サーバは、ステップS106で抽出された感情ベクトルD3及び感情ベクトルD4を含む結果を格納する処理を実行する(ステップS108、格納ステップ)。通常サーバは、処理をステップS109に移す。
【0181】
[ステップS109:感情ベクトルのノルム等を生成]
通常サーバは、ステップS109で格納された感情ベクトルのノルム等を生成する処理を実行する(ステップS109、ノルム等生成ステップ)。通常サーバは、処理をステップS110に移す。ノルム等生成ステップは、図5のステップS6と同様でよい。ノルム等生成ステップは、感情ベクトルのノルム及び該ノルムの移動平均を生成する。
【0182】
[ステップS110:ノルム等に係る相関評価等を生成・表示]
通常サーバは、ステップS110で生成されたノルム等に係る相関評価等を生成・表示する処理を実行する(ステップS110、相関評価等生成・表示ステップ)。通常サーバは、処理を終了する。相関評価等生成・表示ステップは、図5のステップS7から図6のステップS13までと同様でよい。相関評価等生成・表示ステップは、ノルムと該ノルムの移動平均との相関に係る相関評価を生成し、該相関評価を含む文章の評価を表示する。
【0183】
[変形例の分析装置1がサーバ群である場合の分析処理の効果]
上述の分析処理により、サーバ群である分析装置1は、文字列用深層学習サーバと画像用深層学習サーバとにおいて異なる処理単位に対応する感情ベクトルを並列に生成できる。これにより、分析装置1は、画像に係る感情ベクトルをも考慮するより複雑な処理を実行するにも拘わらず、一体の装置として構成された分析装置1より迅速に文章に係る評価を生成・表示できる。また、サーバ群である分析装置1の各サーバは、一体の装置として構成された分析装置1より簡易かつ保守性が高い構成となり得る。これにより、分析装置1の保守性及び経済性が高められ得る。
【0184】
[画像である解析単位に基づく感情ベクトルの生成の機械学習について]
本変形例の分析装置1は、第4機械学習に係る機械学習を実行する第4機械学習部(図示せず)を含んで構成されることが好ましい。これにより、分析装置1は、画像である解析単位に基づく感情ベクトルの生成の機械学習をさらに行うことができる。これにより、分析装置1は、その運用中において感情解析の精度をよりいっそう高め得る。このとき、サーバ群は、第4機械学習部を実現する学習サーバ(画像用学習サーバ)をさらに含んで構成されることが好ましい。これにより、分析装置1は、文章の評価と学習とを並列に実行できる。そして、分析装置1は、並列実行に係る上述の各種効果を得うる。
【0185】
<変形例2>動画、画像を含む文章、又は画像等を伴わない文章の分析
分析装置1は、動画、画像を含む文章、又は画像等を伴わない文章の特徴を分析するよう構成可能である。
【0186】
変形例2の分析装置1は、変形例の分析装置1と同様である。
【0187】
〔変形例2の分析処理〕
図11は、変形例2について、サーバ群である分析装置1で実行される分析処理の好ましい流れの別の例を示すフローチャートである。変形例2の分析処理は、以下の点において変形例の分析処理と異なる。
【0188】
[ステップS121:ファイル取得]
変形例2の分析処理において、通常サーバは、ステップS101の文章取得ステップを実行する代わりに、端末T等からファイルを取得する処理を実行する(ステップS121、ファイル取得ステップ)。通常サーバは、処理をステップS122に移す。
【0189】
[ステップS122:解析単位生成処理]
変形例2の分析処理において、通常サーバは、ステップS102の文章分割ステップを実行する代わりに、解析単位生成処理を実行する(ステップS122、解析単位生成処理実行ステップ)。通常サーバは、処理をステップS103に移す。解析単位生成処理は、後に図12及び図13を用いてより詳細に説明される。
【0190】
[ステップS125:推論結果補正処理]
変形例2の分析処理において、通常サーバは、ステップS105の補正ステップを実行する代わりに、推論結果補正処理を実行する(ステップS125、推論結果補正処理実行ステップ)。通常サーバは、処理をステップS106に移す。推論結果補正処理は、後に図14及び図15を用いてより詳細に説明される。
【0191】
〔解析単位生成処理〕
図12は、図11のステップS122で実行される解析単位生成処理のフローチャートである。図13は、図12に続く図である。以下は、図12及び図13を用いた、図11のステップS122で実行される解析単位生成処理の好ましい流れの一例である。
【0192】
[ステップS401:利用者の入力を取得]
通常サーバは、端末T等から利用者の入力を取得する処理を実行する(ステップS401、入力取得ステップ)。通常サーバは、処理をステップS402に移す。入力取得ステップは、特に限定されない。入力取得ステップは、例えば、端末Tに表示されたGUIからの入力を取得する手順等を含む。
【0193】
[ステップS402:動画か判別]
通常サーバは、ステップS121で取得したファイルが動画であるか判別する処理を実行する(ステップS402、第1動画判別ステップ)。動画であると判別したならば、通常サーバは、処理をステップS403に移す。動画であると判別しなかったならば、通常サーバは、処理をステップS406に移す。
【0194】
[ステップS403:動画の音声を処理単位に分割]
通常サーバは、ステップS402で判別された動画の音声を処理単位に分割する処理を実行する(ステップS403、動画分割ステップ)。通常サーバは、処理をステップS404及びステップS414に移す。処理単位は、特に限定されず、例えば、ステップS401で取得した入力においてユーザが指定したフレーム数等でよい。
【0195】
ステップS403に続いて、通常サーバは、ステップS404からステップS405までの一連の処理及びステップS414からステップS415までの一連の処理を並列実行する。この並列実行により、通常サーバは、音声と画像とを同時に処理し、より短い時間で動画に関する解析単位を生成できる。
【0196】
[ステップS404:音声をテキストに変換]
通常サーバは、ステップS403で処理単位に分割された音声をテキストに変換する処理を実行する(ステップS404、テキスト変換ステップ)。通常サーバは、処理をステップS405に移す。音声をテキストに変換する処理は、特に限定されない。該処理は、例えば、ディープラーニングを用いた音声認識によって音声をテキストに変換する手順等を含む。
【0197】
[ステップS405:変換により得られたテキストを修正]
通常サーバは、ステップS404の変換により得られたテキストを修正する処理を実行する(ステップS405、テキスト修正ステップ)。通常サーバは、ステップS415の処理終了後、解析単位生成処理を終了し、元の処理に戻る。テキストに修正する処理は、特に限定されない。該処理は、例えば、利用者の入力に基づいてテキストを修正する手順、ディープラーニングを用いた自動校正によってテキストを修正する手順等を含む。
【0198】
[ステップS414:動画の画像を処理単位に分割]
通常サーバは、ステップS402で判別された動画の画像を処理単位に分割する処理を実行する(ステップS414、動画画像分割ステップ)。通常サーバは、処理をステップS415に移す。
【0199】
[ステップS415:分割により得られた画像を格納]
通常サーバは、ステップS414の分割により得られた画像を通常サーバの記憶部に格納する処理を実行する(ステップS415、動画画像格納ステップ)。通常サーバは、ステップS405の処理終了後、解析単位生成処理を終了し、元の処理に戻る。
【0200】
[ステップS406:画像・文章混在か判別]
通常サーバは、ステップS121で取得したファイルが画像・文章が混在したファイルであるか判別する処理を実行する(ステップS406、第1混在ファイル判別ステップ)。混在したファイルであると判別したならば、通常サーバは、処理をステップS407に移す。混在したファイルであると判別しなかったならば、通常サーバは、処理をステップS409に移す。なお、第1混在ファイル判別ステップは、画像のみのファイルについても、混在したファイルであると判別した場合と同様の処理を行う。
【0201】
[ステップS407:画像・文章のフォーマットを判別]
通常サーバは、ステップS406で判別された画像・文章のフォーマットをそれぞれ判別する処理を実行する(ステップS407、画像・文章フォーマット判別ステップ)。通常サーバは、解析単位生成処理を終了し、元の処理に戻る。これにより、分析装置1は、上述の構成と同様に、フォーマットに応じた推論等の処理を行える。
【0202】
[ステップS408:画像を格納]
通常サーバは、ステップS407でフォーマットを判別された画像を通常サーバの記憶部に格納する処理を実行する(ステップS408、画像格納ステップ)。通常サーバは、解析単位生成処理を終了し、元の処理に戻る。
【0203】
[ステップS409:文章のフォーマットを判別]
通常サーバは、ステップS406で判別された文章のフォーマットを判別する処理を実行する(ステップS409、文章フォーマット判別ステップ)。通常サーバは、解析単位生成処理を終了し、元の処理に戻る。これにより、分析装置1は、上述の構成と同様に、フォーマットに応じた推論等の処理を行える。
【0204】
ステップS101の文章取得ステップを実行する代わりにファイル取得ステップを実行し、かつ、ステップS102の文章分割ステップを実行する代わりに解析単位生成処理を実行することにより、変形例2の通常サーバは、動画、画像を含む文章、又は画像等を伴わない文章等の各種ファイルのいずれにおいても、各種ファイルを解析単位に分割できる。
【0205】
〔推論結果補正処理〕
図14は、図11のステップS125で実行される推論結果補正処理のフローチャートである。図15は、図14に続く図である。以下は、図14及び図15を用いた、図11のステップS125で実行される推論結果補正処理の好ましい流れの一例である。
【0206】
[ステップS501:動画か判別]
通常サーバは、ステップS121で取得したファイルが動画であるか判別する処理を実行する(ステップS501、第2動画判別ステップ)。動画であると判別したならば、通常サーバは、処理をステップS502に移す。動画であると判別しなかったならば、通常サーバは、処理をステップS504に移す。
【0207】
[ステップS502:シーンに与える影響が強い画像・文章を選出]
通常サーバは、ステップS501で判別された動画に係る推論結果のうち、シーンに与える影響が強い推論結果(画像)及びシーンに与える影響が強い推論結果(文章)を選出する処理を実行する(ステップS502、第1代表画像・文章選出ステップ)。通常サーバは、処理をステップS503に移す。ここで、「シーンに与える影響が強い」は、最も大きい感情値を有する推論結果であることを指す。
【0208】
[ステップS503:選出された画像・文章に基づいて推論結果を補正]
通常サーバは、ステップS502で選出された画像・文章に基づいて推論結果を補正する処理を実行する(ステップS503、動画推論結果補正ステップ)。通常サーバは、推論結果補正処理を終了し、元の処理に戻る。動画推論結果補正ステップは、例えば、セリフ(文章)を基準として、画像の推論結果及びセリフの推論結果を合算し、要素数で割った値を推論結果とする手順を含む。なお、動画に係る感情ベクトルの推論において画像が文字等を含む場合、分析装置1は、該画像から文字をOCR等によって切り出すことなく、該画像を画像として感情ベクトルを推論することが好ましい。これにより、推論結果補正処理における計算負荷が低減される。
【0209】
[ステップS504:画像・文章混在か判別]
通常サーバは、ステップS121で取得したファイルが画像・文章が混在したファイルであるか判別する処理を実行する(ステップS504、第2画像・文章混在判別ステップ)。混在したファイルであると判別したならば、通常サーバは、処理をステップS505に移す。混在したファイルであると判別しなかったならば、通常サーバは、処理をステップS507に移す。なお、第2画像・文章混在判別ステップは、画像のみのファイルについても、混在したファイルであると判別した場合と同様の処理を行う。
【0210】
[ステップS505:シーンに与える影響が強い画像・文章を選出]
通常サーバは、ステップS504で判別されたファイルに係る推論結果のうち、シーンに与える影響が強い推論結果(画像)及びシーンに与える影響が強い推論結果(文章)を選出する処理を実行する(ステップS505、第2代表画像・文章選出ステップ)。通常サーバは、処理をステップS506に移す。
【0211】
[ステップS506:選出された画像・文章に基づいて推論結果を補正]
通常サーバは、ステップS505で選出された画像・文章に基づいて推論結果を補正する処理を実行する(ステップS506、混在ファイル推論結果補正ステップ)。通常サーバは、推論結果補正処理を終了し、元の処理に戻る。なお、混在したファイルに係る感情ベクトルの推論において画像が文字等を含む場合、分析装置1は、該画像から文字をOCR等によって切り出すことなく、該画像を画像として感情ベクトルを推論することが好ましい。これにより、推論結果補正処理における計算負荷が低減される。ただし、該画像が漫画等のセリフが感情ベクトルに与える影響が大きいコンテンツの画像である場合、分析装置1は、任意で該画像から文字をOCR等によって切り出し、感情ベクトルの推論の対象とすることが可能である。
【0212】
[ステップS507:シーンに与える影響が強い文章を選出]
通常サーバは、ステップS504で判別されたファイルに係る推論結果のうち、シーンに与える影響が強い推論結果(文章)を選出する処理を実行する(ステップS507、文章選出ステップ)。通常サーバは、推論結果補正処理を終了し、元の処理に戻る。
【0213】
ステップS101の文章取得ステップを実行する代わりにファイル取得ステップを実行し、かつ、ステップS105の補正ステップを実行する代わりに推論結果補正処理を実行することにより、変形例2の通常サーバは、動画、画像を含む文章、又は画像等を伴わない文章等の各種ファイルのいずれにおいても、解析単位に分割された各種ファイルに係る推論結果を補正できる。
【0214】
これにより、変形例2の分析装置1は、動画、画像を含む文章、又は画像等を伴わない文章等の多種多様なファイルの特徴を分析できる。
【0215】
以上、本発明の好ましい態様の一例が説明された。なお、本発明の思想の範疇において、各種の変更例及び修正例は、当業者であれば想到し得るものである。よって、それら変更例及び修正例は、上述の一例と同様に、本発明の範囲に属するものと了解される。例えば、前述の実施の形態に対して、当業者が適宜、構成要素の追加、削除若しくは設計変更を行ったもの、又は、工程の追加、省略若しくは条件変更を行ったものは、本発明の要旨を備えている限り、上述の一例と同様に、本発明の範囲に含まれる。
【符号の説明】
【0216】
S 分析システム
1 分析装置
11 制御部
111 文章取得部
112 文章分割部
113 感情ベクトル生成部
114 評価生成部
115 要約生成部
116 登場人物情報取得部
117 画像生成部
118 表示指令部
119 第1機械学習部
120 第2機械学習部
121 第3機械学習部
13 記憶部
131 文章リスト
132 解析単位リスト
133 登場人物リスト
14 通信部
N ネットワーク
T 端末

図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
【手続補正書】
【提出日】2023-07-05
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
文章を取得可能な文章取得部と、
前記文章を複数の解析単位に分割可能な文章分割部と、
前記文章における前記解析単位毎の感情ベクトルの推移を生成可能な感情ベクトル生成部と、
前記感情ベクトルの推移に対する評価を生成可能な評価生成部と、
前記評価の表示を指令可能な表示指令部と、
前記文章及び前記解析単位に基づく前記感情ベクトルの生成を機械学習可能な第1機械学習部と、
を備え、
前記感情ベクトルは、複数種類の感情の強さそれぞれを元とするベクトルであり、
前記感情ベクトル生成部は、前記文章と前記解析単位と前記第1機械学習部による機械学習とに基づいて前記感情ベクトルの推移を生成可能であり、
前記評価生成部は、少なくとも、前記感情ベクトルのノルムと前記ノルムの移動平均との相関に関する相関の値に対応する評価を生成可能である、
文章の分析装置。
【請求項2】
前記文章の要約を生成可能な要約生成部と、
前記文章及び前記解析単位に基づく前記要約の生成を機械学習可能な第2機械学習部と、
をさらに備え、
前記要約生成部は、前記文章と前記第2機械学習部による機械学習とに基づいて前記要約を生成可能であり、
前記表示指令部は、前記要約の表示をさらに指令可能である、
請求項1に記載の分析装置。
【請求項3】
前記文章の登場人物の登場人物情報を取得可能な登場人物情報取得部と、
前記登場人物情報に基づいて前記登場人物の画像を生成可能な画像生成部と、
前記登場人物情報に基づく前記画像の生成を機械学習可能な第3機械学習部と、
をさらに備え、
前記画像生成部は、前記第3機械学習部による機械学習に基づいて前記画像を生成可能であり、
前記表示指令部は、前記画像の表示をさらに指令可能である、
請求項1に記載の分析装置。
【請求項4】
前記文章取得部は、画像を含む文章を取得可能であり、
前記文章分割部は、画像を含まない解析単位及び画像からなる解析単位からなる複数の解析単位に前記画像を含む文章を分割可能であり、
前記感情ベクトル生成部は、
前記画像を含まない解析単位について、前記第1機械学習部による機械学習に基づいて前記感情ベクトルの推移を生成可能であり、
前記画像からなる解析単位について、画像に基づく感情ベクトルの生成に係る所定の機械学習に基づいて前記感情ベクトルの推移を生成可能である、
請求項1に記載の分析装置。