(58)【調査した分野】(Int.Cl.,DB名)
【発明の概要】
【発明が解決しようとする課題】
【0004】
各パートにおける特徴語の重要度は、各パート間で異なるため、特徴語の重要度に応じてユーザーが時系列情報を閲覧した場合、各パートの特徴語の重要度をユーザーに示す必要がある。そこで、複数の特徴画像を含む要約を作成する際に特徴語の重要度に応じて複数の特徴画像の大きさを異ならせることができれば利用者の利便性が向上する。
【0005】
本発明の目的の一つは、時系列情報を区分した各パートの特徴語の重要度を利用者に把握させることができる情報処理装置を提供することにある。
【課題を解決するための手段】
【0006】
本発明に係る情報処理装置は、音声情報及び画像情報を含み時間とともに変化する時系列情報を複数のパートに区分する区分手段と、利用者による操作指示を受け付ける操作指示受付手段と、前記区分されたパートの重要度に応じた大きさで表示された、前記区分されたパートの特徴を示す特徴画像を含む要約画像を表示す
るよう制御する表示制御手段と、を備え、前記表示制御手段は、前記特徴画像の大きさに応じて、当該特徴画像に関連付けられた、前記区分されたパートの特徴を示す特徴語の表示を制限し、前記操作指示受付手段が、前記特徴語の表示の制限をされた前記特徴画像を指示する操作を受け付けると、前記表示の制限をされた前記特徴語を表示させた前記要約画像を表示するよう制御することを特徴とする。
【0007】
本発明の請求項2に係る情報処理装置は、請求項1に記載の情報処理装置において、前記区分されたパートの特徴を示す前記特徴語を当該パートに含まれる前記音声情報に基づいて取得する特徴語取得手段をさらに含み、前記特徴語取得手段は、前記区分されたパートに対応する前記音声情報における出現頻度に応じて前記特徴語を取得する。
【0008】
本発明に係る情報処理装置は、それぞれが前記重要度に応じた大きさで表示される前記複数の特徴画像を含む前記要約画像を生成する。
【0009】
本発明の請求項3に係る情報処理装置は、請求項1に記載の情報処理装置において、前記特徴画像は、前記重要度が高いほど大きく表示され、前記重要度が低いほど小さく表示される。
【0010】
本発明の請求項4に係る情報処理装置は、請求項1に記載の情報処理装置において、前記重要度は前記音声情報における前記特徴語の出現回数から決定される。
【0011】
本発明の請求項5に係る情報処理装置は、請求項1に記載の情報処理装置において、前記重要度は前記音声情報における前記特徴語の音量から決定される。
【0012】
本発明の請求項6に係る情報処理装置は、請求項1に記載の情報処理装置において、前記重要度は前記音声情報において前記特徴語が出現する時間の直前に無音の時間があるか否かによって決定される。
【0013】
本発明に係る情報処理装置は、前記要約画像は、前記特徴語が関連付けられた前記特徴画像を含む。
【0014】
本発明に係る情報処理装置は、前記要約画像は、前記特徴画像の大きさに応じた態様の前記特徴語が関連付けられた前記特徴画像を含む。
【0015】
本発明に係る情報処理装置は、前記要約画像生成手段は、前記特徴画像の大きさに応じて当該特徴画像に関連付けられる前記特徴語の表示を制限する。
【0016】
本発明の請求項7に係る情報処理装置は、請求項1に記載の情報処理装置において、前記要約画像生成手段は、前記特徴画像の大きさが予め定められた閾値以下または未満の場合に、当該特徴画像に関連付けられる前記特徴語を表示させない。
【0017】
本発明の請求項8に係る情報処理装置は、請求項1に記載の情報処理装置において、前記要約画像生成手段は、前記特徴画像の大きさが予め定められた閾値以下または未満の場合に、当該特徴画像に関連付けられる前記特徴語の一部を表示させる。
【0018】
本発明に係る情報処理装置は、利用者による操作指示を受け付ける操作指示受付手段、をさらに含み、前記操作指示受付手段が、前記特徴語の表示の制限をされた前記特徴画像を指示する操作を受け付けると、前記要約画像生成手段は前記表示の制限をされた前記特徴語を表示させた前記要約画像を生成する。
【0019】
本発明に係るプログラムは、音声情報及び画像情報を含み時間とともに変化する時系列情報を複数のパートに区分する区分手段、前記区分されたパートの特徴を示す特徴画像を当該パートに含まれる前記画像情報から取得する特徴画像取得手段、前記区分されたパートの特徴を示す特徴語を当該パートに含まれる前記音声情報に基づいて取得する特徴語取得手段、前記区分されたパートの特徴語の重要度に応じた態様で表示された複数の前記特徴画像を含む要約画像を生成する要約画像生成手段、としてコンピュータを機能させるためのプログラムである。
【発明の効果】
【0020】
本発明によれば、時系列情報を区分した各パートの特徴語の重要度を利用者に把握させることができる。
【0021】
本発明の請求項2によれば、各パートにおける出現頻度に応じて特徴語を決定することができる。
【0022】
本発明によれば、特徴画像の大きさにより各パートの特徴語の重要度を利用者に把握させることができる。
【0023】
本発明の請求項3によれば、特徴画像が大きいほど特徴語の重要度が高く、特徴画像が小さいほど特徴語の重要度が低い、ことを利用者に把握させることができる。
【0024】
本発明の請求項4によれば、音声情報における特徴語の出現回数から特徴語の重要度を決定することができる。
【0025】
本発明の請求項5によれば、音声情報における特徴語の音量から特徴語の重要度を決定することができる。
【0026】
本発明の請求項6によれば、音声情報において特徴語が出現する時間の直前に無音の時間があるか否かから特徴語の重要度を決定することができる。
【0027】
本発明によれば、利用者に各パートの情報把握をさせやすくする。
【0028】
本発明によれば、特徴語の表示態様から各パートの特徴語の重要度を利用者に把握させることができる。
【0029】
本発明によれば、特徴語の重要度の低いパートについての情報量を少なくすることができる。
【0030】
本発明によれば、特徴語の重要度の低いパートについては利用者が要求したときだけ情報を提供することができる。
【発明を実施するための形態】
【0032】
以下、本発明の一実施形態について図面に基づき詳細に説明する。
【0033】
図1は、本実施形態に係る情報処理システム1のハードウェア構成の一例を示す図である。
図1に示すように、本実施形態に係る情報処理システム1は、ネットワークを介して接続されるサーバ10及び端末装置20を含んで構成される。なお、
図1においては、情報処理システム1は、1つの端末装置20のみを含んでいるが、その他複数の端末装置20を含んでいてもよい。
【0034】
サーバ10は、例えばサーバコンピュータ等の情報処理装置であって、制御部11と、記憶部12と、通信部13と、を含んで構成される。
【0035】
制御部11は、例えばCPU等であって、記憶部12に格納されるプログラムに従って各種の情報処理を実行する。
【0036】
記憶部12は、例えばRAMやEOM等のメモリ素子、ハードディスクなどを含んで構成される。記憶部12は、制御部11によって実行されるプログラムや、各種のデータを保持する。また、記憶部12は、制御部11のワークメモリとしても動作する。
【0037】
通信部13は、例えばLANカード等のネットワークインタフェースであって、LANや無線通信網などの通信手段を介して、サーバ10との間で情報の送受信を行う。なお、制御部11、記憶部12、通信部13は、それぞれバスを介して接続される。
【0038】
端末装置20は、例えばパーソナルコンピュータ等の情報処理装置であって、制御部21と、記憶部22と、通信部23と、表示部24と、操作部25と、を含んで構成される。上記各部21〜25はバスを介して接続される。なお、制御部21、記憶部22、及び通信部23は、それぞれ制御部11、記憶部12、及び通信部13と同様の構成であってよい。
【0039】
表示部24は、例えば液晶ディスプレイ、CRTディスプレイ、有機ELディスプレイ等であって、制御部21からの指示に従って、情報の表示を行う。
【0040】
操作部25は、例えばキーボード、マウス、ボタンやタッチパネル等であって、利用者の指示操作を受け付けて、当該指示操作の内容を制御部21に出力する。
【0041】
次に、本実施形態に係る情報処理システム1が実現する機能について、説明する。
図2は、本実施形態に係るサーバ10が実現する主な機能の一例を示す機能ブロック図である。
図2に示すように、サーバ10は、機能的には、時系列情報取得部50、パート区分部51、特徴語取得部52、特徴画像取得部53、特徴情報関連付け部54、重要度算出部55、表示態様設定部56、及び要約画像生成部57を含んで構成される。これらの機能は、記憶部12に記憶されたプログラムを制御部11が実行することにより実現される。
このプログラムは、例えば、磁気ディスク(HDD、FD(Flexible Disk))など)、光記録媒体(光ディスク(CD(Compact Disk)、DVD(Digital Versatile Disk))など)、光磁気記録媒体、半導体メモリ(フラッシュROMなど)などのコンピュータが読み取り可能な記録媒体を介して、あるいは、インターネットなどの通信手段を介してサーバ10に供給される。
【0042】
時系列情報取得部50は、時系列情報を取得する。ここで、時系列情報は、時間とともに変化する情報であり、本実施形態では音声情報と、複数のフレーム画像を含む画像情報と、を含む情報とする。具体的な時系列情報としては、講演を記録した講演情報や、テレビやインターネットで配信されている映像を記録した配信記録情報であってよい。当該時系列情報は、サーバ10の記憶部12に記憶されていてもよいし、端末装置20から提供されてもよい。
【0043】
パート区分部51は、時系列情報を複数のパートに区分する。パート区分部51は、時系列情報に含まれる音声情報及び画像情報を複数のパートに区分する。パート区分部51は、例えば、連続する2つのフレーム画像のカラーヒストグラムの差、画素差、離散コサイン変換などの変換係数差などを算出し、算出された差が所定の閾値以上となった場合に当該2つのフレーム画像をパートの区切りとする。
【0044】
特徴語取得部52は、パート区分部51が区分した各パートにおいて、当該パートの特徴を示す特徴語を取得する。本実施形態に係る特徴語取得部52は、音声情報に応じて特徴語を取得する。まず特徴語取得部52は、各パートの音声情報に対して音声認識を行い文字情報に変換する。そして特徴語取得部52は、変換した文字情報から特徴語を取得する。例えば、特徴語取得部52は、変換した文字情報のなかから出現する頻度の最も高い単語を特徴語として抽出する。
【0045】
特徴画像取得部53は、パート区分部51が区分した各パートにおいて、当該パートの特徴を示す特徴画像を取得する。特徴画像取得部53は、特徴語取得部52が取得した特徴語に対応するフレーム画像を特徴画像として取得する。具体的には、特徴画像取得部53は、音声情報における特徴語の出現位置を取得し、当該出現位置に対応するフレーム画像を特徴画像として取得する。なお特徴画像取得部53は、画像情報に基づいて特徴画像を取得してもよい。例えば特徴画像取得部53は、パートにおいて最初に出現するフレーム画像を特徴画像として取得してもよいし、パートに含まれる複数のフレーム画像から所定の基準を満たすフレーム画像を特徴画像として取得してもよい。
【0046】
特徴情報関連付け部54は、特徴語取得部52が取得した特徴語と、特徴画像取得部53が取得した特徴画像と、を関連付けた関連付け情報を関連付け情報記憶部に保存する。
関連付け情報は、パート毎に特徴語と特徴画像とが関連付けられていることとする。関連付け情報には、パート毎に特徴語や特徴画像に関連する情報がさらに関連付けられてもよい。例えば時系列情報において特徴語が出現する出現位置(例えば再生時間など)や、時系列情報において特徴画像が出現する出現位置などが関連付けられてもよい。
【0047】
重要度算出部55は、パート区分部51が区分した各パートの重要度を算出する。重要度算出部55は、特徴語取得部52が取得した特徴語に基づいて各パートの重要度を算出する。例えば、重要度算出部55は、音声情報において特徴語が出現する時間の音量に基づいて重要度を算出する。具体的には重要度算出部55は、特徴語が出現する時間の音量が大きいほど重要度を高く算出し、特徴語が出現する時間の音量が小さいほど重要度を低く算出する。これは音量が大きいほど主張したい内容が含まれていると考えられるからである。また重要度算出部55は、音声情報において特徴語が出現する時間の直前に無音の時間があるか否かにより重要度を算出してもよい。具体的には重要度算出部55は、特徴語が出現する時間の直前に無音の時間がある場合に重要度を高く算出する。これは時系列情報が講演の記録である場合など、聴衆の注意を惹きつけるためにあえて沈黙していると判断し、無音の時間の後に主張したい内容が含まれていると考えられるからである。また重要度算出部55は、各パートにおける特徴語の出現回数に応じて重要度を算出してもよい。これは、パート内における特徴語の出現回数が多いほど、該パートの特徴語が重要だと考えられるからである。なお、重要度算出部55は、特徴画像に基づいて重要度を算出してもよい。例えば重要度算出部55は、特徴画像のカラーヒストグラムや画像分布等から重要度を算出してもよい。また重要度算出部55は、上述した重要度算出手法の2つ以上を組み合わせて各パートの重要度を算出してもよい。例えば、重要度算出部55は、特徴語と特徴画像とに基づいて重要度を算出してもよい。
【0048】
表示態様設定部56は、要約画像生成部57が複数の特徴画像を用いて時系列情報の要約を表す要約画像を生成する際の、各特徴画像の表示態様を設定する。そして、要約画像生成部57は、表示態様設定部56が設定した表示態様にしたがって要約画像を生成する。
【0049】
表示態様設定部56は、重要度算出部55が算出した各パートの重要度に基づいて、各特徴画像の表示態様を設定する。具体的には表示態様設定部56は、複数の特徴画像の大きさを重要度に応じて異ならせる。つまり表示態様設定部56は、重要度の高いパートの特徴画像を大きく、重要度の低いパートの特徴画像を小さく表示されるよう設定する。
【0050】
図3は、本実施形態に係る要約画像100の一例を示す図である。
図3に示す要約画像100は、複数のコマ110を含み、各コマ110に特徴画像が表示される。複数のコマ110は、それぞれ大きさが異なっており、例えばコマ110aはコマ110bより大きい。そして複数の特徴画像は、各コマ110の大きさに応じてそれぞれ異なる大きさで表示されている。これらコマの大きさ、特徴画像の大きさは上述したように重要度に応じて設定されている。なお、表示態様設定部56は、特徴画像の大きさを設定してもよいし、要約画像100の各コマ110の大きさを設定してもよい。表示態様設定部56が各コマ110の大きさを設定する場合は、要約画像生成部57が各特徴画像を対応するコマ110に応じた大きさに変換して表示させればよい。
【0051】
図3に示すような要約画像100は、ネットワークを介して端末装置20へ送信され、端末装置20の表示部24に表示される。端末装置20の利用者は、端末装置20の表示部24に表示された要約画像100を見ることができる。そして、利用者がいずれかの特徴画像を選択すると、当該特徴画像の出現位置から時系列情報が再生され利用者が視聴できるようになっている。このように利用者はコマ割りされた特徴画像の大きさから重要度を判断することができ、重要度に応じて再生位置を選択することが可能となる。
【0052】
また、表示態様設定部56は、要約画像100における複数の特徴画像それぞれの表示位置を設定してもよい。例えば表示態様設定部56は、時系列順に特徴画像が並ぶように各特徴画像の表示位置を設定してもよい。また表示態様設定部56は、特徴画像の大きさに応じて各特徴画像の表示位置を設定してもよい。例えば表示態様設定部56は特徴画像の大きさが大きい順に並ぶよう各特徴画像の表示位置を設定してもよいし、最も大きい特徴画像が要約画像100の中心に位置するよう各特徴画像の表示位置を設定してもよい。
【0053】
また、
図3に示す要約画像100において各特徴画像に当該特徴画像に関連付けられている特徴語を文字で示した文字画像を重畳して表示させる場合がある。このとき、特徴画像の大きさが予め定められた閾値以下または未満の場合に、特徴語文字をすべて表示できないことがある。例えば、特徴語の文字数に対して特徴画像が小さいと、特徴語の文字をすべて表示できない場合がある。そこで、表示態様設定部56は、各特徴画像の大きさに応じて文字画像を調整する。例えば表示態様設定部56は、特徴画像の大きさに応じて特徴語の文字がすべて表示されるよう文字画像のサイズを小さくする。また表示態様設定部56は、特徴画像の大きさに対して特徴語の文字をすべて表示できない場合には、文字画像の表示を制限させてもよい。この場合、要約画像100を見た利用者が、文字画像の表示が制限されている特徴画像にマウスオーバーすると、文字画像が表示されるようにしてもよい。これらの具体的な処理については後述する。
【0054】
ここで、本実施形態に係るサーバ10が実行する要約画像生成処理の一例について
図4に示すフロー図を用いて説明する。
【0055】
まず、時系列情報取得部50が、時系列情報を取得する(S101)。ここで時系列情報は、音声情報と、複数のフレーム画像を含む画像情報と、を含む。
【0056】
パート区分部51は、時系列情報取得部50が取得した時系列情報を複数のパートに区分する(S102)。ここでパート区分部51は、時系列情報をK個のパートに区分し、区分した各パートに時系列順に1〜Kの番号を付す。
【0057】
そして、変数nにn=1の初期値が設定され(S103)、特徴情報取得処理が実行される(S104)。ここで変数nは、1以上の整数値をとるカウンタ変数である。
【0058】
本実施形態に係るサーバが実行する特徴情報取得処理の一例については
図5のフロー図を用いて説明する。ここで特徴情報取得処理により取得される特徴情報は各パートの特徴を示す情報であり、本実施形態においては特徴語と特徴画像とが取得される。
【0059】
まず特徴語取得部52は、n番目パートの音声情報を取得する(S201)。
【0060】
次に特徴語取得部52は、n番目パートの音声情報を音声認識することで文字情報に変換する(S202)。
【0061】
そして特徴情報取得部は、処理S202において得られた文字情報から、n番目パートの特徴を示す特徴語を抽出する(S203)。
【0062】
次に特徴画像取得部53は、処理S203において得られた特徴語の、音声情報における出現位置を取得し、当該出現位置に対応するフレーム画像をn番目パートの特徴を示す特徴画像として取得する(S204)。
【0063】
そして、特徴情報関連付け部54が、処理S203において取得された特徴語と、処理S204において取得された特徴画像と、を関連付けて(S205)、リターンする。ここで特徴情報関連付け部54は、パートを識別する番号と、特徴語と、特徴画像と、を関連付けた関連付け情報を記憶部に記憶することとする。
【0064】
処理S104における特徴情報抽出処理が終了すると、n=Kが成立するか否かが判断される(S105)。つまりK個のパートすべてにおいて特徴情報抽出処理が行われたかを判断される。
【0065】
処理S105の判断の結果、n=Kが成立しないと判断された場合は(S105:N)、変数nに1が加算され(S106)、処理S104以降の処理が繰り返し実行される。
【0066】
処理S105の判断の結果、n=Kが成立すると判断された場合は(S105:Y)、重要度算出部55がK個のパートそれぞれについての重要度を算出する(S107)。ここで重要度算出部55により算出された重要度は、関連付け情報に追加して関連付けられて記憶されることとする。
【0067】
そして、表示態様設定処理が実行される(S108)。本実施形態に係るサーバが実行する表示態様設定処理の一例については
図6のフロー図を用いて説明する。
【0068】
図6に示すように、まず、表示態様設定部56は、処理S107において重要度算出部55が算出した各パートの重要度に基づいて、各パートの特徴画像を表示させるコマ110の大きさを設定する(S301)。ここでは表示態様設定部56は、K個のパートにそれぞれ対応するK個のコマ110の大きさを設定する。例えば表示態様設定部56は、重要度の高いパートに対応するコマ110を大きく、重要度の低いパートに対応するコマ110を小さく設定する。ここで表示態様設定部56が設定した情報は各パートの関連付け情報に追加して関連付ける。
【0069】
次に、変数mにm=1の初期値が設定される(S302)。ここで変数mは、1以上の整数値をとるカウンタ変数である。
【0070】
そして表示態様設定部56は、mパートの特徴語の文字数を算出する(S303)。また表示態様設定部56は、mパートに対応するコマ110に文字を配置する際の配置可能な文字数を算出する(S304)。ここでコマ110に配置可能な文字数は、コマ110の大きさと使用する文字サイズとに応じて予め定められていることとする。
【0071】
そして配置可能な文字数が、特徴語の文字数以上となるかが判断される(S305)。
つまり処理S301において設定されたコマ110に特徴語の文字をすべて配置することができるかが判断される。
【0072】
処理S305の判断の結果、配置可能な文字数が特徴語の文字数以上となる場合は(S305:Y)、表示態様設定部56は、特徴語の文字を示す特徴語文字データを特徴画像に関連付ける(S306)。ここで表示態様設定部56は、mパートに対応する関連付け情報に特徴語文字データを追加して関連付けて記憶する。特徴語文字データは、文字のフォント、配置位置等の情報を含んでいてもよい。なお表示態様設定部56が、特徴語文字データを関連付けた特徴画像を新たに生成して記憶してもよい。
【0073】
そして、m=Kが成立するか否かが判断される(S307)。つまりK個のパートすべてにおいて特徴語文字データが関連付けられたか判断される。
【0074】
処理S307の判断の結果、m=Kが成立しないと判断された場合は(S307:N)、変数mに1が加算され(S308)、処理S303以降の処理が繰り返し実行される。
【0075】
処理S307の判断の結果、m=Kが成立すると判断された場合は(S307:Y)、リターンする。
【0076】
また、処理S305の判断の結果、配置可能な文字数が特徴語の文字数より少ない場合は(S305:N)、表示態様設定部56は、コマ110に配置する特徴語の文字を示す特徴語文字データを調整する(S309)。例えば表示態様設定部56は、特徴語文字データの文字サイズを、コマ110に配置可能なサイズに変更する。そして、処理S307以降の処理を実行する。なお、表示態様設定部56は、特徴語の一部を特徴語文字データとして特徴画像に関連付けてもよい。また表示態様設定部56は、特徴語文字データが示す特徴語の文字をテロップ表示させるよう設定してもよい。
【0077】
表示態様設定処理が終了すると、要約画像生成部57が表示態様設定処理において設定された表示態様に従って要約画像100を生成し(S109)、要約画像生成処理が終了する。ここでは要約画像生成部57は、関連付け情報のパート毎に、関連付けられている各種情報に従って要約画像100を生成すればよい。
【0078】
図7は、本実施形態に係る要約画像100の一例を示す図である。
図7は、処理S109において要約画像生成部57が生成する要約画像100の一例を示している。
図7に示す要約画像100は、各コマ110の特徴画像に特徴語文字データに対応する特徴語文字画像200が重畳されている。そして、小さいコマ110bの特徴画像に重畳されている特徴語文字画像200bは、大きいコマ110aの特徴画像に重畳されている特徴語文字画像200aより文字サイズが小さくなっている。このように小さいコマ110bの特徴画像にも特徴語の文字をすべて表示させることで、利用者に各パートの情報把握をさせやすくする。
【0079】
次に、本実施形態に係るサーバが実行する表示態様設定処理の他の例について
図8のフロー図を用いて説明する。ここでは特徴画像に特徴語文字画像を重畳させない場合の処理について説明する。
【0080】
まず表示態様設定部56は、処理S107において重要度算出部55が算出した各パートの重要度に基づいて、各パートの特徴画像を表示させるコマ110の大きさを設定する
(S401)。
【0081】
次に表示態様設定部56は、特徴語文字画像を重畳させないパートを選択する(S402)。ここでは表示態様設定部56は、配置可能文字数が特徴語文字数より少ないパートを選択する。なお、表示態様設定部56は、すべてのパートを選択してもよい。
【0082】
そして表示態様設定部56は、特徴語文字画像を重畳させないパートについて、特徴語文字画像の代わりに重畳させる代替データを生成する(S403)。ここで代替データは、特徴語文字画像は重畳されていないが文字情報が存在することを、要約画像100を見る利用者に知らせるためのものである。代替データとしては、例えば画像アイコンや、「・・・」などの文字データとする。
【0083】
そして表示態様設定部56は、表示文字データを生成する(S404)。表示文字データは、利用者が特徴語文字画像を重畳させていない特徴画像を選択する操作指示(例えばマウスオーバー操作など)を行った場合に、表示させるものである。表示文字データは、特徴語の文字を示すものであってもよいし、パートに含まれる音声情報を音声認識により変換した文字情報を示すものであってもよい。
【0084】
表示態様設定部56は、処理S403において生成した代替データと、表示文字データとを特徴画像に関連付けて(S404)、リターンする。ここで表示態様設定部56は、各パートに対応する関連付け情報に代替データ及び表示文字データを追加して関連付けて記憶する。
【0085】
図9は、本実施形態に係る要約画像100の一例を示す図である。
図9は、要約画像生成部57が、
図8に示した表示態様設定処理により設定された表示態様に従って生成した要約画像100の一例を示している。
図9に示す要約画像100において、小さいコマ110bの特徴画像には代替データに対応する代替データ画像300が重畳されている。ここで利用者がマウスオーバー操作等により代替データ画像300を選択すると、当該操作指示が端末装置20からサーバ10へ送信される。サーバ10が操作指示を受け付けると、要約画像生成部57が表示文字データに対応する表示文字画像400を重畳させた要約画像100を生成する。そして生成された要約画像は端末装置20へ送信される。そして表示文字画像400が重畳された要約画像100が端末装置20の表示部24に表示される。なお表示文字画像400は、表示文字データが示す文字がテロップ表示されるよう構成されていてもよい。
【0086】
またサーバ10が、利用者によるマウスオーバー操作等により代替データ画像300を選択する操作指示を受け付けると、要約画像生成部57が表示文字データに対応する表示文字画像400を生成して端末装置20へ送信することとしてもよい。
【0087】
本発明は、上記の実施形態に限定されるものではない。
【0088】
例えば、処理S305において配置可能な文字数が、特徴語の文字数より少ない場合に、特徴語を変更してもよい。ここでは特徴情報取得処理を実行させて、特徴語取得部52が表示態様設定部56の設定した大きさのコマに配置される特徴語を取得してもよい。
【0089】
また、上記の実施形態では、サーバ10と端末装置20とが別体の例を示したが、サーバ10と端末装置20とが一体の装置であってもよい。