(58)【調査した分野】(Int.Cl.,DB名)
前記重み付け部は、前記視聴状況に基づいて、前記時間帯のうちユーザが実際に視聴している時間割合に応じて、前記抽出された単語それぞれに対して更に重みを付与する請求項1又は請求項2に記載の情報出力装置。
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、字幕情報のみに基づいてキーワードを抽出する場合、視聴者が実際に興味を持った内容とは無関係に、番組で一律に、いずれの視聴者に対しても同一のキーワードが出力される。
また、たとえ前述の視聴状況の情報に基づいて視聴者が興味を持ったキーワードを絞り込んだとしても、これらの中から実際に興味を持ったキーワードを特定することは難しかった。
【0006】
本発明は、番組放送内で視聴者それぞれが興味を持ったキーワードを、精度良く出力できる情報出力装置及び情報出力プログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明に係る情報出力装置は、放送データからテキスト情報を取得する取得部と、ユーザの視聴状況に基づいて選択される時間帯に対応したテキスト情報を選択する選択部と、前記テキスト情報を形態素解析することにより、前記選択された時間帯に対応した単語を抽出する抽出部と、前記抽出された単語それぞれに対して、所定のデータベースで提供される指標に応じた重みを付与する重み付け部と、前記抽出された単語を、前記重みに基づく優先順位で出力する出力部と、前記出力された単語の中から選択を受け付ける受付部と、前記選択された単語が属するカテゴリに対応するカテゴリ履歴カウントに加算する更新部と、を備え、前記重み付け部は、前記カテゴリ履歴カウントの相対量に応じて前記重みを付与する。
【0008】
この構成によれば、情報出力装置は、ユーザの視聴状況及び選択操作に基づくキーワードへの重み付けにより、番組放送内で視聴者それぞれが興味を持ったキーワードを、精度良く出力できる。特に、情報出力装置は、選択されたキーワードのカテゴリ履歴カウントを更新して重み付けに反映することにより、ユーザ毎に特化した興味キーワードの出力精度を向上できる。
【0009】
前記更新部は、前記抽出された単語に対応するワード履歴カウントに加算し、前記重み付け部は、前記ワード履歴カウントに応じて前記重みを付与してもよい。
【0010】
この構成によれば、情報出力装置は、抽出されたキーワードに対応するワード履歴カウントを更新して重み付けに反映することにより、ユーザ毎に特化した興味キーワードの出力精度を向上できる。
【0011】
前記重み付け部は、前記視聴状況に基づいて、前記時間帯のうちユーザが実際に視聴している時間割合に応じて、前記抽出された単語それぞれに対して更に重みを付与してもよい。
【0012】
この構成によれば、情報出力装置は、視聴状況に基づいて、ユーザが実際に視聴している時間割合に応じてキーワードに対する重み付けを行うので、番組内でユーザが実際に視聴した内容に関するキーワードを精度良く出力できる。
【0013】
前記重み付け部は、前記抽出された単語の出現頻度に基づく重要度の指標に応じて前記重みを付与してもよい。
【0014】
この構成によれば、情報出力装置は、抽出されたキーワードの出現頻度に基づく重要度の指標、例えばTF−IDFに応じて重みを付与するので、重要度が高くユーザが興味を持つ可能性が高いキーワードが優先され、利便性が向上する。
【0015】
前記出力部は、予め設定された所定数の単語を出力してもよい。
【0016】
この構成によれば、情報出力装置は、出力するキーワードの数を初期設定するので、例えば、端末が有する画面サイズに応じて、適切な出力を行える。
【0017】
前記出力部は、前記受付部により過去に選択を受け付けた単語を除外して出力してもよい。
【0018】
この構成によれば、情報出力装置は、ユーザが番組視聴中に一度選択したキーワードを除外して出力するので、既に検索等のサービスを利用したキーワードを、不必要に重複して出力することを抑制でき、他のキーワードの出力を優先して利便性を向上できる。
【0019】
前記重み付け部は、前記抽出された単語それぞれの入力難易度を示す指標に応じて前記重みを付与してもよい。
【0020】
この構成によれば、情報出力装置は、キーワードそれぞれの入力難易度に応じて重みを付与するので、ユーザによる検索キーワードの入力等の手間を削減でき、利便性を向上できる。
【0021】
本発明に係る情報出力プログラムは、放送データに含まれる単語をコンピュータに出力させるためのプログラムであって、前記コンピュータの制御部に、放送データからテキスト情報を取得する取得ステップと、ユーザの視聴状況に基づいて選択される時間帯に対応したテキスト情報を選択する選択ステップと、前記テキスト情報を形態素解析することにより、前記選択された時間帯に対応した単語を抽出する抽出ステップと、前記抽出された単語それぞれに対して、所定のデータベースで提供される指標に応じた重みを付与する重み付けステップと、前記抽出された単語を、前記重みに基づく優先順位で出力する出力ステップと、前記出力された単語の中から選択を受け付ける受付ステップと、前記選択された単語が属するカテゴリに対応するカテゴリ履歴カウントに加算する更新ステップと、を実行させ、前記重み付けステップにおいて、前記カテゴリ履歴カウントの相対量に応じて前記重みを付与させる。
【発明の効果】
【0022】
本発明によれば、番組放送内で視聴者それぞれが興味を持ったキーワードを、精度良く出力できる。
【発明を実施するための形態】
【0024】
以下、本発明の実施形態の一例について説明する。
図1は、本実施形態に係る情報端末1(情報出力装置)を含む視聴システム100の構成を示す図である。
【0025】
視聴システム100では、受信機2により番組の放送信号が受信され、ユーザが視聴する。このとき、番組情報及びユーザ情報が管理サーバ3へ通知されることにより、ユーザが視聴している番組の字幕情報が管理サーバ3から情報端末1へ送信される。
また、情報端末1は、カメラ画像等からユーザの視聴状況を定期的に取得すると共に、字幕情報に含まれるキーワードに対する重み付けの指標を管理サーバから取得し、ユーザそれぞれに適したキーワード群を出力する。
【0026】
図2は、本実施形態に係る情報端末1の機能構成を示す図である。
情報端末1は、取得部11と、選択部12と、抽出部13と、重み付け部14と、出力部15と、受付部16と、更新部17と、履歴データベース(DB)18とを備える。
【0027】
取得部11は、管理サーバ3が管理している番組の放送データからテキスト情報を取得する。テキスト情報とは、例えば字幕DB31に記録されている字幕情報、又は画像内から抽出されるテロップ等である。
なお、取得部11は、テキスト情報を受信機2から直接受信してもよい。
【0028】
選択部12は、ユーザの視聴状況に基づいて選択される時間帯に対応したテキスト情報を選択する。具体的には、選択部12は、カメラ画像の解析結果等により、単位時間当たりにユーザが番組を注視していると判断される時間の割合が所定の閾値を超えている場合、この単位時間をユーザが視聴している時間帯として選択する。
【0029】
抽出部13は、テキスト情報を形態素解析することにより、選択された時間帯に対応したキーワードを抽出する。
【0030】
図3は、本実施形態に係るキーワード群の取得方法を例示する図である。
この例では、情報端末1は、番組の字幕情報からキーワード群を取得している。
【0031】
字幕情報は、番組の進行に連動して時刻情報と共に取得される。視聴状況に基づいて、ユーザが視聴していると判定される時間帯が選択されると、選択された各時間帯に対応した字幕情報から、形態素解析によってキーワード群が抽出される。
【0032】
なお、生放送の番組等で字幕情報が番組の進行より遅延して送信されている場合、番組の画像及び音声と対応付けるために、選択部12は、視聴時間帯の所定時間後の字幕情報を選択する。
【0033】
重み付け部14は、抽出されたキーワードそれぞれに対して、所定のデータベース、例えばキーワード毎のカテゴリを定めたカテゴリDB32、又はキーワードの希少性を示すIDFの値を記憶したIDF−DB33等で提供される指標に応じた重みを付与する。
具体的には、重み付け部14は、後述の履歴DB18に記憶されたカテゴリ履歴カウントの相対量及びワード履歴カウント、並びに抽出されたキーワードの出現頻度に基づく重要度の指標(例えば、後述のTF−IDF)に応じて重みを付与する。
【0034】
また、重み付け部14は、視聴状況度合い、すなわち単位時間のうちユーザが実際に視聴していると判定された時間の割合に応じて、抽出されたキーワードそれぞれに対して更に重みを付与する。
さらに、重み付け部14は、抽出されたキーワードそれぞれの入力難易度を示す指標に応じて重みを付与してもよい。例えば、文字数の多い単語、又は難読漢字を含む単語等は、特に携帯端末においては入力することが容易ではないため、選択により検索キーワード等が指定できることで利便性が向上する。
【0035】
図4は、本実施形態に係るキーワードのカテゴリ及びTF−IDFの取得方法を例示する図である。
【0036】
ユーザが視聴していた時間帯に対応したキーワードのそれぞれについて、IDF−DB33からIDFが、カテゴリDB32からカテゴリデータが取得され、重み付けの指標としてキーワードに対応付けられる。
【0037】
また、単位時間内におけるキーワードの出現頻度としてTFが算出され、重み付けの指標としてキーワードに対応付けられる。
例えば、「北海道」は、単位時間内の計11ワード中、1回出現しているので、TFは「1/11」と算出される。同様に、「砂丘林」は、単位時間内の計11ワード中、2回出現しているので、TFは「2/11」と算出される。
【0038】
ここで、TF−IDFは、単位時間内におけるキーワードの出現頻度を示すTFと、管理対象の全番組(例えば、指定期間分の番組)におけるキーワードの希少性、すなわちキーワードを含む番組の少なさを示すIDFとの積により定義される、キーワードの重要度の指標である。
【0039】
なお、カテゴリDB32は、予め手作業により準備されてもよいし、所定のWebサイトの情報等、外部のデータベースから取得して準備されてもよい。
【0040】
出力部15は、抽出されたキーワードを、重み付け部14により付与された重みに基づく優先順位でディスプレイ等に出力する。
このとき、出力部15は、予め設定された所定数のキーワードを出力する。この所定数は、例えば、初期設定値、ユーザにより入力された値、又は情報端末1の表示部の仕様に基づいて決定された値であってよい。
また、出力部15は、受付部16により過去に選択を受け付けたキーワードを除外して出力してもよい。
【0041】
図5は、本実施形態に係るキーワードの重み付け及び出力の方法を例示する図である。
重み付け部14は、各キーワードに対して、後述のカテゴリ履歴カウントに対応した値(CatCn)、ワード履歴カウントに対応した値(WdCn)、視聴状況度合い(Gaze)及びTF−IDFを掛け合わせ、重みとして算出する。
なお、カテゴリ履歴又はワード履歴が存在しない場合、重み付け部14は、対応する値を「1」として重みを算出する。
【0042】
出力部15は、算出された重みの値が大きい順に、出力用の並べ替えを行う(a)。さらに、出力部15は、「操作ON」フラグが「1」になっているキーワード(この例では、「北海道」)を除外した上で(b)、並べ替えたキーワード群のうち上位から所定数を出力する(c)。
ここで、「操作ON」フラグは、出力されたキーワード群のうち、ユーザの操作により検索処理等のために選択されたキーワードに対して「1」が設定される。
【0043】
受付部16は、出力されたキーワード群の中から、ユーザによる選択を受け付ける。ユーザは、キーワードを選択することにより、情報端末1において、このキーワードによる検索処理を実行し、関連情報を収集できる。
【0044】
更新部17は、抽出されたキーワードに対応するワード履歴カウントに加算すると共に、選択されたキーワードが属するカテゴリに対応するカテゴリ履歴カウントに加算する。
【0045】
履歴DB18は、更新部17によって更新されるワード履歴カウント及び操作ONフラグを含むワードリスト、並びにカテゴリ履歴カウントを、ユーザ毎の履歴情報として記憶する。
【0046】
図6は、本実施形態に係るカテゴリ履歴カウント及びワード履歴カウントの更新方法を例示する図である。
【0047】
更新部17は、例えば、
図5の出力例において「サロベツ」が選択された際に、このキーワードのカテゴリ「場所」に対応するカテゴリ履歴カウント「10」に「1」を加算する。
重み付け部14は、このカテゴリ履歴カウントに対応した重みの値(CatCn)として、例えば、選択されたキーワードのカテゴリに対する履歴カウントを、全カテゴリの履歴カウント総数で除した値を採用する。したがって、全カテゴリに対する「場所」の割合、すなわち相対量が増加するので、重み付け部14により算出される重みが増加する。
【0048】
さらに、更新部17は、ワードリストに、選択されたキーワード「サロベツ」のレコードを追加する。このとき、既にレコードがある場合、更新部17は、履歴カウントに1を加算して更新するが、レコードがない場合、履歴カウントを「2」としてレコードを追加する。
重み付け部14は、この履歴カウントの値を、キーワードそのものの重要度を示す指標(WdCn)として、重みに掛け合わせる。
【0049】
また、更新部17は、ワードリストにおいて、キーワードが選択操作されたことを示す「操作ON」フラグを「1」に設定する。なお、この「操作ON」フラグは、番組が終了した際に「0」に初期化されてよい。
【0050】
この更新方法の例では、キーワードが選択されたことを契機としてカテゴリ履歴カウント及びワード履歴カウントが更新されたが、これには限られず、例えば、出力部15によるキーワードの出力を契機に更新されてもよい。
【0051】
図7は、本実施形態に係るキーワード出力処理の流れを示すフローチャートである。
ステップS1において、情報端末1は、初期設定情報の入力を受け付ける。初期設定情報は、例えば、キーワードの画面出力数の制限、視聴状況を判定するための単位時間、又は重み付けのための指標のいずれを優先するか等の情報を含んでよい。
【0052】
ステップS2において、取得部11は、管理サーバ3から、番組の設定された単位時間毎の字幕情報を取得する。
【0053】
ステップS3において、選択部12は、受信機2に設置されたカメラの画像を解析した結果として、設定された単位時間内にユーザが番組を注視していた度合いを示す視聴状況を取得する。
【0054】
ステップS4において、選択部12は、ステップS3で取得した視聴状況に関して、単位時間のうち注視している時間の割合が所定の閾値を超えているか否かを判定する。この判定がYESの場合、処理はステップS5に移り、判定がNOの場合、処理はステップS11に移る。
【0055】
ステップS5において、抽出部13は、注視している時間の割合が所定の閾値を超えており、視聴していると判定された時間帯に対する字幕情報から、形態素解析によりキーワード群を抽出する。
【0056】
ステップS6において、重み付け部14は、抽出されたキーワードそれぞれに対応して、カテゴリDB32からキーワードのカテゴリを、IDF−DB33からキーワードのIDF値を取得する。
また、重み付け部14は、TFとして、単位時間内にキーワードが出現した頻度を示す値を算出する。
【0057】
ステップS7において、重み付け部14は、ステップS6で得られたカテゴリに対応するカテゴリ履歴カウントの相対量(CatCn)、ワード履歴カウント(WdCn)、視聴状況に基づく注視度合い(Gaze)及びTF−IDFを掛け合わせ、キーワードそれぞれに対する重み値を算出する。
【0058】
ステップS8において、出力部15は、ステップS7で付与された重みの大きい順にキーワードをソートし、操作ONフラグが1のキーワードを除外した上で、初期設定情報で予め設定された上位所定数を出力する。
【0059】
ステップS9において、受付部16は、出力されたキーワード群からの選択操作があったか否かを判定する。この選択操作は、キーワード検索等の所定のサービスへの入力となり、ユーザへ検索結果等の情報が提供される。判定がYESの場合、処理はステップS10に移り、判定がNOの場合、処理はステップS11に移る。
【0060】
ステップS10において、更新部17は、ステップS9で選択操作を受け付けたキーワードに関して、ユーザ毎のカテゴリ履歴カウント及びワード履歴カウントを更新する。さらに、更新部17は、選択されたキーワードの操作ONフラグを「1」に更新する。
【0061】
ステップS11において、情報端末1は、キーワード出力処理を終了するか否かを判定する。例えば、放送中の番組が終了した場合、又はユーザにより明示的に終了が指示された場合に本処理を終了すると判定される。この判定がYESの場合、処理は終了し、判定がNOの場合、処理はステップS2に戻る。
【0062】
本実施形態によれば、情報端末1は、ユーザの視聴状況及び選択操作に基づくキーワードへの重み付けにより、番組放送内で視聴者それぞれが興味を持ったキーワードを、精度良く出力できる。
特に、情報端末1は、選択されたキーワードのカテゴリ履歴カウントを更新して重み付けに反映することにより、ユーザ毎に特化した興味キーワードの出力精度を向上できる。
【0063】
また、情報端末1は、抽出されたキーワードに対応するワード履歴カウントを更新して重み付けに反映することにより、ユーザ毎に特化した興味キーワードの出力精度を向上できる。
【0064】
情報端末1は、視聴状況に基づいて、ユーザが実際に視聴している時間割合に応じてキーワードに対する重み付けを行うので、番組内でユーザが実際に視聴した内容に関するキーワードを精度良く出力できる。
【0065】
情報端末1は、抽出されたキーワードの出現頻度に基づく重要度の指標、例えばTF−IDFに応じて重みを付与するので、重要度が高くユーザが興味を持つ可能性が高いキーワードが優先され、利便性が向上する。
【0066】
情報端末1は、出力するキーワードの数を初期設定するので、例えば、端末が有する画面サイズに応じて、適切な出力を行える。
【0067】
情報端末1は、ユーザが番組視聴中に一度選択したキーワードを除外して出力するので、既に検索等のサービスを利用したキーワードを、不必要に重複して出力することを抑制でき、他のキーワードの出力を優先して利便性を向上できる。
【0068】
情報端末1は、キーワードそれぞれの入力難易度に応じて重みを付与するので、ユーザによる検索キーワードの入力等の手間を削減でき、利便性を向上できる。
【0069】
このように、情報端末1は、ユーザ毎に番組内で興味を持ったキーワードを効率良く出力することが可能であり、さらに、出力されたキーワードにアクセスした情報も取り入れて、個人に特化した情報として蓄積することができる。これにより、ユーザは、個人の興味に合ったキーワードによる調べ物ができる。
【0070】
以上、本発明の実施形態について説明したが、本発明は前述した実施形態に限るものではない。また、本実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本実施形態に記載されたものに限定されるものではない。
【0071】
情報端末1は、パーソナルコンピュータ、タブレット端末、スマートフォン等、通信により番組情報を取得可能な様々な情報処理端末であってよい。また、情報端末1は、受信機2と一体型であってもよい。
また、前述の実施形態では、履歴DB18は、情報端末1が備える構成としたが、これには限られず、外部サーバ、例えば管理サーバ3が備えていてもよい。
【0072】
本実施形態では、主に情報出力装置の構成と動作について説明したが、本発明はこれに限られず、各構成要素を備え、番組に関するユーザ個人に特化したキーワードを出力するための方法、又はプログラムとして構成されてもよい。
【0073】
さらに、情報出力装置の機能を実現するためのプログラムをコンピュータで読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。
【0074】
ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータで読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
【0075】
さらに、「コンピュータで読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時刻の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時刻プログラムを保持しているものも含んでもよい。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。