IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ NECパーソナルコンピュータ株式会社の特許一覧

<>
  • 特許-映像表示装置 図1
  • 特許-映像表示装置 図2
  • 特許-映像表示装置 図3
  • 特許-映像表示装置 図4
  • 特許-映像表示装置 図5
  • 特許-映像表示装置 図6
  • 特許-映像表示装置 図7
  • 特許-映像表示装置 図8
  • 特許-映像表示装置 図9
  • 特許-映像表示装置 図10
  • 特許-映像表示装置 図11
  • 特許-映像表示装置 図12
  • 特許-映像表示装置 図13
  • 特許-映像表示装置 図14
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-08-30
(45)【発行日】2022-09-07
(54)【発明の名称】映像表示装置
(51)【国際特許分類】
   G10L 15/06 20130101AFI20220831BHJP
   H04N 21/439 20110101ALI20220831BHJP
   H04N 21/482 20110101ALI20220831BHJP
   G10L 15/00 20130101ALI20220831BHJP
   G10L 15/28 20130101ALI20220831BHJP
   G06F 3/16 20060101ALI20220831BHJP
【FI】
G10L15/06 300Y
H04N21/439
H04N21/482
G10L15/00 200G
G10L15/28 500
G06F3/16 650
G06F3/16 630
【請求項の数】 7
(21)【出願番号】P 2020087237
(22)【出願日】2020-05-19
(65)【公開番号】P2021182068
(43)【公開日】2021-11-25
【審査請求日】2021-04-19
(73)【特許権者】
【識別番号】311012169
【氏名又は名称】NECパーソナルコンピュータ株式会社
(74)【代理人】
【識別番号】100112737
【弁理士】
【氏名又は名称】藤田 考晴
(74)【代理人】
【識別番号】100140914
【弁理士】
【氏名又は名称】三苫 貴織
(74)【代理人】
【識別番号】100136168
【弁理士】
【氏名又は名称】川上 美紀
(74)【代理人】
【識別番号】100172524
【弁理士】
【氏名又は名称】長田 大輔
(72)【発明者】
【氏名】酒井 祐一
【審査官】中村 天真
(56)【参考文献】
【文献】特開2001-022374(JP,A)
【文献】特開2018-078652(JP,A)
【文献】国際公開第2017/179335(WO,A1)
【文献】特開2007-235912(JP,A)
【文献】特開2014-021475(JP,A)
【文献】特開2004-334409(JP,A)
【文献】特開2004-295102(JP,A)
【文献】特開2004-294872(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 15/00-15/34
G06F 3/16
H04N 7/10- 7/56
21/00-21/858
IEEE Xplore
(57)【特許請求の範囲】
【請求項1】
番組を特定するための番組キーワードと、前記番組に対するアクションを特定するためのアクションキーワードとが関連付けられた音声コマンド辞書を作成する辞書作成部と、
前記音声コマンド辞書を用いて音声認識を行い、音声コマンドを決定する音声認識処理部と、
決定された前記音声コマンドを実行するコマンド実行部と
を具備し、
前記音声認識処理部は、音声認識結果として得られた音声コマンド候補に含まれる番組の放送時刻から特定されるアクションと、該音声コマンド候補のアクションとが合致するか否かに応じて、音声認識結果として得る前記音声コマンドを決定する映像表示装置。
【請求項2】
番組を特定するための番組キーワードと、前記番組に対するアクションを特定するためのアクションキーワードとが関連付けられた音声コマンド辞書を作成する辞書作成部と、
前記音声コマンド辞書を用いて音声認識を行い、音声コマンドを決定する音声認識処理部と、
決定された前記音声コマンドを実行するコマンド実行部と
を具備し、
前記音声認識処理部は、音声認識結果として番組が特定された場合に、特定した番組の放送時刻に基づいて放送状況を特定し、特定した放送状況に関連するアクションキーワードをユーザに通知し、
ユーザによって選択された前記アクションキーワードを用いて前記音声コマンドを決定する映像表示装置。
【請求項3】
番組を特定するための番組キーワードと、前記番組に対するアクションを特定するためのアクションキーワードとが関連付けられた音声コマンド辞書を作成する辞書作成部と、
前記音声コマンド辞書を用いて音声認識を行い、音声コマンドを決定する音声認識処理部と、
決定された前記音声コマンドを実行するコマンド実行部と、
番組の放送状況に応じて、前記アクションキーワードの優先度が予め設定されたアクションキーワード優先度情報と
を具備し、
前記音声認識処理部は、音声認識結果として番組が特定された場合に、特定した番組の放送時刻に基づいて放送状況を特定し、特定した放送状況に関連付けられているアクションキーワードを前記アクションキーワード優先度情報から取得し、取得した前記アクションキーワードを優先度に従ってユーザに通知し、
ユーザによって選択された前記アクションキーワードを用いて前記音声コマンドを決定する映像表示装置。
【請求項4】
前記アクションキーワード優先度情報における優先度は、ユーザによって変更可能とされている請求項に記載の映像表示装置。
【請求項5】
前記アクションキーワード優先度情報における優先度は、過去所定期間におけるユーザによる選択確率に基づいて更新される請求項に記載の映像表示装置。
【請求項6】
前記辞書作成部は、各放送局から放送される番組に関する情報が格納された番組情報データベースから前記番組キーワードを抽出し、抽出した前記番組キーワードを用いて前記音声コマンド辞書を作成する請求項1から5のいずれかに記載の映像表示装置。
【請求項7】
番組を特定するための番組キーワードと、前記番組に対するアクションを特定するためのアクションキーワードとが関連付けられた音声コマンド辞書を作成する辞書作成部と、
前記音声コマンド辞書を用いて音声認識を行い、音声コマンドを決定する音声認識処理部と、
決定された前記音声コマンドを実行するコマンド実行部と
を具備し、
前記辞書作成部は、前記番組の放送時刻に応じて前記番組キーワードに関連付けられるアクションキーワードを更新する映像表示装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、映像表示装置に関するものである。
【背景技術】
【0002】
近年、音声認識機能を搭載したテレビ受像機等の映像表示装置が普及している。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2019-208123号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
音声入力はリモコン等を操作する必要がないため便利である。しかしながら、音声認識の精度や利便性は、利用者に十分な満足度を与えられるまでには至っていない。例えば、音声入力による番組検索においては、ローカル検索とクラウド検索がある。ローカル検索の場合、一般的に検索キーは固定となることから、ユーザは自由に検索キーを選択することができない。また、ユーザが自由に発話した場合には、音声認識率が低下し、検索エラーとなる。また、クラウド検索では自由な単語で検索できるが、汎用性の高い辞書を用いて音声認識を行うため、映像表示装置とは関係のない音声認識結果が得られる確率が高く、ユーザが望む実行結果を得ることは難しい。
【0005】
本発明は、このような事情に鑑みてなされたものであって、音声入力によるコマンド認識を番組情報や番組に対するアクションに特化させることで、番組に対する操作について操作性の高い映像表示装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の一態様は、番組を特定するための番組キーワードと、前記番組に対するアクションを特定するためのアクションキーワードとが関連付けられた音声コマンド辞書を作成する辞書作成部と、前記音声コマンド辞書を用いて音声認識を行い、音声コマンドを決定する音声認識処理部と、決定された前記音声コマンドを実行するコマンド実行部とを具備し、前記音声認識処理部は、音声認識結果として得られた音声コマンド候補に含まれる番組の放送時刻から特定されるアクションと、該音声コマンド候補のアクションとが合致するか否かに応じて、音声認識結果として得る前記音声コマンドを決定する映像表示装置である。
本発明の第二態様は、番組を特定するための番組キーワードと、前記番組に対するアクションを特定するためのアクションキーワードとが関連付けられた音声コマンド辞書を作成する辞書作成部と、前記音声コマンド辞書を用いて音声認識を行い、音声コマンドを決定する音声認識処理部と、決定された前記音声コマンドを実行するコマンド実行部とを具備し、前記音声認識処理部は、音声認識結果として番組が特定された場合に、特定した番組の放送時刻に基づいて放送状況を特定し、特定した放送状況に関連するアクションキーワードをユーザに通知し、ユーザによって選択された前記アクションキーワードを用いて前記音声コマンドを決定する映像表示装置である。
本発明の第三態様は、番組を特定するための番組キーワードと、前記番組に対するアクションを特定するためのアクションキーワードとが関連付けられた音声コマンド辞書を作成する辞書作成部と、前記音声コマンド辞書を用いて音声認識を行い、音声コマンドを決定する音声認識処理部と、決定された前記音声コマンドを実行するコマンド実行部と、番組の放送状況に応じて、前記アクションキーワードの優先度が予め設定されたアクションキーワード優先度情報とを具備し、前記音声認識処理部は、音声認識結果として番組が特定された場合に、特定した番組の放送時刻に基づいて放送状況を特定し、特定した放送状況に関連付けられているアクションキーワードを前記アクションキーワード優先度情報から取得し、取得した前記アクションキーワードを優先度に従ってユーザに通知し、ユーザによって選択された前記アクションキーワードを用いて前記音声コマンドを決定する映像表示装置である。
本発明の第四態様は、番組を特定するための番組キーワードと、前記番組に対するアクションを特定するためのアクションキーワードとが関連付けられた音声コマンド辞書を作成する辞書作成部と、前記音声コマンド辞書を用いて音声認識を行い、音声コマンドを決定する音声認識処理部と、決定された前記音声コマンドを実行するコマンド実行部とを具備し、前記辞書作成部は、前記番組の放送時刻に応じて前記番組キーワードに関連付けられるアクションキーワードを更新する映像表示装置である。
【発明の効果】
【0007】
本発明は、音声入力によるコマンド認識を番組情報や番組に対するアクションに特化させることで、操作性を向上させることができるという効果を奏する。
【図面の簡単な説明】
【0008】
図1】本発明の第1実施形態に係る映像表示装置のハードウェア構成の一例を示した概略構成図である。
図2】本発明の第1実施形態に係る映像表示装置が備える機能の一例を示した機能ブロック図である。
図3】本発明の第1実施形態に係るキーワード抽出部の機能を概念的に示した図である。
図4】本発明の第1実施形態に係る辞書テンプレートの一例を示した図である。
図5】本発明の第1実施形態に係る音声コマンド辞書の一例を示した図である。
図6】本発明の第1実施形態に係る辞書作成処理の一例を示したフローチャートである。
図7】本発明の第1実施形態に係る音声コマンド認識処理の一例を示したフローチャートである。
図8】本発明の第2実施形態に係る映像表示装置が備える機能の一例を示した機能ブロック図である。
図9】本発明の第2実施形態に係るキーワード抽出部及び番組開始終了時刻検出部の機能を概念的に示した図である。
図10】本発明の第2実施形態に係る辞書テンプレートの一例を示した図である。
図11】本発明の第2実施形態に係る映像表示装置において、番組A、番組B、番組Cがいずれも放送前である場合に、記憶部に格納される音声コマンド辞書の一例を示した図である。
図12】本発明の第2実施形態に係る映像表示装置において、番組A、番組Cが放送中であり、番組Bが放送終了した場合に、記憶部に格納される音声コマンド辞書の一例を示した図である。
図13】本発明の第3実施形態に係る映像表示装置が備える機能の一例を示した機能ブロック図である。
図14】本発明の第3実施形態に係る音声コマンド認識処理の一例を示したフローチャートである。
【発明を実施するための形態】
【0009】
〔第1実施形態〕
以下、本発明の第1実施形態に係る映像表示装置について、図面を参照して説明する。映像表示装置は、複数の放送局から配信される番組を視聴可能な機能を有していればよく、例えば、テレビジョン受信機、ノートPC、携帯電話機、タブレット端末等の情報処理装置等が挙げられる。
【0010】
図1は、本発明の第1実施形態に係る映像表示装置1のハードウェア構成の一例を示した概略構成図である。図1に示すように、映像表示装置1は、例えば、CPU11、CPU11が実行するプログラム及びこのプログラムにより参照されるデータ等を記憶するための補助記憶装置12、各プログラム実行時のワーク領域として機能する主記憶装置13、ネットワークに接続するための通信インターフェース14、入力部15、表示部(通知部)16、TVチューナ部17、スピーカ(通知部)18等を備えている。これら各部は、例えば、バス19を介して接続されている。補助記憶装置12は、例えば、HDD(Hard Disk Drive)などの磁気ディスク、光磁気ディスク、SSD(Solid State Drive)等の半導体メモリ等が一例として挙げられる。
【0011】
後述する各種機能を実現するための一連の処理は、一例として、プログラムの形式で補助記憶装置12に記憶されており、このプログラムをCPU11が主記憶装置13に読み出して、情報の加工・演算処理を実行することにより、各種機能が実現される。なお、プログラムは、補助記憶装置12に予めインストールされている形態や、他のコンピュータ読み取り可能な記憶媒体に記憶された状態で提供される形態、有線又は無線による通信手段を介して配信される形態等が適用されてもよい。コンピュータ読み取り可能な記憶媒体とは、磁気ディスク、光磁気ディスク、CD-ROM、DVD-ROM、半導体メモリ等である。
【0012】
図1において、通信インターフェース14は、インターネットに代表されるネットワークに接続され、ネットワークとのインターフェースを図るものである。入力部15は、ユーザが映像表示装置1に対して指示を与えるためのユーザインタフェースであり、音声入力部としてのマイク25を備えている。また、入力部15は、例えば、リモコン、キーボード、マウス、タッチパネル等を備えていてもよい。
【0013】
表示部16は、例えば、LCD(Liquid Crystal Display)等で構成される表示画面を有し、映像表示装置1によって実行されたアプリケーションソフトウェアプログラムの結果やTVチューナ部17によって受信されたテレビ番組等を表示するものである。また、表示部16は、表示情報を投影するプロジェクタであってもよい。
TVチューナ部17は、少なくとも地上デジタルチューナ、BSチューナ、CSチューナのいずれか一つを備え、複数の放送局から送信される地上デジタル、BS、及びCS放送をそれぞれのアンテナから受信し復調等の所定の処理を行う。
【0014】
スピーカ18は、番組の音声を出力するほか、例えば、音声ガイダンス等の機能を有している場合には、ユーザへ音声による通知を行う。
【0015】
図2は、本実施形態に係る映像表示装置1が備える機能の一例を示した機能ブロック図である。図2に示すように、映像表示装置1は、例えば、番組情報データベース21、辞書作成部23、記憶部24、マイク(音声入力部)25、音声認識処理部26、及びコマンド実行部27を備えている。
【0016】
番組情報データベース21には、各放送局から放送される番組に関する情報が格納されている。例えば、映像表示装置1は、TVチューナー(図1参照)から所定のタイミングで放送波を受信し、その中に含まれる番組情報を抽出し、番組情報データベース21に格納する。また、例えば、映像表示装置1は、通信インターフェース(図1参照)を介して所定のタイミングで番組情報を提供するサーバーにアクセスして番組情報をダウンロードし、番組情報データベース21に格納してもよい。
例えば、番組情報データベース21には、番組名、ジャンル(例えば、「ドラマ」、「スポーツ」、「バラエティ」、「アニメ/特撮」、「音楽」、「情報/ワイドショー」、「映画」、「劇場/公演」、「ニュース/報道」、「ドキュメンタリー/教養」等)、放送内容の概要(例えば、サブタイトル、出演者、製作年等)、放送の開始時刻と放送の終了時刻(以下これらを纏めて「放送時刻」という。)等が互いに関連付けられた複数の番組情報が格納されている。
【0017】
例えば、番組情報データベース21には、上記複数の番組情報として、電子番組表(EPG:Electronic Program Guide)が格納されていてもよい。
更に、番組情報データベース21には、録画された番組の番組情報が格納されていてもよい。例えば、番組情報データベース21には、録画した番組の番組名、ジャンル(例えば、「ドラマ」、「スポーツ」、「バラエティ」、「アニメ/特撮」、「音楽」、「情報/ワイドショー」、「映画」、「劇場/公演」、「ニュース/報道」、「ドキュメンタリー/教養」等)、放送内容の概要(例えば、サブタイトル、出演者、製作年等)、放送時刻等が互いに関連付けられた複数の番組情報が格納されていてもよい。また、録画した番組に関する番組情報には、録画番組の情報であることが識別できるように、録画情報であることを示す属性情報が付加されている。
【0018】
辞書作成部23は、キーワード抽出部231及び音声コマンド辞書作成部232を備えている。キーワード抽出部231は、番組情報データベース21から番組を特定するための番組キーワードを抽出する。図3は、本実施形態に係るキーワード抽出部231の機能を概念的に示した図である。図3に示すように、キーワード抽出部231は、例えば、番組キーワードとして、番組名、ジャンル、出演者等を抽出する。
【0019】
音声コマンド辞書作成部232は、抽出された番組キーワードと、番組に対するアクションを特定するためのアクションキーワードとが関連付けられた音声コマンド辞書を作成する。アクションキーワードの一例として、「チャンネル変更」、「録画」、「視聴予約」、「録画予約」、「番組再生」等が挙げられる。
【0020】
音声コマンド辞書作成部232は、例えば、音声コマンド辞書を作成するための辞書テンプレートを有しており、このテンプレートに番組キーワードを埋め込むことにより音声コマンド辞書を作成する。例えば、図4に、本実施形態に係る辞書テンプレートの一例を示す。図4に示すように、音声コマンド辞書作成部232は、アクションキーワードが規定された複数通りの辞書テンプレートを有しており、この辞書テンプレートに番組キーワード(例えば、ジャンル、番組名、出演者等)を入力することにより音声コマンド辞書を作成する。また、テンプレートには、日時情報(例えば、毎日、毎週、曜日、今日、明日、日付)が登録されていてもよい。
【0021】
これにより、例えば、図5に示すような多数の音声コマンド辞書を容易に作成することが可能となる。図5は、本実施形態における音声コマンド辞書の一例を示した図である。例えば、音声コマンド辞書の一例として、図5に示されるように、「番組Aにチャンネルを変えて」、「番組Cを毎日視聴予約して」、「番組Bを録画予約して」、「昨日録画した番組Bを再生して」の他、「ニュースにチャンネルを変えて」、「番組Aを毎日録画予約して」、「今日の出演者αの出演番組を予約して」等が挙げられる。また、番組キーワードとして、ジャンルや出演者を採用した音声コマンド辞書も同様に作成される。例えば、「ニュースにチャンネルを変えて」、「出演者αが出演しているドラマを録画予約して」等が一例として挙げられる。音声コマンド辞書作成部232は、音声コマンド辞書を作成すると、記憶部24に格納する。
【0022】
音声認識処理部26は、記憶部24に格納されている複数の音声コマンド辞書を用いて、マイク25から入力された音声データを認識する。音声認識処理部26は、例えば、マイク25から入力された音声データに最も一致度の高い音声コマンドを音声コマンド辞書から特定し、コマンド実行部27に出力する。なお、音声認識処理部26における音声認識については、公知の技術を適用できる。また例えば、ニューラルネットワークや遺伝的プログラミング等の機械学習技術を用いて、入力音声データに類似度の最も高い音声コマンドを音声コマンド辞書から取得するようにしてもよい。
【0023】
コマンド実行部27は、音声認識処理部26から音声認識結果として出力された音声コマンドに基づく処理、例えば、チャンネル変更、録画、視聴予約、録画予約、番組再生等を行う。
【0024】
次に、本実施形態に係る映像表示装置1の作動について図6及び図7を参照して説明する。図6は、本実施形態に係る辞書作成処理の一例を示したフローチャート、図7は、本実施形態に係る音声コマンド認識処理の一例を示したフローチャートである。
【0025】
辞書作成処理は、所定のタイミングや所定の時間間隔で実行される。
辞書作成処理では、まず、番組情報(例えば、電子番組表(EPG:Electronic Program Guide))を受信し(図6のSA1)、番組情報データベース21に格納する(SA2)。辞書作成部23は、番組情報データベース21の番組情報から番組キーワードを抽出し(SA3)、抽出した番組キーワードとアクションキーワードとが関連付けられた音声コマンド辞書を作成し(SA4)、作成した音声コマンド辞書を記憶部24に格納する(SA5)。
【0026】
音声コマンド認識処理では、ユーザが発話することにより音声入力が受け付けられると(図7のSB1)、音声認識処理部26は、記憶部24に格納されている音声コマンド辞書を参照して音声認識を行い(SB2)、最も一致度の高い音声コマンドを音声認識結果として決定する(SB3)。音声認識処理部26において決定された音声コマンドはコマンド実行部27に出力され、コマンド実行部27によってコマンドが実行される(SB4)。
【0027】
以上説明してきたように、本実施形態に係る映像表示装置1によれば、番組を特定するための番組キーワードと、その番組キーワードで特定される番組に対するアクションキーワードとが関連付けられた音声コマンド辞書を作成し、この音声コマンド辞書に基づいて音声認識を行うので、音声認識の精度を番組情報や番組に対するアクションに特化したかたちで向上させることが可能となる。更に、最新の番組表等の番組情報や録画された番組に関する番組情報に基づいて番組キーワードを抽出するので、音声入力のキーワードを、最新の番組表や録画された番組に適合させることができる。
【0028】
次に、本発明の第2実施形態に係る映像表示装置について図面を参照して説明する。本実施形態に係る映像表示装置1aでは、番組の放送時刻を考慮して音声コマンド辞書を変更する点が上述した第1実施形態と異なる。以下、第1実施形態と共通する点については説明を省略し、異なる点について主に説明する。
【0029】
図8は、本実施形態に係る映像表示装置1aが備える機能の一例を示した機能ブロック図である。図8に示すように、本実施形態に係る辞書作成部23´は、番組時刻検出部233を更に備えている。
【0030】
図9は、本実施形態に係るキーワード抽出部231及び番組時刻検出部233の機能を概念的に示した図である。図9に示すように、番組時刻検出部233は、番組情報データベース21に格納されている番組情報から各番組の番組開始時刻及び番組終了時刻を検出し、番組開始時刻を迎えた番組や番組終了時刻を迎えた番組の情報を音声コマンド辞書作成部232´に出力する。
音声コマンド辞書作成部232´は、番組時刻検出部233から番組開始または番組終了を迎える番組の情報が入力されると、記憶部24に格納されている当該番組に関係する音声コマンド辞書を更新する。
【0031】
例えば、音声コマンド辞書作成部232´は、図10に示すように、放送予定、放送中、放送終了等の番組の放送状況に応じて、番組キーワードに対応付けるアクションキーワードが特定された音声コマンド辞書テンプレートを有している。そして、番組の放送開始や放送終了に応じて、番組キーワードに関連付けられるアクションキーワードを更新することにより、記憶部24に格納されている音声コマンド辞書を更新する。
【0032】
例えば、番組が放送前の場合には、チャンネルを変更することはできないから、放送前の番組に関する番組キーワードと「チャンネルを変えて」というアクションキーワードとは合致しない。したがって、放送前の番組キーワードと「チャンネルを変えて」というアクションキーワードとが関連付けられている音声コマンド辞書を記憶部24から削除する。
【0033】
また、例えば、定期的に放送されるような番組ではなく、単発の番組の場合、放送終了後は、「チャンネルを変えて」、「視聴予約して」、「録画予約して」というアクションキーワードは合致しないこととなる。したがって、放送終了の番組に関する番組キーワードと、「視聴予約して」、「録画予約して」とのアクションキーワードが関連付けられている音声コマンド辞書を記憶部24から削除する。また、放送終了の番組に合致するアクションキー、例えば、「再生して」等のアクションキーが関連付けられた音声コマンド辞書が記憶部24に格納されていない場合や、当該番組が録画されたことを認識した場合には、「再生して」等のアクションキーを関連付けて作成して、記憶部24に格納する。
【0034】
図11は、番組A、番組B、番組Cがいずれも放送前である場合に、記憶部24に格納される音声コマンド辞書の一例を示した図である。図11に示すように、番組A,B,Cについては、「チャンネルを変えて」というアクションキーワードは合致しないため、このような音声コマンド辞書は削除される。一方、「視聴予約して」、「録画予約して」等のアクションキーワードが関連付けられた音声コマンド辞書は記憶部24に格納されたままとなる。また、番組A,B,Cは放送前で録画されていないので、「再生して」というアクションキーワードも削除される。
【0035】
また、図12は、番組A、番組Cが放送中であり、番組Bが放送終了した場合に、記憶部24に格納される音声コマンド辞書の一例を示した図である。図12に示すように、放送中の番組A,Cについては、「チャンネルを変えて」、「視聴予約して」、「録画予約して」というアクションキーワードが関連付けられた音声コマンド辞書が記憶部24に登録され、「再生して」というアクションキーワードは削除される。一方、放送を終了した番組Bについては、「チャンネルを変えて」、「視聴予約して」、「録画予約して」というアクションキーワードは合致しないため、削除される。
【0036】
なお、図11図12では、番組キーワードとして、番組名(タイトル)を採用した場合を例示しているが、ジャンル(例えば、「ドラマ」、「スポーツ」、「バラエティ」、「アニメ/特撮」、「音楽」、「情報/ワイドショー」、「映画」、「劇場/公演」、「ニュース/報道」、「ドキュメンタリー/教育」等)や放送内容の概要(例えば、「出演者」、「サブタイトル」等)を番組キーワードとした音声コマンド辞書についても同様に更新される。
【0037】
このように、本実施形態に係る映像表示装置1aでは、各番組の放送時刻に応じて記憶部24に格納されている音声コマンド辞書が更新される。より具体的には、番組の放送時刻に応じて合致しないアクションキーワードが関連付けられた音声コマンド辞書は記憶部24から削除される。これにより、不適切なコマンドを音声コマンド辞書から排除することが可能となり、音声認識率を更に向上させることができる。この結果、音声認識のエラー確率を低下させることができ、ユーザビリティを向上させることができる。
【0038】
次に、本発明の第3実施形態に係る映像表示装置1bについて図13及び図14を参照して説明する。本実施形態に係る映像表示装置1bでは、番組の放送時刻を考慮する点については上記第2実施形態と同様であるが、音声コマンド辞書を更新するのではなく、音声認識処理部26´が番組の放送時刻を用いて音声認識を行う点で異なる。以下、第1実施形態と共通する点については説明を省略し、異なる点について主に説明する。
【0039】
図13は、本実施形態に係る映像表示装置1bが備える機能の一例を示した機能ブロック図である。図13に示すように、本実施形態に係る音声認識処理部26´は、番組情報データベース21から各番組の番組開始終了時刻を取得し、番組開始終了時刻を用いて音声認識を行う。
【0040】
以下、図14を参照して、本実施形態に係る音声コマンド認識処理について説明する。図14は、本実施形態に係る音声コマンド認識処理の一例を示したフローチャートである。
【0041】
ユーザが発話することにより音声入力が受け付けられると(SC1)、音声認識処理部26´は、記憶部24に格納されている音声コマンド辞書を参照し、入力音声と一致度の高い複数の音声コマンドを音声コマンド候補として取得する(SC2)。続いて、最も一致度の高い音声コマンド候補を選択し(SC3)、選択した音声コマンド候補が適切か否かを判定する(SC4)。
【0042】
具体的には、ステップSC4では、選択された音声コマンド候補の対象とされている番組の放送時刻から、音声コマンド候補に含まれているアクションが適切であるか否かを判定する。
例えば、音声コマンド候補の対象とされている番組が放送終了しているのに対し、音声コマンド候補のアクションが「チャンネルを変えて」であった場合、両者は不適合であると判断できる。したがって、この場合には、音声コマンドは適切でないと判定する。
また、音声コマンドが適切か否かの判定については、例えば、放送前、放送中、放送後、録画あり等の放送状況とアクションキーワードとが関連付けられたアクションリストを予め用意しておき、このアクションリストと、音声コマンド候補に含まれる番組の放送時刻から特定できる放送状況とを用いて音声コマンド候補が適切か否かを判定すればよい。
この結果、番組の放送状況に基づくアクションと、音声コマンド候補のアクションとが合致していない場合には、不適切であると判定し(SC4:NO)、次に一致度の高い音声コマンド候補を選択し(SC5)、ステップSC4に戻り、上記の処理を繰り返し行う。
【0043】
一方、ステップSC4において適切であると判定されると(SC4:YES)、当該音声コマンド候補を音声コマンドとして決定し(SC6)、決定した音声コマンドを実行する(SC7)。
【0044】
このように、本実施形態に係る映像表示装置1bでは、番組情報データベース21から各番組の番組開始終了時刻を取得し、番組開始終了時刻を用いて音声認識を行う。より具体的には、音声認識によって得られた音声コマンド候補のアクションと、音声コマンド候補の対象となる番組の放送時刻に応じて特定される放送状況のアクションとが合致しているか否かを判定することにより音声コマンドを決定するので、音声認識のエラー確率を低下させることができ、ユーザビリティを向上させることができる。
【0045】
〔変形例〕
なお、上述した第3実施形態に係る映像表示装置1bでは、最も一致度の高い音声コマンド候補から順に、選択した音声コマンド候補が適切か否かを判定して音声コマンドを決定していたが、以下のような態様としてもよい。
例えば、音声認識処理部は、音声認識結果として番組が特定された場合に、特定した番組の放送時刻に基づいて放送状況を特定し、特定した放送状況に関連するアクションキーワードをユーザに通知し、ユーザによって選択されたアクションキーワードを用いて音声コマンドを決定するようにしてもよい。以下、具体的に説明する。
【0046】
例えば、映像表示装置は、放送状況に応じて、番組キーワードに組み合わせるアクションキーワードの優先度が予め設定されたアクションキーワード優先度情報を保有している。例えば、放送状況が「放送中」である場合には、「チャンネルを変えて」の優先度が最も高く設定され、それに続いて「録画予約して」、「視聴予約して」の順に優先度が設定される。また、放送状況が「放送予定」である場合には、「視聴予約して」、「録画予約して」、「チャンネルを変えて」の順に優先度が設定される。また、放送状況が「放送終了」である場合には、番組が録画されているか否かに応じて優先度が設定されていてもよい。例えば、番組が録画されている場合には、「再生して」の優先度を他のコマンドよりも高く設定する。また、番組が定期的に放送される番組であれば、「次回の視聴予約をして」、「次回の録画予約をして」等のコマンドを他のコマンドよりも高く設定する。
【0047】
音声認識処理部は、発話があった場合に、記憶部24に格納されている音声コマンド辞書を参照し、入力音声と一致度の高い複数の音声コマンドを音声コマンド候補として取得する。このとき、例えば、ユーザが番組に関する発話は行っているがアクションコマンドについてはまだ発話していない場合や、十分な確度で音声認識が行えなかった場合には、取得した音声コマンド候補には、不確定なアクションコマンドが含まれていることとなる。
このような場合、取得した音声コマンド候補のうち、番組が特定されている場合には、その番組の放送時刻から放送状況を特定し、特定した放送状況に対応付けられているアクションキーワードをアクションキーワード優先度情報から取得する。そして、取得したアクションキーワードを選択肢として優先度の高い順にユーザに通知する。この通知方法は、表示部16(図1参照)に選択肢を優先度の高い順に表示させてもよいし、スピーカ18(図1参照)により音声によって通知してもよい。
これにより、例えば、音声認識処理部によって特定された番組の放送状況が「放送中」であれば、「チャンネルを変えて」、「録画予約して」、「視聴予約して」の順に通知される。
【0048】
ユーザは、通知されたアクションキーワードのうち、所望のものを選択する。この選択操作は、リモコン等を操作することによって所望のアクションキーワードを選択してもよいし、発話による音声入力でもよい。音声認識処理部は、ユーザによって選択されたアクションキーワードと音声認識した番組キーワードとを組み合わせた音声コマンドを出力する。これにより、コマンド実行部によってコマンドに応じた処理が実行される。
【0049】
上記アクションキーワード優先度情報に登録されている優先度は、ユーザによって変更可能とされていてもよいし、過去所定期間におけるユーザによる選択確率に基づいて更新されてもよい。例えば、ユーザによって選択される確率が高いほど優先度が高くなるように更新される。
【0050】
このような構成によれば、例えば、ユーザの発話情報から番組が特定できれば、その番組の放送状況に応じたアクションキーワードを選択肢としてユーザに提示することが可能となる。これにより、アクションキーワードがユーザによって入力されていない状況やアクションキーワードが十分な確度で音声認識できなかった場合においてもユーザの意思を反映したコマンドを決定し、実行することが可能となる。
【0051】
以上、本発明について実施形態を用いて説明したが、本発明の技術的範囲は上記実施形態に記載の範囲には限定されない。発明の要旨を逸脱しない範囲で上記実施形態に多様な変更又は改良を加えることができ、該変更又は改良を加えた形態も本発明の技術的範囲に含まれる。また、上記実施形態を適宜組み合わせてもよい。
また、上記実施形態で説明した視聴支援方法の処理手順も一例であり、本発明の主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよい。
【符号の説明】
【0052】
1、1a、1b:映像表示装置
15:入力部
16:表示部
17:TVチューナ部
21:番組情報データベース
23,23´:辞書作成部
24:記憶部
25:マイク
26,26´:音声認識処理部
27:コマンド実行部
231:キーワード抽出部
232,232´:音声コマンド辞書作成部
233:番組時刻検出部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14