IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 東芝映像ソリューション株式会社の特許一覧

<>
  • 特許-映像信号処理装置、映像信号処理方法 図1
  • 特許-映像信号処理装置、映像信号処理方法 図2
  • 特許-映像信号処理装置、映像信号処理方法 図3
  • 特許-映像信号処理装置、映像信号処理方法 図4
  • 特許-映像信号処理装置、映像信号処理方法 図5
  • 特許-映像信号処理装置、映像信号処理方法 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-03-10
(45)【発行日】2023-03-20
(54)【発明の名称】映像信号処理装置、映像信号処理方法
(51)【国際特許分類】
   G06F 3/16 20060101AFI20230313BHJP
   H04N 21/442 20110101ALI20230313BHJP
   H04N 21/454 20110101ALI20230313BHJP
   H04H 60/15 20080101ALN20230313BHJP
   H04H 60/16 20080101ALN20230313BHJP
   H04H 60/45 20080101ALN20230313BHJP
   H04H 60/17 20080101ALN20230313BHJP
   H04H 60/58 20080101ALN20230313BHJP
【FI】
G06F3/16 630
H04N21/442
H04N21/454
G06F3/16 620
G06F3/16 650
H04H60/15
H04H60/16
H04H60/45
H04H60/17
H04H60/58
【請求項の数】 6
(21)【出願番号】P 2019094658
(22)【出願日】2019-05-20
(65)【公開番号】P2020190836
(43)【公開日】2020-11-26
【審査請求日】2021-09-02
(73)【特許権者】
【識別番号】000214984
【氏名又は名称】TVS REGZA株式会社
(74)【代理人】
【識別番号】110001737
【氏名又は名称】弁理士法人スズエ国際特許事務所
(72)【発明者】
【氏名】石丸 大
【審査官】菅原 浩二
(56)【参考文献】
【文献】特開2014-003610(JP,A)
【文献】特開2015-073286(JP,A)
【文献】特開2015-088086(JP,A)
【文献】米国特許出願公開第2018/0352302(US,A1)
【文献】特開2000-175117(JP,A)
【文献】特開2003-173430(JP,A)
【文献】特開2004-040293(JP,A)
【文献】米国特許第09288387(US,B1)
【文献】米国特許出願公開第2013/0041665(US,A1)
【文献】米国特許出願公開第2012/0316876(US,A1)
【文献】米国特許出願公開第2011/0060592(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 3/16
H04N 21/442
H04N 21/454
H04H 60/15
H04H 60/16
H04H 60/45
H04H 60/17
H04H 60/58
(57)【特許請求の範囲】
【請求項1】
話者の音声命令が入力される音声信号入力部と、
前記音声入力部から入力した前記音声命令を理解する言語理解部と、
前記音声入力部から入力した前記話者の音声の特徴量に基づいて、第1のデータベースに予め登録されている前記話者の特徴量と年齢のデータから、前記音声を入力した前記話者と年齢を特定する話者特定部と、
番組情報として、チャンネルと該チャンネルの番組の視聴を制限すべき年齢との情報が記憶されている第のデータベースと、
前記言語理解部で理解された前記音声命令と、前記特定された前記話者及びその年齢と、前記第のデータベースの情報とに基づき、前記音声命令は予め設定されている制限情報に対して許容されるべきか否定されるべきかを判断する判断部と、
前記判断部が前記音声命令は許容されるべきと判断した場合は前記音声命令を実行する制御実行部と、
前記判断部が前記音声命令は否定されるべきと判断した場合は警告を出力する警告出力部とを備え、さらに、
管理者の特定の操作キーによる特定の入力により前記話者特定部を起動させて、登録モードに切り替える第1の制御手段と、
前記管理者を除くユーザが音声入力したこと及び年齢を入力したことに基づいて、前記ユーザの音声の特徴量及び前記年齢を、前記第1のデータベースに登録する第2の制御手段と、
前記ユーザが前記音声入力を行う前記登録モードのときは、前記管理者の音声には前記話者特定部が反応しないように制御する、第3の制御手段と、
を備えた映像信号処理装置。
【請求項2】
前記音声命令に応じた前記実行は、
放送されるチャンネルの番組の表示処理又は受信処理又は記録再生装置からの再生処理の何れかである、請求項1記載の映像信号処理装置。
【請求項3】
前記話者特定部と前記判断部と前記言語理解部の少なくとも1つは、ネットワークを介して外部に配置されている、請求項記載の映像信号処理装置。
【請求項4】
音声信号入力部に話者の音声命令を入力し、
言語理解部に前記音声入力部から入力した前記音声命令を理解させ、
話者特定部に、前記音声入力部から入力した前記話者の音声の特徴量に基づいて、第1のデータベースに予め登録されている前記話者の特徴量と年齢のデータから、前記音声を入力した前記話者と年齢を特定させ
第2のデータベースで番組情報として、チャンネルと該チャンネルの番組の視聴を制限すべき年齢との情報を記憶しておき、
判断部により、前記言語理解部で理解された前記音声命令と、前記特定された前記話者及びその年齢と、前記第2のデータベースの情報とに基づき、前記音声命令は予め設定されている制限情報に対して許容されるべきか否定されるべきかを判断し、
制御実行部により、前記判断部が前記音声命令は許容されるべきと判断した場合は前記音声命令を実行し、
警告出力部により、前記判断部が前記音声命令は否定されるべきと判断した場合は警告を出力し、さらに、
管理者の特定の操作キーによる特定の入力により前記話者特定部を起動させて、登録モードに切り替えること、
前記管理者を除くユーザが音声入力したこと及び年齢を入力したことに基づいて、前記ユーザの音声の特徴量及び前記年齢を、前記第1のデータベースに登録すること、
前記ユーザが前記音声入力を行う前記登録モードのときは、前記管理者の音声には前記話者特定部が反応しないように制御すること、を備える、
映像信号処理方法。
【請求項5】
前記警告出力部により前記警告を出力した状態であっても、前記音声命令と異なる話者からの第2の音声命令が入力した場合、前記判断部は前記異なる話者と前記第2の音声命令に基づき新たな判断を行う請求項記載の映像信号処理方法。
【請求項6】
前記制御実行部により前記音声命令が実行された状態であって、前記判断部が新しく入力した音声信号に係わる年齢から現在の前記実行は否定すべきであることを判断した場合は、警告又はチャンネル切り替えを判断する、請求項記載の映像信号処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本実施形態は、映像信号処理装置、映像信号処理方法に関する。
【背景技術】
【0002】
近年、音声認識技術の向上により、音声で制御を行うことのできる機器が増えてきている。映像信号処理装置もその例外ではない。例えばユーザが、電源のオンオフやチャンネル変更を行うのに、リモートコントローラを操作することなく、例えば「電源つけて」「チャンネル変えて」のような音声を発話するだけで、その制御を行えるようになってきた。
【0003】
一方、映像信号処理装置には、パレンタルコントロール(視聴制限)の機能があり、過激な内容の番組コンテンツなどには、番組情報として制限年齢が付与されている。その番組情報を利用することで、その許容年齢に達しない子供には、コンテンツの視聴を制限することができるようになっている。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2005-223846号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
これまでの映像信号処理装置におけるパレンタルコントロールの仕組みは、主に、制限なく視聴できる年齢情報をあらかじめ映像信号処理装置に設定しておき、もし番組のもつ年齢情報が映像信号処理装置に設定された年齢の範囲外の場合に、解除コードを入力するまではその番組の視聴をできない状態にするという仕組みであった。
【0006】
例えば、映像信号処理装置に、パレンタル制御年齢が14歳以上と設定されていた場合、対象年齢が14歳以下のコンテンツを閲覧することは視聴者の年齢に関係なく無制限で行えるが、例えば対象年齢が19歳という情報が付与されたコンテンツを閲覧する場合には、たとえ視聴者が20歳以上であったとしても、その年齢に関係なく、視聴するためには、パレンタルロックを解除しなければならない。
【0007】
このように、映像信号処理装置上では、本当は視聴を許されている人が、番組に付された制限のために視聴できない場合に、解除コードを入力するという手順が必要となっていた。また上記の例のパレンタルロック方式では、その視聴を制限されるべき子供が知ってしまった場合、解除コードを変更するまでの間、子供でも番組の制限を自由に解除して視聴できてしまうという問題があった。
【0008】
そこでこの実施形態ではパレンタルコントロール機能に音声制御技術を組み合わせることで、従来よりも利用しやすく、パレンタルロック機能も確実となる、映像信号処理装置、映像信号処理方法を提供することを目的とする。
【0009】
また他の実施形態では、音声コマンドに基づく処理実行するに際して、そのコマンド入力者を事前に特定して、そのコマンド入力者の年齢情報からパレンタルコントロールの制限・解除を、解除コードの操作入力を要せずに、行うことを可能とする映像信号処理装置映像信号処理方法を提供することを目的とする。
【課題を解決するための手段】
【0010】
一実施形態によれば、話者の音声命令が入力される音声信号入力部と、
前記音声入力部から入力した前記音声命令を理解する言語理解部と、
前記音声入力部から入力した前記話者の音声の特徴量に基づいて、第1のデータベースに予め登録されている前記話者の特徴量と年齢のデータから、前記音声を入力した前記話者と年齢を特定する話者特定部と、
番組情報として、チャンネルと該チャンネルの番組の視聴を制限すべき年齢との情報が記憶されている第のデータベースと、
前記言語理解部で理解された前記音声命令と、前記特定された前記話者及びその年齢と、前記第のデータベースの情報とに基づき、前記音声命令は予め設定されている制限情報に対して許容されるべきか否定されるべきかを判断する判断部と、
前記判断部が前記音声命令は許容されるべきと判断した場合は前記音声命令を実行する制御実行部と、
前記判断部が前記音声命令は否定されるべきと判断した場合は警告を出力する警告出力部とを備え、さらに、
管理者の特定の操作キーによる特定の入力により前記話者特定部を起動させて、登録モードに切り替える第1の制御手段と、
前記管理者を除くユーザが音声入力したこと及び年齢を入力したことに基づいて、前記ユーザの音声の特徴量及び前記年齢を、前記第1のデータベースに登録する第2の制御手段と、
前記ユーザが前記音声入力を行う前記登録モードのときは、前記管理者の音声には前記話者特定部が反応しないように制御する、第3の制御手段と、
を備えた映像信号処理装置が提供される。
【0011】
また前記音声命令を前記判断部に入力する系統では音声帯域の音声データをテキスト化する音声認識部、テキストデータを機械語(機械的命令)にする自然言語理解部が用いられる。
【図面の簡単な説明】
【0012】
図1図1は本発明の一実施形態に係る映像信号処理装置の全体構成を示す構成説明図である。
図2図2図1に示した映像信号処理装置において、ユーザ情報を事前設定するときに機能するブロックを取り出して示す部分構成図である。
図3図3図1に示した映像信号処理装置において、パレンタル制限を受けないユーザがチャンネル選択を行う場合の説明図である。
図4図4図1に示した映像信号処理装置において、パレンタル制限を受けるユーザがチャンネル選択を行う場合の説明図である。
図5図5図1に示した映像信号処理装置の一動作例を説明するフローチャートである。
図6図6図1に示した映像信号処理装置の他の動作例を説明するフローチャートである。
【発明を実施するための形態】
【0013】
以下、実施の形態について図面を参照して説明する。図1は一実施形態であり、例えば放送受信装置100に適用された例である。放送受信装置100における受信系統の基本構成50は、チューナ装置51、映像・音声データ処理装置53、映像信号出力部54、オーディオ信号出力部55、記録・再生媒体接続部56などで構成される。さらにまた、ネットワーク接続52も設けられており、外部サーバ等と通信を行うことができる。例えば外部サーバには、ビデオオンデマンドによる動画配信機能があり、視聴者は配信画像を視聴することも可能である。さらには、外部サーバに対して、視聴ログをアップロードすることも可能である。外部サーバは、多数の放送受信装置からの視聴ログを解析して、視視聴者に対して今人気のあるおすすめ番組や、商業コマーシャルなどの情報をサービスすることができる。
【0014】
ここで本実施形態の映像信号処理装置は、マイク(音声信号入力部)11を備える。マイク11で取得したデータは、音声認識部12、特徴量検出部14に入力される。音声認識部12は、音声帯域の音声データをテキスト化し、このテキストデータを機械語(機械的命令)にする自然言語理解部13に入力する。つまり音声認識部12と自然言語理解部13は、音声による発話内容を辞書データなど用いて理解(解読)して命令を出力し、パレンタル制御判断部17に入力する。この音声認識部12及び又は自然言語理解部13は、インターネットを介して外部サーバに設けられていてもよい。自然言語理解部13で理解された発話内容による命令は、パレンタル制御部17に送られる。
【0015】
一方、特徴量検出部14は、例えば話者の声紋などを解析して声紋解析データを出力する。声紋解析データは、話者特定部15に入力する。個人個人の話者の声紋解析データ(特徴量)は、予めデータベース16に登録されている。図の例では、ユーザA(年齢43)、
ユーザB(年齢41)、ユーザC(年齢15)、ユーザD(年齢10)の特徴量がそれぞれデータベース16に登録されている。
【0016】
話者特定部15は、入力した新しい声紋解析データと、データベース16に登録されている複数の登録済声紋解析データとを次々と比較し、新しい声紋解析データに対応する話者を特定する。
【0017】
特定された話者の年齢もデータベースに登録されている。これにより、現在発話した話者(ユーザ)は、何歳であるかが判明する。
【0018】
パレンタル制御判断部17は、特定された話者と、その年齢と、パレンタル制御(ロック)すべき番組の番組情報を受け取る。
【0019】
パレンタル制御(ロック)すべき番組は、その番組情報において制限年齢が指定されている。即ち、番組情報は、チャンネルと制限すべきマーク(識別データ)が付されてデータベース18に格納されている。データベース18には、制限すべき限度となる年齢と制限すべきチャンネルのデータがペアで格納されている。この図の例ではYchチャンネルでは、12歳以下が制限されており、Zchチャンネルでは、18歳以下が制限されている。なお番組情報は、映像再生装置22に記録された番組の番組情報を含んでもよい。
【0020】
パレンタル制御判断部17は、特定された話者と、その年齢と、パレンタル制御(ロック)すべき番組の情報を受け取り、以下のように判断する。
【0021】
即ち、新しい話者がユーザDであり、例えば「Ychチャンネルにして」と発話したとする。このときは、ユーザDは12歳以下であり、一方Ychチャンネルは、12歳以下には制限がかかっているので、パレンタル制御判断部17は、チャンネル切り替えができないものと判断し、その判断結果を制御実行部21に通知する。すると、制御実行部21は、警告出力部(表示及び又は音声)23により、例えば「この番組を視聴することはできません」のように警告を出力する。また、記録再生装置23に対して出力(或いは再生)停止信号を出力する。
【0022】
なお上記各ブロックの動作順序などは、システム制御部30の制御に基づいてコントロールされている。
【0023】
上記したように、本システムでは、音声の声紋などで個人個人を特定することが可能である。このために、パンレンタル制御された番組に対して、個人毎にかつ受信装置毎に「解除」と「制限」が確実に行われることになる。
【0024】
図2は、例えば家庭のユーザA,B,C,Dがそれぞれの音声の特徴と年齢情報を、管理テーブルに構築するための構成を示している。図1と共通する部分には、図1と同じ符号を付して説明する。
【0025】
ユーザは、例えばリモートコントローラ(図示せず)、或いは、放送受信装置100に設けられている特定の操作キーを操作して、ユーザ登録モードに装置を切り替える。この場合、操作キーによる入力は、例えば放送受信装置100を管理する父親(例えばユーザA)或いは母親(例えばユーザB)のみが知る特定の暗証番号が好ましい。装置が登録モードになると、話者年齢情報設定部51が起動し、これから登録すべき話者(例えばユーザC,或いはD)の音声入力モードとなる。
【0026】
この場合、最初は、管理者(例えばユーザA)が管理者としての音声の特徴量を予め登録していることが好ましい。これは、その後、管理者(例えばユーザA)を除くこれからの登録者(例えばユーザC或いはD)の音声の特徴量を登録するとき、管理者が、音声でこれからの登録者に対して指示を出すことがあるからである。このような登録モードのときは、管理者の音声が検知されたとしても、話者特定部15は、管理者の音声を無視して、新しく検知した話者の特徴量を新しいユーザとして認識して、データベース16に登録する。そして、当該ユーザの年齢情報の入力を待つ。
【0027】
年齢情報は、話者年齢情報設定部51により検出され、データベース17に登録される。年齢情報は、例えばリモートコントローラによる入力や、音声入力が可能である。音声入力の場合は、先に検出した声紋を持つユーザが発話した年齢を検出する。例えば10歳、或いは6歳などの発話を理解して年齢判断を行う。これにより、データベース16には、ユーザと、このユーザの年齢と、このユーザの音声の特徴量データとが関連付けて登録される。
【0028】
上記の登録に関しては、システム制御部30のシーケンス制御に基づいて、操作ガイド音声及び又は文字などの操作ガイドの表示が出力される。
【0029】
図3は、例えばユーザC(15歳)が音声により、チャンネル切り替えとして、チャンネルXchを発話により指示した例を示している。例えば「チャンネルをXchにして」と発話した例を示している。この発話は、音声認識部12でテキスト化され、自然言語理解部13において、命令語(例えばChang ch: X)に変換されて、パレンタル制御判断部17に入力される。この場合、データベース16上では話者は、15歳として特定され、自然言語理解部13では、話者がXchチャンネルへの切り替えを指示したことが検出される。
【0030】
パレンタル制御判定部17は、データベース18を参照して、Xchチャンネルに対して番組情報に基づく制限が与えられているか否かの判定を行う。データベース18上では、Xchチャンネルに対する視聴制限はないためにパレンタル制御判定部17は制御実行部21に対して、Xchチャンネルへの切り替えを指示する。同様な動作は、ユーザDがXchチャンネルの指示を行ってもXchチャンネルへの切り替えが実行される。
【0031】
図4は、例えばユーザD(10歳)が音声により、チャンネル切り替えとして、Zchチャンネルを発話により指示した例を示している。この場合、データベース16上では話者は、10歳として特定され、自然言語理解部13では、話者がZchチャンネルへの切り替えを指示したことが検出される。
【0032】
パレンタル制御判定部17は、データベース18を参照して、Zchチャンネルに対して番組情報に基づく制限が与えられているか否かの判定を行う。データベース18上では、
18歳以下の人への制限が与えられている。このために、パレンタル制御判定部17は、Zchチャンネルの切り替えを拒否すべく制御実行部21へ通知する。するとこの場合は、警告出力部23により、例えば「この番組を視聴することはできません」のように警告を出力する。なお図3図4において、図1と同一部には同一符号を付して説明は省略する。
【0033】
制御実行部21が実行する番組視聴制限処理のタイプは、各種の方法が可能である。例えば、制限されている番組のチャンネル受信そのものを制限する、或いはチャンネルは受信するが、番組の復調を行わない、或いは復調まで行うが、出力を停止する、さらには出力をすべてクロレベル或いは白レベルの画像とするなど、各種の方法が可能である。
【0034】
本システムは上記の実施形態に限定されるものではない。音声命令による機器操作機能および話者特定機能は、上記放送受信装置100内に設けられる必要はなく、ネットワークを通じて外部の装置に設けられていてもよい。したがって、放送受信装置100内には、例えばマイク11、パレンタル制御判断部17、制御実行部21、警告出力部23、システム制御部30と、基本構成50が設けられ、音声認識部12、自然言語理解部13、特徴量検出部14、話者特定部15、データベース16、18、などは外部に設けられていてもよい。さらにはパレンタル制御判断部17も外部に設けられてよい。
【0035】
話者特定部15は、事前に機器を操作するユーザの声を記憶(学習)しておき、その声との類似度で同一人物と判断した。しかし、ユーザ声の事前学習は行わず、音声コマンドのデータの特徴量(周波数成分など)を用いて、その声の年齢層を推定する手法も可能である。この場合、正確な年齢の推定までは難しいが、明らかな子供声の場合は視聴制限対象とする一方、明らかな大人声の場合は視聴制限対象にしないという制御も実現可能である。
【0036】
話者の年齢情報については、事前に設定した。さらに生年月日を入力しておくことで、年齢情報を(誕生日がきたら)自動で調節する機能を付加してもよい。視聴コンテンツとしては、地デジやBSなどの放送局が提供する番組を想定しているが、YouTube(登録商標)やNetflix(登録商標)などのネットワークストリーミングコンテンツであっても、制限年齢の情報を持つコンテンツであればすべてに適用できる。
【0037】
実際に、「チャンネルを・・・にして」の音声コマンドが、視聴制限に引っかかった場合に、チャンネル変更をしない、チャンネル変更するが黒画面にする、指定されたチャンネル以降の最初の視聴可能チャンネルに変更をする、音声でチャンネル変更が失敗したことを伝える、画面上にチャンネル変更が失敗したことを表示するなどの機能を追加することも可能である。
【0038】
上記したように本システムは、ユーザの音声認識と年齢認識を行うことができるために次のような動作を得ることも可能である。
【0039】
図5は、例えば子供(10歳)が、「Ychチャンネルに切り替えて」と発話した場合である。この場合、本システムでは、Ychチャンネルは、10歳の子供に対しては視聴拒否し、警告を発する(ステップAs1、As2)。しかし、同じ部屋に父親が居て、「Ychの今の番組は子供が視聴しても構わない」と判断した場合、父親が「Ychチャンネルに切り替えて」と発話して、Ychチャンネルへの切り替えを実現させることが可能である(ステップAs3、As4)。
【0040】
図6は、他の動作例を示している。今父親(43歳)が、Ychチャンネルの番組を視聴していたとする(ステップBs1)。ここで、例えば子供(10歳)が部屋に入ってきて、子供の声を本実施形態のシステムが認識したとする(ステップBs2)。このときの音声は、放送受信装置100に対する音声命令に限定されない。
【0041】
すると、システムは、自動的にXchチャンネル(制限がかかっていない番組)へ自動的に切り替える(ステップBs31)、或いは、警告のテロップ又は音を出力する(ステップBs32)、或いは画像を非表示(全面黒または白)に切り替える(ステップBs33)などの何れかの処理を実行する。そして次の操作があるのを待ち(ステップBs34)、次の操作があれば処理を終了する。ステップBs31、Bs32,Bs33の何れを実行させるかは、ユーザ(管理者)が予め選択して設定することが可能である。或いは、放送受信装置100の出荷時にいずれかが設定されていてもよい。
【0042】
本発明のいくつかの実施形態を説明したが、これらの実施形態は例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態の変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。さらにまた、請求項の各構成要素において、構成要素を分割して表現した場合、或いは複数を合わせて表現した場合、或いはこれらを組み合わせて表現した場合であっても本発明の範疇である。また、複数の実施形態を組み合わせてもよく、この組み合わせで構成される実施例も発明の範疇である。
【0043】
また請求項を制御ロジックとして表現した場合、コンピュータを実行させるインストラクションを含むプログラムとして表現した場合、及び前記インストラクションを記載したコンピュータ読み取り可能な記録媒体として表現した場合でも本発明の装置を適用したものである。また、使用している名称や用語についても限定されるものではなく、他の表現であっても実質的に同一内容、同趣旨であれば、本発明に含まれるものである。
【符号の説明】
【0044】
11・・・マイク、12・・・音声認識部、13・・・自然言語理解部、14・・・特徴量検出部、15・・・話者特定部、17・・・パレンタル制御判断部、21・・・制御実行部、20・・・基本構成、100・・・放送受信装置。
図1
図2
図3
図4
図5
図6