IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 東芝映像ソリューション株式会社の特許一覧

特許7202938番組名検索支援装置、及び、番組名検索支援方法
<>
  • 特許-番組名検索支援装置、及び、番組名検索支援方法 図1
  • 特許-番組名検索支援装置、及び、番組名検索支援方法 図2
  • 特許-番組名検索支援装置、及び、番組名検索支援方法 図3
  • 特許-番組名検索支援装置、及び、番組名検索支援方法 図4
  • 特許-番組名検索支援装置、及び、番組名検索支援方法 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-12-28
(45)【発行日】2023-01-12
(54)【発明の名称】番組名検索支援装置、及び、番組名検索支援方法
(51)【国際特許分類】
   H04N 21/482 20110101AFI20230104BHJP
   H04N 21/439 20110101ALI20230104BHJP
   H04N 21/435 20110101ALI20230104BHJP
   G10L 15/00 20130101ALI20230104BHJP
   G10L 15/06 20130101ALI20230104BHJP
   G06F 3/16 20060101ALI20230104BHJP
【FI】
H04N21/482
H04N21/439
H04N21/435
G10L15/00 200G
G10L15/06 300H
G06F3/16 650
【請求項の数】 5
(21)【出願番号】P 2019053657
(22)【出願日】2019-03-20
(65)【公開番号】P2020155976
(43)【公開日】2020-09-24
【審査請求日】2021-10-15
(73)【特許権者】
【識別番号】000214984
【氏名又は名称】TVS REGZA株式会社
(74)【代理人】
【識別番号】110002907
【氏名又は名称】弁理士法人イトーシン国際特許事務所
(72)【発明者】
【氏名】松原 伸三
【審査官】富樫 明
(56)【参考文献】
【文献】国際公開第2015/045039(WO,A1)
【文献】特開2007-178927(JP,A)
【文献】特開2010-072507(JP,A)
【文献】特開2007-213005(JP,A)
【文献】特開2001-242887(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 21/00-21/858
G10L 15/00
G10L 15/06
G06F 3/16
(57)【特許請求の範囲】
【請求項1】
番組名検索対象機器に格納される番組名の表記である第1番組名と、前記番組名の読みとを対にして記憶する番組情報記憶部と、
前記番組情報記憶部に格納されている前記番組名の読みに基づく音声データに対し、音声認識処理を施し得られた文字データである第2番組名を取得する文字データ取得回路と、
前記第1番組名と前記第2番組名とが異なる場合、前記第1番組名と前記第2番組名とを対にして格納する読み替え辞書と、
を有する番組名検索支援装置。
【請求項2】
前記番組名検索対象機器に格納される前記番組名は、電子番組表に記載されている番組名であることを特徴とする、請求項1に記載の番組名検索支援装置。
【請求項3】
前記番組名検索対象機器を操作するために入力された操作用音声データに対し、音声認識処理を施し得られた文字データの自然言語解析処理を実行する言語データ解析回路を更に有し、前記言語データ解析回路は、前記自然言語解析処理の対象となる前記文字データにおいて前記第2番組名が存在し、かつ、前記読み替え辞書に前記第2番組名が格納されている場合、前記第2番組名を、前記読み替え辞書において対にして格納されている前記第1番組名に置き換えて、前記自然言語解析処理を実行することを特徴とする、請求項1又は請求項2に記載の番組名検索支援装置。
【請求項4】
番組名検索対象機器に格納される番組名の表記である第1番組名と、前記番組名の読みとを対にして取得し、
前記番組名の読みに基づく音声データに対し、音声認識処理を施し得られた文字データである第2番組名を取得し、
前記第1番組名と前記第2番組名とが異なる場合、前記第1番組名と前記第2番組名とを対にして読み替え辞書に登録する、番組名検索支援方法。
【請求項5】
前記番組名検索対象機器に格納される前記番組名は、電子番組表に記載されている番組名であることを特徴とする、請求項4に記載の番組名検索支援方法。
【発明の詳細な説明】
【技術分野】
【0001】
本実施形態は、番組名検索支援装置、及び、番組名検索支援方法に関する。
【背景技術】
【0002】
テレビ等のAV機器では、放送波から取得するEPG(Electronic Program Guide)を利用して、放送番組の検索を行うことが一般的である。検索キーワードを用いて放送番組名を検索する場合、従来、リモコンのボタンを操作して検索する文字を入力していた。
【0003】
近年、操作者の音声を認識し、認識結果に基づいてAV機器等を操作する音声認識技術が実用化されている(例えば、特許文献1参照)。例えば、マイクが搭載されたリモコンに向かって操作者が検索キーワードを発声すると、音声認識結果に基づいて放送番組名を検索することができる。このような音声検索は、文字入力検索に比べて手間なく短時間で検索を行うことができ、操作者の利便性向上に大きく貢献している。
【0004】
しかし、音声検索では、音声認識結果として得られた番組名(文字列)と、EPGから取得した番組名とが一致しない場合、番組検索ができないという問題があった。
【先行技術文献】
【特許文献】
【0005】
【文献】特開2012-168349号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
本実施形態は、音声検索による番組名検索の確度を向上させることができる、番組名検索支援装置、及び、番組名検索支援方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
本実施形態の番組名検索支援装置は、番組名検索対象機器に格納される番組名の表記である第1番組名と、前記番組名の読みとを対にして記憶する番組情報記憶部と、前記番組情報記憶部に格納されている前記番組名の読みに基づく音声データに対し、音声認識処理を施し得られた文字データである第2番組名を取得する文字データ取得回路と、前記第1番組名と前記第2番組名とが異なる場合、前記第1番組名と前記第2番組名とを対にして格納する読み替え辞書と、を有する。
【図面の簡単な説明】
【0008】
図1】本実施形態に係わる番組名検索支援装置を用いた番組名検索システムの構成の一例を示す概略図。
図2】実施形態に係る番組名検索支援装置の一例である、言語処理サーバの構成を示すブロック図。
図3】新番組情報データの一例を説明する図。
図4】番組名読み替えデータの一例を説明する図。
図5】読み替え辞書作成方法の一例を説明するフローチャート。
【発明を実施するための形態】
【0009】
以下、図面を参照して実施形態を説明する。
【0010】
図1は、本実施形態に係わる番組名検索支援装置を用いた番組名検索システムの構成の一例を示す概略図である。番組名検索システムは、言語処理サーバ1と、番組名被検索装置である放送受信装置2と、音声認識サーバ3とから構成されている。言語処理サーバ1と、放送受信装置2と、音声認識サーバ3とは、インターネット回線4を介して互いに接続されている。
【0011】
放送受信装置2は、空間を伝搬する電波として放送事業者が提供する番組や、ケーブル網やIP網などのネットワークを通じて配信事業者が供給する番組などを受信して再生する。放送受信装置2は、リモートコントローラ(以下、リモコンと示す)21を介して、ユーザからの操作指示を受け付ける。なお、放送受信装置2は、受信した番組を記録する記録再生装置を含む構成でもよい。
【0012】
リモコン21は、操作キー(数字キーや矢印キー、カラーボタンなど)と、マイクとを具備している。例えば、操作キーの一つであるマイクボタンを押すなど、リモコン21に対して所定の操作を行うことで、ユーザは、リモコン21のマイクを介して放送受信装置2に音声データを送信することができる。すなわち、ユーザは、音声データにより放送受信装置2に対して操作指示を入力することができる。
【0013】
音声認識サーバ3は、クラウドベースの音声認識サービスを提供するサーバである。音声認識サーバ3は、インターネット回線4に接続された機器から送信されてくる音声データを、文字データに変換して出力する。
【0014】
番組名検索支援装置である言語処理サーバ1は、プロセッサ11を有している。言語処理サーバ1は、放送受信装置2、または、音声認識サーバ3から入力される文字データを解析し、放送受信装置2に対する操作内容やパラメータなどを抽出し、放送受信装置2で処理可能な形式に変換して出力する。
【0015】
図2は、言語処理サーバ1の構成を示すブロック図である。言語処理サーバ1は、文字データ通信回路51、言語データ解析回路52、コマンド出力回路53、読み替え辞書登録回路54、音声データ送信回路55、音声変換回路56、の各回路を備えている。また、言語処理サーバ1は、新番組情報データベース61と、読み替え辞書62の各記憶装置も備えている。
【0016】
文字データ通信回路51、言語データ解析回路52、コマンド出力回路53、読み替え辞書登録回路54、音声データ送信回路55、音声変換回路56、の各回路の機能は、プロセッサ11であるCPU(Central Processing Unit)によりソフトウェアで実現するものであってもよいし、FPGAなどを用いてハードウェアで実現するものであってもよい。
【0017】
文字データ取得回路としての文字データ通信回路51は、インターネット回線4に接続された機器(例えば、放送受信装置2や音声認識サーバ3)との間での文字データの送受信を制御する。例えば、音声認識サーバ3から出力される文字データを取得したり、放送局などから送信される電子番組表(EPG)情報を取得したりする。また、文字データ通信回路51は、図示しない他のサーバから新番組情報を取得した場合、新番組情報データベース61に当該情報を登録する。なお、新番組情報とは、EPG情報において、それまでに取得していない新出の番組名を有する番組の情報である。
【0018】
図3は、新番組情報データの一例を説明する図である。図3に示す新番組情報データは、新番組情報データベース61に登録される。図3に示すように、新番組情報データは、1番組ごとに1レコードが作成され、各レコードは、例えば、「番組名」と、読み方(番組名の読み方のひらがな表記)である「よみ」と、「(情報)取得日」の3項目から構成される。「番組名」と「よみ」には、文字データ通信回路51が取得した新番組情報から抽出されたデータが設定される。「取得日」には、当該レコードの新番組情報を他のサーバから受信した日が設定される。
【0019】
言語データ解析回路52は、文字データ通信回路51において取得した文字データ(自然文として構成されたテキスト)に対し、必要に応じて形態素解析や構文解析などの自然言語解析処理を実行し、文字データの意味内容(操作内容)を把握する。例えば、「〇〇(番組名)が見たい」という文字データが入力されている場合、「〇〇(番組名)」を「検索」するという意味であると解析される。なお、解析結果に番組名が含まれる場合、読み替え辞書62に当該番組名が登録されているか否かを検索する。登録されている場合、解析結果として得られた当該番組名の文字データを、読み替え辞書62で指定されている別の文字データに置き換えて出力する。
【0020】
コマンド出力回路53は、言語データ解析回路52における解析結果を、放送受信装置2において処理可能な形式に変換して出力する。例えば、上述の一例の場合、「〇〇(番組名)」をキーワードとする「検索」操作を実行するよう、放送受信装置2に対して操作指示信号を出力する。
【0021】
音声変換回路56は、入力される文字データを音声データに変換する。変換された音声データは、音声データ送信回路55へ出力される。
【0022】
音声データ送信回路55は、インターネット回線4に接続された機器(例えば、音声認識サーバ3)に対し、音声変換回路56から入力された音声データを送信する。
【0023】
読み替え辞書登録回路54は、番組名読み替えデータを作成し、読み替え辞書62に登録する。図4は、番組名読み替えデータの一例を説明する図である。図4に示すように、番組名読み替えデータは、1番組ごとに1レコードが作成され、各レコードは、例えば、「入力番組名」と、「読み替え番組名」と、「登録日」の3項目から構成される。「入力番組名」は、新番組情報における「番組名」の「よみ」を音声認識サーバ3で文字データに変換して得られた番組名(文字データ)に対応する項目である。「読み替え番組名」は、「入力番組名」に登録された文字データと置き換えて使用する、別の文字データ(具体的には、新番組情報の「番組名」が設定される。「登録日」は、当該レコードが読み替え辞書62に登録された日が設定される。なお、読み替え辞書62は、言語データ解析回路52から参照される。
【0024】
次に、言語処理サーバ1における読み替え辞書作成方法について、図5を用いて説明する。図5は、読み替え辞書作成方法の一例を説明するフローチャートである。
【0025】
まず、文字データ通信回路51において、外部のサーバ等から新番組情報が取得され、新番組情報データベース61に当該情報が登録される(S1)。続いて、読み替え辞書登録回路54は、新番組情報データベース61から、読み替え辞書登録候補となる番組名を抽出する(S2)。例えば、読み替え辞書の作成を最後に実施した日以降に新番組情報データベース61に登録された番組を抽出する。読み替え辞書の作成を最後に実施した日が、例えば、2018年11月1日である場合、「取得日」が2018年11月2日以降のレコードを抽出し、抽出されたレコードの「番組名」に登録されている番組を、読み替え辞書登録候補とする。
【0026】
なお、読み替え辞書登録候補番組の抽出方法は、上述の方法に限定されない。例えば、新番組情報データベース61の各レコードに、読み替え辞書登録候補として抽出されたことがあるか否かを識別可能なフラグを設定しておき、未抽出を示すフラグを有するレコードの「番組名」に登録されている番組を、読み替え辞書登録候補としてもよい。
【0027】
次に、読み替え辞書登録回路54は、S2で抽出された番組名を、音声データに変換して音声認識サーバ3へ出力する(S3)。具体的には、まず、読み替え辞書登録回路54は、抽出された番組名(文字データ)を、音声変換回路56へ出力する。音声変換回路56は、入力された文字データを音声データに変換し、音声データ送信回路55を介して音声認識サーバ3へ出力する。なお、S2で複数の番組名が抽出された場合、複数の番組名から一つの番組名を選択し、上述したS3の手順を実行する。
【0028】
なお、抽出された番組名(文字データ)を音声データに変換するのは、音声変換回路56に限定されず、言語処理サーバ1から文字データを受信可能であって音声変換機能を有する他のサーバ等で行なってもよい。例えば、放送受信装置2に音声変換回路がある場合は、読み替え辞書登録回路54から文字データ通信回路51、インターネット回線4を介して放送受信装置2に当該番組名を送信し、放送受信装置2の音声変換回路で当該文字データを音声データに変換してもよい。この場合、変換された音声データは、インターネット回線4を介して放送受信装置2から音声認識サーバ3へ出力される。
【0029】
続いて、言語処理サーバ1の文字データ通信回路51は、S3において出力した音声データの認識結果、すなわち、音声データから変換された文字データを、音声認識サーバ3から取得する(S4)。文字データ通信回路51は、取得した文字データを読み替え辞書登録回路54へ出力する。読み替え辞書登録回路54は、入力された文字データと、S3において出力した番組名(文字データ)とを比較する(S5)。両者が一致しない場合(S5、NO)、比較した文字データを、読み替え辞書62に新規レコードとして登録する(S6)。すなわち、S3において音声認識サーバ3へ出力した番組名(文字データ)を「読み替え番組名」に設定し、S4で音声認識サーバ3から取得した文字データを「入力番組名」に設定し、登録作業を行なっている日を「登録日」に設定したレコードを、読み替え辞書62に新規登録する。
【0030】
例えば、S3において、「3年K組」という表記の番組名(文字データ)を音声変換した音声データ、すなわち、「さんねんけーぐみ」という読みを音声変換した音声データを音声認識サーバ3に出力する。S4において「三年K組」という文字データが入力された場合、両者は一致しない。従って、「3年K組」と「三年K組」の文字データのペアは、S6において、図4に示す表の一番上のレコードのように、読み替え辞書62に登録される。
【0031】
一方、S5において、入力された文字データと、S3において出力した番組名(文字データ)とが一致する場合、読み替え辞書62への登録は行なわずに、S7に進む。
【0032】
S2において抽出された読み替え辞書登録候補の番組名が複数ある場合、全ての番組について、読み替え辞書62への登録要否判定の一連の手順(S3~S6)を実行済である場合(S7、YES)、図5に示す言語処理サーバ1における読み替え辞書作成手順を終了する。一方、読み替え辞書62への登録要否判定の一連の手順を実行していない番組名がある場合(S7、NO)、S8に進んで、未実行の番組名の中から番組名を一つ抽出して、次の判定対象番組名としてセットする。セットした番組名について、S3からS6の一例の手順を実行する。
【0033】
このように、音声認識により取得した番組名の表記が、電子番組表(EPG)の番組名の表記と異なるものを、読み替え辞書として登録しておくことで、放送受信装置2で音声検索を行なった場合に、検索精度を向上させることができる。
【0034】
例えば、図1に示す番組名検索システムにおいて、特定の番組名の音声検索は、以下のように行われる。まず、ユーザが放送受信装置2のリモコン21を用いて、特定の番組名を検索したい旨を音声入力する。例えば、「BACK STREET KIDS」という番組を検索したい場合、ユーザは、「ばっくすとりーときっずがみたい」と、リモコン21のマイクに向かって発生する。
【0035】
放送受信装置2は、ユーザから入力された音声データ(例えば、「ばっくすとりーときっずがみたい」という音声データ)を、インターネット回線4を介して音声認識サーバ3に送信する。音声認識サーバ3は、入力された音声データを文字データに変換し、インターネット回線4を介して言語処理サーバ1に送信する。例えば、「ばっくすとりーときっずがみたい」という音声データは、「バックストリートキッズが見たい」という文字データに変換されて送信される。
【0036】
音声認識サーバ3から入力された文字データは、文字データ通信回路51から言語データ解析回路52へ出力される。言語データ解析回路52は、入力されている文字データに対して自然言語解析処理を行い、文字データの意味内容を把握し、解析結果を生成する。例えば、「バックストリートキッズが見たい」という文字データが入力された場合、「バックストリートキッズ」という番組名をキーワードとして「検索する」という操作を実行する、という解析結果を生成する。
【0037】
言語データ解析回路52は、解析結果に含まれる番組名が、読み替え辞書62の「入力番組名」に登録されているか否かを検索する。登録されている場合、当該レコードの「読み替え番組名」に登録されている文字データを、解析結果に含まれる当該番組名と置き換える。そして、番組名置き換え後の解析結果をコマンド出力回路53へ出力する。
【0038】
例えば、解析結果に「バックストリートキッズ」という番組名が存在する場合、言語データ解析回路52は、読み替え辞書62を参照し、「バックストリートキッズ」という番組名(文字データ)が「入力番組名」として登録されているか否かを検索する。登録されている場合、当該レコードの「読み替え番組名」に登録されている番組名(文字データ)を抽出する。
【0039】
上述のように、EPGの表記に基づく読み替え辞書登録作業がすでになされている場合、「入力番組名」が「バックストリートキッズ」、「読み替え番組名」が「BACK STREET KIDS」と設定されたレコードが、読み替え辞書62に登録されている。従って、言語データ解析回路52は、読み替え辞書62を参照し、解析結果の「バックストリートキッズ」という番組名(文字列)を「BACK STREET KIDS」に置き換える。そして、コマンド出力回路53には、「BACK STREET KIDS」という番組名をキーワードとして「検索する」という操作を実行する、という解析結果が出力される。
【0040】
コマンド出力回路53は、言語データ解析回路52から入力された解析結果を、放送受信装置2において処理可能な形式に変換して出力する。上述の一例の場合、番組表(EPG)や録画データなどの番組名において、「BACK STREET KIDS」を「検索」するよう、放送受信装置2に対して操作指示信号を出力する。
【0041】
放送受信装置2は、記憶している番組表(EPG)等から、「BACK STREET KIDS」という表記の番組名を抽出し、検索結果画面などに表示する。音声認識サーバ3から出力された文字データである「バックストリートキッズ」という表記をそのまま用いて、放送受信装置2に対して検索指示を行った場合、番組表(EPG)における表記(「BACK STREET KIDS」)と異なるため、所望の番組が検索できないという問題
があった。これに対し、本実施形態では、言語処理サーバ1において、音声認識サーバ3から出力された文字データの表記が、EPGにおける表記と異なる番組名については、EPGの表記に読み替えて、放送受信装置2に対して操作指示を行っているので、表記の不一致による検索漏れを低減することができ、音声検索における検索精度を向上させることができる。
【0042】
なお、上述では、放送受信装置2に対して番組名を音声検索する場合を一例にあげて説明したが、インターネットテレビなど、ネットワークを通じて配信業者が供給する番組などの音声検索についても、適用可能である。
【0043】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、一例として示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると共に、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0044】
1…言語処理サーバ、
2…放送受信装置、
3…音声認識サーバ、
4…インターネット回線、
21…リモコン、
51…文字データ通信回路、
52…言語データ解析回路、
53…コマンド出力回路、
54…読み替え辞書登録回路、
55…音声データ送信回路、
56…音声変換回路、
61…新番組情報データベース、
62…読み替え辞書、
図1
図2
図3
図4
図5