特許第6393219号(P6393219)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アルパイン株式会社の特許一覧

特許6393219音声入力装置及びコンピュータプログラム
<>
  • 特許6393219-音声入力装置及びコンピュータプログラム 図000002
  • 特許6393219-音声入力装置及びコンピュータプログラム 図000003
  • 特許6393219-音声入力装置及びコンピュータプログラム 図000004
  • 特許6393219-音声入力装置及びコンピュータプログラム 図000005
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6393219
(24)【登録日】2018年8月31日
(45)【発行日】2018年9月19日
(54)【発明の名称】音声入力装置及びコンピュータプログラム
(51)【国際特許分類】
   G10L 15/00 20130101AFI20180910BHJP
   G10L 15/22 20060101ALI20180910BHJP
【FI】
   G10L15/00 200G
   G10L15/22 200H
【請求項の数】11
【全頁数】12
(21)【出願番号】特願2015-49076(P2015-49076)
(22)【出願日】2015年3月12日
(65)【公開番号】特開2016-170238(P2016-170238A)
(43)【公開日】2016年9月23日
【審査請求日】2017年9月14日
(73)【特許権者】
【識別番号】000101732
【氏名又は名称】アルパイン株式会社
(74)【代理人】
【識別番号】100099748
【弁理士】
【氏名又は名称】佐藤 克志
(72)【発明者】
【氏名】青山 文彦
【審査官】 山下 剛史
(56)【参考文献】
【文献】 特開2006−227954(JP,A)
【文献】 特開2011−43710(JP,A)
【文献】 特開2008−76766(JP,A)
【文献】 特開2010−128144(JP,A)
【文献】 宮下恒雄他,属性に基づく楽曲推薦システムWisdomTunesの試作について,情報処理学会第67回(平成17年)全国大会講演論文集,2005年 3月 2日,第2分冊(人工知能と認知科学),p.325-326
【文献】 新美怜志他,再生履歴によるユーザの状況推測に基づく音楽推薦システム,情報処理学会研究報告[CD−ROM],2009年12月 5日,Vol.2009-MUS-83,No.10,p.1-4
(58)【調査した分野】(Int.Cl.,DB名)
G10L 15/00−15/34
G10K 15/04
G06F 3/16,17/30
(57)【特許請求の範囲】
【請求項1】
楽曲の属性値で操作対象とする楽曲を指定する音声入力を受け付ける音声入力装置であって、
複数の属性について各属性の属性値をもつ楽曲を記憶した楽曲記憶手段と、
前記楽曲記憶手段に記憶された楽曲を再生出力する楽曲再生手段と、
前記楽曲再生手段が再生出力した楽曲の各属性の属性値を管理する再生履歴管理手段と、
ユーザの発話による音声入力を受け付ける際に、音声入力を受け付け可能な発話例を提示する発話例提示手段とを有し、
前記発話例提示手段は、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示する発話例表示処理を行うことを特徴とする音声入力装置。
【請求項2】
請求項1記載の音声入力装置であって、
前記楽曲再生手段は、前記楽曲記憶手段に記憶された楽曲に加え、通信を介して配信される楽曲を再生出力し、
前記再生履歴管理手段は、前記楽曲記憶手段に記憶された楽曲のうちの前記楽曲再生手段が再生出力した楽曲の各属性の属性値と、通信を介して配信され前記楽曲再生手段が再生出力した楽曲の各属性の属性値とを管理することを特徴とする音声入力装置。
【請求項3】
楽曲の属性値で操作対象とする楽曲を指定する音声入力を受け付ける音声入力装置であって、
複数の属性について各属性の属性値をもつ楽曲を記憶した楽曲記憶手段と、
前記楽曲記憶手段に記憶された楽曲と、通信を介して配信される楽曲を再生出力する楽曲再生手段と、
通信を介して配信され前記楽曲再生手段が再生出力した楽曲の各属性の属性値を管理する再生履歴管理手段と、
ユーザの発話による音声入力を受け付ける際に、音声入力を受け付け可能な発話例を提示する発話例提示手段とを有し、
前記発話例提示手段は、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示する発話例表示処理を行うことを特徴とする音声入力装置。
【請求項4】
請求項2または3記載の音声入力装置であって、
前記通信を介して配信される楽曲は、ラジオ放送とインターネットラジオと動画共有サイトのうちの少なくとも一つから配信される楽曲であることを特徴とする音声入力装置。
【請求項5】
請求項1、2、3または4記載の音声入力装置であって、
前記発話例提示手段は、ユーザの発話による音声入力を受け付けるまで、前記発話例表示処理を、各回の発話例表示処理において前記提示属性値として異なる属性値が選定されるように行うことにより、表示する文字列が表す前記発話例の更新を行うことを特徴とする音声入力装置。
【請求項6】
請求項1、2、3、4または5記載の音声入力装置であって、
受け付けた音声入力において操作対象とする楽曲を指定している属性値を管理する入力履歴管理手段を有し、
前記発話例提示手段は、前記発話例表示処理において、前記入力履歴管理手段が管理している属性値を、前記提示属性値として選定しないことを特徴とする音声入力装置。
【請求項7】
請求項1、2、3、4、5または6記載の音声入力装置であって、
前記再生履歴管理手段は、前記楽曲再生手段が再生出力した楽曲の、当該楽曲を再生出力した回数も管理し、
前記発話例提示手段は、前記発話例表示処理において、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲であって前記再生履歴管理手段が管理している再生出力した回数が所定のレベル以上である楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示することを特徴とする音声入力装置。
【請求項8】
請求項1、2、3、4、5、6または7記載の音声入力装置であって、
前記複数の属性は、楽曲のソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名のうちの少なくとも2つの属性を含むことを特徴とする音声入力装置。
【請求項9】
コンピュータによって読み取られ実行されるコンピュータプログラムであって、
当該コンピュータプログラムは、前記コンピュータを、
楽曲の属性値で操作対象とする楽曲を指定する音声入力を受け付ける音声入力手段と、
複数の属性について各属性の属性値をもつ楽曲を記憶した楽曲記憶手段と、
前記楽曲記憶手段に記憶された楽曲を再生出力する楽曲再生手段と、
前記楽曲再生手段が再生出力した楽曲の各属性の属性値を管理する再生履歴管理手段と、
ユーザの発話による音声入力を受け付ける際に、音声入力を受け付け可能な発話例を提示する発話例提示手段として機能させ、
前記発話例提示手段は、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示する発話例表示処理を行うことを特徴とするコンピュータプログラム。
【請求項10】
コンピュータによって読み取られ実行されるコンピュータプログラムであって、
当該コンピュータプログラムは、前記コンピュータを、
楽曲の属性値で操作対象とする楽曲を指定する音声入力を受け付ける音声入力手段と、
複数の属性について各属性の属性値をもつ楽曲を記憶した楽曲記憶手段と、
前記楽曲記憶手段に記憶された楽曲と、通信を介して配信される楽曲を再生出力する楽曲再生手段と、
通信を介して配信され前記楽曲再生手段が再生出力した楽曲の各属性の属性値を管理する再生履歴管理手段と、
ユーザの発話による音声入力を受け付ける際に、音声入力を受け付け可能な発話例を提示する発話例提示手段として機能させ、
前記発話例提示手段は、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示する発話例表示処理を行うことを特徴とするコンピュータプログラム。
【請求項11】
請求項9または10記載のコンピュータプログラムであって、
当該コンピュータプログラムは、前記コンピュータを、さらに、受け付けた音声入力において操作対象とする楽曲を指定している属性値を管理する入力履歴管理手段として機能させ、
前記発話例提示手段は、前記発話例表示処理において、前記入力履歴管理手段が管理している属性値を、前記提示属性値として選定しないことを特徴とするコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、発話音声による入力を受け付ける音声入力の技術に関するものである。
【背景技術】
【0002】
発話音声による入力を受け付ける音声入力の技術としては、音声入力を受け付け可能な発話例として、音声認識辞書に登録された音声認識可能な単語を用いた発話例を表示する技術が知られている(たとえば、特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2010-128144号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
上述のように音声認識辞書に登録された単語を用いた発話例を表示する場合、音声入力の各回において同じ発話例を表示することは、既にユーザが音声入力可能であることを認知している発話内容を繰り返しユーザに提示することになるため、発話例を提示する意義が希薄となる。
一方、たとえば、音声入力の各回において、音声認識辞書に登録された単語をランダムに選定し、選定した単語を用いた発話例を表示することも考えられるが、このようにした場合には、数多くの単語が音声認識辞書に登録されているときには、ユーザにとって興味のない単語、すなわち、ユーザがおよそ音声入力することのない単語を用いた発話例も高い頻度で表示されることとなるため、提示される発話例は充分にユーザにとって有用なものとはならない。
そこで、本発明は、音声入力を受け付け可能な発話例を表示する音声入力装置において、よりユーザにとって有用な形態で発話例を提示することを課題とする。
【課題を解決するための手段】
【0005】
前記課題達成のために、本発明は、楽曲の属性値で操作対象とする楽曲を指定する音声入力を受け付ける音声入力装置に、複数の属性について各属性の属性値をもつ楽曲を記憶した楽曲記憶手段と、前記楽曲記憶手段に記憶された楽曲を再生出力する楽曲再生手段と、前記楽曲再生手段が再生出力した楽曲の各属性の属性値を管理する再生履歴管理手段と、ユーザの発話による音声入力を受け付ける際に、音声入力を受け付け可能な発話例を提示する発話例提示手段とを備えたものである。ただし、前記発話例提示手段は、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示する発話例表示処理を行うものである。
【0006】
ここで、以上の音声入力装置は、前記楽曲再生手段において、前記楽曲記憶手段に記憶された楽曲に加え、通信を介して配信される楽曲を再生出力し、前記再生履歴管理手段において、前記楽曲記憶手段に記憶された楽曲のうちの前記楽曲再生手段が再生出力した楽曲の各属性の属性値と、通信を介して配信され前記楽曲再生手段が再生出力した楽曲の各属性の属性値とを管理するように構成してもよい。
【0007】
または、以上の音声入力装置は、前記楽曲再生手段において、前記楽曲記憶手段に記憶された楽曲に加え、通信を介して配信される楽曲を再生出力し、前記再生履歴管理手段において、前記楽曲記憶手段に記憶された楽曲のうちの前記楽曲再生手段が再生出力した楽曲の各属性の属性値は管理せず、通信を介して配信され前記楽曲再生手段が再生出力した楽曲の各属性の属性値のみを管理するように構成してもよい。
【0008】
ここで、このような音声入力装置は、前記発話例提示手段において、ユーザの発話による音声入力を受け付けるまで、前記発話例表示処理を、各回の発話例表示処理において前記提示属性値として異なる属性値が選定されるように行うことにより、表示する文字列が表す前記発話例の更新を行うように構成してもよい。
また、以上のような音声入力装置は、当該音声入力装置に、さらに、受け付けた音声入力において操作対象とする楽曲を指定している属性値を管理する入力履歴管理手段を設け、前記発話例提示手段において、前記発話例表示処理で、前記入力履歴管理手段が管理している属性値を、前記提示属性値として選定しないように構成してもよい。
【0009】
また、この場合には、前記通信を介して配信される楽曲は、ラジオ放送とインターネットラジオと動画共有サイトのうちの少なくとも一つから配信される楽曲であってよい。
ここで、以上の音声入力装置は、前記再生履歴管理手段において、前記楽曲再生手段が再生出力した楽曲の、当該楽曲を再生出力した回数も管理し、前記発話例提示手段において、前記発話例表示処理で、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲であって前記再生履歴管理手段が管理している再生出力した回数が所定のレベル以上である楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示するように構成してもよい。
【0010】
また、以上の音声入力装置において、前記複数の属性は、楽曲のソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名のうちの少なくとも2つの属性を含むものとすることが好ましい。
【0011】
以上のような音声入力装置によれば、楽曲の属性値で、操作対象とする楽曲を指定する音声入力の発話例として、過去に再生出力した楽曲と属性値と同じ属性値をもつ楽曲、すなわち、過去に再生出力した楽曲に関連する楽曲の属性値を用いた発話例を表示する。ここで、ユーザが過去に再生した楽曲に関連する楽曲の属性値によって指定される楽曲は、ユーザが過去に再生した楽曲に関連する楽曲であり、ユーザの嗜好に合致したユーザが興味ある楽曲である蓋然性が大きい。したがって、本発明によれば、音声入力の発話例として、ユーザにとって有用な、ユーザが興味ある楽曲を操作対象とする発話例を表示することができ、発話例の表示のユーザにとっての有用性を向上することができる。
【発明の効果】
【0012】
以上のように、本発明によれば、音声入力を受け付け可能な発話例を表示する音声入力装置において、よりユーザにとって有用な形態で発話例を提示することができる。
【図面の簡単な説明】
【0013】
図1】本発明の実施形態に係るAVシステムの構成を示すブロック図である。
図2】本発明の実施形態に係る認識履歴テーブルと再生頻度テーブルを示す図である。
図3】本発明の実施形態に係る発話例提示処理を示すフローチャートである。
図4】本発明の実施形態に係る音声入力案内ウインドウを示す図である。
【発明を実施するための形態】
【0014】
以下、本発明の実施形態を、自動車に搭載されるAVシステムへの適用を例にとり説明する。
図1に、本実施形態に係るAVシステムの構成を示す。
図示するように、AVシステム1は、マイクロフォン101、音声認識エンジン102、音声認識辞書103、辞書作成部104、音声入力制御部105、認識履歴テーブル106、ディスプレイ107、入力装置108、スピーカ等を備えた音声出力装置109、楽曲データベース110、再生履歴テーブル111、楽曲管理部112、メディアプレイヤ113、HDD114(ハードディスク114)、外部インタフェース115、デジタルラジオ受信機116、移動通信装置117を備えている。
【0015】
ただし、AVシステム1は、CPUやメモリやその他の周辺デバイスを備えたコンピュータを用いて構成されるものであって良く、また、この場合、音声認識エンジン102、辞書作成部104、音声入力制御部105、楽曲管理部112、メディアプレイヤ113などは、CPUが所定のコンピュータプログラムを実行することにより実現されるものであってよい。
【0016】
さて、このようなAVシステム1の構成において、HDD114には、楽曲のオーディオファイルが格納されている。また、外部インタフェース115には、楽曲のオーディオファイルを格納したポータブルプレイヤ2を接続することができる。また、デジタルラジオ受信機116はデジタルラジオ局3が放送するデジタルラジオ放送を受信する。また、移動通信装置117は、移動通信を介してインターネット4に接続することができる。
【0017】
次に、楽曲管理部112は、HDD114とポータブルプレイヤ2を参照し、HDD114に格納された楽曲のオーディオファイルとポータブルプレイヤ2に格納されている楽曲のオーディオファイルの情報を楽曲データベース110に登録する。楽曲データベース110に登録する各オーディオファイルの情報としては、オーディオファイルのロケーションや、オーディオファイルの楽曲の属性値を登録する。楽曲データベース110に属性値を登録する楽曲の属性としては、楽曲のソング名(タイトル)、アルバム名、アーティスト名、ジャンル名、コンポーザ名などを用いる。また、楽曲データベース110には、各属性の属性値毎に作成したリストも登録する。ここで、属性Aの属性値Bについて作成したリストは、属性Aの属性値がBであるオーディオファイルをリストアップしたリストである。なお、各オーディオファイルの楽曲の各属性の属性値は、HDD114やポータブルプレイヤ2に登録されており、楽曲管理部112は、HDD114やポータブルプレイヤ2から、各オーディオファイルの楽曲の各属性の属性値を取得して楽曲データベース110に登録する。
【0018】
次に、辞書作成部104は、楽曲データベース110を参照し、楽曲データベース110にオーディオファイルが登録されている楽曲の属性値として用いられている語彙(ソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名など)を抽出し、抽出した各語彙を認識するための辞書データを作成し、音声認識辞書103に登録する。ここで、音声認識辞書103には、上記語彙を認識するための辞書データの他に、音声入力制御部105が音声入力を受け付ける各種コマンドを表す語彙を認識するための辞書データも格納されている。
【0019】
次に、音声認識エンジン102は音声認識辞書103を用いて、マイクロフォン101から入力するユーザの発話音声を認識し、音声入力制御部105は、音声認識エンジン102の音声認識結果を音声入力として受け付ける。
【0020】
一方、メディアプレイヤ113は、音声入力制御部105がユーザから受け付けた音声入力や入力装置108で受け付けたユーザの操作に応じて、HDD114やポータブルプレイヤ2にオーディオファイルが格納されている楽曲を音声出力装置109から再生出力したり、デジタルラジオ受信機116にデジタルラジオ放送を受信させてデジタルラジオ放送で受信した楽曲を音声出力装置109から再生出力したり、移動通信装置117を介してインターネット4上のインターネットラジオサービス5にアクセスして、ユーザが選択したインターネットラジオステーションから配信される楽曲を音声出力装置109から再生出力したり、移動通信装置117を介してインターネット4上の動画共有サービス6にアクセスして、ユーザが選択した楽曲ビデオの配信を動画共有サービス6から受けディスプレイ107と音声出力装置109から再生出力する処理などを行う。
【0021】
また、メディアプレイヤ113は、以上のように、HDD114、ポータブルプレイヤ2、デジタルラジオ放送、インターネットラジオサービス5の楽曲や、動画共有サービス6の楽曲ビデオの再生出力を行ったならば、再生出力した楽曲、または、再生出力した楽曲ビデオの楽曲の情報を再生履歴テーブル111に登録する。
【0022】
ここで、図2aに再生履歴テーブル111の内容を示すように、再生履歴テーブル111は、メディアプレイヤ113が再生出力したことのある楽曲、または、再生出力したことのある楽曲ビデオの楽曲毎のエントリ(図の各行)を有し、メディアプレイヤ113は、各楽曲のエントリに、その楽曲の情報として、その楽曲の各属性の属性値(ソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名など)と、その楽曲をメディアプレイヤ113が再生出力した回数を登録する。すなわち、メディアプレイヤ113は、HDD114、ポータブルプレイヤ2、デジタルラジオ放送、インターネットラジオサービス5の楽曲や、動画共有サービス6の楽曲ビデオの再生出力を行ったならば、再生出力した楽曲、または、再生出力した楽曲ビデオの楽曲の各属性の属性値が登録されているエントリが再生履歴テーブル111に存在すかどうかを調べ、存在していれば、そのエントリの再生回数を1増加し、存在していない場合には新たなエントリを再生履歴テーブル111に作成し、作成したエントリに、再生出力した再生出力した楽曲、または、再生出力した楽曲ビデオの楽曲の各属性の属性値を登録すると共に、当該作成したエントリの再生回数に1を登録する。
【0023】
ただし、メディアプレイヤ113は、HDD114、ポータブルプレイヤ2の楽曲の再生出力については、再生出力した楽曲の情報の再生履歴テーブル111への登録を行わないようにしてもよい。すなわち、メディアプレイヤ113は、デジタルラジオ放送、インターネットラジオサービス5の楽曲や、動画共有サービス6の楽曲ビデオの再生出力を行った場合にのみ、再生出力した楽曲の情報の再生履歴テーブル111への登録を行うようにしてもよい。
【0024】
なお、HDD114、ポータブルプレイヤ2の楽曲の各属性の属性値は楽曲データベース110から取得することができ、デジタルラジオ放送、インターネットラジオサービス5の楽曲の各属性の属性値は、楽曲の放送時に楽曲と共に配信される楽曲の属性情報から取得することができ、動画共有サイトの楽曲ビデオの楽曲の各属性の属性値は、楽曲ビデオと共に動画共有サイトに公開されている楽曲ビデオのタイトルや基本情報(動画の説明)から取得することができる。
【0025】
次に、認識履歴テーブル106には、音声入力制御部105によって、音声入力制御部105が音声入力を受け付けたことのある音声入力内容が登録される。
ここで、いま、音声入力制御部105が音声入力受け付けるユーザの発話のフォーマットが
「プレイ“楽曲の属性値”」 と、「リスト“楽曲の属性値”」であるものとする。
【0026】
ここで、“プレイ”と“リスト”は音声入力コマンドであり、“楽曲の属性値”はコマンドのパラメータである。そして、「プレイ“楽曲の属性値”」は“楽曲の属性値”と等しい属性値を持つ楽曲の再生を要求する音声入力であり、「リスト“楽曲の属性値”」は、“楽曲の属性値”と等しい属性値を持つ楽曲のリストの表示を要求する音声入力である。すなわち、Xがソング名であれば、「プレイ X」は、ソング名Xの楽曲の再生を要求する音声入力であり、Yがアーティスト名であれば「リスト Y」は、アーティスト名Yの楽曲のリストの表示を要求する音声入力である。
【0027】
そして、図2bに示すように、認識履歴テーブル106は、音声入力制御部105が音声入力を受け付けるコマンド毎のエントリ(図の各行)を有し、音声入力制御部105は、音声入力を受け付ける度に、音声入力を受け付けたコマンドに対応するエントリに、音声入力を受け付けたコマンドのパラメータ(楽曲の属性値)が登録されていない場合には、当該パラメータを登録する。
【0028】
以下、音声入力制御部105における音声入力受付動作について説明する。
音声入力制御部105は、入力装置108の操作を介して、または、所定の発話音声による音声入力を介して、ユーザから音声入力による楽曲選択操作開始の指示を受け付けたならば、発話例提示処理を行って、音声入力受付可能な発話例をディスプレイ107に表示する。ここで、音声入力制御部105は、発話例提示処理において、上述した“プレイ”コマンドの音声入力「プレイ“楽曲の属性値”」 の発話例と、“リスト”コマンドの音声入力「リスト“楽曲の属性値”」の発話例を表示する。
【0029】
図3に、この発話例提示処理の手順を示す。
図示するように発話例提示処理において、音声入力制御部105は、“プレイ”コマンドの発話例に用いる属性を、ソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名などの楽曲の各属性のうちからランダムに第1属性として選択する(ステップ302)。
【0030】
次に、“リスト”コマンドの発話例に用いる属性を、アルバム名、アーティスト名、ジャンル名、コンポーザ名などの、ソングを除く楽曲の各属性のうちからランダムに第2属性として選択する(ステップ304)。
【0031】
次に、再生履歴テーブル111に登録されている楽曲のうちの再生回数が上位の楽曲の内からランダムに一つの楽曲を参照楽曲として選択する(ステップ306)。そして、参照楽曲に関連する楽曲を、楽曲データベース110に登録されている楽曲のうちからランダムに選定し、選定した楽曲の第1属性の属性値を第1提示属性値として選定する(ステップ308)。
【0032】
ここで、参照楽曲に関連する楽曲とは、参照楽曲と、ソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名などの属性のうちの予め定めたいずれか一つの属性または予め定めた複数の属性の属性値が一致する楽曲である。
【0033】
そして、第1提示属性値が認識履歴テーブル106の“プレイ”コマンドのエントリに登録されているかどうかを調べ(ステップ310)、登録されていればステップ308からの処理に戻り、登録されていなければステップ312の処理に進む。なお、ステップ310は、第1提示属性値が認識履歴テーブル106の“プレイ”コマンドのエントリと“リスト”コマンドのエントリのいずれかに登録されているかどうかを調べ、いずれかに登録されていればステップ308からの処理に戻り、いずれにも登録されていなければステップ312の処理に進むステップとしてもよい。
【0034】
さて、第1提示属性値が認識履歴テーブル106の“プレイ”コマンドのエントリに登録されておらず(ステップ310)、ステップ312に進んだならば、当該ステップ312において、再度、参照楽曲に関連する楽曲を、楽曲データベース110に登録されている楽曲のうちからランダムに選定し、選定した楽曲の第2属性の属性値を第2提示属性値として選定する。
そして、第2提示属性値が認識履歴テーブル106の“リスト”コマンドのエントリに登録されているかどうかを調べ(ステップ314)、登録されていれば、ステップ312からの処理に戻り、登録されていなければステップ316の処理に進む。なお、ステップ314は、第2提示属性値が認識履歴テーブル106の“プレイ”コマンドのエントリと“リスト”コマンドのエントリのいずれかに登録されているかどうかを調べ、いずれかに登録されていればステップ312からの処理に戻り、いずれにも登録されていなければステップ316の処理に進むステップとしてもよい。
【0035】
さて、第2提示属性値が認識履歴テーブル106の“リスト”コマンドのエントリに登録されておらず(ステップ314)、ステップ316に進んだ場合には、当該ステップ316において、図4aに示すような、第1提示属性値を用いた“プレイ”コマンドの発話例401と、第2提示属性値を用いた“リスト”コマンドの発話例402とを表した音声入力案内ウインドウをディスプレイ107に表示する(ステップ316)。
【0036】
ここで、“プレイ”コマンドの発話例401は、「プレイ “第1提示属性値”」とする。すなわち、第1属性がソング名で、第1提示属性値がソング名「ビリー ジェーン」であれば、「プレイ ビリー ジェーン」を“プレイ”コマンドの発話例401とする。また、“リスト" コマンドの発話例402は、「リスト “第2提示属性値”」とする。すなわち、第2属性がアーティスト名で、第2提示属性値がアーティスト名「マイケル ジャックであれば」であれば、「リスト マイケル ジャック」を“リスト” コマンドの発話例402とする。
【0037】
そして、このように音声入力案内ウインドウを表示したならば、所定のタイムアウト時間(たとえば、3秒)を設定したタイマをスタートし(ステップ318)、音声入力案内ウインドウに設けた終了ボタン403の操作による終了指示の発生と(ステップ320)、音声入力の終了と(ステップ322)、タイマのタイムアウトの発生(ステップ324)とを監視する。
【0038】
そして、終了指示の発生(ステップ320)、または、音声入力の終了(ステップ322)が発生した場合には、発話例提示処理を終了する。なお、音声入力の終了については後述する。
【0039】
一方、タイマのタイムアウトが発生した場合には(ステップ324)、ステップ302からの処理に戻り、以上の処理を繰り返す。
ここで、このように、終了指示が発生するか音声入力が終了するまで、タイマのタイムアウトが発生する度に、ステップ302からの処理を繰り返すことにより、音声入力案内ウインドウに表示する発話例を、定期的に、順次、図4a、図4b、...に示すように更新することができ、ユーザにより多くの発話例を提示できるようになる。
【0040】
なお、ステップ302からの処理の繰り返しの各回において行われるステップ308の第1提示属性値の選定は、前回以前の回のステップ308で既に第1提示属性値として選定した属性値は、今回の第1提示属性値として選定しないように行い、ステップ302からの処理の繰り返しの各回において行われるステップ312の第2提示属性値の選定は、前回以前の回のステップ312で既に第2提示属性値として選定した属性値は、今回の第1提示属性値として選定しないように行う。より具体的には、ステップ308では、参照楽曲に関連する楽曲を、楽曲データベース110に登録されている楽曲のうちからランダムに選定する処理を、選定した楽曲の第1属性の属性値が前回以前の回のステップ308で既に第1提示属性値として選定した属性値と異なる属性値となるまで行い、異なる属性値となったならば当該異なる属性値を第1提示属性値として選定する。また、同様に、ステップ312では、参照楽曲に関連する楽曲を、楽曲データベース110に登録されている楽曲のうちからランダムに選定する処理を、選定した楽曲の第2属性の属性値が前回以前の回のステップ312で既に第2提示属性値として選定した属性値と異なる属性値となるまで行い、異なる属性値となったならば当該異なる属性値を第2提示属性値として選定する。
【0041】
以上、音声入力制御部105が行う発話例提示処理について説明した。
さて、音声入力制御部105は、以上の発話例提示処理と並行して、入力装置108に設けられた「発話」ボタンの操作の発生を監視する。
そして、入力装置108に設けられた「発話」ボタンが操作されたならば、音声入力制御部105はマイクロフォン101から入力するユーザの発話音声の音声認識を音声認識エンジン102に開始させ、音声認識エンジン102は音声認識辞書103を用いた音声認識を行い、音声認識結果を音声入力制御部105に出力し、音声入力制御部105は音声認識結果を正常に取得できたならば音声認識結果を音声入力内容として受け付けて音声入力を終了し、上述のように発話例提示処理を終了した上で、音声認識エンジン102の受け付けた音声入力内容に応じた処理を行う。
【0042】
すなわち、音声入力制御部105は、音声認識結果が、「プレイX」(ただし、Xは楽曲の属性値)であれば、メディアプレイヤ113にXを属性値としてもつ楽曲の再生を要求し、メディアプレイヤ113は、楽曲データベース110を参照してXを属性値としてもつ楽曲のオーディオファイルの情報を抽出し、HDD114とポータブルプレイヤ2に格納されているXを属性値としてもつ楽曲を音声出力装置109に順次再生出力する。
【0043】
なお、再生出力される楽曲は、Xがソング名であればソング名がXの楽曲となり、Xがアルバム名であればアルバム名がXの各楽曲となり、Xがアーティスト名であればアーティスト名がXの各楽曲、Xがジャンル名であればジャンル名がXの各楽曲となる。
【0044】
また、音声認識結果が、「リスト Y」(ただし、Yは楽曲の属性値)であれば、メディアプレイヤ113にYを属性値としてもつ楽曲のリストの表示を要求し、メディアプレイヤ113は、楽曲データベース110を参照してYを属性値としてもつ楽曲のリストを抽出し、抽出したリストをディスプレイ107に表示する。なお、Yがアルバム名であれば、表示するリストはアルバム名がYのソング名のリストとなり、Yがアーティスト名であれば表示するリストはアーティスト名がYの楽曲のアルバム名のリストとなり、Yがジャンル名であれば表示するリストはジャンル名がYの楽曲のアーティスト名のリストとなる。
【0045】
以上、本発明の実施形態について説明した。
以上のように本実施形態では、楽曲の属性値(ソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名など)で、操作対象とする楽曲を指定する音声入力の発話例として、ユーザが過去に再生した楽曲に関連する楽曲の属性値を用いた発話例を表示する。ここで、ユーザが過去に再生した楽曲に関連する楽曲の属性値によって指定される楽曲は、ユーザが過去に再生した楽曲に関連する楽曲であり、ユーザの嗜好に合致しユーザが興味ある楽曲である蓋然性が大きい。したがって、本実施形態によれば、音声入力の発話例として、ユーザにとって有用な、ユーザが興味ある楽曲を操作対象とする発話例を表示することができる。
【符号の説明】
【0046】
1…AVシステム、2…ポータブルプレイヤ、3…デジタルラジオ局、4…インターネット、5…インターネットラジオサービス、6…動画共有サービス、101…マイクロフォン、102…音声認識エンジン、103…音声認識辞書、104…辞書作成部、105…音声入力制御部、106…認識履歴テーブル、107…ディスプレイ、108…入力装置、109…音声出力装置、110…楽曲データベース、111…再生履歴テーブル、112…楽曲管理部、113…メディアプレイヤ、114…HDD、115…外部インタフェース、116…デジタルラジオ受信機、117…移動通信装置。
図1
図2
図3
図4