特許6393219 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ アルパイン株式会社の特許一覧

特許6393219音声入力装置及びコンピュータプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6393219

(24)【登録日】2018年8月31日

(45)【発行日】2018年9月19日

(54)【発明の名称】音声入力装置及びコンピュータプログラム

(51)【国際特許分類】

G10L 15/00 20130101AFI20180910BHJP

G10L 15/22 20060101ALI20180910BHJP

【ＦＩ】

G10L15/00 200G

G10L15/22 200H

【請求項の数】11

【全頁数】12

(21)【出願番号】特願2015-49076(P2015-49076)

(22)【出願日】2015年3月12日

(65)【公開番号】特開2016-170238(P2016-170238A)

(43)【公開日】2016年9月23日

【審査請求日】2017年9月14日

(73)【特許権者】

【識別番号】000101732

【氏名又は名称】アルパイン株式会社

(74)【代理人】

【識別番号】100099748

【弁理士】

【氏名又は名称】佐藤克志

(72)【発明者】

【氏名】青山文彦

【審査官】山下剛史

(56)【参考文献】

【文献】特開２００６−２２７９５４（ＪＰ，Ａ）

【文献】特開２０１１−４３７１０（ＪＰ，Ａ）

【文献】特開２００８−７６７６６（ＪＰ，Ａ）

【文献】特開２０１０−１２８１４４（ＪＰ，Ａ）

【文献】宮下恒雄他，属性に基づく楽曲推薦システムＷｉｓｄｏｍＴｕｎｅｓの試作について，情報処理学会第６７回（平成１７年）全国大会講演論文集，２００５年３月２日，第２分冊（人工知能と認知科学），p.325-326

【文献】新美怜志他，再生履歴によるユーザの状況推測に基づく音楽推薦システム，情報処理学会研究報告［ＣＤ−ＲＯＭ］，２００９年１２月５日，Vol.2009-MUS-83，No.10，p.1-4

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ１０Ｌ１５／００−１５／３４

Ｇ１０Ｋ１５／０４

Ｇ０６Ｆ３／１６，１７／３０

(57)【特許請求の範囲】

【請求項1】

楽曲の属性値で操作対象とする楽曲を指定する音声入力を受け付ける音声入力装置であって、
複数の属性について各属性の属性値をもつ楽曲を記憶した楽曲記憶手段と、
前記楽曲記憶手段に記憶された楽曲を再生出力する楽曲再生手段と、
前記楽曲再生手段が再生出力した楽曲の各属性の属性値を管理する再生履歴管理手段と、
ユーザの発話による音声入力を受け付ける際に、音声入力を受け付け可能な発話例を提示する発話例提示手段とを有し、
前記発話例提示手段は、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示する発話例表示処理を行うことを特徴とする音声入力装置。

【請求項2】

請求項１記載の音声入力装置であって、
前記楽曲再生手段は、前記楽曲記憶手段に記憶された楽曲に加え、通信を介して配信される楽曲を再生出力し、
前記再生履歴管理手段は、前記楽曲記憶手段に記憶された楽曲のうちの前記楽曲再生手段が再生出力した楽曲の各属性の属性値と、通信を介して配信され前記楽曲再生手段が再生出力した楽曲の各属性の属性値とを管理することを特徴とする音声入力装置。

【請求項3】

楽曲の属性値で操作対象とする楽曲を指定する音声入力を受け付ける音声入力装置であって、
複数の属性について各属性の属性値をもつ楽曲を記憶した楽曲記憶手段と、
前記楽曲記憶手段に記憶された楽曲と、通信を介して配信される楽曲を再生出力する楽曲再生手段と、
通信を介して配信され前記楽曲再生手段が再生出力した楽曲の各属性の属性値を管理する再生履歴管理手段と、
ユーザの発話による音声入力を受け付ける際に、音声入力を受け付け可能な発話例を提示する発話例提示手段とを有し、
前記発話例提示手段は、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示する発話例表示処理を行うことを特徴とする音声入力装置。

【請求項4】

請求項２または３記載の音声入力装置であって、
前記通信を介して配信される楽曲は、ラジオ放送とインターネットラジオと動画共有サイトのうちの少なくとも一つから配信される楽曲であることを特徴とする音声入力装置。

【請求項5】

請求項１、２、３または４記載の音声入力装置であって、
前記発話例提示手段は、ユーザの発話による音声入力を受け付けるまで、前記発話例表示処理を、各回の発話例表示処理において前記提示属性値として異なる属性値が選定されるように行うことにより、表示する文字列が表す前記発話例の更新を行うことを特徴とする音声入力装置。

【請求項6】

請求項１、２、３、４または５記載の音声入力装置であって、
受け付けた音声入力において操作対象とする楽曲を指定している属性値を管理する入力履歴管理手段を有し、
前記発話例提示手段は、前記発話例表示処理において、前記入力履歴管理手段が管理している属性値を、前記提示属性値として選定しないことを特徴とする音声入力装置。

【請求項7】

請求項１、２、３、４、５または６記載の音声入力装置であって、
前記再生履歴管理手段は、前記楽曲再生手段が再生出力した楽曲の、当該楽曲を再生出力した回数も管理し、
前記発話例提示手段は、前記発話例表示処理において、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲であって前記再生履歴管理手段が管理している再生出力した回数が所定のレベル以上である楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示することを特徴とする音声入力装置。

【請求項8】

請求項１、２、３、４、５、６または７記載の音声入力装置であって、
前記複数の属性は、楽曲のソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名のうちの少なくとも２つの属性を含むことを特徴とする音声入力装置。

【請求項9】

コンピュータによって読み取られ実行されるコンピュータプログラムであって、
当該コンピュータプログラムは、前記コンピュータを、
楽曲の属性値で操作対象とする楽曲を指定する音声入力を受け付ける音声入力手段と、
複数の属性について各属性の属性値をもつ楽曲を記憶した楽曲記憶手段と、
前記楽曲記憶手段に記憶された楽曲を再生出力する楽曲再生手段と、
前記楽曲再生手段が再生出力した楽曲の各属性の属性値を管理する再生履歴管理手段と、
ユーザの発話による音声入力を受け付ける際に、音声入力を受け付け可能な発話例を提示する発話例提示手段として機能させ、
前記発話例提示手段は、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示する発話例表示処理を行うことを特徴とするコンピュータプログラム。

【請求項10】

コンピュータによって読み取られ実行されるコンピュータプログラムであって、
当該コンピュータプログラムは、前記コンピュータを、
楽曲の属性値で操作対象とする楽曲を指定する音声入力を受け付ける音声入力手段と、
複数の属性について各属性の属性値をもつ楽曲を記憶した楽曲記憶手段と、
前記楽曲記憶手段に記憶された楽曲と、通信を介して配信される楽曲を再生出力する楽曲再生手段と、
通信を介して配信され前記楽曲再生手段が再生出力した楽曲の各属性の属性値を管理する再生履歴管理手段と、
ユーザの発話による音声入力を受け付ける際に、音声入力を受け付け可能な発話例を提示する発話例提示手段として機能させ、
前記発話例提示手段は、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示する発話例表示処理を行うことを特徴とするコンピュータプログラム。

【請求項11】

請求項９または１０記載のコンピュータプログラムであって、
当該コンピュータプログラムは、前記コンピュータを、さらに、受け付けた音声入力において操作対象とする楽曲を指定している属性値を管理する入力履歴管理手段として機能させ、
前記発話例提示手段は、前記発話例表示処理において、前記入力履歴管理手段が管理している属性値を、前記提示属性値として選定しないことを特徴とするコンピュータプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、発話音声による入力を受け付ける音声入力の技術に関するものである。

【背景技術】

【0002】

発話音声による入力を受け付ける音声入力の技術としては、音声入力を受け付け可能な発話例として、音声認識辞書に登録された音声認識可能な単語を用いた発話例を表示する技術が知られている（たとえば、特許文献１）。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開2010-128144号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

上述のように音声認識辞書に登録された単語を用いた発話例を表示する場合、音声入力の各回において同じ発話例を表示することは、既にユーザが音声入力可能であることを認知している発話内容を繰り返しユーザに提示することになるため、発話例を提示する意義が希薄となる。
一方、たとえば、音声入力の各回において、音声認識辞書に登録された単語をランダムに選定し、選定した単語を用いた発話例を表示することも考えられるが、このようにした場合には、数多くの単語が音声認識辞書に登録されているときには、ユーザにとって興味のない単語、すなわち、ユーザがおよそ音声入力することのない単語を用いた発話例も高い頻度で表示されることとなるため、提示される発話例は充分にユーザにとって有用なものとはならない。
そこで、本発明は、音声入力を受け付け可能な発話例を表示する音声入力装置において、よりユーザにとって有用な形態で発話例を提示することを課題とする。

【課題を解決するための手段】

【0005】

前記課題達成のために、本発明は、楽曲の属性値で操作対象とする楽曲を指定する音声入力を受け付ける音声入力装置に、複数の属性について各属性の属性値をもつ楽曲を記憶した楽曲記憶手段と、前記楽曲記憶手段に記憶された楽曲を再生出力する楽曲再生手段と、前記楽曲再生手段が再生出力した楽曲の各属性の属性値を管理する再生履歴管理手段と、ユーザの発話による音声入力を受け付ける際に、音声入力を受け付け可能な発話例を提示する発話例提示手段とを備えたものである。ただし、前記発話例提示手段は、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示する発話例表示処理を行うものである。

【0006】

ここで、以上の音声入力装置は、前記楽曲再生手段において、前記楽曲記憶手段に記憶された楽曲に加え、通信を介して配信される楽曲を再生出力し、前記再生履歴管理手段において、前記楽曲記憶手段に記憶された楽曲のうちの前記楽曲再生手段が再生出力した楽曲の各属性の属性値と、通信を介して配信され前記楽曲再生手段が再生出力した楽曲の各属性の属性値とを管理するように構成してもよい。

【0007】

または、以上の音声入力装置は、前記楽曲再生手段において、前記楽曲記憶手段に記憶された楽曲に加え、通信を介して配信される楽曲を再生出力し、前記再生履歴管理手段において、前記楽曲記憶手段に記憶された楽曲のうちの前記楽曲再生手段が再生出力した楽曲の各属性の属性値は管理せず、通信を介して配信され前記楽曲再生手段が再生出力した楽曲の各属性の属性値のみを管理するように構成してもよい。

【0008】

ここで、このような音声入力装置は、前記発話例提示手段において、ユーザの発話による音声入力を受け付けるまで、前記発話例表示処理を、各回の発話例表示処理において前記提示属性値として異なる属性値が選定されるように行うことにより、表示する文字列が表す前記発話例の更新を行うように構成してもよい。
また、以上のような音声入力装置は、当該音声入力装置に、さらに、受け付けた音声入力において操作対象とする楽曲を指定している属性値を管理する入力履歴管理手段を設け、前記発話例提示手段において、前記発話例表示処理で、前記入力履歴管理手段が管理している属性値を、前記提示属性値として選定しないように構成してもよい。

【0009】

また、この場合には、前記通信を介して配信される楽曲は、ラジオ放送とインターネットラジオと動画共有サイトのうちの少なくとも一つから配信される楽曲であってよい。
ここで、以上の音声入力装置は、前記再生履歴管理手段において、前記楽曲再生手段が再生出力した楽曲の、当該楽曲を再生出力した回数も管理し、前記発話例提示手段において、前記発話例表示処理で、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲であって前記再生履歴管理手段が管理している再生出力した回数が所定のレベル以上である楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示するように構成してもよい。

【0010】

また、以上の音声入力装置において、前記複数の属性は、楽曲のソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名のうちの少なくとも２つの属性を含むものとすることが好ましい。

【0011】

以上のような音声入力装置によれば、楽曲の属性値で、操作対象とする楽曲を指定する音声入力の発話例として、過去に再生出力した楽曲と属性値と同じ属性値をもつ楽曲、すなわち、過去に再生出力した楽曲に関連する楽曲の属性値を用いた発話例を表示する。ここで、ユーザが過去に再生した楽曲に関連する楽曲の属性値によって指定される楽曲は、ユーザが過去に再生した楽曲に関連する楽曲であり、ユーザの嗜好に合致したユーザが興味ある楽曲である蓋然性が大きい。したがって、本発明によれば、音声入力の発話例として、ユーザにとって有用な、ユーザが興味ある楽曲を操作対象とする発話例を表示することができ、発話例の表示のユーザにとっての有用性を向上することができる。

【発明の効果】

【0012】

以上のように、本発明によれば、音声入力を受け付け可能な発話例を表示する音声入力装置において、よりユーザにとって有用な形態で発話例を提示することができる。

【図面の簡単な説明】

【0013】

【図1】本発明の実施形態に係るＡＶシステムの構成を示すブロック図である。

【図2】本発明の実施形態に係る認識履歴テーブルと再生頻度テーブルを示す図である。

【図3】本発明の実施形態に係る発話例提示処理を示すフローチャートである。

【図4】本発明の実施形態に係る音声入力案内ウインドウを示す図である。

【発明を実施するための形態】

【0014】

以下、本発明の実施形態を、自動車に搭載されるＡＶシステムへの適用を例にとり説明する。
図１に、本実施形態に係るＡＶシステムの構成を示す。
図示するように、ＡＶシステム１は、マイクロフォン１０１、音声認識エンジン１０２、音声認識辞書１０３、辞書作成部１０４、音声入力制御部１０５、認識履歴テーブル１０６、ディスプレイ１０７、入力装置１０８、スピーカ等を備えた音声出力装置１０９、楽曲データベース１１０、再生履歴テーブル１１１、楽曲管理部１１２、メディアプレイヤ１１３、ＨＤＤ１１４（ハードディスク１１４）、外部インタフェース１１５、デジタルラジオ受信機１１６、移動通信装置１１７を備えている。

【0015】

ただし、ＡＶシステム１は、ＣＰＵやメモリやその他の周辺デバイスを備えたコンピュータを用いて構成されるものであって良く、また、この場合、音声認識エンジン１０２、辞書作成部１０４、音声入力制御部１０５、楽曲管理部１１２、メディアプレイヤ１１３などは、ＣＰＵが所定のコンピュータプログラムを実行することにより実現されるものであってよい。

【0016】

さて、このようなＡＶシステム１の構成において、ＨＤＤ１１４には、楽曲のオーディオファイルが格納されている。また、外部インタフェース１１５には、楽曲のオーディオファイルを格納したポータブルプレイヤ２を接続することができる。また、デジタルラジオ受信機１１６はデジタルラジオ局３が放送するデジタルラジオ放送を受信する。また、移動通信装置１１７は、移動通信を介してインターネット４に接続することができる。

【0017】

次に、楽曲管理部１１２は、ＨＤＤ１１４とポータブルプレイヤ２を参照し、ＨＤＤ１１４に格納された楽曲のオーディオファイルとポータブルプレイヤ２に格納されている楽曲のオーディオファイルの情報を楽曲データベース１１０に登録する。楽曲データベース１１０に登録する各オーディオファイルの情報としては、オーディオファイルのロケーションや、オーディオファイルの楽曲の属性値を登録する。楽曲データベース１１０に属性値を登録する楽曲の属性としては、楽曲のソング名（タイトル）、アルバム名、アーティスト名、ジャンル名、コンポーザ名などを用いる。また、楽曲データベース１１０には、各属性の属性値毎に作成したリストも登録する。ここで、属性Ａの属性値Ｂについて作成したリストは、属性Ａの属性値がＢであるオーディオファイルをリストアップしたリストである。なお、各オーディオファイルの楽曲の各属性の属性値は、ＨＤＤ１１４やポータブルプレイヤ２に登録されており、楽曲管理部１１２は、ＨＤＤ１１４やポータブルプレイヤ２から、各オーディオファイルの楽曲の各属性の属性値を取得して楽曲データベース１１０に登録する。

【0018】

次に、辞書作成部１０４は、楽曲データベース１１０を参照し、楽曲データベース１１０にオーディオファイルが登録されている楽曲の属性値として用いられている語彙（ソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名など）を抽出し、抽出した各語彙を認識するための辞書データを作成し、音声認識辞書１０３に登録する。ここで、音声認識辞書１０３には、上記語彙を認識するための辞書データの他に、音声入力制御部１０５が音声入力を受け付ける各種コマンドを表す語彙を認識するための辞書データも格納されている。

【0019】

次に、音声認識エンジン１０２は音声認識辞書１０３を用いて、マイクロフォン１０１から入力するユーザの発話音声を認識し、音声入力制御部１０５は、音声認識エンジン１０２の音声認識結果を音声入力として受け付ける。

【0020】

一方、メディアプレイヤ１１３は、音声入力制御部１０５がユーザから受け付けた音声入力や入力装置１０８で受け付けたユーザの操作に応じて、ＨＤＤ１１４やポータブルプレイヤ２にオーディオファイルが格納されている楽曲を音声出力装置１０９から再生出力したり、デジタルラジオ受信機１１６にデジタルラジオ放送を受信させてデジタルラジオ放送で受信した楽曲を音声出力装置１０９から再生出力したり、移動通信装置１１７を介してインターネット４上のインターネットラジオサービス５にアクセスして、ユーザが選択したインターネットラジオステーションから配信される楽曲を音声出力装置１０９から再生出力したり、移動通信装置１１７を介してインターネット４上の動画共有サービス６にアクセスして、ユーザが選択した楽曲ビデオの配信を動画共有サービス６から受けディスプレイ１０７と音声出力装置１０９から再生出力する処理などを行う。

【0021】

また、メディアプレイヤ１１３は、以上のように、ＨＤＤ１１４、ポータブルプレイヤ２、デジタルラジオ放送、インターネットラジオサービス５の楽曲や、動画共有サービス６の楽曲ビデオの再生出力を行ったならば、再生出力した楽曲、または、再生出力した楽曲ビデオの楽曲の情報を再生履歴テーブル１１１に登録する。

【0022】

ここで、図２ａに再生履歴テーブル１１１の内容を示すように、再生履歴テーブル１１１は、メディアプレイヤ１１３が再生出力したことのある楽曲、または、再生出力したことのある楽曲ビデオの楽曲毎のエントリ(図の各行)を有し、メディアプレイヤ１１３は、各楽曲のエントリに、その楽曲の情報として、その楽曲の各属性の属性値（ソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名など）と、その楽曲をメディアプレイヤ１１３が再生出力した回数を登録する。すなわち、メディアプレイヤ１１３は、ＨＤＤ１１４、ポータブルプレイヤ２、デジタルラジオ放送、インターネットラジオサービス５の楽曲や、動画共有サービス６の楽曲ビデオの再生出力を行ったならば、再生出力した楽曲、または、再生出力した楽曲ビデオの楽曲の各属性の属性値が登録されているエントリが再生履歴テーブル１１１に存在すかどうかを調べ、存在していれば、そのエントリの再生回数を１増加し、存在していない場合には新たなエントリを再生履歴テーブル１１１に作成し、作成したエントリに、再生出力した再生出力した楽曲、または、再生出力した楽曲ビデオの楽曲の各属性の属性値を登録すると共に、当該作成したエントリの再生回数に１を登録する。

【0023】

ただし、メディアプレイヤ１１３は、ＨＤＤ１１４、ポータブルプレイヤ２の楽曲の再生出力については、再生出力した楽曲の情報の再生履歴テーブル１１１への登録を行わないようにしてもよい。すなわち、メディアプレイヤ１１３は、デジタルラジオ放送、インターネットラジオサービス５の楽曲や、動画共有サービス６の楽曲ビデオの再生出力を行った場合にのみ、再生出力した楽曲の情報の再生履歴テーブル１１１への登録を行うようにしてもよい。

【0024】

なお、ＨＤＤ１１４、ポータブルプレイヤ２の楽曲の各属性の属性値は楽曲データベース１１０から取得することができ、デジタルラジオ放送、インターネットラジオサービス５の楽曲の各属性の属性値は、楽曲の放送時に楽曲と共に配信される楽曲の属性情報から取得することができ、動画共有サイトの楽曲ビデオの楽曲の各属性の属性値は、楽曲ビデオと共に動画共有サイトに公開されている楽曲ビデオのタイトルや基本情報(動画の説明)から取得することができる。

【0025】

次に、認識履歴テーブル１０６には、音声入力制御部１０５によって、音声入力制御部１０５が音声入力を受け付けたことのある音声入力内容が登録される。
ここで、いま、音声入力制御部１０５が音声入力受け付けるユーザの発話のフォーマットが
「プレイ“楽曲の属性値”」と、「リスト“楽曲の属性値”」であるものとする。

【0026】

ここで、“プレイ”と“リスト”は音声入力コマンドであり、“楽曲の属性値”はコマンドのパラメータである。そして、「プレイ“楽曲の属性値”」は“楽曲の属性値”と等しい属性値を持つ楽曲の再生を要求する音声入力であり、「リスト“楽曲の属性値”」は、“楽曲の属性値”と等しい属性値を持つ楽曲のリストの表示を要求する音声入力である。すなわち、Ｘがソング名であれば、「プレイＸ」は、ソング名Ｘの楽曲の再生を要求する音声入力であり、Ｙがアーティスト名であれば「リストＹ」は、アーティスト名Ｙの楽曲のリストの表示を要求する音声入力である。

【0027】

そして、図２ｂに示すように、認識履歴テーブル１０６は、音声入力制御部１０５が音声入力を受け付けるコマンド毎のエントリ(図の各行)を有し、音声入力制御部１０５は、音声入力を受け付ける度に、音声入力を受け付けたコマンドに対応するエントリに、音声入力を受け付けたコマンドのパラメータ（楽曲の属性値）が登録されていない場合には、当該パラメータを登録する。

【0028】

以下、音声入力制御部１０５における音声入力受付動作について説明する。
音声入力制御部１０５は、入力装置１０８の操作を介して、または、所定の発話音声による音声入力を介して、ユーザから音声入力による楽曲選択操作開始の指示を受け付けたならば、発話例提示処理を行って、音声入力受付可能な発話例をディスプレイ１０７に表示する。ここで、音声入力制御部１０５は、発話例提示処理において、上述した“プレイ”コマンドの音声入力「プレイ“楽曲の属性値”」の発話例と、“リスト”コマンドの音声入力「リスト“楽曲の属性値”」の発話例を表示する。

【0029】

図３に、この発話例提示処理の手順を示す。
図示するように発話例提示処理において、音声入力制御部１０５は、“プレイ”コマンドの発話例に用いる属性を、ソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名などの楽曲の各属性のうちからランダムに第１属性として選択する（ステップ３０２）。

【0030】

次に、“リスト”コマンドの発話例に用いる属性を、アルバム名、アーティスト名、ジャンル名、コンポーザ名などの、ソングを除く楽曲の各属性のうちからランダムに第２属性として選択する（ステップ３０４）。

【0031】

次に、再生履歴テーブル１１１に登録されている楽曲のうちの再生回数が上位の楽曲の内からランダムに一つの楽曲を参照楽曲として選択する（ステップ３０６）。そして、参照楽曲に関連する楽曲を、楽曲データベース１１０に登録されている楽曲のうちからランダムに選定し、選定した楽曲の第１属性の属性値を第１提示属性値として選定する（ステップ３０８）。

【0032】

ここで、参照楽曲に関連する楽曲とは、参照楽曲と、ソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名などの属性のうちの予め定めたいずれか一つの属性または予め定めた複数の属性の属性値が一致する楽曲である。

【0033】

そして、第１提示属性値が認識履歴テーブル１０６の“プレイ”コマンドのエントリに登録されているかどうかを調べ（ステップ３１０）、登録されていればステップ３０８からの処理に戻り、登録されていなければステップ３１２の処理に進む。なお、ステップ３１０は、第１提示属性値が認識履歴テーブル１０６の“プレイ”コマンドのエントリと“リスト”コマンドのエントリのいずれかに登録されているかどうかを調べ、いずれかに登録されていればステップ３０８からの処理に戻り、いずれにも登録されていなければステップ３１２の処理に進むステップとしてもよい。

【0034】

さて、第１提示属性値が認識履歴テーブル１０６の“プレイ”コマンドのエントリに登録されておらず（ステップ３１０）、ステップ３１２に進んだならば、当該ステップ３１２において、再度、参照楽曲に関連する楽曲を、楽曲データベース１１０に登録されている楽曲のうちからランダムに選定し、選定した楽曲の第２属性の属性値を第２提示属性値として選定する。
そして、第２提示属性値が認識履歴テーブル１０６の“リスト”コマンドのエントリに登録されているかどうかを調べ（ステップ３１４）、登録されていれば、ステップ３１２からの処理に戻り、登録されていなければステップ３１６の処理に進む。なお、ステップ３１４は、第２提示属性値が認識履歴テーブル１０６の“プレイ”コマンドのエントリと“リスト”コマンドのエントリのいずれかに登録されているかどうかを調べ、いずれかに登録されていればステップ３１２からの処理に戻り、いずれにも登録されていなければステップ３１６の処理に進むステップとしてもよい。

【0035】

さて、第２提示属性値が認識履歴テーブル１０６の“リスト”コマンドのエントリに登録されておらず（ステップ３１４）、ステップ３１６に進んだ場合には、当該ステップ３１６において、図４ａに示すような、第１提示属性値を用いた“プレイ”コマンドの発話例４０１と、第２提示属性値を用いた“リスト”コマンドの発話例４０２とを表した音声入力案内ウインドウをディスプレイ１０７に表示する（ステップ３１６）。

【0036】

ここで、“プレイ”コマンドの発話例４０１は、「プレイ “第１提示属性値”」とする。すなわち、第１属性がソング名で、第１提示属性値がソング名「ビリージェーン」であれば、「プレイビリージェーン」を“プレイ”コマンドの発話例４０１とする。また、“リスト" コマンドの発話例４０２は、「リスト “第２提示属性値”」とする。すなわち、第２属性がアーティスト名で、第２提示属性値がアーティスト名「マイケルジャックであれば」であれば、「リストマイケルジャック」を“リスト” コマンドの発話例４０２とする。

【0037】

そして、このように音声入力案内ウインドウを表示したならば、所定のタイムアウト時間（たとえば、３秒）を設定したタイマをスタートし（ステップ３１８）、音声入力案内ウインドウに設けた終了ボタン４０３の操作による終了指示の発生と（ステップ３２０）、音声入力の終了と（ステップ３２２）、タイマのタイムアウトの発生（ステップ３２４）とを監視する。

【0038】

そして、終了指示の発生（ステップ３２０）、または、音声入力の終了（ステップ３２２）が発生した場合には、発話例提示処理を終了する。なお、音声入力の終了については後述する。

【0039】

一方、タイマのタイムアウトが発生した場合には（ステップ３２４）、ステップ３０２からの処理に戻り、以上の処理を繰り返す。
ここで、このように、終了指示が発生するか音声入力が終了するまで、タイマのタイムアウトが発生する度に、ステップ３０２からの処理を繰り返すことにより、音声入力案内ウインドウに表示する発話例を、定期的に、順次、図４ａ、図４ｂ、...に示すように更新することができ、ユーザにより多くの発話例を提示できるようになる。

【0040】

なお、ステップ３０２からの処理の繰り返しの各回において行われるステップ３０８の第１提示属性値の選定は、前回以前の回のステップ３０８で既に第１提示属性値として選定した属性値は、今回の第１提示属性値として選定しないように行い、ステップ３０２からの処理の繰り返しの各回において行われるステップ３１２の第２提示属性値の選定は、前回以前の回のステップ３１２で既に第２提示属性値として選定した属性値は、今回の第１提示属性値として選定しないように行う。より具体的には、ステップ３０８では、参照楽曲に関連する楽曲を、楽曲データベース１１０に登録されている楽曲のうちからランダムに選定する処理を、選定した楽曲の第１属性の属性値が前回以前の回のステップ３０８で既に第１提示属性値として選定した属性値と異なる属性値となるまで行い、異なる属性値となったならば当該異なる属性値を第１提示属性値として選定する。また、同様に、ステップ３１２では、参照楽曲に関連する楽曲を、楽曲データベース１１０に登録されている楽曲のうちからランダムに選定する処理を、選定した楽曲の第２属性の属性値が前回以前の回のステップ３１２で既に第２提示属性値として選定した属性値と異なる属性値となるまで行い、異なる属性値となったならば当該異なる属性値を第２提示属性値として選定する。

【0041】

以上、音声入力制御部１０５が行う発話例提示処理について説明した。
さて、音声入力制御部１０５は、以上の発話例提示処理と並行して、入力装置１０８に設けられた「発話」ボタンの操作の発生を監視する。
そして、入力装置１０８に設けられた「発話」ボタンが操作されたならば、音声入力制御部１０５はマイクロフォン１０１から入力するユーザの発話音声の音声認識を音声認識エンジン１０２に開始させ、音声認識エンジン１０２は音声認識辞書１０３を用いた音声認識を行い、音声認識結果を音声入力制御部１０５に出力し、音声入力制御部１０５は音声認識結果を正常に取得できたならば音声認識結果を音声入力内容として受け付けて音声入力を終了し、上述のように発話例提示処理を終了した上で、音声認識エンジン１０２の受け付けた音声入力内容に応じた処理を行う。

【0042】

すなわち、音声入力制御部１０５は、音声認識結果が、「プレイＸ」（ただし、Ｘは楽曲の属性値）であれば、メディアプレイヤ１１３にＸを属性値としてもつ楽曲の再生を要求し、メディアプレイヤ１１３は、楽曲データベース１１０を参照してＸを属性値としてもつ楽曲のオーディオファイルの情報を抽出し、ＨＤＤ１１４とポータブルプレイヤ２に格納されているＸを属性値としてもつ楽曲を音声出力装置１０９に順次再生出力する。

【0043】

なお、再生出力される楽曲は、Ｘがソング名であればソング名がＸの楽曲となり、Ｘがアルバム名であればアルバム名がＸの各楽曲となり、Ｘがアーティスト名であればアーティスト名がＸの各楽曲、Ｘがジャンル名であればジャンル名がＸの各楽曲となる。

【0044】

また、音声認識結果が、「リストＹ」（ただし、Yは楽曲の属性値）であれば、メディアプレイヤ１１３にＹを属性値としてもつ楽曲のリストの表示を要求し、メディアプレイヤ１１３は、楽曲データベース１１０を参照してＹを属性値としてもつ楽曲のリストを抽出し、抽出したリストをディスプレイ１０７に表示する。なお、Ｙがアルバム名であれば、表示するリストはアルバム名がＹのソング名のリストとなり、Ｙがアーティスト名であれば表示するリストはアーティスト名がＹの楽曲のアルバム名のリストとなり、Ｙがジャンル名であれば表示するリストはジャンル名がＹの楽曲のアーティスト名のリストとなる。

【0045】

以上、本発明の実施形態について説明した。
以上のように本実施形態では、楽曲の属性値（ソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名など）で、操作対象とする楽曲を指定する音声入力の発話例として、ユーザが過去に再生した楽曲に関連する楽曲の属性値を用いた発話例を表示する。ここで、ユーザが過去に再生した楽曲に関連する楽曲の属性値によって指定される楽曲は、ユーザが過去に再生した楽曲に関連する楽曲であり、ユーザの嗜好に合致しユーザが興味ある楽曲である蓋然性が大きい。したがって、本実施形態によれば、音声入力の発話例として、ユーザにとって有用な、ユーザが興味ある楽曲を操作対象とする発話例を表示することができる。

【符号の説明】

【0046】

１…ＡＶシステム、２…ポータブルプレイヤ、３…デジタルラジオ局、４…インターネット、５…インターネットラジオサービス、６…動画共有サービス、１０１…マイクロフォン、１０２…音声認識エンジン、１０３…音声認識辞書、１０４…辞書作成部、１０５…音声入力制御部、１０６…認識履歴テーブル、１０７…ディスプレイ、１０８…入力装置、１０９…音声出力装置、１１０…楽曲データベース、１１１…再生履歴テーブル、１１２…楽曲管理部、１１３…メディアプレイヤ、１１４…ＨＤＤ、１１５…外部インタフェース、１１６…デジタルラジオ受信機、１１７…移動通信装置。

【図1】

【図2】

【図3】

【図4】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

特許第6393219号(P6393219)IP Force 特許公報掲載プロジェクト 2022.1.31 β版