特許第6229071号(P6229071)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ソニー・コンピュータエンタテインメントの特許一覧

特許6229071制御装置、制御方法、プログラム及び情報記憶媒体
<>
  • 特許6229071-制御装置、制御方法、プログラム及び情報記憶媒体 図000002
  • 特許6229071-制御装置、制御方法、プログラム及び情報記憶媒体 図000003
  • 特許6229071-制御装置、制御方法、プログラム及び情報記憶媒体 図000004
  • 特許6229071-制御装置、制御方法、プログラム及び情報記憶媒体 図000005
  • 特許6229071-制御装置、制御方法、プログラム及び情報記憶媒体 図000006
  • 特許6229071-制御装置、制御方法、プログラム及び情報記憶媒体 図000007
  • 特許6229071-制御装置、制御方法、プログラム及び情報記憶媒体 図000008
  • 特許6229071-制御装置、制御方法、プログラム及び情報記憶媒体 図000009
  • 特許6229071-制御装置、制御方法、プログラム及び情報記憶媒体 図000010
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6229071
(24)【登録日】2017年10月20日
(45)【発行日】2017年11月8日
(54)【発明の名称】制御装置、制御方法、プログラム及び情報記憶媒体
(51)【国際特許分類】
   G06F 3/16 20060101AFI20171030BHJP
   G10L 15/22 20060101ALI20171030BHJP
【FI】
   G06F3/16 650
   G06F3/16 630
   G10L15/22 453
【請求項の数】7
【全頁数】15
(21)【出願番号】特願2016-555123(P2016-555123)
(86)(22)【出願日】2015年8月27日
(86)【国際出願番号】JP2015074188
(87)【国際公開番号】WO2016063621
(87)【国際公開日】20160428
【審査請求日】2016年12月2日
(31)【優先権主張番号】特願2014-217762(P2014-217762)
(32)【優先日】2014年10月24日
(33)【優先権主張国】JP
(73)【特許権者】
【識別番号】310021766
【氏名又は名称】株式会社ソニー・インタラクティブエンタテインメント
(74)【代理人】
【識別番号】110000154
【氏名又は名称】特許業務法人はるか国際特許事務所
(72)【発明者】
【氏名】田村 啓悟
(72)【発明者】
【氏名】小木曽 徹
(72)【発明者】
【氏名】青木 俊雅
【審査官】 星野 裕
(56)【参考文献】
【文献】 特開2004−234273(JP,A)
【文献】 特開2012−185861(JP,A)
【文献】 特開平02−272624(JP,A)
【文献】 特開平10−222337(JP,A)
【文献】 特開平07−140998(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 3/16
G10L 15/22
(57)【特許請求の範囲】
【請求項1】
音声を受け付ける音声受付部と、
前記音声受付部が受け付ける音声を示す音声データが、当該音声データを利用するプログラムに出力されるよう制御する出力制御部と、を含み、
前記出力制御部は、前記音声受付部が受け付ける音声が所与の情報を表すことが認識された場合に、その後は前記音声受付部が受け付ける音声を示す音声データの代わりに無音を表す音声データが前記プログラムに出力されるよう制御する、
ことを特徴とする制御装置。
【請求項2】
音声を受け付ける音声受付部と、
前記音声受付部が受け付ける音声が当該音声を利用した処理を実行可能なプログラムに出力されるよう制御する出力制御部と、を含み、
前記出力制御部は、
前記音声受付部が受け付ける音声が所与の情報を表すことが認識された場合に、その後に前記音声受付部が受け付ける音声が前記プログラムに出力されないよう制御し、
前記音声受付部が受け付ける音声が当該音声を利用した処理を実行可能なプログラムに出力されるか否かを、当該プログラムに設定されている優先度と、システムプログラムに設定されている優先度と、の比較結果に基づいて制御する、
ことを特徴とする制御装置。
【請求項3】
前記プログラムは、前記音声を認識する音声認識部とは別に独立して動作するプログラムである、
ことを特徴とする請求項1又は2に記載の制御装置。
【請求項4】
音声を受け付けるステップと、
受け付ける音声を示す音声データが当該音声データを利用するプログラムに出力されるよう制御するステップと、
受け付ける音声が所与の情報を表すことが認識された場合に、その後は受け付ける音声を示す音声データの代わりに無音を表す音声データが前記プログラムに出力されるよう制御するステップと、
を含むことを特徴とする制御方法。
【請求項5】
音声を受け付けるステップと、
受け付ける音声が当該音声を利用した処理を実行可能なプログラムに出力されるよう制御するステップと、
受け付ける音声が所与の情報を表すことが認識された場合に、その後に受け付ける音声が前記プログラムに出力されないよう制御するステップと、
受け付ける音声が当該音声を利用した処理を実行可能なプログラムに出力されるか否かを、当該プログラムに設定されている優先度と、システムプログラムに設定されている優先度と、の比較結果に基づいて制御するステップと、
を含むことを特徴とする制御方法。
【請求項6】
音声を受け付ける手順、
受け付ける音声を示す音声データが当該音声データを利用するプログラムに出力されるよう制御する手順、
受け付ける音声が所与の情報を表すことが認識された場合に、その後は受け付ける音声を示す音声データの代わりに無音を表す音声データが前記プログラムに出力されるよう制御する手順、
をコンピュータに実行させることを特徴とするプログラム。
【請求項7】
音声を受け付ける手順、
受け付ける音声が当該音声を利用した処理を実行可能なプログラムに出力されるよう制御する手順、
受け付ける音声が所与の情報を表すことが認識された場合に、その後に受け付ける音声が前記プログラムに出力されないよう制御する手順、
受け付ける音声が当該音声を利用した処理を実行可能なプログラムに出力されるか否かを、当該プログラムに設定されている優先度と、システムプログラムに設定されている優先度と、の比較結果に基づいて制御する手順、
をコンピュータに実行させることを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、制御装置、制御方法、プログラム及び情報記憶媒体に関する。
【背景技術】
【0002】
ユーザが入力した音声を受け付けて、当該音声の認識結果に応じたコマンドを特定し、特定されるコマンドに応じた処理を実行する技術が存在する。
【発明の概要】
【発明が解決しようとする課題】
【0003】
ゲームコンソールやパーソナルコンピュータなどといった情報処理装置に複数のプログラムがインストールされていることがある。例えば情報処理装置に、オペレーティングシステム等のシステムプログラムとともに、システムプログラムとは別に実行されるゲームプログラムがインストールされていることがある。そして情報処理装置にインストールされている複数のプログラムのいずれもが、受け付ける音声を利用した処理が実行可能であることがある。
【0004】
例えば情報処理装置にインストールされているシステムプログラムもゲームプログラムも、受け付けた音声の認識結果に応じたコマンドを特定し、特定されるコマンドに応じた処理を実行できることとする。そして同一の音声に対応付けられるコマンドがシステムプログラム及びゲームプログラムにおいて独立して設定されている、すなわちコマンドの競合が発生していることとする。この場合には、当該音声を受け付けた際に、システムプログラム及びゲームプログラムにおいてそれぞれ個別にコマンドの特定が可能であり、その結果、システムプログラム及びゲームプログラムにおいてそれぞれ個別に処理の実行が可能となる。そのため例えばユーザがシステムプログラムにおける処理を実行しようとしていたのに、当該処理だけではなくゲームプログラムにおける処理が実行されてしまうおそれがある。
【0005】
このように、入力される音声を利用した処理が実行可能な複数のプログラムがインストールされている情報処理装置においては、音声の入力に応じて所望の処理とは異なる処理が実行されるおそれがある。
【0006】
本発明は上記課題に鑑みてなされたものであって、その目的の1つは、音声の入力に応じて所望の処理とは異なる処理が実行されることを防止できる制御装置、制御方法、プログラム及び情報記憶媒体を提供することにある。
【課題を解決するための手段】
【0007】
上記課題を解決するために、本発明に係る制御装置は、音声を受け付ける音声受付部と、前記音声受付部が受け付ける音声が当該音声を利用した処理を実行可能なプログラムに出力されるよう制御する出力制御部と、を含み、前記出力制御部は、前記音声受付部が受け付ける音声が所与の情報を表すことが認識された場合に、その後に前記音声受付部が受け付ける音声が前記プログラムに出力されないよう制御する。
【0008】
また、本発明に係る制御方法は、音声を受け付けるステップと、受け付ける音声が当該音声を利用するプログラムに出力されるよう制御するステップと、受け付ける音声が所与の情報を表すことが認識された場合に、その後に受け付ける音声が前記プログラムに出力されないよう制御するステップと、を含む。
【0009】
また、本発明に係るプログラムは、音声を受け付ける手順、受け付ける音声が当該音声を利用するプログラムに出力されるよう制御する手順、受け付ける音声が所与の情報を表すことが認識された場合に、その後に受け付ける音声が前記プログラムに出力されないよう制御する手順、をコンピュータに実行させる。
【0010】
また、本発明に係る情報記憶媒体は、音声を受け付ける手順、受け付ける音声が当該音声を利用するプログラムに出力されるよう制御する手順、受け付ける音声が所与の情報を表すことが認識された場合に、その後に受け付ける音声が前記プログラムに出力されないよう制御する手順、をコンピュータに実行させるプログラムを記憶したコンピュータ読み取り可能な情報記憶媒体である。
【0011】
本発明の一態様では、前記出力制御部は、前記音声受付部が受け付ける音声を示す音声データが、当該音声データを利用するプログラムに出力されるよう制御し、前記音声受付部が受け付ける音声が所与の情報を表すことが認識された場合に、その後は前記音声受付部が受け付ける音声を示す音声データの代わりに無音を表す音声データが前記プログラムに出力されるよう制御する。
【0012】
また、本発明の一態様では、前記プログラムは、前記音声を認識する音声認識部とは別に独立して動作するプログラムである。
【0013】
また、本発明の一態様では、前記出力制御部は、前記音声受付部が受け付ける音声が当該音声を利用した処理を実行可能なプログラムに出力されるか否かを、当該プログラムに設定されている優先度と、システムプログラムに設定されている優先度と、の比較結果に基づいて制御する。
【図面の簡単な説明】
【0014】
図1】本発明の一実施形態に係る情報処理システムの全体構成の一例を示す図である。
図2】本発明の一実施形態に係る情報処理装置のハードウェア構成の一例を示す図である。
図3】プレイ画面の一例を示す図である。
図4】プレイ画面の一例を示す図である。
図5】本発明の一実施形態に係る情報処理装置で動作するプログラムの一例を説明する説明図である。
図6A】優先度データの一例を示す図である。
図6B】優先度データの一例を示す図である。
図7】本発明の一実施形態に係る情報処理装置で実現される機能の一例を示す機能ブロック図である。
図8】本発明の一実施形態に係る情報処理装置で行われる処理の流れの一例を示すフロー図である。
【発明を実施するための形態】
【0015】
以下、本発明の一実施形態について図面に基づき詳細に説明する。
【0016】
図1は、本発明の一実施形態に係る情報処理システム10の全体構成の一例を示す図である。図1に示すように、本実施形態に係る情報処理システム10は、情報処理装置12とディスプレイ14とカメラマイクユニット16とコントローラ18とを含んでいる。
【0017】
本実施形態に係る情報処理装置12は、例えばゲームコンソールなどといったエンタテインメント装置等のコンピュータであり、例えば図2に示すように、制御部20、記憶部22、通信部24、入出力部26を含んでいる。制御部20は、例えば情報処理装置12にインストールされるプログラムに従って動作するCPU等のプログラム制御デバイスである。本実施形態に係る制御部20には、CPUから供給されるグラフィックスコマンドやデータに基づいてフレームバッファに画像を描画するGPU(Graphics Processing Unit)も含まれている。記憶部22は、例えばROMやRAM等の記憶素子やハードディスクドライブなどである。記憶部22には、制御部20によって実行されるプログラムなどが記憶される。また、本実施形態に係る記憶部22には、GPUにより画像が描画されるフレームバッファの領域が確保されている。通信部24は、例えばイーサネット(登録商標)モジュールや無線LANモジュールなどの通信インタフェースなどである。入出力部26は、HDMI(登録商標)(High-Definition Multimedia Interface)ポートやUSBポートなどの入出力ポートである。
【0018】
本実施形態に係るディスプレイ14は、液晶ディスプレイ等であり、情報処理装置12が生成する画面などを表示させる。また、本実施形態に係るディスプレイ14は、情報処理装置12が生成する音声データが表す音声を出力するスピーカも備えている。本実施形態に係るカメラマイクユニット16は、例えば被写体を撮像した画像を情報処理装置12に出力するカメラ16a及び周囲の音声を取得して当該音声を音声データに変換して情報処理装置12に出力するマイク16bを含んでいる。
【0019】
情報処理装置12とディスプレイ14とは、例えば、AVケーブルや、HDMIケーブル等を介して接続されている。情報処理装置12とカメラマイクユニット16とは、例えば、USBケーブルや、AVケーブルや、HDMIケーブル等を介して接続されている。
【0020】
本実施形態に係るコントローラ18は、情報処理装置12に対する操作入力を行うための操作入力装置である。本実施形態に係るコントローラ18には、例えばボタン、タッチパネル、操作スティックなどの操作子が設けられている。また、本実施形態に係るコントローラ18は、角速度を検出するジャイロセンサ、加速度を検出する加速度センサ等のセンサを備えている。また、本実施形態に係るコントローラ18はジャックを備えており、当該ジャックにマイクが備えるプラグを差し込むことにより、当該マイクによる音声入力も行うことができるようになっている。コントローラ18に差し込まれたマイクに入力された音声はコントローラ18で音声データに変換されて情報処理装置12に出力される。
【0021】
本実施形態では、カメラマイクユニット16が備えるマイク16b又はコントローラ18に接続されたマイクにユーザが音声を入力することにより、情報処理装置12は当該音声を認識する。そして本実施形態に係る情報処理装置12では、認識が成功した場合に、当該情報処理装置12に入力される音声(当該情報処理装置12が受け付ける音声)の認識結果に応じたコマンドの特定が可能となっている。そして本実施形態に係る情報処理装置12は、特定されたコマンドに応じた処理を実行する。このようにして本実施形態では、ユーザは音声によって情報処理装置12に対する操作を行えるようになっている。なお本実施形態では、コントローラ18のジャックにマイクのプラグが差し込まれている際には、当該マイクに入力された音声の認識結果をカメラマイクユニット16が備えるマイク16bに入力された音声の認識結果よりも優先して取り扱うようになっている。
【0022】
またユーザは、ボタンを押下したり、操作スティックを傾けたりすることで、コントローラ18を用いて各種の操作入力を行うことができる。そして本実施形態では、コントローラ18は、操作入力に対応付けられる入力データを情報処理装置12に出力する。
【0023】
また、本実施形態に係るコントローラ18は、USBポートを備えている。コントローラ18は、USBケーブルで情報処理装置12と接続することで、入出力部26を介して有線で入力データを情報処理装置12に出力することができる。また、本実施形態に係るコントローラ18は、無線通信モジュール等を備えており、通信部24を介して無線で入力データを情報処理装置12に出力することができるようにもなっている。
【0024】
図3は、本実施形態に係る情報処理装置12のユーザがプレイするゲームのプレイ内容を表すプレイ画面30の一例を示す図である。本実施形態に係る情報処理装置12には、システムプログラム40とゲームプログラム42とがインストールされている(図5参照)。そして図3に示すプレイ画面30がディスプレイ14に表示されている際には、ユーザは当該ゲームに関するコマンドを音声により入力することができるようになっている。ここでのゲームに関するコマンドとは、例えば音声の入力に応じてゲームプログラム42で対応する処理が実行されるコマンドを指すこととする。ユーザにより音声が入力された際には、ゲームプログラム42は、当該音声に応じたコマンドを特定し、当該コマンドに応じた、ゲームに関する処理を実行する。本実施形態では例えば、図3に示すプレイ画面30がディスプレイ14に表示されている際に、「ホーム画面」との語句を表す音声が入力された際には、ディスプレイ14に表示された画面は、当該ゲームにおけるホーム画面に切り替わる。
【0025】
ここで例えば情報処理装置12が、例えば「音声認識開始」などといった、システムプログラム40における音声認識を開始するための所与の語句を表す音声を受け付けたとする。以下、システムプログラム40における音声認識を開始するための音声を表す所与の語句をマジックワードと呼ぶこととする。すると本実施形態では、表示されているプレイ画面30が、図4に示す状態に切り替わる。図4に示す状態では、プレイ画面30に、入力すべき音声をユーザに案内するための音声入力案内画像32が配置されている。音声入力案内画像32には、システムに関するコマンドを表す語句が配置されている。ここでのシステムに関するコマンドとは、例えば音声の入力に応じて対応する処理がシステムプログラム40で実行されるコマンドを指すこととする。
【0026】
本実施形態では、プレイ画面30に音声入力案内画像32が配置されている際には、ユーザが音声入力案内画像32に配置されている語句を表す音声を入力すると、システムプログラム40は、当該音声の認識結果に基づいて当該音声が表すコマンドを特定する。そしてシステムプログラム40は、当該コマンドに応じた処理を実行する。例えば図4の例では情報処理装置12が「ホーム画面」との語句を表す音声を受け付けた際には、ディスプレイ14に表示された画面は、情報処理装置12で実行されるプログラムを選択するメニューが配置された、システムにおけるホーム画面に切り替わる。当該ホーム画面は、システムプログラム40によって生成される画面である。
【0027】
また、本実施形態に係る情報処理装置12では、音声入力案内画像32に語句が配置されていないシステムに関するコマンドについても、当該コマンドを表す音声が入力された場合には、当該コマンドに応じた処理が実行される。例えば図4に例示するプレイ画面30が表示されている際に「スクリーンショットを撮る」との語句を表す音声が入力された場合には、プレイ画面30の表示内容を静止画像としてキャプチャしたキャプチャ画像が情報処理装置12の記憶部22に保存される。
【0028】
なおシステムに関するコマンドは上述した、システムにおけるホーム画面を表示させるコマンドやスクリーンショットを撮るコマンドには限定されない。例えば、ゲームのプレイ内容を表す動画像のブロードキャストを行うためのコマンド、ビデオクリップを保存するためのコマンド、ログインするためのコマンド、などもシステムに関するコマンドに該当する。
【0029】
そして本実施形態では、図4に示すプレイ画面30が表示されている状態で所定時間以上、所定の音量よりも大きな音量の音声が入力されなかった場合には、表示されているプレイ画面30が、図3に示す状態に切り替わる。
【0030】
上述のように本実施形態では「ホーム画面」とのコマンドがゲームプログラム42とシステムプログラム40とで競合している。ここで例えば図4に示すプレイ画面30がディスプレイ14に表示されている際にユーザがゲームに関するコマンドを音声で入力した場合に、ゲームプログラム42が当該音声に応じた処理を実行すると仮定する。そうすると、例えば図4に示すプレイ画面30がディスプレイ14に表示されている際に「ホーム画面」との語句を表す音声が入力された場合に、ディスプレイ14に表示された画面が、当該ゲームにおけるホーム画面には切り替わるおそれがある。こうなると、システムにおけるホーム画面を表示させるという所望の処理が実行されないこととなる。
【0031】
そこで本実施形態では、図4に示すプレイ画面30がディスプレイ14に表示されている際にはユーザがゲームに関するコマンドを音声で入力しても、ゲームプログラム42は当該音声に応じた処理を実行しないようになっている。そのため例えば図4の例では情報処理装置12が「ホーム画面」との語句を表す音声を受け付けた際には、ディスプレイ14に表示された画面は、システムにおけるホーム画面に確実に切り替わる。
【0032】
一方本実施形態では、図3に示すプレイ画面30がディスプレイ14に表示されている際にはユーザがシステムに関するコマンドを音声で入力しても、システムプログラム40は当該音声に応じた処理を実行しないようになっている。
【0033】
このようにして本実施形態によれば、音声の入力に応じて所望の処理とは異なる処理が実行されることを防止できることとなる。
【0034】
以下、図5を参照しながら上述の制御についてさらに説明する。
【0035】
図5は、本実施形態に係る情報処理装置12で動作するプログラムの一例を説明する説明図である。上述のように本実施形態に係る情報処理装置12には、システムプログラム40とゲームプログラム42とがインストールされている。本実施形態ではシステムプログラム40とゲームプログラム42とは独立しており、ゲームプログラム42はシステムプログラム40上で動作する。システムにおけるホーム画面は、情報処理装置12がシステムプログラム40を実行することで生成されてディスプレイ14に表示される。また本実施形態では図3図4に例示するプレイ画面30、ゲームにおけるホーム画面は、情報処理装置12がゲームプログラム42を実行することにより生成されてディスプレイ14に表示される。
【0036】
図5に示すように、本実施形態に係るシステムプログラム40は、例えば、ボイスチャットモジュール50、オーディオドライバ52、ポート管理モジュール54、音声認識エンジン56、を含んで構成されている。なお本実施形態に係るシステムプログラム40には、他のモジュールが含まれていてもよい。
【0037】
本実施形態に係るゲームプログラム42がマイクを使用するプログラムである場合には、当該ゲームプログラム42は、どのような用途でマイクを使用するかを示すポートタイプ情報がオーディオドライバ52に出力されるよう実装される。本実施形態に係るポートタイプ情報は「音声認識」、「ボイスチャット」、「一般」のいずれかの値をとることとする。例えば上述のようにゲームプログラム42において、入力された音声に応じたゲームに関するコマンドの特定、及び、当該コマンドに応じた処理の実行が行われることとする。この場合には、当該ゲームプログラム42は、値が「音声認識」であるポートタイプ情報がオーディオドライバ52に出力されるよう実装される。またゲームプログラム42においてボイスチャットを行う場合には、当該ゲームプログラム42は、値が「ボイスチャット」であるポートタイプ情報がオーディオドライバ52に出力されるよう実装される。またゲームプログラム42が例えばカラオケのゲームのプログラムであって入力された音声を増幅させてスピーカから出力させる場合には、当該ゲームプログラム42は、値が「一般」であるポートタイプ情報がオーディオドライバ52に出力されるよう実装される。以下の説明においては、ゲームプログラム42は、値が「音声認識」であるポートタイプ情報がオーディオドライバ52に出力されるよう実装されることとする。
【0038】
ボイスチャットモジュール50は、情報処理装置12のユーザが他のユーザとの音声によるチャットを行うためのモジュールである。本実施形態では、アプリケーションプログラムがシステムプログラム40の一部として含まれており、ボイスチャットモジュール50は、そのようなアプリケーションプログラムの一例である。なおシステムプログラム40に、ボイスチャットモジュール以外のアプリケーションプログラムが含まれていてもよい。
【0039】
本実施形態ではボイスチャットモジュール50も、ゲームプログラム42と同様にポートタイプ情報がオーディオドライバ52に出力されるよう実装されていることとする。ここでは例えば、ボイスチャットモジュール50は、値が「ボイスチャット」であるポートタイプ情報がオーディオドライバ52に出力されるよう実装されることとする。
【0040】
オーディオドライバ52は、本実施形態では例えば、情報処理装置12にマイク16bやコントローラ18に接続されたマイクを介して入力された音声を受け付けるドライバである。本実施形態では例えば、マイク16bやコントローラ18に接続されたマイクは、受け付けた音声を音声データに変換する。そしてオーディオドライバ52は、このようにして変換された音声データを受け付ける。そして本実施形態に係るオーディオドライバ52は、受け付けた音声データを、ゲームプログラム42、ボイスチャットモジュール50、音声認識エンジン56に出力することができるようになっている。ゲームプログラム42、ボイスチャットモジュール50、音声認識エンジン56のそれぞれは、音声データを受け付けた際に、当該音声データを用いて各種の処理を実行する。
【0041】
またオーディオドライバ52は、本実施形態では、プログラムからポートタイプ情報を受け付けると、当該ポートタイプ情報を当該プログラムの識別情報に関連付けて、ポート管理モジュール54に出力する。そしてポート管理モジュール54は、プログラムの識別情報に関連付けられたポートタイプ情報を保持する。
【0042】
ポート管理モジュール54は、本実施形態では例えば、オーディオドライバ52による音声データの出力を制御するプログラムである。本実施形態では、ポート管理モジュール54は、オーディオドライバ52による音声データの出力先となるプログラムが利用するポートのステータスを示すステータス情報をオーディオドライバ52に出力する。本実施形態では例えば、音声データの出力先となるプログラムの識別情報が、当該プログラムが利用するポートのステータスを示すステータス情報に関連付けられていることとする。なお本実施形態における音声データの出力先は、ゲームプログラム42、ボイスチャットモジュール50、音声認識エンジン56である。
【0043】
またポート管理モジュール54は、本実施形態では、最後に出力されたステータス情報、すなわち最新のステータスを示すステータス情報を保持する。
【0044】
オーディオドライバ52は、ポート管理モジュール54から出力されるステータス情報を受け付けると、当該ステータス情報が示すステータスに応じて、当該ステータスに関連付けられているプログラムへの音声データの供給を制御する。
【0045】
例えばオーディオドライバ52が、値が「1」であるステータス情報をポート管理モジュール54から受け付けたとする。この場合、オーディオドライバ52は、本実施形態では、当該ステータス情報に関連付けられているプログラムに、マイクから受け付けた音声を示す音声データを出力することとする。一方例えばオーディオドライバ52が、値が「0」であるステータス情報をポート管理モジュール54から受け付けたとする。この場合、オーディオドライバ52は、本実施形態では、当該ステータス情報に関連付けられているプログラムにマイクから受け付けた音声を示す音声データを出力しないこととする。
【0046】
そして本実施形態では、マイクから受け付けた音声を示す音声データがプログラムに出力されない場合は、その代わりに、無音を表す音声データが当該プログラムに出力される。そのため本実施形態では、音声データの出力先となるプログラムにおいて、マイクから受け付けた音声を示す音声データがプログラムに出力されないよう制御される場合に対応するための特別な実装を行う必要がない。従って音声データの出力先となるプログラムの実装が複雑になることを防ぐことができる。なお、マイクから受け付けた音声を示す音声データがプログラムに出力されない場合は、当該プログラムへの音声データの出力自体が行われないようにしても構わない。
【0047】
音声認識エンジン56は、例えば公知の音声認識エンジン56であって、オーディオドライバ52から受け付けた音声データを認識して、当該音声データが示す音声の認識が成功した場合には、音声の認識結果に応じたコマンドを特定する。本実施形態では、音声認識エンジン56は、システムに関するコマンドを特定する。
【0048】
一方音声の入力に応じたゲームに関するコマンドの特定は、本実施形態では、音声認識エンジン56とは別に独立して動作するプログラムで行われる。本実施形態では例えば、ゲームに関するコマンドの特定は、ゲームプログラム42の一部として音声認識エンジン56とは別に実装されている、音声の認識結果に応じたコマンドの特定が可能なモジュールで行われることとする。
【0049】
そして本実施形態では上述したように、情報処理装置12が、マジックワードを表す音声を受け付けた際には、オーディオドライバ52が当該音声を示す音声データを受け付ける。そして当該音声データは上述のように音声認識エンジン56に出力される。すると本実施形態では、音声認識エンジン56は、システムプログラム40における音声認識を開始させるためのステータス制御情報をポート管理モジュール54に出力する。
【0050】
するとポート管理モジュール54は、音声認識エンジン56から受け付けたステータス制御情報に基づいて、最新のステータス情報の値を決定する。ポート管理モジュール54が保持しているステータス情報の値はこのようにして決定される値に更新される。そしてポート管理モジュール54は、決定された最新の値が設定されたステータス情報をオーディオドライバ52に出力する。オーディオドライバ52は、当該ステータス情報が示すステータスに応じて、当該ステータスに関連付けられているプログラムへの音声データの供給を制御する。
【0051】
本実施形態ではステータス情報の値の決定は、図6A及び図6Bに例示する優先度データに基づいて行われる。図6Aは、図3に例示するプレイ画面が表示されている際における優先度データの一例を示す図である。図6Bは、図4に例示するプレイ画面が表示されている際における優先度データの一例を示す図である。
【0052】
図6A及び図6Bに示すように、優先度データは、音声データの出力先となるプログラムに対応付けられている。そして優先度データは、共有可否情報と、優先度情報と、を含んでいる。共有可否情報は、他のプログラムにも音声データが出力されることを許可するか否かを示す情報である。本実施形態では例えば、他のプログラムにも音声データが出力されることを許可するプログラムについては共有可否情報の値として「共有」が設定される。一方本実施形態では例えば、他のプログラムにも音声データが出力されることを許可しないプログラムについては共有可否情報の値として「専有」が設定される。優先度情報は、音声データの出力を優先させる程度を示すデータであり、値が大きいほど音声データが優先して出力される。
【0053】
なお、ポート管理モジュール54が受け付ける上述のポートタイプ情報に基づいて、当該ポートタイプ情報に関連付けられているプログラムの共有可否情報の値、及び、優先度情報の値が決定されても構わない。また図6A及び図6Bの例では、ボイスチャットモジュール50の優先度情報の値が、ゲームプログラム42の優先度情報の値よりも大きいが、ゲームプログラム42の優先度情報の値が、ボイスチャットモジュール50の優先度情報の値よりも大きくても構わない。
【0054】
図6Aの例では、優先度情報の値が最も大きいボイスチャットモジュール50もその次に大きいゲームプログラム42も、共有可否情報の値が「共有」である。そのため、この場合はシステムプログラム40も含む3つのプログラムのすべてにオーディオドライバ52から音声データが出力されるよう制御される。すなわち、値が「1」であるステータス情報がポート管理モジュール54からオーディオドライバ52に出力される。
【0055】
ここで上述のように、ポート管理モジュール54がシステムプログラム40における音声認識を開始させるためのステータス制御情報を音声認識エンジン56から受け付けたとする。この場合は、ポート管理モジュール54は、システムプログラム40の優先度の値を10から40に変更する。図6Bには、当該変更後の優先度データが示されている。こうなると、優先度情報の値が最も大きいプログラムはシステムプログラム40となる。そしてシステムプログラム40の共有可否情報の値は「専有」である。従ってこの場合は、オーディオドライバ52がマイクから受け付けた音声を示す音声データをボイスチャットモジュール50及びゲームプログラム42に出力しないよう制御されることとなる。すなわち、ボイスチャットモジュール50に関連付けられた、値が「0」であるステータス情報、及び、ゲームプログラム42に関連付けられた、値が「0」であるステータス情報がポート管理モジュール54からオーディオドライバ52に出力されることとなる。なおこの場合、上述のようにオーディオドライバ52が無音を表す音声データを出力しても構わない。
【0056】
なお特定のプログラムの優先度情報の値を上げるための音声を表す所与の語句を表す音声を受け付けた際に、当該プログラムの優先度情報の値が増加するようにしてもよい。
【0057】
また優先度情報の値が数値ではなく、例えば「高」、「中」、「低」などのランクを示していてもよい。そして優先度情報が示すランクが最も高いプログラムにオーディオドライバ52から音声データが出力されるよう制御されても構わない。なお優先度情報が示すランクが最も高いプログラムが複数存在する場合は、当該複数のプログラムにオーディオドライバ52から音声データが出力されるよう制御されても構わない。
【0058】
また例えば、優先度データが、音声データの出力先となるプログラムの種類に対応付けられていてもよい。そして、音声データの出力先となるプログラムの種類に対応付けられる優先度データに基づいて、当該プログラムのステータス情報の値が決定されてもよい。
【0059】
また図6Aの例においてシステムプログラム40の共有可否情報の値が「共有」であってもよい。そして上述のステータス制御情報の受付に応じて、システムプログラム40の共有可否情報の値が「専有」に変更されるとともにシステムプログラム40の優先度の値を10から40に変更されてもよい。
【0060】
なおステータス情報の値の決定の方法は上述のものには限定されない。例えば、上述のステータス制御情報を音声認識エンジン56から受け付けた際に、ポートタイプ情報の値が「音声認識」であるプログラムには、オーディオドライバ52がマイクから受け付けた音声を示す音声データが出力されないよう制御されても構わない。こうすれば当該プログラムとシステムプログラム40との間での音声認識におけるコマンドが競合することを防ぐことができる。
【0061】
また例えば、上述のステータス制御情報を音声認識エンジン56から受け付けた際に、ポートタイプ情報の値が「ボイスチャット」であるプログラムには、マイクから受け付けた音声を示す音声データが出力されないよう制御されても構わない。こうすればボイスチャットの相手のユーザが使用する情報処理装置12に、システムプログラム40による音声認識におけるコマンドが出力されることを防ぐことができる。
【0062】
以下、音声データの出力制御に関して、情報処理装置12で実装される機能及び情報処理装置12で行われる処理についてさらに説明する。
【0063】
図7は、音声データの出力制御に関して、本実施形態に係る情報処理装置12で実装される機能の一例を示す機能ブロック図である。なお、本実施形態に係る情報処理装置12で、図7に示す機能のすべてが実装される必要はなく、また、図7に示す機能以外の機能が実装されていても構わない。
【0064】
本実施形態に係る情報処理装置12は、図7に示すように、機能的には例えば、音声受付部60、音声出力部62、音声認識部64、実行部66、優先度データ記憶部68、優先度変更部70、出力制御部72、を含んでいる。音声受付部60、出力制御部72は、入出力部26を主として実装される。音声出力部62、音声認識部64、実行部66、優先度変更部70は、制御部20を主として実装される。優先度データ記憶部68は、記憶部22を主として実装される。
【0065】
音声受付部60、音声出力部62の機能は、例えば図5におけるオーディオドライバ52で実装される機能に相当する。優先度データ記憶部68、優先度変更部70、出力制御部72の機能は、例えば図5におけるポート管理モジュール54で実装される機能に相当する。音声認識部64の機能は、たとえば図5における音声認識エンジン56で実装される機能に相当する。
【0066】
そして、以上の機能は、コンピュータである情報処理装置12にインストールされた、以上の機能に対応する指令を含むプログラムを制御部20で実行することにより実装されている。このプログラムは、例えば、光ディスク、磁気ディスク、磁気テープ、光磁気ディスク、フラッシュメモリ等のコンピュータ読み取り可能な情報記憶媒体を介して、あるいは、インターネットなどの通信手段を介して情報処理装置12に供給される。
【0067】
音声受付部60は、本実施形態では、音声を受け付ける。
【0068】
音声出力部62は、本実施形態では、音声受付部60が受け付ける音声を、当該音声を利用した処理を実行可能なプログラムに出力する。以下、音声受付部60が受け付ける音声が出力される、当該音声を利用した処理を実行可能なプログラムをターゲットプログラムと呼ぶこととする。本実施形態では、ゲームプログラム42、ボイスチャットモジュール50、音声認識エンジン56(音声認識部64)が、ターゲットプログラムに相当する。当該音声を受け付けたターゲットプログラムは、当該音声データを用いて各種の処理を実行する。
【0069】
音声認識部64は、本実施形態では、音声受付部60が受け付ける音声を認識して、当該音声に応じた、システムに関するコマンドを特定する。音声認識部64は、本実施形態では、音声出力部62から出力される音声を認識して、当該音声に応じた、システムに関するコマンドを特定する。
【0070】
実行部66は、音声認識部64が特定したシステムに関するコマンドに応じた処理を実行する。
【0071】
優先度データ記憶部68は、図6A及び図6Bに例示する優先度データを記憶する。
【0072】
優先度変更部70は、音声認識部64がマジックワードを表す音声を認識した際に、優先度データ記憶部68に記憶されている優先度データを上述したように変更する。
【0073】
出力制御部72は、音声受付部60が受け付ける音声が当該音声を利用した処理を実行可能なプログラムに出力されるよう制御する。出力制御部72は、本実施形態では例えば、上述のステータス情報を音声出力部62に出力する。また本実施形態では、出力制御部72は、音声受付部60が受け付ける音声が所与の情報を表すことが認識された場合に、その後に音声受付部60が受け付ける音声が、音声出力部62によってターゲットプログラムの少なくとも一部に出力されないよう制御する。例えば上述のように、出力制御部72は、マジックワードを表す音声が認識された場合に、その後に音声受付部60が受け付ける音声が、例えばゲームプログラム42等に出力されないよう制御してもよい。なおこのとき出力制御部72が、上述の通り、音声受付部60が受け付ける音声が出力されないよう制御されるターゲットプログラムに、音声受付部60が受け付ける音声を示す音声データの代わりに無音を表す音声データが出力されるよう制御してもよい。
【0074】
また出力制御部72は、上述のように、音声受付部60が受け付ける音声がターゲットプログラムに出力されるか否かを、当該ターゲットプログラムに設定されている優先度と、システムプログラムに設定されている優先度と、の比較結果に基づいて制御してもよい。
【0075】
ここで音声認識部64がマジックワードを表す音声を認識した際に、本実施形態に係る情報処理装置12で行われる処理の流れの一例を、図8に例示するフロー図を参照しながら説明する。
【0076】
音声認識部64がマジックワードを表す音声を認識すると、音声認識部64は、システムプログラム40における音声認識を開始させるためのステータス制御情報を優先度変更部70に出力する(S101)。すると、優先度変更部70は、当該ステータス制御情報に基づいて優先度データ記憶部68に記憶されている優先度データを変更する(S102)。すると、出力制御部72が、更新された優先度データに基づいてステータス情報の値を決定する(S103)。そして、出力制御部72が、決定された値が設定されたステータス情報を音声出力部62に出力する(S104)。すると、当該ステータス情報を受け付けた音声出力部62は、当該ステータス情報が示すステータスに応じて音声データのターゲットプログラムへの出力を行う(S105)。そして本処理例に示す処理は終了される。
【0077】
なお、本発明は上述の実施形態に限定されるものではない。
【0078】
例えば、情報処理装置12が、カメラ16aやマイク16bを備えた携帯型ゲーム装置であってもよい。また、情報処理装置12は、パーソナルコンピュータ、タブレット端末、スマートフォン、ヘッドマウントディスプレイなどであっても構わない。
【0079】
また、情報処理装置12、ディスプレイ14、カメラマイクユニット16、の役割分担は上述のものに限定されない。また、情報処理装置12が複数の筐体から構成されていてもよい。
【0080】
また、上記の具体的な文字列や数値、図面中の具体的な文字列や数値は例示であり、これらの文字列や数値には限定されない。
図1
図2
図3
図4
図5
図6A
図6B
図7
図8