(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-12-20
(45)【発行日】2023-12-28
(54)【発明の名称】電子機器、その制御方法、およびそのプログラム
(51)【国際特許分類】
G06F 3/16 20060101AFI20231221BHJP
G10L 15/10 20060101ALI20231221BHJP
G06F 3/0482 20130101ALI20231221BHJP
【FI】
G06F3/16 650
G10L15/10 500Z
G06F3/16 620
G06F3/0482
(21)【出願番号】P 2018171938
(22)【出願日】2018-09-13
【審査請求日】2021-09-01
(73)【特許権者】
【識別番号】000001007
【氏名又は名称】キヤノン株式会社
(74)【代理人】
【識別番号】100126240
【氏名又は名称】阿部 琢磨
(74)【代理人】
【識別番号】100223941
【氏名又は名称】高橋 佳子
(74)【代理人】
【識別番号】100159695
【氏名又は名称】中辻 七朗
(74)【代理人】
【識別番号】100172476
【氏名又は名称】冨田 一史
(74)【代理人】
【識別番号】100126974
【氏名又は名称】大朋 靖尚
(72)【発明者】
【氏名】北井 伸平
【審査官】滝谷 亮一
(56)【参考文献】
【文献】特開2000-293353(JP,A)
【文献】特開2006-244280(JP,A)
【文献】特開2011-008435(JP,A)
【文献】特開2001-175278(JP,A)
【文献】特開2008-077373(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 3/16
G10L 15/10
G06F 3/0482
(57)【特許請求の範囲】
【請求項1】
音声を集音する集音手段と、
前記集音手段によって集音された音声の言語を判断する判断手段と、
前記判断手段によって判断された前記集音手段によって集音された音声の言語である第一の言語と前記電子機器において使用される言語として設定されている第二の言語とが異なると判断された場合、前記第一の言語および前記第二の言語をそれぞれ用いて、前記電子機器において使用される言語を前記第二の言語から前記第一の言語に変更することを確認する通知を行うよう制御する制御手段と
を有し、
前記判断手段が、前記第1の言語に複数の候補があると判断した場合、前記制御手段は、前記候補の言語および前記第二の言語をそれぞれ用いて、前記電子機器において使用する言語を前記第二の言語から前記候補の言語のうちの一つに変更することを確認する通知を行い、
前記制御手段は、前記第二の言語からそれぞれの前記候補の言語に変更することを確認する通知をそれぞれ前記第二の言語を用いて行うことを特徴とする電子機器。
【請求項2】
前記制御手段は、前記第二の言語から前記候補の言語のうちの一つである第三の言語に変更することを確認する通知を前記第三の言語を用いて行う
ことを特徴とする請求項1に記載の電子機器。
【請求項3】
前記制御手段は、前記候補の言語それぞれに優先度を設定し、前記優先度が高い前記候補の言語から順番にユーザに通知を行う
ことを特徴とする請求項1または2に記載の電子機器。
【請求項4】
前記判断手段は、前記集音された音声の言語に加えて前記集音された音声の単語の意味を解析し、
前記制御手段は、前記集音された音声の言語よりも前記単語が意味する言語の方の優先度を高く設定する
ことを特徴とする請求項3に記載の電子機器。
【請求項5】
さらに表示手段を有し、
前記制御手段は、前記第二の言語からそれぞれの前記候補の言語に変更することを確認する前記第二の言語が用いられた通知と、前記第二の言語から前記第三の言語に変更することを確認する前記第三の言語が用いられた通知と、を前記表示手段によって同じ画面に表示する
ことを特徴とする請求項2に記載の電子機器。
【請求項6】
さらに表示手段を有し、
前記判断手段が前記集音手段によって集音された音声の言語に該当する候補を判断できない場合、前記制御手段は、前記電子機器において使用される言語を変更するための画面を前記表示手段によって表示する
ことを特徴とする請求項1から4のいずれか1項に記載の電子機器。
【請求項7】
さらにユーザの操作を検出する検出手段を有し、
前記制御手段は、ユーザに所定の操作をされたことを前記検出手段によって検出されたことに応じて、前記電子機器において使用される言語を変更するための音声を前記集音手段によって集音する
ことを特徴とする請求項1から
6のいずれか1項に記載の電子機器。
【請求項8】
前記制御手段は、前記第一の言語と前記第二の言語が一致すると判断した場合、前記電子機器において使用される言語を変更しないことの通知を行う
ことを特徴とする請求項1から
7のいずれか1項に記載の電子機器。
【請求項9】
前記集音手段によって集音された音声の情報を外部装置へ送信し、前記集音手段によって集音された音声が解析された情報を前記外部装置から受信する通信手段をさらに有し、
前記判断手段は、前記通信手段によって受信した前記解析された情報に基づいて、前記集音手段によって集音された音声の言語を判断する
ことを特徴とする請求項1から
8のいずれか1項に記載の電子機器。
【請求項10】
音声を集音する集音ステップと、
前記集音手段によって集音された音声の言語を判断する判断ステップと、
前記判断ステップにおいて判断された前記集音ステップにおいて集音された音声の言語である第一の言語と前記電子機器において使用される言語として設定されている第二の言語とが異なると判断された場合、前記第一の言語および前記第二の言語をそれぞれ用いて、前記電子機器において使用される言語を前記第二の言語から前記第一の言語に変更することを確認する通知を行うよう制御する制御ステップと
を有し、
前記判断ステップで、前記第1の言語に複数の候補があると判断した場合、前記制御ステップでは、前記候補の言語および前記第二の言語をそれぞれ用いて、前記電子機器において使用する言語を前記第二の言語から前記候補の言語のうちの一つに変更することを確認する通知を行い、
前記制御手段は、前記第二の言語からそれぞれの前記候補の言語に変更することを確認する通知をそれぞれ前記第二の言語を用いて行うことを特徴とする制御方法。
【請求項11】
音声を集音する集音ステップと、
前記集音手段によって集音された音声の言語を判断する判断ステップと、
前記判断ステップにおいて判断された前記集音ステップにおいて集音された音声の言語である第一の言語と前記電子機器において使用される言語として設定されている第二の言語とが異なると判断された場合、前記第一の言語および前記第二の言語をそれぞれ用いて、前記電子機器において使用される言語を前記第二の言語から前記第一の言語に変更することを確認する通知を行うよう制御する制御ステップとを有し、
前記判断ステップで、前記第1の言語に複数の候補があると判断した場合、前記制御ステップでは、前記候補の言語および前記第二の言語をそれぞれ用いて、前記電子機器において使用する言語を前記第二の言語から前記候補の言語のうちの一つに変更することを確認する通知を行い、
前記制御手段は、前記第二の言語からそれぞれの前記候補の言語に変更することを確認する通知をそれぞれ前記第二の言語を用いて行うことを特徴とする制御方法を、電子機器に実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声を集音することができる電子機器に関する。
【背景技術】
【0002】
近年、集音した音声を認識できる電子機器が知られている。また、ユーザは電子機器を利用するときに様々な言語から任意の言語を設定できる。電子機器の言語の設定に音声を用いる例として、特許文献1では、電子機器に設定されている言語と異なる言語の音声を集音すると、集音した音声の言語に設定を変更する電子機器が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、特許文献1では、ユーザの音声の言語を誤認識した場合でも、電子機器はその誤認識した言語に設定を変えてしまい、ユーザの意図しない言語に設定を変更してしまうという課題があった。そこで本発明は、ユーザが電子機器の言語の設定をユーザの意図した言語に変更しやすくすることを目的とする。
【課題を解決するための手段】
【0005】
上記課題を解決するために、本発明の電子機器は、音声を集音する集音手段と、前記集音手段によって集音された音声の言語を判断する判断手段と、前記判断手段によって判断された前記集音手段によって集音された音声の言語である第一の言語と前記電子機器において使用される言語として設定されている第二の言語とが異なると判断された場合、前記第一の言語および前記第二の言語をそれぞれ用いて、前記電子機器において使用される言語を前記第二の言語から前記第一の言語に変更することを確認する通知を行うよう制御する制御手段とを有し、前記判断手段が、前記第1の言語に複数の候補があると判断した場合、前記制御手段は、前記候補の言語および前記第二の言語をそれぞれ用いて、前記電子機器において使用する言語を前記第二の言語から前記候補の言語のうちの一つに変更することを確認する通知を行い、前記制御手段は、前記第二の言語からそれぞれの前記候補の言語に変更することを確認する通知をそれぞれ前記第二の言語を用いて行うことを特徴とする。
【発明の効果】
【0006】
本発明によれば、ユーザは電子機器の言語の設定をユーザの意図した言語に変更しやすくすることができる。
【図面の簡単な説明】
【0007】
【
図1】第一の実施形態のスマートフォン100の一例を示すブロック図。
【
図2】第一の実施形態のスマートフォン100の一例を示す外観図。
【
図3】第一の実施形態における、スマートフォン100の使用言語の設定を変更する方法の一例を示す図。
【
図4】第一の実施形態における、使用言語の設定を変更するか否かを確認する場合におけるスマートフォン100の画面の一例を示す図。
【
図5】第一の実施形態における、スマートフォン100の処理の一例を示すフローチャート。
【
図6】第一の実施形態における、使用言語を複数の言語の候補から選択する場合におけるスマートフォン100の画面の一例を示す図。
【
図7】使用言語の設定を変更するか否かを確認する場合、スマートフォン100が音声を用いてユーザに確認する方法の一例を示す図。
【
図8】第二の実施形態における、スマートフォン100の使用言語の設定を変更する方法の一例を示す図。
【
図9】第二の実施形態における、使用言語の設定を変更するか否かを確認する場合におけるスマートフォン100の画面の一例を示す図。
【
図10】第二の実施形態における、スマートフォン100の処理の一例を示すフローチャート。
【
図11】スマートフォン100が画像を用いてユーザの音声を集音する方法の一例を示す図。
【発明を実施するための形態】
【0008】
<第一の実施形態>
以下、図面を参照して、本発明の各実施例の動作を説明する。本実施形態において、電子機器にユーザが使用する言語として設定されている言語を他の言語と区別して使用言語という。
【0009】
図1は、本実施形態の電子機器の一例であるスマートフォン100の構成例を示すブロック図である。
【0010】
制御部101は、入力された信号や、後述のプログラムに従ってスマートフォン100の各部を制御する。なお、制御部101が装置全体を制御する代わりに、複数のハードウェアが処理を分担することで、装置全体を制御してもよい。
【0011】
不揮発性メモリ103は、電気的に消去・記録可能な不揮発性のメモリである。不揮発性メモリ103には、制御部101が実行する基本的なソフトウェアであるOS(オペレーティングシステム)や、このOSと協働して応用的な機能を実現するアプリケーションが記録されている。このアプリケーションは、集音した音声データの言語を解析するプログラムおよび後述する各種フローチャートの処理を実行するためのプログラムを含む。
【0012】
作業用メモリ104は、後述する表示部106の画像表示用メモリや、制御部101の作業領域等として使用される。作業用メモリ104はマイク107において集音した音声の言語を解析するために必要な音声データや通信部111を介して受信した音声データを格納する。
【0013】
操作部105は、スマートフォン100に対する指示をユーザから受け付けるために用いられる。操作部105は例えば、ユーザがスマートフォン100の電源のON/OFFを指示するための電源ボタンや、表示部106に形成されるタッチパネルなどの操作部材を含む。制御部101は操作部105がユーザに操作されたことを検出し、その操作に従って処理を行う。
【0014】
表示部106は、画像データの表示、対話的な操作のための文字表示などを行う。なお、表示部106は必ずしもスマートフォン100が備える必要はない。スマートフォン100は表示部106と接続することができ、表示部106の表示を制御する表示制御機能を少なくとも有していればよい。本実施形態において表示部106は液晶ディスプレイを用いる。ただし、表示部106は液晶ディスプレイに限られるものではなく、有機EL(Organic Electroluminescence)ディスプレイなどの他の方式を用いてもよい。
【0015】
マイク107は音声を集音するために用いられる。マイク107は外部からの音声を集音し、制御部101に出力する。制御部101は集音した音声をアナログデータからデジタルデータへA/D変換する処理を行うが、マイク107がA/D変換する処理を行い、A/D変換したデジタルデータを制御部101に出力してもよい。マイク107はスマートフォン100に内蔵されているが、ケーブル等を介して外部のマイクと接続する構成でもよい。
【0016】
スピーカ108は、音声を再生するために用いられる。制御部101はスピーカ108によって再生する音声をデジタルデータからアナログデータへD/A変換する処理を行い、アナログデータをマイク107へ出力する。または、制御部101の代わりにスピーカ108がD/A変換する処理を行ってもよい。スピーカ108はスマートフォン100に内蔵されているが、ケーブル等を介して外部のスピーカと接続する構成でもよい。
【0017】
記録媒体110は、スマートフォン100に着脱可能なよう構成してもよいし、スマートフォン100に内蔵されていてもよい。スマートフォン100は少なくとも記録媒体110にアクセスする手段を有していればよい。
【0018】
通信部111は、外部装置と接続するためのインターフェースである。本実施形態のスマートフォン100は、通信部111を介して、外部装置とデータを送受信することができる。例えばスマートフォン100はマイク107で集音した音声データを、通信部111を介して外部装置に送信することができる。また、スマートフォン100は外部装置から音声データを受信できる。なお、本実施形態では、通信部111は外部装置とIEEE802.11の規格に従った、いわゆる無線LANで通信するためのインターフェースを含む。制御部101は、通信部111を制御することで外部装置との無線通信を実現する。なお、通信方式は無線LANのような無線通信方式に限定されるものではなく、有線通信方式でもよい。通信部111はスマートフォン100に内蔵されているが、LANケーブルを介して外部の通信モジュールと接続する構成でもよい。
【0019】
電源部112は、アルカリ電池やリチウム電池等の一次電池やNiCd電池やNiMH電池、Li電池等の二次電池、ACアダプター等からなる。
【0020】
図2は、電子機器の一例であるスマートフォン100の外観図である。スマートフォン100は表示部106、マイク107、スピーカ108、および音声入力ボタン220を有する。音声入力ボタン220は操作部105に含まれる操作部材であり、ユーザは音声入力ボタン220を押すことで音声をスマートフォン100に入力することができる。ここで、スマートフォン100が音を集音するトリガは、ユーザによる音声入力ボタン220を押す操作の代わりに、ユーザによる表示部106に表示された画面の操作でもよい。例えば、
図2において音声入力ボタン220は物理的な機構であり、
図3のマイクボタン301は、タッチパネルを介して操作されるようなGUI(Graphical User Interface)である。ユーザは音声入力ボタン220またはマイクボタン301を操作することで音声をスマートフォン100に入力する。
【0021】
スマートフォン100は集音した音声を解析して、その音声の言語を判断する。ここで、スマートフォン100が音声の言語を判断する方法例を2つ記載する。まず1つ目の方法例を説明する。その方法は、スマートフォン100は集音した音声を音声データにして作業用メモリ104に格納し、その音声データを不揮発性メモリ103に記録されているプログラムを使用して解析する、という方法である。次に2つめの方法例を説明する。その方法は、スマートフォン100は通信部111を介して外部にあるサーバに集音した音声データを送信する。サーバは受信した音声データの言語を解析し、その解析した結果に関する情報をスマートフォン100に送信する。スマートフォン100は通信部111でその情報を受信することで音声を解析する、という方法である。2つ目の方法例において、解析した結果に関する情報は、外部サーバが音声データの言語だと判断した言語の候補を少なくとも一つ含む。本実施形態では、2つ目の方法例を採用する。
【0022】
図3は本実施形態における、音声によって使用言語の設定を変更する方法の一例を示す。
図3においてユーザは、スマートフォン100を持ちながら使用言語の設定を変更する画面300を開いている。ここで初期状態においてスマートフォン100の使用言語は英語である。
図3の左上に記載しているスマートフォン100の図は、ユーザが手にしているスマートフォン100の画面を拡大したものである。この場面において、ユーザは音声入力ボタン220またはマイクボタン301を押しながら、任意の言語名(
図3においては「日本語」という単語)を発言することで、スマートフォン100の使用言語を変更する。スマートフォン100はその言語名を集音し、上述した言語を解析するプログラムを用いて言語を判断できた場合、
図4に示すような使用言語を変更するか否かを確認する画面を表示する。
【0023】
図4ではスマートフォン100は、現在の使用言語から集音した言語に変更するか否かを確認するための画面を表示している。ダイアログボックス401では、スマートフォン100は現在の使用言語(英語)によって設定を変更するか否かを確認する通知を表示し、並行してダイアログボックス402では集音した言語(日本語)によって設定を変更するか否かを確認する通知を表示する。ユーザはどのダイアログボックスを操作してもよい。ユーザは操作部105または音声によってスマートフォン100を操作することで、使用言語を設定できる。このようにスマートフォン100は使用言語と集音した言語とでユーザに通知することで、ユーザの意図しない言語に使用言語を変更することを防ぎやすくする。
【0024】
図5はスマートフォン100の使用言語の設定を変更する処理手順の一例を説明するフローチャートである。この処理は、不揮発性メモリ103に記録されたソフトウェアを作業用メモリ104に展開して制御部101が実行することで実現する。またこの処理は、制御部101がスマートフォン100の使用言語の設定を変更する画面を表示部106に表示したことをトリガに開始される。例えば、
図3の画面300の表示をした場合、制御部101は本フローチャートの処理を開始する。
【0025】
ステップS501では、制御部101は音声入力ボタン220が押されたか否かを判断する。制御部101は音声入力ボタン220を押されたと判断した場合はステップS502へ遷移し、押されていないと判断した場合はステップS505へ遷移する。
【0026】
ステップS502では、制御部101はマイク107によって音を集音する。
【0027】
ステップS503では、制御部101は音声入力ボタン220が離されたか否かを判断する。音声入力ボタン220が離されていない場合、制御部101はステップS502に戻り、音を集音し続ける。音声入力ボタン220が離された場合、制御部101はステップS504へ遷移する。
【0028】
ステップS504では、制御部101は音声を集音したか否かを判断する。例えば、制御部101は閾値より大きい音声を集音した場合、音声を集音したと判断する。なお、音声の音量が閾値以下だった場合、制御部101は音声を集音しなかったものとして判断する。まず制御部101が音声を集音しなかった場合について述べる。この場合、制御部101はステップS505へ遷移する。
【0029】
ステップS505では、制御部101はユーザから操作部105によって表示部106に表示している言語を選択されたか否かを判断する。制御部101は操作部105によって言語を選択されていないと判断した場合、ステップS501に戻る。制御部101は操作部105によって言語を選択されたと判断した場合、ステップS506に遷移する。
【0030】
ステップS506では、制御部101はステップS505で選択された言語をスマートフォン100の使用言語にするよう設定を変更し、本フローチャートの処理を終了する。
【0031】
次にステップS504において、制御部101が音声を集音した場合について述べる。この場合、制御部101はステップS507へ遷移する。
【0032】
ステップS507では、制御部101はステップS507において判断した音声の言語に適する言語の候補があったかどうかを判断する。例えば、制御部101は上述したように、外部サーバを用いて音声の言語の候補を取得する。集音した音声の言語に適する言語があった場合、ステップS509へ遷移する。集音した音声の言語に適する言語がなかった場合、ステップS508へ遷移する。
【0033】
ステップS508では、制御部101はステップS507において、集音した音声の言語に適する言語の候補がなかったことを示す通知を表示部106に表示する。制御部101は本処理の後、ステップS501に戻る。
【0034】
一方、ステップS509では、制御部101はステップS507において判断した言語の候補の中から1つを選択する。
【0035】
ステップS510では、制御部101はステップS509において選択した言語と、使用言語とが一致するか否かを判断する。2つの言語が異なる場合、制御部101はステップS512へ遷移する。2つの言語が一致した場合、制御部101はステップS511へ遷移する。
【0036】
ステップS511では、制御部101は集音した音声の言語が使用言語と一致したため、使用言語の変更が行われないことを示す通知を表示部106へ表示する。または、制御部101はスピーカ108から使用言語によって使用言語の変更が行われないことを示す音または音声を再生し、本フローチャートの処理を終了する。
【0037】
一方、ステップS512では、制御部101は使用言語を、集音した音声の言語に変更することをユーザに確認する通知を表示部106に表示する。このとき、表示部106に表示される画面には、制御部101は使用言語と、集音した音声の言語とを用いて、同じ内容の通知を表示する。例えば使用言語が英語、集音した音声が「日本語」だった場合、
図4に示すように、制御部101はダイアログボックス401(英語表記)とダイアログボックス402(日本語表記)とで使用言語を変更するか否かを確認する通知を表示する。このように、使用言語の設定を変更する場合、制御部101は使用言語と、集音した音声の言語とを用いて表示することで、ユーザは複数の言語を確認して、使用言語から、集音した音声の言語に変更するか否かを選択することができる。これによってユーザはスマートフォン100が自身の意図しない言語に使用言語の設定を変更することを防ぎやすくなる。
【0038】
ステップS513では、制御部101は使用言語の設定を変更することをユーザに了承されたか否かを判断する。例えば、
図4において、制御部101はダイアログボックス401の「YES」がタッチされた(使用言語を変更する操作がされた)か、「NO」がタッチされた(使用言語を変更しない操作がされた)かを判断する。使用言語を変更する操作がされた場合、制御部101はステップS514へ遷移する。使用言語を変更しない操作がされた場合、制御部101はステップS511へ遷移する。
【0039】
ステップS514では、制御部101は使用言語の設定を、集音した音声の言語に変更する。その後、制御部101は本フローチャートの処理を終了する。
【0040】
以上、制御部101が使用言語の設定を変更する画面を表示している場合における、制御部101が使用言語を変更する処理について説明した。
【0041】
また、ステップS509において制御部101が集音した音声の言語に複数の候補があると判断した場合、ステップS512において制御部101は使用言語と複数の候補とを用いてダイアログボックスを表示する。例えば使用言語が英語、集音した音声が日本語または韓国語だと判断した場合、
図6に示すように、制御部101はダイアログボックス601、ダイアログボックス602、ダイアログボックス603、およびダイアログボックス604を表示する。(ここで、説明のため集音した音声の候補は日本語または韓国語という例を記載したが、これは日本語と韓国語とが似たような発音であることを意味するわけではない。)ダイアログボックス601およびダイアログボックス602において、制御部101は英語(使用言語)を用いて、英語から日本語または韓国語(集音した音声の言語の候補)へ変更するか否かをそれぞれ表示する。ダイアログボックス603およびダイアログボックス604において、制御部101は日本語または韓国語(集音した音声の言語の候補)をそれぞれ用いて、英語から日本語または韓国語(集音した音声の言語の候補)へ変更するか否かをそれぞれ表示する。すべてのダイアログボックス601~604が画面内に収まりきらない場合、
図6に示すように、制御部101は操作部105によって画面をスクロールできるようにしてダイアログボックス601~604を表示部106に表示する。
【0042】
また、ステップS512において、制御部101は使用言語から、集音した音声の言語に変更するか否かをユーザに確認する内容の音または音声をスピーカ108によって再生してもよい。例えば使用言語が英語、集音した音声が日本語と判断した場合、
図7に示すように、制御部101は英語および日本語を用いて、英語から日本語へ使用言語を変更することをユーザに確認する内容の音または音声をそれぞれ続けてスピーカ108によって再生する。ユーザはその音声を聞いてから、操作部105または音声によってスマートフォン100を操作し、使用言語を変更するか否かを決定する。
【0043】
また、ステップS513において、ユーザはスマートフォン100に対して音声によって使用言語を変更するか否かを操作してもよい。この場合、制御部101はユーザの音声をマイク107によって集音し、変更前の使用言語および集音した音声の言語のどちらの言語でも言語を変更するか否かを判断できるように処理を行う。
【0044】
また、ステップS504において、制御部101は集音した音の大きさの時間的な変化を解析することで、集音した音が音声か否かを判断できる。例えば、制御部101は不揮発性メモリ103に音声の大きさの時間的な変化の特徴量を記録しておき、集音した音とこの特徴量とを比較することで音声か否かを判断する。
【0045】
<第二の実施形態>
次に、制御部101が音声認識機能を利用して使用言語を変更する処理について説明する。音声認識機能とは、集音した音声の意味に沿った処理を電子機器が行う機能である。例えば、いわゆるスマートスピーカは音声認識機能を有し、「テレビをつける」や「好きな音楽を流す」といったユーザの音声を集音すると、その意味に沿うように、無線通信を介してテレビの電源をONしたり再生頻度の高い曲を再生したりすることができる。本実施形態において、スマートフォン100は音声認識機能を利用して使用言語の設定を変更できるとする。
【0046】
図8は本実施形態における、音声認識機能によって使用言語の設定を変更する方法の一例を示す。
図8においてユーザは、スマートフォン100を持ちながら音声認識機能による使用言語の設定を変更する画面800を開いている。ここで初期状態においてスマートフォン100の使用言語は英語である。
図8の左上に記載しているスマートフォン100の図は、ユーザが手にしているスマートフォン100の画面を拡大したものである。この場面において、任意の言語名(
図8においては「韓国語」という日本語の単語)を発言することで、スマートフォン100の使用言語を変更する。
図8において、スマートフォン100はユーザが発言した「韓国語」の単語の意味から韓国語が候補にあると判断できる。またスマートフォン100は「韓国語」という日本語の単語を集音したことから日本語も候補にあると判断できる。スマートフォン100はユーザの発言した言語名を集音し、音声認識機能を用いて言語を判断できた場合、
図9に示すような使用言語を変更するか否かを確認する画面を表示する。
【0047】
図9ではスマートフォン100は、現在の使用言語から集音した言語に変更するか否かを確認するための画面を表示している。
図9の画面は
図6の画面と同じ機能を有する。(ただし、
図9の画面は
図6の画面と、ダイアログボックスの並ぶ順番が異なる。)
図8において、ユーザはその発言の意味から使用言語を韓国語にしたい意図があると考えられる。しかし、ユーザは日本語によって発言しているため、ユーザはスマートフォン100の使用言語を日本語に変更したい可能性もあると考えられる。そのため、
図9においてスマートフォン100は、日本語よりも韓国語の方を画面の上部に表示する。このように使用言語の設定を変更する言語に複数の候補がある場合、スマートフォン100はその言語の候補に優先度をつけ、優先度の高い順番にダイアログボックスを表示する。本実施形態において、スマートフォン100は音声認識機能によって認識した言葉の意味を、その言葉自体の言語よりも優先して表示するが、この優先度は逆にしてもよい。また、ユーザの発言している言葉の意味が認識できず、その言葉自体の言語に複数の候補があると判断でき場合、スマートフォン100はその複数の候補のなかで優先度をつけて表示する。例えば、日本語の可能性が韓国語の可能性よりも高いと判断した場合は、スマートフォン100は日本語の優先度の方を韓国語の優先度よりも高くする。
【0048】
図10はスマートフォン100の使用言語の設定を変更する処理手順を説明するフローチャートである。この処理は、不揮発性メモリ103に記録されたソフトウェアを作業用メモリ104に展開して制御部101が実行することで実現する。またこの処理は、操作部105の電源ボタンをONされたことをトリガに開始する。
【0049】
ステップS1001では、制御部101はスマートフォン100の使用言語の設定を変更する画面を表示部106に表示する。例えば、使用言語の設定を変更する画面は、
図3の画面300に示すように、ユーザがスマートフォン100で利用可能な言語の中から任意の言語を選択するための画面である。例えばユーザがスマートフォン100を初めて電源ONする場合や所定の操作手順によって電源ONする場合等において、電源ボタンをONにされたことをトリガに制御部101が使用言語の設定を変更する画面を表示する。
【0050】
ステップS1002では、制御部101は音声入力ボタン220が押されたか否かを判断する。制御部101は音声入力ボタン220を押されたと判断した場合はステップS1005へ遷移し、押されていないと判断した場合はステップS1003へ遷移する。
【0051】
ステップS1003およびステップS1004は、それぞれ
図5のステップS505およびステップS506と同様である。
【0052】
ステップS1005では、制御部101は表示部106に音声認識機能によって音声を集音する画面を表示する。また本ステップの画面は
図8の画面800に対応する。
【0053】
ステップS1006は
図5のステップS502と同様である。
【0054】
ステップS1007では、制御部101は音声を集音したか否かを判断する。制御部101は所定の時間が経過していなくても、ステップS106において閾値より大きい音声を集音した場合、音声を集音したと判断する。なお、音声の音量が閾値以下だった場合、制御部101は音声を集音しなかったものとして判断する。
【0055】
ステップS1008では、制御部101は音声の集音を開始してから所定の時間以上経過したか否かを判断する。音声の集音を開始してから経過した時間が所定の時間未満場合、制御部101はステップS506に戻る。音声の集音を開始してから所定の時間以上経過した場合、制御部101はステップS1010へ遷移する。
【0056】
ステップS1009からステップS1016は、それぞれ
図5のステップS507からステップS514と同様である。
【0057】
以上、制御部101が音声認識機能を用いて使用言語を変更する処理について説明した。
【0058】
本実施形態において、ユーザはスマートフォン100に対して言語名を発言することで使用言語の設定の変更を行ったが、音声認識機能が任意の音声から言語を判断できる場合、ユーザは任意の言葉を用いて使用言語の設定を変更できる。また、制御部101は言語名ではなく特定の画像に対する発言を集音してもよい。例えば
図11において、制御部101は表示部106にリンゴの画像1101を表示している。制御部101はこのリンゴの画像1101に対してユーザがどんな発言をしたかを判断する。「リンゴ」という日本語の単語を集音した場合、制御部101はユーザの発言を日本語と判断できる。他にも「Apple」という英語の単語を集音した場合、制御部101はユーザの発言を英語と判断できる。
【0059】
<その他の実施形態>
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
【0060】
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。