(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-02-14
(45)【発行日】2024-02-22
(54)【発明の名称】電子機器の通訳機能提供方法およびイヤセット機器
(51)【国際特許分類】
G06F 40/58 20200101AFI20240215BHJP
G10L 15/00 20130101ALI20240215BHJP
H04R 1/10 20060101ALI20240215BHJP
【FI】
G06F40/58
G10L15/00 200C
H04R1/10 104Z
(21)【出願番号】P 2021121707
(22)【出願日】2021-07-26
(62)【分割の表示】P 2017220005の分割
【原出願日】2017-11-15
【審査請求日】2021-08-24
【審判番号】
【審判請求日】2023-06-02
(31)【優先権主張番号】10-2017-0082430
(32)【優先日】2017-06-29
(33)【優先権主張国・地域又は機関】KR
(73)【特許権者】
【識別番号】505205812
【氏名又は名称】ネイバー コーポレーション
【氏名又は名称原語表記】NAVER Corporation
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100135079
【氏名又は名称】宮崎 修
(73)【特許権者】
【識別番号】500257300
【氏名又は名称】LINEヤフー株式会社
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】パク ジュンヒョン
(72)【発明者】
【氏名】パク シヨン
【合議体】
【審判長】渡邊 聡
【審判官】佐藤 智康
【審判官】相崎 裕恒
(56)【参考文献】
【文献】特表2016-509379(JP,A)
【文献】特開2016-91350(JP,A)
【文献】米国特許出願公開第2014/017785(US,A1)
【文献】米国特許出願公開第2017/0060850(US,A1)
【文献】世界の言葉の壁を取り払う、同時通訳イヤホンPilotが商品化!,株式会社ユーディーアール ワールドビジネスブログ,日本,株式会社ユーディーアール,2016年06月30日
(58)【調査した分野】(Int.Cl.,DB名)
G06F 40/00-40/58
(57)【特許請求の範囲】
【請求項1】
電子機器の通訳機能提供方法であって、
左右の耳に着用する1つのイヤセットペア(pair)を形成する第1イヤセット機器および第2イヤセット機器に対し、第1イヤセット機器または第2イヤセット機器で発生するアプリケーション実行信号を前記電子機器で受信する段階、
前記受信したアプリケーション実行信号に対応するアプリケーションを前記電子機器で実行させる段階、
前記実行されたアプリケーションの制御にしたがい、前記電子機器で実行する通訳モードをセルフ通訳モードまたは多者間通訳モードに設定する段階、および
前記電子機器で実行される通訳モードを前記多者間通訳モードに設定した場合、前記実行するアプリケーションの制御にしたがい、前記電子機器が、第1ユーザの片耳に着用された前記第1イヤセット機器および第2ユーザの片耳に着用された前記第2イヤセット機器と通信して前記第1ユーザおよび前記第2ユーザ間の互いに異なる言語への
前記多者間通訳モードによる通訳機能を提供する段階
を含
み、
前記設定する段階は、前記第1イヤセット機器および前記第2イヤセット機器のうち少なくとも1つを通じて入力される音声に対する分析に基づいて、前記電子機器で実行する通訳モードを前記セルフ通訳モードまたは前記多者間通訳モードに自動的に設定し、
前記電子機器で実行される通訳モードを前記セルフ通訳モードに設定した場合、前記実行されたアプリケーションの制御にしたがい、前記電子機器が、前記第1イヤセット機器及び前記第2イヤセット機器の少なくとも1つを通じて入力された第1言語の音声を第2言語に変換し、変換された前記第2言語の音声を前記第1イヤセット機器及び前記第2イヤセット機器のうち少なくとも1つを通じて出力することによって前記セルフ通訳モードによる通訳機能を提供する、通訳機能提供方法。
【請求項2】
前記通訳機能を提供する段階は、
前記第1イヤセット機器を通じて入力され前記電子機器が受信した第1ユーザの第1言語の音声を第2ユーザの第2言語の音声に変換して前記第2イヤセット機器に提供し、前記第2イヤセット機器を通じて入力され前記電子機器が受信した第2言語の音声を第1言語の音声に変換して前記第1イヤセット機器に提供し、互いに異なる言語への通訳機能を提供する、請求項1に記載の通訳機能提供方法。
【請求項3】
前記電子機器は、前記第1イヤセット機器および前記第2イヤセット機器のうちのいずれか1つのイヤセット機器と直接通信し、前記直接通信するイヤセット機器と残り1つのイヤセット機器間の無線通信によって前記残り1つのイヤセット機器と間接通信する、請求項1に記載の通訳機能提供方法。
【請求項4】
前記電子機器は、前記第1イヤセット機器および前記第2イヤセット機器の両方と直接通信する、請求項1に記載の通訳機能提供方法。
【請求項5】
前記受信したアプリケーション実行信号または前記実行するアプリケーションで入力される通訳モード開始信号に基づいて、前記第1イヤセット機器および前記第2イヤセット機器のうちの少なくとも1つを利用した音楽鑑賞モードまたは電話通話モードを通訳モードに切り替える段階、および
前記第1イヤセット機器と第2イヤセット機器を含むイヤセットペアのうちいずれか1つのイヤセット機器で発生するアプリケーション終了信号または前記アプリケーションで入力される通訳モード終了信号に基づいて、前記通訳モードを前記音楽鑑賞モードまたは電話通話モードに切り替える段階
をさらに含む、請求項1に記載の通訳機能提供方法。
【請求項6】
前記電子機器を使用した電話通話の相手との電話通話中に、電話通話中通訳機能を提供する段階
をさらに含み、
前記
電話通話中通訳機能を提供する段階は、
前記電子機器が前記電話通話の相手と電話通話中の状態で、前記第1イヤセット機器または第2イヤセット機器で発生するアプリケーション実行信号または前記実行するアプリケーションで入力される電話通話中通訳モードの開始信号に基づいて、前記第1イヤセット機器および前記第2イヤセット機器のうちの少なくとも1つを利用して実行中の電話通話モードを電話通話中通訳モードに切り替える段階、
前記第1イヤセット機器および前記第2イヤセット機器のうちの少なくとも1つを通じて入力され受信した言語の音声を、前記電話通話の相手の言語である他の言語の音声に変換する段階、および
前記変換された前記他の言語の音声を、前記電話通話モードを通じて前記電話通話の相手に提供する段階
をさらに含む、請求項1に記載の通訳機能提供方法。
【請求項7】
前記アプリケーション実行信号は、前記第1イヤセット機器および前記第2イヤセット機器のうちの少なくとも1つが含む物理的なボタンによる入力、または前記第1イヤセット機器および前記第2イヤセット機器のうちの少なくとも1つが含むセンサの出力値によって発生する、請求項1に記載の通訳機能提供方法。
【請求項8】
前記通訳機能を提供する段階は、
前記第1イヤセット機器を通じて入力され受信した前記第1ユーザの音声の第1言語と前記第2イヤセット機器を通じて入力され受信した前記第2ユーザの音声の第2言語を感知する段階、
感知された第1言語の音声を感知された第2言語の音声に変換し、感知された第2言語の音声を感知された第1言語の音声に変換する段階、および
前記変換された第2言語の音声を前記第2イヤセット機器に提供し、前記変換された第1言語の音声を前記第1イヤセット機器に提供する段階
を含む、請求項2に記載の通訳機能提供方法。
【請求項9】
コンピュータと結合して請求項1~8のうちのいずれか一項に記載の方法をコンピュータに実行させるためにコンピュータで読み取り可能な記録媒体に格納された、コンピュータプログラム。
【請求項10】
請求項1~8のうちのいずれか一項に記載の方法をコンピュータに実行させるためのプログラムが記録されている、コンピュータで読み取り可能な記録媒体。
【請求項11】
通訳機能を提供する電子機器であって、
メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサ
を含み、
前記少なくとも1つのプロセッサは、
左右の耳に着用する1つのイヤセットペア(pair)を形成する第1イヤセット機器および第2イヤセット機器に対し、第1イヤセット機器または第2イヤセット機器で発生するアプリケーション実行信号を受信し、
前記受信したアプリケーション実行信号に対応するアプリケーションを実行
し、
前記実行されたアプリケーションの制御にしたがい、前記電子機器で実行する通訳モードをセルフ通訳モードまたは多者間通訳モードに設定し、
前記電子機器で実行される通訳モードを前記多者間通訳モードに設定した場合、前記実行するアプリケーションの制御にしたがい、第1ユーザの片耳に着用された前記第1イヤセット機器および第2ユーザの片耳に着用された前記第2イヤセット機器と通信して前記第1ユーザおよび前記第2ユーザ間の互いに異なる言語への
前記多者間通訳モードによる通訳機能を提供する
ものであり、
前記電子機器で実行する通訳モードをセルフ通訳モードまたは多者間通訳モードに設定する際に、前記第1イヤセット機器および前記第2イヤセット機器のうち少なくとも1つを通じて入力される音声に対する分析に基づいて、前記電子機器で実行する通訳モードを前記セルフ通訳モードまたは前記多者間通訳モードに自動的に設定し、
前記電子機器で実行される通訳モードを前記セルフ通訳モードに設定した場合、前記実行されたアプリケーションの制御にしたがい、前記電子機器が、前記第1イヤセット機器及び前記第2イヤセット機器の少なくとも1つを通じて入力された第1言語の音声を第2言語に変換し、変換された前記第2言語の音声を前記第1イヤセット機器及び前記第2イヤセット機器のうち少なくとも1つを通じて出力することによって前記セルフ通訳モードによる通訳機能を提供する、電子機器。
【発明の詳細な説明】
【技術分野】
【0001】
以下の説明は、イヤセットを利用した通訳機能提供方法および装置、コンピュータと結合して本発明の実施形態に係る通訳機能提供方法をコンピュータに実行させるためにコンピュータで読み取り可能な記録媒体に格納されたコンピュータプログラムとその記録媒体に関する。
【背景技術】
【0002】
イヤセット(earset)とは、電話機に連結することで手を使わずに通話をするために利用されるイヤホンとマイクを備えた機器であり、例えば、スマートフォンに連結することにより、電話通話はもちろん、音楽のようなオーディオを受信して出力したり、物理的なボタンやセンサ、あるいは音声によってスマートフォンを制御するための多様な制御信号をスマートフォンに提供したりすることができる。例えば、特許文献1では、イヤカーネルマイクが内蔵されたブルートゥース(登録商標)イヤセットを開示している。
【先行技術文献】
【特許文献】
【0003】
【文献】韓国公開特許第10-2017-0030375号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
イヤセットを利用して通訳機能を提供することができる通訳機能提供方法および装置、コンピュータと結合して本発明の実施形態に係る通訳機能提供方法をコンピュータに実行させるためにコンピュータで読み取り可能な記録媒体に格納されたコンピュータプログラムとその記録媒体を提供する。
【0005】
第1イヤセット機器を通じて入力され電子機器が受信した第1言語の音声を第2言語の音声に変換して第2イヤセット機器に提供し、第2イヤセット機器を通じて入力され電子機器が受信された第2言語の音声を第1言語の音声に変換して第1イヤセット機器に提供することにより、第1イヤセット機器と第2イヤセット機器を含むイヤセットペア(pair)を利用して互いに異なる言語を利用する2人のユーザ間の通訳機能を提供することができる通訳機能提供方法および装置、コンピュータと結合して本発明の実施形態に係る通訳機能提供方法をコンピュータに実行させるためにコンピュータで読み取り可能な記録媒体に格納されたコンピュータプログラムとその記録媒体を提供する。
【課題を解決するための手段】
【0006】
電子機器の通訳機能提供方法であって、第1イヤセット機器または第2イヤセット機器で発生するアプリケーション実行信号を受信する段階、前記受信したアプリケーション実行信号に対応するアプリケーションを実行する段階、および前記実行されるアプリケーションの制御にしたがい、前記第1イヤセット機器および前記第2イヤセット機器のうちの少なくとも1つを通じて入力されて電子機器が受信した音声に対する他の言語への通訳機能を提供する段階を含む、通訳機能提供方法を提供する。
【0007】
第1イヤセット機器の通訳機能提供方法であって、前記第1イヤセット機器に入力される第1言語の音声が電子機器で実行されるアプリケーションの通訳機能によって第2言語の音声に変換され、前記第1イヤセット機器とイヤセットペアをなす第2イヤセット機器に提供されるように、前記第1言語の音声を前記電子機器に送信する段階、前記第2イヤセット機器に入力されて前記電子機器で受信した第2言語の音声を、前記電子機器が前記実行されたアプリケーションの通訳機能によって第1言語の音声に変換することに応答し、前記電子機器から前記変換された第1言語の音声を受信する段階、および前記受信した第1言語の音声を出力する段階を含む、通訳機能提供方法を提供する。
【0008】
前記通訳機能提供方法をコンピュータに実行させるためのコンピュータプログラムが記録されている、コンピュータで読み取り可能な記録媒体を提供する。
【0009】
コンピュータと結合して前記通訳機能提供方法をコンピュータに実行させるためにコンピュータで読み取り可能な記録媒体に格納された、コンピュータプログラムを提供する。
【0010】
第1イヤセット機器であって、音を入力するための音信号入力部、音を出力するための音信号出力部、前記電子機器または前記第1イヤセット機器とイヤセットペアをなす第2イヤセット機器と通信するための通信部、および前記音信号入力部、前記音信号出力部、および前記通信部を制御する制御部を備え、前記制御部は、前記音信号入力部を通じて入力される第1言語の音声が、前記電子機器で実行されたアプリケーションの通訳機能にしたがって第2言語の音声に変換されて前記第1イヤセット機器とイヤセットペアをなす第2イヤセット機器に提供されるように、前記第1言語の音声を前記電子機器に送信するように前記通信部を制御し、前記第2イヤセット機器に入力されて前記電子機器で受信した第2言語の音声を、前記電子機器が前記実行されるアプリケーションの通訳機能にしたがって第1言語の音声に変換するに応答し、前記電子機器から前記変換された第1言語の音声を受信するように前記通信部を制御し、前記受信した第1言語の音声を出力するように前記音信号出力部を制御する、第1イヤセット機器を提供する。
【発明の効果】
【0011】
イヤセットを利用して通訳機能を提供することができ、第1イヤセット機器と第2イヤセット機器を含むイヤセットペアを利用して互いに異なる言語の2名のユーザ間の通訳機能を提供することができる。
【0012】
通訳機能を利用することにより、第1言語から第2言語に通訳された音声を電話通話の相手に提供することができる。
【図面の簡単な説明】
【0013】
【
図1】本発明の一実施形態における、イヤセットを利用した通訳機能提供過程の例を示した図である。
【
図2】本発明の一実施形態における、イヤセットペアの例を示した図である。
【
図3】本発明の一実施形態における、イヤセットペアと電子機器の通信例を示した図である。
【
図4】本発明の一実施形態における、イヤセットペアと電子機器の他の通信例を示した図である。
【
図5】本発明の一実施形態における、電子機器、イヤセット機器、およびサーバの内部構成を説明するためのブロック図である。
【
図6】本発明の一実施形態における、クラウド人工知能プラットフォームの例を示した図である。
【
図7】本発明の一実施形態における、通訳機能提供方法の例を示したフローチャートである。
【
図8】本発明の一実施形態における、セルフ通訳および多者間通訳のための通訳機能を提供する例を示したフローチャートである。
【
図9】本発明の一実施形態における、音楽鑑賞モードまたは電話通話モードを通訳モードに切り替える例を示したフローチャートである。
【
図10】本発明の一実施形態における、電話通話中に通訳機能を提供する例を示したフローチャートである。
【
図11】本発明の一実施形態における、イヤセット機器の通訳機能提供方法の例を示したフローチャートである。
【発明を実施するための形態】
【0014】
以下、実施形態について、添付の図面を参照しながら詳しく説明する。
【0015】
本発明の実施形態に係る通訳機能提供方法は、以下で説明される電子機器やイヤセット機器によって実行されてよい。例えば、電子機器やイヤセット機器には、本発明の一実施形態に係るコンピュータプログラムがインストールおよび駆動されてよく、電子機器やイヤセット機器は、駆動するコンピュータプログラムの制御にしたがって本発明の一実施形態に係る通訳機能提供方法を実行してよい。上述したコンピュータプログラムは、コンピュータで実現される電子機器やイヤセット機器と結合して通訳機能提供方法をコンピュータに実行させるためにコンピュータで読み取り可能な記録媒体に格納されてよい。ここで、説明したコンピュータプログラムは、独立する1つのプログラムパッケージの形態であってもよいし、独立する1つのプログラムパッケージの形態が、コンピュータに予めインストールされて駆動するオペレーティングシステムや他のプログラムパッケージと連係する形態であってもよい。
【0016】
図1は、本発明の一実施形態における、イヤセットを利用した通訳機能提供過程の例を示した図である。
図1は、電子機器110、第1イヤセット機器120、および第2イヤセット機器130を示しており、第1ユーザ140が第1イヤセット機器120を右耳に、第2ユーザ150が第2イヤセット機器130を左耳にそれぞれ着用した例を示している。ここで、第1ユーザ140は第1言語を使用し、第2ユーザ150は第2言語を使用すると仮定する。
【0017】
このとき、第1ユーザ140が発話する第1言語の音声は、第1イヤセット機器120が含むマイクのような音信号入力部に入力されてよく、第1イヤセット機器120は、入力された第1言語の音声を電子機器110に送信してよい。この場合、電子機器110は、電子機器110にインストールされたアプリケーションの通訳機能を利用し、受信した第1言語の音声を第2言語の音声に変換して第2イヤセット機器130に提供してよい。このとき、第2イヤセット機器130は、提供された第2言語の音声を第2イヤセット機器130が含むスピーカ(イヤホン)のような音信号出力部を通じて出力してよい。したがって、第2ユーザ150は、第1ユーザ140が発話する第1言語の音声を、第2言語に通訳された音声で聞くことができるようになる。
【0018】
また、第2ユーザ150が発話する第2言語の音声は、第2イヤセット機器130が含むマイクのような音信号入力部に入力されてよく、第2イヤセット機器130は、入力された第2言語の音声を電子機器110に送信してよい。この場合、電子機器110は、電子機器110にインストールされたアプリケーションの通訳機能を利用し、受信した第2言語の音声を第1言語の音声に変換して第1イヤセット機器120に提供してよい。このとき、第1イヤセット機器120は、提供された第1言語の音声を第1イヤセット機器120が含むスピーカ(イヤホン)のような音信号出力部を通じて出力してよい。したがって、第1ユーザ140は、第2ユーザ150が発話する第2言語の音声を、第1言語に通訳された音声で聞くことができるようになる。
【0019】
このように、
図1の実施形態によると、1つのイヤセットペアをなす第1イヤセット機器120と第2イヤセット機器130を利用して多者間通訳の機能を提供することができる。
【0020】
図1の実施形態とは異なる実施形態において、第1ユーザ140が第1イヤセット機器120と第2イヤセット機器130をそれぞれ両耳に着用している場合が考慮されることもある。この場合、第1ユーザ140が発話する第1言語の音声は、第1イヤセット機器120と第2イヤセット機器130のうちの少なくとも1つを通じて入力されて電子機器110に送信されてよい。このとき、電子機器110は、電子機器110にインストールされたアプリケーションの通訳機能を利用し、受信した第1言語の音声を第2言語の音声に変換して第1イヤセット機器120と第2イヤセット機器130のうちの少なくとも1つに送信してよい。このとき、第1イヤセット機器120および/または第2イヤセット機器130は、第2言語に変換された音声を出力してよく、第1ユーザ140は、自身が第1言語で発話した音声を通訳した第2言語の音声を聞くことができるようになる。このように、
図1の実施形態とは異なり、本発明の他の実施形態では、セルフ通訳のための機能を提供することも可能である。
【0021】
多者間通訳のための機能とセルフ通訳のための機能は、電子機器110にインストールされたアプリケーションでモードを変更することによってそれぞれ提供されてよい。例えば、アプリケーションは、多者間通訳モードとセルフ通訳モードのうちの1つを設定することができるユーザインタフェースを提供するように電子機器110を制御してよく、提供されたユーザインタフェースを利用することで、ユーザが多者間通訳モードとセルフ通訳モードのうちの1つを直接設定してよい。あるいは、このようなモードの設定は、第1イヤセット機器120および第2イヤセット機器130のうちの少なくとも1つが含む物理的なボタンに対する入力によってなされてもよい。また他の例として、モードの設定は、第1イヤセット機器120および第2イヤセット機器130に入力される音声を分析してなされてもよい。例えば、第1イヤセット機器120と第2イヤセット機器130それぞれに入力される音声のピッチや大きさなどが類似する場合にはセルフ通訳モードが設定されてよく、第1イヤセット機器120と第2イヤセット機器130それぞれに入力される音声のピッチや大きさなどが全く異なる場合には多者間通訳モードが設定されてよい。
【0022】
図2は、本発明の一実施形態における、イヤセットペアの例を示した図である。本実施形態に係るイヤセットペアは、
図2に示すように、第1イヤセット機器120と第2イヤセット機器130を含んでいる。
図1および
図2の実施形態には、第1イヤセット機器120は右耳に、第2イヤセット機器130は左耳に着用する様子が示されているが、これは発明を説明するための1つの実施形態に過ぎず、これに限定されることはない。例えば、第1イヤセット機器120は左耳に、第2イヤセット機器130は右耳に着用するように実現されてもよい。
【0023】
また、
図2の実施形態には、第1イヤセット機器120および第2イヤセット機器130の保管、据置、充電などの機能を提供するクレイドル(cradle)210の例が示されている。このようなクレイドル210も、第1イヤセット機器120と第2イヤセット機器130が1つのイヤセットペアをなす実施形態を説明するための1つの例示に過ぎず、その形状や機能などが
図2の説明によって限定されることはない。
【0024】
図3は、本発明の一実施形態における、イヤセットペアと電子機器の通信例を示した図である。一般的に、スマートフォンは、ブルートゥース(登録商標)(Bluetooth)、ジグビー(Zigbee)、Wi‐Fiなどのような近距離無線通信プロトコルを介してイヤセットや無線スピーカのような周辺機器と通信する。
図3の実施形態でも、電子機器110が、このような近距離無線通信プロトコルを利用してイヤセットペアと通信する例について説明する。ただし、電子機器110は、1つの近距離無線通信プロトコル(一例として、ブルートゥース(登録商標)4.1)を利用して一度に1つの機器(
図3の実施形態では、第1イヤセット機器120)とだけ通信しなければならない場合が存在する。言い換えれば、電子機器110が、1つの近距離無線通信プロトコルを介して2つ以上の機器と同時に通信することができない場合が考慮される。本実施形態において、電子機器110は、1つの近距離無線通信プロトコルを利用して1つの機器として第1イヤセット機器120と通信してよく、第2イヤセット機器130とは、第1イヤセット機器120の中継によって通信してよい。このために、第1イヤセット機器120と第2イヤセット機器130は、互いに近距離無線通信を行ってよい。例えば、第2イヤセット機器130は、入力された第2言語の音声を、第1イヤセット機器120を経て電子機器110に送信してよい。これとは逆に、電子機器110が送信する第1言語に通訳された音声を、第1イヤセット機器120を経て第2イヤセット機器130に送信してよい。このような中継通信のための一例として、TWS(True Wireless Stereo)方式が利用されてよい。
【0025】
図4は、本発明の一実施形態における、イヤセットペアと電子機器の他の通信例を示した図である。
図3の実施形態と異なり、電子機器110は、1つの近距離無線通信プロトコルを利用して第1イヤセット機器120および第2イヤセット機器130の両方と同時に通信してもよい。例えば、ブルートゥース(登録商標)5.0のような近距離無線通信プロトコルは、スマートフォンが同時に2つの機器とブルートゥース(登録商標)連結および通信が可能な技術を提供する。
図4の実施形態は、このように同時に複数の機器と通信が可能な近距離無線通信プロトコルを活用することで、第1イヤセット機器120および第2イヤセット機器130の両方と同時に通信することも可能である。
【0026】
一方、電子機器110は、アプリケーションを利用して通訳機能を提供するにあたり、アプリケーションが自主的に有する通訳機能を提供することも可能であるが、アプリケーションと連係するサーバから通訳機能の提供を受けることも可能である。例えば、電子機器110は、アプリケーションの制御にしたがってサーバに接続して第1言語の音声および第1言語の音声を通訳しようとする第2言語に関する情報を伝達してよい。この場合、サーバは、第1言語の音声を第2言語の音声に変換して電子機器110に提供してよく、電子機器110は、第1言語の音声に対して通訳された第2言語の音声を得ることができるようになる。
【0027】
図5は、本発明の一実施形態における、電子機器、イヤセット機器、およびサーバの内部構成を説明するためのブロック図である。
図5のサーバ520は、電子機器110にインストールおよび駆動されるアプリケーションと連係して通訳機能を提供する外部システムであってよい。
【0028】
電子機器110とサーバ520は、メモリ511、521、プロセッサ512、522、通信インタフェース513、523、および入力/出力インタフェース514、524を含んでよい。メモリ511、521は、コンピュータで読み取り可能な記録媒体であって、RAM(random access memory)、ROM(read only memory)、およびディスクドライブのような永久大容量記憶装置(permanent mass storage device)を含んでよい。ここで、ROMやディスクドライブのような永久大容量記憶装置は、メモリ511、521とは区分される、別の永久記憶装置として電子機器110やサーバ520に含まれてもよい。また、メモリ511、521には、オペレーティングシステムと、少なくとも1つのプログラムコード(一例として、電気機器110にインストールされ、特定のサービスの提供のために電子機器110で駆動するアプリケーションなどのためのコード)が格納されてよい。このようなソフトウェア構成要素は、メモリ511、521とは別のコンピュータで読み取り可能な記録媒体からロードされてよい。このような別のコンピュータで読み取り可能な記録媒体は、フロッピー(登録商標)ドライブ、ディスク、テープ、DVD/CD-ROMドライブ、メモリカードなどのコンピュータで読み取り可能な記録媒体を含んでよい。他の実施形態において、ソフトウェア構成要素は、コンピュータで読み取り可能な記録媒体ではない通信インタフェース513、523を通じてメモリ511、521にロードされてもよい。例えば、少なくとも1つのプログラムは、開発者またはアプリケーションのインストールファイルを配布するファイル配布システムがネットワーク530を介して提供するファイルによってインストールされるコンピュータプログラム(一例として、上述したアプリケーション)に基づいて電子機器110のメモリ511にロードされてよい。
【0029】
プロセッサ512、522は、基本的な算術、ロジック、および入出力演算を実行することにより、コンピュータプログラムの命令を処理するように構成されてよい。命令は、メモリ511、521または通信インタフェース513、523によって、プロセッサ512、522に提供されてよい。例えば、プロセッサ512、522は、メモリ511、521のような記録装置に格納されたプログラムコードにしたがって受信される命令を実行するように構成されてよい。
【0030】
通信インタフェース513、523は、ネットワーク530を介して電子機器110とサーバ520とが互いに通信するための機能を提供してもよいし、電子機器110および/またはサーバ520が他の電子機器または他のサーバと通信するための機能を提供してもよい。一例として、電子機器110のプロセッサ512がメモリ511のような記録装置に格納されたプログラムコードにしたがって生成した要求が、通信インタフェース513の制御にしたがってネットワーク530を介してサーバ520に伝達されてよい。これとは逆に、サーバ520のプロセッサ522の制御にしたがって提供される制御信号や命令、コンテンツ、ファイルなどが、通信インタフェース523とネットワーク530を経て電子機器110の通信インタフェース513を通じて電子機器110に受信されてもよい。例えば、通信インタフェース513を通じて受信したサーバ520の制御信号や命令、コンテンツ、ファイルなどは、プロセッサ512やメモリ511に伝達されてよく、コンテンツやファイルなどは、電子機器110がさらに含むことのできる格納媒体(上述した永久記憶装置)に格納されてよい。
【0031】
入力/出力インタフェース514は、入力/出力装置515とのインタフェースのための手段であってよい。例えば、入力装置は、マイク、キーボード、またはマウスなどの装置を、出力装置は、ディスプレイやスピーカのような装置を含んでよい。他の例として、入力/出力インタフェース514は、タッチスクリーンのように入力と出力のための機能が1つに統合された装置とのインタフェースのための手段であってもよい。入力/出力装置515は、電子機器110と1つの装置で構成されてもよい。また、サーバ520の入力/出力インタフェース524は、サーバ520と連結するかサーバ520が含むことのできる入力または出力のための装置(図示せず)とのインタフェースのための手段であってよい。
【0032】
また、他の実施形態において、電子機器110およびサーバ520は、
図5の構成要素よりも少ないか、それよりも多い構成要素を含んでもよい。しかし、大部分の従来技術的構成要素を明確に図に示す必要はない。例えば、電子機器110は、上述した入力/出力装置515のうちの少なくとも一部を含むように実現されてもよいし、トランシーバ、GPS(Global Positioning System)モジュール、カメラ、各種センサ、データベースなどのような他の構成要素をさらに含んでもよい。より具体的な例として、電子機器110がスマートフォンである場合、一般的にスマートフォンが含んでいる加速度センサやジャイロセンサ、カメラモジュール、物理的な各種ボタン、タッチパネルを利用したボタン、入力/出力ポート、振動のための振動器などのような多様な構成要素が電子機器110にさらに含まれるように実現されてよい。
【0033】
第1イヤセット機器120は、音の入力を受けるための音信号入力部541、音を出力するための音信号出力部542、電子機器110または第1イヤセット機器120とイヤセットペアをなす第2イヤセット機器130と通信するための通信部543、および音信号入力部541、音を出力するための音信号出力部542、および通信部543を制御する制御部544を備えてよい。例えば、制御部544は、ユーザ(一例として、
図1の第1ユーザ140)が発話する第1言語の音声の入力を受けるように音信号入力部541を制御してよい。また、制御部544は、入力される第1言語の音声が電子機器110で実行されるアプリケーションの通訳機能にしたがって第2言語の音声に変換されて第2イヤセット機器130に提供されるように、第1言語の音声を電子機器110に送信するように通信部543を制御してよい。また、制御部544は、第2イヤセット機器120に入力されて電子機器110で受信した第2言語の音声を電子機器110で実行されるアプリケーションの通訳機能にしたがって第1言語の音声に変換することに応答し、電子機器110から変換された第1言語の音声を受信するように通信部543を制御してよい。さらに、制御部544は、電子機器110から受信された第1言語の音声を出力するように音信号出力部542を制御してよい。
【0034】
図6は、本発明の一実施形態における、クラウド人工知能プラットフォームの例を示した図である。
図6は、電子機器610、クラウド人工知能プラットフォーム620、およびコンテンツ・サービス630を示している。
【0035】
一例として、電子機器610は、一例として、スマートホームネットワークを介して連結する宅内の機器を含んでよいが、それぞれあるいは少なくとも1つが上述した電子機器110に対応してもよい。このような電子機器610や電子機器610でインストールおよび駆動するアプリケーション(以下、アプリとする)は、インタフェースコネクト640を介してクラウド人工知能プラットフォーム620と連係してよい。ここで、インタフェースコネクト640は、電子機器610や電子機器610でインストールおよび駆動するアプリの開発のためのSDK(Software Development Kit)および/または開発文書を開発者に提供してよい。また、インタフェースコネクト640は、電子機器610や電子機器610でインストールおよび駆動するアプリが、クラウド人工知能プラットフォーム620が提供する機能を活用することのできるAPI(Application Program Interface)を提供してよい。具体的な例として、開発者は、インタフェースコネクト640が提供するSDK(Software Development Kit)および/または開発文書を利用して開発した機器やアプリは、インタフェースコネクト640が提供するAPIを利用してクラウド人工知能プラットフォーム620が提供する機能(一例として、通訳機能)を活用することができるようになる。
【0036】
ここで、クラウド人工知能プラットフォーム620は、通訳機能はもちろん、多様な音声基盤のサービスを提供するための機能を提供してもよい。例えば、クラウド人工知能プラットフォーム620は、受信した音声を認識して出力する音声を合成するための音声処理モジュール621、受信した映像や動画を分析して処理するためのビジョン処理モジュール622、受信した音声に応じて適合する音声(一例として、第2言語に通訳された音声)を出力するために適切な会話を決定するための会話処理モジュール623、受信した音声に適合する機能を勧めるための推薦モジュール624、人工知能がデータ学習に基づいて文章単位で言語を翻訳するようにサポートするニューラル機械翻訳(Neural Machine Translation:NMT)625などのように、音声基盤サービスを提供するための多様なモジュールを含んでよい。
【0037】
例えば、電子機器110は、第1言語の音声と通訳された第2言語に関する情報を、インタフェースコネクト640で提供するAPIを利用してクラウド人工知能プラットフォーム620に送信してよい。この場合、クラウド人工知能プラットフォーム620は、受信した第1言語の音声を、上述したモジュール621~625を活用して認識および分析してよく、第1言語の音声を第2言語の音声に通訳し、適切な返答音声を合成して提供してよい。
【0038】
また、拡張キット650は、第三者であるコンテンツ開発者または会社がクラウド人工知能プラットフォーム620に基づいて新たな音声基盤機能を実現することができる開発キットを提供してよい。例えば、クラウド人工知能プラットフォーム620の通訳機能の活用が可能な別のアプリケーションとサーバが提供された開発キットを利用して開発されてよい。
【0039】
このようなクラウド人工知能プラットフォーム620は、電子機器110に通訳機能を提供するためのサーバ520の具体的な一例に過ぎず、電子機器11に通訳機能を提供することが可能なサーバ520であれば限定されることはない。
【0040】
図7は、本発明の一実施形態における、通訳機能提供方法の例を示したフローチャートである。本実施形態に係る通訳機能提供方法は、上述した電子機器110のようなコンピュータ装置によって実行されてよい。このとき、電子機器110のプロセッサ512は、メモリ511が含むオペレーティングシステムのコードや少なくとも1つのプログラムのコードによる制御命令(instruction)を実行するように実現されてよい。ここで、プロセッサ512は、電子機器110に格納されたコードが提供する制御命令にしたがって電子機器110が
図7の通訳機能提供方法が含む段階710~730を実行するように、電子機器110を制御してよい。
【0041】
段階710で、電子機器110は、第1イヤセット機器または第2イヤセット機器で発生するアプリケーション実行信号を受信してよい。ここで、第1イヤセット機器と第2イヤセット機器は、上述した第1イヤセット機器120および第2イヤセット機器130に対応してよい。例えば、第1イヤセット機器および第2イヤセット機器は、左耳と右耳のためのイヤセットペアで構成されてよい。アプリケーション実行信号は、第1イヤセット機器および第2イヤセット機器のうちの少なくとも1つが含む物理的なボタンからの入力、または第1イヤセット機器および第2イヤセット機器のうちの少なくとも1つが含むセンサの出力値によって発生されてよい。例えば、第1イヤセット機器(または第2イヤセット機器)は、ユーザが第1イヤセット機器(または第2イヤセット機器)に含まれるボタンを押すことによって発生する入力信号を感知し、感知した入力信号に対応してアプリケーション実行信号を生成してよい。その後、第1イヤセット機器(または第2イヤセット機器)は、生成されたアプリケーション実行信号を電子機器110に送信してよい。他の例として、第1イヤセット機器(または第2イヤセット機器)は、照度センサを含んでよい。このとき、第1イヤセット機器(または第2イヤセット機器)は、ユーザが照度センサの測定部位に指を一定の時間以上かざす行為を感知し、このような行為の感知によってアプリケーション実行信号を生成してもよい。このように、ユーザの特定の行為を感知してアプリケーション実行信号を生成するための多様な方法のうちの1つが活用可能であることは、当業者であれば容易に理解することができるであろう。
【0042】
段階720で、電子機器110は、受信したアプリケーション実行信号に対応するアプリケーションを実行させてよい。このとき、実行させるアプリケーションは、自主的あるいは上述したサーバ520との連係によって通訳機能を提供するためのコンピュータプログラムであってよい。
【0043】
段階730で、電子機器110は、実行するアプリケーションの制御にしたがい、第1イヤセット機器および第2イヤセット機器のうちの少なくとも1つを通じて入力され電子機器110が受信した音声に対する他の言語への通訳機能を提供してよい。このとき、通訳機能は、上述したように、セルフ通訳のための機能と多者間通訳のための機能を含んでよい。
【0044】
このように、ユーザ(あるいはユーザら)は、イヤセット機器を利用して電子機器110の通訳機能のためのアプリケーションを実行させることができ、イヤセット機器を利用して発話された音声に対する他の言語への通訳機能の提供を受けることができるようになる。
【0045】
図8は、本発明の一実施形態における、セルフ通訳および多者間通訳のための通訳機能を提供する例を示したフローチャートである。
図8の段階810~890は、
図7の段階730で通訳機能を提供するための具体的な過程の一例を示している。
【0046】
段階810で、電子機器110は、通訳モードが実行中であるかを判断してよい。例えば、通訳モードの終了またはアプリケーションの終了によって通訳モードが実行中でない場合には、
図8の過程は終わってよい。電子機器110は、段階810で通訳モードが実行中の場合、段階820を実行してよい。
【0047】
段階820で、電子機器110は、通訳モードが多者間通訳モードであるかを判断してよい。通訳モードが多者間通訳モードの場合には段階830が実行されてよい。通訳モードが多者間通訳モードでなければ、電子機器110は、段階870を実行してよい。
【0048】
段階830で、電子機器110は、第1イヤセット機器から音声を受信したかを判断してよい。ここで、第1イヤセット機器は、イヤセットペアが含む2つのイヤセット機器のうちのいずれか1つであってよい。このとき、第1イヤセット機器から音声を受信した場合、電子機器110は、段階840を実行してよい。第1イヤセット機器から音声が受信されなかった場合、電子機器110は、段階850を実行してよい。
【0049】
段階840で、電子機器110は、第1イヤセット機器を通じて入力され電子機器110が受信した第1言語の音声を第2言語の音声に変換して第2イヤセット機器に提供してよい。ここで、第2イヤセット機器は、段階830で音声を提供したイヤセット機器を除いた他の1つのイヤセット機器であってよい。第2イヤセット機器は、変換された第2言語の音声を出力することにより、第2イヤセット機器を着用した第2ユーザに、第1イヤセット機器を着用した第1ユーザが第1言語で発話した音声が第2言語の音声に通訳されて提供されてよい。
【0050】
段階850で、電子機器110は、第2イヤセット機器から音声を受信したかを判断してよい。このとき、第2イヤセット機器から音声を受信した場合、電子機器110は、段階860を実行してよい。第2イヤセット機器から音声が受信されなかった場合、電子機器110は、再び段階810を実行してよい。
【0051】
段階860で、電子機器110は、第2イヤセット機器を通じて入力された第2言語の音声を受信して第1言語の音声に変換して第1イヤセット機器に提供してよい。第1イヤセット機器は、変換された第1言語の音声を出力することにより、第1イヤセット機器を着用した第1ユーザに、第2イヤセット機器を着用した第2ユーザが第2言語で発話した音声が第1言語の音声に通訳されて提供されてよい。この後、電子機器110は、再び段階810を実行してよい。
【0052】
段階870で、電子機器110は、通訳モードがセルフ通訳モードであるかを判断してよい。通訳モードがセルフ通訳モードである場合には段階880が実行されてよい。通訳モードがセルフ通訳モードでなければ、電子機器110は、段階890を実行してよい。
【0053】
段階880で、電子機器110は、第1イヤセット機器および第2イヤセット機器のうちの少なくとも1つを通じて入力された第1言語の音声を受信して第2言語の音声に変換し、第1イヤセット機器および第2イヤセット機器のうちの少なくとも1つに提供してよい。セルフ通訳モードでは、1人のユーザが第1イヤセット機器と第2イヤセット機器の両方を着用しているものと判断するため、第1イヤセット機器および第2イヤセット機器のうちの少なくとも1つを通じて第1言語の音声を受信し、通訳された第2言語の音声を第1イヤセット機器および第2イヤセット機器のうちの少なくとも1つに提供してよい。段階880の後、電子機器110は、再び段階810を実行してよい。
【0054】
段階890で、電子機器110は、モードを設定してよい。例えば、電子機器110は、アプリケーションの制御にしたがい、ユーザに通訳モードとして多者間通訳モードおよびセルフ通訳モードのうちの1つを設定することを要求してよい。例えば、電子機器110は、アプリケーションが提供するユーザインタフェースを利用して多者間通訳モードおよびセルフ通訳モードのうちの1つを設定するようにユーザに要求してもよいし、第1イヤセット機器および第2イヤセット機器のうちの少なくとも1つが含むボタンやセンサを利用した入力をユーザに要求してもよい。他の例として、電子機器110が入力される音声を分析するなどの分析過程を経て自動で多者間通訳モードおよびセルフ通訳モードのうちの1つを設定することも可能である。段階890の後、電子機器110は、再び段階810を実行してよい。
【0055】
このように、
図8の実施形態では、多者間通訳モードとセルフ通訳モードに応じて通訳機能を提供する具体的な例について説明している。このような
図8の実施形態では、セルフ通訳モードと多者間通訳モードによる動作の例を示しているが、実施形態によっては、セルフ通訳モードだけが提供されてもよいし、多者間通訳モードだけが提供されてもよい。
【0056】
電子機器110と第1イヤセット機器および第2イヤセット機器間の通信は、
図3および
図4を参照しながら説明したように、直接/間接通信によって行われてよい。例えば、電子機器110は、第1イヤセット機器および第2イヤセット機器のうちのいずれか1つのイヤセット機器と直接通信し、直接通信するイヤセット機器と残り1つのイヤセット機器間の無線通信によって残り1つのイヤセット機器と間接通信してよい。他の例として、電子機器110は、第1イヤセット機器および第2イヤセット機器の両方と同時に直接通信をすることも可能である。
【0057】
また、ユーザ(一例として、
図1の第1ユーザ140)が第1イヤセット機器および第2イヤセット機器のうちの少なくとも1つを着用した状態で音楽鑑賞をしたり電話通話を行ったりしている状況で通訳機能が必要となる場合もある。
【0058】
図9は、本発明の一実施形態における、音楽鑑賞モードまたは電話通話モードを通訳モードに切り替える例を示したフローチャートである。
【0059】
段階910で、電子機器110は、受信したアプリケーション実行信号または実行されるアプリケーションで入力される通訳モード開始信号に基づいて、第1イヤセット機器および第2イヤセット機器のうちの少なくとも1つを利用した音楽鑑賞モードまたは電話通話モードを通訳モードに切り替えてよい。例えば、電子機器110は、ブルートゥース(登録商標)連結による音楽鑑賞モードにおいて、音楽鑑賞モードを通訳モードに変更しながら、音楽再生のためのA2DP(Advanced Audio Distribution Profile)を、ユーザの音声の入力を受けるためにHFP(Hands Free profile)に変更してよい。また、電子機器110は、電話通話モードにおいて、電話通話を終了させた後に通訳モードに切り替えてもよいが、電話通話をしばらく待機状態に変更した後に通訳モードに切り替えてもよい。
【0060】
このような段階910は、
図7を参照しながら説明した段階710または段階720が実行された後に実行されてよい。例えば、受信したアプリケーション実行信号に基づいて音楽鑑賞モードまたは電話通話モードを通訳モードに切り替える場合、段階910は、段階710の後に実行されてよい。他の例として、実行されるアプリケーションで入力される通訳モード開始信号に基づいて音楽鑑賞モードまたは電話通話モードを通訳モードに切り替える場合、段階910は、段階720の後に実行されてよい。段階910が実行された後に段階730が実行され、一例として、
図8のように通訳機能が提供されてよい。
【0061】
段階920で、電子機器110は、第1イヤセット機器と第2イヤセット機器を含むイヤセットペアのうちのいずれか1つのイヤセット機器で発生するアプリケーション終了信号またはアプリケーションで入力される通訳モード終了信号に基づいて、通訳モードを再び音楽鑑賞モードまたは電話通話モードに切り替えてよい。この場合、ユーザは、再び音楽鑑賞や電話通話を続けることができるようになる。
【0062】
図10は、本発明の一実施形態における、電話通話中に通訳機能を提供する例を示したフローチャートである。
【0063】
段階1010で、電子機器110は、受信したアプリケーション実行信号または実行されるアプリケーションで入力される通訳モード開始信号に基づいて、第1イヤセット機器および第2イヤセット機器のうちの少なくとも1つを利用して実行中の電話通話モードを通訳モードに切り替えてよい。
図9の段階910と同じように、段階1010は、
図7を参照しながら説明した段階710または段階720が実行された後に実行されてよい。
【0064】
段階1020で、電子機器110は、第1イヤセット機器および第2イヤセット機器のうちの少なくとも1つを通じて入力された第1言語の音声を受信してそれを、通訳機能を利用して第2言語の音声に変換してよい。このような段階1020は、
図7の段階730に含まれて実行されてよい。
【0065】
段階1030で、電子機器110は、第1イヤセット機器または第2イヤセット機器で発生するアプリケーション終了信号またはアプリケーションで入力された通訳モード終了信号に基づいて、通訳モードをまた電話通話モードに切り替えてよい。変換された第2言語の音声は、第1イヤセット機器および第2イヤセット機器のうちの少なくとも1つに先に伝達されてユーザに確認されてもよい。また、変換された第2言語の音声は、メモリ511などに一時格納されてよい。
【0066】
段階1040で、電子機器110は、変換された第2言語の音声を、電話通話モードを通じて電話通話の相手に提供してよい。例えば、メモリ511に一時格納された第2言語の音声が、電話通話モードを通じて電話通話の相手に送信されてよい。より具体的な例として、第1言語を使用する第1ユーザが第2言語を使用する第2ユーザと電話通話中である場合、第1ユーザが通訳機能を利用して第2言語に通訳された音声を第2ユーザに提供することができるようになる。このとき、電話通話は、画像通話を含んでもよい。
【0067】
図11は、本発明の一実施形態における、イヤセット機器の通訳機能提供方法の例を示したフローチャートである。
【0068】
段階1110で、第1イヤセット機器120は、第1イヤセット機器120に入力された第1言語の音声が電子機器110で実行されるアプリケーションの通訳機能によって第2言語の音声に変換されて第1イヤセット機器120とイヤセットペアをなす第2イヤセット機器130に提供されるように、第1言語の音声を電子機器110に送信してよい。上述したように、電子機器110は、受信した第1言語の音声を、実行されるアプリケーションの通訳機能によって第2言語の音声に変換して第2イヤセット機器130に提供してよく、第2イヤセット機器130は、変換された第2言語の音声を出力することにより、第2イヤセット機器130を着用した第2ユーザが第1イヤセット機器120を着用した第1ユーザの第1言語に対する通訳機能の提供を受けることができるようになる。
【0069】
段階1120で、第1イヤセット機器120は、第2イヤセット機器130に入力されて電子機器110で受信された第2言語の音声を、電子機器110が実行されるアプリケーションの通訳機能によって第1言語の音声に変換することに応答し、電子機器110から変換された第1言語の音声を受信してよい。上述したように、電子機器110は、第2イヤセット機器130から受信した第2言語の音声を第1言語の音声に変換して第1イヤセット機器120に提供してよい。
【0070】
段階1130で、第1イヤセット機器120は、受信した第1言語の音声を出力してよい。したがって、第1イヤセット機器120の第1ユーザは、第2ユーザの第2言語に対する通訳機能の提供を受けることができるようになる。
【0071】
上述したように、第1イヤセット機器120は、イヤセットペアの2つのイヤセット機器のうちのいずれか1つに対応してよい。したがって、
図11の実施形態では、多者間通訳モードにおける第1イヤセット機器120の動作のみを説明したが、上述した内容に基づいて、セルフ通訳モードにおける第1イヤセット機器120の動作や第2イヤセット機器130の動作についても、当業者であれば容易に理解することができるであろう。
【0072】
また、上述した実施形態では、2つのイヤセット機器がイヤセットペアをなす場合の実施形態のみを説明したが、3つ以上のイヤセット機器が電子機器110と直接的あるいは間接的に連結して多者間通訳モードが実行可能であることも、当業者であれば上述した内容を参照することで容易に理解することができるであろう。例えば、イヤセット機器1の第1言語の音声が第2言語と第3言語の音声にそれぞれ通訳されてイヤセット機器2とイヤセット機器3それぞれに伝達されることも可能である。また、イヤセット機器2の第2言語の音声が第1言語と第3言語の音声にそれぞれ通訳されてイヤセット機器1とイヤセット機器3それぞれに伝達されたり、イヤセット機器3の第3言語の音声が第1言語と第2言語の音声にそれぞれ通訳されてイヤセット機器1とイヤセット機器2それぞれに伝達されたりすることも可能である。通信の例として、電子機器110は、イヤセット機器1およびイヤセット機器2と直接通信し、イヤセット機器1やイヤセット機器2を経てイヤセット機器3と間接通信してよい。
【0073】
上述した実施形態では、第1言語の音声を第2言語の音声に変換しているが、本発明はこの例に限定されない。例えば、第1言語の音声を第2言語の文字に変換して出力してもよいし、逆に、第1言語の文字を第2言語の音声に変換して出力してもよい。文字と音声の双方が出力されても良い。
【0074】
例えば、第1のイヤセット及び第2のイヤセットを利用してユーザに通訳機能を提供することにおいて、第1のイヤセットを介して入力される第1の言語の音声は自動的に第2の言語の文字に変換されて電子機器のディスプレイを介して表示され、第2のイヤセットを介して入力される第2の言語の音声は自動的に第1の言語の文字に変換されて電子機器のディスプレイを介して表示されることができる。この時、第1のイヤセットの第1ユーザと第2のイヤセットの第2のユーザは電子機器を介して表示される第2の言語の文字と第1の言語の文字を一緒に見ながら通訳機能の提供をもらうことができる。
【0075】
このように本実施形態によると、イヤセットを利用して通訳機能を提供することができ、第1イヤセット機器と第2イヤセット機器を含むイヤセットペアを利用して互いに異なる言語を利用する2人のユーザ間の通訳機能を提供することができる。また、通訳機能により、第1言語から第2言語に通訳された音声を電話通話の相手に提供することができる。
【0076】
なお、
【0077】
上述した装置は、ハードウェア構成要素、ソフトウェア構成要素、および/またはハードウェア構成要素とソフトウェア構成要素との組み合わせによって実現されてよい。例えば、実施形態で説明された装置および構成要素は、例えば、プロセッサ、コントローラ、ALU(arithmetic logic unit)、デジタル信号プロセッサ、マイクロコンピュータ、FPGA(field programmable gate array)、PLU(programmable logic unit)、マイクロプロセッサ、または命令を実行して応答することができる様々な装置のように、1つ以上の汎用コンピュータまたは特殊目的コンピュータを利用して実現されてよい。処理装置は、オペレーティングシステム(OS)および前記OS上で実行される1つ以上のソフトウェアアプリケーションを実行してよい。また、処理装置は、ソフトウェアの実行に応答し、データにアクセスし、データを格納、操作、処理、および生成してもよい。理解の便宜のために、1つの処理装置が使用されるとして説明される場合もあるが、当業者は、処理装置が複数個の処理要素および/または複数種類の処理要素を含んでもよいことが理解できるであろう。例えば、処理装置は、複数個のプロセッサまたは1つのプロセッサおよび1つのコントローラを含んでよい。また、並列プロセッサのような、他の処理構成も可能である。
【0078】
ソフトウェアは、コンピュータプログラム、コード、命令、またはこれらのうちの1つ以上の組み合わせを含んでもよく、思うままに動作するように処理装置を構成したり、独立的または集合的に処理装置に命令したりしてよい。ソフトウェアおよび/またはデータは、処理装置に基づいて解釈されたり、処理装置に命令またはデータを提供したりするために、いかなる種類の機械、コンポーネント、物理装置、コンピュータ格納媒体または装置に具現化されてよい。ソフトウェアは、ネットワークに接続したコンピュータシステム上に分散され、分散された状態で格納されても実行されてもよい。ソフトウェアおよびデータは、1つ以上のコンピュータで読み取り可能な記録媒体に格納されてよい。
【0079】
実施形態に係る方法は、多様なコンピュータ手段によって実行可能なプログラム命令の形態で実現されてコンピュータで読み取り可能な媒体に記録されてもよい。前記コンピュータで読み取り可能な媒体は、プログラム命令、データファイル、データ構造などを単独でまたは組み合わせて含んでもよい。前記媒体に記録されるプログラム命令は、実施形態のために特別に設計されて構成されたものであってもよいし、コンピュータソフトウェア当業者に公知な使用可能なものであってもよい。コンピュータで読み取り可能な記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク、および磁気テープのような磁気媒体、CD-ROM、DVDのような光媒体、フロプティカルディスク(floptical disk)のような光磁気媒体、およびROM、RAM、フラッシュメモリなどのようなプログラム命令を格納して実行するように特別に構成されたハードウェア装置が含まれる。プログラム命令の例は、コンパイラによって生成されるもののような機械語コードだけではなく、インタプリタなどを使用してコンピュータによって実行される高級言語コードを含む。上述したハードウェア装置は、実施形態の動作を実行するために1つ以上のソフトウェアモジュールとして動作するように構成されてもよく、その逆も同じである。
【0080】
以上のように、実施形態を、限定された実施形態と図面に基づいて説明したが、当業者であれば、上述した記載から多様な修正および変形が可能であろう。例えば、説明された技術が、説明された方法とは異なる順序で実行されたり、かつ/あるいは、説明されたシステム、構造、装置、回路などの構成要素が、説明された方法とは異なる形態で結合されたりまたは組み合わされたり、他の構成要素または均等物によって対置されたり置換されたとしても、適切な結果を達成することができる。
【0081】
したがって、異なる実施形態であっても、特許請求の範囲と均等なものであれば、添付される特許請求の範囲に属する。
【0082】
以下、本願により教示される手段を例示的に列挙する。
(付記1)
電子機器の通訳機能提供方法であって、
第1イヤセット機器または第2イヤセット機器で発生するアプリケーション実行信号を受信する段階、
前記受信したアプリケーション実行信号に対応するアプリケーションを実行させる段階、および
前記実行するアプリケーションの制御にしたがい、前記第1イヤセット機器および前記第2イヤセット機器のうちの少なくとも1つを通じて入力され前記電子機器が受信した音声に対する他の言語への通訳機能を提供する段階
を含む、通訳機能提供方法。
(付記2)
前記通訳機能を提供する段階は、
前記第1イヤセット機器を通じて入力され前記電子機器が受信した第1言語の音声を第2言語の音声に変換して前記第2イヤセット機器に提供し、前記第2イヤセット機器を通じて入力され前記電子機器が受信した第2言語の音声を第1言語の音声に変換して前記第1イヤセット機器に提供する、付記1に記載の通訳機能提供方法。
(付記3)
前記電子機器は、前記第1イヤセット機器および前記第2イヤセット機器のうちのいずれか1つのイヤセット機器と直接通信し、前記直接通信するイヤセット機器と残り1つのイヤセット機器間の無線通信によって前記残り1つのイヤセット機器と間接通信する、付記1に記載の通訳機能提供方法。
(付記4)
前記電子機器は、前記第1イヤセット機器および前記第2イヤセット機器の両方と同時に直接通信する、付記1に記載の通訳機能提供方法。
(付記5)
前記受信したアプリケーション実行信号または前記実行するアプリケーションで入力される通訳モード開始信号に基づいて、前記第1イヤセット機器および前記第2イヤセット機器のうちの少なくとも1つを利用した音楽鑑賞モードまたは電話通話モードを通訳モードに切り替える段階、および
前記第1イヤセット機器と第2イヤセット機器を含むイヤセットペアのうちいずれか1つのイヤセット機器で発生するアプリケーション終了信号または前記アプリケーションで入力される通訳モード終了信号に基づいて、前記通訳モードを前記音楽鑑賞モードまたは電話通話モードに切り替える段階
をさらに含む、付記1に記載の通訳機能提供方法。
(付記6)
前記受信したアプリケーション実行信号または前記実行するアプリケーションで入力される通訳モード開始信号に基づいて、前記第1イヤセット機器および前記第2イヤセット機器のうちの少なくとも1つを利用して実行中の電話通話モードを通訳モードに切り替える段階、
前記第1イヤセット機器および前記第2イヤセット機器のうちの少なくとも1つを通じて入力され前記電子機器が受信した第1言語の音声を、前記通訳機能を利用して第2言語の音声に変換する段階、
前記第1イヤセット機器または第2イヤセット機器で発生するアプリケーション終了信号または前記アプリケーションで入力された通訳モード終了信号に基づいて、前記通訳モードを前記電話通話モードに切り替える段階、および
前記変換された第2言語の音声を、前記電話通話モードを通じて電話通話の相手に提供する段階
をさらに含む、付記1に記載の通訳機能提供方法。
(付記7)
前記第1イヤセット機器および前記第2イヤセット機器は、左耳と右耳のためのイヤセットペアを構成する、付記1に記載の通訳機能提供方法。
(付記8)
前記アプリケーション実行信号は、前記第1イヤセット機器および前記第2イヤセット機器のうちの少なくとも1つが含む物理的なボタンによる入力、または前記第1イヤセット機器および前記第2イヤセット機器のうちの少なくとも1つが含むセンサの出力値によって発生する、付記1に記載の通訳機能提供方法。
(付記9)
前記通訳機能を提供する段階は、
前記第1イヤセット機器を通じて入力され前記電子機器が受信した音声の第1言語と前記第2イヤセット機器を通じて入力され前記電子機器が受信した音声の第2言語を感知する段階、
感知された第1言語の音声を感知された第2言語の音声に変換し、感知された第2言語の音声を感知された第1言語の音声に変換する段階、および
前記変換された第2言語の音声を前記第2イヤセット機器に提供し、前記変換された第1言語の音声を前記第1イヤセット機器に提供する段階
を含む、付記1に記載の通訳機能提供方法。
(付記10)
前記通訳機能を提供する段階は、
前記第1イヤセット機器を通じて入力され前記電子機器が受信した音声を、前記アプリケーションで前記第2イヤセット機器に対して設定された第2言語に変換し、前記第2イヤセット機器を通じて入力され前記電子機器が受信した音声を、前記アプリケーションで前記第1イヤセット機器に対して設定された第1言語に変換する段階、および
前記変換された第2言語の音声を前記第2イヤセット機器に提供し、変換された第1言語の音声を前記第1イヤセット機器に提供する段階
を含む、付記1に記載の通訳機能提供方法。
(付記11)
第1イヤセット機器の通訳機能提供方法であって、
前記第1イヤセット機器に入力された第1言語の音声が電子機器で実行されるアプリケーションの通訳機能によって第2言語の音声に変換され、前記第1イヤセット機器とイヤセットペアをなす第2イヤセット機器に提供されるように、前記第1言語の音声を前記電子機器に送信する段階、
前記第2イヤセット機器に入力されて前記電子機器で受信された第2言語の音声を、前記電子機器が前記実行されるアプリケーションの通訳機能によって第1言語の音声に変換することに応答し、前記電子機器から前記変換された第1言語の音声を受信する段階、および
前記受信した第1言語の音声を出力する段階
を含む、通訳機能提供方法。
(付記12)
前記第2イヤセット機器と前記電子機器間の通信を中継するか、または前記第2イヤセット機器の中継によって前記電子機器と通信する、付記11に記載の通訳機能提供方法。
(付記13)
前記第1イヤセット機器および前記第2イヤセット機器のうちの少なくとも1つが含む物理的なボタンによる入力、または前記第1イヤセット機器および前記第2イヤセット機器のうちの少なくとも1つが含むセンサの出力値によって発生し、前記電子機器に送信されるアプリケーション実行信号によって前記電子機器で前記アプリケーションが実行される、付記11に記載の通訳機能提供方法。
(付記14)
前記第1言語は、前記第1イヤセット機器に入力される音声の言語を前記実行されたアプリケーションを利用して感知した言語を含むか、または前記実行されたアプリケーションで前記第1イヤセット機器に対応して予め設定された言語を含み、
前記第2言語は、前記第2イヤセット機器に入力される音声の言語を前記実行されたアプリケーションを利用して感知した言語を含むか、または前記実行されたアプリケーションで前記第2イヤセット機器に対応して予め設定された言語を含む、付記11に記載の通訳機能提供方法。
(付記15)
コンピュータと結合して付記1~14のうちのいずれか一項に記載の方法をコンピュータに実行させるためにコンピュータで読み取り可能な記録媒体に格納された、コンピュータプログラム。
(付記16)
付記1~14のうちのいずれか一項に記載の方法をコンピュータに実行させるためのプログラムが記録されている、コンピュータで読み取り可能な記録媒体。
(付記17)
第1イヤセット機器であって、
音の入力を受けるための音信号入力部、
音を出力するための音信号出力部、
電子機器または前記第1イヤセット機器とイヤセットペアをなす第2イヤセット機器と通信するための通信部、および
前記音信号入力部、前記音信号出力部、および前記通信部を制御する制御部
を備え、
前記制御部は、
前記音信号入力部に入力される第1言語の音声が前記電子機器で実行されるアプリケーションの通訳機能によって第2言語の音声に変換され、前記第1イヤセット機器とイヤセットペアをなす第2イヤセット機器に提供されるように、前記第1言語の音声を前記電子機器に送信するように前記通信部を制御し、
前記第2イヤセット機器に入力されて前記電子機器で受信された第2言語の音声を、前記電子機器が前記実行されたアプリケーションの通訳機能によって第1言語の音声に変換することに応答し、前記電子機器から前記変換された第1言語の音声を受信するように前記通信部を制御し、
前記受信した第1言語の音声を出力するように前記音信号出力部を制御する、第1イヤセット機器。
(付記18)
前記制御部は、
前記第2イヤセット機器と前記電子機器間の通信を中継するように前記通信部を制御するか、または前記第2イヤセット機器の中継によって前記電子機器と通信するように前記通信部を制御する、付記17に記載の第1イヤセット機器。
(付記19)
前記第1イヤセット機器および前記第2イヤセット機器のうちの少なくとも1つが含む物理的なボタンによる入力、または前記第1イヤセット機器および前記第2イヤセット機器のうちの少なくとも1つが含むセンサの出力値によって発生して前記電子機器に送信されるアプリケーション実行信号によって前記電子機器で前記アプリケーションが実行される、付記17に記載の第1イヤセット機器。
(付記20)
前記第1言語は、前記第1イヤセット機器に入力される音声の言語を前記実行されたアプリケーションを利用して感知した言語を含むか、または前記実行されたアプリケーションで前記第1イヤセット機器に対応して予め設定された言語を含み、
前記第2言語は、前記第2イヤセット機器に入力される音声の言語を前記実行されたアプリケーションを利用して感知した言語を含むか、または前記実行されたアプリケーションで前記第2イヤセット機器に対応して予め設定された言語を含む、付記17に記載の第1イヤセット機器。
【符号の説明】
【0083】
110:電子機器
120:第1イヤセット機器
130:第2イヤセット機器