(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-08-13
(45)【発行日】2024-08-21
(54)【発明の名称】着信音声通信要求の通知のインテリジェントなルーティングのためのシステムおよび方法
(51)【国際特許分類】
H04M 1/00 20060101AFI20240814BHJP
G06F 3/16 20060101ALI20240814BHJP
G16Y 10/75 20200101ALI20240814BHJP
G16Y 40/10 20200101ALI20240814BHJP
【FI】
H04M1/00 V
G06F3/16 650
G16Y10/75
G16Y40/10
【外国語出願】
(21)【出願番号】P 2021021664
(22)【出願日】2021-02-15
(62)【分割の表示】P 2020502454の分割
【原出願日】2018-05-23
【審査請求日】2021-03-15
【審判番号】
【審判請求日】2022-10-26
(32)【優先日】2017-07-21
(33)【優先権主張国・地域又は機関】US
【早期審査対象出願】
(73)【特許権者】
【識別番号】595020643
【氏名又は名称】クゥアルコム・インコーポレイテッド
【氏名又は名称原語表記】QUALCOMM INCORPORATED
(74)【代理人】
【識別番号】110003708
【氏名又は名称】弁理士法人鈴榮特許綜合事務所
(74)【代理人】
【識別番号】100108855
【氏名又は名称】蔵田 昌俊
(74)【代理人】
【識別番号】100158805
【氏名又は名称】井関 守三
(74)【代理人】
【識別番号】100112807
【氏名又は名称】岡田 貴志
(72)【発明者】
【氏名】スラバン・クマー・レッディ、アチャモラ
(72)【発明者】
【氏名】キラン、コーナ
(72)【発明者】
【氏名】ラビ・テジャ、マンダビッリ
(72)【発明者】
【氏名】ベンカタ・スッバラオ、アンナム
(72)【発明者】
【氏名】テジャスリー、デパ
(72)【発明者】
【氏名】プラプッラ、バップ
(72)【発明者】
【氏名】ベンカタ・ナガ・ポールスワラ・ラオ、カルチュラ
【合議体】
【審判長】馬場 慎
【審判官】高野 洋
【審判官】衣鳩 文彦
(56)【参考文献】
【文献】特開2014-53692(JP,A)
【文献】特開2015-153379(JP,A)
【文献】米国特許出願公開第2015/0288745(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04M1/00
H04M1/24-1/82
H04M99/00
G06F3/16
(57)【特許請求の範囲】
【請求項1】
方法であって、
電子デバイスによって、着信音声通信要求のインジケーションを受信することと、
前記電子デバイスと通信することが可能な複数のデバイスを識別することと、前記複数のデバイスの各々は、1つまたは複数のオーディオ信号を取得することが可能なセンサを含み、
前記複数のデバイスにおいて、そのそれぞれのセンサを介してオーディオ信号を取得することと、
前記複数のデバイスによって取得された前記オーディオ信号から認識された人物を識別する情報を取得することと、
前記取得された前記認識された人物を識別する情報と優先度情報とに基づいて、前記複数のデバイスのうちの1つのデバイスを選択することと、前記優先度情報は、前記着信音声通信要求を通知するための前記オーディオ信号に関連付けられた複数の人物に対する優先度、およびどのデバイスが前記着信音声通信要求に回答するために使用されるべきかに関連する前記複数のデバイスに対する優先度を示し、
前記着信音声通信要求を示す通知を出力するために、前記選択されたデバイスに信号を提供することと、
を備え、
前記複数のデバイスのうちの1つのデバイスを選択することは、
どの人物がどのデバイスによって認識されたかに基づいて、前記認識された複数の人物のうち相対的に高い優先度をもつ人物が認識された2つ以上のデバイスを決定することと、
前記2つ以上のデバイスのうち、前記着信音声通信要求に回答するための相対的に高い優先度をもつ1つのデバイスを選択することと、
を備える、方法。
【請求項2】
方法であって、
電子デバイスによって、着信音声通信要求のインジケーションを受信することと、
前記電子デバイスと通信することが可能な複数のデバイスを識別することと、前記複数のデバイスの各々は、1つまたは複数のイメージを取得することが可能なセンサを含み、
前記複数のデバイスにおいて、そのそれぞれのセンサを介してイメージを取得することと、
前記複数のデバイスによって取得された前記イメージから認識された人物を識別する情報を取得することと、
前記取得された前記認識された人物を識別する情報と優先度情報とに基づき、前記複数のデバイスのうちの1つのデバイスを選択することと、前記優先度情報は、前記着信音声通信要求を通知するための前記イメージに関連付けられた複数の人物に対する優先度、およびどのデバイスが前記着信音声通信要求に回答するために使用されるべきかに関連する前記複数のデバイスに対する優先度を示し、
前記着信音声通信要求を示す通知を出力するために、前記
選択されたデバイスに信号を提供することと、
を備え、
前記複数のデバイスのうちの1つのデバイスを選択することは、
どの人物がどのデバイスによって認識されたかに基づいて、前記認識された複数の人物のうち相対的に高い優先度をもつ人物が認識された2つ以上のデバイスを決定することと、
前記2つ以上のデバイスのうち、前記着信音声通信要求に回答するための相対的に高い優先度をもつ1つのデバイスを選択することと、
を備える、方法。
【請求項3】
電子デバイスであって、
ネットワークインターフェースと、
メモリと、
前記ネットワークインターフェースおよび前記メモリと通信するプロセッサと、
を備え、前記プロセッサは、
着信音声通信要求のインジケーションを受信することと、
前記電子デバイスと通信することが可能な複数のデバイスを識別することと、前記複数のデバイスの各々は、1つまたは複数のオーディオ信号を取得することが可能なセンサを含み、
そのそれぞれのセンサを介してオーディオ信号を取得するよう前記複数のデバイスのうちの少なくとも1つに要求することと、
前記複数のデバイスによって取得された前記オーディオ信号から認識された人物を識別する情報を取得することと、
前記取得された前記認識された人物を識別する情報と優先度情報とに基づいて、前記複数のデバイスのうちの1つのデバイスを選択することと、前記優先度情報は、
前記着信音声通信要求を通知するための前記オーディオ信号に関連付けられ
た複数の人物に対する優先度、およびどのデバイスが前記着信音声通信要求に回答するために使用されるべきかに関連する前記複数のデバイスに対する優先度を示し、
前記着信音声通信要求を示す通知を出力するために、前記選択されたデバイスに信号を提供することと、
を行わせるように構成され、
前記複数のデバイスのうちの1つのデバイスを選択することは、
どの人物がどのデバイスによって認識されたかに基づいて、前記認識された複数の人物のうち相対的に高い優先度をもつ人物が認識された2つ以上のデバイスを決定することと、
前記2つ以上のデバイスのうち、前記着信音声通信要求に回答するための相対的に高い優先度をもつ1つのデバイスを選択することと、
を備える、電子デバイス。
【請求項4】
電子デバイスであって、
ネットワークインターフェースと、
メモリと、
前記ネットワークインターフェースおよび前記メモリと通信するプロセッサと、
を備え、前記プロセッサは、
着信音声通信要求のインジケーションを受信することと、
前記電子デバイスと通信することが可能な複数のデバイスを識別することと、前記複数のデバイスの各々は、1つまたは複数のイメージを取得することが可能なセンサを含み、
そのそれぞれのセンサを介してイメージを取得するよう前記複数のデバイスのうちの少なくとも1つに要求することと、
前記複数のデバイスによって取得された前記イメージから認識された人物を識別する情報を取得することと、
前記取得された前記認識された人物を識別する情報と優先度情報とに基づき、前記複数のデバイスのうちの1つのデバイスを選択することと、前記優先度情報は、前記着信音声通信要求を通知するための前記イメージに関連付けられた複数の人物に対する優先度、およびどのデバイスが前記着信音声通信要求に回答するために使用されるべきかに関連する前記複数のデバイスに対する優先度を示し、
前記着信音声通信要求を示す通知を出力するために、前記
選択されたデバイスに信号を提供することと、
を行わせるように構成され、
前記複数のデバイスのうちの1つのデバイスを選択することは、
どの人物がどのデバイスによって認識されたかに基づいて、前記認識された複数の人物のうち相対的に高い優先度をもつ人物が認識された2つ以上のデバイスを決定することと、
前記2つ以上のデバイスのうち、前記着信音声通信要求に回答するための相対的に高い優先度をもつ1つのデバイスを選択することと、
を備える、電子デバイス。
【発明の詳細な説明】
【技術分野】
【0001】
[0001] 本開示は、電子デバイスを使用する音声およびビデオ通信に関し、より具体的には、着信音声通信要求(incoming voice communication request)の通知のインテリジェントなルーティングのためのシステムおよび方法に関する。
【背景技術】
【0002】
[0002] ユーザがより多くのモノのインターネット(「IOT」:Internet-of-Things)デバイスを入手し始めるにつれて、それらうちのいくつかは、ユーザがオーディオまたはビデオ通信に従事することを可能にする機能を含むこととなり得る。例えば、ユーザは、そのユーザのスマートフォンまたは自宅電話にIOTデバイスを接続し、接続されたIOTデバイスを介して通信することによって、従来のセルラまたはワイヤードフォンコールに従事し得る。複数のIOTデバイスがそのような通信を提供するのに適したシナリオでは、着信フォンコールがユーザのスマートフォンで検出されたとき、例えばそのスマートフォンがこれらのIOTデバイスに着信コールを各々通知し、それにより、着信コールをユーザに通知するためにそれらに呼び出し(ring)を行わせることができる。
【発明の概要】
【0003】
[0003] 本開示のシステム、方法、およびデバイスは各々、いくつかの革新的な様態を有し、これらのうちの何れも、本明細書に開示される所望の属性を単独で担うものではない。
【0004】
[0004] 着信音声通信要求の通知のインテリジェントなルーティングのためのシステムおよび方法に関する様々な例が説明される。本開示で説明される主題の1つの発展的な態様は、電子デバイスによって、着信音声通信要求のインジケーションを受信することと、インジケーションに応答して、および通知を出力するようデバイスに要求する前に、電子デバイスに接続された1つまたは複数のデバイスを識別することと、1つまたは複数のデバイスの各々は、オーディオ入力デバイスおよびオーディオ出力デバイスを含み、そのそれぞれのオーディオ入力デバイスを使用してオーディオ信号を検出するよう各識別されたデバイスに要求することと、第1のオーディオ信号に基づいて音声を受信することと、第1のオーディオ信号は、1つまたは複数のデバイスのうちの1つによって受信され、音声に基づいて1つまたは複数のデバイスのうちの第1のデバイスを選択することと、着信音声通信要求を示す通知を出力するために、第1のデバイスに信号を提供することと、を含む方法において実装され得る。
【0005】
[0005] 本開示で説明される主題の別の革新的な態様は、プロセッサに、着信音声通信要求のインジケーションを受信することと、インジケーションに応答して、および通知を出力するようデバイスに要求する前に、電子デバイスに接続された1つまたは複数のデバイスを識別することと、1つまたは複数のデバイスの各々は、オーディオ入力デバイスおよびオーディオ出力デバイスを含み、そのそれぞれのオーディオ入力デバイスを使用してオーディオ信号を検出するよう各識別されたデバイスに要求することと、第1のオーディオ信号に基づいて音声を受信することと、第1のオーディオ信号は、1つまたは複数のデバイスのうちの1つによって受信され、音声に基づいて1つまたは複数のデバイスのうちの第1のデバイスを選択することと、着信音声通信要求を示す通知を出力するために、第1のデバイスに信号を提供することと、を行わせるように構成されたプロセッサ実行可能なプログラムコード含む、非一時的コンピュータ可読媒体において実装され得る。
【0006】
[0006] 本開示で説明される主題の別の革新的な態様は、マイクフォン、スピーカ、ネットワークインターフェース、非一時的コンピュータ可読媒体、およびプロセッサを含むデバイスと、マイクロフォン、スピーカ、ネットワークインターフェース、および非一時的コンピュータ可読媒体と通信状態であり、かつプロセッサに、ネットワークインターフェースを介して着信音声通信要求のインジケーションを受信することと、インジケーションに応答して、および通知を出力するようデバイスに要求する前に、電子デバイスに接続された1つまたは複数のデバイスを識別することと、1つまたは複数のデバイスの各々は、オーディオ入力デバイスおよびオーディオ出力デバイスを含み、そのそれぞれのオーディオ入力デバイスを使用してオーディオ信号を検出するよう各識別されたデバイスに要求することと、第1のオーディオ信号に基づいて音声を受信することと、第1のオーディオ信号は、1つまたは複数のデバイスのうちの1つによって受信され、音声に基づいて1つまたは複数のデバイスのうちの第1のデバイスを選択することと、着信音声通信要求を示す通知を出力するために、第1のデバイスに信号を提供することと、を行わせるように構成される、非一時的コンピュータ可読媒体に記憶されたプロセッサ実行可能なプログラムコードを実行するように構成されたプロセッサと、において実装され得る。
【0007】
[0007] 本開示で説明される主題の別の革新的な態様は、着信音声通信要求のインジケーションを受信するための手段と、インジケーションに応答して、および通知を出力するようデバイスに要求する前に、装置に接続される1つまたは複数のデバイスを識別するための手段と、1つまたは複数のデバイスの各々は、オーディオ入力デバイスおよびオーディオ出力デバイスを含み、インジケーションに応答して、および通知を出力することなしに、そのそれぞれのオーディオ入力デバイスを使用してオーディオ信号を検出するよう各識別されたデバイスに要求するための手段と、第1のオーディオ信号に基づいて音声を受信するための手段と、第1のオーディオ信号は、1つまたは複数のデバイスのうちの1つによって受信され、音声に基づいて1つまたは複数のデバイスのうちの第1のデバイスを選択するための手段と、着信音声通信要求を示す通知を出力するために、第1のデバイスに信号を提供するための手段と、を含む態様において実装され得る。
【0008】
[0008] 本開示で説明される主題の1つまたは複数の実装の詳細が、添付の図面および以下の説明に記載されている。他の特徴、様態、および利点が、説明、図面、および特許請求の範囲から明らかになるだろう。以下の図面の相対的な寸法は、原寸通りに描かれていない可能性があることに留意されたい。
【図面の簡単な説明】
【0009】
【
図1】[0009]
図1は、着信音声通信要求の通知のインテリジェントなルーティングに適した例示的な環境のレイアウトを示す。
【
図2】[0010]
図2は、着信音声通信要求の通知のインテリジェントなルーティングのための例示的なシステムを示す。
【
図3】[0011]
図3は、着信音声通信要求からの通知のインテリジェントなルーティングのための例示的なコンピューティングデバイスを示す。
【
図4】
図4は、着信音声通信要求からの通知のインテリジェントなルーティングのための例示的なコンピューティングデバイスを示す。
【
図5】[0012]
図5は、着信音声通信要求の通知のインテリジェントなルーティングのための例示的なシステムを示す。
【
図6】[0013]
図6は、着信音声通信要求の通知のインテリジェントなルーティングのための例示的な方法を示す。
【
図7】
図7は、着信音声通信要求の通知のインテリジェントなルーティングのための例示的な方法を示す。
【0010】
[0014] 様々な図面における同様の参照番号および名称は、同様の要素を示す。
【詳細な説明】
【0011】
[0015] 下記の説明は、本開示の革新的な態様を説明することを目的として、ある特定の実装を対象としている。しかしながら、当業者は、本明細書における教示が多数の異なる方法で適用される得ることを容易に認識するだろう。説明される実装は、IEEE16.11規格のうちの任意のもの、またはIEEE802.11規格のうちの任意のもの、Bluetooth(登録商標)規格、符号分割多元接続(CDMA)、周波数分割多元接続(FDMA)、時分割多元接続(TDMA)、モバイル通信のためのグローバルシステム(GSM(登録商標))、GSM/汎用パケット無線サービス(GPRS)、拡張型データGSM環境(EDGE)、地上基盤無線(TETRA)、ワイドバンドCDMA(W-CDMA(登録商標))、エボリューションデータオプティマイズド(EV-DO)、1xEV-DO、EV-DO Rev A、EV-DO Rev B、高速パケットアクセス(HSPA)、高速ダウンリンクパケットアクセス(HSDPA)、高速アップリンクパケットアクセス(HSUPA)、発展型高速パケットアクセス(HSPA+)、ロングタームエボリューション(LTE(登録商標))、AMPSによるRF信号、あるいは、3G、4G、または5G、またはそれらのさらなる実装の技術を利用するシステムのような、ワイヤレス、セルラまたはモノのインターネット(IOT)ネットワーク内で通信するために使用される他の知られている信号を送信および受信することが可能な任意のデバイス、システムまたはネットワークにおいて実装され得る。
【0012】
[0016] 本開示は、電子デバイスに着信音声またはビデオ通信要求(すなわち「コール」)の通知をルーティングするための技法を説明する。ユーザは、別のデバイスから音声または音声コールを受信することができる、スマートフォンまたはラップトップコンピュータなどの通信デバイスを有し得る。このようなコールが受信されると、通信デバイス自体が呼び出し音またはバイブレーションなどの通知を出力し得るか、あるいは別のデバイスがその通知を出力することを要求し得る。この通知は、通信デバイス自体を探すというよりも、ユーザの注意をそのデバイスに向けるために使用され得、ユーザは次いで着信コールに応答し、かつ参加するためにそれを使用する。
【0013】
[0017] 例えば、ユーザのスマートフォンは、着信コールにユーザが参加することを可能にし得る、ヘッドセットまたはタブレットなどの複数の異なるデバイスに接続されている可能性がある。しかし、これらの接続デバイス並びにスマートフォン自体の各々から通知を出力するのではなく、スマートフォンは代わりに、その通知を出力するために1つのデバイスのみを決定しようと試み得る。そうするために、スマートフォンは、接続デバイス(スマートフォンを含む)の各々がマイクロフォンを起動し、かつユーザの音声を聞き取るのを開始することを要求し得る。接続デバイス(またはスマートフォン自体)のうちの1つの付近にユーザの音声があると認識された場合、スマートフォンは、そのデバイスのみが通知を出力すること要求し得る。代替的に、スマートフォンは、イメージをキャプチャするためにカメラを各々起動するよう接続デバイスに要求して、ユーザを光学的に位置特定(locate)しようと試みる。スマートフォンは次いで、キャプチャされたイメージのうちの任意のものにユーザが識別されるかどうかを決定し得、識別された場合、対応するデバイスが通知を出力することを要求する。いくつかの例では、通信デバイスはまた、接続デバイスの各々から、各々の検出された人物までの距離を検出し得、それにより、通知を出力するデバイスを選択するためのさらなるメトリックを提供する。さらに、いくつかの例では、通信デバイスは、異なる人物の音声または顔を区別することができ、かつ、最重要検出人物(most important detected person)に近接するデバイスを使用して通知を出力するために、その検出された人物を優先し得る。
【0014】
[0018] 本開示で説明される主題の特定の実装は、下記の潜在的な利点のうちの1つまたは複数を実現するように実装され得る。着信コール通知を出力するために1つのデバイスのみを選択することによって、ユーザのスマートフォンは、その全てが同じ着信コールをユーザに通知しようと試みる同時の複数のデバイスからの通知を、ユーザに殺到しないようにし得る。さらに、1つのデバイスを使用する通知のみを出力することによって、本開示によるシステムは、同じロケーションにいる他人に迷惑をかけることを回避することができる。加えて、オーディオまたはビデオセンサを使用してユーザを位置特定しようと試みることによって、通信デバイスは、通知が出力されたときにユーザの注意を引きそうなデバイスを選択し得る。加えて、1つのデバイスを使用する通知のみを出力することによって、他のデバイスによる不要な通知を出力するための余分な電力消費を回避することができる。
【0015】
[0019]
図1は、着信音声通信要求の通知のインテリジェントなルーティングに適した例示的な環境のレイアウトを示す。具体的には、
図1は、複数の部屋102~108を有するユーザの家100の例示的なレイアウトを示す。この例では、ユーザ101は、寝室にあるベッド140上にスマートフォン130を置いたままである。ユーザ101は現在、書斎102にある机120におり、タブレット132上でウェブを閲覧している。居間106には、スマートTV134(音声通信またはビデオ通信アプリケーションを実行するように構成されたテレビなど)およびIOTハブ136があり、それは、ショッピング機能、天気、および交通情報などの音声制御されたオンデマンドバーチャルアシスタント機能、音楽およびビデオ機能などを提供する。これらのデバイスの各々は、Bluetooth(BT)接続またはWiFiアクセスポイント(「AP」)162を使用するWiFi接続などを介して、スマートフォン130に接続されている。
【0016】
[0020] 着信コールがスマートフォン130で検出されたとき、それは、着信コール自体を処理すべきか、あるいは、コールを別の接続デバイス132~136にルーティングすべきかを決定する。そうするために、それは、接続デバイス132~136のいずれがオーディオまたはビデオ通信を処理することが可能かを決定する。例えば、適したデバイスは、スピーカ、マイクロフォン、カメラなどのようなイメージセンサを有し得る。この例では、ユーザのタブレット132、スマートTV134、およびIOTハブ136、並びにスマートフォン130自体の各々は、各々がマイクロフォンおよびスピーカを有しているので、音声コールを処理するためにユーザ101とインターフェースをとることができる。これらのデバイス130~136の各々に対して、スマートフォン130は、呼び出し通知(ring notification)を提供し得るが、これは、ユーザの家または職場の至る所で多数のデバイス130~136が鳴ることとなり、それはユーザ101や周囲の他の人々をいらだたせ得る。
【0017】
[0021] ユーザの家の至る所で同時に複数のデバイスが鳴るという、ユーザ101のこのいらだちまたは不便さを軽減するために、スマートフォン130は代わりに、利用可能な接続デバイス132~136のいずれがユーザ101の最も近くにあるかを決定しようと試み、かつそのデバイスのみに呼び出し通知を提供することを指示し得る。この例では、スマートフォン130は、接続デバイス132~136またはスマートフォン130自体のいずれも鳴らすことなく、かつコールに応答する前に、ユーザ101の最も近くにあるデバイスを識別する。そうするために、スマートフォン130は、スマートフォン130に接続されている全ての接続デバイス132~136を識別し、次いで、各々がそのマイクロフォンを起動するよう指令してユーザの音声を検出しようと試みる。スマートフォン130はまた、それ自体のマイクロフォンを起動してユーザのデバイスを検出しようと試み得る。デバイス130~136の各々は次いで、そのそれぞれのマイクロフォンを起動し、オーディオ信号を受信することを開始する。各デバイス130~136は次いで、それらの受信されたオーディオ信号自体において音声認識を行うか、または音声認識を行うために、受信したオーディオ信号をスマートフォン130に、または別のコンピューティングデバイスに転送する。デバイス130~136のうちの1つまたは複数はまた、それぞれのデバイスからユーザ101までの相対的な距離を決定するために使用され得る、信号対雑音比(「SNR」)、1つまたは複数の検出された音声の振幅などのような、取得したオーディオ信号についての他の情報を取得し得る。
【0018】
[0022] 受信したオーディオ信号に基づいてユーザの音声が認識された場合、接続デバイスまたはオーディオ信号を取得したデバイスがスマートフォン130によって識別される。スマートフォン130は、これらのデバイスのいずれが呼び出すのに最良であるかを決定する。この例におけるタブレット132などの1つの接続デバイスのみがユーザ101を認識した場合、そのデバイスが選択され得る。1より多くの接続デバイスがユーザ101を認識した場合、―例えば、ユーザ101が居間のスマートTV134およびIOTハブ136の近くにいた場合―スマートフォン130は、それぞれのオーディオ信号の強度、それぞれのオーディオ信号のSNRなどのような異なる要因に基づいて、それらのデバイス134~136のうちの1つを選択し得る。さらに、ユーザ101、ユーザの配偶者、ユーザの子供(複数を含む)などの1より多くのユーザが検出された場合、スマートフォン130は次いで、様々なユーザの優先度に基づいて、コールが向けられるべきユーザを選択し得る。
【0019】
[0023] 例えば、ユーザの子供のうちの1人とユーザ101とが検出された場合、スマートフォン130は、ユーザ101を検出したデバイス、またはユーザ101に最も近いデバイスを選択し得る。あるいは、ユーザの子供のうちの1人とユーザの配偶者とが検出されるが、ユーザ101ではない場合、配偶者を検出したデバイスが選択され得る。デバイス130~136のうちの1つを選択した後、スマートフォン130は、選択したデバイスに呼び出しを行うよう指令し、かつ他のデバイスにそれらのマイクロフォンを無効にするよう命令する。ユーザ101は次いで、フォンコールに応答するために、呼び出しデバイス(ringing device)とインタラクトし得る。
【0020】
[0024]
図2は、着信音声通信要求の通知のインテリジェントなルーティングの200ための例示的なシステムを示す。この例では、スマートフォン210は、セルラネットワークに接続され、セルラフォンコールを受信することが可能である。加えて、スマートフォン210は、ラップトップ220、BTヘッドセット230、およびスマートTV240などの複数の他のデバイスに接続される。この例では、他のデバイス220~240は、以前に確立されたペアリング、またはピア・ツー・ピア関係を介して、スマートフォン210に接続される。例えば、BTヘッドセット230は、BTプロトコルを介してスマートフォン210との成功裏のペアリング(successfully pairing)に基づいて、スマートフォン210に接続される。よって、いくつかの例では、接続デバイスは、ローカルエリアネットワークのような共通ネットワークに単に接続されたものというよりも、他のスマートフォン210との通信を確立したものであり得る。例えば、スマートフォン210およびラップトップ220が
図1に示されるワイヤレスAP162と各々接続され得るが、それらがメッセージまたはデータを交換するために互いに以前に通信を確立していない場合、それらは「接続」されない。
【0021】
[0025] 所定の時間に接続されていない可能性があるが、スマートフォン210に登録されておりかつ接続に利用可能な互いに以前に接続を確立しているデバイスは、予め定められたイベントの発生に応じて動的に接続され得ることに留意されたい。例えば、スマートフォン210およびラップトップ220は、スマートフォン210によって受信した電話コールのユーザインターフェース機能をラップトップ220が処理することを可能にするためなど、互いの接続を以前に確立している。このような処理では、ユーザがスマートフォン210によって処理されている電話コールに従事すること、あるいはラップトップのタッチスクリーンまたはキーボードを使用して番号をダイヤルすることができるように、スマートフォン210は、そのスピーカおよびマイクロフォンをラップトップ220が使用している間、セルラネットワークとのシグナリングおよび通信を処理する。しかしながら、アクティブなコールがない場合、ラップトップ220とスマートフォン210との間の接続は停止され、終了し得る。しかしながら、新規のコールがスマートフォン210によって検出された場合、スマートフォン210は、ラップトップ220への接続を確立しようと試み得る。このようなシナリオでは、代わりにラップトップ220が接続に適している。スマートフォン210は次いで、ユーザがラップトップ220を介して着信音声コールをとることができるように接続を再確立し得る。
【0022】
[0026] この例では、スマートフォン210は、他のデバイス220~240の各々に接続され、スマートフォン210に接続されているか、あるいは以前に接続されたまたは登録されたデバイスのリストまたは登録を維持する。このリストは各デバイスを識別し、デバイスの能力についての情報を含み得る。例えば、この例における接続デバイス220~240についてのリストは、以下のようなデータを含む:
【表1】
【0023】
[0027] 上記のリストの例では、それらのそれぞれの接続ステータスと同様に、デバイス220~240の各々が表現されている。加えて、デバイス250(図示せず)は、スマートフォン210によって既知であるが、現在利用可能ではない。例えば、電源がオフにされているか、または範囲外にあり、オーディオ入力および出力能力を有するが、ビデオ入力およびビデオ出力能力は有していない。
【0024】
[0028] スマートフォン210が、様々なデバイスとの接続を確立するために、複数の異なるワイヤレス技術を同時に利用し得ることを理解されたい。この例では、スマートフォン210は、WiFi接続を使用してラップトップ220とスマートTV240とに接続することができ、一方、BT接続を介してBTヘッドセット230に接続される。さらに他のタイプの通信プロトコルまたは技法は、WiFi、BT、BT低エネルギー(「BLE」)、Zigbee(登録商標)、IEEE802.15.4などを含む、様々な例で用いられ得る。任意のまたは全てのこれらの様々な技法は、独立してまたは同時に、様々な例に従って用いられ得る。
【0025】
[0029]
図3は、着信音声通信要求からの通知のインテリジェントなルーティングのための例示的なコンピューティングデバイス300を示す。例示的なコンピューティングデバイス300は、バス350を介して互いに通信状態にある、プロセッサ310、メモリ320、ディスプレイ、ユーザ入力デバイス340、マイクロフォン342、スピーカ344、およびカメラ346を含む。加えて、コンピューティングデバイス300は、3つのワイヤレストランシーバ312、322、332と、関連したアンテナ314、324、334を含む。プロセッサ310は、本開示による着信音声通信要求の通知のインテリジェントなルーティングの1つまたは複数の方法を実行するために、メモリ320に記憶されたプロセッサ実行可能なプログラムコードを実行するように構成される。
【0026】
[0030] この例では、コンピューティングデバイス300は、スマートフォンである。しかしながら、コンピューティングデバイスは、音声またはビデオ通信の他端を構成する遠隔のコンピューティングデバイスとの通信ネットワーク上で、オーディオまたはオーディオ/ビジュアル(「ビデオ」)を受信および処理するように構成され得る任意のコンピューティングデバイスであり得る。本開示による例示的なコンピューティングデバイスは、ラップトップコンピュータ、デスクトップコンピュータ、タブレット、ファブレット、衛星電話、セルラフォン、専用のビデオ会議用機器、IOTハブ、バーチャルアシスタントデバイス(Alexa(登録商標)、Home(登録商標)など)、ウェアラブルデバイス(スマートウォッチ、イヤホン、ヘッドフォン、Google Glass(登録商標)など)、車内エンターテインメントまたは通信システム、ホームセキュリティシステム、または通信ネットワークおよび適切な入力および出力デバイスへのインターフェースを有する任意のデバイスであり得る。音声通信または音声コールへの言及はビデオ通信を含むが、一方、音声のみの通信または音声のみのコールへの言及はこのようなビデオ通信を除くことを理解されたい。
【0027】
[0031] このような例では、スマートフォン300がワイヤレストランシーバ312を備え、上述されるように、任意の適切な通信技術を使用して、アンテナ314がセルラネットワークと通信するように構成される。
【0028】
[0032] この例では、スマートフォン300は、セルラネットワークに接続された遠隔デバイスからの着信音声通信要求を受信し得る。遠隔デバイスがセルラフォンコールを開始した後、スマートフォン300は、着信フォンコールのインジケーションをセルラネットワークから受信し得る。いくつかの例では、着信音声通信要求は、ビデオ会議要求(FaceTime(登録商標)、Skype(登録商標)、Hangouts(登録商標)など)、ウォーキートーキー要求(Sprint/Nextel Direct Connectプロトコルなどのような)、衛星フォンコールなどのようなオーディオまたはビデオ通信の別の形態であり得る。このような音声またはビデオ通信要求は、任意の適切なネットワークを介して受信され得る。例えば、音声通信要求は、ローカルエリアネットワーク(「LAN」)、インターネットなどのワイドエリアネットワーク(「WAN」)、メトロポリタンエリアネットワーク(「MAN」)、ポイント・ツー・ポイントまたはピア・ツー・ピア接続などから受信され得る。コンピューティングデバイス間の通信は、任意の適切なネットワーキングプロトコルを使用して達成され得る。例えば、1つの適切なネットワーキングプロトコルは、インターネット・プロトコル(「IP」)、転送制御プロトコル(「TCP」)、ユーザデータグラムプロトコル(「UDP」)、あるいはTCP/IPまたはUDP/IPなどのそれらの組み合わせを含み得る。
【0029】
[0033] 音声またはビデオ通信は、一般に、1つまたは複数の介在通信ネットワークを介して接続された異なるコンピューティングデバイスのユーザ間のリアルタイムのまたはほぼリアルタイムの通信を指し、ユーザがまるで彼らが対面の会話をしているかのように、実質的に互いに会話することが可能である。例えば、本開示によると、会話のフォンコールおよびビデオ会議コールは、音声またはビデオ通信である。
【0030】
[0034] ワイヤレストランシーバ312およびアンテナ314に加えて、スマートフォン300はまた、それぞれ、BT通信およびWiFi通信のために構成された、さらなるワイヤレストランシーバ322、332、およびアンテナ324、334も含む。よって、スマートフォン300は、BTヘッドセットまたはイヤホン、並びにWiFiアクセスポイント(「AP」)のような、1つまたは複数のBTデバイスに接続することが可能である。
【0031】
[0035] スマートフォン300はまた、ディスプレイ330およびユーザ入力デバイス340も含む。適切なユーザ入力デバイスは、タッチスクリーン、ボタン、ノブ、ロッカースイッチ、方向パッド、マウス、キーボード、マイクロフォンなどの、タッチ感知表面を含む。適切な出力デバイスは、スピーカ、ディスプレイ、デバイス、点字出力デバイス、触覚出力デバイスなどを含む。
【0032】
[0036]
図4は、
図3に示されたコンピューティングデバイス300に接続され得る例示的なコンピューティングデバイス400を示す。上述されるように、接続デバイスは、上述されたもののうちの任意のものを含む、幅広い電子デバイスを含み得るが、音声またはビデオ通信に従事するためにユーザにユーザインターフェースを提供するのに適した接続デバイスは、このようなインタラクションを有効にすることを必要とする機能を含み得る。
【0033】
[0037] この例では、コンピューティングデバイス400は、バス460を介してメモリ420と通信状態にあるプロセッサ410を含む。加えて、コンピューティングデバイス400は、ワイヤレストランシーバ412および関連したアンテナ414を含む。加えて、コンピューティングデバイス400は、音声またはビデオ通信に従事するために使用され得る出力および入力デバイスを含む。この例では、コンピューティングデバイス400は、スピーカ430、マイクロフォン440、およびカメラ450を含む。よってこの例示的なコンピューティングデバイス400は、音声およびビデオ通信の両方に従事するのに適し得る。いくつかの例示的なコンピューティングデバイスは、カメラ450が欠如している可能性があるが、一方、マイクロフォン440およびスピーカ430を有している。
【0034】
[0038] この例では、例示的な接続されたコンピューティングデバイス400は、呼び出しデバイスとの電子音声通信のプロトコルの態様を処理する
図3のコンピューティングデバイス300のための遠隔入力および出力インターフェースを提供する。例えば、コンピューティングデバイス300がスマートフォンであり、一方、接続されたコンピューティングデバイス400がラップトップである場合、スマートフォンは、ラップトップのスピーカを介して再生されるべきラップトップへのオーディオ出力ストリームを提供しつつ、セルラコールを指示することを必要とするシグナリングおよび他のメッセージングを処理する。同様に、ラップトップは、セルラフォンコールの遠端に、セルラネットワークを介して送信されるべきオーディオ出力ストリームをスマートフォンに提供する。よって、この例における接続されたコンピューティングデバイス400は、音声またはビデオ通信のユーザインターフェース部分を提供し、一方、コンピューティングデバイス300は、呼び出しデバイスとの音声またはビデオ通信を確立および指示するメカニズムを処理する。
【0035】
[0039]
図5は、着信音声通信要求の通知のインテリジェントなルーティングのための例示的なシステム500を示す。この例では、セルラデバイス510は、セルラトランシーバ516aを介してセルラネットワーク515を使用して、スマートフォン520にビデオコールをかける。スマートフォン520は、ラップトップ530、BTヘッドセット540、およびスマートTV550などの複数の他のデバイスに接続される。この例では、他のデバイス530~550は、一般に
図2に関して上述されたような、前に確立されたペアリングまたは他のピア・ツー・ピア関係を介して、スマートフォン520に登録または接続される。
【0036】
[0040] この例では、スマートフォン520がセルラトランシーバ516bを介してセルラネットワーク515からの着信音声コールを受信したとき、それは、接続デバイス530~550を識別し、かつどれがビデオコールを処理することができるかを識別する。この例では、スマートフォン520は、ラップトップ530とスマートTV550との両方がマイクロフォン、スピーカ、およびカメラを有しており、従って各々がビデオコールを処理することが可能であることを識別する。対照的に、BTヘッドセット540は、マイクロフォンおよびスピーカを有しているが、カメラが欠如している。そのため、スマートフォン520は、音声コールを処理することが可能であるが、ビデオコールは処理することができないものとしてそれを識別する。
【0037】
[0041] この例では、スマートフォン520は次いで、ユーザがスマートフォン520の近くにいるか、または識別された接続デバイス530、550の近くにいるかを検出するために、それ自体のマイクロフォンを起動し、またラップトップ530およびスマートTV550にそれらのそれぞれのマイクロフォンを起動するよう指令する。デバイス520、530、550がそれらの起動されたマイクロフォンからオーディオ信号を受信すると、それらは、受信したオーディオ信号に基づいて、音声認識を行って1つまたは複数の音声を認識しようと試みる。加えて、各デバイス520、530、550はまた、それぞれのデバイスから人物または複数の人物までの、相対的な距離を決定するために使用され得る、SNRまたは音声信号強度のような追加の情報を取得し得る。
【0038】
[0042] この例では、スマートフォン520およびラップトップ530は、各々が音声認識能力を有するが、スマートTV550はそれを有していない。よって、スマートTV550は、ネットワーク560を使用して、音声認識を提供する遠隔コンピューティングデバイス570に接続し、次いで、遠隔コンピューティングデバイス570に受信したオーディオ信号をストリーミングする。遠隔コンピューティングデバイス570は次いで、受信したオーディオ信号上で1つまたは複数の音声認識技法を実施して、1つまたは複数のユーザ音声を認識しようと試みる。遠隔コンピューティングデバイス570が1つまたは複数のユーザ音声を認識する場合、それは、認識された音声を識別する情報を有するスマートTV550に応答する。例えば、遠隔コンピューティングデバイス570は、名前、ユーザID,ユーザプロファイル、または他の情報を、各認識された音声を識別するためにスマートTVに提供し得る。加えて、遠隔コンピューティングデバイス570は、音声認識の品質または信頼性レーティング、SNR情報などのような音声情報に関する情報を提供し得る。例えば、遠隔コンピューティングデバイス570にストリーミングされたオーディオ信号は、スピーカがマイクロフォンから離れている場合にわずかな音声情報しか含まない場合があり、または音声認識技法と干渉するするバックグラウンドノイズを含む場合がある。よって、SNR値が低くなり得る、または認識された音声についての信頼性レーティングが低くなり得る。このような情報が、1つまたは複数の認識された音声についての情報に沿ってスマートTV550に提供され得る。スマートTV550は次いで、認識された音声、並びに任意の品質、SNR、または遠隔コンピューティングデバイス570から受信した他の情報を識別する情報をスマートフォン520に提供し得る。
【0039】
[0043] 同様に、ラップトップ530は、それ自体の音声認識技法を実施した後、任意の認識された音声を識別する任意の情報をスマートフォン520に提供する。さらに、いくつかの例では、ラップトップ530はまた、SNR情報、信頼性情報などのような追加の情報も提供し得る。
【0040】
[0044] 識別された接続デバイス530、550の各々から認識された音声についての情報を受信し、それ自体の取得されたオーディオ信号上で音声認識を実施した後、スマートフォン520は、デバイス520、530、550のうちの任意のものによってユーザが識別されるかどうかを決定する。ユーザが1つのデバイスによってのみ識別された場合、スマートフォン520は次いで、着信音声コールをユーザにアラートするために、音声コール通知を行うようそのデバイスに通知を送信することができる。ユーザが複数のデバイスによって識別された場合、スマートフォン520は、それらデバイスのうちのいずれを選択するか決定し、かつそのデバイスに通知を送信し得るか、あるいは複数のデバイスを選択し、そのようなデバイスの各々に通知を送信し得る。デバイスが音声コール通知を出力した後、ユーザは次いで、そのデバイスを使用してコールを応答することができる。
【0041】
[0045] この例では、スマートフォン520は、着信通信がビデオコールとして識別されるため、ラップトップ530およびスマートTV550のみにそれらのマイクロフォンを起動するよう指令したが、いくつかの例では、スマートフォン520はまた、カメラが欠如しているにも関わらずBTヘッドセット540にも同様に指令し得る。例えば、スマートフォン520は、ビデオコール受け入れ、次いで、BTヘッドセット540にオーディオ信号のみを提供するか、または音声コールを音声のみのコールに変換することができ、それは、コールのためのユーザインターフェースを提供するようBTヘッドセット540を適切な接続デバイスにし得る。
【0042】
[0046] さらに、いくつかの例では、着信音声通信の通知を受信した後、スマートフォン520は、接続デバイス530~550にそれらのマイクロフォンを起動するよう指令し得るが、同様にあるいはそれに代わって、ラップトップ530およびスマートTV550にそれらのそれぞれのカメラを起動するよう指令してユーザまたは他の個人を識別しようとし得る。例えば、ラップトップ530は、内蔵ウェブカメラを起動し、1つまたは複数のイメージをキャプチャし得る。ラップトップ530は次いで、イメージ内で1または複数の個人を識別しようと試み得、任意の個人が識別された場合、識別された個人を認識し、かつ認識された個人のうちの1または複数までの相対的な距離を決定しようと試みる。例えば、ラップトップ530は、1つまたは複数のキャプチャされたイメージから個々を識別および認識するために、1つまたは複数の顔識別および顔認識技法を利用し得る。いくつかの例では、ラップトップ530は、代わりに1つまたは複数のキャプチャされたイメージを遠隔コンピューティングデバイス570に送信し得、それは次いで、キャプチャされたイメージ中の1または複数の個人を識別および認識しようと試みる。遠隔コンピューティングデバイス570は次いで、ラップトップ530に、イメージ内で1または複数の個人が認識されたというインジケーション、または個人が認識されなかったとのインジケーションを提供し得る。いくつかの例では、スマートTV550または他の接続デバイスは、1つまたは複数のキャプチャされたイメージ中の1または複数の個人を視覚的に識別および認識するための同様の技法を実施し得、いくつかの例では、キャプチャされたイメージに基づいて1つまたは複数の認識された個人までの距離を決定する。
【0043】
[0047] ユーザまたは他の個人を識別および認識しようと試みた後、接続デバイス530~550は、視覚的に認識されようとまたは聴覚的に認識されようと、任意の認識された個人を識別する情報を、あるいはSNR情報などの接続デバイスからユーザまでの決定された距離のような他の情報をスマートフォン520に送信し得る。スマートフォン520は次いで、そのような情報を利用して、コール通知を出力するためのデバイスとして、接続デバイスのうちの1つを選択し得るか、またはそれ自体を選択し得る。その後、スマートフォン520は、選択したデバイスに、呼び出し音、光またはスクリーンの点滅、振動などのようなコール通知を出力するよう指令する。
【0044】
[0048]
図6は、着信音声通信要求の通知のインテリジェントなルーティングのための例示的な方法600を示す。例示的な方法600は、
図5の例示的なシステム500に関して説明される。しかしながら、本開示による例示的な方法は、本開示による任意の適切なデバイス、システム、または方法によって利用され得ることを理解されたい。
【0045】
[0049] ブロック610において、スマートフォン520は、着信音声通信要求のインジケーションを受信する。この例では、セルラデバイス510は、セルラトランシーバ516aを介してセルラネットワーク515を使用して、スマートフォン520に音声コールをかける。スマートフォン520は、セルラトランシーバ516bを介してセルラネットワーク515からの着信音声コールのインジケーションを受信する。上述されたもののような様々な例において、任意の適切なセルラ技術が利用され得る。
【0046】
[0050] この例では、セルラデバイス510は、標準的なセルラ音声コールをかける。よって、セルラネットワーク515は、スマートフォン520によって用いられるセルラプロトコルを使用して、着信セルラ音声コールのインジケーションを提供する。しかし、いくつかの例では、セルラデバイス510は、セルラデバイス510によって実行される音声またはビデオコールアプリケーション(すなわち「アプリ」)を使用して、音声通信を開始し得、そのデータは、セルラネットワークによって提供される1つまたは複数のデータ送信プロトコル内にカプセル化されたネットワーキングプロトコルなどを使用することによって、データストリームとしてセルラネットワークによって搬送される。しかしながら、ユーザが別のデバイスへの音声またはビデオコールを開始すること、あるいは別のデバイスによる音声またはビデオコールを受信することを可能にする任意の適切なアプリケーションが利用され得る。このようなアプリケーションは、音声またはビデオ通信が要求されたとのインジケーションを、呼び出されたデバイスに提供するための特徴を含み得、それは次いで、その要求の呼び出されたデバイスのユーザへの通知を開始し得る。
【0047】
[0051] 一方この例では、呼び出されたデバイスは、スマートフォン520であり、遠隔デバイスからの音声またはビデオ通信要求を受信することが可能な任意の他の適切な電子デバイスは、
図4に関して上述されたように用いられ得る。
【0048】
[0052] さらに、この例がセルラネットワーク上で行われた音声コールを論じている一方、
図3に関して上述されるような、任意の適切な通信ネットワーク、あるいは音声またはビデオ通信要求が用いられ得る。
【0049】
[0053] インジケーションに応答して、および通知を出力するようデバイスに要求する前に、方法600は、ブロック620へと進む。この例では、スマートフォンは、通知を出力するよう任意のデバイスに要求することなく、ブロック620へと進む。
【0050】
[0054] ブロック620において、スマートフォン520は、1つまたは複数の適切な入力デバイスおよび1つまたは複数の適切な出力デバイスを有する1つまたは複数の接続デバイスを識別する。適切な入力および出力デバイスは、音声通信要求のタイプに基づいて識別され得る。音声のみの通信要求のための適切な入力および出力デバイスは、1つまたは複数のマイクロフォンと1つまたは複数のスピーカとを含む。ビデオ通信要求のための適切な入力および出力デバイスは、1つまたは複数のマイクロフォン、1つまたは複数のスピーカ、並びに、オプションで、1つまたは複数のカメラおよびビデオ表示デバイスを含む。いくつかの例では、着信ビデオ通信要求は、音声のみの通信にダウングレードされ得るか、あるいは、カメラおよびビデオ表示デバイスを有する適切な接続デバイス(または呼び出されたデバイス自体)が存在しない場合、完全に拒否され得る。
【0051】
[0055] この例では、スマートフォン520は、それに接続する3つのデバイス、ラップトップ530と、BTヘッドセット540と、スマートTV550とを有するが、任意の数のデバイスがスマートフォン520に接続され得る。上述されるように、接続デバイスは、静的にまたは動的にスマートフォン520に接続され得る。例えば、BTヘッドセット540は、電源がオンにされ、かつスマートフォン520の範囲内にある限り、静的に接続され得る。よって、接続は、オーディオデータがスマートフォン520とBTヘッドセット540との間で交換されないときであっても、アクティブ状態で維持される。しかしながら、いくつかのデバイスは、スマートフォン520に動的に接続され得る。
【0052】
[0056] 例えば、ラップトップ530は、スマートフォン520もまた接続されているWiFi APを介して、LANと通信状態にあり得る。スマートフォン520は、ラップトップ530の存在を検出し、ラップトップ530をスマートフォン520への接続のために認定されたデバイスとして認識し得るが、トリガイベントが発生しない限りラップトップ530との接続を開始しない可能性がある。例えば、ユーザは、スマートフォン520上で音楽プレイヤアプリケーションを開き得、それは、ラップトップ530に記憶されるメディアライブラリにアクセスし得る。ラップトップ530への接続は次いで、メディアライブラリにアクセスを提供するために動的に確立され得る。同様に、この例では、ラップトップ530は、ラップトップ530を介してスマートフォン520によって処理される音声またはビデオコールのためにスマートフォン520にオーディオまたはビデオインターフェースを提供し得る。この例では、スマートTV550もまた、着信音声通信が受信されたときのように、スマートフォン520によって動的に接続可能である。
【0053】
[0057] よって、ブロック620において、スマートフォン520は、スマートフォン520に接続され、かつスマートフォン520への動的接続を可能にするデバイスを識別する。
【0054】
[0058] 接続されているまたは動的接続に適したデバイスを識別することに加えて、スマートフォン520は、着信音声通信要求のためにインターフェースデバイスとしてサービスするための各デバイスの能力を決定する。この例では、着信音声通信要求は、音声のみの通信を示し、よって、スマートフォン520は、マイクロフォンおよびスピーカを有する全ての接続されたまたは接続可能なデバイスを識別する。いくつかの例では、ビデオ通信要求が受信される場合、スマートフォン520は、マイクロフォン、スピーカ、カメラ、およびディスプレイデバイスを有する全てのデバイスを識別する。このような情報は、一般に
図2に関して上述されるような、既知のデバイスのデータベースまたは他のレジストリに記憶され得る。
【0055】
[0059] 例えば、スマートフォン520が新規のデバイスに接続するとき、それは、マイクロフォン、スピーカ、カメラ、ディスプレイスクリーンなどのようなデバイスからデバイス能力を要求し得る。新規のデバイスから受信したこのような能力に関する情報は、デバイスのためのユニーク識別子など(MACアドレス、IMEIなど)に基づいて、デバイスに関連付けられた記録にスマートフォン520によって記憶され得る。後に、スマートフォン520がデバイスに再度接続するとき、それは、デバイスがどの能力を有しているかを決定するためにデバイスの記録にアクセスすることができる。しかしながら、いくつかの例では、スマートフォン520は、デバイスに接続するたびにデバイス能力を決定し得る。例えば、デバイス能力は、時間とともに変化し得、あるいはユーザは、スピーカをミュートにするかまたはカメラを無効にすることなどによって1つまたは複数の入力または出力デバイスを無効にし得る。
【0056】
[0060] スマートフォン520が適切な入力および出力デバイスとの接続デバイスを識別することができない場合、方法は終了し、スマートフォン520自体は、呼び出しなどによる着信音声通信の通知を出力し得る。代替的に、適切な入力または出力デバイスがビデオコールに関して識別されないが、1つまたは複数の接続デバイスが音声のみのコールを処理することが可能な場合、スマートフォン520は、ビデオ通信要求から音声のみの通信要求に通信要求をダウングレードするか、またはビデオ能力がサポートされない呼び出しデバイスに通知を提供し得る。スマートフォン520がビデオコールを音声コールにダウングレードする場合、それは次いで、音声のみのコールを処理することが可能な1つまたは複数の接続デバイスを識別し得る。
【0057】
[0061] ブロック630において、スマートフォン520は、1つまたは複数の適切な入力デバイスを使用してセンサ信号を取得するよう各識別されたデバイスに指令する。この例では、スマートフォン520は、オーディオ信号を取得するために、そのマイクロフォンを起動するようBTヘッドセット540にコマンドを送信する。加えて、スマートフォン520は、ラップトップ530およびスマートTV550の各々への動的接続を開始する。動的接続を開始した後、スマートフォン520は、オーディオ信号を取得するために、それのマイクロフォンを起動するようそれぞれの接続デバイス530、550に指令する。いくつかの例では、スマートフォン520自体はまた、センサ信号を取得するために、それのマイクロフォンまたはカメラを起動し得る。
【0058】
[0062] いくつかの例では、着信音声通信要求がビデオ通信要求を示す場合。このような一例では、スマートフォン520は、1つまたは複数のマイクロフォンを使用してオーディオ信号を、1つまたは複数のカメラを使用してビデオ信号を、またはオーディオ信号とビデオ信号との両方を取得するよう各識別されたデバイスに指令し得る。例えば、スマートフォン520は、そのマイクロフォンからオーディオ信号を取得するよう、およびそのカメラからビデオ信号を取得するよう、ラップトップ530に指令を送信し得る。さらに、いくつかの例では、スマートフォン520は、音声のみの通信要求のコンテキスト中であっても、マイクロフォンおよびカメラから両方のセンサ信号を取得するよう、1つまたは複数のデバイス520~550に指令し得る。このような技法は、1または複数の人物を認識するために使用され得る複数のタイプのセンサを提供し得、それは、人物を認識する確率を高め得る。
【0059】
[0063] このような指令を受信することに応じて、接続デバイス530~550の各々は、センサ信号を取得するために、本開示による方法を行い得、センサ信号に基づいて1または複数の人物を認識するか、またはスマートフォン520にセンサ信号を提供するかのいずれかである。その一例の方法700の1つが
図7で示されており、以下でより詳細に説明される。
【0060】
[0064] ブロック640において、スマートフォン520は、1つまたは複数のセンサ信号に基づいて、1または複数の認識された人物のインジケーションを受信する。この例では、スマートフォン520は、デバイス530~550のうちの1つまたは複数のから、認識された人物のインジケーションを受信し、
図7に関して以下で説明されるように認識された人物を決定した。しかしながら、いくつかの例では、スマートフォン520は、デバイス530~550のうちの1つまたは複数からセンサ信号を受信し、各デバイスからのそれに提供された受信されたセンサ信号を使用して1つまたは複数の認識技法を行い得る。認識技法を行った後、スマートフォン520は、それぞれの認識技法の出力として、認識された人物のインジケーションを受信する。
【0061】
[0065] 適切な認識技法の例は、音声認識、顔認識、オブジェクト認識などを含む。受信したオーディオ信号は、音声認識技法を提供して、オーディオ信号内に記憶された1つまたは複数の音声を認識しようと試み得、一方、受信した音声信号は、1つまたは複数の人物の顔を識別するための顔認識技法を提供し得る。認識した音声または顔のインジケーションは、このような認識技法からスマートフォン520によって受信され得る。例えば、インジケーションは、名前、ユーザプロファイルID、または1つまたは複数の人物のスマートフォン520によって認識される何らかの他の識別子を含み得る。複数の人物が接続デバイス530~550のうちの1つまたは複数によって、またはスマートフォン520自体によって識別され得ることを理解されたい。
【0062】
[0066] いくつかの例では、デバイス520~550のうちの1つまたは複数は、それぞれのデバイスから1つまたは複数の認識された人物までの距離を決定するよう試み得る。距離決定は、SNR情報または音声信号強度、あるいはキャプチャされたイメージ内の人物のイメージおよび検出されたサイズを決定することなどによって、オーディオ信号に基づき得る。例えば、音声信号強度は、人物がマイクロフォンから遠ざかるにつれて減少し得る。よって、デバイスは、個人までの距離を決定するために、音声信号強度と距離との対応(correspondence)を用い得る。距離は、フィートまたはメーターのような、対象距離の測定値(objective distance measurement)を必ずしも指さないことを理解されたい。むしろ、距離は、音声信号強度、SNRなどについての予め定められた閾値に基づく「近い」または「遠い」のような、粗い測定値(coarse measurement)であり得る。いくつかの例では、距離は、複数のデバイスからの異なるSNRまたは音声信号強度測定値に基づいて、スマートフォン520によって推測され得る。それぞれのSNRまたは音声信号強度測定値を比較することによって、スマートフォン520は、それらそれぞれのSNRまたは音声信号強度測定値に従って、デバイスを順序付けすることによって、1つまたは複数の認識された個人からそれぞれのデバイスの距離のランキングを決定し得る。このような順序付けは、1つまたは複数のデバイスに関して「最も近い」および「最も遠い」のような相対的な距離情報を提供し得る。
【0063】
[0067] ブロック650において、スマートフォン520は、識別された人物または複数の人物に基づいて、スマートフォン520自体か、または接続デバイス530~550のうちの1つかのデバイスを選択する。この例では、スマートフォン520がその所有者に関連付けられるため、着信音声通信要求は、そのデバイスの所有者に向けられる可能性が最も高い。よって、スマートフォン520の所有者が認識された場合、所有者を認識するために使用されたセンサ信号を提供された任意のデバイス520~550は、選択の候補者であり得る。1つのデバイス520~550のみがこのようなセンサ信号を提供した場合、スマートフォン520は、そのデバイスを選択する。しかしながら、複数のデバイス520~550がこのようなセンサ信号を提供した場合、スマートフォン520は、1つまたは複数の要因に基づいてデバイス520~550を選択し得る。
【0064】
[0068] このような要因は、所有者までのデバイス520~550の検出された距離を含み得る。例えば、ラップトップ530は、所有者を認識するために使用される取得されたセンサ信号を有し得るが、センサ信号は、低いSNRを有しているか、または低い振幅であり、その所有者がラップトップ530からの距離である可能性が高いことを示す。同時に、スマートTV550は、ラップトップ530からSNRまでよりも長いSNRを用いて取得されたセンサ信号、またはラップトップ530によって取得されたものよりも大きい振幅を有し得、その所有者がラップトップ530よりもスマートTV550に近いことを潜在的に示す。このような例では、スマートフォン520は、スマートTV550を選択し得る。代替的に、スマートフォン520は、上述されたような1つまたは複数のデバイスから距離を受信し得る。
【0065】
[0069] いくつかの例では、1つまたは複数のデバイス520~550は、複数のセンサ入力から所有者を認識し得る。例えば、所有者は、ラップトップカメラとマイクロフォンとの両方に方向付けられたセンサ信号に基づいて認識されている可能性がある。対照的に、所有者は、スマートTVのマイクロフォンからのセンサ信号によって認識されているが、そのカメラからは認識されていない可能性がある。よって、スマートフォン520は、スマートTVよりも、所有者の存在を示すラップトップのセンサ入力の多くに基づいて、ラップトップを選択し得る。
【0066】
[0070] いくつかの例では、スマートフォン520は、優先度情報に基づいてデバイスを選択し得る。優先度情報は、1または複数の認識された人物または1つまたは複数のデバイス520~550に関連付けられ得る。例えば、スマートフォン520は、デバイスの所有者、所有者の配偶者、所有者の子供(複数を含む)などのような既知の人物についての情報を維持し得る。このような既知の人物のうちの1または複数は、デバイス520~550を選択するために使用されることができる、関連付けられた優先度情報を有し得る。このような優先度情報は、人物が着信音声コールについて通知するための選好を示し得るか、あるいは着信音声コールを通知されるべきではない1または複数の人物を識別し得る。例えば、スマートフォン520は、デバイスの所有者に関連付けられた1の優先度、所有者の配偶者関連付けられた2の優先度値、および所有者の子供の各々に対する3の優先度値を有し得る。よって、スマートフォン520が認識された人物についての情報を1つまたは複数のデバイス520~550から受信し、それは、どの人物がどのデバイスによって認識されたかに基づいてデバイスごとに優先度を決定し得る。例えば、ラップトップ530が所有者を認識した場合、スマートTVは所有者の配偶者を認識するが、スマートフォン520は、所有者に関連付けられた優先度が所有者の配偶者に関連付けられた優先度よりも大きいときに、ラップトップ530を選択し得る。
【0067】
[0071] いくつかの例では、優先度情報は、1つまたは複数のデバイスに関連付けられ得る。例えば、スマートフォンの所有者は、どのデバイスが音声コールに回答するために使用されるべきかに関連する選好を提供し得る。例えば、所有者は、最も高い優先度を有するスマートフォン、2番目に高い優先度を有するタブレットデバイス(図示せず)、3番目に高い優先度を有するラップトップ530およびスマートTV550、4番目に高い優先度を有するBTヘッドセット540を確立し得る。よって、複数のデバイスが所有者を認識した場合、スマートフォン520は次いで、所有者を認識し、かつ最も高い優先度を有するデバイスを選択し得る。
【0068】
[0072] いくつかの例では、複数の人物または複数のデバイスに関連付けられた優先度情報が同じ優先度を有することを示す場合、スマートフォン520は、認識された個人までの距離などのような他の要因に基づいてデバイスを選択し得る。しかし、いくつかの例では、スマートフォン520は、同じ優先度レベルまたは情報を示す複数のデバイスを選択し得る。
【0069】
[0073] ブロック660において、スマートフォン520は、音声通信要求の通知を出力するために、選択されたデバイスにコマンドを送信する。通知は、可聴性通知、ビジュアルインジケーション、触覚性インジケーション、またはそれらの任意の組み合わせを含み得る。コマンドは、出力するための通知のタイプ、またはオーディオ信号、イメージ、触感などのような、その通知を説明する情報を識別するための1つまたは複数の通知識別子を含み得る。いくつかの例では、そのコマンドは、出力されるべき通知を説明する任意の情報なしに、通知を出力するためのデバイスへのコマンドであり得る。通知を出力することに加えて、スマートフォン520はまた、センサ信号を取得するのを停止するために選択されなかったデバイスに、1つまたは複数のコマンドを送信し得る。
【0070】
[0074] しかしながら、いくつかの例では、予め定められた時間で認識された人物を識別するスマートフォン520に応答するデバイスが存在しない可能性がある。このような予め定められた時間は、着信音声通信要求が音声メッセージサービスのような別のサービスに再ルーティングされる前の時間の量に基づいて、固定の呼び出し音の数、固定の時間の量、または相対的な時間であり得る。
【0071】
[0075] このようなシナリオでは、スマートフォン520は、通知を出力するために全てのデバイス520~550にコマンドを出力し得るか、またはスマートフォン520は、それ自体の通知のみを出力し得る。いくつかの例では、スマートフォン520は、着信音声要求の通知を出力するために閾値よりも高い優先度を有するデバイスに指令し得る。
【0072】
[0076]
図7は、着信音声通信要求の通知のインテリジェントなルーティングのための例示的な方法700を示す。この例では、方法700は、
図5に示された例示的なシステム500に関して、および
図6に示された例示的な方法600に関して説明される。しかしながら、本開示による例示的な方法は、本開示による任意の適切なデバイス、システム、または方法によって利用され得ることを理解されたい。
【0073】
[0077] ブロック710において、接続デバイス530~550は、センサ信号を取得するためのコマンドを受信する。例えば、接続デバイス530~550は、オーディオ信号を取得するためにマイクロフォンを起動し、ビデオ信号を取得するためにカメラを起動するための指令を受信し得る。この例では、コマンドは、センサ情報を取得するための持続期間と、起動されるべきセンサの1つまたは複数のタイプとを識別する。接続デバイス530~550が、以下でより詳細に説明される認識技法を行うように構成される場合、コマンドはまた、認識された人物を識別する情報、またはこのような情報が提供されるべき期限を提供するためのコマンドを含み得る。
【0074】
[0078] 接続デバイス530~550が認識技法を行うように構成されていない場合、コマンドは、スマートフォン520にセンサ情報を提供するための技法を指定し得る。適切な技法は、スマートフォン520にセンサ信号をストリーミングすること、あるいは1つまたは複数のセンサ信号または符号化されたセンサ信号を含むファイルを提供することを含み得る。いくつかの例では、センサ信号は、フルレート、ハーフレート、適応マルチレート、MPEG level-3(mp3)などのような1つまたは複数のロスの多いまたはロスのない符号化技法、オーディオセンサ信号のためのボコーダ、またはイメージのためのビットマップ、JPEG、GIFなど、またはビデオ信号のためのMPEG-4、H.264などを使用して符号化され得る。
【0075】
[0079] コマンドを受信することに応答して、接続デバイス530~550は、マイクロフォンまたはカメラなどの識別されたセンサを起動する。いくつかの例では、接続デバイス530~550は、1つまたは複数のセンサを起動することができない可能性がある。例えば、ユーザは、構成設定などを介して、いずれかまたは両方を無効している可能性がある。いくつかの例では、起動コマンドは、このような構成に基づいて無視され得、方法700が終了し得る。しかしながら、いくつかの例では、起動コマンドは、本開示による方法を行う目的で、その構成を一時的に無効にし得、かつセンサを起動し得る。
【0076】
[0080] ブロック720において、接続デバイス530~550は、起動したセンサからセンサ信号を受信する。例えば、ラップトップ530は、そのマイクロフォンからのオーディオ情報のストリームとそのカメラからのイメージのストリームを受信し得る。カメラの場合には、いくつかの例では、カメラは、毎秒24、25、または30フレームのような基準フレームレートにおいてビデオを提供し得るか、または、1秒ごとのような特定のレートでイメージをキャプチャし得るか、または、イメージの特定の数のみをキャプチャし得る。このようなセンサ信号は、受信した後、さらなる処理のためにメモリに記憶し得る。例えば、オーディオ情報は、メモリ中にまたは不揮発性記憶媒体上のオーディオファイルにレンダリングされ得る。カメラから受信されたイメージは、別個のファイルに個々に記憶され得るか、またはビデオファイルとして記憶され得る。
【0077】
[0081] ブロック730では、接続デバイス530~550は、それが認識技法を行い得るか、処理のために取得したセンサ信号をスマートフォン520に提供し得るかを決定する。接続デバイス530~550が認識技法を行うように構成された場合、方法700は、ブロック734に進み、そうでなければ、方法700は、ブロック732に進む。
【0078】
[0082] ブロック732において、接続デバイス530~550は、スマートフォン520にそのセンサ信号を提供する。例えば、接続デバイス530~550は、オーディオファイル、イメージファイル、またはビデオファイルをスマートフォン520に送信し得る。いくつかの例では、接続デバイス530~550は、センサ信号、またはセンサ信号から抽出された情報を、リアルタイムでスマートフォン520にストリーミングし得る。いくつかの例では、このようなセンサ信号は、
図6のブロック630に関して上述されるような1つまたは複数の符号化技法に従って符号化され得る。このようなセンサ信号を提供した後、方法700は、終了し得る。
【0079】
[0083] この例では、接続デバイス530~550は、それがセンサ信号を取得することを停止するために後続のコマンドを受信するまで、センサ信号を提供し続けるだろう。しかしながら、いくつかの例では、接続デバイス530~550は、所定の時間期間の間、または所定の数のセンサ信号が提供されるまで、センサ信号を提供するだろう。例えば、接続デバイスは、最大5秒間、センサ信号を提供し得、最大10イメージを提供し得る。
【0080】
[0084] ブロック734において、接続デバイス530~550は、受信したセンサ信号に基づいて、1または複数の人物を認識する。いくつかの例では、接続デバイス530~550自体は、音声認識技法または顔認識技法のような、1つまたは複数の認識技法を実行し得る。適切な音声または顔認識技法は、ディープニューラルネットワークを含むニューラルネットワーク、隠れマルコフモデル(「HMM」)、スペクトルまたはケプストラム分析技法、動的時間ワーピング技法などを利用し得る。接続デバイス530~550は、音声または顔認識技法に1つまたは複数のセンサ信号を提供し、入力されたセンサ信号に関連付けられた人物または複数の人物のアイデンティティの識別子を受信し得る。
【0081】
[0085] いくつかの例では、接続デバイス530~550自体は認識技法を行わないが、代わりに、1つまたは複数の認識技法を実行するスマートフォン520以外の遠隔コンピューティングデバイス570にセンサ信号を提供する。このような遠隔コンピューティングデバイス570は次いで、入力されたセンサ信号に関連付けられた人物または複数の人物の識別のインジケーションを有する接続デバイス530~550に応答し得る。
【0082】
[0086] いくつかの例では、接続デバイス530~550は、時間期間中にセンサ信号を取得し得るため、接続デバイス530~550は、センサ信号が取得された時間期間にわたって、認識技法の複数の反復を行って1または複数の人物を識別しようと試み得る。
【0083】
[0087] ブロック736において、接続デバイス530~550は、1または複数の認識された人物のインジケーション、または人物が認識されなかったとのインジケーションを、スマートフォン520に提供する。例えば、接続デバイス530~550は、名前、ユーザ識別子番号またはコード、ユーザプロファイルなどを、スマートフォン520に提供し得る。いくつかの例では、接続デバイス530~550は、認識された人物の複数のインジケーションを提供し得る。上述されたように、接続デバイス530~550は、時間期間にわたってセンサ信号を取得し得、取得したセンサ信号において認識技法を反復して行い得る。人物が認識されると、接続デバイス530~550は、認識された人物のインジケーションをスマートフォン520に提供し得る。
【0084】
[0088] この例では、接続デバイス530~550は、スマートフォン520によって停止するよう指令されるまで、またはブロック710において受信されたコマンドから所定の閾値に到達するまで、センサ信号を取得し続け、認識技法を行い得る。
【0085】
[0089] 本明細書で使用されるとき、項目のリスト「~のうちの少なくとも1つ」に言及するフレーズは、単一の構成要素(members)を含む、それらの項目の任意の組み合わせに言及する。例として、「a、b、またはcのうちの少なくとも1つ」は、a、b、c、a-b、a-c、b-c、およびa-b-cをカバーすることが意図される。
【0086】
[0090] 本明細書で開示された実施形態に関連して説明される様々な例示的なロジック、論理ブロック、モジュール、回路、およびアルゴリズムプロセスは、電子ハードウェア、コンピュータソフトウェア、または両方の組み合わせとして実施され得る。ハードウェアとソフトウェアとの互換性は概して、機能の観点から説明されており、上述された様々な例示的なコンポーネント、ブロック、モジュール、回路、およびプロセスにおいて例示されている。そのような機能がハードウェアとして実施されるか、ソフトウェアとして実施されるかは、特定のアプリケーションおよび全体的なシステムに課される設計制約に依存する。
【0087】
[0091] 本明細書に開示される態様に関連して説明された様々な例示的な論理、論理ブロック、モジュール、および回路を実施するために使用されるハードウェアおよびデータ処理装置は、汎用のシングルチップまたはマルチチッププロセッサ、デジタルシグナルプロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、または他のプログラマブル論理デバイス、ディスクリートゲートまたはトランジスタロジック、ディスクリートハードウェアコンポーネント、または本明細書で説明される機能を行うように設計されたそれらの任意の組み合わせで実施され得るかまたは行われ得る。汎用プロセッサは、マイクロプロセッサ、または、任意の従来のプロセッサ、コントローラ、マイクロコントローラ、あるいはステートマシンであり得る。プロセッサはまた、DSPとマイクロプロセッサの組み合わせ、複数のマイクロプロセッサ、DSPコアと連携した1つまたは複数のマイクロプロセッサ、あるいは任意の他のこのような構成などの、コンピューティングデバイスの組み合わせとして実装され得る。いくつかの実施形態では、特定のプロセスおよび方法が、所与の機能に特有である回路によって行われ得る。
【0088】
[0092] 1つまたは複数の様態では、説明された機能は、本明細書中に開示された構造およびそれらの構造的同等物を含む、ハードウェア、デジタル電子回路、コンピュータソフトウェア、ファームウェアまたはそれらの任意の組み合わせにおいて実装され得る。本明細書で説明された主題の実装はまた、データ処理装置による実行のための、またはデータ処理装置の動作を制御するための、コンピュータ記憶媒体上で符号化される、1つまたは複数のコンピュータプログラム、すなわち、コンピュータプログラムの命令の1つまたは複数のモジュールとして実装されることができる。
【0089】
[0093] ソフトウェアで実施する場合、機能は、1つまたは複数の命令またはコードとしてコンピュータ可読媒体上に記憶されるか、あるいはコンピュータ可読媒体を介して送信され得る。本明細書で開示された方法またはアルゴリズムのプロセスは、コンピュータ可読媒体上に存在し得るプロセッサ実行可能ソフトウェアモジュールにおいて実装され得る。コンピュータ可読媒体は、ある場所から別の場所にコンピュータプログラムを転送することを可能にされることができる任意の媒体を含む通信媒体およびコンピュータ記憶媒体の両方を含む。記憶媒体は、コンピュータによってアクセスされ得る任意の利用可能な媒体であり得る。限定ではされないが、例として、このようなコンピュータ可読媒体は、RAM、ROM、EEPROM(登録商標)、CD-ROMまたは他の光ディスク記憶装置、磁気ディスク記憶装置または他の磁気記憶デバイス、あるいは、命令またはデータ構造の形態で望ましいプログラムコードを記憶するために使用され、かつ、コンピュータによってアクセスされ得る任意の他の媒体を含み得る。また、任意の接続は、コンピュータ可読媒体と適切に呼ばれ得る。本明細書で使用される場合、ディスク(disk)およびディスク(disc)は、コンパクトディスク(CD)、レーザーディスク(登録商標)、光ディスク、デジタル多用途ディスク(DVD)、フロッピー(登録商標)ディスク、およびブルーレイ(登録商標)ディスクを含み、ディスク(disk)は、通常、データを磁気的に再生し、ディスク(disc)は、データをレーザで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含めるべきである。加えて、方法またはアルゴリズムの動作は、機械可読媒体およびコンピュータ可読媒体上で、コードおよび命令のうちの1つ、またはそれらの任意の組み合わせ、またはそれらのセットとして存在し得、それは、コンピュータプログラム製品に組み込まれ得る。
【0090】
[0094] 本開示で説明される実装への様々な変更は、当業者にとって容易に明らかであり、および、本明細書で定義される一般的な原理は、本開示の精神または範囲から逸脱することなく他の実装に適用され得る。よって、特許請求の範囲は、本明細書に示される実施形態に限定されることを意図されてはいないが、本明細書に開示されたこの開示、原理および新規の特徴と一致する最も広い範囲が付与されるべきである。
【0091】
[0095] 加えて、当業者は、「上方」および「下方」という用語が、図を説明しやすくするために使用されることがあり、適正に方向付けられた頁上で図の向きに対応する相対的な位置を示し、実施されたときの任意のデバイスの適正な向きを反映しないことがあり得ることを容易に認識するであろう。
【0092】
[0096] 別個の実装に照らして本明細書で説明される、ある特徴もまた、単一の実装で組み合わせて実施されることができる。反対に、単一の実装のコンテキストにおいて説明されている様々な特徴もまた、別個に複数の実装において、または任意の適したサブコンビネーションにおいて実装されることができる。さらに、特徴は、ある特定の組み合わせで機能するとして上述され、特許請求の範囲にさえ最初はそのように記載され得るが、特許請求の範囲に記載されている組み合わせからの1つまたは複数の特徴は、いくつかのケースでは、その組み合わせから削除され、特許請求の範囲に記載されている組み合わせは、サブコンビネーションまたはサブコンビネーションの変形を対象とし得る。
【0093】
[0097] 同様に、動作が特定の順序で図面に図示されているが、このことは、そのような動作が、望ましい結果を達成するために、示された特定の順序または連続した順序で行われること、または全ての例示された動作が行われることを必要とするものと理解されるべきではない。さらに、図面は、フロー図の形式でもう1つの実例的なプロセスを概略的に図示し得る。しかしながら、図示されていない他の動作は、概略的に例示されている例示的なプロセス中に組み込まれることができる。例えば、1つまたは複数の追加の動作は、例示されている動作のいずれかの前に、後で、同時に、または間に行われ得る。ある特定の状況では、マルチタスクおよび平行処理が有利であり得る。さらに、上述された実装における様々なシステムコンポーネントの分離は、全ての実装においてそのような分離を必要とするものと理解されるべきではなく、説明されたプログラムコンポーネントおよびシステムが、概して、単一のソフトウェア製品に一体化されるか、または複数のソフトウェア製品にパッケージ化される得ることが理解されるべきである。加えて、他の実施形態は、下記の特許請求の範囲内にある。いくつかのケースでは、特許請求の範囲に記載されるアクションは、異なる順序で行われ、それでもなお望ましい結果を達成することができる。
以下に本願の出願当初の特許請求の範囲に記載された発明を付記する。
[C1]
方法であって、
電子デバイスによって、着信音声通信要求のインジケーションを受信することと、
前記インジケーションに応答して、および通知を出力するようデバイスに要求する前に、
前記電子デバイスに接続された1つまたは複数のデバイスを識別することと、前記1つまたは複数のデバイスの各々は、オーディオ入力デバイスおよびオーディオ出力デバイスを備え、
そのそれぞれのオーディオ入力デバイスを使用してオーディオ信号を検出するよう各識別されたデバイスに要求することと、
第1のオーディオ信号に基づいて音声を受信することと、前記第1のオーディオ信号は、前記1つまたは複数のデバイスのうちの1つによって受信され、
前記音声に基づいて前記1つまたは複数のデバイスのうちの第1のデバイスを選択することと、
前記着信音声通信要求を示す通知を出力するために、前記第1のデバイスに信号を提供することと
を備える、方法。
[C2]
前記電子デバイスは、スマートフォンであり、前記1つまたは複数のデバイスは、ラップトップコンピュータ、タブレット、スマートテレビ、Bluetoothイヤホン、モノのインターネット(「IOT」)デバイス、またはIOTハブのうちの少なくとも1つを備える、C1に記載の方法。
[C3]
前記着信音声通信要求は、着信セルラフォンコールまたは着信ビデオ会議コールである、C1に記載の方法。
[C4]
音声認識技法を使用して1つまたは複数のオーディオ信号に基づいて前記音声を認識することをさらに備え、前記第1のデバイスを選択することは、前記認識された音声にさらに基づく、C1に記載の方法。
[C5]
前記音声を受信することは、複数の音声を受信することを備え、音声認識技法を使用して前記複数の音声のうちの1つまたは複数の音声を認識することをさらに備える、C1に記載の方法。
[C6]
各認識された音声についての優先度を決定することと、
最も高い優先度を有する前記認識された音声を識別することと、
ここにおいて、前記第1のデバイスを選択することは、前記最も高い優先度を有する前記認識された音声にさらに基づく、
をさらに備える、C5に記載の方法。
[C7]
各認識された音声までの距離を決定することをさらに備え、ここにおいて、前記第1のデバイスを選択することは、前記決定された距離にさらに基づく、C6に記載の方法。
[C8]
前記インジケーションに応答して、および通知を出力するようデバイスに要求する前に、
イメージセンサを有する前記1つまたは複数のデバイスの各々について、そのそれぞれのイメージセンサを使用して1つまたは複数のイメージをキャプチャするよう各デバイスに要求することと、
前記キャプチャされた1つまたは複数のイメージを受信することと
前記キャプチャされたイメージのうちの少なくとも1つ中の人物を認識することと、 ここにおいて、前記第1のデバイスを選択することは、前記認識された人物にさらに基づく、
をさらに備える、C1に記載の方法。
[C9]
前記キャプチャされたイメージのうちの1つまたは複数中の複数の人物を認識することと、
各認識された人物についての優先度を決定することと、
最も高い優先度を有する前記認識された人物を識別することと、
ここにおいて、前記第1のデバイスを選択することは、前記最も高い優先度を有する前記認識された人物にさらに基づく、
をさらに備える、C8に記載の方法。
[C10]
各デバイスは、関連した優先度を有し、前記デバイスを選択することは、各デバイスのそれぞれの前記優先度にさらに基づく、C1に記載の方法。
[C11]
プロセッサ実行可能なプログラムコードを備える非一時的コンピュータ可読媒体であって、前記コードは、電子デバイスのプロセッサに、
着信音声通信要求のインジケーションを受信することと、
前記インジケーションに応答して、および通知を出力するようデバイスに要求する前に、
前記電子デバイスに接続された1つまたは複数のデバイスを識別することと、前記1つまたは複数のデバイスの各々は、オーディオ入力デバイスおよびオーディオ出力デバイスを備え、
そのそれぞれのオーディオ入力デバイスを使用してオーディオ信号を検出するよう各識別されたデバイスに要求することと、
第1のオーディオ信号に基づいて音声を受信することと、前記第1のオーディオ信号は、前記1つまたは複数のデバイスのうちの1つによって受信され、
前記音声に基づいて前記1つまたは複数のデバイスのうちの第1のデバイスを選択することと、
前記着信音声通信要求を示す通知を出力するために、前記第1のデバイスに信号を提供することと
を行わせるように構成される、非一時的コンピュータ可読媒体。
[C12]
前記着信音声通信要求は、着信セルラフォンコールまたは着信ビデオ会議コールである、C11に記載の非一時的コンピュータ可読媒体。
[C13]
プロセッサに、音声認識技法を使用して1つまたは複数のオーディオ信号に基づいて前記音声を認識させるように構成されたプロセッサ実行可能なプログラムコードをさらに備え、ここにおいて、前記第1のデバイスの前記選択は、前記認識された音声にさらに基づく、C11に記載の非一時的コンピュータ可読媒体。
[C14]
前記音声は、複数の音声を備え、プロセッサに、音声認識技法を使用して前記複数の音声のうちの1つまたは複数の音声を認識させるように構成されたプロセッサ実行可能なプログラムコードをさらに備える、C11に記載の非一時的コンピュータ可読媒体。
[C15]
プロセッサに、
各認識された音声についての優先度を決定することと、
最も高い優先度を有する前記認識された音声を識別することと、
前記最も高い優先度を有する前記認識された音声に基づいて前記第1のデバイスを選択することと
を行わせるように構成されたプロセッサ実行可能なプログラムコードをさらに備える、C14に記載の非一時的コンピュータ可読媒体。
[C16]
プロセッサに、各認識された音声までの距離を決定することと、前記決定した距離に基づいて前記第1のデバイスを選択することと、を行わせるように構成されたプロセッサ実行可能なプログラムコードをさらに備える、C14に記載の非一時的コンピュータ可読媒体。
[C17]
プロセッサに、
前記インジケーションに応答して、および通知を出力するようデバイスに要求する前に、
イメージセンサを有する前記1つまたは複数のデバイスの各々について、そのそれぞれのイメージセンサを使用して1つまたは複数のイメージをキャプチャするよう各デバイスに要求することと、
前記1つまたは複数のキャプチャされたイメージを受信することと、
前記キャプチャされたイメージのうちの少なくとも1つ中の人物を認識することと、 前記認識された人物にさらに基づいて前記第1のデバイスを選択することと
を行わせるように構成されたプロセッサ実行可能なプログラムコードをさらに備える、C11に記載の非一時的コンピュータ可読媒体。
[C18]
プロセッサに、
前記キャプチャされたイメージのうちの1つまたは複数中の複数の人物を認識することと、
各認識された人物についての優先度を決定することと、
最も高い優先度を有する前記認識された人物を識別することと、
前記最も高い優先度を有する前記認識された人物に基づいて前記第1のデバイスを選択することと
を行わせるように構成されたプロセッサ実行可能なプログラムコードをさらに備える、C17に記載の非一時的コンピュータ可読媒体。
[C19]
各デバイスは、関連した優先度を有し、プロセッサに、各デバイスのそれぞれの前記優先度に基づいて前記第1のデバイスを選択させるように構成されたプロセッサ実行可能なプログラムコードをさらに備える、C11に記載の非一時的コンピュータ可読媒体。
[C20]
電子デバイスであって、
マイクロフォンと、
スピーカと、
ネットワークインターフェースと、
非一時的コンピュータ可読媒体と、
前記マイクロフォン、前記スピーカ、前記ネットワークインターフェース、および前記非一時的コンピュータ可読媒体と通信状態であり、かつプロセッサに、
前記ネットワークインターフェースを介して着信音声通信要求のインジケーションを受信することと、
前記インジケーションに応答して、および通知を出力するようデバイスに要求する前に、
前記電子デバイスに接続された1つまたは複数のデバイスを識別することと、前記1つまたは複数のデバイスの各々は、オーディオ入力デバイスおよびオーディオ出力デバイスを備え、
そのそれぞれのオーディオ入力デバイスを使用してオーディオ信号を検出するよう各識別されたデバイスに要求することと、
第1のオーディオ信号に基づいて音声を受信することと、前記第1のオーディオ信号は、前記1つまたは複数のデバイスのうちの1つによって受信され、
前記音声に基づいて前記1つまたは複数のデバイスのうちの第1のデバイスを選択することと、
前記着信音声通信要求を示す通知を出力するために、前記第1のデバイスに信号を提供することと
を行わせるように構成される、前記非一時的コンピュータ可読媒体に記憶されたプロセッサ実行可能なプログラムコードを実行するように構成された前記プロセッサと、
を備える、電子デバイス。
[C21]
前記着信音声通信要求は、着信セルラフォンコールまたは着信ビデオ会議コールである、C20に記載のデバイス。
[C22]
前記プロセッサは、音声認識技法を使用して1つまたは複数のオーディオ信号に基づいて前記音声を認識するためのプロセッサ実行可能なプログラムコードを実行するようにさらに構成され、前記第1のデバイスの前記選択は、前記認識された音声にさらに基づく、C20に記載のデバイス。
[C23]
前記音声は、複数の音声を備え、前記プロセッサは、音声認識技法を使用して前記複数の音声のうちの1つまたは複数の音声を認識するためのプロセッサ実行可能なプログラムコードを実行するようにさらに構成される、C20に記載のデバイス。
[C24]
前記プロセッサは、
各認識された音声についての優先度を決定することと、
最も高い優先度を有する前記認識された音声を識別することと、
前記最も高い優先度を有する前記認識された音声に基づいて前記第1のデバイスを選択することと
を行うためのプロセッサ実行可能なプログラムコードを実行するようにさらに構成される、C23に記載のデバイス。
[C25]
前記プロセッサは、各認識された音声までの距離を決定することと、前記決定した距離に基づいて前記第1のデバイスを選択することと、を行うためのプロセッサ実行可能なプログラムコードを実行するようにさらに構成される、C23に記載のデバイス。
[C26]
イメージセンサをさらに備え、ここにおいて、前記プロセッサは、
前記インジケーションに応答して、および通知を出力するようデバイスに要求する前に、
イメージセンサを有する前記1つまたは複数のデバイスの各々について、そのそれぞれのイメージセンサを使用して1つまたは複数のイメージをキャプチャするよう各デバイスに要求することと、
前記1つまたは複数のイメージを受信することと、
前記イメージのうちの少なくとも1つ中の人物を認識することと、
前記認識された人物にさらに基づいて前記第1のデバイスを選択することと
を行うためのプロセッサ実行可能なプログラムコードを実行するようにさらに構成される、C20に記載のデバイス。
[C27]
前記プロセッサは、
前記イメージの1つまたは複数中の複数の人物を認識することと、
各認識された人物についての優先度を決定することと、
最も高い優先度を有する前記認識された人物を識別することと、
前記最も高い優先度を有する前記認識された人物に基づいて前記第1のデバイスを選択することと
を行うためのプロセッサ実行可能なプログラムコードを実行するようにさらに構成される、C26に記載のデバイス。
[C28]
各デバイスは、関連した優先度を有し、前記プロセッサは、各デバイスのそれぞれの前記優先度に基づいて前記第1のデバイスを選択するためのプロセッサ実行可能なプログラムコードを実行するようにさらに構成される、C20に記載のデバイス。
[C29]
装置であって、
着信音声通信要求のインジケーションを受信するための手段と、
前記インジケーションに応答して、および通知を出力するようデバイスに要求する前に、前記装置に接続される1つまたは複数のデバイスを識別するための手段と、前記1つまたは複数のデバイスの各々は、オーディオ入力デバイスおよびオーディオ出力デバイスを備え、
前記インジケーションに応答して、および前記通知を出力することなしに、そのそれぞれのオーディオ入力デバイスを使用してオーディオ信号を検出するよう各識別されたデバイスに要求するための手段と、
第1のオーディオ信号に基づいて音声を受信するための手段と、前記第1のオーディオ信号は、前記1つまたは複数のデバイスのうちの1つによって受信され、
前記音声に基づいて前記1つまたは複数のデバイスのうちの第1のデバイスを選択するための手段と、
前記着信音声通信要求を示す通知を出力するために、前記第1のデバイスに信号を提供するための手段と
を備える、装置。
[C30]
各音声までの距離を決定するための手段をさらに備え、ここにおいて、前記第1のデバイスを選択するための前記手段は、前記決定された距離にさらに基づく、C29に記載の装置。