(58)【調査した分野】(Int.Cl.,DB名)
現在の時間帯及び現在ユーザが位置する空間でのユーザの予測状況又は予測行動を、前記空間別及び時間帯別にパターン化されたユーザ情報及び現在ユーザが位置する空間の種類に基づいて決定する段階
をさらに含むことを特徴とする、請求項13に記載の情報提供方法。
請求項10〜15のうちのいずれか一項に記載の方法をコンピュータに実行させるためのプログラムが記録されていることを特徴とする、コンピュータ読み取り可能な記録媒体。
【発明を実施するための形態】
【0014】
以下、実施形態について、添付の図面を参照しながら詳しく説明する。
【0015】
本発明の実施形態に係る情報提供装置は、音声を基盤として動作するインタフェースを提供する電子機器によって実現されてよい。このような電子機器は、音声要請を直接に処理して応答情報を生成するか、別途のインタフェースコネクトを介して連結する外部プラットフォームによって音声要請を認識及び分析して処理してよい。例えば外部プラットフォームは、電子機器からユーザの音声要請を受信し、受信した音声要請を分析してユーザの意図に適したクエリ又は該当のクエリに対応する応答情報を生成するクラウド人工知能プラットフォームを含んでよい。このとき、電子機器は、室内に区画された複数の空間の中からユーザが位置する空間を決定してよく、このようなユーザの位置する空間に応じてユーザに能動的に情報を提供してよい。例えば電子機器は、ユーザの音声要請とは関係なくユーザが位置する空間に適した情報を提供し、ユーザの音声要請に対する返答を提供する過程において、ユーザが位置する空間に適した情報を追加でさらに提供してよい。他の例として、電子機器は、ユーザの位置する空間に応じて、ユーザの同じ音声要請を異なるように解釈してもよく、ユーザの音声要請に対する認識エラーを訂正してもよい。
【0016】
本発明の実施形態に係る情報提供方法は、上述した電子機器によって実行されてよい。このとき、電子機器には、本発明の一実施形態に係るコンピュータプログラムがインストール及び駆動されてよく、電子機器は、駆動するコンピュータプログラムの制御に従って本発明の一実施形態に係る情報提供方法を実行してよい。上述したコンピュータプログラムは、コンピュータで実現される電子機器と結合して情報提供方法をコンピュータに実行させるためにコンピュータで読み取り可能な記録媒体に格納されてよい。
【0017】
図1は、本発明の一実施形態における、音声基盤のインタフェースを活用したサービス環境の例を示した図である。
図1の実施形態では、スマートホーム(smart home)やホームネットワークサービスのように宅内の機器を連結して制御する技術において、音声基盤のインタフェース(一例として、マイクとスピーカ)を含む電子機器100が、ユーザ110の発話「電気を消して」121をマイクで受信することによって音声要請を認識及び分析し、「リビングの電気を消しましょうか?」122のような応答情報をスピーカから出力する例を示している。さらに、
図1の実施形態では、応答情報に対応するユーザ110の発話「うん」123に従って受信される音声要請を認識及び分析し、電子機器100と内部ネットワークを介して連動する宅内照明機器130のライト電源を制御する例を示している。
【0018】
ここで、宅内の機器は、上述した宅内照明機器130の他にも、IPTV、PC(Personal Computer)、周辺機器、エアコン、冷蔵庫、ロボット清掃機などのような家電製品はもちろん、水道、電気、冷暖房機器などのようなエネルギー消費装置、ドアロックや監視カメラなどのような保安機器など、オンライン上で連結して制御可能な多様な機器を含んでよい。また、内部ネットワークは、イーサネット(Ethernet)(登録商標)、HomePNA、IEEE 1394のような有線ネットワーク技術、ブルートゥース(Bluetooth)(登録商標)、UWB(ultra Wide Band)、ジグビー(ZigBee)(登録商標)、Wireless 1394、Home RFのような無線ネットワーク技術などが活用されてよい。
【0019】
電子機器100は、宅内の機器のうちの1つであってよい。例えば電子機器100は、宅内に備えられた人工知能スピーカやロボット清掃機などのような機器のうちの1つであってよい。また、電子機器100は、スマートフォン(smart phone)、携帯電話、ノート型パンコン、デジタル放送用端末、PDA(Personal Digital Assistants)、PMP(Portable Multimedia Player)、タブレットなどのようなユーザ110のモバイル機器であってもよい。このように、電子機器100は、ユーザ110の音声要請を受信して宅内の機器を制御するために宅内の機器と連結可能な機能を含む機器であれば、特に制限されることはない。また、実施形態によっては、上述したユーザ110のモバイル機器が宅内の機器として含まれてもよい。
【0020】
応答情報は、
図1の実施形態のように、基本的に音声基盤インタフェースに対応するメインメディア(一例として、電子機器100が含むスピーカ)から出力されてよいが、上述したように、本発明の実施形態において、応答情報は、さらに多様なメディアから出力されてもよく、電子機器100は、音声要請及び/又は応答情報に応じて応答情報が出力されるメディアを決定してよい。例えば
図1は、IPTV140とユーザ110のモバイル機器150をさらに示している。この場合、応答情報は、IPTV140やモバイル機器150のディスプレイから視覚的にユーザ110に出力されてよい。このとき、電子機器100は、応答情報を出力するためのメディアの決定はもちろん、聴覚的出力と視覚的出力の効率性に基づいて応答情報を出力するためのメディアを決定してよい。
【0021】
図2は、本発明の一実施形態における、音声基盤のインタフェースを活用したサービス環境の他の例を示した図である。
図2は、音声基盤インタフェースを含む電子機器100がユーザ110の発話「今日の天気」210を認識及び分析し、外部ネットワークを介して外部サーバ220から今日の天気に関する情報を取得し、取得した情報を「今日の天気は・・・」230のように音声で合成して出力する例を示している。例えば外部ネットワークは、PAN(personal area network)、LAN(local area network)、CAN(campus area network)、MAN(metropolitan area network)、WAN(wide area network)、BBN(broadband network)、インターネットなど、ネットワークのうちの1つ以上の任意のネットワークを含んでよい。
【0022】
図2の実施形態でも、電子機器100は、宅内の機器のうちの1つであるか、ユーザ110のモバイル機器のうちの1つであってよく、ユーザ110の音声要請を受信して処理するための機能と、外部ネットワークを介して外部サーバ220と通信して外部サーバ220が提供するサービスやコンテンツをユーザ110に提供するための機能を含む機器であれば、特に制限されることはない。このように、本発明の実施形態に係る電子機器100は、ユーザ110の発話に従って受信される音声要請を音声基盤のインタフェースによって処理することのできる機器であれば、特に制限されることはない。例えば電子機器100は、ユーザの音声要請を直接に認識及び分析して音声要請を処理してもよいが、実施形態によっては、電子機器100と連係する外部のプラットフォーム(一例として、上述したクラウド人工知能プラットフォーム)によって音声要請を処理してもよい。
【0023】
このとき、電子機器100は、ユーザの音声要請に対応する応答情報を出力するためのメディアを音声要請及び/又は応答情報に基づいて自動で決定してよい。
図2では、電子機器100が応答情報を「今日の天気は・・・」230のように聴覚的に出力すると同時に、IPTV140のディスプレイから視覚的にも出力する例を示している。このために、電子機器100は、応答情報の出力が可能な複数のメディアに関する情報を管理してよく、音声要請及び/又は応答情報に基づいて複数のメディアの中から応答情報を出力するための少なくとも1つのメディアを選択し、応答情報を伝達してよい。
【0024】
図3は、本発明の一実施形態における、クラウド人工知能プラットフォームの例を示した図である。
図3は、電子機器310とクラウド人工知能プラットフォーム320、及びコンテンツ・サービス330を示している。
【0025】
一例として、電子機器310は、宅内に備えられる機器を意味してよく、少なくとも上述した電子機器100を含んでよい。このような電子機器310や電子機器310にインストール及び駆動されるアプリケーション(以下、アプリとする)は、インタフェースコネクト340を介してクラウド人工知能プラットフォーム320と連係してよい。ここで、インタフェースコネクト340は、電子機器310や電子機器310にインストール及び駆動されるアプリの開発のためのソフトウェア開発キット(SDK:Software Development Kit)及び/又は開発文書を開発者に提供してよい。また、インタフェースコネクト340は、電子機器310や電子機器310にインストール及び駆動されるアプリが、クラウド人工知能プラットフォーム320によって提供される機能を活用することを可能にするAPI(Application Program Interface)を提供してよい。具体的な例として、開発者がインタフェースコネクト340によって提供されるSDK及び/又は開発文書を利用して開発した機器やアプリは、インタフェースコネクト340によって提供されるAPIを利用してクラウド人工知能プラットフォーム320によって提供される機能を活用することを可能にする。
【0026】
ここで、クラウド人工知能プラットフォーム320は、音声基盤のサービスを提供するための機能を提供してよい。例えばクラウド人工知能プラットフォーム320は、受信された音声を認識し、出力される音声を合成するための音声処理モジュール321、受信された映像や動画を分析して処理するためのビジョン処理モジュール322、受信された音声に従って適した音声を出力するために適切な対話を決定するための対話処理モジュール323、受信された音声に適した機能を推薦するための推薦モジュール324、人工知能がデータ学習によって文章単位で言語を翻訳するように支援するニューラル機械翻訳(Neural Machine Translation:NMT)325などのように、音声基盤サービスを提供するための多様なモジュールを含んでよい。
【0027】
例えば
図1及び
図2の実施形態において、電子機器100が、ユーザ110の音声要請を、インタフェースコネクト340で提供するAPIを利用してクラウド人工知能プラットフォーム320に送信したとする。この場合、クラウド人工知能プラットフォーム320は、受信された音声要請を上述したモジュール321〜325を活用して認識及び分析してよく、受信された音声要請に従って適切な返答音声を合成して提供するか、適切な動作を推薦してよい。
【0028】
また、拡張キット350は、第三者コンテンツ開発者又は会社が、クラウド人工知能プラットフォーム320に基づいて新たな音声基盤機能を実現することができる開発キットを提供してよい。例えば
図2の実施形態において、電子機器100は、受信したユーザ110の音声要請を外部サーバ220に送信してよく、外部サーバ220は、拡張キット350によって提供されるAPIを利用してクラウド人工知能プラットフォーム320に音声要請を送信してよい。この場合、上述と同じように、クラウド人工知能プラットフォーム320は、受信される音声要請を認識及び分析して適切な返答音声を合成して提供するか、音声要請によって処理されるべき機能に関する推薦情報を外部サーバ220に提供してよい。一例として、
図2において、外部サーバ220が、音声要請「今日の天気」をクラウド人工知能プラットフォーム320に送信すると、クラウド人工知能プラットフォーム320から、音声要請「今日の天気」の認識によって抽出されるキーワード「今日の」及び「天気」を受信したとする。この場合、外部サーバ220は、キーワード「今日の」及び「天気」に基づいて「今日の天気は・・・」のようなテキスト情報を生成し、生成されたテキスト情報をクラウド人工知能プラットフォーム320に再び送信してよい。このとき、クラウド人工知能プラットフォーム320は、テキスト情報を音声で合成して外部サーバ220に提供してよい。外部サーバ220は、合成された音声を電子機器100に送信してよく、電子機器100が合成された音声「今日の天気は・・・」をスピーカから出力することにより、ユーザ110から受信した音声要請「今日の天気」が処理されてよい。
【0029】
図4は、本発明の一実施形態における、電子機器及びサーバの内部構成を説明するためのブロック図である。
図4の電子機器410は、上述した電子機器100に対応してよく、本発明の実施形態に係る情報提供装置に対応してよい。また、サーバ420は、上述した外部サーバ220やクラウド人工知能プラットフォーム320を実現する1つのコンピュータ装置に対応してよい。
【0030】
電子機器410及びサーバ420は、それぞれ、メモリ411、421、プロセッサ412、422、通信インタフェース413、423、及び入力/出力インタフェース414、424を含んでよい。メモリ411、421は、コンピュータで読み取り可能な記録媒体であって、RAM(random access memory)、ROM(read only memory)、及びディスクドライブのような永久大容量記憶装置(permanent mass storage device)を含んでよい。ここで、ROMとディスクドライブのような永久大容量記憶装置は、メモリ411、421とは区別される別の永久記憶装置として電子機器410やサーバ420に含まれてもよい。また、メモリ411、421には、オペレーティングシステムと、少なくとも1つのプログラムコード(一例として、電子機器410にインストールされ、特定のサービスを提供するために電子機器410で駆動するアプリケーションなどのためのコード)が格納されてよい。このようなソフトウェア構成要素は、メモリ411、421とは別のコンピュータで読み取り可能な記録媒体からロードされてよい。このような別のコンピュータで読み取り可能な記録媒体は、フロッピー(登録商標)ドライブ、ディスク、テープ、DVD/CD−ROMドライブ、メモリカードなどのコンピュータで読み取り可能な記録媒体を含んでよい。他の実施形態において、ソフトウェア構成要素は、コンピュータで読み取り可能な記録媒体ではない通信インタフェース413、423を通じてメモリ411、421にロードされてもよい。例えば少なくとも1つのプログラムは、開発者又はアプリケーションのインストールファイルを配布するファイル配布システムがネットワーク430を介して提供するファイルによってインストールされるコンピュータプログラム(一例として、上述したアプリケーション)に基づいて電子機器410のメモリ411にロードされてよい。
【0031】
プロセッサ412、422は、基本的な算術、ロジック及び入出力演算を実行することにより、コンピュータプログラムの命令を処理するように構成されてよい。命令は、メモリ411、421又は通信インタフェース413、423によって、プロセッサ412、422に提供されてよい。例えばプロセッサ412、422は、メモリ411、421のような記録装置に格納されたプログラムコードに従って受信される命令を実行するように構成されてよい。
【0032】
通信インタフェース413、423は、ネットワーク430を介して電子機器410とサーバ420とが互いに通信するための機能を提供してもよいし、電子機器410及び/又はサーバ420が他の電子機器又は他のサーバと通信するための機能を提供してもよい。一例として、電子機器410のプロセッサ412がメモリ411のような記録装置に格納されたプログラムコードに従って生成した要求が、通信インタフェース413の制御に従ってネットワーク430を介してサーバ420に伝達されてよい。これとは逆に、サーバ420のプロセッサ422の制御に従って提供される制御信号や命令、コンテンツ、ファイルなどが、通信インタフェース423とネットワーク430を経て電子機器410の通信インタフェース413を通じて電子機器410に受信されてもよい。例えば通信インタフェース413を通じて受信したサーバ420の制御信号や命令、コンテンツ、ファイルなどは、プロセッサ412やメモリ411に伝達されてよく、コンテンツやファイルなどは、電子機器410がさらに含むことのできる格納媒体(上述した永久記憶装置)に格納されてよい。
【0033】
入力/出力インタフェース414は、入力/出力装置415とのインタフェースのための手段であってよい。例えば入力装置は、マイク、キーボード、又はマウスなどの装置を含んでよく、出力装置は、ディスプレイ、スピーカのような装置を含んでよい。他の例として、入力/出力インタフェース414は、タッチスクリーンのように入力と出力のための機能が1つに統合された装置とのインタフェースのための手段であってもよい。入力/出力装置415は、電子機器410と1つの装置で構成されてもよい。また、サーバ420の入力/出力インタフェース424は、サーバ420と連結するか、サーバ420が含むことのできる入力又は出力のための装置(図示せず)とのインタフェースのための手段であってもよい。
【0034】
また、他の実施形態において、電子機器410及びサーバ420は、
図4の構成要素よりも少ないか多くの構成要素を含んでもよい。しかし、大部分の従来技術的構成要素を明確に図に示す必要はない。例えば電子機器410は、上述した入力/出力装置415のうちの少なくとも一部を含むように実現されてもよいし、トランシーバ、GPS(Global Positioning System)モジュール、カメラ、各種センサ、データベースなどのような他の構成要素をさらに含んでもよい。より具体的な例として、電子機器410がスマートフォンである場合、一般的にスマートフォンに含まれる加速度センサやジャイロセンサ、カメラモジュール、物理的な各種ボタン、タッチパネルを利用したボタン、入力/出力ポート、振動のための振動器などのような多様な構成要素が電子機器410にさらに含まれるように実現されてよい。
【0035】
本実施形態において、電子機器410は、ユーザの音声要請を受信するためのマイク(一例として、
図4のマルチチャンネルマイク417)及び/又は応答情報を聴覚的に出力するためのスピーカ(一例として、
図4のスピーカ416)を入力/出力装置415として含んでよい。
【0036】
このとき、本発明の実施形態は、室内の区画された空間をさらに考慮してよい。
【0037】
図5は、本発明の一実施形態における、室内の区画された空間と位置に関する情報の例を示した図である。
図5の平面
図500は、室内の区画された空間の種類(リビング、キッチン、玄関、トイレ、寝室など)、室内での電子機器410の位置及びユーザの位置510、520、530の例を示している。例えばユーザの第1位置510による空間は「リビング」であり、第2位置520による空間は「キッチン」であり、第3位置530による空間は「玄関」であってよい。
【0038】
電子機器410は、室内の区画された空間の中からユーザが位置する空間を決定してよく、決定された空間に基づいて、電子機器410に含まれる音声基盤の入力/出力インタフェース(一例として、
図4の入力/出力インタフェース414)で受信されるユーザの音声要請の解釈を動的に調整するか、あるいは決定された空間に基づいて、電子機器410によって能動的に決定された情報を、音声基盤の入力/出力インタフェースを通じてユーザに提供してよい。例えばユーザが第1位置510である「リビング」に位置する場合と第2位置520である「キッチン」に位置する場合に対し、電子機器410は、それぞれ異なる情報をユーザに提供してよい。他の例として、ユーザが第1位置510である「リビング」に位置する場合と第2位置520である「キッチン」に位置する場合に対し、電子機器410は、ユーザの発話が同じであっても、それぞれ異なるように解釈してもよい。
【0039】
より具体的な例として、第1位置510である「リビング」に位置するユーザの発話「たまねぎ」に対し、電子機器410は、「歌手たまねぎの歌」又は「たまねぎに関するTV番組」を出力してよく、第2位置520である「キッチン」に位置するユーザの発話「たまねぎ」に対し、電子機器410は、「たまねぎ購入」又は「たまねぎを使ったレシピ」に関する情報をユーザに提供してよい。
【0040】
このように、空間に応じて適した情報を提供するために、電子機器410は、室内に区画された複数の物理的空間を把握してよく、このような物理的空間の把握及び/又はユーザの位置(電子機器410からの相対的な方向と距離)の把握は、ユーザが機器を使用中でないときでも周期的に実行されてよい。
【0041】
図6は、本発明の一実施形態における、単一機器で物理的空間を把握する例を示した図である。電子機器410は、音声基盤の入力/出力インタフェースに含まれるスピーカから音信号を出力してよい。このような音信号は、ユーザが認識することのできる音帯域であっても、ユーザが認識することのできない音帯域であってもよい。また、電子機器410は、出力された音信号が室内で反射することによって受信される反射信号の入力を、マルチチャンネルマイクでチャンネル別に受信してよい。1つのスピーカから出力された音信号は電子機器410の周囲に広がり、室内の区画された境界の壁面などで反射した後、電子機器410に再び伝達されるようになる。このような反射信号は、電子機器410のマルチチャンネルマイクのチャンネル別にそれぞれ入力されてよい。このとき、マルチチャンネルマイクに入力される反射信号の電子機器410を基準とする相対的な方向は、マルチチャンネルマイクのチャンネル別に入力される特定の反射信号の位相変位(phase shift)に基づいて決定されてよい。複数のマイクに入力される同一の音信号の位相変位を利用して音信号の発生位置を測定する技術は、ビームフォーミング(beam forming)技術のように周知の技術であるため、当業者であれば容易に理解することができるであろう。本実施形態において、電子機器410は、特定の反射信号がマルチチャンネルマイクのチャンネル別に入力され、このようなチャンネル別に入力された特定の反射信号の位相変位に基づいて該当の反射信号の方向を決定してよい。また、電子機器410は、音信号の出力時刻と該当の反射信号のチャンネル別の入力時刻に基づき、電子機器410と区画された空間の境界に関する情報(一例として、距離)を計算してよい。言い換えれば、電子機器410は、特定の反射信号に対する方向と距離を求めることが可能であるが、これは、電子機器410を基準として区画された空間の境界を測定することが可能であることを意味してよい。例えば電子機器410は、一定の距離内で空間的に閉鎖された場所の方向と開放された場所の方向を区分することが可能である。
【0042】
再び
図5を参照すると、電子機器410は、第1位置510である「リビング」に位置するユーザの発話の方向が空間的に閉鎖された場所への方向であるため、ユーザが電子機器410と同じ空間に存在することを認識するようになる。この場合、ユーザの発話の方向も、上述したビームフォーミング技術によって決定されてよい。
【0043】
一方、電子機器410は、第2位置520である「キッチン」又は第3位置530である「玄関」に位置するユーザの発話の方向が空間的に開放されている方向であるため、ユーザが電子機器410とは異なる空間に存在することを認識してよい。
【0044】
図7は、本発明の一実施形態における、複数のサブ機器を活用して物理的空間を把握する例を示した図である。
図7の平面
図700は、
図5の平面
図500と類似する、室内の区画された空間の種類(居間、キッチン、玄関、トイレ、寝室など)、室内での電子機器410の位置及びユーザの位置510、520、530の例を示しており、複数のサブ機器710、720、730が追加された例を示している。複数のサブ機器710、720、730は、一例として、電子機器410と通信可能な複数のサブスピーカであってよく、ユーザの接近を感知するセンサ(一例として、近接センサ、IRセンサなど)を含んでよい。この場合、電子機器410は、複数のサブ機器710、720、730それぞれが位置する空間に関する情報を管理してよく、このような空間に関する情報と複数のサブ機器710、720、730のセンサ情報に基づいてユーザが位置する空間を決定してよい。例えば電子機器410は、複数のサブスピーカそれぞれから出力されてマルチチャンネルマイクに入力されるチャンネル別の音信号に基づいて複数のサブスピーカそれぞれとの距離及び方向を決定してよく、決定された距離及び方向に基づき、複数のサブ機器それぞれが位置する空間に関する情報を生成してよい。
【0045】
より具体的な例として、第1サブ機器710から出力される音信号が電子機器410のマルチチャンネルマイクに入力されることにより、電子機器410は、第1サブ機器710が位置する方向と相対的な距離を決定してよい。このとき、電子機器410において、第1サブ機器710の方向は閉鎖されている場所への方向であり、第1サブ機器710が位置する方向との相対的な距離は空間の境界までの相対的な距離よりも遠いため、電子機器410は、一例として、第1サブ機器710が「時計の1時方向」の「電子機器410が位置する空間とは異なる空間」に位置していることを把握してよい。第1サブ機器710がセンサによってユーザの接近を知らせてきた場合、電子機器410は、ユーザが「時計の1時方向」の「電子機器410が位置する空間とは異なる空間」に位置していると決定してよい。
【0046】
以下では、電子機器410が把握した「電子機器410が位置する空間とは異なる空間」の種類を決定するための実施形態について説明する。例えば上述した
図7の実施形態において、電子機器410は、第1サブ機器710の位置する空間にユーザが位置することは把握したが、このような空間の種類も把握する必要がある。このために、電子機器410は、ユーザが位置する空間別に、ユーザの発話内容と発話内容に関連するユーザの活動うちの少なくとも一方についてのユーザ情報を時間帯別にパターン化してよい。例えば電子機器410は、ユーザ情報を空間別さらには時間帯別にデータベースに格納及び累積してよく、累積情報を空間別にさらには時間帯別に分析してよい。ユーザが「時計の1時方向」の「異なる空間」で「レシピ」、「カロリー」、「料理の材料」などに関する内容の発話を頻繁に要請する場合、電子機器410は、「時計の1時方向」の「異なる空間」を「キッチン」と認識してよい。他の例として、「時計の4時方向」の「異なる空間」でユーザが室内の外部に出ていくか外部から入ってくる活動が感知される場合、電子機器410は、「時計の4時方向」の「異なる空間」を「玄関」と認識してよい。このようなユーザの活動は、ユーザの外出を意味するユーザの発話、ユーザの位置に対する感知の有無及び/又はユーザのスケジュールのような外部情報に基づいて決定されてよい。例えば電子機器410は、ユーザのスケジュールにおいて「午後7時」に約束があり、「午後6時半」に「時計の4時方向」の「異なる空間」でユーザの発話「全体消灯」が認識された後、ユーザの位置がそれ以上感知されなければ、ユーザが「時計の4時方向」の「異なる空間」から室内の外部に出ていったことを把握してよい。このようなユーザの行動により、電子機器410は、「時計の4時方向」の「異なる空間」が「玄関」であることを把握することが可能となる。他にも、電子機器410が、各空間が有する特殊性に基づいて該当する空間の種類を把握することが可能であることは、当業者であれば、上述した例を参照することによって理解できるであろう。
【0047】
また、電子機器410は、現在の時間帯及び現在ユーザが位置する空間でのユーザの予測状況又は予測行動を決定してよい。電子機器410は、このような予測に基づき、ユーザに適したコンテンツを能動的に提供してよい。このような予測状況又は予測行動は、現在ユーザが位置する空間の種類と、空間別及び時間帯別にパターン化されたユーザ情報を基盤としてよい。例えば
図5及び/又は
図7の実施形態において、第2位置520である「キッチン」に位置するユーザのパターン化されたユーザ情報に基づき、電子機器410は、該当のユーザは、主に、午後4時頃に夕食の準備のためのレシピを要請することを把握してよい。午後4時頃に現在のユーザの位置が「キッチン」と判断された場合、電子機器410は、ユーザの音声要請とは関係なく、夕食の準備ためのレシピの種類を自動でユーザに勧めてよい。他の例として、電子機器410は、「玄関」に位置するユーザが外出しようとしていると判断された場合(例えばユーザが登録した情報(一例として、ユーザのスケジュール情報)を活用するか、ユーザの移動方向などを利用して判断可能)、自動車の鍵や傘などを持っていくように助言してよい。さらに、ユーザが玄関から外出しようとしている状況で室内に電気が点いている場合、「電気を消しましょうか?」のように能動的に質問した後、ユーザの応答に応じて機器制御などの追加機能を実行させてもよい。
【0048】
このために、電子機器410は、スケジュール情報や天気情報のような外部情報をさらに活用してもよい。スケジュール情報は、ユーザと関連する別途の外部サービスから取得してもよいし、電子機器410がユーザから直接にスケジュール登録を受信して管理してもよい。他の例として、電子機器410は、「バルコニー」に位置するユーザに「植木に水をあげる時間」になったことを知らせたり、「キッチン」に位置するユーザに「卵」の残りの個数と共に「卵購入」と関連する情報を知らせたりすることも可能である。
【0049】
また他の例として、電子機器410は、決定されたユーザの予測状況又は予測行動に基づき、ユーザの発話内容を特定の単語に解釈する確率を動的に調整してもよい。例えば「犬と(韓国語の発音でケラン)」と「計量(韓国語の発音でケリャン)」のように類似する発音の発話に対し、「キッチン」では「犬と」という単語よりも「計量」という単語を発話する確率が相対的に高いことが予想される。これにより、「ケラン」と類似する発音の発話が受信された場合、「キッチン」に位置するユーザの場合には「計量」と認識するようにする反面、「リビング」に位置するユーザの場合には「犬と」と認識するように、ユーザの音声要請に対する解釈を調整することが可能である。このように、本実施形態に係る電子機器410は、ユーザからの設定入力がなくても、室内の区画された空間を測位し、空間それぞれの種類を決定してよく、空間の種類とユーザの状況及び/又は行動パターンに基づいて空間別にユーザコンテキストと関連性の高い情報/コンテンツを提供することにより、情報提供の有用性を向上させることができる。また、ユーザから明確な要請がなくても、ユーザが位置する空間とユーザの状況及び/又は行動パターンに基づいて電子機器410が能動的に特定の情報を決定し、ユーザに提供してもよい。
【0050】
また、電子機器410は、ユーザの位置に基づいて情報の出力メディアを決定してもよい。例えば電子機器410は、室内に位置する複数の出力メディアと通信する通信インタフェースを含んでよく、このような複数の出力メディアの位置とユーザの位置に基づき、複数の出力メディアの中から少なくとも1つの出力メディアを決定してよい。この場合、電子機器410は、ユーザに提供するための情報が決定された少なくとも1つの出力メディアから出力されるように、ユーザに提供するための情報を、通信インタフェースを通じて決定された少なくとも1つの出力メディアに送信してよい。
【0051】
図8は、本発明の一実施形態における、複数の出力メディアから情報を提供する例を示した図である。電子機器410は、複数の出力メディアと通信してよい。複数の出力メディアは、上述した宅内の機器(ユーザのモバイル機器を含む)のうち、視覚的及び/又は聴覚的に情報の出力が可能な機器であってよい。また、複数の出力メディアは、視覚的及び/又は聴覚的に情報の出力が可能な機器にインストールされたアプリケーションであってもよい。例えば電子機器410は、第2位置520である「キッチン」に位置するユーザに、「キッチン」に位置する第1サブ機器710を通じて情報を提供してよい。このような情報は、ユーザの音声要請に対する返答であっても、電子機器410が能動的にユーザに提供しようとする情報であってもよい。他の例として、電子機器410は、第1位置510である「リビング」に位置するユーザに、IPTV810を通じて情報を提供してもよい。このように、電子機器410は、ユーザが位置する空間に位置する出力メディアを選択してよく、選択された出力メディアからユーザに提供するための情報を出力してよい。
【0052】
他の実施形態として、電子機器410は、ユーザのモバイル機器に情報を提供してもよい。例えば現在、ユーザがモバイル機器を操作中である場合、電子機器410は、操作中であることに関する情報をモバイル機器から受信してよく、出力メディアをユーザが操作中のモバイル機器として決定してよい。
【0053】
情報を提供している途中にユーザが位置する空間の変更が認識された場合、出力メディアも変更されてよい。例えば電子機器410は、ユーザが位置する空間が「キッチン」から「寝室1」に変更された場合、出力メディアを第1サブ機器710から第2サブ機器720に変更してよい。
【0054】
また、電子機器410は、上述した宅内の機器(ユーザのモバイル機器を含む)を出力メディアとして活用するために、このような機器に関する情報を管理してもよい。
【0055】
図9は、本発明の一実施形態における、出力メディアに関する情報の例を示した図である。
図9の表900は、電子機器410と連動して通信可能な電子機器を識別するための機器項目910、他の電子機器の宅内位置を識別するための位置項目920、他の電子機器が含む出力メディアを識別するための出力メディア項目930、出力メディアに関する情報を含む詳細項目940及び出力メディアがどのような情報類型との連係が可能であるかを識別するための情報類型項目950を含む例を示している。電子機器410は、表900のように、宅内で連動する他の電子機器に関する情報と共に、該当する他の電子機器の出力メディアに関する情報を管理してよい。また、このような情報は、音声要請及び/又は音声要請に対する応答情報の情報類型と予め連結されてよい。例えばユーザの音声要請や対応する応答情報が「外部の特定場所」と関連する情報類型として分析される場合、電子機器410は、表900に基づき、電子機器Aの地図アプリケーションを応答情報の出力メディアとして決定してよい。この場合、応答情報は、電子機器Aに伝達されてよく、電子機器Aは、電子機器Aの地図アプリケーションを通じて応答情報に対応する地図サービスをユーザに提供してよい。他の例として、応答情報は、地図アプリケーションを通じて地図サービスを提供するサービスサーバに伝達されてよい。この場合、サービスサーバは、電子機器Aにインストールされた地図アプリケーションを通じて地図サービスを提供してよい。このために、電子機器410は、サービスサーバにアクセスするための情報、及びサービスサーバがユーザの電子機器Aを識別できるようにするためのユーザのアカウントなどのような情報をさらに管理してもよい。例えば電子機器410は、表900が地図アプリケーションと関連してさらに格納しているURLを利用してサービスサーバにアクセスしてよく、ユーザのアカウントと共に応答情報を伝達することにより、サービスサーバがユーザのアカウントを参照した上で、電子機器Aにインストールされた地図アプリケーションを通じて応答情報と連係するサービスを提供するようにしてよい。
【0056】
また、電子機器410は、表900に基づき、ユーザが「キッチン」に位置する場合、電子機器Dのディスプレイ4から情報が視覚的に出力されるように、該当の情報を電子機器Dに送信してよい。他の例として、電子機器410は、1つの空間に複数の出力メディアが存在する場合、出力しようとする情報の類型に適した機器やユーザからより近くにある機器の出力メディアを選択してよい。このとき、1つの空間でユーザからより近くにある機器の出力メディアを選択するために、より具体的な機器の位置が表900で管理されてよい。このような機器の位置は、ユーザの位置と同じように、電子機器410を基準とする相対的な位置であってよい。
【0057】
図10は、本発明の一実施形態における、電子機器の情報提供方法の例を示したフローチャートである。本実施形態に係る情報提供方法は、上述した電子機器410のようなコンピュータ装置によって実行されてよい。このとき、電子機器410のプロセッサ412は、メモリ411が含むオペレーティングシステムのコードや、少なくとも1つのプログラムのコードによる制御命令(instruction)を実行するように実現されてよい。ここで、プロセッサ412は、電子機器410に格納されたコードにより提供される制御命令に従って電子機器410が
図10の情報提供方法に含まれる段階1010及び段階1020を実行するように電子機器410を制御してよい。
【0058】
段階1010において、電子機器410は、複数の空間の中からユーザが位置する空間を決定してよい。一例として、複数の空間は、ホームネットワークサービスが適用されたホームのような、室内の区画された空間を含んでよい。
【0059】
段階1020において、電子機器410は、決定された空間に基づいて、電子機器410に含まれる音声基盤の入力/出力インタフェースで受信されるユーザの音声要請を解釈するか、あるいは決定された空間に基づいて能動的に決定された情報を、音声基盤の入力/出力インタフェースを通じてユーザに提供してよい。例えば電子機器410は、同じユーザの音声要請を、決定された空間に応じて動的に調整して解釈するか、又はユーザからの要請がなくても能動的に空間と関連する情報をユーザに提供してよい。
【0060】
このように、本実施形態では、既に決定されている情報を提供するためにユーザの位置や空間を活用するのではなく、ユーザの位置や空間に応じて能動的にユーザからの要請を調整して解釈するか、又は電子機器410が優先的に空間別のユーザコンテキストと関連性の高い情報を能動的に提供することにより、情報提供の有用性を向上させることができる。
【0061】
図11は、本発明の一実施形態における、ユーザが位置する空間を決定する方法の例を示したフローチャートである。
図11に示された段階1110及び段階1120は、
図10の段階1010に含まれ、電子機器410によって実行されてよい。
【0062】
段階1110において、電子機器410は、スピーカから出力される音信号及び出力された音信号が室内で反射することによってマルチチャンネルマイクにチャンネル別に入力される反射信号に基づき、区画された空間に関する情報を取得してよい。このために、電子機器410は、上述したように、マルチチャンネルマイクにチャンネル別に入力される特定の反射信号の位相変位に基づいて特定の反射信号の方向を決定し、音信号の出力時刻と、特定の反射信号が前記マルチチャンネルマイクに入力されるチャンネル別の入力時刻に基づいて、特定の反射信号の方向への空間の境界との相対的な距離を決定し、音信号に対応する反射信号それぞれに対して決定される方向と相対的な距離に基づいて区画された空間を認識してよい。
【0063】
段階1120において、電子機器410は、取得した空間に関する情報と、ユーザの発話に基づいて測定されるユーザの位置により、ユーザの位置と特定の空間をマッチングしてよい。ユーザの位置も、電子機器410でユーザの発話による音信号をマルチチャンネルマイクでチャンネル別に受信することにより、ユーザとの相対的な方向及び/又は距離を測定することによって得られてよい。
【0064】
このように、本実施形態によると、ユーザが空間に関する情報(空間の種類や構造、位置など)を設定しなくても、電子機器410が自動的に室内の区画された空間に関する情報を取得し、ユーザがどの種類の空間に位置しているかを把握することが可能となる。
【0065】
図12は、本発明の一実施形態における、ユーザが位置する空間を決定する方法の他の例を示したフローチャートである。
図12に示された段階1210及び段階1220は、
図10の段階1010に含まれ、電子機器410によって実行されてよい。
【0066】
段階1210において、電子機器410は、複数のサブ機器それぞれが位置する空間に関する情報を管理してよい。ここで、複数のサブ機器は、ユーザの接近を感知するセンサを含んでよく、電子機器410に含まれる通信インタフェース413を介して、電子機器410と通信してよい。
【0067】
段階1220において、電子機器410は、通信インタフェース413により、複数のサブ機器から受信されるセンサ情報と複数のサブ機器それぞれが位置する空間に関する情報に基づいてユーザが位置する空間を決定してよい。一例として、複数のサブ機器は、複数のサブスピーカを含んでよい。この場合、電子機器410は、複数のサブスピーカそれぞれから出力されてマルチチャンネルマイクに入力されるチャンネル別の音信号に基づいて、複数のサブスピーカそれぞれとの距離及び方向を決定し、決定された距離及び方向に基づいて、複数のサブ機器それぞれが位置する空間に関する情報を生成してよい。実施形態によっては、
図9を参照しながら説明したように、複数のサブ機器を含む多様な宅内の機器に関する位置情報がさらに活用されてもよい。
【0068】
本実施形態によると、ユーザが空間に関する情報(空間の種類や構造、位置など)を設定しなくても、電子機器410が、複数のサブ機器から提供されるセンサ情報と複数のサブ機器が位置する空間に関する情報に基づき、室内の区画された空間に関する情報を取得することができる。
図12の実施形態は、
図11の実施形態と組み合わせてより正確な空間に関する情報を取得するのに利用されてよく、これにより、ユーザが位置する空間に関する情報もより正確になる。
【0069】
図13は、本発明の一実施形態における、ユーザの状況及び/又は行動を予測し、予測された状況及び/又は行動に基づいて情報を提供する方法の例を示したフローチャートである。
【0070】
段階1310において、電子機器410は、ユーザが位置する空間別のユーザの発話内容及びユーザの活動のうちの少なくとも一方のユーザ情報を時間帯別にパターン化してよい。
【0071】
段階1320において、電子機器410は、空間別及び時間帯別にパターン化されたユーザ情報に基づき、区画された空間それぞれの種類を決定してよい。
【0072】
段階1330において、電子機器410は、現在の時間帯及び現在ユーザが位置する空間でのユーザの予測状況又は予測行動を、空間別及び時間帯別にパターン化されたユーザ情報及び現在ユーザが位置する空間の種類に基づいて決定してよい。
【0073】
段階1340において、電子機器410は、決定されたユーザの予測状況又は予測行動に基づき、ユーザの発話内容を特定の単語に解釈する確率を動的に調整するか、ユーザの発話内容に応じて提供する情報を決定するか、又はユーザの発話とは関係なくユーザに提供する情報を能動的に決定してよい。
【0074】
このように、本実施形態によると、現在ユーザが位置している空間の種類と空間別及び/又は時間帯別にパターン化されたユーザ情報を活用することにより、ユーザの状況又は行動を予測することができ、空間別/時間帯別に予測された状況や行動に応じて電子機器410が能動的にユーザの発話の解釈を調節したり、又はユーザの音声要請とは関係なく能動的に情報をユーザに提供したりすることが可能となる。
【0075】
上述したシステム又は装置は、ハードウェア構成要素、ソフトウェア構成要素、又はハードウェア構成要素とソフトウェア構成要素との組み合わせによって実現されてよい。例えば実施形態で説明された装置及び構成要素は、例えばプロセッサ、コントローラ、ALU(arithmetic logic unit)、デジタル信号プロセッサ、マイクロコンピュータ、FPGA(field programmable gate array)、PLU(programmable logic unit)、マイクロプロセッサ、又は命令を実行して応答することができる様々な装置のように、1つ以上の汎用コンピュータ又は特殊目的コンピュータを利用して実現されてよい。処理装置は、オペレーティングシステム(OS)及び前記OS上で実行される1つ以上のソフトウェアアプリケーションを実行してよい。また、処理装置は、ソフトウェアの実行に応答し、データにアクセスし、データを格納、操作、処理及び生成してもよい。理解の便宜のために、1つの処理装置が使用されるとして説明される場合もあるが、当業者は、処理装置が複数個の処理要素及び/又は複数種類の処理要素を含んでもよいことが理解できるであろう。例えば処理装置は、複数個のプロセッサ又は1つのプロセッサ及び1つのコントローラを含んでよい。また、並列プロセッサのような、他の処理構成も可能である。
【0076】
ソフトウェアは、コンピュータプログラム、コード、命令又はこれらのうちの1つ以上の組み合わせを含んでもよく、所望のとおりに動作するように処理装置を構成したり、独立的又は集合的に処理装置に命令したりしてよい。ソフトウェア及び/又はデータは、処理装置に基づいて解釈されたり、処理装置に命令又はデータを提供したりするために、いかなる種類の機械、コンポーネント、物理装置、仮想装置、コンピュータ格納媒体又は装置に具現化されてよい。ソフトウェアは、ネットワークによって接続されたコンピュータシステム上に分散されてよく、分散された状態で格納されても実行されてもよい。ソフトウェア及びデータは、1つ以上のコンピュータで読み取り可能な記録媒体に格納されてよい。
【0077】
実施形態に係る方法は、多様なコンピュータ手段によって実行可能なプログラム命令の形態で実現されてコンピュータで読み取り可能な媒体に記録されてよい。コンピュータで読み取り可能な媒体は、プログラム命令、データファイル、データ構造などを単独又は組み合わせて含んでよい。媒体は、コンピュータによって実行可能なプログラムを継続して格納するものであっても、実行又はダウンロードのために一時的に格納するものであってもよい。また、媒体は、単一又は複数個のハードウェアが結合した形態の多様な記録手段又は格納手段であってよいが、あるコンピュータシステムに直接接続する媒体に限定されてはならず、ネットワーク上に分散して存在するものであってもよい。媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体、CD−ROM及びDVDのような光媒体、フロプティカルディスク(floptical disk)のような光磁気媒体、及びROM、RAM、フラッシュメモリなどを含んでプログラム命令語が格納されるように構成されたものであってよい。また、他の媒体の例として、アプリケーションを流通するアプリストアや他の多様なソフトウェアを供給ないし流通するサイト、サーバなどで管理する記録媒体ないし格納媒体が挙げられてもよい。プログラム命令の例には、コンパイラによって生成されるような機械語コードだけでなく、インタプリタなどを利用してコンピュータによって実行されることが可能な高級言語が含まれる。
【0078】
以上のように、実施形態を、限定された実施形態と図面に基づいて説明したが、当業者であれば、上述した記載から多様な修正及び変形が可能であろう。例えば説明された技術が、説明された方法とは異なる順序で実行されたり、かつ/あるいは、説明されたシステム、構造、装置、回路などの構成要素が、説明された方法とは異なる形態で結合されたり又は組み合わされたり、他の構成要素又は均等物によって代替されたり置換されたとしても、適切な結果を達成することができる。
【0079】
したがって、異なる実施形態であっても、特許請求の範囲と均等なものであれば、添付される特許請求の範囲に属する。