(58)【調査した分野】(Int.Cl.,DB名)
前記移動制御部は、前記受付機能が受け付けた音が利用者の発した音声であり、かつ、当該音声の内容を特定することができなかった場合は、当該利用者の方向へ前記入出力装置を移動させる
ことを特徴とする請求項1〜5のうちいずれか1つに記載の制御装置。
前記移動制御部は、前記受付機能が受け付けた音に基づいて特定された位置であって、前記入出力装置が発した音を利用者が視聴しやすい位置に前記入出力装置を移動させる
ことを特徴とする請求項1〜6のうちいずれか1つに記載の制御装置。
前記入出力装置の筐体内に設置され、前記受付機能が受け付けた音に応じて、前記入出力装置が有する移動機能を発揮させるための駆動部品を制御することを特徴とする請求項1〜8のうちいずれか1つに記載の制御装置。
前記移動制御部は、前記受付機能に利用者が発した音声が含まれる場合は、当該利用者に関する情報であって、第1事業者が取得した情報と、当該第1事業者とは異なる第2事業者が取得した情報とに応じた移動態様で、前記入出力装置を移動させる
ことを特徴とする請求項1〜9のうちいずれか1つに記載の制御装置。
前記出力制御部は、前記受付機能に利用者が発した音声が含まれる場合は、当該利用者に関する情報であって、第1事業者が取得した情報と、当該第1事業者とは異なる第2事業者が取得した情報とに応じた内容の音を出力させる
ことを特徴とする請求項1〜10のうちいずれか1つに記載の制御装置。
【発明を実施するための形態】
【0010】
以下に、本願に係る制御装置、入出力装置、制御方法、および制御プログラムを実施するための形態(以下、「実施形態」と呼ぶ。)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る制御装置、入出力装置、制御方法、および制御プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0011】
〔1.入出力装置の一例〕
まず、
図1を用いて、実施形態に係る制御装置により制御される入出力装置100の一例について説明する。
図1は、実施形態に係る入出力装置の一例を示す図である。
図1では、制御装置10(例えば、
図2参照)により制御される入力処理装置の一例として、周囲の音を取得するマイク等の入力装置と、任意の音を出力可能なスピーカー等の出力装置とを有する入出力装置であって、小型のタイヤ等の駆動部を有し、任意の位置へ自律的に移動可能な移動機能を有する入出力装置の一例について記載した。
【0012】
例えば、入出力装置100は、スマートスピーカーと呼ばれる入出力装置であり、出力装置を用いて、音楽などの音を出力可能な装置である。また、入出力装置100は、音の入力を受付ける受付機能を有し、利用者が発した音声を取得すると、取得した音声の内容に応じた音を出力する出力機能を有する。例えば、入出力装置100は、利用者が所定の楽曲の曲名を示す音声を発した場合には、各種の音声解析技術により、音声が示す曲名を特定し、特定した曲名が示す楽曲のデータを、ネットワークN(例えば、
図2を参照)を介して、所定の外部サーバ200(例えば、
図2参照)から取得する。そして、入出力装置100は、取得した楽曲を再生する。
【0013】
また、入出力装置100は、例えば、利用者が発した音声の内容を各種の音声解析技術により特定し、特定した内容に応じた応答を出力する機能を有する。例えば、入出力装置100は、「今日の天気は?」といった利用者の音声を取得した場合は、外部サーバ200から天気や気温などといった各種の気象情報を取得し、取得した気象情報を読み上げることで、利用者に天気の情報を提供する。また、入出力装置100は、上述した処理以外にも、例えば、電子商店街に出品された商品の注文、空調装置や照明装置等といった各種家電機器の制御、メールやスケジュールの読み上げ等といった各種の処理を実現可能なスマートスピーカーである。
【0014】
ここで、入出力装置100は、タイヤやキャタピラ等、入出力装置の筐体を移動させるための駆動部を有し、かかる駆動部を制御することで、任意の位置に移動可能な移動機能を有する。例えば、入出力装置100は、モーター等を用いて、駆動部を動かすことで、回転や移動等といった移動を実現可能である。なお、例えば、入出力装置100は、ドローンのようにプロペラを用いて飛行することで移動可能な装置であってもよい。
【0015】
〔1−1.制御処理の例について〕
ここで、上述した受付機能と、出力機能と、移動機能とを有する入出力装置100は、制御装置10が実行する制御処理により、以下の処理を行う。例えば、入出力装置100は、受付機能により受け付けた音に応じて、移動するとともに、出力機能を用いて、受付機能により受付けられた音に応じた音を出力する。
【0016】
〔1−2.適切な解析を行うための移動について〕
以下、入出力装置100が実行する処理の一例について、
図1を用いて説明する。例えば、入出力装置100は、利用者Uが発した音声を受付ける(ステップS1)。このような場合、入出力装置100は、音声解析を行う、利用者Uが発した音声の内容を特定する。
【0017】
ここで、利用者Uと入出力装置100との距離が遠い場合、利用者Uが発した音声を正確に解析することができない場合がある。そこで、入出力装置100は、受け付けた音声を解析できない恐れがある場合には、音声を発した利用者Uの近くまで移動する(ステップS2)。例えば、入出力装置100は、受付け機能により受付けられた音に利用者Uが発した音声が含まれるが、かかる音声の音量が所定の閾値よりも低い場合は、利用者Uが発した音声と他の音声(例えば、各種の背景音)との比、すなわち、S/N比(Signal-to-Noise ratio)が所定の閾値よりも低い場合は、利用者Uが発した音声を適切に解析できないと判定する。
【0018】
このような場合、入出力装置100は、音声を発した利用者Uの方向を特定する。例えば、入出力装置100は、それぞれ異なる位置に設置された複数のマイクを有し、各マイクが音声を受け付けたタイミングの差や各マイクが受け付けた音声の大きさの差等に基づいて、利用者Uが所在する方向を特定する。そして、入出力装置100は、駆動部を制御することで、利用者Uの近傍まで移動し、「もう一度発話してくれますか?」等というように再度発話を要求するための音声を出力する。すなわち、入出力装置100は、受け付けた音が利用者の発した音声であり、かつ、音声の内容を特定することができなかった場合は、利用者Uの方向へ移動する。
【0019】
そして、例えば、入出力装置100は、新たに受け付けた音声の内容に応じた応答を出力する(ステップS3)。例えば、入出力装置100は、利用者Uの近傍まで移動した結果、利用者Uの発話から「今日の天気は?」等という解析結果を適切に取得した場合は、取得した解析結果に基づいて、外部サーバ200から気象情報を収集する。そして、入出力装置100は、例えば、「今日は晴れです」というように、収集した気象情報の内容を読み上げる音声を出力することで、利用者Uに対して発話に対応する応答を提供することができる。なお、入出力装置100は、応答を出力した後は、元の位置まで移動してもよく、そのまま利用者Uの近傍に留まってもよい。
【0020】
また、入出力装置100は、例えば、「楽曲Aを再生して」といった発話を受け付けた場合は、「楽曲A」のデータを取得し、取得した「楽曲A」の再生を開始してもよい。ここで、入出力装置100は、利用者Uの近傍に移動したままで「楽曲A」を再生してもよく、元の位置まで移動した後で「楽曲A」を再生してもよい。また、入出力装置100は、各種家電装置の制御を要求する発話を受け付けた場合は、HEMS(Home Energy Management System)等の技術を用いて家電装置を制御し、その後、元の位置まで移動してもよく、そのまま利用者Uの近傍に留まってもよい。
【0021】
〔1−3.適切な提供を行うための移動について〕
ここで、入出力装置100が各種の楽曲を出力する場合、入出力装置の位置や利用者Uの位置によっては、音の反響や音量等が変化するため、利用者Uが楽曲を適切に視聴できなくなる恐れがある。そこで、入出力装置100は、受付機能が受け付けた音に基づいて特定された位置であって、入出力装置が発した音を利用者が視聴しやすい位置に移動する。
【0022】
例えば、入出力装置100は、複数の利用者Uが発した音声を受付ける(ステップS4)。このような場合、入出力装置100は、利用者Uの音声の大きさ等に応じて、入出力装置100と各利用者Uとの位置関係を特定する。なお、入出力装置100は、音声以外にも、各種の環境音や音の反響等に応じて、入出力装置100と各利用者Uとの位置関係を特定して良い。また、入出力装置100は、入出力装置100と各利用者Uとの間にある壁や家具等の障害物を特定してもよい。このような特定処理は、音から位置関係を特定する各種の技術や、音から障害物を特定する各種の特定技術により実現可能である。
【0023】
そして、入出力装置100は、入出力装置100が発する音を各利用者Uが視聴しやすい位置を特定する。例えば、入出力装置100は、利用者Uが発する音声に対する雑音の音量が大きい場合は、より利用者Uに近い位置を特定する。また、入出力装置100は、障害物による音の吸収、壁による音の反射等を考慮して、入出力装置100が所定の音量で音を出力した際に、各利用者Uがその音を認識可能と推定される位置を特定する。
【0024】
そして、入出力装置100は、特定した位置、すなわち、各利用者が音を聞きやすい位置へと移動する(ステップS5)。その後、入出力装置100は、移動後の位置で音楽等の音を出力する(ステップS6)。
【0025】
なお、出力する音の種別によって、各利用者が良く聞こえる位置は変化するとも考えられる。例えば、入出力装置100が出力する音の種別が音楽などの音であるか、応答などの音声であるかによって、入出力装置100が出力する音が良く聞こえる位置が変化するとも考えられる。そこで、入出力装置100は、出力する音の種別(例えば、音楽であるか音声であるか)や、出力する音の内容(例えば、クラシック音楽であるかポップ音楽であるか)、出力する音の音量等に応じて、移動先となる位置を特定してもよい。このような処理の結果、入出力装置100は、各利用者が良く聞こえる位置で音声や音楽を出力することができる。
【0026】
〔1−4.ノイズキャンセルを行うための移動について〕
ここで、各種の装置は、定常的な音を出力し続ける場合がある。例えば、冷蔵庫は、コンプレッサーやファンの音を定常的に出力し付ける場合がある。このような各種装置が出力する定常的な音は、利用者Uにとって不快な音となる蓋然性が高い。そこで、入出力装置100は、所定の装置が出力する音の大きさが所定の閾値を超える場合は、所定の装置の方向へ移動し、所定の装置が出力する音と位相が逆の音を出力する。
【0027】
例えば、入出力装置100は、所定の装置(
図1に示す例では、冷蔵庫)が発した音を取得する(ステップS7)。このような場合、入出力装置100は、取得した音が所定の条件を満たすか否かを判定する。例えば、入出力装置100は、取得した音の周波数特性が所定の特性を有し、かつ、取得した音の大きさが所定の閾値を超えるか否かを判定する。なお、このような条件は、所定の装置が出力した音を利用者Uが不快に思う蓋然性が高いか否かに応じて、適宜設定される。
【0028】
そして、入出力装置100は、取得した音が所定の条件を満たす場合は、その音を発した装置の近傍まで移動する(ステップS8)。そして、入出力装置100は、装置が発する音と位相を反転させた音を出力することで、ノイズの軽減を図る(ステップS9)。すなわち、入出力装置100は、取得した音に基づいて、ノイズキャンセリングの対象となる装置の近傍まで移動し、ノイズキャンセリングを行う。この結果、入出力装置100は、適切にノイズキャンセリングを実現できる。
【0029】
〔1−5.利用者への注意を行うための移動について〕
ここで、利用者Uが発話した音声の音量が大きい場合や、大きな音量で音楽を聴いていた場合には、周囲の利用者Uに迷惑をかける恐れがある。しかしながら、利用者Uと入出力装置100との距離が遠い場合には、注意を促したとしても、利用者Uが気づかない恐れがある。そこで、入出力装置100は、利用者Uの周囲から発生される音の大きさが所定の閾値を超える場合は、利用者Uの方向へ移動し、所定の内容を通知する音を出力する。
【0030】
例えば、入出力装置100は、利用者Uの周囲の音を受付ける(ステップS10)。より具体的には、入出力装置100は、利用者Uが発する音声を取得し、取得した音声に基づいて、利用者Uが所在する位置を特定する。また、入出力装置100は、各種の環境音等を取得し、取得した環境音が発せられた位置と特定した利用者Uの位置との位置関係に基づいて、利用者Uの周囲から発せられた音を特定する。そして、入出力装置100は、利用者Uが発した音声の音量が所定の閾値を超える場合、または、利用者Uの周囲から発せられた音の大きさが所定の閾値を超える場合は、利用者Uの方向へと移動する(ステップS11)。
【0031】
そして、入出力装置100は、利用者Uの近傍まで移動した場合は「声を小さくしてください」等というように、音量に関する注意を促す通知を出力する(ステップS12)。この結果、入出力装置100は、利用者Uの周囲から発せられる音の大きさが大きい場合にも、音声を使った注意を実現することができる。
【0032】
なお、入出力装置100は、利用者Uの周囲から発せられた音のうち、音量が所定の閾値を超える音の種別に応じて、異なる内容の通知を出力してもよい。例えば、入出力装置100は、利用者Uが発した音声の音量が所定の閾値を超える場合は、「声を小さくしてください」等というように、利用者Uが発した音声の音量を小さくするよう要求する通知を出力し、利用者Uの周囲から発せられた音楽の音量が所定の閾値を超える場合は、「再生音量を小さくしてください」等というように、利用者Uの周囲から発せられた音楽の音量を小さくするよう要求する通知を出力してもよい。
【0033】
〔1−6.その他〕
上述したように、入出力装置100は、入出力装置100を呼ぶ音声以外にも、受け付けた任意の音の内容、態様若しくは音が発せられた位置に応じて、移動する。例えば、入出力装置100は、受け付けた音の内容や態様が所定の条件を満たす場合は、当該内容や態様が所定の条件を満たす音が発せられた位置の近傍に移動する。また、例えば、入出力装置100は、音を発した複数の利用者Uが、入出力装置100が発する音を聞きやすい位置、すなわち、受け付けた音が発せられた位置に応じた位置に移動する。そして、入出力装置100は、受け付けた音と対応する音を出力する。この結果、入出力装置100は、提供するサービスの多様化を実現できる。
【0034】
なお、入出力装置100は、上述した各種の処理以外にも、取得した音に応じて任意の位置に移動して良い。すなわち、入出力装置100は、受け付けた音の種別を特定し、特定した音の種別に応じて、移動を行えばよい。より具体的には、入出力装置100は、受け付けた音の種別が、利用者Uが発した音声であるか、所定の装置が発した音(例えば、駆動音や音楽等)であるかを特定し、特定した音の種別に応じて入出力装置を移動させればよい。
【0035】
例えば、入出力装置100は、受け付けた音の種別が利用者Uが発した音声であり、かつ、かかる音声の音量や内容が所定の条件を満たす場合は、かかる音声を発した利用者Uの方向に移動すればよい。例えば、入出力装置100は、音声を適切に認識することができない程度に音声の音量が所定の閾値よりも小さい場合、あるいは、周囲の利用者Uが迷惑に思う程度に音声の音量が所定の閾値よりも大きい場合は、かかる音声を発した利用者の方向へ移動すればよい。
【0036】
また、入出力装置100は、例えば、利用者Uから離れた位置に設置された装置(例えば、テレビ等)が発する音の大きさが所定の閾値を超える場合は、その装置ではなく、利用者Uの方向へと移動し、利用者Uの近傍で「テレビの音を小さくしてください。」等といった注意を行ってもよい。また、入出力装置100は、利用者Uの音声を取得できない場合等、利用者Uの位置を特定することができない場合は、あらかじめ登録された利用者Uが使用する利用者端末(例えば、スマートフォン等。)に対し、注意を促すメッセージを送信し、出力させてもよい。
【0037】
〔1−7.利用者が発する音について〕
なお、上述した例では、入出力装置100は、利用者Uが発した音声に基づいて、利用者Uの位置を特定した。しかしながら、実施形態は、これに限定されるものではない。例えば、入出力装置100は、利用者Uが演奏する楽器の音や、利用者Uの動作によって生じる音(例えば、キーボードやマウスを操作する音等)を取得し、取得した音に基づいて、利用者Uの位置を特定してもよい。すなわち、入出力装置100は、利用者Uの発した声のみならず、利用者Uに起因して発せられた音に基づいて、利用者Uの位置を特定するのであれば、任意の音に基づいて、利用者Uの位置を特定しても良い。
【0038】
〔1−8.制御手法について〕
なお、上述した例では、入出力装置100は、上述した処理を実現するための制御装置10を有し、かかる制御装置10による制御にしたがって、上述した処理を実行した。すなわち、制御装置10は、入出力装置100の筐体内に設置され、受付機能が受け付けた音に応じて、入出力装置100が有する移動機能を発揮させるための駆動部品を制御することで、上述した処理を実現した。しかしながら、実施形態は、これに限定されるものではない。
【0039】
例えば、制御装置10は、入出力装置100とは個別の装置であってもよい。例えば、制御装置10と入出力装置100とは、ネットワークNを介して通信可能に接続されていてもよい。このような場合、制御装置10は、入出力装置100が受け付けた音のデータを取得し、取得した音のデータに基づいて、入出力装置100を移動させるとともに、入出力装置100から各種の音を出力させればよい。
【0040】
〔2.入出力装置の構成〕
以下、上記した入出力装置100が有する機能構成の一例について説明する。
図2は、実施形態に係る入出力装置の構成例を示す図である。
図2に示すように、入出力装置100は、制御装置10、マイク50、スピーカー60、モーター70、および駆動部80を有する。
【0041】
マイク50は、各種の音を受付け可能な入力装置であり、任意のマイクにより実現される。なお、入出力装置100は、任意の数のマイク50が設置可能であるものとする。例えば、マイク50は、受け付けた音を電気信号に変換し、電気信号を制御装置10へと提供する。このように、マイク50は、音を受付ける受付機能を実現する。
【0042】
スピーカー60は、各種の音を出力可能な出力装置であり、各種のスピーカーにより実現される。なお、入出力装置100は、任意の数のスピーカーを有していてよい。例えば、スピーカー60は、制御装置10から受け付けた音のデータを再生することで、各種の音声や音楽を出力する。このように、スピーカー60は、音を出力する出力機能を実現する。
【0043】
モーター70は、タイヤ等の駆動部80を駆動するためのモーターである。例えば、モーター70は、制御装置10による制御に従って、駆動部80を駆動させることで、入出力装置100を任意の位置に移動させる。このように、モーター70および駆動部80は、入出力装置100を移動させる移動機能を実現する。
【0044】
制御装置10は、入出力装置100の制御を行う制御装置である。例えば、制御装置10は、通信部20、記憶部30、および制御部40を有する。
【0045】
通信部20は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部20は、ネットワークNと有線または無線で接続され、外部サーバ200との間で情報の送受信を行う。
【0046】
記憶部30は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。また、記憶部30は、音声データベース31や音楽データベース32を記憶する。
【0047】
音声データベース31は、音声を出力するために用いられるデータベースである。例えば、音声データベース31には、各種の言語の音声を出力する際に用いられる各種の母音や子音のデータが登録されている。制御装置10は、音声データベース31に登録された母音や子音のデータを組み合わせることにより、音声のデータを生成し、生成した音声をスピーカーから出力することで、音声による応答や注意等を実現する。
【0048】
音楽データベース32には、外部サーバ200から取得した音楽のデータが登録されている。なお、音楽データベース32には、MP3(MPEG-1 Audio Layer-3)やMP4(MPEG-4 Part 14)等、任意の規格のデータが登録されていてよい。
【0049】
制御部40は、例えば、コントローラ(controller)であり、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、入出力装置100内部の記憶装置に記憶されている各種プログラム(通知プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部40は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
【0050】
図2に示すように、制御部40は、受付部41、特定部42、移動制御部43、および出力制御部44を有する。受付部41は、マイク50が受け付けた音を受付ける。例えば、受付部41は、マイク50から電気信号を受付けると、受け付けた電気信号からマイク50が受け付けた音の大きさや周波数特性等を示す音データを生成する。
【0051】
特定部42は、受付機能が受け付けた音の種別を特定する。例えば、特定部42は、受付機能が受け付けた音の種別が、利用者Uが発した音声であるか、所定の装置が発した音であるかを特定する。
【0052】
例えば、特定部42は、受付部41が生成した音データを解析し、周波数特性等に基づいて、受付けられた音が利用者Uの声等であるか、所定の装置が発した音であるかを特定する。また、特定部42は、受付けられた音の音量を特定する。なお、特定部42は、例えば、入出力装置100が複数のマイク50を有する場合、各マイク50が受け付けた音の音データをそれぞれ個別に受け付ける。そして、特定部42は、同じ音源から発せられた音を各マイク50が受け付けたタイミング、各マイク50が受け付けた音の大きさ、各マイク50が設置された位置等に基づいて、入出力装置100を基準とする音源の位置を特定する。例えば、特定部42は、入出力装置100に対する音源の方向や距離等を特定する。
【0053】
また、特定部42は、受付けられた音が利用者Uの声、すなわち音声である場合には、利用者Uの音声をテキストに変換する。かかる変換処理は、入出力装置100によって実現されてもよく、所定の外部サーバ200によって実現されてもよい。すなわち、特定部42は、利用者Uの音声の内容を特定する。
【0054】
移動制御部43は、受付機能が受け付けた音に応じて、入出力装置100を移動させる。例えば、移動制御部43は、特定された音の種別に応じて、入出力装置100を移動させる。より具体的な例を挙げると、移動制御部43は、特定した音の種別が音声であるか、所定の装置が発した音であるかに応じて、入出力装置100を移動させる。また、移動制御部43は、受付機能が受け付けた音の大きさに応じて、入出力装置100を移動させる。
【0055】
例えば、移動制御部43は、受付機能が受け付けた音が利用者の発した音声であり、かつ、音声の内容を特定することができなかった場合は、当該利用者の方向へ前記入出力装置を移動させる。より具体的な例を挙げると、移動制御部43は、音声の大きさが所定の閾値を下回る場合、特定部42がノイズ等により音声の内容を示すテキストを取得することができなかった場合、音声の内容を示すテキストの内容が不明確であった場合等、再度利用者Uに発話を求めるような場合には、入出力装置100を利用者Uの近傍まで移動させる。
【0056】
また、移動制御部43は、受付機能が受け付けた音に基づいて特定された位置であって、入出力装置100が発した音を利用者Uが視聴しやすい位置に入出力装置100を移動させる。例えば、移動制御部43は、音楽等の所定の音を出力する場合には、入出力装置100が出力する音を各利用者Uが聞き取りやすい位置、すなわち、各利用者Uが発した音を入出力装置100が聞き取りやすい位置を特定し、特定した位置へと入出力装置100を移動させる。
【0057】
また、移動制御部43は、所定の装置が出力する音の大きさが所定の閾値を超える場合は、所定の装置の方向へ入出力装置100を移動させる。例えば、移動制御部43は、周波数特性が所定の特性を有し、かつ、音の大きさが所定の閾値を超える事が受け付けられた場合は、かかる音を出力する装置の位置を特定し、特定した位置の近傍へと入出力装置100を移動させる。
【0058】
また、移動制御部43は、利用者Uの周囲から発せられる音の大きさが所定の閾値を超える場合は、利用者Uの方向へ入出力装置100を移動させる。例えば、移動制御部43は、利用者Uが発した音声の大きさが所定の閾値を超える場合は、利用者Uの位置を特定し、特定した位置の近傍へと入出力装置100を移動させる。
【0059】
このように移動制御部43は、入出力装置100が受け付けた音に応じた位置へと入出力装置100を移動させる。より具体的には、移動制御部43は、モーター70を制御することにより駆動部80を駆動させ、入出力装置100を移動させる。すなわち、制御装置10は、入出力装置100の筐体内に設置され、受付機能が受け付けた音に応じて、入出力装置100が有する移動機能を発揮させるための駆動部80を制御する。
【0060】
出力制御部44は、入出力装置100が有する出力機能を用いて、受付機能により受付けられた音に応じた音を入出力装置100から出力させる。例えば、出力制御部44は、特定した音の種別が音声であるか、所定の装置が発した音であるかに応じた音を出力させる。
【0061】
より具体的な例を挙げると、出力制御部44は、利用者Uが発した音声の内容を特定できなかった場合は、音声データベース31に登録されたデータを用いて、「もう一度おっしゃってください」等というように、再度の発話を促す音声を生成する。そして、出力制御部44は、移動制御部43による移動後に、生成した音声をスピーカー60から出力させる。
【0062】
また、出力制御部44は、移動制御部43によって、入出力装置100が出力する音を各利用者Uが聞き取りやすい位置へと入出力装置100を移動させた場合は、音楽などの所定の音声をスピーカー60から出力させる。また、出力制御部44は、移動制御部43によって、利用者Uが不快に思うと考えられる音を出力する装置の近傍まで入出力装置100が移動した場合は、装置が出力する音をマイク50から取得し、取得した音と位相が逆の音を生成する。そして、出力制御部44は、生成した音をスピーカー60から出力する。また、出力制御部44は、移動制御部43によって、発する音の大きさが所定の閾値を超える利用者Uの近傍まで入出力装置100を移動させた場合は、利用者Uに対して静かにするように要請する内容の通知など、所定の内容の通知をスピーカー60から出力する。
【0063】
〔3.処理手順〕
次に、
図3を用いて、実施形態に係る制御装置10が実行する制御処理の流れの一例について説明する。
図3は、実施形態に係る制御処理の流れの一例を示すフローチャートである。
図3に示すように、制御装置10は、入出力装置100が有するマイク50が取得した音を受付ける(ステップS101)。このような場合、制御装置10は、受け付けた音の種別や音の大きさを特定する(ステップS102)。そして、制御装置10は、音の種別や音の大きさに応じて、入出力装置100の移動態様と音の出力態様とを特定する(ステップS103)。例えば、制御装置10は、入出力装置100を移動させる位置を特定するとともに、出力する音声の内容等を特定する。そして、制御装置10は、モーター70を制御することで、特定した移動態様で入出力装置100を移動させ、特定した出力態様で音声を出力し(ステップS104)、処理を終了する。
【0064】
〔4.変形例〕
上述した制御装置10は、上記実施形態以外にも種々の異なる形態にて実施されてもよい。そこで、以下では、制御装置10の他の実施形態について説明する。
【0065】
〔4−1.構成について〕
上述した例では、制御装置10は、入出力装置100の筐体内に設置され、入出力装置100が受け付けた音に応じて入出力装置100を移動させる制御装置10について説明した。しかしながら、実施形態は、これに限定されるものではない。例えば、制御装置10は、制御サーバ等、入出力装置100とは個別の筐体内に設置され、ネットワークNを介して入出力装置100の制御を行ってもよい。
【0066】
例えば、
図4は、実施形態に係る制御装置の他の例を示す図である。
図4に示す例では、制御装置10は、入出力装置100とは個別の装置であり、ネットワークNを介して入出力装置100と通信可能である。なお、
図4に示す制御装置10が有する機能構成については、
図2に示す機能構成と同様の機能構成であるものとして、説明を省略する。
【0067】
図4に示す例では、入出力装置100は、通信部120、記憶部130、および制御部140を有する。通信部120は、例えば、NIC等によって実現される。また、通信部120は、ネットワークNと有線または無線で接続され、外部サーバ200や制御装置10との間で情報の送受信を行う。
【0068】
記憶部130は、例えば、RAM、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。また、記憶部130には、入出力装置100を動作させるための各種の情報が登録されている。
【0069】
制御部140は、例えば、コントローラであり、CPUやMPU等によって、制御装置10内部の記憶装置に記憶されている各種プログラム(通知プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部140は、コントローラであり、例えば、ASICやFPGA等の集積回路により実現される。
【0070】
このような機能構成の元、制御装置10および入出力装置100は、以下の制御処理を実行する。例えば、制御部140は、マイク50が受け付けた音の音データを生成し、生成した音データを制御装置10へと送信する。このような場合、制御装置10は、上述した制御処理を実行することで、入出力装置100を移動させる方向や位置を示す移動データ、および出力する音の音データを生成する。そして、制御装置10は、生成した移動データ及び音データを入出力装置100へと送信する。このような場合、入出力装置100が有する制御部140は、制御装置10から受信した移動データに従って、モーター70を制御することで入出力装置100を移動させ、制御装置10から受信した音データを用いて、スピーカー60から所定の音を出力する。
【0071】
このように、制御装置10は、入出力装置100の筐体内から入出力装置100を制御してもよく、ネットワークNを介して入出力装置100を制御してもよい。
【0072】
〔4−2.利用者の属性に応じた移動や出力について〕
ここで、制御装置10は、利用者Uの属性に応じた態様で入出力装置100を移動させてもよい。また、制御装置10は、利用者Uの属性に応じた音を出力させてもよい。例えば、制御装置10は、入出力装置100が音声を受け付けた場合は、音声認識を行い、音声を発した利用者Uを識別する。そして、制御装置10は、外部サーバ200から、識別した利用者Uのデモグラフィック属性やサイコグラフィック属性等といった各種属性を取得する。そして、制御装置10は、取得した属性に応じて、入出力装置100を移動させ、取得した属性に応じた態様で、各種の音を出力する。
【0073】
例えば、利用者Uが老人である場合、利用者Uが発する音声の大きさが小さく、認識がし辛いとも考えられる。また、利用者Uが老人である場合、利用者Uが音を聞き取りづらくなっているとも考えられる。そこで、制御装置10は、利用者Uの年齢が所定の閾値を超える場合は、より利用者Uに近い位置まで入出力装置100を移動させてもよい。また、制御装置10は、利用者Uの年齢が所定の閾値を超える場合は、出力する音の音量をより大きくしてもよい。このような処理を実行することにより、制御装置10は、利用者Uの音声をより受付けやすくすることができるとともに、利用者Uに対して各種の音を適切に届けることができる。なお、制御装置10は、複数の利用者Uが存在する場合、各利用者Uの属性に応じた位置に入出力装置100を移動させてもよい。
【0074】
また、制御装置10は、利用者Uの年齢以外にも、各種利用者の属性に応じて、入出力装置100を移動させてもよく、入出力装置100が出力する音の種別、大きさ、内容等を適宜変更してもよい。
【0075】
〔4−3.データ連携について〕
ここで、利用者Uのデモグラフィック属性やサイコグラフィック属性や、利用者Uにより登録されたものであってもよく、利用者Uの検索履歴、位置履歴、購買履歴等、各種の履歴に基づいて推定されたものであってもよい。また、利用者Uの属性は、複数のサービスを介して取得されたものであってもよく、複数のサービスを介して取得された利用者Uの情報から推定されたものであってもよい。
【0076】
例えば、制御装置10は、受け付けた音に利用者Uが発した音声が含まれる場合は、利用者Uに関する情報であって、第1事業者が取得した情報と、第1事業者とは異なる第2事業者が取得した情報とに応じた移動態様で、入出力装置を移動させてもよい。また、制御装置10は、受け付けた音に利用者Uが発した音声が含まれる場合は、利用者Uに関する情報であって、第1事業者が取得した情報と、第1事業者とは異なる第2事業者が取得した情報とに応じた内容の音を入出力装置100から出力させてもよい。
【0077】
例えば、
図5は、実施形態に係る制御装置が異なる事業者データに基づいて実行する制御処理の一例を示す図である。なお、
図5に示す例では、入出力装置100の筐体内に制御装置10が設置されている例について記載した。
【0078】
図5に示す例では、入出力装置100は、第1事業者が使用する第1事業者サーバ210と、第2事業者が使用する第2事業者サーバ220と通信可能である。例えば、第1事業者サーバ210は、第1事業者が使用するサーバ装置である。例えば、第1事業者は、利用者Uに対して、電子商店街やウェブ検索等の各種サービスを提供する。
【0079】
第2事業者サーバ220は、第2事業者が使用するサーバ装置である。例えば、第2事業者は、利用者Uに対し、音楽や動画像等のコンテンツ配信サービスや、利用者Uが使用する各種端末装置の提供、端末装置へのコンテンツ配信等といったサービスを提供する。なお、第1事業者と第2事業者とは、それぞれ個別に事業を行うのであれば、同一種別のサービスを利用者Uに対して提供してもよい。
【0080】
このような場合、例えば、第1事業者サーバ210は、第1事業者が提供するサービスを介して、利用者Uの情報を取得する(ステップS1)。例えば、第1事業者が電子商店街に関するサービスを提供する場合、第1事業者サーバ210は、利用者Uの購買履歴、利用者Uが閲覧した商品の履歴、利用者Uが入力した検索クエリの履歴、利用者Uが設定した商品の宛先、利用者Uのクレジットカード番号、利用者Uの住所、氏名、年齢、電話番号、メールアドレス等といった各種の情報を取得する。そして、第1事業者サーバ210は、第1事業者が取得した利用者Uの情報を入出力装置100へと提供する(ステップS2)。
【0081】
また、例えば、第2事業者サーバ220は、第2事業者が提供するサービスを介して、利用者Uの情報を取得する(ステップS3)。例えば、第2事業者が端末装置を提供するサービスを提供する場合、第2事業者サーバ220は、利用者Uの操作履歴、利用者Uの位置履歴、利用者Uの住所、氏名、年齢、電話番号、メールアドレス等といった各種の情報を取得する。そして、第2事業者サーバ220は、第2事業者が取得した利用者Uの情報を入出力装置100へと提供する(ステップS4)。
【0082】
このような場合、入出力装置100は、第1事業者が取得した情報と第2事業者が取得した情報とを統合的に用いて、利用者Uが発した音声に対する移動態様と出力態様とを決定する(ステップS5)。例えば、入出力装置100は、利用者Uの住所、氏名、年齢、電話番号等、任意の情報を軸として、第1事業者が取得した情報と第2事業者が取得した情報との名寄せを行い、利用者Uに関する各種の情報を統合する。そして、入出力装置100は、統合した情報に基づいて、利用者Uの属性を推定し、推定した属性に応じた移動態様や出力態様を決定する。その後、入出力装置100は、決定した移動態様で移動し、決定した出力態様で音声を出力する(ステップS6)。この結果、入出力装置100は、利用者Uに対してより適切な態様で、各種のサービスを提供することができる。
【0083】
〔4−4.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、逆に、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0084】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0085】
また、上記してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0086】
〔4−5.プログラム〕
また、上述した実施形態に係る制御装置10は、例えば
図6に示すような構成のコンピュータ1000によって実現される。
図6は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
【0087】
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ等により実現される。
【0088】
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。
【0089】
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。
【0090】
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
【0091】
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
【0092】
例えば、コンピュータ1000が制御装置10として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部40の機能を実現する。
【0093】
〔5.効果〕
上述してきたように、制御装置10は、音を受付ける受付機能と、音を出力する出力機能と、移動機能とを有する入出力装置100を制御する。また、制御装置10は、入出力装置100が有する受付機能が受け付けた音に応じて、入出力装置100を移動させる。そして、制御装置10は、入出力装置100が有する出力機能を用いて、受付機能により受付けられた音に応じた音を入出力装置100から出力させる。このため、制御装置10は、入出力装置100が提供するサービスの多様化を実現することができる。
【0094】
また、制御装置10は、受付機能が受け付けた音の種別を特定する。そして、制御装置10は、特定した音の種別に応じて、入出力装置100を移動させる。例えば、制御装置10は、受付機能が受け付けた音の種別が、利用者Uが発した音声であるか、所定の装置が発した音であるかを特定し、特定した音の種別が音声であるか、所定の装置が発した音であるかに応じて、入出力装置100を移動させる。また、例えば、制御装置10は、受付機能が受け付けた音の大きさに応じて、入出力装置100を移動させる。このため、制御装置10は、受け付けた音に応じた適切な位置で入出力装置100から音を出力させることができる。
【0095】
また、制御装置10は、特定した音の種別が音声であるか、所定の装置が発した音であるかに応じた音を出力させる。このため、制御装置10は、受け付けた音に応じた音を入出力装置100から出力させることができる。
【0096】
また、制御装置10は、受付機能が受け付けた音が利用者Uの発した音声であり、かつ、音声の内容を特定することができなかった場合は、利用者Uの方向へ入出力装置100を移動させる。このため、制御装置10は、適切な態様で、利用者Uに対する聞き返しを行うことができる。
【0097】
また、制御装置10は、受付機能が受け付けた音に基づいて特定された位置であって、入出力装置100が発した音を利用者Uが視聴しやすい位置に入出力装置100を移動させる。このため、制御装置10は、適切な態様で、各利用者Uに対して視聴させたい音を出力することができる。
【0098】
また、制御装置10は、所定の装置が出力する音の大きさが所定の閾値を超える場合は、所定の装置の方向へ入出力装置100を移動させ、所定の装置が出力する音と位相が逆の音を出力させる。このため、制御装置10は、各種装置のノイズキャンセリングを適切な態様で実現できる。
【0099】
また、制御装置10は、利用者Uの周囲から発せられる音の大きさが所定の閾値を超える場合は、利用者Uの方向へ入出力装置100を移動させ、利用者Uに対して所定の内容を通知する音を出力させる。このため、制御装置10は、適切な態様で、騒音を発する利用者Uに対して注意を促すことができる。
【0100】
また、制御装置10は、入出力装置100の筐体内に設置され、受付機能が受け付けた音に応じて、入出力装置100が有する移動機能を発揮させるための駆動部品を制御する。このため、制御装置10は、入出力装置100を適切に制御することができる。
【0101】
また、制御装置10は、受付機能に利用者Uが発した音声が含まれる場合は、利用者Uに関する情報であって、第1事業者が取得した情報と、第1事業者とは異なる第2事業者が取得した情報とに応じた移動態様で、入出力装置100を移動させる。また、制御装置10は、受付機能に利用者Uが発した音声が含まれる場合は、利用者Uに関する情報であって、第1事業者が取得した情報と、第1事業者とは異なる第2事業者が取得した情報とに応じた内容の音を出力させる。このため、制御装置10は、異なる事業者が取得した情報に応じて、利用者Uに対し、各種のサービスを提供することができる。
【0102】
また、入出力装置100は、音を受付ける受付機能(例えば、マイク50)と、音を出力する出力機能(例えば、スピーカー60)とを有する。また、入出力装置100は、入出力装置100を移動させる駆動部80を有する。また、入出力装置100は、受付機能により受け付けられた音に応じて、駆動部80を制御し、入出力装置100を移動させる。そして、入出力装置100は、出力機能を用いて、受付機能により受付けられた音に応じた音を出力する。このため、入出力装置100は、提供するサービスの多様化を実現することができる。
【0103】
以上、本願の実施形態を図面に基づいて詳細に説明したが、これは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0104】
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。