(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022165672
(43)【公開日】2022-11-01
(54)【発明の名称】通話装置、通話方法
(51)【国際特許分類】
H04M 11/00 20060101AFI20221025BHJP
【FI】
H04M11/00 302
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2021071106
(22)【出願日】2021-04-20
(71)【出願人】
【識別番号】000237592
【氏名又は名称】株式会社デンソーテン
(74)【代理人】
【識別番号】110002860
【氏名又は名称】弁理士法人秀和特許事務所
(72)【発明者】
【氏名】鈴木 亮
【テーマコード(参考)】
5K201
【Fターム(参考)】
5K201AA05
5K201BB09
5K201BD06
5K201CA01
5K201CC04
5K201CC05
5K201CC06
5K201ED04
5K201ED08
5K201EF03
(57)【要約】
【課題】他の通話装置の利用者の音声を適切に出力する通話装置を提供する。
【解決手段】他の通話装置から受信した音声を出力する音声出力部と、前記他の通話装置の位置に基づいて、前記音声出力部による前記他の通話装置から受信した音声の出力を制御する制御部と、を備える通話装置とする。
【選択図】
図1
【特許請求の範囲】
【請求項1】
他の通話装置から受信した音声を出力する音声出力部と、
前記他の通話装置の位置に基づいて、前記音声出力部による前記他の通話装置から受信した音声の出力を制御する制御部と、
を備える通話装置。
【請求項2】
車両に設けられる
請求項1に記載の通話装置。
【請求項3】
前記車両は、乗員を覆う外壁が設けられていない車両である、
請求項2に記載の通話装置。
【請求項4】
前記制御部は、前記他の通話装置の位置と前記通話装置の位置との距離が所定値未満である場合、前記音声出力部に前記他の通話装置から受信した音声を出力させない制御を行う、
請求項1から3のいずれか1項に記載の通話装置。
【請求項5】
前記制御部は、前記他の通話装置が存在する方向に基づいて、前記音声出力部による前記他の通話装置から受信した音声の出力を制御する、
請求項1から4のいずれか1項に記載の通話装置。
【請求項6】
前記制御部は、前記他の通話装置の利用者の顔が向いている方向に基づいて、前記音声出力部による前記他の通話装置から受信した音声の出力を制御する、
請求項5に記載の通話装置。
【請求項7】
音声を検出する音声入力部を備え、
前記制御部は、前記音声入力部が検出した音声と、前記他の通話装置から受信した音声とに基づいて、前記音声出力部による前記他の通話装置から受信した音声の出力を制御する、
請求項1から6のいずれか1項に記載の通話装置。
【請求項8】
他の通話装置から受信した音声を出力する音声出力部を有する通話装置が、
前記他の通話装置の位置に基づいて、前記音声出力部による前記他の通話装置から受信した音声の出力を制御することを実行する、通話方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、通話装置、通話方法に関する。
【背景技術】
【0002】
複数人のグループで行動する際、各メンバーがある程度自由に行動をとることができるように、グループのメンバーの間で、通話等でコミュニケーションをとることができることが求められる。
【0003】
例えば、大型の商業施設等において、施設内を移動する手段である電動立ち乗り二輪車などの利用者乗車型の小型モビリティ(移動体、車両)の導入が進んでいる。この場合、多くの小型モビリティは1人乗りであるため、家族などの複数人数のグループで施設に来場し別行動をしたときに、互いに、コミュニケーションをとることが求められる。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2003-121162号公報
【特許文献2】特開2009-229292号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
グループのメンバーがある程度自由に行動できるようにするために、グループのメンバー間で、通話でコミュニケーションをとれるように、携帯電話などの通話装置が使用されることがある。しかし、一般的な通話装置では、通話の相手が近くにいる場合に、直接聞こえる音声と、通話装置から聞こえる音声とが二重になり、聞き取りづらいことがある。
【0006】
本発明は、他の通話装置の利用者の音声を適切に出力する通話装置を提供することを目的とする。
【課題を解決するための手段】
【0007】
上記課題を解決するため、本発明は、以下の手段を採用する。
即ち、第1の態様は、
他の通話装置から受信した音声を出力する音声出力部と、
前記他の通話装置の位置に基づいて、前記音声出力部による前記他の通話装置から受信した音声の出力を制御する制御部と、
を備える通話装置である。
【0008】
開示の態様は、プログラムが情報処理装置によって実行されることによって実現されてもよい。即ち、開示の構成は、上記した態様における各手段が実行する処理を、情報処理装置に対して実行させるためのプログラム、或いは当該プログラムを記録した情報処理装置が読み取り可能な記録媒体として特定することができる。また、開示の構成は、上記した各手段が実行する処理を情報処理装置が実行する方法をもって特定されてもよい。開示の構成は、上記した各手段が実行する処理を行う情報処理装置を含むシステムとして特定されてもよい。なお、情報処理装置は、例えば、コンピュータである。コンピュータは、パソコンや、サーバと呼ばれることもある。
【発明の効果】
【0009】
本発明によれば、他の通話装置の利用者の音声を適切に出力する通話装置を提供するこ
とができる。
【図面の簡単な説明】
【0010】
【
図1】
図1は、実施形態の通話システムの構成例を示す図である。
【
図2】
図2は、通話装置200の構成例を示す図である。
【
図3】
図3は、車両100の構成例(1/2)を示す図である。
【
図4】
図4は、車両100の構成例(2/2)を示す図である。
【
図5】
図5は、情報処理装置のハードウェア構成例を示す図である。
【
図6】
図6は、通話装置200の動作例1の動作フローを示す図である。
【
図7】
図7は、利用者Bが向いている方向、車両100Bから見た車両100Aの方向の例を示す図である。
【
図8】
図8は、音声出力部210の制御の例を示す図である。
【
図9】
図9は、通話装置200の動作例2の動作フローを示す図である。
【
図10】
図10は、通話装置200の動作例3の動作フローを示す図である。
【発明を実施するための形態】
【0011】
以下、図面を参照して本発明の実施形態について説明する。以下の実施形態の構成は例示であり、本発明は実施形態の構成に限定されない。
【0012】
〈実施形態〉
(構成例)
図1は、本実施形態の通話システムの構成例を示す図である。
図1の通話システム10は、車両100A、車両100B、車両100C、車両100Aに搭載される通話装置200A、車両100Aに搭載される通話装置200B、車両100Aに搭載される通話装置200Cを含む。通話装置200A、通話装置200B、通話装置200Cは、例えば、通信ネットワーク等を介して、通信可能に接続される。通話装置200A、通話装置200B、通話装置200Cは、通信ネットワーク上に設置されるサーバを介して、通信可能に接続されてもよい。また、通話装置200A、通話装置200B、通話装置200Cが、互いに、直接、通信可能に接続されてもよい。車両100A、車両100B、車両100Cは、同様の構成を有する。車両100A、車両100B、車両100Cを区別しない場合、単に、車両100という。通話装置200A、通話装置200B、通話装置200Cを区別しない場合、単に、通話装置200という。車両100は、商業施設等の施設に置かれる。利用者は、車両100に乗り、車両100を運転操作して、施設内を自由に移動することができる。また、利用者は、通話装置200を介して、他の利用者と通話することができる。
【0013】
車両100は、例えば、電動立ち乗り二輪車、電動車椅子、自転車、三輪車などの小型車両である。ここでは、車両100は、原則、1人乗りの車両であるとするが、複数人乗りの車両でもよい。
【0014】
図2は、通話装置200の構成例を示す図である。通話装置200は、制御部202、格納部204、通信部206、音声入力部208、音声出力部210、映像入力部212、位置検出部214、重量検出部216を含む。通話装置200は、他の通話装置200から音声を受信し、受信した音声を出力する。また、通話装置200は、利用者の音声を検出して、他の通話装置200に送信する。
【0015】
通話装置200は、PC(Personal Computer)、スマートフォン、携帯電話、タブレ
ット型端末、カーナビゲーション装置、PDA(Personal Digital Assistant)のような専用または汎用のコンピュータ、あるいは、コンピュータを搭載した電子機器を使用して実現可能である。
【0016】
制御部202は、通話装置200全体の制御を行う中央処理演算装置である。制御部202はプロセッサとも呼ばれる。制御部202は、格納部204に記憶されたプログラムを作業領域に実行可能に展開し、プログラムの実行を通じて周辺機器等の制御を行うことで所定の目的に合致した機能を提供する。また、制御部202は、各種演算を実行する。
【0017】
格納部204は、制御部202がプログラムやデータを記憶したり、作業領域を展開したり、動作の設定情報などを記憶したりする記録媒体である。
【0018】
通信部206は、通信ネットワーク等を介して他の情報処理装置などと通信をする通信インタフェースである。通信部206は、車両100や他の通話装置200などと通信可能に接続される。
【0019】
音声入力部208は、通話装置200が搭載される車両100の利用者が発声する音声などを検出する。音声入力部208は、音声を検出するマイクを含む。音声入力部208は、複数のマイクを含んでもよい。音声入力部208は、利用者の音声を検出するマイクに接続されて、当該マイクで検出された音声を取得するものであってもよい。
【0020】
音声出力部210は、他の通話装置200で検出された他の通話装置200の利用者の音声などを出力する。音声出力部210は、音声を出力するスピーカを含む。音声出力部210は、複数のスピーカを含んでもよい。音声出力部210は、音声を出力するスピーカに接続されて、当該スピーカに任意の音声を出力させるものであってもよい。
【0021】
映像入力部212は、通話装置200が搭載される車両100の利用者を撮影するカメラである。映像入力部212は、利用者の顔を撮影できる位置(例えば、車両100のハンドル、支柱など)に設置される。映像入力部212は、複数のカメラを含んでもよい。映像入力部212は、動画または静止画を撮影する。映像入力部212は、利用者の顔を撮影できる位置に設置されるカメラに接続されて、当該カメラで撮影された画像を取得するものであってもよい。
【0022】
位置検出部214は、通話装置200が搭載される車両100の位置及び向きを検出する。車両100の位置は、例えば、緯度、経度によって表される。車両100の向き(方位)は、車両100の正面が向いている方向であり、例えば、車両100の正面が向いている方向の、車両100の中心から真北への方向からの時計回りの角度によって表される。位置検出部214は、例えば、位置を検出するGPS(Global Positioning System)
受信機、車両100の向き(方位)を検出する電子コンパスを含む。位置検出部214は、他の方法により、車両100の位置、向きを取得してもよい。位置検出部214は、無線LANの位置が既知である複数のアクセスポイントからの電波の受信強度の比較などによる周知の方法によって、車両100の位置を検出してもよい。GPS受信機、電子コンパスが車両100に内蔵されている場合、位置検出部214は、車両100の位置の情報、車両100の向きの情報を、車両100を介して、取得してもよい。
【0023】
重量検出部216は、通話装置200が搭載される車両100に、利用者が乗っているか否かを検出する。重量検出部216は、例えば、重量センサを含む。重量検出部216は、例えば、重量センサの検出値が所定値以上である場合に、車両100に利用者が乗っていると判定する。重量検出部216は、車両100に利用者が乗っていると判定する場合に、車両100に利用者が乗っていることを示す情報を出力する。重量検出部216は、車両100に利用者が乗っていないと判定する場合に、車両100に利用者が乗っていないことを示す情報を出力する。重量センサが車両100に内蔵されている場合、重量検出部216は、車両100に利用者が乗っているか否か情報を、車両100を介して、取
得してもよい。
【0024】
図3、
図4は、車両100の構成例を示す図である。
図3は、車両100を正面から見た図であり、
図4は、車両100を上面から見た図である。ここでは、車両は、電動立ち乗り二輪車であるとする。
図4の車両100の中央から上に向かう方向を、正面の方向とする。利用者は、原則として、車両100に正面の方向を向いて乗る。利用者は、車両100に乗る際に、顔や身体の向きを変えることは可能である。車両100は、底面102、2つの車輪104、支柱106、ハンドル108を含む。底面102は、利用者が乗る位置である。底面102は、床面と平行に設けられる板状の部材である。車輪104は、その車軸を回転可能に底面102に接続される円形の部材である。支柱106は、棒状の部材であり、一端を底面102に接続され、床面から離れる方向に伸び、他端をハンドル108に接続される。ハンドル108は、支柱106に接続され、利用者によって把持される部材である。車両100は、底面102に乗り、ハンドル108を把持する利用者の運転操作によって、車輪104を回転させることによって、移動する。
【0025】
支柱106には、位置検出部214(GPS受信機、電子コンパス)、音声入力部208(マイク)が設置される。また、ハンドル108には、音声出力部210(スピーカ)、映像入力部212(カメラ)が設置される。ハンドル108に設置される音声出力部210は、ハンドル108の右側と左側に1つずつ設置される。また、底面102には、音声出力部210(スピーカ)、重量検出部216(重量センサ)が設置される。底面102に設置される音声出力部210は、車両100に乗る利用者の背面(背中側)の位置に設置される。車両100を上面から見た場合、音声出力部210は、車両100に乗る利用者の右手前方、左手前方、後方に設置される。利用者の周囲に複数の音声出力部210を設置することにより、利用者が感じる音声の発生の方向を制御することができる。音声入力部208、音声出力部210、映像入力部212、位置検出部214、重量検出部216の設置位置は、例示であって、これらの位置に限定されるものではない。音声出力部210は、乗員の耳等の顔付近に取り付けるイヤホンやヘッドホン等であってもよい。音声入力部208、音声出力部210は、マイク及びスピーカが一体化したヘッドセットのような利用者の顔付近に取り付けるようなものであってもよい。
【0026】
図5は、情報処理装置のハードウェア構成例を示す図である。
図5に示す情報処理装置は、一般的なコンピュータの構成を有している。通話装置200は、
図5に示すような情報処理装置90によって実現される。
図5の情報処理装置90は、プロセッサ91、メモリ92、記憶部93、入力部94、出力部95、通信制御部96を有する。これらは、互いにバスによって接続される。メモリ92及び記憶部93は、コンピュータ読み取り可能な記録媒体である。コンピュータのハードウェア構成は、
図5に示される例に限らず、適宜構成要素の省略、置換、追加が行われてもよい。
【0027】
情報処理装置90は、プロセッサ91が記録媒体に記憶されたプログラムをメモリ92の作業領域にロードして実行し、プログラムの実行を通じて各構成部等が制御されることによって、所定の目的に合致した機能を実現することができる。
【0028】
プロセッサ91は、例えば、CPU(Central Processing Unit)やDSP(Digital Signal Processor)である。プロセッサ91は、単一のプロセッサに限定されるものでは
なく、マルチプロセッサ構成であってもよい。プロセッサ91は、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)等の専用LSI(Large Scale Integration)、その他のデジタル回路等を含んでもよい。
【0029】
メモリ92は、例えば、RAM(Random Access Memory)やROM(Read Only Memory)を含む。メモリ92は、主記憶装置とも呼ばれる。
【0030】
記憶部93は、不揮発性記憶媒体を備える。記憶部93に備わる不揮発性記憶媒体は、例えば、EPROM(Erasable Programmable ROM)、ハードディスクドライブ(HDD
、Hard Disk Drive)である。また、記憶部93は、リムーバブルメディア、即ち可搬記
録媒体を含むことができる。リムーバブルメディアは、例えば、USB(Universal Serial Bus)メモリ、あるいは、CD(Compact Disc)やDVD(Digital Versatile Disc)のようなディスク記録媒体である。記憶部93は、補助記憶装置とも呼ばれる。
【0031】
記憶部93は、各種のプログラム、各種のデータ及び各種のテーブルを読み書き自在に記録媒体に格納する。記憶部93には、オペレーティングシステム(Operating System :OS)、各種プログラム、各種テーブル等が格納される。記憶部93に格納される情報は、メモリ92に格納されてもよい。また、メモリ92に格納される情報は、記憶部93に格納されてもよい。
【0032】
オペレーティングシステムは、ソフトウェアとハードウェアとの仲介、メモリ空間の管理、ファイル管理、プロセスやタスクの管理等を行うソフトウェアである。オペレーティングシステムは、通信インタフェースを含む。通信インタフェースは、通信制御部96を介して接続される他の外部装置等とデータのやり取りを行うプログラムである。外部装置等には、例えば、他のコンピュータ、外部記憶装置等が含まれる。
【0033】
入力部94は、キーボード、ポインティングデバイス、ワイヤレスリモコン、タッチパネル等を含む。また、入力部94は、カメラのような映像や画像の入力装置や、マイクロフォンのような音声の入力装置を含むことができる。
【0034】
出力部95は、LCD(Liquid Crystal Display)、EL(Electroluminescence)パ
ネル、CRT(Cathode Ray Tube)ディスプレイ、PDP(Plasma Display Panel)等の表示装置、プリンタ等の出力装置を含む。また、出力部95は、スピーカのような音声の出力装置を含むことができる。
【0035】
通信制御部96は、他の装置と接続し、情報処理装置90と他の装置との間の通信を制御する。通信制御部96は、例えば、LAN(Local Area Network)インタフェースボード、無線通信のための無線通信回路、有線通信のための通信回路である。LANインタフェースボードや無線通信回路は、インターネット等のネットワークに接続される。
【0036】
通話装置200を実現するコンピュータは、プロセッサが補助記憶装置に記憶されているプログラムを主記憶装置にロードして実行することによって、制御部202、通信部206、通信部206、音声入力部208、音声出力部210、映像入力部212、位置検出部214、重量検出部216としての機能を実現する。一方、格納部204は、主記憶装置または補助記憶装置の記憶領域に設けられる。
【0037】
(動作例1)
図6は、通話装置200の動作例1の動作フローを示す図である。ここでは、
図1のように、商業施設等の施設内に通話装置200Aが搭載された車両100A、通話装置200Bが搭載された車両100B、通話装置200Cが搭載された車両100Cが存在しているものとする。また、車両100A、車両100B、車両100Cには、それぞれ、利用者A、利用者B、利用者Cが乗っているものとする。各利用者は、車両100に搭載される通話装置200を介して、互いに通話しているものとする。通話装置200A、通話装置200B、通話装置200Cは、互いに、通信可能に接続されている。
【0038】
このとき、車両100に搭載される通話装置200の制御部202は、音声入力部20
8により、周囲の音声を取得する。周囲の音声には、例えば、車両100に乗る利用者が話す音声が含まれ得る。制御部202は、取得した音声(音声データ)を、音声を取得した日時(音声が発せられた日時)を示すタイムスタンプと対応付けて、格納部204に格納する。1つの音声は、所定期間(例えば、0.1秒間)の時系列データである。例えば、音声のサンプリング周波数が8kHzである場合、1つの音声(0.1秒間)は、音声の振幅を示す800個の時系列データである。
【0039】
また、制御部202は、映像入力部212に車両100に乗る利用者を撮影させ、撮影した画像を取得する。制御部202は、取得した画像を、画像が撮影された日時を示すタイムスタンプと対応付けて、格納部204に格納する。また、制御部は、取得した画像に含まれる利用者について、周知の画像認識技術などにより、当該利用者の顔が向いている方向を算出する。制御部202は、算出した利用者の顔が向いている方向を、画像が撮影された日時を示すタイムスタンプと対応付けて、格納部204に格納する。利用者の顔が向いている方向は、例えば、車両100を上方から見たときに、利用者の顔が向いている方向の、車両100の中心から正面への方向からの時計回りの角度として表される。すなわち、利用者の顔が向いている方向は、車両100の中心から正面への方向と、利用者の顔が向いている方向との間の、車両100の中心から正面への方向からの時計回りの角度として表される。制御部202は、例えば、撮影された画像と、格納部204に格納される利用者の顔が向いている方向を推定する推定モデルとに基づいて、利用者の顔が向いている方向を算出してもよい。このとき、利用者の顔が向いている方向を推定する推定モデル(学習済み推定モデル)は、教師データを用いて学習(機械学習)された、利用者の顔が向いている方向を推定する推定モデルである。教師データは、例えば、映像入力部212から取得した利用者を撮影した画像と当該利用者の顔が向いている方向(正面の方向からの時計回りの角度)との組である。あらゆる方向を向いている利用者の顔を撮影した画像を用いることにより、より精度の高い推定モデルが生成される。機械学習として、周知の機械学習が適用され得る。当該推定モデルは、あらかじめ、生成され、格納部204に格納されているとする。制御部202は、他の方法により、利用者の顔が向いている方向を算出してもよい。
【0040】
また、制御部202は、位置検出部214に、通話装置200が搭載される車両100の位置及び向きを検出させ、当該車両100の位置及び向きを取得する。制御部202は、取得した車両100の位置及び向きを、検出した日時を示すタイムスタンプと対応付けて、格納部204に格納する。車両100の位置は、例えば、緯度、経度によって表される。車両100の向きは、車両100の正面が向いている方向であり、例えば、車両100の正面が向いている方向の、車両100の中心から真北への方向からの時計回りの角度によって表される。さらに、制御部202は、車両100の正面が向いている方向の、車両100の中心から真北への方向からの時計回りの角度と、上記の、利用者の顔が向いている方向の車両100の正面が向いている方向からの時計回りの角度とを加算することで、利用者の顔が向いている方向の、利用者から真北への方向からの時計回りの角度を算出する。利用者の顔が向いている方向の、利用者から真北への方向からの時計回りの角度は、利用者の顔が向いている方向の絶対的な方向である。制御部202は、利用者の顔が向いている方向の絶対的な方向(利用者の顔が向いている方向の、利用者から真北への方向からの時計回りの角度)を、検出した日時を示すタイムスタンプと対応付けて、格納部204に格納する。
【0041】
さらに、通話装置200の制御部202は、格納部204に格納される、音声、当該通話装置200が搭載される車両100の位置、利用者の顔が向いている方向の絶対的な方向を、それぞれのタイムスタンプ及び当該通話装置200を識別する識別子とともに、通信部206を介して、他の通話装置200に向けて、送信する。車両100の位置、利用者の顔が向いている方向の絶対的な方向を、送信する周期は、音声を送信する周期よりも
、大きくてもよい。例えば、制御部202は、音声を0.1秒ごとに送信するのに対し、車両100の位置、利用者の顔が向いている方向の絶対的な方向を10秒ごとに送信してもよい。また、制御部202は、車両100の位置、利用者の顔が向いている方向の絶対的な方向については、直前に送信したものと変更があった場合にのみ、送信してもよい。利用者が通話装置200を介して互いに通話している間、通話装置200の制御部202は、常時、音声等を送信する。制御部202は、他の通話装置200から、音声、当該他の通話装置200が搭載される車両100の位置、利用者の顔が向いている方向の絶対的な方向等を受信すると、送信した通話装置200を識別する識別子とともに、格納部204に格納する。最後に受信した、車両100の位置は、現在の、車両100の位置を示す。最後に受信した、利用者の顔が向いている方向の絶対的な方向は、現在の、利用者の顔が向いている方向の絶対的な方向を示す。
【0042】
通話装置200A、通話装置200B、通話装置200Cが、互いに、通信している間、以上の動作が繰り返される。
【0043】
以上を前提として、次に、通話装置200Bと通信する通話装置200Aの動作フロー(
図6)について説明する。
図6の動作フローは、通話装置200Aが通話装置200Bと通信している間、繰り返される。通話装置200Cと通信する通話装置200A、通話装置200Bと通信する通話装置200C、通話装置200Aと通信する通話装置200Bなどについても同様である。ここでは、例えば、通話装置200Aは、通話装置200Bおよび通話装置200Cと通信している。
【0044】
S101では、通話装置200Aの制御部202は、通話装置200Aの位置と通話装置200Bの位置との距離が所定値未満であるか否かを判定する。当該距離が所定値未満であることは、車両100Aに乗る通話装置200Aの利用者Aと車両100Bに乗る通話装置200Bの利用者Bとの間の距離が、利用者Aが利用者Bの声を直接聞ける距離であることを示す。当該所定値は、例えば、2mである。当該所定値は、利用者Aの身体の状態や周囲の環境などによって変更されもよい。周囲の環境として、例えば、環境雑音の大きさ、周囲の人の多さ、車道の近くといった大きな環境雑音の発生しやすい場所であるかなどが挙げられる。当該所定値は、例えば、利用者Aが利用者Bの声を直接聞き取りやすい状況(環境雑音等が少ない状況)であるほど、大きく設定される。また、聞き取りやすさが極端に悪い(例えば、周囲雑音の大きさが所定閾値以上である)場合には、利用者Aと利用者Bとの間の距離に関係なく、音声出力部210より音声を出力してもよい。すなわち、聞き取りやすさが極端に悪い場合、当該所定値を0mとしてもよい。制御部202は、位置検出部214を介して、通話装置200Aの位置を取得する。また、制御部202は、格納部204から、通話装置200Bの現在の位置を抽出する。制御部202は、通話装置200Aの位置と、通話装置200Bの現在の位置とから、通話装置200Aの位置と通話装置200Bの位置との距離を算出する。算出した距離が所定値未満である場合(S101;YES)、処理がS105に進む。算出した距離が所定値以上である場合(S101;NO)、処理がS102に進む。
【0045】
S102では、制御部202は、格納部204に格納される、現在の利用者Bの利用者の顔が向いている方向の絶対的な方向を取得する。利用者Bの顔が向いている方向の絶対的な方向は、例えば、利用者Bの顔が向いている方向の、利用者Bから真北への方向からの時計回り角度である。
【0046】
S103では、制御部202は、利用者Bが利用者Aの方向、すなわち、車両100Aの方向を向いているか否かを判定する。利用者Bが利用者Aの方向を向いていることは、利用者Bが利用者Aに向かって話していると考えられる。制御部202は、S101で取得した車両100Aの位置と、車両100Bの現在の位置とから、車両100Bから見た
車両100Aの方向を算出する。車両100Bから見た車両100Aの方向は、例えば、車両100Bの中心から車両100Aの中心への方向の、車両100Bの中心から真北への方向からの時計回りの角度によって表される。制御部202は、S102で取得した、現在の利用者Bの利用者の顔が向いている方向と、車両100Bから見た車両100Aの方向との角度差を算出する。制御部202は、算出した角度差が所定値(ここでは角度αとする)未満である場合、利用者Bが利用者Aの方向を向いていると判定する。また、制御部202は、算出した角度差が所定値以上である場合、利用者Bが利用者Aの方向を向いていないと判定する。角度αは、例えば、30度である。
【0047】
図7は、利用者Bが向いている方向、車両100Bから見た車両100Aの方向の例を示す図である。
図7は、車両100Aに乗った利用者Aと、車両100Bに乗った利用者Bとを、上方から見た図である。
図7の例では、利用者Bが向いている方向と、車両100Bから見た車両100Aの方向との角度差が角度α未満である。よって、
図7の場合、利用者Bは、利用者Aの方向を向いていると判定される。
【0048】
利用者Bが利用者Aの方向を向いていると判定された場合(S103;YES)、処理がS104に進む。利用者Bが利用者Aの方向を向いていないと判定された場合(S103;NO)、処理がS105に進む。
【0049】
S104では、制御部202は、格納部204に格納される、通話装置200Bから受信した音声を取得し、音声出力部210により、当該音声を出力する制御を行う。ここで、制御部202は、利用者Aが感じる音声の発生の方向を、利用者Bの方向(車両100B)の方向になるように、音声出力部210を制御する。これにより、利用者Aは、利用者Bが存在する方向を認識することができる。
【0050】
図8は、音声出力部210の制御の例を示す図である。
図8は、利用者Aが乗る車両100Aを上方から見た図である。利用者Aは、車両100Aの中央に乗っており、図の上方(車両100Aの正面の方向)を向いている。利用者Aの右側、左側、後側には、音声出力部210(スピーカ)が設置されている。
【0051】
車両100Bの方向が第1の方向(前方向)である場合、制御部202は、通話装置200Bからの音声を、右側の音声出力部210の出力の大きさと、左側の音声出力部210の出力の大きさとを、同じにする。また、制御部202は、後側の音声出力部210の出力の大きさを0にする。これにより、利用者Aは、通話装置200Bからの音声が、第1の方向から発生していると感じることができる。
【0052】
車両100Bの方向が第2の方向(右後方向)である場合、制御部202は、通話装置200Bからの音声を、右側の音声出力部210の出力の大きさと、後側の音声出力部210の出力の大きさとを、同じにする。また、制御部202は、左側の音声出力部210の出力の大きさを0にする。これにより、利用者Aは、通話装置200Bからの音声が、第2の方向から発生していると感じることができる。
【0053】
車両100Bの方向が第3の方向(後方向)である場合、制御部202は、通話装置200Bからの音声を、後側の音声出力部210からのみ出力し、左側の音声出力部210の出力の大きさ及び右側の音声出力部210の出力の大きさを0にする。これにより、利用者Aは、通話装置200Bからの音声が、第3の方向から発生していると感じることができる。
【0054】
車両100Bの方向が他の方向である場合であっても、同様にして、制御部202は、それぞれの音声出力部210の出力の大きさを制御することで、利用者Aが感じる音声が
発生する方向を制御する。制御部202は、音声出力部210から出力した音声を、格納部204から削除してもよい。
【0055】
S105では、制御部202は、格納部204に格納される、通話装置200Bから受信した音声を、音声出力部210により、出力しない制御を行う。これにより、利用者Bが利用者Aのそばに存在する場合や、利用者Bが利用者Aの方向を向いて話していない場合に、音声出力部210からの出力を停止することができる。
【0056】
(動作例2)
図9は、通話装置200の動作例2の動作フローを示す図である。前提は、動作例1と同様である。
図9の動作フローは、通話装置200Bと通信する通話装置200Aの動作フローである。
図9の動作フローは、通話装置200Aが通話装置200Bと通信している間、繰り返される。通話装置200Cと通信する通話装置200A、通話装置200Bと通信する通話装置200C、通話装置200Aと通信する通話装置200Bなどについても同様である。ここでは、例えば、通話装置200Aは、通話装置200Bおよび通話装置200Cと通信している。
【0057】
通話装置200Aの制御部202は、音声入力部208により、周囲の音声を取得する。周囲の音声には、例えば、車両100Aに乗る利用者Aが話す音声、車両100Aのそばにいる他の利用者の音声が含まれ得る。制御部202は、取得した音声を、音声を取得した日時(音声が発せられた日時)を示すタイムスタンプと対応付けて、格納部204に格納する。
【0058】
S201では、制御部202は、格納部204から、通話装置200Bから受信した音声を抽出する。
【0059】
S202では、制御部202は、S201で抽出した通話装置200Bからの音声のタイムスタンプを確認し、当該タイムスタンプと同じタイムスタンプを有する、通話装置200Aの音声入力部208により取得された音声を抽出する。制御部202は、周知の音声処理技術などにより、抽出した通話装置200Aの音声から人間の音声以外の周波数成分を除去する。制御部202は、人間の音声以外の周波数成分を除去した音声を、格納部204に格納する。
【0060】
S203では、制御部202は、S201で抽出した音声と、S202で格納部204に格納した音声(人間の音声以外の周波数成分を除去した音声)とが一致するか否かを判定する。例えば、制御部202は、S201で抽出した音声と、S202で格納部204に格納した音声の各時刻の差分をとり、所定割合以上(例えば90%以上)の時刻において、差分が所定値以下である場合に、2つの音声が一致すると判定する。2つの音声が一致する場合、通話装置200Bの利用者Bが車両100Aの近くに存在すると考えられる。また、2つの音声が一致しない場合、通話装置200Bの利用者Bが近くに存在しない、もしくは、周囲が騒々しく利用者Bの音声を聞き取れないと考えられる。2つの音声が一致する場合(S203;YES)、処理がS205に進む。2つの音声が一致しない場合(S203;NO)、処理がS204に進む。
【0061】
S204の処理は、S104の処理と同様である。これにより、利用者Bが利用者A(車両100A)のそばにいない場合、利用者Bの声が聞こえづらい場合に、音声出力部210から利用者Bの音声を出力することができる。
【0062】
S205の処理は、S105の処理と同様である。これにより、利用者Bが利用者A(車両100A)のそばにいる場合、音声出力部210からの利用者Bの音声の出力を停止
することができる。
【0063】
(動作例3)
図10は、通話装置200の動作例3の動作フローを示す図である。前提は、動作例1と同様である。
図10の動作フローは、通話装置200Bと通信する通話装置200Aの動作フローである。
図10の動作フローは、通話装置200Aが通話装置200Bと通信している間、繰り返される。通話装置200Cと通信する通話装置200A、通話装置200Bと通信する通話装置200C、通話装置200Aと通信する通話装置200Bなどについても同様である。ここでは、例えば、通話装置200Aは、通話装置200Bおよび通話装置200Cと通信している。
【0064】
S301では、制御部202は、格納部204から、通話装置200Bから受信した音声を抽出する。
【0065】
S302では、制御部202は、車両100Aに利用者Aが搭乗しているか否かを判定する。制御部202は、重量検出部216により、車両100Aに利用者Aが搭乗しているか否かを示す情報を取得する。制御部202は、重量検出部216からの情報に基づいて、車両100Aに利用者Aが搭乗しているか否かを判定する。車両100Aに利用者Aが搭乗している場合(S302;YES)、処理がS304に進む。車両100Aに利用者Aが搭乗していない場合(S302;NO)、処理がS303に進む。
【0066】
S303では、制御部202は、S301で抽出した音声に、未再生を示すフラグを付けて、格納部204に格納する。これにより、S301で抽出された音声は、この時点では、再生(出力)されない。
【0067】
S304では、制御部202は、格納部204に、S303で未再生を示すフラグを付けられた音声が格納されているか否かを判定する。制御部202は、格納部204に格納される音声から、未再生を示すフラグを付けられた音声を検索する。格納部204に未再生を示すフラグを付けられた音声がない場合(S304;NO)、処理がS305に進む。格納部204に未再生を示すフラグを付けられた音声がある場合(S304;YES)、処理がS306に進む。
【0068】
S305の処理は、S104の処理と同様である。
【0069】
S306では、制御部202は、格納部204から、S303で未再生を示すフラグを付けられた音声を抽出する。制御部202は、抽出した音声のうち、タイムスタンプが最も古いものから順番に、音声出力部210を介して、出力する。音声の出力の処理は、S104と同様である。制御部202は、出力した音声に付けられたフラグを、格納部204から削除する。制御部202は、出力した音声自体を格納部204から削除してもよい。これにより、利用者Aが車両100Aに搭乗していなかったときに、利用者Bによって発せられた音声を、利用者Aが車両100Aに戻った時に出力することができる。利用者Aは、車両100Aに搭乗していなかったときに利用者Bによって発生された音声を聞くことができる。
【0070】
S302において、制御部202は、映像入力部212(カメラ)によって撮影された画像に基づいて、車両100Aに利用者Aが搭乗しているか否かを判定してもよい。また、利用者Aが車両100Aに乗車していない場合でも、利用者Aが車両100Aの近くに存在すると検出した場合には、制御部202は、車両100Aに利用者Aが搭乗しているとみなして(S302;YES)もよい。利用者Aが車両100Aの近くに存在するか否かは、例えば、映像入力部212(カメラ)によって撮影された画像に基づいて判定され
る。利用者Aが車両100Aに乗車しておらず、利用者Aが車両100Aの近くに存在する場合、音声の出力において、音声のボリューム(音量)を通常よりも大きくするようにしてもよい。また、利用者Aと車両100Aとの距離が離れているほど、音声のボリュームを大きくするようにしてもよい。
【0071】
S304において、制御部202は、現在、通話装置200Bから受信した音声(リアルタイムの音声、S301で受信した音声)が存在する場合、もしくは、当該音声が有音である(無音でない)場合、処理をS305にすすめてもよい。このとき、過去に受信した音声の出力よりも、リアルタイムの音声(最後に受信した音声)の出力が優先される。
【0072】
(その他)
ここでは、通話装置200は車両100に搭載されるとしたが、通話装置200は、携帯電話、スマートフォン、タブレット端末などとして、車両100に搭載されずに使用されてもよい。このとき、通話装置200は、他の通話装置200が近くに存在する場合(他の通話装置200との距離が所定値未満である場合)などに、他の通話装置200からの音声の出力を停止することができる。
【0073】
本実施形態の通話システム10は、小型車両のような、グループで行動する利用者がそれぞれ別の車両に乗って、グループで行動していても利用者間の距離が離れる傾向がある場合に利用すると特に有効である。グループで行動していても利用者間の距離が離れる場合は、例えば、徒歩の利用者がグループ行動する場合に比べて、乗っている車両の大きさの影響や安全性確保等のために利用者間の距離が離れる傾向がある場合である。本実施形態の通話システム10は、ショッピングモールといった施設内や、商店街や公園といった場所を複数の小型車両に乗ってグループ行動する際に、周囲の人や障害物を避けるために、個々の小型車両が離れた位置になる(離れ離れになる)場合に、特に有効である。本実施形態の通話システム10は、車両でも特に利用者(乗員)を覆う外壁(側壁、天井、窓など)が設けられてない車両に用いた場合に、特に有効である。すなわち、例えば、車両に外壁がない場合、周囲雑音の影響を受けやすく、また、近くにいる利用者の声が直接届きやすい。また、本実施形態の通話システム10は、外壁が設けられている車両にも適用可能である。この場合、車両の窓が開いていると判定した場合に、本実施形態の制御を行うようにすればよい。また、車両の窓が閉じている場合には、他の車両の利用者の声が聞こえないため、他の通話装置200(他の車両100)が近くに存在していないとみなすことができる。本実施形態の通話システム10の車両100は、例えば、車道を走行する一般的な車両ではなく、歩行者扱いとなる車両である。本実施形態の通話システム10の車両100は、例えば、施設内(建物内や、複数の建物を包含する敷地内)や歩道、商店街、公園等を走行可能な車両である。
【0074】
(実施形態の作用、効果)
本実施形態の通話装置200は、他の通話装置200から他の通話装置200の利用者が発した音声を受信する。通話装置200は、他の通話装置200までの距離に基づいて、他の通話装置200から受信した音声の出力を制御する。通話装置200は、他の通話装置200までの距離が所定値未満である場合、他の通話装置200から受信した音声を出力しない。通話装置200によれば、他の通話装置200の利用者から直接聞こえる音声と、通話装置200から聞こえる音声とが二重になることを抑制することができる。通話装置200は、他の通話装置200が存在する方向に基づいて、他の通話装置200から受信した音声の出力を制御する。通話装置200によれば、他の通話装置200の方向から音声が発生していると通話装置200の利用者が感じるようにできる。通話装置200は、他の通話装置200の利用者の顔が通話装置200の方向を向いている場合に、他の通話装置200から受信した音声を出力する。通話装置200によれば、他の通話装置200の利用者が、通話装置200の利用者に向かって話しているときに、他の通話装置
200の利用者の音声を出力することができる。通話装置200は、音声入力部208で検出した音声と、他の通話装置200から受信した音声とが一致する場合、他の通話装置200から受信した音声を出力しない。通話装置200によれば、他の通話装置200の利用者から直接聞こえる音声と、通話装置200から聞こえる音声とが二重になることを抑制することができる。
【0075】
〈コンピュータ読み取り可能な記録媒体〉
コンピュータその他の機械、装置(以下、コンピュータ等)に上記いずれかの機能を実現させるプログラムをコンピュータ等が読み取り可能な記録媒体に記録することができる。そして、コンピュータ等に、この記録媒体のプログラムを読み込ませて実行させることにより、その機能を提供させることができる。
【0076】
ここで、コンピュータ等が読み取り可能な記録媒体とは、データやプログラム等の情報を電気的、磁気的、光学的、機械的、または化学的作用によって蓄積し、コンピュータ等から読み取ることができる記録媒体をいう。このような記録媒体内には、CPU、メモリ等のコンピュータを構成する要素を設け、そのCPUにプログラムを実行させてもよい。
【0077】
また、このような記録媒体のうちコンピュータ等から取り外し可能なものとしては、例えばフレキシブルディスク、光磁気ディスク、CD-ROM、CD-R/W、DVD、DAT、8mmテープ、メモリカード等がある。
【0078】
また、コンピュータ等に固定された記録媒体としてハードディスクやROM等がある。
【0079】
以上、本発明の実施形態を説明したが、これらはあくまで例示にすぎず、本発明はこれらに限定されるものではなく、特許請求の範囲の趣旨を逸脱しない限りにおいて、複数の構成を組み合わせたり、一部の構成を省略したりするなど、当業者の知識に基づく種々の変更が可能である。
【符号の説明】
【0080】
10 通話システム
100 車両
102 底面
104 車輪
106 支柱
108 ハンドル
200 通話装置
202 制御部
204 格納部
206 通信部
208 音声入力部
210 音声出力部
212 映像入力部
214 位置検出部
216 重量検出部
90 情報処理装置
91 プロセッサ
92 メモリ
93 記憶部
94 入力部
95 出力部
96 通信制御部